OpenClaw 支持发送和接收图片、音频和文档,让 AI Agent 能够处理多媒体内容。
支持的媒体类型
- 图片:JPEG、PNG、GIF、WebP 等格式
- 音频:语音消息、音频文件
- 文档:PDF、Word、Excel 等
图片处理
当主模型不支持图片时,OpenClaw 会自动使用 agents.defaults.imageModel 配置的模型来处理图片。
PDF 处理
PDF 工具使用 agents.defaults.pdfModel 配置的模型。如果未配置,会回退到 imageModel,然后是默认会话模型。
图片生成
OpenClaw 支持图片生成能力,使用 agents.defaults.imageGenerationModel 配置的模型。如果未配置,会尝试当前默认 Provider,然后是其他已注册的图片生成 Provider。
跨渠道媒体
媒体可以在不同渠道之间传递。例如,你可以在 Telegram 中发送一张图片,AI Agent 可以在 Discord 中引用它。