OpenClaw 媒体支持:图片、音频、文档处理

2026年6月5日 4

OpenClaw 支持发送和接收图片、音频和文档,让 AI Agent 能够处理多媒体内容。

支持的媒体类型

  • 图片:JPEG、PNG、GIF、WebP 等格式
  • 音频:语音消息、音频文件
  • 文档:PDF、Word、Excel 等

图片处理

当主模型不支持图片时,OpenClaw 会自动使用 agents.defaults.imageModel 配置的模型来处理图片。

PDF 处理

PDF 工具使用 agents.defaults.pdfModel 配置的模型。如果未配置,会回退到 imageModel,然后是默认会话模型。

图片生成

OpenClaw 支持图片生成能力,使用 agents.defaults.imageGenerationModel 配置的模型。如果未配置,会尝试当前默认 Provider,然后是其他已注册的图片生成 Provider。

跨渠道媒体

媒体可以在不同渠道之间传递。例如,你可以在 Telegram 中发送一张图片,AI Agent 可以在 Discord 中引用它。

admin

本站作者