OpenClaw 媒体支持：图片、音频、文档处理

2026年6月5日 4

OpenClaw 支持发送和接收图片、音频和文档，让 AI Agent 能够处理多媒体内容。

支持的媒体类型

当主模型不支持图片时，OpenClaw 会自动使用 agents.defaults.imageModel 配置的模型来处理图片。

PDF 工具使用 agents.defaults.pdfModel 配置的模型。如果未配置，会回退到 imageModel，然后是默认会话模型。

OpenClaw 支持图片生成能力，使用 agents.defaults.imageGenerationModel 配置的模型。如果未配置，会尝试当前默认 Provider，然后是其他已注册的图片生成 Provider。

媒体可以在不同渠道之间传递。例如，你可以在 Telegram 中发送一张图片，AI Agent 可以在 Discord 中引用它。

本文仅供学习交流，转载请注明来源。

admin

本站作者