DeepSeek 是由深度求索(DeepSeek)推出的一系列大语言模型。部分版本(如 DeepSeek-VL)具备多模态能力,可以“看图说话”,即理解图像内容并进行问答或描述。
1. 确认你使用的是支持图像的 DeepSeek 版本
目前只有特定的 DeepSeek 多模态模型(例如 DeepSeek-VL)支持图像输入。标准文本模型(如 DeepSeek-7B/67B)无法处理图片。
2. 使用官方平台或 API 上传图片
如果你通过 DeepSeek 官方网页或 App 使用服务,请查找“上传图片”或“多模态输入”选项。通常界面会提供一个“+”按钮或图片图标,点击后可选择本地图片上传。
3. 调用多模态 API(开发者适用)
开发者可通过 DeepSeek 提供的多模态 API 接口发送包含 Base64 编码图像的数据请求。请求格式通常为 JSON,包含文本提示和图像数据。
4. 常见问题
Q:为什么我上传图片后 DeepSeek 没反应?
A:可能你使用的是纯文本模型,或当前平台未开放图像功能。请确认是否使用 DeepSeek-VL 或官方支持图像的入口。
Q:支持哪些图片格式?
A:通常支持 JPG、PNG 等常见格式,建议使用清晰度较高的图片以获得更好效果。
5. 小结
要让 DeepSeek “看图”,关键在于使用其多模态版本,并通过支持图像输入的渠道(如官方网页、App 或 API)上传图片。普通文本模型无法处理视觉信息。