截至当前(2025年),DeepSeek 主要是一个专注于文本处理的大语言模型,其官方公开版本(如 DeepSeek-V2、DeepSeek-Coder 等)。
这意味着:
- 你无法向 DeepSeek 发送一张图片并让它描述图中内容;
- 它不能识别图像中的文字(OCR);
- 也无法根据文字生成图片(如 DALL·E 或 Midjourney 那样)。
DeepSeek 的核心优势在于代码生成、逻辑推理、长文本理解与中文优化,属于纯文本多轮对话模型。如果你需要处理图像,建议结合专门的多模态模型(如 Qwen-VL、GPT-4V、Claude 3 等)使用。
不过,DeepSeek 团队未来可能会推出支持多模态(图文)的版本。请持续关注官方动态以获取最新功能更新。