截至当前(2025年),DeepSeek 主要是一个专注于文本生成与理解的大语言模型,其官方版本(如 DeepSeek-V2、DeepSeek-Coder 等)并未原生支持图像输入或“拍照识物”功能。
“拍照识物”通常指通过手机或设备摄像头拍摄一张图片,由AI自动识别图中物体、文字、场景等,并返回相关信息。这类功能依赖于多模态模型(如 CLIP、GPT-4V、Qwen-VL 等)。
目前,DeepSeek 的公开版本主要处理文本任务(如编程、写作、问答等)。虽然其技术团队可能在研发多模态能力,但官方尚未推出支持图像输入的 DeepSeek 版本。因此,用户无法直接通过 DeepSeek 应用进行拍照识物。
如果您需要拍照识物功能,可考虑以下工具:
随着多模态AI的发展,DeepSeek 未来有可能推出支持图像理解的版本。建议关注其官网或技术博客获取最新动态。