DeepSeek 是由深度求索(DeepSeek)公司推出的一系列开源大语言模型,在中文 AI 社区中引起了广泛关注。虽然其技术积累始于更早时期,但真正“火起来”是在 2024 年初。
关键时间节点
- 2023 年底:DeepSeek 发布首个开源模型 DeepSeek-Coder,专精代码生成,迅速在 GitHub 上获得大量关注。
- 2024 年 1 月:DeepSeek-LLM 系列模型开源,支持中英文,性能媲美 Llama 系列,引发开发者社区热议。
- 2024 年春季:多家科技媒体和 AI 博主评测 DeepSeek 模型,称其为“国产最强开源大模型之一”,用户量和讨论热度激增。
- 2024 年中至今:DeepSeek 推出多模态、长上下文(128K)版本,并集成到多个国产 AI 工具中,进一步扩大影响力。
可以说,DeepSeek 的“爆火”并非一蹴而就,而是凭借扎实的技术、开放的策略和对开发者友好的生态,在 2024 年实现了现象级传播。