DeepSeek 是由深度求索(DeepSeek)公司推出的一系列开源大语言模型,在中文 AI 社区中引发了广泛关注。尽管其技术基础早在 2023 年底就已构建,但真正“火起来”的时间点集中在 2024 年上半年。
关键时间节点
2023 年 11 月:DeepSeek 首次公开其第一代大模型 DeepSeek-V1,支持代码生成与通用对话,引起开发者初步关注。
2024 年 1–2 月:随着 DeepSeek-Coder 系列在 GitHub 上开源,并在多个编程基准测试中表现优异,技术社区开始热议。
2024 年 3–4 月:DeepSeek 发布支持 128K 上下文的 DeepSeek-V2,性能和效率显著提升,被大量中文用户用于本地部署和商业应用,热度迅速攀升。
2024 年 5 月起:各类教程、测评视频、工具集成(如 VS Code 插件、国产 IDE 支持)大量涌现,“DeepSeek”成为中文 AI 圈高频词,标志着其正式“出圈”。
为何能快速走红?
DeepSeek 的爆火并非偶然,主要得益于以下几点:
- 完全开源且可商用,降低使用门槛;
- 在中文和代码任务上表现突出;
- 支持长上下文(最高 128K),适合复杂场景;
- 社区活跃,配套工具生态快速完善。
结语
可以说,DeepSeek 在 2024 年春季完成了从“技术圈内关注”到“大众开发者广泛采用”的跨越。它的崛起也反映了国产大模型在开源策略与工程落地上的成功路径。