DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,在中文 AI 社区中迅速引起广泛关注。但很多人好奇:DeepSeek 究竟是从什么时候开始“火”起来的?本文将梳理其关键发展节点,揭示其走红背后的原因。
DeepSeek 最早于 2023 年底发布其初代模型 DeepSeek-Coder,专注于代码生成任务,凭借在 HumanEval 等基准测试中的优异表现,初步吸引了开发者社区的关注。
2024 年 1 月,DeepSeek 发布了通用大模型 DeepSeek-V2,并开源了多个版本。其强大的推理能力、对中文的深度优化以及支持长上下文(最高达 128K tokens),使其在 Hugging Face 和 GitHub 上获得大量星标。
随着国内对国产大模型关注度提升,DeepSeek 在知乎、B站、微信公众号等平台频繁被提及。众多技术博主制作评测视频,企业开始尝试将其集成到产品中。此时,“DeepSeek”成为国产开源模型的代表之一。
截至 2024 年底,DeepSeek 已形成完整生态,包括 DeepSeek-R1、DeepSeek-MoE 等多款模型,并提供 Web 端和 API 服务。其易用性、高性能和完全开源策略,使其真正“出圈”,成为 AI 领域的热门关键词。