什么是 DeepSeek?
DeepSeek 是由深度求索(DeepSeek)推出的一系列开源大语言模型,支持多种应用场景,如代码生成、文本创作、问答系统等。其高效、安全、本地可部署的特点深受开发者和企业用户喜爱。
安装与配置
你可以通过以下方式使用 DeepSeek:
- 在线体验:访问官方平台直接使用,无需安装。
- 本地部署:下载开源模型,配合推理框架(如 vLLM、Transformers)在本地运行。
- API 调用:注册开发者账号,通过 API 接入 DeepSeek 服务。
基础使用示例
以下是一个简单的 Python 调用示例(使用 Hugging Face Transformers):
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained("deepseek-ai/deepseek-coder-1.3b-instruct")
model = AutoModelForCausalLM.from_pretrained("deepseek-ai/deepseek-coder-1.3b-instruct")
inputs = tokenizer("写一个Python函数计算斐波那契数列", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
常见问题
- Q:DeepSeek 是否免费?
A:部分模型开源免费,商业用途请查看官方授权协议。 - Q:需要 GPU 才能运行吗?
A:小参数版本可在 CPU 上运行,但 GPU 可显著提升速度。 - Q:支持中文吗?
A:是的,DeepSeek 系列模型对中文有良好支持。