DeepSeek 官方 API 一直提示系统繁忙,原因是限制了每个账户一段时间只能请求一次满血模型。现在市面上类似的产品也多,要么不是满血的模型,要不也存在繁忙的问题。火山背靠字节提供 DeepSeek 每个模型 50W Token 的免费推理额度且支持3万RPM和500万TPM不限速,相比硅基什么的更稳定更好用。同样,字节属于国内平台,实名无可避免。

注册账号完成实名认证

这里用手机号注册就行,现在用我的邀请注册赠送每个模型50w Token 和15元代金券:

https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=IBBM4TL7

开通模型

创建API Key

需要记下来保存的。

创建推理点

这样就会得到你的接入点ID,用于调用模型。

客户端调用

这里可以使用开源的客户端 Cherry Studio,提供 Windows/Mac/Linux 版本。

项目地址: Cherry Studio - 全能的AI助手

如果需要手机使用,可以考虑 ChatBox

50W token 还是可以用挺久的,加上赠送的15元.用完了再买 50W 也只需要 1 块钱(目前的价格和官方 API 相同)

联网搜索

这里可以使用开源的客户端 Cherry Studio,提供 Windows/Mac/Linux 版本。

首先注册火山,点击创建应用→零代码→单聊,应用名称随意,接入点选择DS-R1(如果没有请新建),选择联网模型插件(如果没有请开通)

第一次使用的话,联网内容插件是需要开通的,去开通即可。

创建完毕后点击右上方的api调用指南,点击“选择api并复制”。

返回cherry studio,在模型中点击添加,供应商选择openAI,名称随意。然后填入api,api地址写https://ark.cn-beijing.volces.com/api/v3/bots/

然后手动添加模型——点“添加”,注意模型ID写你创立的bot应用的ID,格式是“bot-xxx”,位置在我上图的左上角,名称随意

模型ID就是Bot的ID

接入翻译

同样,由于字节卡多,tpm够高,很适合接入翻译。但这可能带来更多的token消耗

设置里找到豆包大模型

填入API 和接入点,和上方一样,但是这里注意需要填写 DeepSeek-V3 的接入点ID,速度最快效果最好。

点击测试,验证成功即可调用。