DeepSeek 官方 API 一直提示系统繁忙,原因是限制了每个账户一段时间只能请求一次满血模型。现在市面上类似的产品也多,要么不是满血的模型,要不也存在繁忙的问题。火山背靠字节提供 DeepSeek 每个模型 50W Token 的免费推理额度且支持3万RPM和500万TPM不限速,相比硅基什么的更稳定更好用。同样,字节属于国内平台,实名无可避免。
注册账号完成实名认证
这里用手机号注册就行,现在用我的邀请注册赠送每个模型50w Token 和15元代金券:
https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=IBBM4TL7
开通模型
创建API Key
需要记下来保存的。
创建推理点
这样就会得到你的接入点ID,用于调用模型。
客户端调用
这里可以使用开源的客户端 Cherry Studio,提供 Windows/Mac/Linux 版本。
项目地址: Cherry Studio - 全能的AI助手
如果需要手机使用,可以考虑 ChatBox。
50W token 还是可以用挺久的,加上赠送的15元.用完了再买 50W 也只需要 1 块钱(目前的价格和官方 API 相同)
联网搜索
这里可以使用开源的客户端 Cherry Studio,提供 Windows/Mac/Linux 版本。
首先注册火山,点击创建应用→零代码→单聊,应用名称随意,接入点选择DS-R1(如果没有请新建),选择联网模型插件(如果没有请开通)
第一次使用的话,联网内容插件是需要开通的,去开通即可。
创建完毕后点击右上方的api调用指南,点击“选择api并复制”。
返回cherry studio,在模型中点击添加,供应商选择openAI,名称随意。然后填入api,api地址写https://ark.cn-beijing.volces.com/api/v3/bots/
然后手动添加模型——点“添加”,注意模型ID写你创立的bot应用的ID,格式是“bot-xxx”,位置在我上图的左上角,名称随意
模型ID就是Bot的ID
接入翻译
同样,由于字节卡多,tpm够高,很适合接入翻译。但这可能带来更多的token消耗
设置里找到豆包大模型
填入API 和接入点,和上方一样,但是这里注意需要填写 DeepSeek-V3 的接入点ID,速度最快效果最好。
点击测试,验证成功即可调用。
评论区