8月25日,据硅基流动消息,他们已经上线了深度求索团队最新开源的 DeepSeek-V3.1 模型。
据悉,DeepSeek-V3.1 模型的总参数达到了 671B,激活参数为 37B。它采用了混合推理架构(既支持思考模式,也支持非思考模式),因此相比 DeepSeek-R1-0528,具有更高的思考效率,能够更快地给出答案。此外,DeepSeek-V3.1 在工具使用和智能体任务方面的表现也得到了显著提升。新版本在 SWE、Browsecomp、xbench 和 SimpleQA 等基础测试中实现了性能的大幅提升,在多个领域甚至可以与 Claude 4 Sonnet 等模型相媲美。

DeepSeek-V3.1 的定价为输入 4 元 / M Tokens,输出 12 元 / M Tokens,相比之下,Claude 4 Sonnet 的输入成本要高出 5 倍,输出成本更是高出 9 倍。

除了最大支持 500 万 TPM 之外,此次硅基流动平台推出的 DeepSeek-V3.1 还率先支持 160K 超长上下文,从而可以更好地处理长文档、多轮对话、编码以及智能体等复杂场景。具体优势包括:
超长文档无需分段切割:能够无损地解析法律合同、比对学术文献、综述金融报告,并理解全量代码库;
深度对话长程记忆:更适应复杂客服、心理咨询、教学辅导等需要强连贯性交互的场景;
复杂任务端到端处理:无需进行分段处理或缓存拼接等繁琐的工程逻辑,可以一站式完成全链路任务;
高精度 RAG 增强检索:可以将数百份文档嵌入上下文,并基于完整的信息生成精准的答案,从而显著降低检索错误率。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述