感谢热心网友 HH_KK、GreatMOLA、西窗旧事 提供的线索!
xiayx 8月21日消息,深度求索公司今日正式推出新一代人工智能模型 DeepSeek-V3.1。据官方介绍,该模型采用了名为 UE8M0 FP8 Scale 的参数精度技术。
在官方公众号发布的文章中,DeepSeek 进一步说明,UE8M0 FP8 是一项专门为下一代国产芯片量身打造的技术标准,旨在充分发挥新型硬件性能。

注:FP 是 Floating Point 的缩写,指 IEEE 制定的标准浮点数格式。UE8M0 FP8 是人工智能模型领域中的一种参数精度表示方法。
DeepSeek V3.1 的基座模型在 V3 版本基础上进行了扩展训练,新增训练数据量达 840B tokens。目前,基座模型与经过后续训练的完整模型均已同步开源至 Hugging Face 和魔搭平台。以下是具体开源地址:
基座模型:
Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
完整模型:
Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述