首页 > 人工智能 >英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

来源:ithome 2025-08-19 14:00:52

AI小模型竞赛升级:英伟达推出性能强劲的Nemotron Nano v2

在AI领域掀起了一股"小模型"热潮。继麻省理工学院Liquid AI推出可穿戴设备适配的微型视觉模型,以及谷歌发布手机端运行的小型模型后,英伟达近日也加入战局,推出了其最新研发的Nemotron Nano v2小型语言模型(SLM)。这款仅9B参数的"小"模型在性能表现上令人惊喜。

性能表现亮眼

根据测试数据,Nemotron Nano v2在复杂推理任务中的准确率与Qwen3-8B相当甚至更高,而运行速度更是提升了惊人的6倍。这款由英伟达自主研发的模型采用了独特的设计理念,旨在成为通用型AI解决方案。

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

创新功能设计

该模型最引人注目的特点是其"思考预算控制"机制。用户可以根据需求设定模型推理过程中允许使用的token数量。这种设计既保证了推理质量,又提高了效率。技术团队负责人Oleksii Kuchaiev透露,他们通过特殊训练方法解决了模型"偷跑"思考的问题。

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

全面开源策略

英伟达此次不仅开源了模型本身,还罕见地公开了训练数据集。这套包含20万亿token的预训练语料库分为多个专业领域,为AI开发者提供了宝贵的研究资源。这种开放态度在业内实属罕见。

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

技术细节解析

模型训练过程分为三个阶段:

  1. 预训练阶段采用FP8精度处理海量数据
  2. 后训练阶段通过多种优化方法提升性能
  3. 压缩阶段使模型能在普通GPU上高效运行

测试结果显示,该模型在多项基准测试中表现优异,特别是在数学推理和长文本处理方面。

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

行业影响展望

英伟达近期在开源领域的积极布局,与部分科技巨头转向闭源形成鲜明对比。其Nemotron生态系统的持续完善,特别是针对中国市场对标Qwen系列的战略,或将重塑AI开源生态格局。目前,Nemotron Nano v2已开放在线试用,感兴趣的开发者可以亲身体验其性能表现。

英伟达开源 9B 参数 AI 小模型 Nemotron Nano v2,比 Qwen3 快 6 倍

本文首发于量子位(ID:QbitAI),作者:不圆

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。