首页 > 人工智能 >IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

来源:ithome 2025-10-04 17:30:16
感谢xiayx网友 Snailwang 的线索投递!

xiayx 10月4日消息,IBM 当地时间 2 日宣布推出 Granite 4.0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅降低内存需求,这降低了推理部署的成本。

Granite 4.0 系列模型的首发型号包括 Small、Tiny、Micro 规模的标准和指令变体(规格参见下方列表),未来其它参数规模版本和推理变体则将在 2025 年底推出。

Granite-4.0-H-Small:总参数 32B,激活 9B;

Granite-4.0-H-Tiny:总参数 7B,激活 1B;

Granite-4.0-H-Micro:总参数 3B;

Granite-4.0-Micro:采用传统 Transformer 架构,总参数 3B。

IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

IBM 表示混合架构的设计能在长输入和多并发场景下减少 70% 的内存需求。性能方面,即使是最小的 Granite 4.0 模型在基准测试中也明显优于 Granite 3.3 8B,而 Granite-4.0-H-Small 则以较小参数规模取得了开源模型中一流的表现。

IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

IBM 以标准 Apache 2.0 许可开源 Granite 4.0 系列模型,这些模型得到了 ISO 42001 认证并经过加密签名。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。