首页 > 人工智能 >面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

来源:ithome 2025-12-10 17:01:36

xiayx 12月10日消息,面壁智能今日官宣,VoxCPM 1.5 版本正式上线,在持续优化开发者开发体验的同时,也带来了多项核心能力升级。

VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模型,于今年 9 月首次发布。

长期稳定更新的攒劲资源: >>>点此立即查看<<<

面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

xiayx附 VoxCPM 1.5 更新亮点:

高采样音频克隆:AudioVAE 采样率从 16kHz 提升至 44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;

生成效率翻倍:在模型参数有所增加的前提下,VoxCPM 1.5 仅需 6.25 个 token 即可生成 1 秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量;

开发者友好:新增 LoRA 和全量微调脚本,支持深度定制;

增强稳定性:减少音频伪影,优化长文本音频的生成效果。

目前,VoxCPM 1.5 模型已在 Github、Hugging Face 开源。

面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

Huggingface:https://huggingface.co/openbmb/VoxCPM1.5

Github:https://github.com/OpenBMB/VoxCPM

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。