Kate Kuray

NeuTTS Air

互联网 2025-10-16 10:16:42

NeuTTS Air 是 Neuphonic 开发的超拟真、可离线运行的 TTS(文本到语音)模型。具备高拟真语音合成能力,声音自然流畅,几乎能以假乱真。支持本地运行,提供 GGML 格式,兼容 CPU,可部署在手机、笔电或树莓派等设备上,无需联网即可使用。NeuTTS Air 支持即时语音克隆,仅需 3 秒音频样本就能克隆说话者的声音。采用基于 LM + Codec 的混合架构,基于 Qwen 0.5B 语言模型和自研 NeuCodec 音频编解码器,在性能、速度与质量之间取得平衡。在中端设备上可实现实时推理,功耗优化适配移动端,生成结果自带水印,确保可溯源与合规使用。NeuTTS Air 可应用于离线语音助手、智能玩具、本地 AI Agent 嵌入式语音接口、游戏与互动角色配音以及对隐私敏感的医疗、司法、教育等领域。