✈️ Qwen3-TTS | 阿里开源新一代 TTS,同传级低延迟还支持秒级克隆

🏷 检索标签:#Qwen3TTS #文本转语音 #文字转语音 #TTS #声音克隆 #多语种 #模型 #AI

⭐️ 详情介绍:阿里这次放出的 Qwen3-TTS,明显不是冲着“念得像人”这么简单的目标来的,而是直接对准 实时同传级别的语音生成输入 1 个字就能出首包音频,端到端延迟压到 97ms,已经可以进 直播、实时翻译、AI 客服 这种对延迟极其敏感的场景,它最夸张的点在于 秒级音色克隆一句话设计新音色,克隆完还能直接跨语种输出中英日韩德法俄西葡意甚至方言,音色不飘、不换人

  架构上它用了 Dual-Track 双轨流式设计,提供 1.7B 与 0.6B 两个尺寸,前者控制力更强,适合复杂表达,后者在性能和效率之间更均衡,部署门槛也低不少,用来做 有声书一人分饰多角、情绪和方言齐全 这种玩法很有空间

📖 GitHub · 🌐 模型集合

😌频道 |🙂群聊 |😋中文包 |☺️搜索
 
 
Back to Top