✈️ Qwen3-TTS | 阿里开源新一代 TTS,同传级低延迟还支持秒级克隆🏷 检索标签:#Qwen3TTS #文本转语音 #文字转语音 #TTS #声音克隆 #多语种 #模型 #AI
⭐️ 详情介绍:阿里这次放出的 Qwen3-TTS,明显不是冲着“念得像人”这么简单的目标来的,而是直接对准
实时同传级别的语音生成,
输入 1 个字就能出首包音频,端到端延迟压到
97ms,已经可以进
直播、实时翻译、AI 客服 这种对延迟极其敏感的场景,它最夸张的点在于
秒级音色克隆 加
一句话设计新音色,克隆完还能直接跨语种输出中英日韩德法俄西葡意甚至方言,
音色不飘、不换人 架构上它用了
Dual-Track 双轨流式设计,提供
1.7B 与 0.6B 两个尺寸,前者控制力更强,适合复杂表达,后者在性能和效率之间更均衡,部署门槛也低不少,用来做
有声书一人分饰多角、情绪和方言齐全 这种玩法很有空间
📖 GitHub ·
🌐 模型集合😌频道 |
🙂群聊 |
😋中文包 |
☺️搜索