Qwen3-TTS-Flash
复制成功!
立即体验加入对比
语音合成
概述
语音合成
Qwen3-TTS-Flash模型是通义实验室最新推出的离线语音合成大模型,不仅拥有17种高表现力的拟人音色,且能低延迟高稳定地合成音频;同时支持多种语言,方言,支持同一音色多语言输出。该模型经过海量数据训练,合成音频可以根据文本自适应调节语气,对复杂文本合成也有较好的处理能力。
输入
文本
输出
音频
功能
前缀补全
函数调用
缓存
结构化输出
批量任务
联网搜索
微调
定价
- 语音合成¥0.8每万字符
速率限制
- RPM每分钟请求数180
API 参考
获取 API Key复制成功!
1234567891011121314
# DashScope SDK 版本不低于 1.23.1
import os
import dashscope
text = "那我来给大家推荐一款T恤,这款呢真的是超级好看,这个颜色呢很显气质,而且呢也是搭配的绝佳单品,大家可以闭眼入,真的是非常好看,对身材的包容性也很好,不管啥身材的宝宝呢,穿上去都是很好看的。推荐宝宝们下单哦。"
response = dashscope.audio.qwen_tts.SpeechSynthesizer.call(
# 仅支持qwen-tts系列模型,请勿使用除此之外的其他模型
model="qwen3-tts-flash",
# 若没有配置环境变量,请用阿里云百炼API Key将下行替换为:api_key="sk-xxx"
api_key=os.getenv("DASHSCOPE_API_KEY"),
text=text,
voice="Cherry",
)
print(response)