Qwen3-TTS-Flash

复制成功!
立即体验加入对比
语音合成

概述

语音合成

Qwen3-TTS-Flash模型是通义实验室最新推出的离线语音合成大模型,不仅拥有17种高表现力的拟人音色,且能低延迟高稳定地合成音频;同时支持多种语言,方言,支持同一音色多语言输出。该模型经过海量数据训练,合成音频可以根据文本自适应调节语气,对复杂文本合成也有较好的处理能力。

输入

文本

输出

音频

功能

前缀补全

函数调用

缓存

结构化输出

批量任务

联网搜索

微调

定价

  • 语音合成
    ¥0.8每万字符

速率限制

  • RPM每分钟请求数
    180

API 参考

获取 API Key
复制成功!
1234567891011121314
# DashScope SDK 版本不低于 1.23.1
import os
import dashscope

text = "那我来给大家推荐一款T恤,这款呢真的是超级好看,这个颜色呢很显气质,而且呢也是搭配的绝佳单品,大家可以闭眼入,真的是非常好看,对身材的包容性也很好,不管啥身材的宝宝呢,穿上去都是很好看的。推荐宝宝们下单哦。"
response = dashscope.audio.qwen_tts.SpeechSynthesizer.call(
    # 仅支持qwen-tts系列模型,请勿使用除此之外的其他模型
    model="qwen3-tts-flash",
    # 若没有配置环境变量,请用阿里云百炼API Key将下行替换为:api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    text=text,
    voice="Cherry",
)
print(response)