Qwen3-TTS-Flash

复制成功！

语音合成

概述

语音合成

Qwen3-TTS-Flash模型是通义实验室最新推出的离线语音合成大模型，不仅拥有17种高表现力的拟人音色，且能低延迟高稳定地合成音频；同时支持多种语言，方言，支持同一音色多语言输出。该模型经过海量数据训练，合成音频可以根据文本自适应调节语气，对复杂文本合成也有较好的处理能力。

输入

文本

输出

音频

功能

前缀补全

函数调用

缓存

结构化输出

批量任务

联网搜索

微调

定价

语音合成
¥0.8每万字符

速率限制

RPM每分钟请求数
180

API 参考

获取 API Key

复制成功！

1234567891011121314

# DashScope SDK 版本不低于 1.23.1
import os
import dashscope

text = "那我来给大家推荐一款T恤，这款呢真的是超级好看，这个颜色呢很显气质，而且呢也是搭配的绝佳单品，大家可以闭眼入，真的是非常好看，对身材的包容性也很好，不管啥身材的宝宝呢，穿上去都是很好看的。推荐宝宝们下单哦。"
response = dashscope.audio.qwen_tts.SpeechSynthesizer.call(
    # 仅支持qwen-tts系列模型，请勿使用除此之外的其他模型
    model="qwen3-tts-flash",
    # 若没有配置环境变量，请用阿里云百炼API Key将下行替换为：api_key="sk-xxx"
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    text=text,
    voice="Cherry",
)
print(response)