CosyVoice大模型
复制成功!
立即体验加入对比
语音合成
概述
语音合成
克隆能力:CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音克隆大模型,具有更好的音质和复刻相似度,适用于更专业的场景。仅需提供5-20s的参考音频,即可迅速生成高度相似且听感自然的定制声音。合成能力:CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音合成大模型,具有更好的音质和表现力,适用于更专业的场景。该模型支持文本至语音的实时流式合成。
输入
文本
输出
音频
功能
前缀补全
函数调用
缓存
结构化输出
批量任务
联网搜索
微调
定价
- 语音合成¥2每万字符
速率限制
- RPM每分钟请求数180
API 参考
获取 API Key复制成功!
12345678910111213141516
# coding=utf-8
import dashscope
from dashscope.audio.tts_v2 import *
# 若没有将API Key配置到环境变量中,需将your-api-key替换为自己的API Key
# dashscope.api_key = "your-api-key"
model = "cosyvoice-v3-plus"
voice = "longanyang"
synthesizer = SpeechSynthesizer(model=model, voice=voice)
audio = synthesizer.call("今天天气怎么样?")
with open('output.mp3', 'wb') as f:
f.write(audio)