CosyVoice大模型

复制成功!
立即体验加入对比
语音合成

概述

语音合成

克隆能力:CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音克隆大模型,具有更好的音质和复刻相似度,适用于更专业的场景。仅需提供5-20s的参考音频,即可迅速生成高度相似且听感自然的定制声音。合成能力:CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音合成大模型,具有更好的音质和表现力,适用于更专业的场景。该模型支持文本至语音的实时流式合成。

输入

文本

输出

音频

功能

前缀补全

函数调用

缓存

结构化输出

批量任务

联网搜索

微调

定价

  • 语音合成
    ¥2每万字符

速率限制

  • RPM每分钟请求数
    180

API 参考

获取 API Key
复制成功!
12345678910111213141516
# coding=utf-8

import dashscope
from dashscope.audio.tts_v2 import *

# 若没有将API Key配置到环境变量中,需将your-api-key替换为自己的API Key
# dashscope.api_key = "your-api-key"

model = "cosyvoice-v3-plus"
voice = "longanyang"

synthesizer = SpeechSynthesizer(model=model, voice=voice)
audio = synthesizer.call("今天天气怎么样?")

with open('output.mp3', 'wb') as f:
    f.write(audio)