语音生成CosyVoice-v3-plus大模型

CosyVoice大模型

复制成功！

语音合成

概述

语音合成

克隆能力：CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音克隆大模型，具有更好的音质和复刻相似度，适用于更专业的场景。仅需提供5-20s的参考音频，即可迅速生成高度相似且听感自然的定制声音。合成能力：CosyVoice-v3-plus是通义实验室CosyVoice系列最新版的语音合成大模型，具有更好的音质和表现力，适用于更专业的场景。该模型支持文本至语音的实时流式合成。

输入

文本

输出

音频

功能

前缀补全

函数调用

缓存

结构化输出

批量任务

联网搜索

微调

定价

语音合成
¥2每万字符

速率限制

RPM每分钟请求数
180

API 参考

获取 API Key

复制成功！

12345678910111213141516

# coding=utf-8

import dashscope
from dashscope.audio.tts_v2 import *

# 若没有将API Key配置到环境变量中，需将your-api-key替换为自己的API Key
# dashscope.api_key = "your-api-key"

model = "cosyvoice-v3-plus"
voice = "longanyang"

synthesizer = SpeechSynthesizer(model=model, voice=voice)
audio = synthesizer.call("今天天气怎么样？")

with open('output.mp3', 'wb') as f:
    f.write(audio)