curl --request POST \
--url https://api.dedaluslabs.ai/v1/audio/speech \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"model": "<string>",
"input": "<string>",
"voice": "alloy",
"instructions": "<string>",
"response_format": "mp3",
"speed": 1,
"stream_format": "sse"
}
'"<string>"从文本生成语音音频。
使用文本转语音模型从输入文本合成音频。支持多种声音和输出格式,包括 mp3、opus、aac、flac、wav 和 pcm。
音频数据以流式传输的方式返回,你可以将其保存为文件,或直接实时推送给用户。
curl --request POST \
--url https://api.dedaluslabs.ai/v1/audio/speech \
--header 'Authorization: Bearer <token>' \
--header 'Content-Type: application/json' \
--data '
{
"model": "<string>",
"input": "<string>",
"voice": "alloy",
"instructions": "<string>",
"response_format": "mp3",
"speed": 1,
"stream_format": "sse"
}
'"<string>"使用 Bearer 令牌的 API 密钥身份验证
从文本生成音频的请求。
用于生成音频的文本内容,最大长度为 4096 个字符。
"Hello, how are you today?"
使用附加指令控制生成语音的风格。对 tts-1 和 tts-1-hd 无效。
输出音频的格式。支持的格式包括:mp3、opus、aac、flac、wav 和 pcm。
mp3, opus, aac, flac, wav, pcm "mp3"
生成音频的播放速度。在 0.25 到 4.0 之间选择一个值,默认值为 1.0。
0.25 <= x <= 41
指定用于以流式传输方式输出音频的格式。支持的格式为 sse(基于服务器发送事件 (SSE))和 audio。tts-1 和 tts-1-hd 不支持 sse 流式传输。
sse, audio "sse"
音频文件流式传输
The response is of type file.
此页面对您有帮助吗?