跳转到主要内容
POST
/
v1
/
audio
/
speech
生成语音音频
curl --request POST \
  --url https://api.dedaluslabs.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "input": "<string>",
  "voice": "alloy",
  "instructions": "<string>",
  "response_format": "mp3",
  "speed": 1,
  "stream_format": "sse"
}
'
"<string>"

授权

Authorization
string
header
必填

使用 Bearer 令牌的 API 密钥身份验证

请求体

application/json

从文本生成音频的请求。

model
string
必填

以下任一可用的 TTS 模型openai/tts-1openai/tts-1-hdopenai/gpt-4o-mini-tts

示例:

"openai/tts-1"

"openai/tts-1-hd"

input
string
必填

用于生成音频的文本内容,最大长度为 4096 个字符。

示例:

"Hello, how are you today?"

voice
enum<string>
必填

用于生成音频的语音。当前支持的语音包括:alloyashballadcoralechofableonyxnovasageshimmerverse。你可以在文本转语音指南中预览这些语音的示例。

可用选项:
alloy,
ash,
ballad,
coral,
echo,
fable,
onyx,
nova,
sage,
shimmer,
verse
示例:

"alloy"

"nova"

instructions
string | null

使用附加指令控制生成语音的风格。对 tts-1tts-1-hd 无效。

response_format
enum<string> | null

输出音频的格式。支持的格式包括:mp3opusaacflacwavpcm

可用选项:
mp3,
opus,
aac,
flac,
wav,
pcm
示例:

"mp3"

speed
number | null

生成音频的播放速度。在 0.254.0 之间选择一个值,默认值为 1.0

必填范围: 0.25 <= x <= 4
示例:

1

stream_format
enum<string> | null

指定用于以流式传输方式输出音频的格式。支持的格式为 sse(基于服务器发送事件 (SSE))和 audiotts-1tts-1-hd 不支持 sse 流式传输。

可用选项:
sse,
audio
示例:

"sse"

响应

音频文件流式传输

The response is of type file.