Dedalus Docs / Home

生成语音音频

curl --request POST \
  --url https://api.dedaluslabs.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "input": "<string>",
  "voice": "alloy",
  "instructions": "<string>",
  "response_format": "mp3",
  "speed": 1,
  "stream_format": "sse"
}
'

"<string>"

POST

audio

speech

生成语音音频

curl --request POST \
  --url https://api.dedaluslabs.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "input": "<string>",
  "voice": "alloy",
  "instructions": "<string>",
  "response_format": "mp3",
  "speed": 1,
  "stream_format": "sse"
}
'

"<string>"

授权

Authorization

string

header

必填

使用 Bearer 令牌的 API 密钥身份验证

请求体

application/json

从文本生成音频的请求。

model

string

必填

以下任一可用的 TTS 模型：openai/tts-1、openai/tts-1-hd 或 openai/gpt-4o-mini-tts。

示例:

"openai/tts-1"

"openai/tts-1-hd"

input

string

必填

用于生成音频的文本内容，最大长度为 4096 个字符。

示例:

"Hello, how are you today?"

voice

enum<string>

必填

用于生成音频的语音。当前支持的语音包括：alloy、ash、ballad、coral、echo、fable、onyx、nova、sage、shimmer 和 verse。你可以在文本转语音指南中预览这些语音的示例。

可用选项:

alloy,

ash,

ballad,

coral,

echo,

fable,

onyx,

nova,

sage,

shimmer,

verse

示例:

"alloy"

"nova"

instructions

string | null

使用附加指令控制生成语音的风格。对 tts-1 和 tts-1-hd 无效。

response_format

enum<string> | null

输出音频的格式。支持的格式包括：mp3、opus、aac、flac、wav 和 pcm。

可用选项:

mp3,

opus,

aac,

flac,

wav,

pcm

示例:

"mp3"

speed

number | null

生成音频的播放速度。在 0.25 到 4.0 之间选择一个值，默认值为 1.0。

必填范围: 0.25 <= x <= 4

示例:

1

stream_format

enum<string> | null

指定用于以流式传输方式输出音频的格式。支持的格式为 sse（基于服务器发送事件 (SSE)）和 audio。tts-1 和 tts-1-hd 不支持 sse 流式传输。

可用选项:

sse,

audio

示例:

"sse"

响应

音频文件流式传输

The response is of type file.

创建嵌入

创建转录文本

⌘I

概览

端点

文档处理

模式

生成语音音频

授权

请求体

响应