मुख्य सामग्री पर जाएं
POST
/
v1
/
audio
/
speech
स्पीच जेनरेट करें
curl --request POST \
  --url https://api.dedaluslabs.ai/v1/audio/speech \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "<string>",
  "input": "<string>",
  "voice": "alloy",
  "instructions": "<string>",
  "response_format": "mp3",
  "speed": 1,
  "stream_format": "sse"
}
'
"<string>"

प्राधिकरण

Authorization
string
header
आवश्यक

Bearer टोकन के माध्यम से API कुंजी का प्रमाणीकरण

बॉडी

application/json

टेक्स्ट से ऑडियो जनरेट करने के लिए किया गया request।

model
string
आवश्यक

उपलब्ध TTS मॉडल में से कोई एक: openai/tts-1, openai/tts-1-hd या openai/gpt-4o-mini-tts

उदाहरण:

"openai/tts-1"

"openai/tts-1-hd"

input
string
आवश्यक

वह टेक्स्ट जिसके लिए ऑडियो उत्पन्न करना है। अधिकतम लंबाई 4096 कैरेक्टर है।

उदाहरण:

"Hello, how are you today?"

voice
enum<string>
आवश्यक

ऑडियो जेनरेट करते समय उपयोग की जाने वाली voice का नाम। समर्थित voices हैं alloy, ash, ballad, coral, echo, fable, onyx, nova, sage, shimmer, और verse। इन voices का प्रीव्यू आप Text to speech guide में देख सकते हैं।

उपलब्ध विकल्प:
alloy,
ash,
ballad,
coral,
echo,
fable,
onyx,
nova,
sage,
shimmer,
verse
उदाहरण:

"alloy"

"nova"

instructions
string | null

अतिरिक्त निर्देशों के ज़रिए अपने जेनरेट किए गए ऑडियो की आवाज़ को नियंत्रित करें। tts-1 या tts-1-hd के साथ संगत नहीं है।

response_format
enum<string> | null

ऑडियो के लिए आउटपुट फ़ॉर्मेट। समर्थित फ़ॉर्मेट हैं mp3, opus, aac, flac, wav और pcm

उपलब्ध विकल्प:
mp3,
opus,
aac,
flac,
wav,
pcm
उदाहरण:

"mp3"

speed
number | null

जेनरेट किए गए ऑडियो की गति। 0.25 से 4.0 के बीच कोई मान चुनें। 1.0 डिफ़ॉल्ट है।

आवश्यक सीमा: 0.25 <= x <= 4
उदाहरण:

1

stream_format
enum<string> | null

ऑडियो को स्ट्रीम करने के लिए उपयोग किया जाने वाला फ़ॉर्मेट। समर्थित फ़ॉर्मेट sse और audio हैं। tts-1 या tts-1-hd के लिए sse समर्थित नहीं है।

उपलब्ध विकल्प:
sse,
audio
उदाहरण:

"sse"

प्रतिक्रिया

ऑडियो फ़ाइल स्ट्रीम

The response is of type file.