OpenAI
OPENAI_API_KEYAnthropic
ANTHROPIC_API_KEYGoogle Gemini
GOOGLE_API_KEYFireworks AI
FIREWORKS_API_KEYxAI
XAI_API_KEYPerplexity
PERPLEXITY_API_KEYDeepSeek
DEEPSEEK_API_KEYGroq
GROQ_API_KEYCohere
COHERE_API_KEYCerebras
CEREBRAS_API_KEYMistral
MISTRAL_API_KEYMoonshot
MOONSHOT_API_KEY## उपयोग के अनुसार मॉडल अनुशंसाएँ
सही मॉडल चुनना आपकी विशिष्ट आवश्यकताओं पर निर्भर करता है। यह मार्गदर्शिका आपको अपनी ज़रूरतों के अनुरूप सर्वश्रेष्ठ प्रदाता और मॉडल चुनने में मदद करेगी:
### टूल कॉलिंग और फ़ंक्शन उपयोग
सबसे उपयुक्त: ऐसे एजेंट्स और एप्लिकेशन्स बनाने के लिए जिन्हें बाहरी टूल्स या फ़ंक्शन्स कॉल करने की आवश्यकता होती है
anthropic/claude-opus-4-5- संरचित आउटपुट के साथ उत्कृष्ट टूल कॉलिंग विश्वसनीयताanthropic/claude-sonnet-4-5-20250929- तेज़ परफ़ॉर्मेंस के साथ मज़बूत tool उपयोगopenai/gpt-5- संरचित रिस्पॉन्स के साथ नेटिव फ़ंक्शन कॉलिंग सपोर्टopenai/gpt-4o- प्रोडक्शन एप्लिकेशन्स के लिए विश्वसनीय टूल कॉलिंगdeepseek/deepseek-chat- मल्टी‑स्टेप रीजनिंग के साथ उन्नत tool उपयोग
### कोडिंग और विकास
सबसे उपयुक्त: कोड जेनरेशन, डिबगिंग, और तकनीकी इम्प्लीमेंटेशन
deepseek/deepseek-coder- कोडिंग कार्यों के लिए विशेष रूप से बनाया गयाopenai/gpt-5-codex- कोड जेनरेशन और कोड कंप्लीशन के लिए विशेषज्ञanthropic/claude-opus-4-5- कोड को समझने और जनरेट करने में मजबूतanthropic/claude-sonnet-4-5-20250929- तेज़ प्रतिक्रिया के साथ उत्कृष्ट कोडिंगxai/grok-code-fast-1- तेज़, कोड-केंद्रित model
### तर्क और जटिल समस्या समाधान
सबसे उपयुक्त: गणितीय तर्क, तार्किक विश्लेषण और जटिल निर्णय‑लेना
anthropic/claude-opus-4-5- उन्नत तर्क क्षमताएँopenai/o3- जटिल समस्याओं के लिए गहन तर्कopenai/o1- मज़बूत बहु‑चरणीय तर्कdeepseek/deepseek-reasoner- तर्क के लिए विशेषीकृत मॉडलxai/grok-4-fast-reasoning- तर्क-संबंधी कार्यों के लिए अनुकूलित
### गति और दक्षता
उपयोग के लिए सर्वोत्तम: उच्च-थ्रूपुट एप्लिकेशन जिन्हें तेज़ प्रतिक्रियाओं की आवश्यकता होती है
anthropic/claude-haiku-4-5-20251001- कम लागत पर तेज़ प्रदर्शनgoogle/gemini-2.5-flash- थ्रूपुट और कम लेटेंसी के लिए अनुकूलितopenai/gpt-5-mini- हल्का, तेज़ modelopenai/gpt-5-nano- सरल कार्यों के लिए अल्ट्रा-तेज़xai/grok-4-fast-non-reasoning- विस्तृत तर्क के बिना त्वरित प्रतिक्रियाएँ
### Long Context Tasks
सबसे उपयुक्त: बड़े दस्तावेज़ों, कोडबेस या लंबी बातचीत को प्रोसेस करने के लिए
google/gemini-2.5-pro- 1M+ टोकन तक की कॉन्टेक्स्ट विंडोgoogle/gemini-2.0-flash- तेज़ प्रदर्शन के साथ बड़ा कॉन्टेक्स्टanthropic/claude-opus-4-5- जटिल विश्लेषण के लिए विस्तारित कॉन्टेक्स्टanthropic/claude-sonnet-4-5-20250929- लंबे कॉन्टेक्स्ट की मज़बूत क्षमताएँopenai/gpt-4-32k- विस्तारित 32K कॉन्टेक्स्ट विंडो
### विज़न और मल्टीमोडल
सबसे उपयुक्त: छवि समझ, दस्तावेज़ विश्लेषण और विज़ुअल कार्यों के लिए
openai/gpt-4o- चैट के साथ शक्तिशाली विज़न क्षमताएँanthropic/claude-opus-4-5- उन्नत मल्टीमोडल समझanthropic/claude-sonnet-4-5-20250929- तेज़ प्रदर्शन वाला मल्टीमोडलgoogle/gemini-2.5-pro- उन्नत विज़न और मल्टीमोडल प्रोसेसिंगxai/grok-2-vision-1212- मल्टीमोडल समझ
## समर्थित मॉडल्स
прोग्रामेटिक खोज:
GET /v1/models का उपयोग करके सैकड़ों मॉडल्स की सूची
प्राप्त करें, उनकी क्षमताओं (विज़न, टूल्स, थिंकिंग, स्ट्रीमिंग) और रूटिंग मेटाडेटा सहित। मॉडल
सेलेक्टर्स बनाने या n8n जैसे टूल्स में ड्रॉपडाउन को अपने‑आप भरने के लिए उपयुक्त।### OpenAI
#### चैट मॉडल
openai/gpt-5.2openai/gpt-5.1openai/gpt-5openai/gpt-5-miniopenai/gpt-5-nanoopenai/gpt-5-chat-latestopenai/gpt-4.1openai/gpt-4.1-miniopenai/gpt-4.1-nanoopenai/gpt-4oopenai/gpt-4o-2024-05-13openai/gpt-5.2openai/gpt-4o-search-previewopenai/gpt-4o-mini-search-previewopenai/chatgpt-4o-latestopenai/gpt-4-turboopenai/gpt-4-turbo-2024-04-09openai/gpt-4openai/gpt-4-0125-previewopenai/gpt-4-1106-previewopenai/gpt-4-0613openai/gpt-3.5-turboopenai/gpt-3.5-turbo-0125openai/gpt-3.5-turbo-1106
#### रीज़निंग मॉडल
openai/o1openai/o3openai/o3-miniopenai/o4-mini
#### इमेज जेनरेशन
openai/dall-e-3
#### ऑडियो ट्रांसक्रिप्शन
openai/whisper-1
#### एम्बेडिंग मॉडल
| मॉडल | मूल्य |
|---|---|
openai/text-embedding-3-large | $0.13 / 1M tokens |
openai/text-embedding-3-small | $0.02 / 1M tokens |
openai/text-embedding-ada-002 | $0.10 / 1M tokens |
### Anthropic (Claude)
#### Claude 4.5 श्रृंखला
anthropic/claude-opus-4-5anthropic/claude-haiku-4-5-20251001anthropic/claude-sonnet-4-5-20250929
#### Claude 4 श्रृंखला
anthropic/claude-opus-4-1-20250805anthropic/claude-opus-4-20250514anthropic/claude-opus-4-5
#### Claude 3.7 श्रृंखला
anthropic/claude-3-7-sonnet-20250219
#### Claude 3.5 श्रृंखला
anthropic/claude-3-5-haiku-20241022
#### Claude 3 श्रृंखला
anthropic/claude-3-haiku-20240307
### Google (Gemini)
#### Gemini 3 श्रृंखला
google/gemini-3-pro-previewgoogle/gemini-3-flash-preview
#### Gemini 2.5 श्रृंखला
google/gemini-2.5-progoogle/gemini-2.5-flashgoogle/gemini-2.5-flash-lite
#### Gemini 2.0 श्रृंखला
google/gemini-2.0-flashgoogle/gemini-2.0-flash-expgoogle/gemini-2.0-flash-001google/gemini-2.0-flash-lite
एंबेडिंग मॉडल
google/text-embedding-004
### xAI (Grok)
#### Grok 4 श्रृंखला
xai/grok-4-1-fast-reasoningxai/grok-4-1-fast-non-reasoningxai/grok-4-fast-reasoningxai/grok-4-fast-non-reasoningxai/grok-code-fast-1xai/grok-4-0709
#### Grok 3 श्रृंखला
xai/grok-3xai/grok-3-mini
#### Grok 2 श्रृंखला
xai/grok-2-vision-1212
### DeepSeek
deepseek/deepseek-chatdeepseek/deepseek-reasonerdeepseek/deepseek-coder
### Mistral
mistral/mistral-large-latestmistral/mistral-medium-latestmistral/mistral-small-latestmistral/codestral-2508mistral/open-mistral-nemo-2407mistral/pixtral-12b
### Groq
ओपन‑सोर्स models के लिए अत्यधिक तेज़ इनफ़ेरेंस।
groq/llama-3.1-8b-instantgroq/llama-3.3-70b-versatilegroq/openai/gpt-oss-120bgroq/openai/gpt-oss-20bgroq/whisper-large-v3groq/whisper-large-v3-turbo
### Cerebras
कस्टम सिलिकॉन पर अत्यंत तेज़ इनफ़रेंस।
#### प्रोडक्शन मॉडल्स
cerebras/llama3.1-8bcerebras/llama-3.3-70bcerebras/gpt-oss-120bcerebras/qwen-3-32b
#### प्रीव्यू मॉडल्स
cerebras/qwen-3-235b-a22b-instruct-2507cerebras/zai-glm-4.6cerebras/zai-glm-4.7
### Moonshot (Kimi)
Moonshot AI से उन्नत तर्क‑क्षमता (reasoning) और विस्तारित context window।
moonshot/kimi-k2.5moonshot/kimi-k2-0905-previewmoonshot/kimi-k2-0711-previewmoonshot/kimi-k2-turbo-previewmoonshot/kimi-k2-thinkingmoonshot/kimi-k2-thinking-turbo