मुख्य सामग्री पर जाएं

OpenAI

OPENAI_API_KEY

Anthropic

ANTHROPIC_API_KEY

Google Gemini

GOOGLE_API_KEY

Fireworks AI

FIREWORKS_API_KEY

xAI

XAI_API_KEY

Perplexity

PERPLEXITY_API_KEY

DeepSeek

DEEPSEEK_API_KEY

Groq

GROQ_API_KEY

Cohere

COHERE_API_KEY

Cerebras

CEREBRAS_API_KEY

Mistral

MISTRAL_API_KEY

Moonshot

MOONSHOT_API_KEY
## उपयोग के अनुसार मॉडल अनुशंसाएँ
सही मॉडल चुनना आपकी विशिष्ट आवश्यकताओं पर निर्भर करता है। यह मार्गदर्शिका आपको अपनी ज़रूरतों के अनुरूप सर्वश्रेष्ठ प्रदाता और मॉडल चुनने में मदद करेगी:
### टूल कॉलिंग और फ़ंक्शन उपयोग
सबसे उपयुक्त: ऐसे एजेंट्स और एप्लिकेशन्स बनाने के लिए जिन्हें बाहरी टूल्स या फ़ंक्शन्स कॉल करने की आवश्यकता होती है
  • anthropic/claude-opus-4-5 - संरचित आउटपुट के साथ उत्कृष्ट टूल कॉलिंग विश्वसनीयता
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ परफ़ॉर्मेंस के साथ मज़बूत tool उपयोग
  • openai/gpt-5 - संरचित रिस्पॉन्स के साथ नेटिव फ़ंक्शन कॉलिंग सपोर्ट
  • openai/gpt-4o - प्रोडक्शन एप्लिकेशन्स के लिए विश्वसनीय टूल कॉलिंग
  • deepseek/deepseek-chat - मल्टी‑स्टेप रीजनिंग के साथ उन्नत tool उपयोग
### कोडिंग और विकास
सबसे उपयुक्त: कोड जेनरेशन, डिबगिंग, और तकनीकी इम्प्लीमेंटेशन
  • deepseek/deepseek-coder - कोडिंग कार्यों के लिए विशेष रूप से बनाया गया
  • openai/gpt-5-codex - कोड जेनरेशन और कोड कंप्लीशन के लिए विशेषज्ञ
  • anthropic/claude-opus-4-5 - कोड को समझने और जनरेट करने में मजबूत
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ प्रतिक्रिया के साथ उत्कृष्ट कोडिंग
  • xai/grok-code-fast-1 - तेज़, कोड-केंद्रित model
### तर्क और जटिल समस्या समाधान
सबसे उपयुक्त: गणितीय तर्क, तार्किक विश्लेषण और जटिल निर्णय‑लेना
  • anthropic/claude-opus-4-5 - उन्नत तर्क क्षमताएँ
  • openai/o3 - जटिल समस्याओं के लिए गहन तर्क
  • openai/o1 - मज़बूत बहु‑चरणीय तर्क
  • deepseek/deepseek-reasoner - तर्क के लिए विशेषीकृत मॉडल
  • xai/grok-4-fast-reasoning - तर्क-संबंधी कार्यों के लिए अनुकूलित
### गति और दक्षता
उपयोग के लिए सर्वोत्तम: उच्च-थ्रूपुट एप्लिकेशन जिन्हें तेज़ प्रतिक्रियाओं की आवश्यकता होती है
  • anthropic/claude-haiku-4-5-20251001 - कम लागत पर तेज़ प्रदर्शन
  • google/gemini-2.5-flash - थ्रूपुट और कम लेटेंसी के लिए अनुकूलित
  • openai/gpt-5-mini - हल्का, तेज़ model
  • openai/gpt-5-nano - सरल कार्यों के लिए अल्ट्रा-तेज़
  • xai/grok-4-fast-non-reasoning - विस्तृत तर्क के बिना त्वरित प्रतिक्रियाएँ
### Long Context Tasks
सबसे उपयुक्त: बड़े दस्तावेज़ों, कोडबेस या लंबी बातचीत को प्रोसेस करने के लिए
  • google/gemini-2.5-pro - 1M+ टोकन तक की कॉन्टेक्स्ट विंडो
  • google/gemini-2.0-flash - तेज़ प्रदर्शन के साथ बड़ा कॉन्टेक्स्ट
  • anthropic/claude-opus-4-5 - जटिल विश्लेषण के लिए विस्तारित कॉन्टेक्स्ट
  • anthropic/claude-sonnet-4-5-20250929 - लंबे कॉन्टेक्स्ट की मज़बूत क्षमताएँ
  • openai/gpt-4-32k - विस्तारित 32K कॉन्टेक्स्ट विंडो
### विज़न और मल्टीमोडल
सबसे उपयुक्त: छवि समझ, दस्तावेज़ विश्लेषण और विज़ुअल कार्यों के लिए
  • openai/gpt-4o - चैट के साथ शक्तिशाली विज़न क्षमताएँ
  • anthropic/claude-opus-4-5 - उन्नत मल्टीमोडल समझ
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ प्रदर्शन वाला मल्टीमोडल
  • google/gemini-2.5-pro - उन्नत विज़न और मल्टीमोडल प्रोसेसिंग
  • xai/grok-2-vision-1212 - मल्टीमोडल समझ
कई प्रदाता लागत, गति और क्षमताओं के संतुलन के लिए कई मॉडल टियर (जैसे mini, standard, pro, opus) प्रदान करते हैं। परीक्षण के लिए छोटे मॉडलों से शुरू करें और अपनी प्रदर्शन आवश्यकताओं के आधार पर बड़े/अधिक सक्षम मॉडलों तक स्केल करें।
## समर्थित मॉडल्स
прोग्रामेटिक खोज: GET /v1/models का उपयोग करके सैकड़ों मॉडल्स की सूची प्राप्त करें, उनकी क्षमताओं (विज़न, टूल्स, थिंकिंग, स्ट्रीमिंग) और रूटिंग मेटाडेटा सहित। मॉडल सेलेक्टर्स बनाने या n8n जैसे टूल्स में ड्रॉपडाउन को अपने‑आप भरने के लिए उपयुक्त।
### OpenAI
#### चैट मॉडल
  • openai/gpt-5.2
  • openai/gpt-5.1
  • openai/gpt-5
  • openai/gpt-5-mini
  • openai/gpt-5-nano
  • openai/gpt-5-chat-latest
  • openai/gpt-4.1
  • openai/gpt-4.1-mini
  • openai/gpt-4.1-nano
  • openai/gpt-4o
  • openai/gpt-4o-2024-05-13
  • openai/gpt-5.2
  • openai/gpt-4o-search-preview
  • openai/gpt-4o-mini-search-preview
  • openai/chatgpt-4o-latest
  • openai/gpt-4-turbo
  • openai/gpt-4-turbo-2024-04-09
  • openai/gpt-4
  • openai/gpt-4-0125-preview
  • openai/gpt-4-1106-preview
  • openai/gpt-4-0613
  • openai/gpt-3.5-turbo
  • openai/gpt-3.5-turbo-0125
  • openai/gpt-3.5-turbo-1106
#### रीज़निंग मॉडल
  • openai/o1
  • openai/o3
  • openai/o3-mini
  • openai/o4-mini
#### इमेज जेनरेशन
  • openai/dall-e-3
#### ऑडियो ट्रांसक्रिप्शन
  • openai/whisper-1
#### एम्बेडिंग मॉडल
मॉडलमूल्य
openai/text-embedding-3-large$0.13 / 1M tokens
openai/text-embedding-3-small$0.02 / 1M tokens
openai/text-embedding-ada-002$0.10 / 1M tokens
### Anthropic (Claude)
#### Claude 4.5 श्रृंखला
  • anthropic/claude-opus-4-5
  • anthropic/claude-haiku-4-5-20251001
  • anthropic/claude-sonnet-4-5-20250929
#### Claude 4 श्रृंखला
  • anthropic/claude-opus-4-1-20250805
  • anthropic/claude-opus-4-20250514
  • anthropic/claude-opus-4-5
#### Claude 3.7 श्रृंखला
  • anthropic/claude-3-7-sonnet-20250219
#### Claude 3.5 श्रृंखला
  • anthropic/claude-3-5-haiku-20241022
#### Claude 3 श्रृंखला
  • anthropic/claude-3-haiku-20240307
### Google (Gemini)
#### Gemini 3 श्रृंखला
  • google/gemini-3-pro-preview
  • google/gemini-3-flash-preview
#### Gemini 2.5 श्रृंखला
  • google/gemini-2.5-pro
  • google/gemini-2.5-flash
  • google/gemini-2.5-flash-lite
#### Gemini 2.0 श्रृंखला
  • google/gemini-2.0-flash
  • google/gemini-2.0-flash-exp
  • google/gemini-2.0-flash-001
  • google/gemini-2.0-flash-lite

एंबेडिंग मॉडल

  • google/text-embedding-004
### xAI (Grok)
#### Grok 4 श्रृंखला
  • xai/grok-4-1-fast-reasoning
  • xai/grok-4-1-fast-non-reasoning
  • xai/grok-4-fast-reasoning
  • xai/grok-4-fast-non-reasoning
  • xai/grok-code-fast-1
  • xai/grok-4-0709
#### Grok 3 श्रृंखला
  • xai/grok-3
  • xai/grok-3-mini
#### Grok 2 श्रृंखला
  • xai/grok-2-vision-1212
### DeepSeek
  • deepseek/deepseek-chat
  • deepseek/deepseek-reasoner
  • deepseek/deepseek-coder
### Mistral
  • mistral/mistral-large-latest
  • mistral/mistral-medium-latest
  • mistral/mistral-small-latest
  • mistral/codestral-2508
  • mistral/open-mistral-nemo-2407
  • mistral/pixtral-12b
### Groq
ओपन‑सोर्स models के लिए अत्यधिक तेज़ इनफ़ेरेंस।
  • groq/llama-3.1-8b-instant
  • groq/llama-3.3-70b-versatile
  • groq/openai/gpt-oss-120b
  • groq/openai/gpt-oss-20b
  • groq/whisper-large-v3
  • groq/whisper-large-v3-turbo
### Cerebras
कस्टम सिलिकॉन पर अत्यंत तेज़ इनफ़रेंस।
#### प्रोडक्शन मॉडल्स
  • cerebras/llama3.1-8b
  • cerebras/llama-3.3-70b
  • cerebras/gpt-oss-120b
  • cerebras/qwen-3-32b
#### प्रीव्यू मॉडल्स
  • cerebras/qwen-3-235b-a22b-instruct-2507
  • cerebras/zai-glm-4.6
  • cerebras/zai-glm-4.7
### Moonshot (Kimi)
Moonshot AI से उन्नत तर्क‑क्षमता (reasoning) और विस्तारित context window।
  • moonshot/kimi-k2.5
  • moonshot/kimi-k2-0905-preview
  • moonshot/kimi-k2-0711-preview
  • moonshot/kimi-k2-turbo-preview
  • moonshot/kimi-k2-thinking
  • moonshot/kimi-k2-thinking-turbo
Last modified on April 11, 2026