मुख्य सामग्री पर जाएं

OpenAI

OPENAI_API_KEY

Anthropic

ANTHROPIC_API_KEY

Google Gemini

GOOGLE_API_KEY

Fireworks AI

FIREWORKS_API_KEY

xAI

XAI_API_KEY

Perplexity

PERPLEXITY_API_KEY

DeepSeek

DEEPSEEK_API_KEY

Groq

GROQ_API_KEY

Cohere

COHERE_API_KEY

Cerebras

CEREBRAS_API_KEY

Mistral

MISTRAL_API_KEY

Moonshot

MOONSHOT_API_KEY

उपयोग के अनुसार मॉडल अनुशंसाएँ

सही मॉडल चुनना आपकी विशिष्ट आवश्यकताओं पर निर्भर करता है। यह मार्गदर्शिका आपको अपनी ज़रूरतों के अनुरूप सर्वश्रेष्ठ प्रदाता और मॉडल चुनने में मदद करेगी:

टूल कॉलिंग और फ़ंक्शन उपयोग

सबसे उपयुक्त: ऐसे एजेंट्स और एप्लिकेशन्स बनाने के लिए जिन्हें बाहरी टूल्स या फ़ंक्शन्स कॉल करने की आवश्यकता होती है
  • anthropic/claude-opus-4-5 - संरचित आउटपुट के साथ उत्कृष्ट टूल कॉलिंग विश्वसनीयता
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ परफ़ॉर्मेंस के साथ मज़बूत tool उपयोग
  • openai/gpt-5 - संरचित रिस्पॉन्स के साथ नेटिव फ़ंक्शन कॉलिंग सपोर्ट
  • openai/gpt-4o - प्रोडक्शन एप्लिकेशन्स के लिए विश्वसनीय टूल कॉलिंग
  • deepseek/deepseek-chat - मल्टी‑स्टेप रीजनिंग के साथ उन्नत tool उपयोग

कोडिंग और विकास

सबसे उपयुक्त: कोड जेनरेशन, डिबगिंग, और तकनीकी इम्प्लीमेंटेशन
  • deepseek/deepseek-coder - कोडिंग कार्यों के लिए विशेष रूप से बनाया गया
  • openai/gpt-5-codex - कोड जेनरेशन और कोड कंप्लीशन के लिए विशेषज्ञ
  • anthropic/claude-opus-4-5 - कोड को समझने और जनरेट करने में मजबूत
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ प्रतिक्रिया के साथ उत्कृष्ट कोडिंग
  • xai/grok-code-fast-1 - तेज़, कोड-केंद्रित model

तर्क और जटिल समस्या समाधान

सबसे उपयुक्त: गणितीय तर्क, तार्किक विश्लेषण और जटिल निर्णय‑लेना
  • anthropic/claude-opus-4-5 - उन्नत तर्क क्षमताएँ
  • openai/o3 - जटिल समस्याओं के लिए गहन तर्क
  • openai/o1 - मज़बूत बहु‑चरणीय तर्क
  • deepseek/deepseek-reasoner - तर्क के लिए विशेषीकृत मॉडल
  • xai/grok-4-fast-reasoning - तर्क-संबंधी कार्यों के लिए अनुकूलित

गति और दक्षता

उपयोग के लिए सर्वोत्तम: उच्च-थ्रूपुट एप्लिकेशन जिन्हें तेज़ प्रतिक्रियाओं की आवश्यकता होती है
  • anthropic/claude-haiku-4-5-20251001 - कम लागत पर तेज़ प्रदर्शन
  • google/gemini-2.5-flash - थ्रूपुट और कम लेटेंसी के लिए अनुकूलित
  • openai/gpt-5-mini - हल्का, तेज़ model
  • openai/gpt-5-nano - सरल कार्यों के लिए अल्ट्रा-तेज़
  • xai/grok-4-fast-non-reasoning - विस्तृत तर्क के बिना त्वरित प्रतिक्रियाएँ

Long Context Tasks

सबसे उपयुक्त: बड़े दस्तावेज़ों, कोडबेस या लंबी बातचीत को प्रोसेस करने के लिए
  • google/gemini-2.5-pro - 1M+ टोकन तक की कॉन्टेक्स्ट विंडो
  • google/gemini-2.0-flash - तेज़ प्रदर्शन के साथ बड़ा कॉन्टेक्स्ट
  • anthropic/claude-opus-4-5 - जटिल विश्लेषण के लिए विस्तारित कॉन्टेक्स्ट
  • anthropic/claude-sonnet-4-5-20250929 - लंबे कॉन्टेक्स्ट की मज़बूत क्षमताएँ
  • openai/gpt-4-32k - विस्तारित 32K कॉन्टेक्स्ट विंडो

विज़न और मल्टीमोडल

सबसे उपयुक्त: छवि समझ, दस्तावेज़ विश्लेषण और विज़ुअल कार्यों के लिए
  • openai/gpt-4o - चैट के साथ शक्तिशाली विज़न क्षमताएँ
  • anthropic/claude-opus-4-5 - उन्नत मल्टीमोडल समझ
  • anthropic/claude-sonnet-4-5-20250929 - तेज़ प्रदर्शन वाला मल्टीमोडल
  • google/gemini-2.5-pro - उन्नत विज़न और मल्टीमोडल प्रोसेसिंग
  • xai/grok-2-vision-1212 - मल्टीमोडल समझ
कई प्रदाता लागत, गति और क्षमताओं के संतुलन के लिए कई मॉडल टियर (जैसे mini, standard, pro, opus) प्रदान करते हैं। परीक्षण के लिए छोटे मॉडलों से शुरू करें और अपनी प्रदर्शन आवश्यकताओं के आधार पर बड़े/अधिक सक्षम मॉडलों तक स्केल करें।

समर्थित मॉडल्स

прोग्रामेटिक खोज: GET /v1/models का उपयोग करके सैकड़ों मॉडल्स की सूची प्राप्त करें, उनकी क्षमताओं (विज़न, टूल्स, थिंकिंग, स्ट्रीमिंग) और रूटिंग मेटाडेटा सहित। मॉडल सेलेक्टर्स बनाने या n8n जैसे टूल्स में ड्रॉपडाउन को अपने‑आप भरने के लिए उपयुक्त।

OpenAI

चैट मॉडल

  • openai/gpt-5.2
  • openai/gpt-5.1
  • openai/gpt-5
  • openai/gpt-5-mini
  • openai/gpt-5-nano
  • openai/gpt-5-chat-latest
  • openai/gpt-4.1
  • openai/gpt-4.1-mini
  • openai/gpt-4.1-nano
  • openai/gpt-4o
  • openai/gpt-4o-2024-05-13
  • openai/gpt-5.2
  • openai/gpt-4o-search-preview
  • openai/gpt-4o-mini-search-preview
  • openai/chatgpt-4o-latest
  • openai/gpt-4-turbo
  • openai/gpt-4-turbo-2024-04-09
  • openai/gpt-4
  • openai/gpt-4-0125-preview
  • openai/gpt-4-1106-preview
  • openai/gpt-4-0613
  • openai/gpt-3.5-turbo
  • openai/gpt-3.5-turbo-0125
  • openai/gpt-3.5-turbo-1106

रीज़निंग मॉडल

  • openai/o1
  • openai/o3
  • openai/o3-mini
  • openai/o4-mini

इमेज जेनरेशन

  • openai/dall-e-3

ऑडियो ट्रांसक्रिप्शन

  • openai/whisper-1

एम्बेडिंग मॉडल

मॉडलमूल्य
openai/text-embedding-3-large$0.13 / 1M tokens
openai/text-embedding-3-small$0.02 / 1M tokens
openai/text-embedding-ada-002$0.10 / 1M tokens

Anthropic (Claude)

Claude 4.5 श्रृंखला

  • anthropic/claude-opus-4-5
  • anthropic/claude-haiku-4-5-20251001
  • anthropic/claude-sonnet-4-5-20250929

Claude 4 श्रृंखला

  • anthropic/claude-opus-4-1-20250805
  • anthropic/claude-opus-4-20250514
  • anthropic/claude-opus-4-5

Claude 3.7 श्रृंखला

  • anthropic/claude-3-7-sonnet-20250219

Claude 3.5 श्रृंखला

  • anthropic/claude-3-5-haiku-20241022

Claude 3 श्रृंखला

  • anthropic/claude-3-haiku-20240307

Google (Gemini)

Gemini 3 श्रृंखला

  • google/gemini-3-pro-preview
  • google/gemini-3-flash-preview

Gemini 2.5 श्रृंखला

  • google/gemini-2.5-pro
  • google/gemini-2.5-flash
  • google/gemini-2.5-flash-lite

Gemini 2.0 श्रृंखला

  • google/gemini-2.0-flash
  • google/gemini-2.0-flash-exp
  • google/gemini-2.0-flash-001
  • google/gemini-2.0-flash-lite

एंबेडिंग मॉडल

  • google/text-embedding-004

xAI (Grok)

Grok 4 श्रृंखला

  • xai/grok-4-1-fast-reasoning
  • xai/grok-4-1-fast-non-reasoning
  • xai/grok-4-fast-reasoning
  • xai/grok-4-fast-non-reasoning
  • xai/grok-code-fast-1
  • xai/grok-4-0709

Grok 3 श्रृंखला

  • xai/grok-3
  • xai/grok-3-mini

Grok 2 श्रृंखला

  • xai/grok-2-vision-1212

DeepSeek

  • deepseek/deepseek-chat
  • deepseek/deepseek-reasoner
  • deepseek/deepseek-coder

Mistral

  • mistral/mistral-large-latest
  • mistral/mistral-medium-latest
  • mistral/mistral-small-latest
  • mistral/codestral-2508
  • mistral/open-mistral-nemo-2407
  • mistral/pixtral-12b

Groq

ओपन‑सोर्स models के लिए अत्यधिक तेज़ इनफ़ेरेंस।
  • groq/llama-3.1-8b-instant
  • groq/llama-3.3-70b-versatile
  • groq/openai/gpt-oss-120b
  • groq/openai/gpt-oss-20b
  • groq/whisper-large-v3
  • groq/whisper-large-v3-turbo

Cerebras

कस्टम सिलिकॉन पर अत्यंत तेज़ इनफ़रेंस।

प्रोडक्शन मॉडल्स

  • cerebras/llama3.1-8b
  • cerebras/llama-3.3-70b
  • cerebras/gpt-oss-120b
  • cerebras/qwen-3-32b

प्रीव्यू मॉडल्स

  • cerebras/qwen-3-235b-a22b-instruct-2507
  • cerebras/zai-glm-4.6
  • cerebras/zai-glm-4.7

Moonshot (Kimi)

Moonshot AI से उन्नत तर्क‑क्षमता (reasoning) और विस्तारित context window।
  • moonshot/kimi-k2.5
  • moonshot/kimi-k2-0905-preview
  • moonshot/kimi-k2-0711-preview
  • moonshot/kimi-k2-turbo-preview
  • moonshot/kimi-k2-thinking
  • moonshot/kimi-k2-thinking-turbo