मुख्य सामग्री पर जाएं
POST
/
v1
/
ocr
OCR
curl --request POST \
  --url https://api.example.com/v1/ocr

अवलोकन

OCR endpoint दस्तावेज़ों और छवियों से टेक्स्ट निकालकर सुव्यवस्थित Markdown लौटाता है। यह Mistral के OCR model द्वारा संचालित है। समर्थित फ़ॉर्मेट: PDF, PNG, JPEG, WebP

त्वरित प्रारंभ

curl -X POST https://api.dedaluslabs.ai/v1/ocr \
  -H "Authorization: Bearer $DEDALUS_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "mistral-ocr-latest",
    "document": {
      "type": "document_url",
      "document_url": "https://arxiv.org/pdf/1706.03762"
    }
  }'
स्थानीय फ़ाइलों के लिए, उन्हें base64 डेटा URI के रूप में एन्कोड करें: data:application/pdf;base64, {base64_data}

रेस्पॉन्स

{
  "pages": [
    {
      "index": 0,
      "markdown": "# Attention Is All You Need\n\nAshish Vaswani, Noam Shazeer...\n\n# Abstract\n\nThe dominant sequence transduction models..."
    },
    {
      "index": 1,
      "markdown": "## 1 Introduction\n\nRecurrent neural networks..."
    }
  ],
  "model": "mistral-ocr-latest"
}

उपयोग के परिदृश्य

Invoice Processing

स्वचालित बहीखाता-प्रबंधन के लिए इनवॉइस से लाइन आइटम, कुल राशि और तिथियाँ निकालें।

रसीद स्कैनिंग

खर्च ट्रैकिंग के लिए रसीदों को प्रोसेस करें—राशि, विक्रेता और तारीख जैसी जानकारियाँ संरचित टेक्स्ट के रूप में निकालें।

दस्तावेज़ डिजिटाइजेशन

स्कैन किए गए दस्तावेज़ों को तालिकाओं और फ़ॉर्मेटिंग को ज्यों‑का‑त्यों बनाए रखते हुए खोजने योग्य, संपादन योग्य मार्कडाउन में बदलें।

पैरामीटर

ParameterTypeRequiredDescription
modelstringNoOCR model. डिफ़ॉल्ट मान: mistral-ocr-latest
document.typestringYesहमेशा document_url
document.document_urlstringYesHTTPS URL या डेटा URI

सीमाएँ

  • अधिकतम फ़ाइल आकार: 50 MB
  • अधिकतम पृष्ठ: प्रति दस्तावेज़ 1,000
  • समय-सीमा (टाइमआउट): 120 सेकंड