प्रमुख रिलीज़: मिस्ट्रल OCR अब MCP प्रोटोकॉल को सपोर्ट करता है

प्रमुख रिलीज़: मिस्ट्रल OCR अब MCP प्रोटोकॉल को सपोर्ट करता है

Author

MISTRAL OCR Team

7 जून 2025

प्रमुख रिलीज़: मिस्ट्रल OCR अब MCP प्रोटोकॉल को सपोर्ट करता है

हमें यह घोषणा करते हुए खुशी हो रही है कि मिस्ट्रल OCR अब आधिकारिक तौर पर MCP (मॉडल कॉन्टेक्स्ट प्रोटोकॉल) को सपोर्ट करता है! इसका मतलब है कि आप हमारी शक्तिशाली OCR क्षमताओं को कर्सर IDE, क्लॉड डेस्कटॉप और अन्य लोकप्रिय एप्लिकेशन्स सहित विभिन्न AI टूल्स और डेवलपमेंट एनवायरनमेंट्स में सीमलेसली इंटीग्रेट कर सकते हैं।

🤖 MCP क्या है?

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) एंथ्रोपिक द्वारा पेश किया गया एक ओपन स्टैंडर्ड प्रोटोकॉल है, जिसे AI एजेंट्स को सुरक्षित और नियंत्रित टूल कॉलिंग क्षमताएं प्रदान करने के लिए डिज़ाइन किया गया है। MCP के माध्यम से, AI मॉडल यह कर सकते हैं:

  • 🔧 बाहरी टूल्स और सेवाओं को कॉल करना
  • 📊 स्ट्रक्चर्ड डेटा सोर्सेज तक पहुंचना
  • 🌐 विभिन्न एप्लिकेशन्स के साथ इंटरैक्ट करना
  • 🔒 सिक्योर सैंडबॉक्स एनवायरनमेंट में रन करना

सरल शब्दों में, MCP AI को शुद्ध टेक्स्ट कन्वर्सेशन से आगे बढ़कर वास्तविक समस्याओं को हल करने के लिए "कार्रवाई" करने की अनुमति देता है।

🚀 मिस्ट्रल OCR MCP इंटीग्रेशन

कोर फंक्शनैलिटी

हमारा MCP सर्वर एक शक्तिशाली टूल प्रदान करता है:

🔍 extract_text - टेक्स्ट एक्सट्रैक्शन

  • उपयोग केस: विभिन्न डॉक्यूमेंट्स और इमेजेस से टेक्स्ट निकालना
  • इनपुट मेथड्स: बेस64 डेटा या फाइल URL
  • आउटपुट फॉर्मेट्स: प्लेन टेक्स्ट, JSON स्ट्रक्चर्ड डेटा, मार्कडाउन
  • प्रोसेसिंग स्पीड: तुरंत परिणामों के साथ सिंक्रोनस प्रोसेसिंग
  • सपोर्टेड फॉर्मेट्स: PDF, JPEG, PNG, WebP

ड्यूल ट्रांसपोर्ट प्रोटोकॉल सपोर्ट

HTTP/JSON-RPC मोड

POST https://www.mistralocr.app/api/mcp
  • ✅ सिंक्रोनस रिक्वेस्ट/रिस्पॉन्स
  • ✅ CORS क्रॉस-ओरिजिन सपोर्ट
  • ✅ वेब क्लाइंट्स के लिए परफेक्ट
  • ✅ API key ऑथेंटिकेशन

SSE स्ट्रीमिंग मोड

GET https://www.mistralocr.app/api/mcp
  • ✅ सर्वर-सेंट इवेंट्स
  • ✅ रियल-टाइम बायडायरेक्शनल कम्युनिकेशन
  • ✅ इवेंट-ड्रिवन मैसेज हैंडलिंग
  • ✅ पर्सिस्टेंट कनेक्शन सपोर्ट

🛠️ क्लाइंट इंटीग्रेशन गाइड

कर्सर IDE / क्लॉड डेस्कटॉप इंटीग्रेशन

डेवलपर्स के लिए, हमने कर्सर IDE और क्लॉड डेस्कटॉप के साथ इंटीग्रेशन अनुभव को विशेष रूप से ऑप्टिमाइज़ किया है:

कॉन्फिगरेशन स्टेप्स

  1. कॉन्फिगरेशन फाइल बनाएं cursor_mcp_config.json:
{
  "mcp": {
    "servers": {
      "mistral-ocr": {
        "url": "https://www.mistralocr.app/api/mcp",
        "transport": "http",
        "headers": {
          "x-api-key": "mk_your_api_key_here",
          "Content-Type": "application/json"
        },
        "capabilities": { "tools": true }
      }
    }
  },
  "shortcuts": {
    "ocr": "@mistral-ocr extract_text"
  }
}
  1. कर्सर में शॉर्टकट्स का उपयोग करें:
    • @ocr - डायरेक्ट OCR रिकग्निशन
    • @mistral-ocr extract_text - फुल टूल कॉल

रियल-वर्ल्ड यूज़ केस

केस 1: कोड डॉक्युमेंटेशन एनालिसिस

यूज़र: @ocr इस डॉक्युमेंटेशन स्क्रीनशॉट में API इंटरफेस जानकारी का विश्लेषण करने में मेरी मदद करें
AI: मैं आपके लिए इस API डॉक्युमेंटेशन स्क्रीनशॉट का विश्लेषण करूंगा...

केस 2: डॉक्युमेंट प्रोसेसिंग

यूज़र: मेरे पास एक PDF डॉक्युमेंट है जिसमें से टेक्स्ट निकालने की आवश्यकता है
AI: मैं आपके PDF डॉक्युमेंट से टेक्स्ट निकालने में आपकी मदद कर सकता हूं...

कस्टम क्लाइंट इंटीग्रेशन

कस्टम इंटीग्रेशन बनाने वाले डेवलपर्स के लिए, हम पूर्ण कॉन्फिगरेशन टेम्प्लेट प्रदान करते हैं:

{
  "mcp": {
    "servers": {
      "mistral-ocr": {
        "url": "https://www.mistralocr.app/api/mcp",
        "transport": "http",
        "authentication": {
          "type": "api_key",
          "header": "x-api-key",
          "key": "mk_your_api_key_here"
        },
        "capabilities": {
          "tools": true,
          "resources": false,
          "prompts": false
        }
      }
    }
  }
}

💡 यूज़ केस & वर्कफ़्लो

स्टैंडर्ड वर्कफ़्लो

graph LR
    A[इमेज/PDF अपलोड करें] --> B[बेस64 एन्कोडिंग या URL]
    B --> C[extract_text]
    C --> D[टेक्स्ट रिजल्ट प्राप्त करें]

उपयुक्त: स्क्रीनशॉट्स, इमेजेस, डॉक्यूमेंट्स, PDFs

🔐 सिक्योरिटी ऑथेंटिकेशन

सुरक्षित API कॉल सुनिश्चित करने के लिए मल्टीपल ऑथेंटिकेशन मेथड्स का सपोर्ट:

# मेथड 1: x-api-key हेडर
x-api-key: mk_your_api_key_here

# मेथड 2: Authorization हेडर  
Authorization: Bearer mk_your_api_key_here

🧪 क्विक टेस्टिंग

HTTP एंडपॉइंट टेस्टिंग

curl -X POST https://www.mistralocr.app/api/mcp \
  -H "Content-Type: application/json" \
  -H "x-api-key: mk_your_api_key" \
  -d '{
    "jsonrpc": "2.0",
    "id": 1,
    "method": "tools/list"
  }'

SSE एंडपॉइंट टेस्टिंग

curl -N -H "Accept: text/event-stream" \
  -H "x-api-key: mk_your_api_key" \
  https://www.mistralocr.app/api/mcp

🎯 रियल-वर्ल्ड एप्लिकेशन केस

केस 1: टेक्निकल डॉक्युमेंटेशन ऑटोमेशन

सीनारियो: डेवलपमेंट टीम्स को डिज़ाइन इमेजेस से API स्पेसिफिकेशन को कोड डॉक्युमेंटेशन में कन्वर्ट करने की आवश्यकता

सॉल्यूशन:

  1. डिज़ाइनर्स API डिज़ाइन इमेजेस अपलोड करते हैं
  2. इंटरफेस जानकारी निकालने के लिए MCP का उपयोग कर OCR को कॉल करें
  3. AI स्वचालित रूप से संबंधित कोड डॉक्युमेंटेशन और टेस्ट केस जनरेट करता है

केस 2: इनवॉइस बैच प्रोसेसिंग

सीनारियो: फाइनेंस पर्सनल को बड़ी संख्या में इनवॉइस इमेजेस को प्रोसेस करने की आवश्यकता

सॉल्यूशन:

  1. इनवॉइस इमेजेस अपलोड करें
  2. OCR की इनवॉइस जानकारी (रकम, तारीखें, सप्लायर्स) निकालें
  3. स्वचालित रूप से फाइनेंसियल रिकॉर्ड टेबल जनरेट करें

केस 3: अकादमिक रिसर्च असिस्टेंस

सीनारियो: शोधकर्ताओं को स्कैन्ड हिस्टोरिकल डॉक्यूमेंट्स से डेटा निकालने की आवश्यकता

सॉल्यूशन:

  1. डॉक्यूमेंट स्कैन्स अपलोड करें
  2. OCR टेक्स्ट कंटेंट निकालता है
  3. AI रिसर्च डेटा को व्यवस्थित और विश्लेषण करने में सहायता करता है

🌟 मिस्ट्रल OCR का MCP इंटीग्रेशन क्यों चुनें?

🚀 टेक्निकल एडवांटेज

  • हाई एक्यूरेसी रिकग्निशन: इंडस्ट्री-लीडिंग OCR रिकग्निशन एक्यूरेसी
  • मल्टी-फॉर्मेट सपोर्ट: PDF, JPEG, PNG, WebP का पूर्ण कवरेज
  • फास्ट रिस्पॉन्स: मिलीसेकंड-लेवल रिटर्न के साथ सिंक्रोनस प्रोसेसिंग
  • ईजी इंटीग्रेशन: सरल बेस64 या URL इनपुट मेथड्स

🔧 इंटीग्रेशन एडवांटेज

  • स्टैंडर्ड प्रोटोकॉल: MCP ओपन स्टैंडर्ड्स का पालन करता है
  • ड्यूल ट्रांसपोर्ट: HTTP और SSE मोड्स के बीच चयन
  • प्लग एंड प्ले: कोई कॉम्प्लेक्स कॉन्फिगरेशन नहीं, तुरंत शुरू करें
  • वाइड कम्पैटिबिलिटी: मेनस्ट्रीम AI डेवलपमेंट टूल्स को सपोर्ट करता है

💼 बिजनेस एडवांटेज

  • कॉस्ट इफेक्टिव: पे-एज़-यू-यूज़ मॉडल, कोई फिक्स्ड कॉस्ट नहीं
  • स्केलेबल: पर्सनल से एंटरप्राइज़-लेवल एप्लिकेशन्स तक सपोर्ट
  • टेक्निकल सपोर्ट: प्रोफेशनल टीम इंटीग्रेशन सपोर्ट प्रदान करती है
  • कंटीन्यूअस अपडेट्स: MCP प्रोटोकॉल डेवलपमेंट के साथ अपडेट रहता है

🔮 फ्यूचर रोडमैप

हम अधिक MCP फीचर्स पर सक्रिय रूप से काम कर रहे हैं:

  • 📊 बैच प्रोसेसिंग टूल्स: एक साथ मल्टीपल फाइल्स प्रोसेस करने का सपोर्ट
  • 🎨 इमेज प्रीप्रोसेसिंग: बेहतर रिकग्निशन के लिए स्वचालित इमेज क्वालिटी ऑप्टिमाइज़ेशन
  • 🔍 इंटेलिजेंट एनालिसिस: न केवल टेक्स्ट निकालें बल्कि कंटेंट को समझने वाले AI एनालिसिस टूल्स इंटीग्रेट करें
  • 🌐 मल्टी-लैंग्वेज एन्हांसमेंट: विभिन्न भाषाओं के लिए रिकग्निशन इफेक्ट्स को ऑप्टिमाइज़ करें

📚 रिसोर्स डाउनलोड्स

आपको तेजी से शुरुआत करने में मदद करने के लिए, हमने पूर्ण कॉन्फिगरेशन फाइल्स तैयार की हैं: