OCR क्या है?

Optical Character Recognition (OCR) वह तकनीक है जो छवियों में मौजूद पाठ को मशीन-पठनीय वर्णों में परिवर्तित करती है। यह छवि में आकार और पैटर्न का विश्लेषण करके उन्हें ज्ञात वर्ण प्रतिनिधित्व के साथ मिलाकर काम करता है। OCR का व्यापक रूप से मुद्रित दस्तावेजों को डिजिटल करने, फ़ोटो से पाठ निकालने और स्कैन की गई सामग्री को खोजने योग्य या संपादन योग्य बनाने के लिए उपयोग किया जाता है।

आधुनिक ब्राउज़र-आधारित OCR प्रशिक्षित तंत्रिका नेटवर्क मॉडल का उपयोग करता है जो पूरी तरह से आपके डिवाइस पर चलते हैं। इसका मतलब है कि आपकी छवियां कभी सर्वर को नहीं भेजी जाती — पहचान आपके CPU का उपयोग करके स्थानीय रूप से होती है।

उपकरण विवरण

यह उपकरण Tesseract.js OCR इंजन का उपयोग करके सीधे आपके ब्राउज़र में छवियों से पाठ निकालता है। एक फ़ोटो, स्क्रीनशॉट या स्कैन किया गया दस्तावेज़ अपलोड करें, पाठ की भाषा चुनें, और पाठ निकालें पर क्लिक करें। पहचाना गया पाठ आउटपुट क्षेत्र में दिखाई देता है, जहां आप इसे क्लिपबोर्ड में कॉपी कर सकते हैं या इसे .txt फ़ाइल के रूप में डाउनलोड कर सकते हैं। पृष्ठ लोड होने के बाद कोई इंस्टॉलेशन, कोई अपलोड, कोई इंटरनेट कनेक्शन आवश्यक नहीं है।

विशेषताएं

  • पूरी तरह से ब्राउज़र में चलता है — कोई फ़ाइल अपलोड नहीं, पूर्ण गोपनीयता
  • अंग्रेजी, रूसी, चीनी (सरलीकृत और पारंपरिक), जापानी, कोरियाई, अरबी, हिंदी और प्रमुख यूरोपीय भाषाओं सहित 19 भाषाओं का समर्थन करता है
  • JPEG, PNG, WebP, GIF, BMP और TIFF छवि प्रारूपों को स्वीकार करता है
  • पहचान के दौरान वास्तविक समय प्रगति संकेतक
  • निकाले गए पाठ को .txt फ़ाइल के रूप में डाउनलोड करें जिसका नाम स्रोत छवि के अनुसार हो

उपयोग के मामले

  • मुद्रित दस्तावेजों को डिजिटल करना: अपने फ़ोन से एक पृष्ठ स्कैन करें और इसे मैन्युअल रूप से फिर से टाइप किए बिना संपादन या खोज के लिए सभी पाठ निकालें।
  • स्क्रीनशॉट से पाठ की प्रतिलिपि बनाना: स्क्रीनशॉट से कोड स्निपेट, त्रुटि संदेश या उद्धरण निकालें जहां पाठ को सामान्य रूप से चुना नहीं जा सकता।
  • विदेशी भाषा पाठ वाली छवियों को संसाधित करना: अरबी, जापानी या सिरिलिक जैसी गैर-लैटिन लिपियों में पाठ को पहचानने के लिए भाषा चयनकर्ता का उपयोग करें।

समर्थित प्रारूप

प्रारूप एक्सटेंशन
JPEG .jpg, .jpeg
PNG .png
WebP .webp
GIF .gif
BMP .bmp
TIFF .tif, .tiff

समर्थित भाषाएं

भाषा कोड
अंग्रेजी eng
रूसी rus
फ्रेंच fra
जर्मन deu
इतालवी ita
स्पेनिश spa
पुर्तगाली por
डच nld
पोलिश pol
अरबी ara
चीनी (सरलीकृत) chi_sim
चीनी (पारंपरिक) chi_tra
जापानी jpn
कोरियाई kor
हिंदी hin
तुर्की tur
स्वीडिश swe
नॉर्वेजियन nor
फिनिश fin

सुझाव

  • बेहतर छवियां बेहतर परिणाम देती हैं: उच्च-विपरीत छवियों का उपयोग करें जिनमें तीव्र, समान रूप से प्रकाशित पाठ हो। धुंधली या कम-रिज़ॉल्यूशन वाली फ़ोटो सटीकता को कम करेगी।
  • सही भाषा चुनें: जब गलत भाषा चुनी जाती है, तो पहचान की सटीकता में काफी कमी आती है, विशेष रूप से गैर-लैटिन लिपियों के लिए।
  • गहरे पाठ पर हल्की पृष्ठभूमि सबसे अच्छी तरह काम करती है: यदि आपकी छवि में गहरी पृष्ठभूमि पर हल्का पाठ है, तो अपलोड करने से पहले इसे उलटने का प्रयास करें।
  • स्कैन किए गए दस्तावेज़: मुद्रित पाठ के साथ सर्वोत्तम परिणामों के लिए 300 DPI या उससे अधिक पर स्कैन करें।

सीमाएं

  • पहचान की सटीकता छवि की गुणवत्ता, फ़ॉन्ट शैली और पाठ आकार पर बहुत अधिक निर्भर करती है। हस्तलेखन, सजावटी फ़ॉन्ट और बहुत छोटे पाठ को अच्छी तरह से पहचाना नहीं जा सकता है।
  • भाषा मॉडल फ़ाइलें पहली बार उपयोग पर डाउनलोड की जाती हैं (प्रत्येक कुछ मेगाबाइट), इसलिए पहला निष्कर्षण अधिक समय ले सकता है।
  • बहु-स्तंभ लेआउट अप्रत्याशित पढ़ने के क्रम में पाठ का उत्पादन कर सकते हैं।