OCR इमेज टेक्स्ट एक्सट्रैक्टर
Tesseract.js OCR इंजन का उपयोग करके सीधे अपने ब्राउज़र में इमेज से टेक्स्ट निकालें। अंग्रेजी, रूसी, चीनी, जापानी, अरबी और अन्य सहित 19 भाषाओं का समर्थन करता है।
इनपुट
आउटपुट
रीडमी
OCR क्या है?
Optical Character Recognition (OCR) वह तकनीक है जो छवियों में मौजूद पाठ को मशीन-पठनीय वर्णों में परिवर्तित करती है। यह छवि में आकार और पैटर्न का विश्लेषण करके उन्हें ज्ञात वर्ण प्रतिनिधित्व के साथ मिलाकर काम करता है। OCR का व्यापक रूप से मुद्रित दस्तावेजों को डिजिटल करने, फ़ोटो से पाठ निकालने और स्कैन की गई सामग्री को खोजने योग्य या संपादन योग्य बनाने के लिए उपयोग किया जाता है।
आधुनिक ब्राउज़र-आधारित OCR प्रशिक्षित तंत्रिका नेटवर्क मॉडल का उपयोग करता है जो पूरी तरह से आपके डिवाइस पर चलते हैं। इसका मतलब है कि आपकी छवियां कभी सर्वर को नहीं भेजी जाती — पहचान आपके CPU का उपयोग करके स्थानीय रूप से होती है।
उपकरण विवरण
यह उपकरण Tesseract.js OCR इंजन का उपयोग करके सीधे आपके ब्राउज़र में छवियों से पाठ निकालता है। एक फ़ोटो, स्क्रीनशॉट या स्कैन किया गया दस्तावेज़ अपलोड करें, पाठ की भाषा चुनें, और पाठ निकालें पर क्लिक करें। पहचाना गया पाठ आउटपुट क्षेत्र में दिखाई देता है, जहां आप इसे क्लिपबोर्ड में कॉपी कर सकते हैं या इसे .txt फ़ाइल के रूप में डाउनलोड कर सकते हैं। पृष्ठ लोड होने के बाद कोई इंस्टॉलेशन, कोई अपलोड, कोई इंटरनेट कनेक्शन आवश्यक नहीं है।
विशेषताएं
- पूरी तरह से ब्राउज़र में चलता है — कोई फ़ाइल अपलोड नहीं, पूर्ण गोपनीयता
- अंग्रेजी, रूसी, चीनी (सरलीकृत और पारंपरिक), जापानी, कोरियाई, अरबी, हिंदी और प्रमुख यूरोपीय भाषाओं सहित 19 भाषाओं का समर्थन करता है
- JPEG, PNG, WebP, GIF, BMP और TIFF छवि प्रारूपों को स्वीकार करता है
- पहचान के दौरान वास्तविक समय प्रगति संकेतक
- निकाले गए पाठ को
.txtफ़ाइल के रूप में डाउनलोड करें जिसका नाम स्रोत छवि के अनुसार हो
उपयोग के मामले
- मुद्रित दस्तावेजों को डिजिटल करना: अपने फ़ोन से एक पृष्ठ स्कैन करें और इसे मैन्युअल रूप से फिर से टाइप किए बिना संपादन या खोज के लिए सभी पाठ निकालें।
- स्क्रीनशॉट से पाठ की प्रतिलिपि बनाना: स्क्रीनशॉट से कोड स्निपेट, त्रुटि संदेश या उद्धरण निकालें जहां पाठ को सामान्य रूप से चुना नहीं जा सकता।
- विदेशी भाषा पाठ वाली छवियों को संसाधित करना: अरबी, जापानी या सिरिलिक जैसी गैर-लैटिन लिपियों में पाठ को पहचानने के लिए भाषा चयनकर्ता का उपयोग करें।
समर्थित प्रारूप
| प्रारूप | एक्सटेंशन |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
समर्थित भाषाएं
| भाषा | कोड |
|---|---|
| अंग्रेजी | eng |
| रूसी | rus |
| फ्रेंच | fra |
| जर्मन | deu |
| इतालवी | ita |
| स्पेनिश | spa |
| पुर्तगाली | por |
| डच | nld |
| पोलिश | pol |
| अरबी | ara |
| चीनी (सरलीकृत) | chi_sim |
| चीनी (पारंपरिक) | chi_tra |
| जापानी | jpn |
| कोरियाई | kor |
| हिंदी | hin |
| तुर्की | tur |
| स्वीडिश | swe |
| नॉर्वेजियन | nor |
| फिनिश | fin |
सुझाव
- बेहतर छवियां बेहतर परिणाम देती हैं: उच्च-विपरीत छवियों का उपयोग करें जिनमें तीव्र, समान रूप से प्रकाशित पाठ हो। धुंधली या कम-रिज़ॉल्यूशन वाली फ़ोटो सटीकता को कम करेगी।
- सही भाषा चुनें: जब गलत भाषा चुनी जाती है, तो पहचान की सटीकता में काफी कमी आती है, विशेष रूप से गैर-लैटिन लिपियों के लिए।
- गहरे पाठ पर हल्की पृष्ठभूमि सबसे अच्छी तरह काम करती है: यदि आपकी छवि में गहरी पृष्ठभूमि पर हल्का पाठ है, तो अपलोड करने से पहले इसे उलटने का प्रयास करें।
- स्कैन किए गए दस्तावेज़: मुद्रित पाठ के साथ सर्वोत्तम परिणामों के लिए 300 DPI या उससे अधिक पर स्कैन करें।
सीमाएं
- पहचान की सटीकता छवि की गुणवत्ता, फ़ॉन्ट शैली और पाठ आकार पर बहुत अधिक निर्भर करती है। हस्तलेखन, सजावटी फ़ॉन्ट और बहुत छोटे पाठ को अच्छी तरह से पहचाना नहीं जा सकता है।
- भाषा मॉडल फ़ाइलें पहली बार उपयोग पर डाउनलोड की जाती हैं (प्रत्येक कुछ मेगाबाइट), इसलिए पहला निष्कर्षण अधिक समय ले सकता है।
- बहु-स्तंभ लेआउट अप्रत्याशित पढ़ने के क्रम में पाठ का उत्पादन कर सकते हैं।