OCR इमेज टेक्स्ट एक्सट्रैक्टर

Tesseract.js OCR इंजन का उपयोग करके सीधे अपने ब्राउज़र में इमेज से टेक्स्ट निकालें। अंग्रेजी, रूसी, चीनी, जापानी, अरबी और अन्य सहित 19 भाषाओं का समर्थन करता है।

यह टूल सभी डेटा को आपके डिवाइस पर स्थानीय रूप से प्रोसेस करता है।

इनपुट

फ़ाइलें चुनने के लिए ड्रैग और ड्रॉप या क्लिक करें

फ़ाइलें ब्राउज़ करें

.JPG.JPEG.JPE.PNG.WEBP.GIF.BMP.DIB.TIF.TIFF

आउटपुट

निकाला गया पाठ

0 अक्षर

रीडमी

OCR क्या है?

Optical Character Recognition (OCR) वह तकनीक है जो छवियों में मौजूद पाठ को मशीन-पठनीय वर्णों में परिवर्तित करती है। यह छवि में आकार और पैटर्न का विश्लेषण करके उन्हें ज्ञात वर्ण प्रतिनिधित्व के साथ मिलाकर काम करता है। OCR का व्यापक रूप से मुद्रित दस्तावेजों को डिजिटल करने, फ़ोटो से पाठ निकालने और स्कैन की गई सामग्री को खोजने योग्य या संपादन योग्य बनाने के लिए उपयोग किया जाता है।

आधुनिक ब्राउज़र-आधारित OCR प्रशिक्षित तंत्रिका नेटवर्क मॉडल का उपयोग करता है जो पूरी तरह से आपके डिवाइस पर चलते हैं। इसका मतलब है कि आपकी छवियां कभी सर्वर को नहीं भेजी जाती — पहचान आपके CPU का उपयोग करके स्थानीय रूप से होती है।

उपकरण विवरण

यह उपकरण Tesseract.js OCR इंजन का उपयोग करके सीधे आपके ब्राउज़र में छवियों से पाठ निकालता है। एक फ़ोटो, स्क्रीनशॉट या स्कैन किया गया दस्तावेज़ अपलोड करें, पाठ की भाषा चुनें, और पाठ निकालें पर क्लिक करें। पहचाना गया पाठ आउटपुट क्षेत्र में दिखाई देता है, जहां आप इसे क्लिपबोर्ड में कॉपी कर सकते हैं या इसे .txt फ़ाइल के रूप में डाउनलोड कर सकते हैं। पृष्ठ लोड होने के बाद कोई इंस्टॉलेशन, कोई अपलोड, कोई इंटरनेट कनेक्शन आवश्यक नहीं है।

विशेषताएं

पूरी तरह से ब्राउज़र में चलता है — कोई फ़ाइल अपलोड नहीं, पूर्ण गोपनीयता
अंग्रेजी, रूसी, चीनी (सरलीकृत और पारंपरिक), जापानी, कोरियाई, अरबी, हिंदी और प्रमुख यूरोपीय भाषाओं सहित 19 भाषाओं का समर्थन करता है
JPEG, PNG, WebP, GIF, BMP और TIFF छवि प्रारूपों को स्वीकार करता है
पहचान के दौरान वास्तविक समय प्रगति संकेतक
निकाले गए पाठ को .txt फ़ाइल के रूप में डाउनलोड करें जिसका नाम स्रोत छवि के अनुसार हो

उपयोग के मामले

मुद्रित दस्तावेजों को डिजिटल करना: अपने फ़ोन से एक पृष्ठ स्कैन करें और इसे मैन्युअल रूप से फिर से टाइप किए बिना संपादन या खोज के लिए सभी पाठ निकालें।
स्क्रीनशॉट से पाठ की प्रतिलिपि बनाना: स्क्रीनशॉट से कोड स्निपेट, त्रुटि संदेश या उद्धरण निकालें जहां पाठ को सामान्य रूप से चुना नहीं जा सकता।
विदेशी भाषा पाठ वाली छवियों को संसाधित करना: अरबी, जापानी या सिरिलिक जैसी गैर-लैटिन लिपियों में पाठ को पहचानने के लिए भाषा चयनकर्ता का उपयोग करें।

समर्थित प्रारूप

प्रारूप	एक्सटेंशन
JPEG	`.jpg`, `.jpeg`
PNG	`.png`
WebP	`.webp`
GIF	`.gif`
BMP	`.bmp`
TIFF	`.tif`, `.tiff`

समर्थित भाषाएं

भाषा	कोड
अंग्रेजी	eng
रूसी	rus
फ्रेंच	fra
जर्मन	deu
इतालवी	ita
स्पेनिश	spa
पुर्तगाली	por
डच	nld
पोलिश	pol
अरबी	ara
चीनी (सरलीकृत)	chi_sim
चीनी (पारंपरिक)	chi_tra
जापानी	jpn
कोरियाई	kor
हिंदी	hin
तुर्की	tur
स्वीडिश	swe
नॉर्वेजियन	nor
फिनिश	fin

सुझाव

बेहतर छवियां बेहतर परिणाम देती हैं: उच्च-विपरीत छवियों का उपयोग करें जिनमें तीव्र, समान रूप से प्रकाशित पाठ हो। धुंधली या कम-रिज़ॉल्यूशन वाली फ़ोटो सटीकता को कम करेगी।
सही भाषा चुनें: जब गलत भाषा चुनी जाती है, तो पहचान की सटीकता में काफी कमी आती है, विशेष रूप से गैर-लैटिन लिपियों के लिए।
गहरे पाठ पर हल्की पृष्ठभूमि सबसे अच्छी तरह काम करती है: यदि आपकी छवि में गहरी पृष्ठभूमि पर हल्का पाठ है, तो अपलोड करने से पहले इसे उलटने का प्रयास करें।
स्कैन किए गए दस्तावेज़: मुद्रित पाठ के साथ सर्वोत्तम परिणामों के लिए 300 DPI या उससे अधिक पर स्कैन करें।

सीमाएं

पहचान की सटीकता छवि की गुणवत्ता, फ़ॉन्ट शैली और पाठ आकार पर बहुत अधिक निर्भर करती है। हस्तलेखन, सजावटी फ़ॉन्ट और बहुत छोटे पाठ को अच्छी तरह से पहचाना नहीं जा सकता है।
भाषा मॉडल फ़ाइलें पहली बार उपयोग पर डाउनलोड की जाती हैं (प्रत्येक कुछ मेगाबाइट), इसलिए पहला निष्कर्षण अधिक समय ले सकता है।
बहु-स्तंभ लेआउट अप्रत्याशित पढ़ने के क्रम में पाठ का उत्पादन कर सकते हैं।

समान टूल्स

रेजोल्यूशन पिक्सल काउंट कैलकुलेटर

चौड़ाई और ऊंचाई दर्ज करके रेजोल्यूशन में कुल पिक्सल की संख्या की गणना करें। 1080p, 4K और 8K जैसे सामान्य डिस्प्ले रेजोल्यूशन के लिए प्रीसेट शामिल हैं।

कस्टम फ़ॉन्ट टेस्टर

एक कस्टम फ़ॉन्ट फ़ाइल (TTF, OTF, WOFF, WOFF2) अपलोड करें और यह कैसे प्रस्तुत होता है इसका पूर्वावलोकन करें। कस्टम टेक्स्ट के साथ परीक्षण करें, आकार, वजन, रंग, लाइन ऊंचाई, अक्षर रिक्ति बदलें, और पूर्ण वर्णमाला नमूना देखें।

सरल वेब पेंट

इस हल्के ऑनलाइन पेंट टूल के साथ सीधे अपने ब्राउज़र में ड्रॉ और स्केच करें। स्ट्रोक को पूर्ववत या फिर से करें, गलतियों को मिटाएं, और अपनी कलाकृति को PNG छवि के रूप में सहेजें।

द्वारा संचालित

tesseract.projectnaptha.com/

एम्बेड

इस टूल को कहीं भी मुफ्त में एम्बेड करें। मदद चाहिए? हमारी गाइड देखें.

<iframe src="https://speedtoolkit.com/hi/embed/ocr-image-text-extractor" title="OCR इमेज टेक्स्ट एक्सट्रैक्टर - speedtoolkit.com" style="border:0;width:100%;min-height:600px;" loading="lazy"></iframe>
<p>SpeedToolKit द्वारा संचालित: <a href="https://speedtoolkit.com/hi/tool/ocr-image-text-extractor" target="_blank">https://speedtoolkit.com/hi/tool/ocr-image-text-extractor</a></p>

HTML

382 अक्षर

अस्वीकरण

इस वेबसाइट पर प्रदान किए गए टूल्स उपयोगकर्ताओं को विभिन्न समस्याओं को हल करने में सहायता करने के लिए डिज़ाइन किए गए हैं। जबकि हम टूल्स की सटीकता और प्रभावशीलता सुनिश्चित करने का प्रयास करते हैं, हम यह गारंटी नहीं देते कि किसी भी टूल का आउटपुट 100% सटीक या त्रुटिरहित होगा। इन टूल्स द्वारा उत्पन्न परिणाम जैसा का तैसा प्रदान किए जाते हैं और इन्हें सावधानीपूर्वक उपयोग करना चाहिए। हम उपयोगकर्ताओं को सलाह देते हैं कि वे महत्वपूर्ण जानकारी या परिणामों की पुष्टि अतिरिक्त स्रोतों या पेशेवर सलाह से करें, क्योंकि हम इन टूल्स के उपयोग से उत्पन्न किसी भी परिणाम की जिम्मेदारी नहीं ले सकते। इस वेबसाइट का उपयोग करके, आप प्रदान किए गए परिणामों की सटीकता और उपयोग से जुड़े सभी जोखिमों को स्वीकार करने के लिए सहमत होते हैं।