مستخرج نص الصور OCR
استخرج النص من الصور مباشرة في متصفحك باستخدام محرك Tesseract.js OCR. يدعم 19 لغة تشمل الإنجليزية والروسية والصينية واليابانية والعربية والمزيد.
الإدخال
الإخراج
ملف القراءة
ما هو التعرف الضوئي على الأحرف (OCR)؟
التعرف الضوئي على الأحرف (OCR) هي التكنولوجيا التي تحول الصور التي تحتوي على نصوص إلى أحرف قابلة للقراءة الآلية. تعمل من خلال تحليل الأشكال والأنماط في الصورة ومطابقتها مع تمثيلات الأحرف المعروفة. يُستخدم التعرف الضوئي على الأحرف على نطاق واسع لرقمنة المستندات المطبوعة واستخراج النصوص من الصور وجعل المحتوى الممسوح ضوئياً قابلاً للبحث أو التحرير.
يستخدم التعرف الضوئي على الأحرف الحديث القائم على المتصفح نماذج الشبكات العصبية المدربة التي تعمل بالكامل على جهازك. هذا يعني أن صورك لا تُرسل أبداً إلى خادم — يحدث التعرف محلياً باستخدام وحدة المعالجة المركزية (CPU) الخاصة بك.
وصف الأداة
تستخرج هذه الأداة النصوص من الصور مباشرة في متصفحك باستخدام محرك Tesseract.js للتعرف الضوئي على الأحرف. قم بتحميل صورة أو لقطة شاشة أو مستند ممسوح ضوئياً، واختر لغة النص، وانقر على استخراج النص. يظهر النص المعترف به في منطقة الإخراج، حيث يمكنك نسخه إلى الحافظة أو تنزيله كملف .txt. لا توجد حاجة للتثبيت أو التحميل أو الاتصال بالإنترنت بعد تحميل الصفحة.
الميزات
- يعمل بالكامل في المتصفح — بدون تحميل الملفات، خصوصية كاملة
- يدعم 19 لغة تشمل الإنجليزية والروسية والصينية (المبسطة والتقليدية) واليابانية والكورية والعربية والهندية واللغات الأوروبية الرئيسية
- يقبل صيغ الصور JPEG و PNG و WebP و GIF و BMP و TIFF
- مؤشر تقدم فوري أثناء التعرف
- تنزيل النص المستخرج كملف
.txtباسم مشتق من الصورة الأصلية
حالات الاستخدام
- رقمنة المستندات المطبوعة: امسح صفحة بهاتفك واستخرج كل النص للتحرير أو البحث دون إعادة كتابة يدوية.
- نسخ النص من لقطات الشاشة: استخرج مقاطع الأكواد أو رسائل الأخطاء أو الاقتباسات من لقطات الشاشة حيث لا يمكن تحديد النص بشكل طبيعي.
- معالجة الصور التي تحتوي على نصوص بلغات أجنبية: استخدم محدد اللغة للتعرف على النصوص في الأبجديات غير اللاتينية مثل العربية أو اليابانية أو السيريلية.
الصيغ المدعومة
| الصيغة | الامتدادات |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
اللغات المدعومة
| اللغة | الرمز |
|---|---|
| الإنجليزية | eng |
| الروسية | rus |
| الفرنسية | fra |
| الألمانية | deu |
| الإيطالية | ita |
| الإسبانية | spa |
| البرتغالية | por |
| الهولندية | nld |
| البولندية | pol |
| العربية | ara |
| الصينية (المبسطة) | chi_sim |
| الصينية (التقليدية) | chi_tra |
| اليابانية | jpn |
| الكورية | kor |
| الهندية | hin |
| التركية | tur |
| السويدية | swe |
| النرويجية | nor |
| الفنلندية | fin |
نصائح
- الصور الأفضل تعطي نتائج أفضل: استخدم صوراً عالية التباين مع نصوص حادة ومضاءة بشكل متساوٍ. الصور الضبابية أو منخفضة الدقة ستقلل من الدقة.
- اختر اللغة الصحيحة: تنخفض دقة التعرف بشكل كبير عند اختيار لغة خاطئة، خاصة للأبجديات غير اللاتينية.
- النص الداكن على خلفية فاتحة يعمل بشكل أفضل: إذا كانت صورتك تحتوي على نص فاتح على خلفية داكنة، حاول عكسها قبل التحميل.
- المستندات الممسوحة ضوئياً: امسح بدقة 300 DPI أو أعلى للحصول على أفضل النتائج مع النصوص المطبوعة.
القيود
- تعتمد دقة التعرف بشكل كبير على جودة الصورة وأسلوب الخط وحجم النص. قد لا يتم التعرف على الكتابة اليدوية والخطوط الزخرفية والنصوص الصغيرة جداً بشكل جيد.
- يتم تنزيل ملفات نموذج اللغة عند الاستخدام الأول (بضعة ميجابايتات لكل منها)، لذا قد يستغرق الاستخراج الأول وقتاً أطول.
- قد تنتج التخطيطات متعددة الأعمدة نصاً بترتيب قراءة غير متوقع.