ما هو التعرف الضوئي على الأحرف (OCR)؟

التعرف الضوئي على الأحرف (OCR) هي التكنولوجيا التي تحول الصور التي تحتوي على نصوص إلى أحرف قابلة للقراءة الآلية. تعمل من خلال تحليل الأشكال والأنماط في الصورة ومطابقتها مع تمثيلات الأحرف المعروفة. يُستخدم التعرف الضوئي على الأحرف على نطاق واسع لرقمنة المستندات المطبوعة واستخراج النصوص من الصور وجعل المحتوى الممسوح ضوئياً قابلاً للبحث أو التحرير.

يستخدم التعرف الضوئي على الأحرف الحديث القائم على المتصفح نماذج الشبكات العصبية المدربة التي تعمل بالكامل على جهازك. هذا يعني أن صورك لا تُرسل أبداً إلى خادم — يحدث التعرف محلياً باستخدام وحدة المعالجة المركزية (CPU) الخاصة بك.

وصف الأداة

تستخرج هذه الأداة النصوص من الصور مباشرة في متصفحك باستخدام محرك Tesseract.js للتعرف الضوئي على الأحرف. قم بتحميل صورة أو لقطة شاشة أو مستند ممسوح ضوئياً، واختر لغة النص، وانقر على استخراج النص. يظهر النص المعترف به في منطقة الإخراج، حيث يمكنك نسخه إلى الحافظة أو تنزيله كملف .txt. لا توجد حاجة للتثبيت أو التحميل أو الاتصال بالإنترنت بعد تحميل الصفحة.

الميزات

  • يعمل بالكامل في المتصفح — بدون تحميل الملفات، خصوصية كاملة
  • يدعم 19 لغة تشمل الإنجليزية والروسية والصينية (المبسطة والتقليدية) واليابانية والكورية والعربية والهندية واللغات الأوروبية الرئيسية
  • يقبل صيغ الصور JPEG و PNG و WebP و GIF و BMP و TIFF
  • مؤشر تقدم فوري أثناء التعرف
  • تنزيل النص المستخرج كملف .txt باسم مشتق من الصورة الأصلية

حالات الاستخدام

  • رقمنة المستندات المطبوعة: امسح صفحة بهاتفك واستخرج كل النص للتحرير أو البحث دون إعادة كتابة يدوية.
  • نسخ النص من لقطات الشاشة: استخرج مقاطع الأكواد أو رسائل الأخطاء أو الاقتباسات من لقطات الشاشة حيث لا يمكن تحديد النص بشكل طبيعي.
  • معالجة الصور التي تحتوي على نصوص بلغات أجنبية: استخدم محدد اللغة للتعرف على النصوص في الأبجديات غير اللاتينية مثل العربية أو اليابانية أو السيريلية.

الصيغ المدعومة

الصيغة الامتدادات
JPEG .jpg, .jpeg
PNG .png
WebP .webp
GIF .gif
BMP .bmp
TIFF .tif, .tiff

اللغات المدعومة

اللغة الرمز
الإنجليزية eng
الروسية rus
الفرنسية fra
الألمانية deu
الإيطالية ita
الإسبانية spa
البرتغالية por
الهولندية nld
البولندية pol
العربية ara
الصينية (المبسطة) chi_sim
الصينية (التقليدية) chi_tra
اليابانية jpn
الكورية kor
الهندية hin
التركية tur
السويدية swe
النرويجية nor
الفنلندية fin

نصائح

  • الصور الأفضل تعطي نتائج أفضل: استخدم صوراً عالية التباين مع نصوص حادة ومضاءة بشكل متساوٍ. الصور الضبابية أو منخفضة الدقة ستقلل من الدقة.
  • اختر اللغة الصحيحة: تنخفض دقة التعرف بشكل كبير عند اختيار لغة خاطئة، خاصة للأبجديات غير اللاتينية.
  • النص الداكن على خلفية فاتحة يعمل بشكل أفضل: إذا كانت صورتك تحتوي على نص فاتح على خلفية داكنة، حاول عكسها قبل التحميل.
  • المستندات الممسوحة ضوئياً: امسح بدقة 300 DPI أو أعلى للحصول على أفضل النتائج مع النصوص المطبوعة.

القيود

  • تعتمد دقة التعرف بشكل كبير على جودة الصورة وأسلوب الخط وحجم النص. قد لا يتم التعرف على الكتابة اليدوية والخطوط الزخرفية والنصوص الصغيرة جداً بشكل جيد.
  • يتم تنزيل ملفات نموذج اللغة عند الاستخدام الأول (بضعة ميجابايتات لكل منها)، لذا قد يستغرق الاستخراج الأول وقتاً أطول.
  • قد تنتج التخطيطات متعددة الأعمدة نصاً بترتيب قراءة غير متوقع.