Какво е OCR?

Оптично разпознаване на символи (OCR) е технология, която преобразува изображения, съдържащи текст, в символи, четими от машина. Работи чрез анализиране на формите и моделите в изображението и съпоставянето им с известни представяния на символи. OCR се използва широко за дигитализиране на печатни документи, извличане на текст от снимки и превръщане на сканирано съдържание в търсимо или редактируемо.

Съвременното OCR, базирано на браузър, използва обучени модели на невронни мрежи, които работят изцяло на вашето устройство. Това означава, че вашите изображения никога не се изпращат на сървър — разпознаването се извършва локално, използвайки вашия CPU.

Описание на инструмента

Този инструмент извлича текст от изображения директно в браузъра ви, използвайки OCR двигателя Tesseract.js. Качете снимка, екранна снимка или сканиран документ, изберете езика на текста и щракнете върху Извличане на текст. Разпознатият текст се появява в областта за резултати, където можете да го копирате в буфера на обмена или да го изтеглите като файл .txt. Не е необходима инсталация, качване на файлове или интернет връзка след зареждането на страницата.

Функции

  • Работи изцяло в браузъра — без качване на файлове, пълна поверителност
  • Поддържа 19 езика, включително английски, руски, китайски (опростен и традиционен), японски, корейски, арабски, хинди и основни европейски езици
  • Приема JPEG, PNG, WebP, GIF, BMP и TIFF формати на изображения
  • Индикатор на прогреса в реално време по време на разпознаване
  • Изтегляне на извлечения текст като файл .txt, наименуван според изходното изображение

Случаи на употреба

  • Дигитализиране на печатни документи: Сканирайте страница със своя телефон и извлекчете целия текст за редактиране или търсене без ръчно преписване.
  • Копиране на текст от екранни снимки: Извлекчете фрагменти код, съобщения за грешки или цитати от екранни снимки, където текстът не може да бъде избран нормално.
  • Обработка на изображения с текст на чужд език: Използвайте селектора на езика, за да разпознаете текст в нелатински писмена като арабски, японски или кирилица.

Поддържани формати

Формат Разширения
JPEG .jpg, .jpeg
PNG .png
WebP .webp
GIF .gif
BMP .bmp
TIFF .tif, .tiff

Поддържани езици

Език Код
Английски eng
Руски rus
Френски fra
Немски deu
Италиански ita
Испански spa
Португалски por
Холандски nld
Полски pol
Арабски ara
Китайски (опростен) chi_sim
Китайски (традиционен) chi_tra
Японски jpn
Корейски kor
Хинди hin
Турски tur
Шведски swe
Норвежки nor
Финландски fin

Съвети

  • По-добрите изображения дават по-добри резултати: Използвайте изображения с висок контраст и остър, равномерно осветен текст. Размазаните или нискорезолюционни снимки ще намалят точността.
  • Изберете правилния език: Точността на разпознаване пада значително, когато е избран неправилен език, особено за нелатински писмена.
  • Тъмен текст на светъл фон работи най-добре: Ако вашето изображение има светъл текст на тъмен фон, опитайте да го инвертирате преди качване.
  • Сканирани документи: Сканирайте с 300 DPI или по-висока резолюция за най-добри резултати с печатен текст.

Ограничения

  • Точността на разпознаване зависи силно от качеството на изображението, стила на шрифта и размера на текста. Ръкописният текст, декоративните шрифтове и много малкия текст може да не бъдат разпознати добре.
  • Файловете на езиковия модел се изтеглят при първа употреба (няколко мегабайта всеки), така че първото извличане може да отнеме повече време.
  • Многоколонните оформления могат да произведат текст в неочакван ред на четене.