OCR Екстрактор на текст от изображения
Извличане на текст от изображения директно в браузъра ви с помощта на OCR двигателя Tesseract.js. Поддържа 19 езика, включително английски, руски, китайски, японски, арабски и други.
Вход
Изход
Прочети ме
Какво е OCR?
Оптично разпознаване на символи (OCR) е технология, която преобразува изображения, съдържащи текст, в символи, четими от машина. Работи чрез анализиране на формите и моделите в изображението и съпоставянето им с известни представяния на символи. OCR се използва широко за дигитализиране на печатни документи, извличане на текст от снимки и превръщане на сканирано съдържание в търсимо или редактируемо.
Съвременното OCR, базирано на браузър, използва обучени модели на невронни мрежи, които работят изцяло на вашето устройство. Това означава, че вашите изображения никога не се изпращат на сървър — разпознаването се извършва локално, използвайки вашия CPU.
Описание на инструмента
Този инструмент извлича текст от изображения директно в браузъра ви, използвайки OCR двигателя Tesseract.js. Качете снимка, екранна снимка или сканиран документ, изберете езика на текста и щракнете върху Извличане на текст. Разпознатият текст се появява в областта за резултати, където можете да го копирате в буфера на обмена или да го изтеглите като файл .txt. Не е необходима инсталация, качване на файлове или интернет връзка след зареждането на страницата.
Функции
- Работи изцяло в браузъра — без качване на файлове, пълна поверителност
- Поддържа 19 езика, включително английски, руски, китайски (опростен и традиционен), японски, корейски, арабски, хинди и основни европейски езици
- Приема JPEG, PNG, WebP, GIF, BMP и TIFF формати на изображения
- Индикатор на прогреса в реално време по време на разпознаване
- Изтегляне на извлечения текст като файл
.txt, наименуван според изходното изображение
Случаи на употреба
- Дигитализиране на печатни документи: Сканирайте страница със своя телефон и извлекчете целия текст за редактиране или търсене без ръчно преписване.
- Копиране на текст от екранни снимки: Извлекчете фрагменти код, съобщения за грешки или цитати от екранни снимки, където текстът не може да бъде избран нормално.
- Обработка на изображения с текст на чужд език: Използвайте селектора на езика, за да разпознаете текст в нелатински писмена като арабски, японски или кирилица.
Поддържани формати
| Формат | Разширения |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
Поддържани езици
| Език | Код |
|---|---|
| Английски | eng |
| Руски | rus |
| Френски | fra |
| Немски | deu |
| Италиански | ita |
| Испански | spa |
| Португалски | por |
| Холандски | nld |
| Полски | pol |
| Арабски | ara |
| Китайски (опростен) | chi_sim |
| Китайски (традиционен) | chi_tra |
| Японски | jpn |
| Корейски | kor |
| Хинди | hin |
| Турски | tur |
| Шведски | swe |
| Норвежки | nor |
| Финландски | fin |
Съвети
- По-добрите изображения дават по-добри резултати: Използвайте изображения с висок контраст и остър, равномерно осветен текст. Размазаните или нискорезолюционни снимки ще намалят точността.
- Изберете правилния език: Точността на разпознаване пада значително, когато е избран неправилен език, особено за нелатински писмена.
- Тъмен текст на светъл фон работи най-добре: Ако вашето изображение има светъл текст на тъмен фон, опитайте да го инвертирате преди качване.
- Сканирани документи: Сканирайте с 300 DPI или по-висока резолюция за най-добри резултати с печатен текст.
Ограничения
- Точността на разпознаване зависи силно от качеството на изображението, стила на шрифта и размера на текста. Ръкописният текст, декоративните шрифтове и много малкия текст може да не бъдат разпознати добре.
- Файловете на езиковия модел се изтеглят при първа употреба (няколко мегабайта всеки), така че първото извличане може да отнеме повече време.
- Многоколонните оформления могат да произведат текст в неочакван ред на четене.