OCR Екстрактор на текст от изображения

Извличане на текст от изображения директно в браузъра ви с помощта на OCR двигателя Tesseract.js. Поддържа 19 езика, включително английски, руски, китайски, японски, арабски и други.

Този инструмент обработва всички данни локално на вашето устройство.

Вход

Плъзнете и пуснете или щракнете, за да изберете файлове

Преглед на файлове

.JPG.JPEG.JPE.PNG.WEBP.GIF.BMP.DIB.TIF.TIFF

Изход

Извлечен текст

0 знаци

Прочети ме

Какво е OCR?

Оптично разпознаване на символи (OCR) е технология, която преобразува изображения, съдържащи текст, в символи, четими от машина. Работи чрез анализиране на формите и моделите в изображението и съпоставянето им с известни представяния на символи. OCR се използва широко за дигитализиране на печатни документи, извличане на текст от снимки и превръщане на сканирано съдържание в търсимо или редактируемо.

Съвременното OCR, базирано на браузър, използва обучени модели на невронни мрежи, които работят изцяло на вашето устройство. Това означава, че вашите изображения никога не се изпращат на сървър — разпознаването се извършва локално, използвайки вашия CPU.

Описание на инструмента

Този инструмент извлича текст от изображения директно в браузъра ви, използвайки OCR двигателя Tesseract.js. Качете снимка, екранна снимка или сканиран документ, изберете езика на текста и щракнете върху Извличане на текст. Разпознатият текст се появява в областта за резултати, където можете да го копирате в буфера на обмена или да го изтеглите като файл .txt. Не е необходима инсталация, качване на файлове или интернет връзка след зареждането на страницата.

Функции

Работи изцяло в браузъра — без качване на файлове, пълна поверителност
Поддържа 19 езика, включително английски, руски, китайски (опростен и традиционен), японски, корейски, арабски, хинди и основни европейски езици
Приема JPEG, PNG, WebP, GIF, BMP и TIFF формати на изображения
Индикатор на прогреса в реално време по време на разпознаване
Изтегляне на извлечения текст като файл .txt, наименуван според изходното изображение

Случаи на употреба

Дигитализиране на печатни документи: Сканирайте страница със своя телефон и извлекчете целия текст за редактиране или търсене без ръчно преписване.
Копиране на текст от екранни снимки: Извлекчете фрагменти код, съобщения за грешки или цитати от екранни снимки, където текстът не може да бъде избран нормално.
Обработка на изображения с текст на чужд език: Използвайте селектора на езика, за да разпознаете текст в нелатински писмена като арабски, японски или кирилица.

Поддържани формати

Формат	Разширения
JPEG	`.jpg`, `.jpeg`
PNG	`.png`
WebP	`.webp`
GIF	`.gif`
BMP	`.bmp`
TIFF	`.tif`, `.tiff`

Поддържани езици

Език	Код
Английски	eng
Руски	rus
Френски	fra
Немски	deu
Италиански	ita
Испански	spa
Португалски	por
Холандски	nld
Полски	pol
Арабски	ara
Китайски (опростен)	chi_sim
Китайски (традиционен)	chi_tra
Японски	jpn
Корейски	kor
Хинди	hin
Турски	tur
Шведски	swe
Норвежки	nor
Финландски	fin

Съвети

По-добрите изображения дават по-добри резултати: Използвайте изображения с висок контраст и остър, равномерно осветен текст. Размазаните или нискорезолюционни снимки ще намалят точността.
Изберете правилния език: Точността на разпознаване пада значително, когато е избран неправилен език, особено за нелатински писмена.
Тъмен текст на светъл фон работи най-добре: Ако вашето изображение има светъл текст на тъмен фон, опитайте да го инвертирате преди качване.
Сканирани документи: Сканирайте с 300 DPI или по-висока резолюция за най-добри резултати с печатен текст.

Ограничения

Точността на разпознаване зависи силно от качеството на изображението, стила на шрифта и размера на текста. Ръкописният текст, декоративните шрифтове и много малкия текст може да не бъдат разпознати добре.
Файловете на езиковия модел се изтеглят при първа употреба (няколко мегабайта всеки), така че първото извличане може да отнеме повече време.
Многоколонните оформления могат да произведат текст в неочакван ред на четене.

Подобни инструменти

Калкулатор за брой пиксели в разделителна способност

Изчислете общия брой пиксели в разделителна способност, като въведете ширина и височина. Включва предварително зададени стойности за често използвани разделителни способности на дисплеи като 1080p, 4K и 8K.

Тестер на персонализирани шрифтове

Качете файл с персонализиран шрифт (TTF, OTF, WOFF, WOFF2) и преглед как се визуализира. Тестирайте с персонализиран текст, променете размер, тегло, цвят, височина на линията, разстояние между букви и преглед на пълната азбука.

Просто уеб рисуване

Рисувайте и скицирайте директно в браузъра ви с този лекотежен онлайн инструмент за рисуване. Отменете или повторете щрихи, изтрийте грешки и запазете вашето произведение като PNG изображение.

Захранвано от

tesseract.projectnaptha.com/

Споделяне

Вграждане

Вграждайте този инструмент навсякъде безплатно. Нужна ви помощ? Проверете нашето ръководство.

<iframe src="https://speedtoolkit.com/bg/embed/ocr-image-text-extractor" title="OCR Екстрактор на текст от изображения - speedtoolkit.com" style="border:0;width:100%;min-height:600px;" loading="lazy"></iframe>
<p>Захранвано от SpeedToolKit: <a href="https://speedtoolkit.com/bg/tool/ocr-image-text-extractor" target="_blank">https://speedtoolkit.com/bg/tool/ocr-image-text-extractor</a></p>

HTML

390 знаци

Отказ от отговорност

Инструментите, предоставени на този уебсайт, са предназначени да помогнат на потребителите при решаването на различни проблеми. Въпреки че се стремим да гарантираме, че инструментите са точни и ефективни, не гарантираме, че резултатът от всеки инструмент ще бъде 100% точен или без грешки. Резултатите, генерирани от тези инструменти, се предоставят както са и трябва да се използват с предпазливост. Препоръчваме потребителите да проверят всяка важна информация или резултати с допълнителни ресурси или професионален съвет, тъй като не можем да бъдем отговорни за никакви последствия, произтичащи от използването на тези инструменти. Използвайки този уебсайт, вие се съгласявате да поемете всички рискове, свързани с точността и използването на предоставените резултати.