Ekstraktor tekstu z obrazów OCR
Wyodrębniaj tekst z obrazów bezpośrednio w przeglądarce za pomocą silnika OCR Tesseract.js. Obsługuje 19 języków, w tym angielski, rosyjski, chiński, japoński, arabski i wiele innych.
Wejście
Wyjście
Instrukcja
Co to jest OCR?
Optyczne Rozpoznawanie Znaków (OCR) to technologia, która konwertuje obrazy zawierające tekst na znaki czytelne dla maszyn. Działa poprzez analizę kształtów i wzorców w obrazie oraz dopasowanie ich do znanych reprezentacji znaków. OCR jest szeroko stosowane do cyfryzacji drukowanych dokumentów, ekstrakcji tekstu ze zdjęć oraz udostępniania zeskanowanej zawartości do wyszukiwania lub edycji.
Nowoczesne OCR oparte na przeglądarce wykorzystuje wytrenowane modele sieci neuronowych, które działają całkowicie na Twoim urządzeniu. Oznacza to, że Twoje obrazy nigdy nie są wysyłane na serwer — rozpoznawanie odbywa się lokalnie przy użyciu Twojego procesora.
Opis narzędzia
To narzędzie ekstrahuje tekst z obrazów bezpośrednio w Twojej przeglądarce, używając silnika OCR Tesseract.js. Prześlij zdjęcie, zrzut ekranu lub zeskanowany dokument, wybierz język tekstu i kliknij Ekstrahuj tekst. Rozpoznany tekst pojawia się w obszarze wyjściowym, gdzie możesz go skopiować do schowka lub pobrać jako plik .txt. Brak instalacji, brak przesyłania, brak wymaganego połączenia internetowego po załadowaniu strony.
Funkcje
- Działa całkowicie w przeglądarce — brak przesyłania plików, pełna prywatność
- Obsługuje 19 języków, w tym angielski, rosyjski, chiński (uproszczony i tradycyjny), japoński, koreański, arabski, hindi i główne języki europejskie
- Akceptuje formaty obrazów JPEG, PNG, WebP, GIF, BMP i TIFF
- Wskaźnik postępu w czasie rzeczywistym podczas rozpoznawania
- Pobieranie ekstrahowanego tekstu jako plik
.txtnazwany na podstawie obrazu źródłowego
Przypadki użycia
- Cyfryzacja drukowanych dokumentów: Zeskanuj stronę za pomocą telefonu i ekstrahuj cały tekst do edycji lub wyszukiwania bez ręcznego przepisywania.
- Kopiowanie tekstu ze zrzutów ekranu: Ekstrahuj fragmenty kodu, komunikaty o błędach lub cytaty ze zrzutów ekranu, gdzie tekst nie może być normalnie zaznaczony.
- Przetwarzanie obrazów z tekstem w obcym języku: Użyj selektora języka, aby rozpoznać tekst w skryptach nołacińskich, takich jak arabski, japoński lub cyrylica.
Obsługiwane formaty
| Format | Rozszerzenia |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
Obsługiwane języki
| Język | Kod |
|---|---|
| Angielski | eng |
| Rosyjski | rus |
| Francuski | fra |
| Niemiecki | deu |
| Włoski | ita |
| Hiszpański | spa |
| Portugalski | por |
| Niderlandzki | nld |
| Polski | pol |
| Arabski | ara |
| Chiński (uproszczony) | chi_sim |
| Chiński (tradycyjny) | chi_tra |
| Japoński | jpn |
| Koreański | kor |
| Hindi | hin |
| Turecki | tur |
| Szwedzki | swe |
| Norweski | nor |
| Fiński | fin |
Porady
- Lepsze obrazy dają lepsze wyniki: Używaj obrazów o wysokim kontraście z ostrym, równomiernie oświetlonym tekstem. Rozmyte lub niskorozdzielczościowe zdjęcia zmniejszą dokładność.
- Wybierz prawidłowy język: Dokładność rozpoznawania znacznie spada, gdy wybrany jest zły język, szczególnie w przypadku skryptów nołacińskich.
- Ciemny tekst na jasnym tle działa najlepiej: Jeśli Twój obraz ma jasny tekst na ciemnym tle, spróbuj go odwrócić przed przesłaniem.
- Zeskanowane dokumenty: Skanuj z rozdzielczością 300 DPI lub wyższą, aby uzyskać najlepsze wyniki z drukowanym tekstem.
Ograniczenia
- Dokładność rozpoznawania zależy w dużej mierze od jakości obrazu, stylu czcionki i rozmiaru tekstu. Pismo odręczne, czcionki dekoracyjne i bardzo mały tekst mogą nie być dobrze rozpoznawane.
- Pliki modelu języka są pobierane przy pierwszym użyciu (kilka megabajtów każdy), więc pierwsza ekstrakcja może trwać dłużej.
- Układy wielokolumnowe mogą generować tekst w nieoczekiwanej kolejności czytania.