OCR-bildtextextraktor
Extrahera text från bilder direkt i din webbläsare med Tesseract.js OCR-motor. Stöder 19 språk inklusive engelska, ryska, kinesiska, japanska, arabiska och mer.
Inmatning
Utdata
Readme
Vad är OCR?
Optical Character Recognition (OCR) är tekniken som konverterar bilder innehållande text till maskinläsbar text. Det fungerar genom att analysera former och mönster i en bild och matcha dem mot kända teckenrepresentationer. OCR används ofta för att digitalisera tryckta dokument, extrahera text från foton och göra skannat innehål sökbart eller redigerbart.
Modern webbläsarbaserad OCR använder tränade neurala nätverksmodeller som körs helt på din enhet. Det betyder att dina bilder aldrig skickas till en server — igenkänningen sker lokalt med din CPU.
Verktygsbeskrivning
Det här verktyget extraherar text från bilder direkt i din webbläsare med hjälp av Tesseract.js OCR-motorn. Ladda upp ett foto, en skärmbild eller ett skannat dokument, välj språket för texten och klicka på Extrahera text. Den igenkänd text visas i utdataområdet, där du kan kopiera den till urklipp eller ladda ned den som en .txt-fil. Ingen installation, inga uppladdningar, ingen internetanslutning krävs efter att sidan har lästs in.
Funktioner
- Körs helt i webbläsaren — inga filuppladdningar, fullständig sekretess
- Stöder 19 språk inklusive engelska, ryska, kinesiska (förenklad och traditionell), japanska, koreanska, arabiska, hindi och större europeiska språk
- Accepterar JPEG, PNG, WebP, GIF, BMP och TIFF bildformat
- Realtidsförloppsindikator under igenkänning
- Ladda ned extraherad text som en
.txt-fil uppkallad efter källbilden
Användningsfall
- Digitalisering av tryckta dokument: Skanna en sida med din telefon och extrahera all text för redigering eller sökning utan att manuellt skriva om den.
- Kopiera text från skärmbilder: Extrahera kodavsnitt, felmeddelanden eller citat från skärmbilder där texten inte kan väljas normalt.
- Bearbetning av bilder med text på främmande språk: Använd språkväljaren för att känna igen text i icke-latinska skript såsom arabiska, japanska eller kyrilliska.
Format som stöds
| Format | Tillägg |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
Språk som stöds
| Språk | Kod |
|---|---|
| Engelska | eng |
| Ryska | rus |
| Franska | fra |
| Tyska | deu |
| Italienska | ita |
| Spanska | spa |
| Portugisiska | por |
| Nederländska | nld |
| Polska | pol |
| Arabiska | ara |
| Kinesiska (förenklad) | chi_sim |
| Kinesiska (traditionell) | chi_tra |
| Japanska | jpn |
| Koreanska | kor |
| Hindi | hin |
| Turkiska | tur |
| Svenska | swe |
| Norska | nor |
| Finska | fin |
Tips
- Bättre bilder ger bättre resultat: Använd högkontrastbilder med skarp, jämnt belyst text. Suddiga eller låg upplösningsfoton minskar noggrannheten.
- Välj rätt språk: Igenkänningsnoggrannheten sjunker betydligt när fel språk väljs, särskilt för icke-latinska skript.
- Mörk text på ljus bakgrund fungerar bäst: Om din bild har ljus text på mörk bakgrund, försök att invertera den innan du laddar upp den.
- Skannade dokument: Skanna med 300 DPI eller högre för bästa resultat med tryckt text.
Begränsningar
- Igenkänningsnoggrannheten beror mycket på bildkvalitet, teckensnittsstil och textstorlek. Handskrift, dekorativa typsnitt och mycket liten text kanske inte känns igen väl.
- Språkmodellfiler laddas ned vid första användning (några megabyte vardera), så första extraheringen kan ta längre tid.
- Flerspaltig layout kan producera text i en oväntad läsordning.