Vad är OCR?

Optical Character Recognition (OCR) är tekniken som konverterar bilder innehållande text till maskinläsbar text. Det fungerar genom att analysera former och mönster i en bild och matcha dem mot kända teckenrepresentationer. OCR används ofta för att digitalisera tryckta dokument, extrahera text från foton och göra skannat innehål sökbart eller redigerbart.

Modern webbläsarbaserad OCR använder tränade neurala nätverksmodeller som körs helt på din enhet. Det betyder att dina bilder aldrig skickas till en server — igenkänningen sker lokalt med din CPU.

Verktygsbeskrivning

Det här verktyget extraherar text från bilder direkt i din webbläsare med hjälp av Tesseract.js OCR-motorn. Ladda upp ett foto, en skärmbild eller ett skannat dokument, välj språket för texten och klicka på Extrahera text. Den igenkänd text visas i utdataområdet, där du kan kopiera den till urklipp eller ladda ned den som en .txt-fil. Ingen installation, inga uppladdningar, ingen internetanslutning krävs efter att sidan har lästs in.

Funktioner

  • Körs helt i webbläsaren — inga filuppladdningar, fullständig sekretess
  • Stöder 19 språk inklusive engelska, ryska, kinesiska (förenklad och traditionell), japanska, koreanska, arabiska, hindi och större europeiska språk
  • Accepterar JPEG, PNG, WebP, GIF, BMP och TIFF bildformat
  • Realtidsförloppsindikator under igenkänning
  • Ladda ned extraherad text som en .txt-fil uppkallad efter källbilden

Användningsfall

  • Digitalisering av tryckta dokument: Skanna en sida med din telefon och extrahera all text för redigering eller sökning utan att manuellt skriva om den.
  • Kopiera text från skärmbilder: Extrahera kodavsnitt, felmeddelanden eller citat från skärmbilder där texten inte kan väljas normalt.
  • Bearbetning av bilder med text på främmande språk: Använd språkväljaren för att känna igen text i icke-latinska skript såsom arabiska, japanska eller kyrilliska.

Format som stöds

Format Tillägg
JPEG .jpg, .jpeg
PNG .png
WebP .webp
GIF .gif
BMP .bmp
TIFF .tif, .tiff

Språk som stöds

Språk Kod
Engelska eng
Ryska rus
Franska fra
Tyska deu
Italienska ita
Spanska spa
Portugisiska por
Nederländska nld
Polska pol
Arabiska ara
Kinesiska (förenklad) chi_sim
Kinesiska (traditionell) chi_tra
Japanska jpn
Koreanska kor
Hindi hin
Turkiska tur
Svenska swe
Norska nor
Finska fin

Tips

  • Bättre bilder ger bättre resultat: Använd högkontrastbilder med skarp, jämnt belyst text. Suddiga eller låg upplösningsfoton minskar noggrannheten.
  • Välj rätt språk: Igenkänningsnoggrannheten sjunker betydligt när fel språk väljs, särskilt för icke-latinska skript.
  • Mörk text på ljus bakgrund fungerar bäst: Om din bild har ljus text på mörk bakgrund, försök att invertera den innan du laddar upp den.
  • Skannade dokument: Skanna med 300 DPI eller högre för bästa resultat med tryckt text.

Begränsningar

  • Igenkänningsnoggrannheten beror mycket på bildkvalitet, teckensnittsstil och textstorlek. Handskrift, dekorativa typsnitt och mycket liten text kanske inte känns igen väl.
  • Språkmodellfiler laddas ned vid första användning (några megabyte vardera), så första extraheringen kan ta längre tid.
  • Flerspaltig layout kan producera text i en oväntad läsordning.