Estrattore di testo da immagini OCR
Estrai testo da immagini direttamente nel tuo browser utilizzando il motore OCR Tesseract.js. Supporta 19 lingue tra cui inglese, russo, cinese, giapponese, arabo e altri.
Input
Output
Leggimi
Che cos'è l'OCR?
Il riconoscimento ottico dei caratteri (OCR) è la tecnologia che converte le immagini contenenti testo in caratteri leggibili da una macchina. Funziona analizzando le forme e i modelli in un'immagine e confrontandoli con rappresentazioni di caratteri conosciute. L'OCR è ampiamente utilizzato per digitalizzare documenti stampati, estrarre testo da foto e rendere il contenuto scansionato ricercabile o modificabile.
L'OCR moderno basato su browser utilizza modelli di reti neurali addestrate che vengono eseguiti interamente sul tuo dispositivo. Ciò significa che le tue immagini non vengono mai inviate a un server — il riconoscimento avviene localmente utilizzando la tua CPU.
Descrizione dello strumento
Questo strumento estrae il testo dalle immagini direttamente nel tuo browser utilizzando il motore OCR Tesseract.js. Carica una foto, uno screenshot o un documento scansionato, scegli la lingua del testo e fai clic su Estrai testo. Il testo riconosciuto appare nell'area di output, dove puoi copiarlo negli appunti o scaricarlo come file .txt. Nessuna installazione, nessun caricamento, nessuna connessione internet richiesta dopo il caricamento della pagina.
Caratteristiche
- Viene eseguito interamente nel browser — nessun caricamento di file, privacy completa
- Supporta 19 lingue tra cui inglese, russo, cinese (semplificato e tradizionale), giapponese, coreano, arabo, hindi e le principali lingue europee
- Accetta i formati di immagine JPEG, PNG, WebP, GIF, BMP e TIFF
- Indicatore di progresso in tempo reale durante il riconoscimento
- Scarica il testo estratto come file
.txtdenominato in base all'immagine di origine
Casi d'uso
- Digitalizzazione di documenti stampati: Scansiona una pagina con il tuo telefono ed estrai tutto il testo per la modifica o la ricerca senza doverlo riscrivere manualmente.
- Copia di testo da screenshot: Estrai frammenti di codice, messaggi di errore o citazioni da screenshot dove il testo non può essere selezionato normalmente.
- Elaborazione di immagini con testo in lingua straniera: Utilizza il selettore della lingua per riconoscere il testo in script non latini come arabo, giapponese o cirillico.
Formati supportati
| Formato | Estensioni |
|---|---|
| JPEG | .jpg, .jpeg |
| PNG | .png |
| WebP | .webp |
| GIF | .gif |
| BMP | .bmp |
| TIFF | .tif, .tiff |
Lingue supportate
| Lingua | Codice |
|---|---|
| Inglese | eng |
| Russo | rus |
| Francese | fra |
| Tedesco | deu |
| Italiano | ita |
| Spagnolo | spa |
| Portoghese | por |
| Olandese | nld |
| Polacco | pol |
| Arabo | ara |
| Cinese (Semplificato) | chi_sim |
| Cinese (Tradizionale) | chi_tra |
| Giapponese | jpn |
| Coreano | kor |
| Hindi | hin |
| Turco | tur |
| Svedese | swe |
| Norvegese | nor |
| Finlandese | fin |
Suggerimenti
- Immagini migliori producono risultati migliori: Utilizza immagini ad alto contrasto con testo nitido e uniformemente illuminato. Le foto sfocate o a bassa risoluzione ridurranno la precisione.
- Seleziona la lingua corretta: La precisione del riconoscimento diminuisce significativamente quando viene selezionata la lingua sbagliata, soprattutto per gli script non latini.
- Il testo scuro su sfondo chiaro funziona meglio: Se la tua immagine ha testo chiaro su sfondo scuro, prova a invertirla prima di caricarla.
- Documenti scansionati: Scansiona a 300 DPI o superiore per i migliori risultati con testo stampato.
Limitazioni
- La precisione del riconoscimento dipende fortemente dalla qualità dell'immagine, dallo stile del carattere e dalle dimensioni del testo. La scrittura a mano, i caratteri decorativi e il testo molto piccolo potrebbero non essere riconosciuti bene.
- I file del modello linguistico vengono scaricati al primo utilizzo (alcuni megabyte ciascuno), quindi la prima estrazione potrebbe richiedere più tempo.
- I layout a più colonne potrebbero produrre testo in un ordine di lettura inaspettato.