OCRとは?

光学文字認識(OCR)は、テキストを含む画像を機械が読み取り可能な文字に変換するテクノロジーです。画像内の形状とパターンを分析し、既知の文字表現と照合することで機能します。OCRは印刷されたドキュメントのデジタル化、写真からのテキスト抽出、スキャンされたコンテンツの検索可能性と編集可能性の向上に広く使用されています。

最新のブラウザベースのOCRは、デバイス上で完全に実行される訓練済みニューラルネットワークモデルを使用しています。つまり、画像がサーバーに送信されることはなく、認識はCPUを使用してローカルで行われます。

ツール説明

このツールはTesseract.js OCRエンジンを使用して、ブラウザ内で画像から直接テキストを抽出します。写真、スクリーンショット、またはスキャンされたドキュメントをアップロードし、テキストの言語を選択して「テキストを抽出」をクリックします。認識されたテキストは出力エリアに表示され、クリップボードにコピーするか、.txtファイルとしてダウンロードできます。インストール不要、アップロード不要、ページ読み込み後のインターネット接続不要です。

機能

  • ブラウザ内で完全に実行 — ファイルアップロードなし、完全なプライバシー
  • 英語、ロシア語、中国語(簡体字および繁体字)、日本語、韓国語、アラビア語、ヒンディー語、主要なヨーロッパ言語を含む19言語に対応
  • JPEG、PNG、WebP、GIF、BMP、TIFFの画像形式に対応
  • 認識中のリアルタイム進捗インジケーター
  • 抽出されたテキストを元の画像にちなんだ名前の.txtファイルとしてダウンロード

ユースケース

  • 印刷されたドキュメントのデジタル化: スマートフォンでページをスキャンし、手動で再入力することなく、編集または検索用にすべてのテキストを抽出します。
  • スクリーンショットからのテキストコピー: 通常はテキストを選択できないスクリーンショットから、コードスニペット、エラーメッセージ、または引用符を抽出します。
  • 外国語テキストを含む画像の処理: 言語セレクターを使用して、アラビア語、日本語、キリル文字などの非ラテン文字のテキストを認識します。

サポートされている形式

形式 拡張子
JPEG .jpg, .jpeg
PNG .png
WebP .webp
GIF .gif
BMP .bmp
TIFF .tif, .tiff

サポートされている言語

言語 コード
英語 eng
ロシア語 rus
フランス語 fra
ドイツ語 deu
イタリア語 ita
スペイン語 spa
ポルトガル語 por
オランダ語 nld
ポーランド語 pol
アラビア語 ara
中国語(簡体字) chi_sim
中国語(繁体字) chi_tra
日本語 jpn
韓国語 kor
ヒンディー語 hin
トルコ語 tur
スウェーデン語 swe
ノルウェー語 nor
フィンランド語 fin

ヒント

  • より良い画像がより良い結果を生成します: コントラストが高く、シャープで均等に照らされたテキストの画像を使用してください。ぼやけた、または低解像度の写真は精度を低下させます。
  • 正しい言語を選択してください: 特に非ラテン文字では、間違った言語が選択されると認識精度が大幅に低下します。
  • 濃いテキストが明るい背景で最適に機能します: 画像に明るいテキストが暗い背景にある場合は、アップロード前に反転してみてください。
  • スキャンされたドキュメント: 印刷されたテキストで最良の結果を得るには、300 DPI以上でスキャンしてください。

制限事項

  • 認識精度は画像品質、フォントスタイル、テキストサイズに大きく依存します。手書き、装飾的なフォント、非常に小さいテキストは認識されない可能性があります。
  • 言語モデルファイルは初回使用時にダウンロードされます(各数メガバイト)。そのため、最初の抽出には時間がかかる場合があります。
  • 複数列のレイアウトは、予期しない読み取り順序でテキストを生成する可能性があります。