OCR画像テキスト抽出ツール

Tesseract.js OCRエンジンを使用してブラウザで直接画像からテキストを抽出します。英語、ロシア語、中国語、日本語、アラビア語など19言語に対応しています。

このツールはすべてのデータをデバイス上でローカルに処理します。

入力

ドラッグ&ドロップするか、クリックしてファイルを選択

ファイルを参照

.JPG.JPEG.JPE.PNG.WEBP.GIF.BMP.DIB.TIF.TIFF

出力

抽出されたテキスト

0 文字

Readme

OCRとは？

光学文字認識（OCR）は、テキストを含む画像を機械が読み取り可能な文字に変換するテクノロジーです。画像内の形状とパターンを分析し、既知の文字表現と照合することで機能します。OCRは印刷されたドキュメントのデジタル化、写真からのテキスト抽出、スキャンされたコンテンツの検索可能性と編集可能性の向上に広く使用されています。

最新のブラウザベースのOCRは、デバイス上で完全に実行される訓練済みニューラルネットワークモデルを使用しています。つまり、画像がサーバーに送信されることはなく、認識はCPUを使用してローカルで行われます。

ツール説明

このツールはTesseract.js OCRエンジンを使用して、ブラウザ内で画像から直接テキストを抽出します。写真、スクリーンショット、またはスキャンされたドキュメントをアップロードし、テキストの言語を選択して「テキストを抽出」をクリックします。認識されたテキストは出力エリアに表示され、クリップボードにコピーするか、.txtファイルとしてダウンロードできます。インストール不要、アップロード不要、ページ読み込み後のインターネット接続不要です。

機能

ブラウザ内で完全に実行 — ファイルアップロードなし、完全なプライバシー
英語、ロシア語、中国語（簡体字および繁体字）、日本語、韓国語、アラビア語、ヒンディー語、主要なヨーロッパ言語を含む19言語に対応
JPEG、PNG、WebP、GIF、BMP、TIFFの画像形式に対応
認識中のリアルタイム進捗インジケーター
抽出されたテキストを元の画像にちなんだ名前の.txtファイルとしてダウンロード

ユースケース

印刷されたドキュメントのデジタル化: スマートフォンでページをスキャンし、手動で再入力することなく、編集または検索用にすべてのテキストを抽出します。
スクリーンショットからのテキストコピー: 通常はテキストを選択できないスクリーンショットから、コードスニペット、エラーメッセージ、または引用符を抽出します。
外国語テキストを含む画像の処理: 言語セレクターを使用して、アラビア語、日本語、キリル文字などの非ラテン文字のテキストを認識します。

サポートされている形式

形式	拡張子
JPEG	`.jpg`, `.jpeg`
PNG	`.png`
WebP	`.webp`
GIF	`.gif`
BMP	`.bmp`
TIFF	`.tif`, `.tiff`

サポートされている言語

言語	コード
英語	eng
ロシア語	rus
フランス語	fra
ドイツ語	deu
イタリア語	ita
スペイン語	spa
ポルトガル語	por
オランダ語	nld
ポーランド語	pol
アラビア語	ara
中国語（簡体字）	chi_sim
中国語（繁体字）	chi_tra
日本語	jpn
韓国語	kor
ヒンディー語	hin
トルコ語	tur
スウェーデン語	swe
ノルウェー語	nor
フィンランド語	fin

ヒント

より良い画像がより良い結果を生成します: コントラストが高く、シャープで均等に照らされたテキストの画像を使用してください。ぼやけた、または低解像度の写真は精度を低下させます。
正しい言語を選択してください: 特に非ラテン文字では、間違った言語が選択されると認識精度が大幅に低下します。
濃いテキストが明るい背景で最適に機能します: 画像に明るいテキストが暗い背景にある場合は、アップロード前に反転してみてください。
スキャンされたドキュメント: 印刷されたテキストで最良の結果を得るには、300 DPI以上でスキャンしてください。

制限事項

認識精度は画像品質、フォントスタイル、テキストサイズに大きく依存します。手書き、装飾的なフォント、非常に小さいテキストは認識されない可能性があります。
言語モデルファイルは初回使用時にダウンロードされます（各数メガバイト）。そのため、最初の抽出には時間がかかる場合があります。
複数列のレイアウトは、予期しない読み取り順序でテキストを生成する可能性があります。

類似ツール

解像度ピクセル数計算機

幅と高さを入力して、解像度の総ピクセル数を計算します。1080p、4K、8Kなどの一般的なディスプレイ解像度のプリセットが含まれています。

カスタムフォントテスター

カスタムフォントファイル（TTF、OTF、WOFF、WOFF2）をアップロードして、レンダリング方法をプレビューします。カスタムテキストでテストし、サイズ、ウェイト、色、行の高さ、文字間隔を変更し、完全なアルファベットサンプルを表示します。

シンプルウェブペイント

この軽量なオンラインペイントツールでブラウザ内で直接描画とスケッチができます。ストロークを取り消したりやり直したり、間違いを消したり、アートワークをPNG画像として保存できます。

提供

tesseract.projectnaptha.com/

埋め込み

このツールを無料でどこにでも埋め込めます。ヘルプが必要ですか？ガイドをご覧ください.

<iframe src="https://speedtoolkit.com/ja/embed/ocr-image-text-extractor" title="OCR画像テキスト抽出ツール - speedtoolkit.com" style="border:0;width:100%;min-height:600px;" loading="lazy"></iframe>
<p>SpeedToolKitで提供: <a href="https://speedtoolkit.com/ja/tool/ocr-image-text-extractor" target="_blank">https://speedtoolkit.com/ja/tool/ocr-image-text-extractor</a></p>

HTML

355 文字

免責事項

このウェブサイトで提供されるツールは、ユーザーがさまざまな問題を解決するのを支援するために設計されています。ツールの正確性と有効性を確保するために努力していますが、いかなるツールの出力も100%正確またはエラーがないことを保証または保証しません。これらのツールによって生成される結果は現状のままで提供され、注意して使用する必要があります。重要な情報または結果については、追加のリソースまたは専門家のアドバイスで検証することをお勧めします。これらのツールの使用から生じる結果の正確性と使用に関する結果から生じるいかなる結果についても、当社は責任を負いません。このウェブサイトを使用することにより、提供される結果の正確性と使用に関連するすべてのリスクを引き受けることに同意します。