日本語OCR精度を実測比較 — 7エンジン×5シナリオの結果

公開日: 2026年4月17日読了目安: 8分

OCRの精度はツールによって大きく異なります。特に日本語は漢字・ひらがな・カタカナ・数字が混在するため、エンジンごとの得意・不得意がはっきりと出ます。

この記事では、7種類のOCRエンジン5つの日本語シナリオで実際にテストし、CER(文字誤り率)を計測した結果を公開します。無料ツールの選び方や、用途別のおすすめも紹介します。

テスト方法

5つのシナリオ(各3〜5サンプル)を用意し、各エンジンの出力テキストをGround Truth(正解テキスト)と比較しました。精度指標にはCER(Character Error Rate)を使用しています。

テストに使用したサンプル画像は、実務で遭遇する典型的な日本語文書を再現しています。

テスト対象エンジン

エンジン種別料金登録
Tesseractローカル OCR無料不要
PaddleOCRローカル OCR無料不要
GPT-4o-miniAI (OpenAI)従量課金必要
GPT-4oAI (OpenAI)従量課金必要
Gemini 2.5 Flash LiteAI (Google)従量課金必要
Gemini 2.5 FlashAI (Google)従量課金必要
Gemini 2.5 ProAI (Google)従量課金必要

総合結果:CER比較表

各シナリオの平均CERをまとめました。緑色は各シナリオの最高精度です。

シナリオTesseractPaddleOCRGPT-4o-miniGPT-4oGemini FLGemini FlashGemini Pro
印刷文書0.0430.0120.0120.0330.0120.0140.017
手書き0.6720.2000.0560.0280.0130.1330.152
低画質0.1680.1080.1920.1330.1360.0620.098
縦書き0.0420.0080.1860.0000.0860.0190.008
表組み0.4440.2910.3010.2810.2050.1410.204
総合0.2740.1240.1580.1010.0970.0690.077

シナリオ別の詳細分析

1. 印刷文書(オフィス文書)

請求書、契約書などの印刷された日本語文書。すべてのエンジンが高精度を示しました。PaddleOCR(CER 0.012)はローカル動作で最も高精度。AI系エンジンとほぼ同等の精度を達成しており、印刷文書のOCRに課金は不要です。

2. 手書き文字

手書きメモ、ノート、手紙などの手書き日本語。ここでAI系エンジンが圧倒的な差を見せました。Gemini 2.5 Flash Lite(CER 0.013)が最高精度。Tesseractは0.672と実用に耐えないレベルです。手書きOCRを試すなら、AI系エンジンの利用をおすすめします。

3. 低画質・スマホ撮影

スマートフォンで撮影したやや不鮮明な画像。Gemini 2.5 Flash(CER 0.062)が最も強く、画像の前処理やノイズ除去をAIが内部で行っていると推測されます。ローカルOCRのPaddleOCR(0.108)も実用レベルです。

4. 縦書きテキスト

日本語特有の縦書き(縦組み)テキスト。GPT-4o(CER 0.000)が完全一致を達成。PaddleOCR(0.008)とGemini 2.5 Pro(0.008)も極めて高精度です。縦書きOCRを試すなら、ローカルOCRでも十分な精度が得られます。

5. 表組み・複合レイアウト

表やグラフを含む複雑なレイアウト文書。全エンジンで最も苦手なシナリオですが、Gemini 2.5 Flash(CER 0.141)が最高精度。構造的な理解力が求められるため、AI系エンジンが優位です。

無料で使えるOCRツール比較

APIキーなしで、今すぐ無料で使えるOCRツールをまとめました。

ツール精度ランク回数制限登録手書き縦書き
AI OCR (ocrjp.com)PaddleOCR + AI20回/日 + AI 5回/日不要対応対応
Tesseract低〜中無制限不要(要インストール)非対応一部
Google Drive OCR無制限必要一部非対応

まとめ:用途別おすすめ

よくある質問

Q. OCR精度はどうやって測定するのですか?

CER(Character Error Rate)で測定します。CERは正解テキストと認識結果の編集距離を正解文字数で割った値で、0.0が完全一致、1.0が全て誤りを意味します。

Q. 無料で使えるOCRエンジンはどれですか?

Tesseract(完全無料・オープンソース)、PaddleOCR(完全無料・オープンソース)、AI OCR(ocrjp.com、1日20回まで無料)が無料で利用できます。

Q. 手書き文字の認識に最も精度が高いのはどのエンジンですか?

テスト結果では、Gemini 2.5 Flash Lite(CER 0.013)が最も高精度でした。AI系エンジンは手書き文字認識に大きな優位性があります。

AI OCRを無料で試してみませんか?

登録不要・完全無料。写真や画像から日本語テキストを瞬時に読み取ります。

今すぐ無料で試す