OCRの精度はツールによって大きく異なります。特に日本語は漢字・ひらがな・カタカナ・数字が混在するため、エンジンごとの得意・不得意がはっきりと出ます。
この記事では、7種類のOCRエンジンを5つの日本語シナリオで実際にテストし、CER(文字誤り率)を計測した結果を公開します。無料ツールの選び方や、用途別のおすすめも紹介します。
5つのシナリオ(各3〜5サンプル)を用意し、各エンジンの出力テキストをGround Truth(正解テキスト)と比較しました。精度指標にはCER(Character Error Rate)を使用しています。
テストに使用したサンプル画像は、実務で遭遇する典型的な日本語文書を再現しています。
| エンジン | 種別 | 料金 | 登録 |
|---|---|---|---|
| Tesseract | ローカル OCR | 無料 | 不要 |
| PaddleOCR | ローカル OCR | 無料 | 不要 |
| GPT-4o-mini | AI (OpenAI) | 従量課金 | 必要 |
| GPT-4o | AI (OpenAI) | 従量課金 | 必要 |
| Gemini 2.5 Flash Lite | AI (Google) | 従量課金 | 必要 |
| Gemini 2.5 Flash | AI (Google) | 従量課金 | 必要 |
| Gemini 2.5 Pro | AI (Google) | 従量課金 | 必要 |
各シナリオの平均CERをまとめました。緑色は各シナリオの最高精度です。
| シナリオ | Tesseract | PaddleOCR | GPT-4o-mini | GPT-4o | Gemini FL | Gemini Flash | Gemini Pro |
|---|---|---|---|---|---|---|---|
| 印刷文書 | 0.043 | 0.012 | 0.012 | 0.033 | 0.012 | 0.014 | 0.017 |
| 手書き | 0.672 | 0.200 | 0.056 | 0.028 | 0.013 | 0.133 | 0.152 |
| 低画質 | 0.168 | 0.108 | 0.192 | 0.133 | 0.136 | 0.062 | 0.098 |
| 縦書き | 0.042 | 0.008 | 0.186 | 0.000 | 0.086 | 0.019 | 0.008 |
| 表組み | 0.444 | 0.291 | 0.301 | 0.281 | 0.205 | 0.141 | 0.204 |
| 総合 | 0.274 | 0.124 | 0.158 | 0.101 | 0.097 | 0.069 | 0.077 |
請求書、契約書などの印刷された日本語文書。すべてのエンジンが高精度を示しました。PaddleOCR(CER 0.012)はローカル動作で最も高精度。AI系エンジンとほぼ同等の精度を達成しており、印刷文書のOCRに課金は不要です。
手書きメモ、ノート、手紙などの手書き日本語。ここでAI系エンジンが圧倒的な差を見せました。Gemini 2.5 Flash Lite(CER 0.013)が最高精度。Tesseractは0.672と実用に耐えないレベルです。手書きOCRを試すなら、AI系エンジンの利用をおすすめします。
スマートフォンで撮影したやや不鮮明な画像。Gemini 2.5 Flash(CER 0.062)が最も強く、画像の前処理やノイズ除去をAIが内部で行っていると推測されます。ローカルOCRのPaddleOCR(0.108)も実用レベルです。
日本語特有の縦書き(縦組み)テキスト。GPT-4o(CER 0.000)が完全一致を達成。PaddleOCR(0.008)とGemini 2.5 Pro(0.008)も極めて高精度です。縦書きOCRを試すなら、ローカルOCRでも十分な精度が得られます。
表やグラフを含む複雑なレイアウト文書。全エンジンで最も苦手なシナリオですが、Gemini 2.5 Flash(CER 0.141)が最高精度。構造的な理解力が求められるため、AI系エンジンが優位です。
APIキーなしで、今すぐ無料で使えるOCRツールをまとめました。
| ツール | 精度ランク | 回数制限 | 登録 | 手書き | 縦書き |
|---|---|---|---|---|---|
| AI OCR (ocrjp.com) | PaddleOCR + AI | 20回/日 + AI 5回/日 | 不要 | 対応 | 対応 |
| Tesseract | 低〜中 | 無制限 | 不要(要インストール) | 非対応 | 一部 |
| Google Drive OCR | 中 | 無制限 | 必要 | 一部 | 非対応 |
Q. OCR精度はどうやって測定するのですか?
CER(Character Error Rate)で測定します。CERは正解テキストと認識結果の編集距離を正解文字数で割った値で、0.0が完全一致、1.0が全て誤りを意味します。
Q. 無料で使えるOCRエンジンはどれですか?
Tesseract(完全無料・オープンソース)、PaddleOCR(完全無料・オープンソース)、AI OCR(ocrjp.com、1日20回まで無料)が無料で利用できます。
Q. 手書き文字の認識に最も精度が高いのはどのエンジンですか?
テスト結果では、Gemini 2.5 Flash Lite(CER 0.013)が最も高精度でした。AI系エンジンは手書き文字認識に大きな優位性があります。