「OCR を使ってみたら文字が読めない、誤認識ばかりで使い物にならない」——これは多くの方が最初にぶつかる壁です。実は OCR の精度が悪い原因はほぼ 5 つに集約されます。本記事では、原因別の見分け方と具体的な対処法、無料で試せるAI OCR の使い分けを解説します。
原因によって対処法が異なります。下で 1 つずつ解説します。
iPhone は HEIC 形式で画像を保存し、EXIF Orientation タグで「この画像は撮影時に縦向きでした」という情報を別途記録します。古い OCR ツールはこの EXIF Orientation を読まないため、画像を横向きの生データとしてそのまま処理してしまい誤認識します。
従来 OCR(Google Drive、Adobe Acrobat、Tesseract)は印刷文字(明朝・ゴシック)向けに最適化されており、手書き文字の形状ばらつきには対応しきれません。実測データでは Google Drive の手書き CER は 0.342(100 文字中 34 文字誤り)と、実用に耐えないレベルです。
OCR エンジンは学習データに含まれていないフォント・字形を認識できません。また、文字 1 文字あたりのピクセル数が少ない(30 ピクセル未満)と形状が判別不能になります。
| 症状 | 原因 | 対処法 |
|---|---|---|
| 濁点・半濁点が消える | 暗い場所 | 明るい場所で撮り直し |
| 文字がぼやけている | 手ブレ | 両手で固定 / 台に置く |
| 結果が 90 度回転している | HEIC 回転 | AI OCR を使う |
| 手書きが読めない | 従来 OCR の限界 | AI 手書き OCR を使う |
| くずし字・古文書が読めない | 学習データ不足 | AI 高精度認識 + 手動修正 |
| 縦書きの読み順が変 | 縦書き未対応 | 縦書き OCR を使う |
AI OCR(ocrjp.com)は登録不要・無料で利用できます。通常認識(PaddleOCR)が 1 日 20 回、AI 高精度認識が 1 日 5 回まで。手書きや HEIC、縦書きにすべて対応しているので、まずは精度に困っている画像を試してみてください。
👉 7 エンジン×5 シナリオの完全ベンチマーク — 各 OCR の CER データを公開。
👉 AI OCR vs Google Drive OCR vs Adobe Acrobat 比較 — 手書き精度の実測差。
👉 写真の文字をコピーする方法 — iPhone・Android の操作手順。
Q. OCR の精度が悪い一番多い原因は?
撮影段階での問題(暗い場所・手ブレ・斜めから撮影)が約 60% を占めます。これは撮影をやり直すだけで解決できます。次に多いのは手書きで、これは AI 系 OCR を使うことで CER 0.34 → 0.013 に大幅改善します。
Q. iPhone で撮った写真の OCR 精度が悪いのですが?
iPhone は HEIC 形式で保存され、EXIF Orientation で回転情報が含まれます。古い OCR ツールはこの回転を無視するため、横向きの画像として読み込まれて誤認識します。AI OCR(ocrjp.com)は HEIC と EXIF 回転を自動処理するため、iPhone の写真をそのままアップロードできます。
Q. 手書きが読めない場合の対処法は?
従来 OCR(Google Drive、Adobe Acrobat、Tesseract)は印刷文字向けに最適化されており、手書きには対応しきれません。GPT-4o や Claude などの AI 系 OCR を使うことで、手書き精度が大幅に改善します。AI 手書き OCR の AI 高精度認識モードは無料で 1 日 5 回利用できます。
Q. 画像の解像度はどれくらい必要ですか?
文字 1 文字あたり 30 ピクセル以上が目安です。スマホで A4 用紙を 1 枚撮影する場合、最低 1500×2000 ピクセル(約 300 dpi 相当)が望ましいです。低解像度の画像は AI 高精度認識モードで補完できる場合があります。
Q. くずし字や古文書の OCR 精度を上げるには?
くずし字・連綿体は AI 高精度認識(GPT-4o)が文脈を理解して読み取るため、従来 OCR より大幅に高い精度を出せます。縦書き OCR は古文書にも対応しています。完璧でない場合も、AI OCR の出力を下書きとして手動で修正すれば、ゼロから打ち込むより大幅に時間短縮できます。