二値化によるOCR(光学的文字認識)のための画像前処理

 OCR(光学的文字認識)とは画像から文字を認識する技術のことです。昨今のOCRはなかなかの高精度になってきましたが、適切な画像、設定でないとてんで的外れな回答を返すことがよくあります。二値化は適切な画像のための画像加工の一つです。
 ここでいう二値化とは白黒二色にするという意味です。次の2枚の画像が二値化による加工の例です。


 具体的にはグレースケールにして

 消しゴムの汚れが分かりにくくなるように少し明るくして

 コントラストを最大にしました。

 こうすると文字とそれ以外の境界がはっきりする、ノイズが消える、といった効果によって機械に文字を認識させることが容易になります。これは影の中にある白紙に書かれた黒文字のように、背景色に近い色の文字を解析する時に特に効果的です。
 例の図は調整が雑で少々文字がつぶれていますが、高解像度であったり、鮮明な画像であったりした場合は滅多につぶれません。

>株式会社シーポイントラボ

株式会社シーポイントラボ

TEL:053-543-9889
営業時間:9:00~18:00(月〜金)
住所:〒432-8003
   静岡県浜松市中央区和地山3-1-7
   浜松イノベーションキューブ 315
※ご来社の際はインターホンで「316」をお呼びください

CTR IMG