浜松のWEBシステム開発・スマートフォンアプリ開発・RTK-GNSS関連の開発はお任せください
株式会社シーポイントラボ
TEL:053-543-9889
営業時間:9:00~18:00(月〜金)
住所:静岡県浜松市中区富塚町1933-1 佐鳴湖パークタウンサウス2F

二値化によるOCR(光学的文字認識)のための画像前処理

 OCR(光学的文字認識)とは画像から文字を認識する技術のことです。昨今のOCRはなかなかの高精度になってきましたが、適切な画像、設定でないとてんで的外れな回答を返すことがよくあります。二値化は適切な画像のための画像加工の一つです。
 ここでいう二値化とは白黒二色にするという意味です。次の2枚の画像が二値化による加工の例です。


 具体的にはグレースケールにして

 消しゴムの汚れが分かりにくくなるように少し明るくして

 コントラストを最大にしました。

 こうすると文字とそれ以外の境界がはっきりする、ノイズが消える、といった効果によって機械に文字を認識させることが容易になります。これは影の中にある白紙に書かれた黒文字のように、背景色に近い色の文字を解析する時に特に効果的です。
 例の図は調整が雑で少々文字がつぶれていますが、高解像度であったり、鮮明な画像であったりした場合は滅多につぶれません。

  • この記事いいね! (0)