画像の2値化処理、されど2値化処理

ダイナミックレンジ・カメラは
 ウェルドビジョン合同会社 
https://www.weldvision.jp/.../734/
製品を利用させて頂いています

画像の2値化処理は、画像処理で基本中の基本ですが...  (2010/12/02)

画像情報を表すには幾つかの方式がありますが、大別すればカラー画像、濃淡画像、2値画像に分類できます。
これは最終的な表示形態からの分類で、データ構造と常に一致しているとは限りませんし、分解能も異なっている
可能性があります。カラー画像を例に考えれば、通常の画像であれば分解能(空間分解能ではない)は256階調
(8ビット)でカラー画像のR成分、G成分と、B成分が記録されています。画素データの分解能は8ビットに限定される
ものではなく、10ビットでも16ビットでもかまいませんし、記録されるデータのチャネル数もR,G,Bの3チンネルに
限定される必要はありません。また、チャネル毎に分解能が異なっている可能性もあります。
(これらのデータを表示する為には、表示装置に対応した通常形式に変換する作業が必要になります。)
地震情報を画像化する場合では、S波の到達時間を表すチャンネル、P波の到達時間を表すチャンネル、震度を表す
チャンネルを用意するかも知れませんし、人口密度や、被害状況を別チャンネルで用意する可能性も有りえること
と想像します。 一般のカラー画像でも、別チャンネルにUV、IRを同時に記録したいと思うことがあります。
また、画像の2値化処理は多くの場合、画像中の対象物と非対称物を識別する為に利用されます。


はじめに

2値化処理は、データをその物理量や特徴量によって、2つ の状態(状態A,状態B)に振り分ける処理です。
状態が2つしかなので1ビット(0 or 1)あれば記録できますが、慣例的に8ビット(0 or 255)で表記する場合
の方が多いように思われます。 2値化処理の対象となる物理量としては、輝度が選択される場合が非常に
多く、振り分けの基準となる閾値を決定し、閾値未満を状態 A(例えば0)、閾値以上を状態 B(例えば255)
に変換します。閾値の決定方法には、しきい値法、Pタイル法、モード法、判別分析2値化法等があります。
他の手法として、微分フィルターを用いた局所的性質を利用する方法や、領域分割法等が行われています。
輝度で表示される画像は相対的色合いが強く(32の輝度差がある場合、50から32の差と55から32の差は肉眼
では識別が難しい。明るさの差の中間値を考えると、50が基準の場所では66だが、55の場所では、71になり、
同一の基準/閾値では分割できない)コンピュータで処理する場合では問題となります。
色情報を持つ対象物の抽出なら、RGBデータをHSVデータ(一般的なHSV変換には若干の違和感有)に変換し、
色相(H)、彩度(S)、明度(V)の範囲を指定する事で対象物を抽出出来ます。この場合の特徴量は色になるので、
輝度による対象物の抽出よりは、精度の高い抽出が期待できます。 また算術処理により、絶対的な特徴量を
算出した場合には、単一の閾値を用いて正確な抽出が可能になります。(仮に画素が時速を表しているとし、
80Km以上である部分を抜き出す事を考えて下さい)


特徴量の2値化

元画の特徴を正しく伝える事が出来る2値画像を生成する処理は意外と難しい処理になります。
これは画像中の特定部分を抜き出すのではなく、画像にとして描かれている内容を理解できる、
2値画像を生成する事を意味しています。
画像上の物体は、エッジにより識別されますが、明確なエッジを持たない部分(グラデーション)
も存在します。 明確なエッジを持つ対象物のみで構成されている画像なら、canny法等を用いた
エッジ抽出で識別できる2値画像を生成できますが、このエッジ抽出法も万能ではありません。
ここでは画像の微分データ等を利用して特徴量を算出し、2値化する事で画像を生成します。
輝度に対して一次微分を行うと、輝度の変化量が得られます。変化量は画像中の境界情報を
示していると考える事が出来ます。変化量が0なら、その場所は明るさや色が均一な場所であり、
値が大きな部分は、急激な変化(明確な境界)です。輝度がなだらかな変化をしている場所は、
緩やかな変化量として算出されます。この値は絶対量(強さの変化に比例する)なので、一意の
閾値を設定して、有効範囲、無効範囲を指定することが可能になります。 また、変化量を再度
微分する事により、変化の早さと向きを抽出する事が可能になります。
輝度、1次微分、2次微分の関係は、移動距離、速度、加速度の関係を考えると判りやすいと
思います。


画像の2値化処理例

lenna_rgb lenna_bin
4203 4203


画像の特徴を保持した二値化

人間が最初に物を見るときは、写っている物の全体像を把握しようとします。
次に、画像中の興味のある部分に関心が移り、その部分を正確に把握しようとします。
この時、興味のある部分以外の部分の認識は著しく低下しますが、興味を持った部分の認識力は瞬時に高まります。
この2値化処理が目標としているのは、初期の全体を把握する事です。
つまり、原画(情報量の多いカラー画像)を見た瞬間に受ける印象と同じあるいは近い印象を、情報量の少ない2値画像で
伝える事にあります。 特徴を保持するには画像にメリハリをつけますが、同時に細部の正確性を捨てる必要が生じます。
2値データを使って画像情報を伝える方法にディザ方がありますが、これは空間の色密度を変化させる事で、擬似的な
濃淡画像を生成する事により認識力を上げる手法であり、今回の方法とは全くの別アルゴリズムになります。
白い画用紙にマジックで絵を描いて人に情報を正しく伝える事と、同等の処理を行いたいと言ったほうがわかり易いかも
知れません。 この2値化した画像は、低解像度の2値ディスプレイ(コンピュータの黎明期に存在した過去の遺物)でも
精度良く情報を伝える事が期待できますので、新たな分野での利用が考えられます。
比較の為に、閾値指定して2値化した画像と、画像の識別の基準となるエッジを canny法により抽出し2値化した画像を
用意しました。 (各画像をクリックすると、原寸サイズの画像が表示されます。)


原画
I say thanks to fmanto and f12e offering a useful image.

本手法による2値化処理
画像毎に閾値を設定する必要は無い

しきい値法による2値化処理 (閾値:70)

canny 法によるエッジ抽出処理(閾値:43/98)


最後に

この画像生成手法は、視覚にハンデーを持つ方のQOLを高める事に利用できると考えています。
カメラから取り込んだ画像を、2値化し、凸凹型の出力ディバイスに出力する事で、利用者は、
周辺の状況を触覚を利用して判断する事が可能になります。 入力装置は安価なUSBカメラの
流用が出来ますし、画像処理には高性能のCPUを必要としませんので、現行の組み込み用の
プロセッサーや、省電力型のプロセッサーで対応できます。小型軽量小電力の出力ディバイスが
入手できれば、可搬性に優れたハンディタイプのアシスト装置の開発が可能になります。
入力画像の大きさは、2Kx1.5K以上が精度的には好ましいのですが、VGA (640x480)クラス
でも十分に利用できます。 出力用の接触型のディバイスは、ピン型の凸凹デバイスの場合、
128 x 128 ピン以上 (最低64x64ピン以上)が望ましいと考えています。
接触型の出力ディバイスの情報を探しています、情報をお持ちの方 がいらっしゃいましたら、
御一報頂ければ幸いです。 (連絡先:vision@cryst.tv)

この情報が、参考になれば幸いです。




go to TopPage go to CategoryTop