画像内の領域分割と統合


領域分割と統合により、同一の特徴を持つエリアを抽出 (2010/07/27)

画像を一目見ただけで人間は画像中の同一特徴を持つエリアを識別できますが、コンピュータは簡単に認識
する事が出来ません。今回は、画面上の領域を細かく分割し、隣接する類似性の高い領域を統合する事で、
対象領域を分離をする事を考えます。
ここでは、多値データのラベリング処理を行っています。 同じ色で8連結で接続されている領域毎に
個別の識別番号を割り当てています。 同じ色でも連結性が無い場合は、別の境域と認識されます。


3次元データ対応は、こちらを参照の事。
最新の技術情報は、こちらを参照の事。


はじめに

画像処理において、対象物を分離する事は非常に重要ですが、閾値を決め単純2値化する手法では期待
出来る結果は得られません。単純な画像でも、シェーディングが乗っているだけでこの手法は失敗します。
この問題を解決する方法は多くありますが、ここでは、別のアプローチ方法を提案したいと考えています。
ここで提示する画像中の領域を抽出するアプローチは、画面を細かいエリアに分割し、各エリアごとに識別
番号を割り当てます。 現在の注視している領域と隣接する領域の特性を調べ、類似性が高い場合は、各
領域を識別する番号を同一のエリアに属する番号として登録(領域統合)していきます。 2値画像に対する、
ラベリング処理をイメージしてもらうと判り易いと思います。統合された領域は、人間が画像を見た時に
感じる同一性の高い部分に一致します。 この領域に対して様々な画像処理を行う事で、従来より精度の
高い処理が期待できます。
概アルゴリズムを公知の技術として、多くの人に利用して頂ければと有益かと思い公開します。


画像処理

ここでは、以下の画像処理技術を用いて処理を行っています。
 1、画像平滑化手法
 2、高速ラベリング手法
 3、領域結合手法
 4、高速輪郭線抽出手法
 5、画像内イメージ操作


処理のプロセス  (補足ドキュメント OD0503.pdf )
1、対象画素の入力処理
2、入力画像の平滑化処理(ノイズ除去の簡易手段として)
3、画像を色と明るさ情報を基準にして、小領域に分割する。
4、分割した領域にラベリング処理を施し、各分割領域を識別可能にする。注1
5、近接する分割領域の特性を考慮し、領域の統合処理を行う。注2
6、領域中の小領域を除去対象とし、包括する領域に統合する。
7、分離した対象領域をROI(Region of Interest:関心領域)として目的毎の処理を行う
   ・エッジ抽出処理
   ・領域内平滑化
注1
二値画像のラベリングとは異なり、画面上の全ての分割領域がラベリングの対象となる。
(背景と対象物の関係では無い事に注意)

注2
各分割領域の結合判断アルゴリズムは、領域統合のキーテクノロジーだが、アルゴリズムの
概要説明が今回のメイン目的のため、最もシンプルで実装が容易な、各領域を代表する色を
決定し、色彩間距離が閾値より小さい場合に統合を行う手法を用いる事とした。
境域結合を上手く行うには、画像のタイプに合わせたパラメータで処理を行う事。

補足事項
ここでのラベリング処理方法は、3次元データーのラベリングを視野においた手法であり、
多値データ (integer 32bit) の場合でも、ラベリング処理はワンパスでデータを確定します。
同じ値を持つ画素が8連結で接続する領域に対して個別の番号を与えます。同じ値の画素
でも連結性が見出せない画素は、別の対象物と認識し異なる識別番号を付与します。
3次元の場合も一回のスキャンでデータを確定出来ると考えています。
入力画像を直接ラベリングし、擬似カラー化した画像(数の増加に見合った効果が期待できない)。



処理概要の手順に沿った説明

手順を画像を見ながら説明していきます。
tramway013 処理対象の画像
画像 1 (処理対象画像)

tramway015 読み込んだ画像データを、画像を構成
する画素の色と明るさ情報を基準にして、
小領域に分割する。

分割した領域にラベリング処理を施し、
各分割領域を識別可能にする。



左の画像は、ラベリングされた領域毎
にユニークな擬似カラーを割り当てて、
認識性を高める処理を行った画像



領域は 11,000 以上に分割されている
画像 2 (小領域に分割)

tramway016 近接する分割領域の特性を考慮し、
領域の統合処理を行なった結果。


表示は非常にシンプルになった。



部分的にポツポツした部分(微小領域)
が散逸している。
画像 3 (領域統合後の画像)


tramway017 微小領域を除去対象とし、
包括する領域に統合した結果。


画像 4 (微小領域除去後の画像)

tramway001 ここでは、抽出した領域 ROI
の境界部を抽出




ROI (Region of Interest:関心領域)
画像 5 (領域統合された画像のエッジ部)

以上、簡単ではあるが、領域認識のアルゴリズムを理解して頂けた事と思う。



類似領域抽出後の処理

画像上の抽出された境域は、ラベリング処理が行われているので、任意の形状であっても容易に
識別できます。 これは、見方を変えれば、自由形状のROIを設定しているのと等価と言えます。
このROI内に相当する画像の部分に対して、所望する画像処理を行う事が容易に出来ます。
ここでは、関心領域内だけを平滑化する処理を行います。

cat013 処理対象の画像を読み込みます。


白を基調にしており、画像中の色
情報には、偏りが生じています。
画像 2-1 (処理対象画像)

cat015 画像を色と明るさ情報を基準にして、
小領域に分割後、分割した領域に対し
ラベリング処理を施し、各領域毎の
識別を可能にする。

その後、隣接する領域の各カラー要素
の輝度情報をもとに、各分割領域が
隣接する領域と類似性があるかを判断し、
領域の特性が近いと考えれれる場合は、
識別情報を同一のグループに属する様
に変更する。

この例では、より大きな面積を持つ
領域の識別番号を代表番号とし、類似
領域は、その配下に同一のグループ
として統合する処理を行っている。


特定面積(画素数)以下の領域も、保持
する必要性がない場合は、周囲の境域
に統合する事で、以降の処理を円滑化
出来る場合もある。


今回行いたい処理は、ROI毎に画像を
平滑化する処理なので、微小領域を
保持する必要は無く、周辺境域に総合
している。

各ROI毎に色分けした画像
画像 2-2 
(小領域に分割を、類似領域を統合)

cat016
各ROI毎に対応する、原画の領域を
平滑化処理を行い、それぞれの処理
結果を1つの画像ファイルとして統合




画像表示は非常にシンプルになった。


使用している色数もオリジナルの画像
と比較すると格段に少ないが、認識性
の損失は見られない。

オリジナルの画像には無い芸術性の
片鱗すら感じられる。



色(数)と識別能力との因果関係に興味
を持つ方がいらしたら、是非研究して
頂けないだろうか、きっと面白い結果
が見つかると考えている。
画像 2-3 
(各ROI内で平滑化処理した画像)
 

平滑化処理を例に説明しましたが、処理は平滑化に限定されるものでは無く任意の処理が
可能である事を付記しておきます。



画像と認識性

日常生活では、多くの物を目にし判断する事を無意識の中で行っているが、この判断の過程で、
物体の色と動きは重要な要素であり、欠損情報や誤情報の修正にも重要な役割をはたします。

鉛筆で画用紙に書かれた絵を第三者が見る時、書き手が何を描こうとしたを簡単に理解できる
事からも判る様に、適切な二値画像は十分な情報伝達性を有します。ただし、情報量の少ない
二値画像で正しく情報を伝える為には"工夫"が必要です。 その秘訣とは、"必要かつ十分"な
情報に限定して伝達する事です。

コンピュータが入力された画像データから可読性の高い二値情報を自動生成するのは、画面に
描かれている内容を把握していないので、非常に難易度の高い処理になります。
(出力先に十分な解像度がある場合は、ディザリングを使う方法もあります。)
一般的には、画像中の対象物の輪郭線を抽出できれば、画面上の内容を把握出来る情報と
なりえます。 ポピュラーな手段としては、 Canny法に代表されるエッジ検出法がありますが、
分割された領域を結合していく別のアプローチも可能です。

二値画像化は、必要な情報量を劇的に減らす事が出来ますので、ディスプレイ以外の機器を
介して映像情報を伝達する事も可能になります。 信号に合わせて、動的に凸凹を生成可能
機器があれば、触覚による伝達が可能となり、光が無い状態でも情報を伝える事が出来ます。


入力画像を、二値の線情報に変換した例
house010
今回の手法でエッジを抽出した例
精度良く抽出、このクオリティがあえば十分実用的 (領域結合アルゴリズムの品質に依存)

house010
対象物が何か把握しづらい(出来ない)例。  これは何?


領域結合画像処理の応用

視覚障害者にとって、外出先でのトイレ使用には困難を伴う事をよく耳にする。 視覚からの情報を
触覚情報に変換して伝達できれば、問題は軽減されると考えられが、視覚用装置と、触覚用装置では
解像度が著しく異なり、大容量の視覚情報を凸凹の二値情報で表現する為には、高度な変換アルゴ
リズムが必要になる。また、触覚用装置はハンデータイプで持ち運びが容易でなければならない。
リアルタイム処理が可能であるなら、入力データの認識精度の向上が期待できるが、応答速度の点で、
触覚用装置は、異なる方式でなければならない。
難易度は非常に高いが、QOLを高めるための必須の課題であろう。

領域結合手法による画像処理はシェーディング(輝度ムラ)に強く、類似領域の切り出しに適している。
(今回使用している、領域の類似性判断方法や境界線抽出方法は、状況にあわせ変更の必要あり)
下記の画像は、写っているものが何であるかは一目瞭然だが、従来の手法ではこのレベルでの抽出
はかなり難しいと思われる。
表示情報も十分絞り込まれているので、レゾリューション(解像度)の低い出力装置を使っても十分に
把握出来る画像品質を持っている。 128x128の出力解像度(16,384ドット)しかない低解像度の仮想
デバイスに出力した場合(画像1画像2)でも、対象物を識別できる精度がある。

フィジビリティ評価はクリアしていると考えているが、製品化には専用のハードウエアが必要な上、
ソフト部のASIC化も検討の余地があり、実証機開発の実現に向けては克服すべき課題が残されている。
しかし、利用者の利便性とQOLを高めるために、一日でも早い具現化を望んでいる。

興味を持ってご賛同頂ける方は、vision@cryst.tv までご連絡下さい。


tt018



補足情報

多値データに対するラベリング

3次元の多値データを対象とした、高速ラベリング処理(6連結、18連結、26連結)


最後に

空間を微小領域に分割し、統合する手法は2次元データに限定されるものではなく、3次元のボクセル
データにも適用できますので、応用範囲は非常に広いのですが、大変重たい部類の処理で、システム
のパフォーマンスが高くないと、多くの処理時間を必要としてしまいます。
CPUの高性能化と、各処理プログラムの高速化で、以前では不可能に思える事も可能となりましたが、
リアルタイムのレスポンスを得る為には、まだ、ハードウエアの支援が必須と考えています。

新しいアイデアや手法は、コンピュータ画像処理の世界においても、パラダイムシフトを起こさせるに
十分なシーズだと思っています。 より多くの方が素晴らしい技術やアイディアを提供しあう事が出来
れば、革新的に進歩出来ると考えています。





go to TopPage go to CategoryTop