画像の領域分割 (Part of segmentation)
デジタル化された画像から、同一の特徴を持つ部位を抽出 (2016/02/01)
はじめに
画像の中から対象物を分離するのは、事前に予備知識がない状態からでは決して容易な
処理ではないが、自動で判断を行うには避けては通れない関門であると考えている。
複雑な認識の可能性を検討すると、あらためて生物の視覚機能の優位性に驚かされる。
認識方法に関して
画像(写真)の中に映っている対象を判断する事を考えた場合、1枚のデータに対して
結果をだす事にとらわれ過ぎていた感がある事は否めない。
人であれば、全体を一瞬で把握でき、更に興味のある部位を特定し、より詳細な情報を
得る事が出来ると同時に、画像上には存在しない情報も得る事が出来る。
例えば、二人の人がボトルのワインを飲みながら、話をしている写真に対し、どちらに
窓が有りますかと質問をすることを考える。
当然、写真には窓は映っていない、この状態では窓は有りませんと判断するが、人なら
"窓"⇒ "光"⇒"影"⇒"ワインボトルの影、人のグラデーション"から、”写真には写って
いなが左の方にあると思います。”と回答するかも知れない。
また錯覚を起こすような画像、見方を変えると別の物がみえた来たり、存在しない図形が
認識(疑似輪郭により想起される図形等)される場合も考慮すると、デジタル化、同一性
の抽出、同一性部位の連結、及び連結部位と意味のマッピング機能、等に、処理をレイヤ
分割し最適化する事で、より良い結果(判断)を得る可能性を検討し試みる。
視覚モデル
複数のレイヤからなる認識処理を考えた場合、下記の様なレイヤを想定する
layer 0 |
アナログデータをデジタルデータに変換。(コンピュータ処理用)
レンズ、カメラ、メモリ(画素単位) |
layer 1 |
同一特徴を持つ連続領域(blob)分割(領域識別子付与処理を含む)
フレーム毎の、画素(pixel)、塊(ブロブ:blob) 変換(領域内特徴量計測を含)
|
layer 2 |
layer 1 の blob をオブジェクト(グループ)化。(blobの仮想分割を含) オブジェクト と 1つ以上の”意味” の仮マッピング (参照データは別途規定)
(マッピング情報として、”無意味”も重要な意味)
|
layer 3 |
オブジェクト と ”意味” のマッピング(複数フレームデータの相関処理を含) ”意味”に対する尤度の算出 layer 2 へのヒント付き処理リクエスト生成&依頼 layer 0 コントロール(取得位置、焦点、被写界深度等の制御)
|
layer 4 |
TBD (layer 4 or higher) |
領域分割(Blob化)
終わりに
コンピュータの性能が著しく向上しているので、今までは検討対象外の手法も、十分
検討に値する様になった事の意義は大きいと考えるが、同時に誰もが簡単に従来では
出来なかった事が出来るようになったのも事実である。