JPWO2013154062A1 - 画像識別システム、画像識別方法、およびプログラム - Google Patents
画像識別システム、画像識別方法、およびプログラム Download PDFInfo
- Publication number
- JPWO2013154062A1 JPWO2013154062A1 JP2014510156A JP2014510156A JPWO2013154062A1 JP WO2013154062 A1 JPWO2013154062 A1 JP WO2013154062A1 JP 2014510156 A JP2014510156 A JP 2014510156A JP 2014510156 A JP2014510156 A JP 2014510156A JP WO2013154062 A1 JPWO2013154062 A1 JP WO2013154062A1
- Authority
- JP
- Japan
- Prior art keywords
- contour
- partial
- image identification
- information
- feature point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000001514 detection method Methods 0.000 claims abstract description 18
- 230000008569 process Effects 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 15
- 230000000295 complement effect Effects 0.000 description 8
- 230000010365 information processing Effects 0.000 description 6
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
複数の対象が含まれるシルエット情報から一般物体認識を行なう。検出対象とする対象画像データから物体または形状の輪郭を抽出処理する輪郭抽出ステップと、抽出した輪郭から特徴点群を検出処理する特徴点検出ステップと、検出した特徴点情報を用いて、特徴点間の輪郭を一以上の領域に分割し、分割された領域を部分輪郭として生成する部分輪郭生成ステップと、生成した部分輪郭のうちひとつまたは複数を選択し、輪郭情報の照合処理を行う輪郭照合ステップと、を含み成ることを特徴とする物体または形状を識別処理する画像識別方法を実施する。
Description
本発明は、画像情報に含まれる一般的な物体または形状の認識や検索などを行うためのシステムに関し、特に、物体または形状のシルエット情報を用いて対象を識別処理する方法に関する。
近年、デジタルカメラを始めとするデジタル映像機器の急速な普及に伴い、撮影された画像や映像のなかに、どのような物体が含まれているのかを識別する一般物体認識への期待が高まっている。
一般物体認識では、データベース内に分類されずに格納されている画像データの適切な分類や、必要な画像データの検索などが行なわれている。またさらには、動画像の中からの所望のシーンの抽出や、所望のシーンだけを切り取っての再編集など、様々な用途に応用できる可能性を一般物体認識は有している。
物体認識に関する技術として、顔認識や指紋認識など様々な認識技術がこれまでに開発されてきたが、これらは多くの場合特定の用途に向けられたものである。このような特定の用途に特化した認識技術は、別の用途に利用しようとすると能率よく動作しない。この問題点としては、認識率の低下や誤識別、情報処理量の増大などの問題が挙げられる。このため、一般的な物体の認識を能率よく行う技術の開発が期待されている。
情報処理装置によって一般物体を認識する方法として、物体形状のシルエットを利用する方法が提案されており、広く利用されている(特許文献1、特許文献2)。これらの文献では、シルエット情報から、輪郭上の各点の曲率情報を用いて認識を行う手法が提案されている。
曲率は、局所円弧の半径(曲率半径)の逆数として定義される。そのため、曲率それ自体は、物体の大きさに対しての不変量ではない。しかし、相対化を行うことによって、物体の大きさに対して不変に曲率を抽出することができる。
また、似た物体のもつ輪郭の曲率情報は類似していることが知られているため、曲率情報を用いる上記技術は、輪郭形状が若干異なる輪郭に対しても、類似度を算出することが可能である。
また、物体形状のシルエット情報からは、曲率情報だけではなく、曲率の特徴点である変曲点や、輪郭の位置座標など、物体形状に関する様々な特徴量を抽出することが可能である(非特許文献1)。
このようにシルエット情報を用いることで物体輪郭の様々な特徴量を抽出できる一方、シルエットからの対象の識別処理には、複数物体が隣接してシルエットが結合していた場合に、容易に分離することができないという問題点がある(非特許文献2)。非特許文献2では、手書き文字が隣接して結合している場合には、結合している点がどこなのかを判別できないなどの問題を指摘している。
こうした問題に対処するために、シルエットの結合を分析する際に、学習済みの結合パターンを用いる対処法が提案されている。例えば結合している文字数を二文字に制限したうえで、二文字の結合パターンを前もって学習しておき、その学習された結合パターンが出現した点でシルエットの切断を行うなど処理を行う。その後、分割されたシルエットを用いて対象の識別を行なう。しかしながら、こうした学習済みの結合パターンを用いる場合にも多数の問題点がある。例えば、結合している文字数(物体の数)が幾つなのかがわからない場合に対処できない問題を含んでいる。別の問題点を例示すれば、前もって学習した結合パターンでない結合パターンの場合に対処できない点が挙げられる。また、結合度合いによって結合パターンが実質的に異なることも問題点として挙げられる。
このように、学習済みの結合パターンを用いる方法にも様々な課題が残されている。このため、文字数(物体の数)などの認識に用いる条件への制限を行うことなく、また、結合パターンを前もって学習することなく、シルエット情報から自由自在に能率よく形状を切り出す必要がある。
こうした、結合パターンを前もって学習することなく、シルエット情報から形状を切り出す技術として、シルエットの輪郭上に存在する特徴的な点をもって切り出し候補点とし、切り出し候補点の間の輪郭情報を補完することによって形状の切り出しを行う方法が提案されている(特許文献3)。この手法を用いることによって、結合パターンを前もって学習することなく、シルエット情報から多くの形状を切り出すことが可能である。しかしながら、この手法によると、シルエットの輪郭上に特徴的な点が存在しない場合には、形状の切り出しを行うことができない。
一般物体認識では、データベース内に分類されずに格納されている画像データの適切な分類や、必要な画像データの検索などが行なわれている。またさらには、動画像の中からの所望のシーンの抽出や、所望のシーンだけを切り取っての再編集など、様々な用途に応用できる可能性を一般物体認識は有している。
物体認識に関する技術として、顔認識や指紋認識など様々な認識技術がこれまでに開発されてきたが、これらは多くの場合特定の用途に向けられたものである。このような特定の用途に特化した認識技術は、別の用途に利用しようとすると能率よく動作しない。この問題点としては、認識率の低下や誤識別、情報処理量の増大などの問題が挙げられる。このため、一般的な物体の認識を能率よく行う技術の開発が期待されている。
情報処理装置によって一般物体を認識する方法として、物体形状のシルエットを利用する方法が提案されており、広く利用されている(特許文献1、特許文献2)。これらの文献では、シルエット情報から、輪郭上の各点の曲率情報を用いて認識を行う手法が提案されている。
曲率は、局所円弧の半径(曲率半径)の逆数として定義される。そのため、曲率それ自体は、物体の大きさに対しての不変量ではない。しかし、相対化を行うことによって、物体の大きさに対して不変に曲率を抽出することができる。
また、似た物体のもつ輪郭の曲率情報は類似していることが知られているため、曲率情報を用いる上記技術は、輪郭形状が若干異なる輪郭に対しても、類似度を算出することが可能である。
また、物体形状のシルエット情報からは、曲率情報だけではなく、曲率の特徴点である変曲点や、輪郭の位置座標など、物体形状に関する様々な特徴量を抽出することが可能である(非特許文献1)。
このようにシルエット情報を用いることで物体輪郭の様々な特徴量を抽出できる一方、シルエットからの対象の識別処理には、複数物体が隣接してシルエットが結合していた場合に、容易に分離することができないという問題点がある(非特許文献2)。非特許文献2では、手書き文字が隣接して結合している場合には、結合している点がどこなのかを判別できないなどの問題を指摘している。
こうした問題に対処するために、シルエットの結合を分析する際に、学習済みの結合パターンを用いる対処法が提案されている。例えば結合している文字数を二文字に制限したうえで、二文字の結合パターンを前もって学習しておき、その学習された結合パターンが出現した点でシルエットの切断を行うなど処理を行う。その後、分割されたシルエットを用いて対象の識別を行なう。しかしながら、こうした学習済みの結合パターンを用いる場合にも多数の問題点がある。例えば、結合している文字数(物体の数)が幾つなのかがわからない場合に対処できない問題を含んでいる。別の問題点を例示すれば、前もって学習した結合パターンでない結合パターンの場合に対処できない点が挙げられる。また、結合度合いによって結合パターンが実質的に異なることも問題点として挙げられる。
このように、学習済みの結合パターンを用いる方法にも様々な課題が残されている。このため、文字数(物体の数)などの認識に用いる条件への制限を行うことなく、また、結合パターンを前もって学習することなく、シルエット情報から自由自在に能率よく形状を切り出す必要がある。
こうした、結合パターンを前もって学習することなく、シルエット情報から形状を切り出す技術として、シルエットの輪郭上に存在する特徴的な点をもって切り出し候補点とし、切り出し候補点の間の輪郭情報を補完することによって形状の切り出しを行う方法が提案されている(特許文献3)。この手法を用いることによって、結合パターンを前もって学習することなく、シルエット情報から多くの形状を切り出すことが可能である。しかしながら、この手法によると、シルエットの輪郭上に特徴的な点が存在しない場合には、形状の切り出しを行うことができない。
Mokhtarian,Farzin,SILHOUETTE−based occluded object recognitionthrough curvature scale space,Machine Vision and Applications,vol.10,No.3,pp.87−97,August 1997.
西脇大輔,上谷昌昭,田中直哉,山田敬嗣,黒色罫線枠帳票読み取りのための文字枠検出除去と接触文字の切り出し認識,信学技報,PRIU97−218(1998−02)
シルエット情報を用いた一般物体の認識手法を用いる際には、複数の物体が結合しているシルエット情報から、単一物体に対応するシルエット情報を抽出する必要がある。複数物体のシルエット情報から単一物体毎のシルエット情報を抽出するためには、従来は、切り出しを行う特徴点を抽出することによってこれを行っていた。
しかしながら、異なる二つの物体のシルエットの間に特徴的な点が存在しない場合、特徴点を抽出することができず、従来手法では、切り出しを行うことが困難であった。
すなわち、一つまたは複数の物体形状のシルエット情報において、異なる二つのシルエットの間に特徴的な点が存在しない場合に、単一の閉輪郭の抽出を解決する適切な方法は、これまで考案されていなかった。
本発明の目的は、シルエット情報に基づいて該シルエット情報に含まれる物体または形状の一般物体認識を行う画像識別システム、その方法、およびプログラムを提供することにある。
本発明の別の目的は、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供することにある。
しかしながら、異なる二つの物体のシルエットの間に特徴的な点が存在しない場合、特徴点を抽出することができず、従来手法では、切り出しを行うことが困難であった。
すなわち、一つまたは複数の物体形状のシルエット情報において、異なる二つのシルエットの間に特徴的な点が存在しない場合に、単一の閉輪郭の抽出を解決する適切な方法は、これまで考案されていなかった。
本発明の目的は、シルエット情報に基づいて該シルエット情報に含まれる物体または形状の一般物体認識を行う画像識別システム、その方法、およびプログラムを提供することにある。
本発明の別の目的は、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供することにある。
検出対象とする対象画像データから物体または形状の輪郭を抽出処理する輪郭抽出ステップと、抽出した輪郭から特徴点群を検出処理する特徴点検出ステップと、検出した特徴点情報を用いて、特徴点間の輪郭を一以上の領域に分割し、分割された領域を部分輪郭として生成する部分輪郭生成ステップと、生成した部分輪郭のうちひとつまたは複数を選択し、輪郭情報の照合処理を行う輪郭照合ステップと、を含み成ることを特徴とする物体または形状を識別処理する画像識別方法を実施する。
本発明によれば、シルエット情報に基づいて該シルエット情報に含まれる物体または形状の一般物体認識を行う画像識別システム、その方法、およびプログラムを提供できる。
また、本発明によれば、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供できる。
また、本発明によれば、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供できる。
図1は、第1の実施の形態における画像識別システムの構成図である。
図2は、パターン認識の対象となる物体形状の一例を示す説明図である。
図3は、シルエット情報における輪郭情報の一例を示す説明図である。
図4は、輪郭上の特徴点の一例を示す説明図である。
図5は、選択された部分輪郭の一例を示す説明図である。
図6は、記憶部に保存された物体形状の一例を示す説明図である。
図7は、第1の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
図8は、第2の実施の形態における画像識別システムの構成図である。
図9は、輪郭を再構成する手法の一例を示す説明図である。
図10は、第2の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
図11は、第3の実施の形態における画像識別システムの構成図である。
図12は、特徴点間の輪郭の補正方法の一例を示す説明図である。
図13は、パターン認識の対象となる物体形状の一例を示す説明図である。
図14は、補完された輪郭の一例を示す説明図である。
図15は、第3の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
図2は、パターン認識の対象となる物体形状の一例を示す説明図である。
図3は、シルエット情報における輪郭情報の一例を示す説明図である。
図4は、輪郭上の特徴点の一例を示す説明図である。
図5は、選択された部分輪郭の一例を示す説明図である。
図6は、記憶部に保存された物体形状の一例を示す説明図である。
図7は、第1の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
図8は、第2の実施の形態における画像識別システムの構成図である。
図9は、輪郭を再構成する手法の一例を示す説明図である。
図10は、第2の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
図11は、第3の実施の形態における画像識別システムの構成図である。
図12は、特徴点間の輪郭の補正方法の一例を示す説明図である。
図13は、パターン認識の対象となる物体形状の一例を示す説明図である。
図14は、補完された輪郭の一例を示す説明図である。
図15は、第3の実施の形態における画像識別システムの動作の一例を示すフローチャートである。
これまでシルエット情報を用いた一般物体の認識手法を用いる際には、複数の物体が結合しているシルエット情報から、単一物体に対応するシルエット情報を抽出する必要がある。複数物体のシルエット情報から単一物体毎のシルエット情報を抽出するためには、従来は、切り出しを行う特徴点を抽出することによってこれを行っていた。
しかしながら、異なる二つの物体のシルエットの間に特徴的な点が存在しない場合、特徴点を抽出することができず、従来手法では、切り出しを行うことが困難であった。
すなわち、一つまたは複数の物体形状のシルエット情報において、異なる二つのシルエットの間に特徴的な点が存在しない場合に、単一の閉輪郭の抽出を解決する適切な方法は、これまで考案されていなかった。
こうした課題に対して、発明者らは以下のように一般物体認識を行なうシステムを提案する。
本システムの処理動作は、4つのステップで示すことができる。
第一のステップでは、一つまたは複数が含まれた物体のシルエット情報から取得できる全体の輪郭を抽出する。
第二のステップでは、抽出した輪郭上における特徴的な点を検出する。
第三のステップでは、前記第二のステップにおいて抽出した特徴的な点をもとに、輪郭を一つまたは複数に分割し、部分輪郭を生成する。
第四のステップは、生成した部分輪郭情報、データベース情報に照合することによって、物体の特定を行う。
以下、それぞれのステップ行なう画像識別システムについて、実施の形態を用いて説明する。
本発明の実施の形態を図1乃至図15を参照して説明する。
[第1の実施の形態]
本実施の形態を採用することにより、複数の物体形状が含まれたシルエット情報から、その中に含まれる単一の物体の認識を可能にする画像識別処理を行なう情報処理システムを提供できる。
[構成の説明]
図1は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
画像識別システムは、情報処理の全体を管理する制御部10と、検出対象とする画像データを取得する画像情報取得部20、取得した画像データなどを記憶する画像情報記憶部30、予め抽出された物体および形状の特徴が記憶収集されてデータベース化されている輪郭情報記憶部40、認識結果を出力する照合結果出力部50を含み構成されている。また、画像認識システムは、本願発明に係る画像識別部100として、輪郭抽出部101、特徴点検出部102、部分輪郭生成部103、部分輪郭照合部104を含み構成されている。
制御部10では、画像識別に関連する情報処理の全体動作を管理する。
画像情報取得部20では、動画や写真などユーザが指定した画像データを本システムに取り込み、画像情報記憶部30に記憶する。取り込み方法は、ユーザが指定した画像情報をそのまま取得してもよいし、或いは輝度情報などを利用した白黒変換など、その後の処理が容易になるような変換を施して取得すればよい。画像情報取得部20によって取得される画像情報の例を図2に例示する。なお、動画像などから、任意の間隔などで自動的に収集して画像情報を取り込むようにすることも可能である。
画像情報記憶部30では、取得した画像データや照合して得た結果、必要に応じて中間データ(閉輪郭の形状や補完輪郭、特徴点座標など)などを記憶する。画像情報記憶部30は、メモリーで構成してもよいし、HDDで構成してもよく、記憶部であればよい。
輪郭情報記憶部40では、照会に使用されるデータが抽出されて記憶されている。なお、輪郭情報記憶部40として、外部データベースを参照することとしてもよい。
照合結果出力部50では、画像識別部100で得られた結果を出力する。例えば、画像情報記憶部30から取得した照合結果と共に、輪郭情報記憶部40に記録されている照合結果の対象の物体や形状をモニターなどに出力する。なお、出力形態は、どのような情報を出力してもよい。
輪郭抽出部101は、画像情報取得部20によって取得されて画像情報記憶部30に記録されている検出対象とする画像データから取得できる輪郭の全部あるいは一部のみを輪郭情報(シルエット情報)として抽出する。ここでの全部とは、個々に分かれた輪郭をすべて検出対象とすることを指し、一部のみとは、ユーザが指定した近傍の1つの輪郭や任意の個数の輪郭のみを検出対象とすることを指す。
輪郭抽出部101は、対象画像データから、例えば、色相・彩度・明度などが急激に変化する点を、ラプラシアン・ガウシアンフィルタなどを用いて抽出する。ここでの急激に変化する点とは、色相・彩度・明度などの微分値が、前もって定められた閾値を超えるかどうかで判断すればよい。なお、輪郭情報を抽出する方法は、例示した方法に限定するものではない。
抽出された物体の輪郭は、例えば、輪郭点の集まりとして表現すればよく、直交座標系を用いて個々の点を(x,y)などで表してデータ化すればよい。
輪郭抽出部101によって抽出される輪郭情報の一例を図3に示す。このように、図2に示した数字パターン(「2」「3」が結合している2つの物体のシルエット)からなる一つのシルエット情報があった場合、図3のような外輪郭が抽出される。
なお、輪郭は、対象画像データから複数取得できることもある。この取得された個々の輪郭に対して個々に以下で説明する処理を行えばよい。以降の説明ではひとつの輪郭のみが取得されたものとして説明する。
特徴点検出部102は、検出対象とする輪郭上の特徴的な点(特徴点群)を検出処理する。この特徴点とは、例えば、下記式(1)で定義される曲率k(t)の値がゼロとなる点、すなわち変曲点を用いる。
曲率k(t)は、輪郭上における任意の一点を始点として輪郭を一周するように取った輪郭座標t、および、輪郭を直交座標系(x,y座標系)で表現した際の、x,yのtについての一次微分値および二次微分値によって定義される(式(1)参照)。
この手法によって定義された特徴点を図3に示される輪郭上から検出した結果を、図4中に○印で示す。なお、特徴点を検出する方法は、上記したものに限定するものではない。例えば、前述した曲率k(t)の値が急激に変化する点を「接続点」と定義し、接続点を特徴点として採用する手法が考えられる。ここでの急激に変化する点とは、例えば、曲率の微分値が、前もって定められた閾値を超えるかどうかで判断する。「接続点」の定義は以上の定義に限らず、物体が接続を起こす特徴的な点となっていればどのような定義であっても構わない。
部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する。部分輪郭は、特徴点情報を利用するいかなる手段を用いてもよいが、ふたつ以上の特徴点が検出された場合、特徴点を両端とする領域を部分輪郭として生成することが望ましい。また、輪郭抽出部101において抽出された輪郭が開輪郭であった場合、輪郭上の特徴点と輪郭の端点を両端とする領域を部分輪郭としてよい。
部分輪郭照合部104は、部分輪郭生成部103によって生成された部分輪郭のうち、ひとつまたは複数の部分輪郭を選択し、選択したひとつまたは複数の部分輪郭を、輪郭情報記憶部40に記録されている照会データを参照して物体の識別処理を行う。部分輪郭の選択の際には、連続する部分輪郭を選択することが望ましい。照合処理は、既存の多くの手法が使用できる。例えば、部分輪郭毎の特徴量の比較による照合や、選択された全ての部分輪郭を用いた物体の位置を用いた照合などが挙げられる。図2の例で選択された部分輪郭を図5に太線で示すとともに、輪郭情報記憶部40に記録されている照会データの例を図6に示す。図6に示された照会データについても同様の処理を施し、部分輪郭を生成・選択するとともに、図5において選択されている部分輪郭と参照する。また、照合処理は、選定した補完輪郭を用いて、先に抽出した輪郭を分割した部分にあたる部分輪郭を用いて、輪郭情報の照合処理を行えばどのような方法でもよい。
[動作の説明]
次に、実施の形態の動作例について説明する。図7は、本実施の形態の動作の例を示すフローチャートである。
まず、画像情報取得部20は、ユーザが指定する対象画像データを取得して画像情報記憶部30に記録する(S1001)。画像情報の取得は、ユーザが指定したものに限らず、システムが自動的に、半自動的に取得してもよい。
次に、輪郭抽出部101は、画像情報記憶部30に記録された検出対象とする対象画像データから物体または形状の輪郭情報(シルエット情報)を抽出処理する(S1002)。輪郭情報の抽出は、例えば閾値以上の輝度をもつピクセルなどを前もってユーザが基準を指定して、その基準を満たすもののみについて取得できる。
次に、特徴点検出部102は、輪郭上の特徴的な点を検出して特徴点群として検出する(S1003)。
次に、部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する(S1004)。
次に、部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40に格納された輪郭情報と比較した際に、所望の物体が得られない場合は、部分輪郭の選択(S1005)を再度行い、同様の処理を行う(S1007)。
この際、制御部10によって必要に応じて上記処理やパラメータを変更する処理を行ってもよい。条件を変えて処理を行えば精度の向上を図れる。その後、制御部10は、照合結果出力部50から、照合結果を出力する。
このように画像識別システムを動作させることによって、含まれる物体の数が明確でないシルエット情報から、そのシルエットに含まれる単一の物体の認識を能率よく取得できることが期待できる。
尚、画像識別システムの各部は、ハードウェアとソフトウェアの組み合わせを用いて実現すればよい。ハードウェアとソフトウェアとを組み合わせた形態では、RAMに画像識別プログラムが展開され、該プログラムに基づいて制御部(CPU)等のハードウェアを動作させることによって、各部を各種手段として実現する。また、該プログラムは、記憶媒体に記録されて頒布されても良い。当該記録媒体に記録されたプログラムは、有線、無線、又は記録媒体そのものを介して、メモリに読込まれ、制御部等を動作させる。尚、記録媒体を例示すれば、オプティカルディスクや磁気ディスク、半導体メモリ装置、ハードディスクなどが挙げられる。
上記実施の形態を別の表現で説明すれば、画像識別システムとして動作させる情報処理装置を、RAMに展開された画像識別プログラムに基づき、輪郭抽出手段、特徴点検出手段、特徴点ペア生成手段、補完輪郭選択手段、輪郭照合手段として制御部を動作させることで実現することが可能である。
以上説明したように、本発明によれば、シルエット情報に基づいて該シルエット情報に含まれる物体または形状の一般物体認識を行う画像識別システム、その方法、およびプログラムを提供できる。
また、本発明によれば、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供できる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
[第2の実施の形態]
本発明を実施するための第2の実施の形態について、図面を参照して詳細に説明する。本実施の形態は、第1の実施の形態における部分輪郭情報に含まれる情報が十分ではない場合を想定している。こうした場合、第2の実施の形態は、輪郭情報記憶部に格納されている輪郭情報を参照し、部分輪郭を再構成する手法を採用する。このために、第2の実施の形態は、輪郭情報再構成部111を新たに設ける点が、第1の実施の形態とは異なる。このほか、いくつかの要素は第1の実施の形態とは異なる機能を有す。
[構成の説明]
図8は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
輪郭情報再構成部111は、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりする方法で、部分輪郭を再構成する。この際の再構成方法はいかなる方法を用いてもよいが、輪郭情報記憶部40に記録されている既に記憶された物体の輪郭情報を参照することが望ましい。以下、図9を利用して、図2のシルエット情報を用いて輪郭情報再構成部111の採用する手法の一例を説明する。
まず、図9内の(a)下部に示されているシルエット情報に関し、特徴点検出部102、部分輪郭生成部103、部分輪郭照合部104によって生成・選択された部分輪郭を(b)に示す。同時に、輪郭情報記憶部40内に含まれる(a)上部に示された形状の部分輪郭について、(b)下部の部分輪郭に対応する部分輪郭を(b)上部のように選択する。このとき、(b)上部に示される記憶内の形状について、選択されなかった部分輪郭が(c)のように決定される。これに対応する下部の形状内の部分輪郭は、(b)において選択された部分輪郭に隣接する部分輪郭として、(c)下部の二つの部分輪郭から構成すればよい。この再構成は、(c)上部に示される部分輪郭の長さや曲率などの幾何的情報を利用することで実施できる。ここでは、(c)上部に示される部分輪郭の長さ情報を利用して再構成した結果を(d)に示す。以上の一連の処理により、輪郭情報は再構成される。
[動作の説明]
次に、実施の形態の動作例について説明する。図10は、本実施の形態の動作の例を示すフローチャートである。なお、本発明に関連が薄い動作については、説明を省略する。
輪郭情報再構成部111は、S1004の後、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりする(S1101)。
部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40を比較した際に、所望の物体が得られない場合は、輪郭情報の再構成(S1101)および部分輪郭の選択(S1005)を再度行い、同様の処理を行う(S1007)。
この際、制御部10によって必要に応じて上記処理やパラメータを変更する処理を行ってもよい。条件を変えて処理を行えば精度の向上を図れる。その後、制御部10は、照合結果出力部50から、照合結果を出力する。
以上、本実施の形態を実施することにより、部分輪郭情報に含まれる情報が十分ではない場合にも、物体の照合が可能となる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
[第3の実施の形態]
本発明を実施するための第3の実施の形態について、図面を参照して詳細に説明する。本実施の形態は、第1および第2の実施の形態における画像内の輪郭情報に含まれる情報が十分ではない場合を想定している。こうした場合、第3の実施の形態は、輪郭情報記憶部に格納されている輪郭情報を参照し、輪郭を補完する手法を採用する。このために、第3の実施の形態は、輪郭補完部121を新たに設ける点が、第2の実施の形態とは異なる。このほか、いくつかの要素は第2の実施の形態とは異なる機能を有す。
[構成の説明]
図11は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
輪郭補完部121は、輪郭抽出部101において抽出された輪郭に対し、必要な輪郭情報を補完する。この際の補完方法はいかなる方法を用いてもよいが、以下に示すように、特徴点検出部102において検出された特徴点を用いて補完を行うことが望ましい。以下、特徴点検出部102において検出された特徴点を用いた補完方法を説明する。
特徴点検出部102において検出された特徴点のうち、適切な組み合わせの二点間を補完する。二点は、任意の二点であってよいが、幾何的条件などを考慮し、適切なものを選択することが望ましい。例えば、二点上のそれぞれ接線のなす角が閾値以下であるといった条件や、補完を行った後に曲率の値が極度に不連続になる(例えば正負が入れ替わって不連続になるなど)ということがないというような条件で選択することが望ましい。また、ここでの補正は、いかなる補正方法を採用してもよく、第一の小ステップで採用した一次曲線(直線)による近似を採用してもよいが、ここでは特に、二点の位置関係と接線のなす角を用いる手法を、図12を用いて説明する。まず、点10001と点10002との、接線のなす角を、10003として計測する。次に、点10001と点10002とを両端とする線分長さ10004を、点10001と点10002の二点の距離として導出する。さらに、点10001と点10002を両端とする微小領域を円弧と仮定した場合の円弧の代表点を10005とすると、点10001と点10005との距離10006は、この微小領域を円弧としたときの半径(曲率半径)と一致する。また、円弧と仮定することにより、角10003と10007の値は等しくなる。これらの変数の幾何的関係を利用すると、式(2)によって曲率半径10006を導出することができる。
これにより、図13にあるような画像情報から、図14において太線で示されたような輪郭を抽出することができる。こうして再構成された輪郭について、部分輪郭照合部104の操作を施すことにより、輪郭情報の照合が可能になる。
[動作の説明]
次に、実施の形態の動作例について説明する。図15は、本実施の形態の動作の例を示すフローチャートである。なお、本発明に関連が薄い動作については、説明を省略する。
輪郭補完部121は、S1003の後、輪郭抽出部101において抽出された輪郭を補完する(S1201)。
次に、部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する(S1004)。
輪郭情報再構成部111は、S1004の後、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりすることで、部分輪郭を再構成する(S1101)。
部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40を比較した際に、所望の物体が得られない場合は、S1201以降のステップを再度行い、同様の処理を行う(S1007)。
以上、本実施の形態を実施することにより、輪郭情報に含まれる情報が十分ではない場合にも、物体の照合が可能となる。
なお、上述の各実施の形態において、実施の形態の処理は、プログラム、ソフトウェア、又はコンピュータによって実行されることが可能な命令でコード化された、コンピュータ読み取り可能な記憶媒体によって実行されてもよい。記憶媒体には、光ディスク、フロッピー(登録商標)ディスク、ハードディスク等の可搬型の記録媒体が含まれることはもとより、ネットワークのようにデータを一時的に記録保持するような伝送媒体も含まれる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
しかしながら、異なる二つの物体のシルエットの間に特徴的な点が存在しない場合、特徴点を抽出することができず、従来手法では、切り出しを行うことが困難であった。
すなわち、一つまたは複数の物体形状のシルエット情報において、異なる二つのシルエットの間に特徴的な点が存在しない場合に、単一の閉輪郭の抽出を解決する適切な方法は、これまで考案されていなかった。
こうした課題に対して、発明者らは以下のように一般物体認識を行なうシステムを提案する。
本システムの処理動作は、4つのステップで示すことができる。
第一のステップでは、一つまたは複数が含まれた物体のシルエット情報から取得できる全体の輪郭を抽出する。
第二のステップでは、抽出した輪郭上における特徴的な点を検出する。
第三のステップでは、前記第二のステップにおいて抽出した特徴的な点をもとに、輪郭を一つまたは複数に分割し、部分輪郭を生成する。
第四のステップは、生成した部分輪郭情報、データベース情報に照合することによって、物体の特定を行う。
以下、それぞれのステップ行なう画像識別システムについて、実施の形態を用いて説明する。
本発明の実施の形態を図1乃至図15を参照して説明する。
[第1の実施の形態]
本実施の形態を採用することにより、複数の物体形状が含まれたシルエット情報から、その中に含まれる単一の物体の認識を可能にする画像識別処理を行なう情報処理システムを提供できる。
[構成の説明]
図1は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
画像識別システムは、情報処理の全体を管理する制御部10と、検出対象とする画像データを取得する画像情報取得部20、取得した画像データなどを記憶する画像情報記憶部30、予め抽出された物体および形状の特徴が記憶収集されてデータベース化されている輪郭情報記憶部40、認識結果を出力する照合結果出力部50を含み構成されている。また、画像認識システムは、本願発明に係る画像識別部100として、輪郭抽出部101、特徴点検出部102、部分輪郭生成部103、部分輪郭照合部104を含み構成されている。
制御部10では、画像識別に関連する情報処理の全体動作を管理する。
画像情報取得部20では、動画や写真などユーザが指定した画像データを本システムに取り込み、画像情報記憶部30に記憶する。取り込み方法は、ユーザが指定した画像情報をそのまま取得してもよいし、或いは輝度情報などを利用した白黒変換など、その後の処理が容易になるような変換を施して取得すればよい。画像情報取得部20によって取得される画像情報の例を図2に例示する。なお、動画像などから、任意の間隔などで自動的に収集して画像情報を取り込むようにすることも可能である。
画像情報記憶部30では、取得した画像データや照合して得た結果、必要に応じて中間データ(閉輪郭の形状や補完輪郭、特徴点座標など)などを記憶する。画像情報記憶部30は、メモリーで構成してもよいし、HDDで構成してもよく、記憶部であればよい。
輪郭情報記憶部40では、照会に使用されるデータが抽出されて記憶されている。なお、輪郭情報記憶部40として、外部データベースを参照することとしてもよい。
照合結果出力部50では、画像識別部100で得られた結果を出力する。例えば、画像情報記憶部30から取得した照合結果と共に、輪郭情報記憶部40に記録されている照合結果の対象の物体や形状をモニターなどに出力する。なお、出力形態は、どのような情報を出力してもよい。
輪郭抽出部101は、画像情報取得部20によって取得されて画像情報記憶部30に記録されている検出対象とする画像データから取得できる輪郭の全部あるいは一部のみを輪郭情報(シルエット情報)として抽出する。ここでの全部とは、個々に分かれた輪郭をすべて検出対象とすることを指し、一部のみとは、ユーザが指定した近傍の1つの輪郭や任意の個数の輪郭のみを検出対象とすることを指す。
輪郭抽出部101は、対象画像データから、例えば、色相・彩度・明度などが急激に変化する点を、ラプラシアン・ガウシアンフィルタなどを用いて抽出する。ここでの急激に変化する点とは、色相・彩度・明度などの微分値が、前もって定められた閾値を超えるかどうかで判断すればよい。なお、輪郭情報を抽出する方法は、例示した方法に限定するものではない。
抽出された物体の輪郭は、例えば、輪郭点の集まりとして表現すればよく、直交座標系を用いて個々の点を(x,y)などで表してデータ化すればよい。
輪郭抽出部101によって抽出される輪郭情報の一例を図3に示す。このように、図2に示した数字パターン(「2」「3」が結合している2つの物体のシルエット)からなる一つのシルエット情報があった場合、図3のような外輪郭が抽出される。
なお、輪郭は、対象画像データから複数取得できることもある。この取得された個々の輪郭に対して個々に以下で説明する処理を行えばよい。以降の説明ではひとつの輪郭のみが取得されたものとして説明する。
特徴点検出部102は、検出対象とする輪郭上の特徴的な点(特徴点群)を検出処理する。この特徴点とは、例えば、下記式(1)で定義される曲率k(t)の値がゼロとなる点、すなわち変曲点を用いる。
曲率k(t)は、輪郭上における任意の一点を始点として輪郭を一周するように取った輪郭座標t、および、輪郭を直交座標系(x,y座標系)で表現した際の、x,yのtについての一次微分値および二次微分値によって定義される(式(1)参照)。
この手法によって定義された特徴点を図3に示される輪郭上から検出した結果を、図4中に○印で示す。なお、特徴点を検出する方法は、上記したものに限定するものではない。例えば、前述した曲率k(t)の値が急激に変化する点を「接続点」と定義し、接続点を特徴点として採用する手法が考えられる。ここでの急激に変化する点とは、例えば、曲率の微分値が、前もって定められた閾値を超えるかどうかで判断する。「接続点」の定義は以上の定義に限らず、物体が接続を起こす特徴的な点となっていればどのような定義であっても構わない。
部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する。部分輪郭は、特徴点情報を利用するいかなる手段を用いてもよいが、ふたつ以上の特徴点が検出された場合、特徴点を両端とする領域を部分輪郭として生成することが望ましい。また、輪郭抽出部101において抽出された輪郭が開輪郭であった場合、輪郭上の特徴点と輪郭の端点を両端とする領域を部分輪郭としてよい。
部分輪郭照合部104は、部分輪郭生成部103によって生成された部分輪郭のうち、ひとつまたは複数の部分輪郭を選択し、選択したひとつまたは複数の部分輪郭を、輪郭情報記憶部40に記録されている照会データを参照して物体の識別処理を行う。部分輪郭の選択の際には、連続する部分輪郭を選択することが望ましい。照合処理は、既存の多くの手法が使用できる。例えば、部分輪郭毎の特徴量の比較による照合や、選択された全ての部分輪郭を用いた物体の位置を用いた照合などが挙げられる。図2の例で選択された部分輪郭を図5に太線で示すとともに、輪郭情報記憶部40に記録されている照会データの例を図6に示す。図6に示された照会データについても同様の処理を施し、部分輪郭を生成・選択するとともに、図5において選択されている部分輪郭と参照する。また、照合処理は、選定した補完輪郭を用いて、先に抽出した輪郭を分割した部分にあたる部分輪郭を用いて、輪郭情報の照合処理を行えばどのような方法でもよい。
[動作の説明]
次に、実施の形態の動作例について説明する。図7は、本実施の形態の動作の例を示すフローチャートである。
まず、画像情報取得部20は、ユーザが指定する対象画像データを取得して画像情報記憶部30に記録する(S1001)。画像情報の取得は、ユーザが指定したものに限らず、システムが自動的に、半自動的に取得してもよい。
次に、輪郭抽出部101は、画像情報記憶部30に記録された検出対象とする対象画像データから物体または形状の輪郭情報(シルエット情報)を抽出処理する(S1002)。輪郭情報の抽出は、例えば閾値以上の輝度をもつピクセルなどを前もってユーザが基準を指定して、その基準を満たすもののみについて取得できる。
次に、特徴点検出部102は、輪郭上の特徴的な点を検出して特徴点群として検出する(S1003)。
次に、部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する(S1004)。
次に、部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40に格納された輪郭情報と比較した際に、所望の物体が得られない場合は、部分輪郭の選択(S1005)を再度行い、同様の処理を行う(S1007)。
この際、制御部10によって必要に応じて上記処理やパラメータを変更する処理を行ってもよい。条件を変えて処理を行えば精度の向上を図れる。その後、制御部10は、照合結果出力部50から、照合結果を出力する。
このように画像識別システムを動作させることによって、含まれる物体の数が明確でないシルエット情報から、そのシルエットに含まれる単一の物体の認識を能率よく取得できることが期待できる。
尚、画像識別システムの各部は、ハードウェアとソフトウェアの組み合わせを用いて実現すればよい。ハードウェアとソフトウェアとを組み合わせた形態では、RAMに画像識別プログラムが展開され、該プログラムに基づいて制御部(CPU)等のハードウェアを動作させることによって、各部を各種手段として実現する。また、該プログラムは、記憶媒体に記録されて頒布されても良い。当該記録媒体に記録されたプログラムは、有線、無線、又は記録媒体そのものを介して、メモリに読込まれ、制御部等を動作させる。尚、記録媒体を例示すれば、オプティカルディスクや磁気ディスク、半導体メモリ装置、ハードディスクなどが挙げられる。
上記実施の形態を別の表現で説明すれば、画像識別システムとして動作させる情報処理装置を、RAMに展開された画像識別プログラムに基づき、輪郭抽出手段、特徴点検出手段、特徴点ペア生成手段、補完輪郭選択手段、輪郭照合手段として制御部を動作させることで実現することが可能である。
以上説明したように、本発明によれば、シルエット情報に基づいて該シルエット情報に含まれる物体または形状の一般物体認識を行う画像識別システム、その方法、およびプログラムを提供できる。
また、本発明によれば、一般物体認識を、シルエット情報から行い、単一の閉輪郭の抽出を能率よく試みる処理手法を提供できる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
[第2の実施の形態]
本発明を実施するための第2の実施の形態について、図面を参照して詳細に説明する。本実施の形態は、第1の実施の形態における部分輪郭情報に含まれる情報が十分ではない場合を想定している。こうした場合、第2の実施の形態は、輪郭情報記憶部に格納されている輪郭情報を参照し、部分輪郭を再構成する手法を採用する。このために、第2の実施の形態は、輪郭情報再構成部111を新たに設ける点が、第1の実施の形態とは異なる。このほか、いくつかの要素は第1の実施の形態とは異なる機能を有す。
[構成の説明]
図8は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
輪郭情報再構成部111は、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりする方法で、部分輪郭を再構成する。この際の再構成方法はいかなる方法を用いてもよいが、輪郭情報記憶部40に記録されている既に記憶された物体の輪郭情報を参照することが望ましい。以下、図9を利用して、図2のシルエット情報を用いて輪郭情報再構成部111の採用する手法の一例を説明する。
まず、図9内の(a)下部に示されているシルエット情報に関し、特徴点検出部102、部分輪郭生成部103、部分輪郭照合部104によって生成・選択された部分輪郭を(b)に示す。同時に、輪郭情報記憶部40内に含まれる(a)上部に示された形状の部分輪郭について、(b)下部の部分輪郭に対応する部分輪郭を(b)上部のように選択する。このとき、(b)上部に示される記憶内の形状について、選択されなかった部分輪郭が(c)のように決定される。これに対応する下部の形状内の部分輪郭は、(b)において選択された部分輪郭に隣接する部分輪郭として、(c)下部の二つの部分輪郭から構成すればよい。この再構成は、(c)上部に示される部分輪郭の長さや曲率などの幾何的情報を利用することで実施できる。ここでは、(c)上部に示される部分輪郭の長さ情報を利用して再構成した結果を(d)に示す。以上の一連の処理により、輪郭情報は再構成される。
[動作の説明]
次に、実施の形態の動作例について説明する。図10は、本実施の形態の動作の例を示すフローチャートである。なお、本発明に関連が薄い動作については、説明を省略する。
輪郭情報再構成部111は、S1004の後、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりする(S1101)。
部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40を比較した際に、所望の物体が得られない場合は、輪郭情報の再構成(S1101)および部分輪郭の選択(S1005)を再度行い、同様の処理を行う(S1007)。
この際、制御部10によって必要に応じて上記処理やパラメータを変更する処理を行ってもよい。条件を変えて処理を行えば精度の向上を図れる。その後、制御部10は、照合結果出力部50から、照合結果を出力する。
以上、本実施の形態を実施することにより、部分輪郭情報に含まれる情報が十分ではない場合にも、物体の照合が可能となる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
[第3の実施の形態]
本発明を実施するための第3の実施の形態について、図面を参照して詳細に説明する。本実施の形態は、第1および第2の実施の形態における画像内の輪郭情報に含まれる情報が十分ではない場合を想定している。こうした場合、第3の実施の形態は、輪郭情報記憶部に格納されている輪郭情報を参照し、輪郭を補完する手法を採用する。このために、第3の実施の形態は、輪郭補完部121を新たに設ける点が、第2の実施の形態とは異なる。このほか、いくつかの要素は第2の実施の形態とは異なる機能を有す。
[構成の説明]
図11は、実施の一形態の認識システムの構成を示すブロック図である。なお、本発明に関連が薄い構成については、説明を簡略化又は省略する。
輪郭補完部121は、輪郭抽出部101において抽出された輪郭に対し、必要な輪郭情報を補完する。この際の補完方法はいかなる方法を用いてもよいが、以下に示すように、特徴点検出部102において検出された特徴点を用いて補完を行うことが望ましい。以下、特徴点検出部102において検出された特徴点を用いた補完方法を説明する。
特徴点検出部102において検出された特徴点のうち、適切な組み合わせの二点間を補完する。二点は、任意の二点であってよいが、幾何的条件などを考慮し、適切なものを選択することが望ましい。例えば、二点上のそれぞれ接線のなす角が閾値以下であるといった条件や、補完を行った後に曲率の値が極度に不連続になる(例えば正負が入れ替わって不連続になるなど)ということがないというような条件で選択することが望ましい。また、ここでの補正は、いかなる補正方法を採用してもよく、第一の小ステップで採用した一次曲線(直線)による近似を採用してもよいが、ここでは特に、二点の位置関係と接線のなす角を用いる手法を、図12を用いて説明する。まず、点10001と点10002との、接線のなす角を、10003として計測する。次に、点10001と点10002とを両端とする線分長さ10004を、点10001と点10002の二点の距離として導出する。さらに、点10001と点10002を両端とする微小領域を円弧と仮定した場合の円弧の代表点を10005とすると、点10001と点10005との距離10006は、この微小領域を円弧としたときの半径(曲率半径)と一致する。また、円弧と仮定することにより、角10003と10007の値は等しくなる。これらの変数の幾何的関係を利用すると、式(2)によって曲率半径10006を導出することができる。
これにより、図13にあるような画像情報から、図14において太線で示されたような輪郭を抽出することができる。こうして再構成された輪郭について、部分輪郭照合部104の操作を施すことにより、輪郭情報の照合が可能になる。
[動作の説明]
次に、実施の形態の動作例について説明する。図15は、本実施の形態の動作の例を示すフローチャートである。なお、本発明に関連が薄い動作については、説明を省略する。
輪郭補完部121は、S1003の後、輪郭抽出部101において抽出された輪郭を補完する(S1201)。
次に、部分輪郭生成部103は、特徴点検出部102において検出した特徴点情報を用いて、輪郭を一つまたは複数の領域に分割し、分割されたひとつひとつの領域を部分輪郭として生成する(S1004)。
輪郭情報再構成部111は、S1004の後、部分輪郭生成部103において生成された部分輪郭に対し、必要な部分輪郭を切断したり結合したりすることで、部分輪郭を再構成する(S1101)。
部分輪郭照合部104は、対象画像データから抽出された輪郭情報(シルエット情報)と補正された補完輪郭とを使用して、生成された部分輪郭のうちからひとつまたは複数の輪郭を選択(S1005)し、選択された部分輪郭と、輪郭情報記憶部40にある輪郭情報とを比較することによって、物体の照合処理を行う(S1006)。輪郭情報記憶部40を比較した際に、所望の物体が得られない場合は、S1201以降のステップを再度行い、同様の処理を行う(S1007)。
以上、本実施の形態を実施することにより、輪郭情報に含まれる情報が十分ではない場合にも、物体の照合が可能となる。
なお、上述の各実施の形態において、実施の形態の処理は、プログラム、ソフトウェア、又はコンピュータによって実行されることが可能な命令でコード化された、コンピュータ読み取り可能な記憶媒体によって実行されてもよい。記憶媒体には、光ディスク、フロッピー(登録商標)ディスク、ハードディスク等の可搬型の記録媒体が含まれることはもとより、ネットワークのようにデータを一時的に記録保持するような伝送媒体も含まれる。
また、本発明の具体的な構成は前述の実施の形態に限られるものではなく、この発明の要旨を逸脱しない範囲の変更があってもこの発明に含まれる。
本発明によれば、一つまたは複数の物体形状のシルエット情報から、単一情報のそれを抽出することによって、一般的な物体の認識を可能にするので、画像の検索や、画像の分類といった用途に適用可能である。
この出願は、2012年4月11日に出願された日本国特許出願第2012−90225号からの優先権を基礎として、その利益を主張するものであり、その開示はここに全体として参考文献として取り込む。
この出願は、2012年4月11日に出願された日本国特許出願第2012−90225号からの優先権を基礎として、その利益を主張するものであり、その開示はここに全体として参考文献として取り込む。
10 制御部(制御手段)
20 画像情報取得部(画像情報取得手段)
30 画像情報記憶部(対象画像、結果)
40 輪郭情報記憶部(照会データ)
50 照合結果出力部(照合結果出力手段)
100 画像識別部(画像識別手段)
101 輪郭抽出部(輪郭抽出手段)
102 特徴点検出部(特徴点検出手段)
103 部分輪郭生成部(部分輪郭生成手段)
104 部分輪郭照合部(部分輪郭照合手段)
111 輪郭情報再構成部(輪郭情報再構成手段)
121 輪郭補完部(輪郭補完手段)
10001:特徴点ペアの一点
10002:特徴点ペアの一点
10003:特徴点ペアの接線のなす角
10004:特徴点ペア間の線分長
10005:特徴点ペア間を円弧としたときの円弧中心点
10006:円弧中心点と特徴点ペア各点とを両端とする線分
10007:円弧中心点を中心とし、特徴点ペア両端点のなす角
20 画像情報取得部(画像情報取得手段)
30 画像情報記憶部(対象画像、結果)
40 輪郭情報記憶部(照会データ)
50 照合結果出力部(照合結果出力手段)
100 画像識別部(画像識別手段)
101 輪郭抽出部(輪郭抽出手段)
102 特徴点検出部(特徴点検出手段)
103 部分輪郭生成部(部分輪郭生成手段)
104 部分輪郭照合部(部分輪郭照合手段)
111 輪郭情報再構成部(輪郭情報再構成手段)
121 輪郭補完部(輪郭補完手段)
10001:特徴点ペアの一点
10002:特徴点ペアの一点
10003:特徴点ペアの接線のなす角
10004:特徴点ペア間の線分長
10005:特徴点ペア間を円弧としたときの円弧中心点
10006:円弧中心点と特徴点ペア各点とを両端とする線分
10007:円弧中心点を中心とし、特徴点ペア両端点のなす角
Claims (19)
- 検出対象とする対象画像データから物体または形状の輪郭を抽出処理する輪郭抽出ステップと、
抽出した輪郭から特徴点群を検出処理する特徴点検出ステップと、
検出した特徴点情報を用いて、特徴点間の輪郭を一以上の領域に分割し、分割された領域を部分輪郭として生成する部分輪郭生成ステップと、
生成した部分輪郭のうちひとつまたは複数を選択し、輪郭情報の照合処理を行う輪郭照合ステップと、を含むことを特徴とする物体または形状を識別処理する画像識別方法。 - 前記画像識別方法は、
前記選択された部分輪郭以外から、新たに部分輪郭を再構成する輪郭情報再構成ステップをさらに含み、再構成された部分輪郭を用いて輪郭照合ステップを実施する、ことを特徴とする請求項1に記載の物体または形状を識別処理する画像識別方法。 - 前記画像識別方法は、
前記検出した特徴点のうち任意の二点間の輪郭を補完する輪郭補完ステップをさらに含み、補完された輪郭を用いて前記部分輪郭生成ステップを実施する、ことを特徴とする請求項1または2に記載の物体または形状を識別処理する画像識別方法。 - 前記特徴点は、前記輪郭上の接線の方位、或いは曲率が、急激に変化する点或いは、前もって定めた値の範囲内に含まれる点とする、ことを特徴とする請求項1から3の何れかに記載の物体または形状を識別処理する画像識別方法。
- 前記部分輪郭を再構成する際には、前記照合対象の輪郭を参照し、輪郭の長さ、方位、曲率の何れかまたはすべてを用いてこれを行うことを特徴とする請求項1から4の何れかに記載の物体または形状を識別処理する画像識別方法。
- 前記輪郭の補完を行う際には、前記複数個の特徴点の位置・接線の方位・曲率の一つまたは複数の情報が、定められた値の範囲内に含まれる場合のみ、補正を行うことを特徴とする請求項1から5の何れかに記載の物体または形状を識別処理する画像識別方法。
- 検出対象とする対象画像データから物体または形状の輪郭を抽出処理する輪郭抽出手段と、
抽出した輪郭から特徴点群を検出処理する特徴点検出手段と、
検出した特徴点情報を用いて、特徴点間の輪郭を一以上の領域に分割し、分割された領域を部分輪郭として生成する部分輪郭生成手段と、
生成した部分輪郭のうちひとつまたは複数を選択し、輪郭情報の照合処理を行う輪郭照合手段と、を備えることを特徴とする物体または形状を識別処理する画像識別システム。 - 前記画像識別システムは、
前記選択された部分輪郭以外から、新たに部分輪郭を再構成する輪郭情報再構成手段をさらに備え、再構成された部分輪郭を用いて輪郭照合手段を実施する、ことを特徴とする請求項7に記載の物体または形状を識別処理する画像識別システム。 - 前記画像識別システムは、
前記検出した特徴点のうち任意の二点間の輪郭を補完する輪郭補完手段をさらに備え、補完された輪郭を用いて前記部分輪郭生成手段を実施する、ことを特徴とする請求項7または8に記載の物体または形状を識別処理する画像識別システム。 - 前記特徴点は、前記輪郭上の接線の方位、或いは曲率が、急激に変化する点或いは、前もって定めた値の範囲内に含まれる点とする、ことを特徴とする請求項7から9の何れかに記載の物体または形状を識別処理する画像識別システム。
- 前記部分輪郭を再構成する際には、前記照合対象の輪郭を参照し、輪郭の長さ、方位、曲率の何れかまたはすべてを用いてこれを行うことを特徴とする請求項7から10の何れかに記載の物体または形状を識別処理する画像識別システム。
- 前記輪郭の補完を行う際には、前記複数個の特徴点の位置・接線の方位・曲率の一つまたは複数の情報が、定められた値の範囲内に含まれる場合のみ、補正を行うことを特徴とする請求項7から11の何れかに記載の物体または形状を識別処理する画像識別システム。
- 検出対象とする対象画像データから物体または形状の輪郭を抽出処理する輪郭抽出処理と、
抽出した輪郭から特徴点群を検出処理する特徴点検出処理と、
検出した特徴点情報を用いて、特徴点間の輪郭を一以上の領域に分割し、分割された領域を部分輪郭として生成する部分輪郭生成処理と、
生成した部分輪郭のうちひとつまたは複数を選択し、輪郭情報の照合処理を行う輪郭照合処理と、をコンピュータに実行させることを特徴とする画像識別プログラム。 - 前記画像識別プログラムは、
前記選択された部分輪郭以外から、新たに部分輪郭を再構成する輪郭情報再構成処理をさらに含み、再構成された部分輪郭を用いて輪郭照合処理をコンピュータに実行させることを特徴とする請求項13に記載の画像識別プログラム。 - 前記画像識別プログラムは、
前記検出した特徴点のうち任意の二点間の輪郭を補完する輪郭補完処理をさらに含み、補完された輪郭を用いて前記部分輪郭生成処理をコンピュータに実行させることを特徴とする請求項13または14に記載の画像識別プログラム。 - 前記特徴点は、前記輪郭上の接線の方位、或いは曲率が、急激に変化する点或いは、前もって定めた値の範囲内に含まれる点とする、ことを特徴とする請求項13から15の何れかに記載の画像識別プログラム。
- 前記部分輪郭を再構成する際には、前記照合対象の輪郭を参照し、輪郭の長さ、方位、曲率の何れかまたはすべてを用いてこれを行うことを特徴とする請求項13から16の何れかに記載の画像識別プログラム。
- 前記輪郭の補完を行う際には、前記複数個の特徴点の位置・接線の方位・曲率の一つまたは複数の情報が、定められた値の範囲内に含まれる場合のみ、補正を行うことを特徴とする請求項13から17の何れかに記載の画像識別プログラム。
- 請求項13から18の何れか一項に記載の画像識別プログラムを記録したコンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014510156A JPWO2013154062A1 (ja) | 2012-04-11 | 2013-04-01 | 画像識別システム、画像識別方法、およびプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012090225 | 2012-04-11 | ||
JP2012090225 | 2012-04-11 | ||
JP2014510156A JPWO2013154062A1 (ja) | 2012-04-11 | 2013-04-01 | 画像識別システム、画像識別方法、およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2013154062A1 true JPWO2013154062A1 (ja) | 2015-12-17 |
Family
ID=49327626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014510156A Pending JPWO2013154062A1 (ja) | 2012-04-11 | 2013-04-01 | 画像識別システム、画像識別方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2013154062A1 (ja) |
WO (1) | WO2013154062A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115601543A (zh) * | 2022-10-13 | 2023-01-13 | 上海第二工业大学(Cn) | 基于改进的SOLOv2的蘑菇簇轮廓分割和重构方法 |
CN115690132A (zh) * | 2022-10-20 | 2023-02-03 | 北京霍里思特科技有限公司 | 一种图像处理方法和系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60200376A (ja) * | 1984-03-26 | 1985-10-09 | Hitachi Ltd | 部分パタ−ンマツチング方式 |
JPH06309498A (ja) * | 1993-02-25 | 1994-11-04 | Fujitsu Ltd | 画像抽出方式 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS59160274A (ja) * | 1983-03-02 | 1984-09-10 | Hitachi Ltd | 文字切出し方式 |
-
2013
- 2013-04-01 JP JP2014510156A patent/JPWO2013154062A1/ja active Pending
- 2013-04-01 WO PCT/JP2013/060564 patent/WO2013154062A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60200376A (ja) * | 1984-03-26 | 1985-10-09 | Hitachi Ltd | 部分パタ−ンマツチング方式 |
JPH06309498A (ja) * | 1993-02-25 | 1994-11-04 | Fujitsu Ltd | 画像抽出方式 |
Also Published As
Publication number | Publication date |
---|---|
WO2013154062A1 (ja) | 2013-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4284288B2 (ja) | パターン認識装置及びその方法 | |
US9953211B2 (en) | Image recognition apparatus, image recognition method and computer-readable medium | |
JP5706647B2 (ja) | 情報処理装置、およびその処理方法 | |
US9256802B2 (en) | Object or shape information representation method | |
JP2014131277A5 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US11049256B2 (en) | Image processing apparatus, image processing method, and storage medium | |
CN105069457B (zh) | 图像识别方法和装置 | |
TWI567660B (zh) | 多類別物件分類方法及系統 | |
JP2007316809A (ja) | 顔照合装置および方法並びにプログラム | |
US20130301911A1 (en) | Apparatus and method for detecting body parts | |
US9489593B2 (en) | Information processing apparatus and training method | |
US8938132B2 (en) | Image collation system, image collation method and computer program | |
JP2013206458A (ja) | 画像における外観及びコンテキストに基づく物体分類 | |
Wu et al. | Privacy leakage of sift features via deep generative model based image reconstruction | |
JP2008251029A (ja) | 文字認識装置、ナンバープレート認識システム | |
WO2013154062A1 (ja) | 画像識別システム、画像識別方法、およびプログラム | |
KR101521136B1 (ko) | 얼굴 인식 방법 및 얼굴 인식 장치 | |
WO2013084731A1 (ja) | 画像識別システム | |
JP2016053763A (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6126979B2 (ja) | 特徴選択装置、方法、及びプログラム | |
Ngoc | An efficient LBP-based descriptor for real-time object detection | |
WO2015178001A1 (ja) | 画像照合システム、画像照合方法、およびプログラムを記憶する記録媒体 | |
JP2014112347A (ja) | 画像照合システム、画像照合方法、およびプログラム | |
KR101306576B1 (ko) | 차분 성분을 고려한 조명 변화에 강인한 얼굴 인식 시스템 | |
JP2014056415A (ja) | 画像照合システム、画像照合方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151222 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170405 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20171122 |