JP4967045B2 - 背景判別装置、方法及びプログラム - Google Patents
背景判別装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4967045B2 JP4967045B2 JP2010135643A JP2010135643A JP4967045B2 JP 4967045 B2 JP4967045 B2 JP 4967045B2 JP 2010135643 A JP2010135643 A JP 2010135643A JP 2010135643 A JP2010135643 A JP 2010135643A JP 4967045 B2 JP4967045 B2 JP 4967045B2
- Authority
- JP
- Japan
- Prior art keywords
- background
- image
- region
- block
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 15
- 238000009826 distribution Methods 0.000 claims description 54
- 238000000605 extraction Methods 0.000 claims description 9
- 238000013500 data storage Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 5
- 238000012850 discrimination method Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 235000012736 patent blue V Nutrition 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
本実施形態は、図1(構成図)に示すように、画像内の背景を判別する背景判別装置1(以下「本装置1」又は「本装置」と呼ぶ)に関する。本装置1は、通信ネットワークN経由で端末Tに類似画像検索サービスを提供する機能を持つサーバを兼ねるが、そのような機能を兼ねず背景の判別だけの装置としてもよい。
上記のような本装置1において、背景を判別する処理手順を図3のフローチャートに示す。
〔2−1.背景確率分布の生成〕
ここで、設定手段13は、画像の各ブロック毎に背景である確率(「背景確率」と呼ぶこととする)を設定するが、本実施形態における背景確率の設定は、背景の判別(図3)に先立って、画像全体における背景確率の分布(「背景確率分布」と呼ぶこととする)を、画像のジャンル(例えば、人物、商品、風景など)ごとに予め定める処理と、背景の判別時に背景確率分布を適用することで個々の元画像のブロック毎に背景確率を設定する処理と、からなる。ここで、背景確率分布の例を図4の概念図に示す。この例では、破線の同心円で示すように、黒っぽい部分ほど主たるオブジェクトである確率が高く背景確率が低く、逆に、周囲の白っぽい色の部分ほど背景確率が高い。
上記のように、設定手段13が生成して記憶しておく背景確率分布の表現形式は自由であるが、その一例として、ジャンル毎の背景確率分布を、二次元正規分布に関する係数を用いて表現することができる。すなわち、まず、背景確率は、基本的に画像の中心ほど低く辺縁部ほど高いので、主たるオブジェクトである確率(仮に「対象確率」と呼ぶ)と逆であり、背景確率と対象確率は足して1になるいわゆる補数の関係にある。
以上のように背景確率分布が生成され、記憶されている前提で、背景を判別して抽出する処理手順(図3)について説明する。まず、特徴量抽出手段15が、元画像記憶手段11から、背景判別の対象とする元画像(「対象画像」又は単に「画像」とも呼ぶこととする)をブロックに分割し、分割した画像のブロック毎に特徴量を計算などで抽出する(ステップS11)。ここで抽出する特徴量は、カラーヒストグラムやテクスチャ特徴量など一般的なものでよい。
続いて、分割手段16が、上記のように抽出されたブロックの特徴量に基づいてブロックをクラスタリングして同一クラスタに属するブロック群ごとに領域(「部分領域」とも呼ぶこととする)を生成することにより、画像を複数の領域に分割する(ステップS12)。この特徴量のクラスタリングは特徴量空間内で行い、クラスタリングした特徴量ごとに、元画像中における領域として配置するが、その例を以下に示す。
さらに、判別手段17は、分割された領域に対応する位置のブロック毎に設定されている確率の平均値を領域毎に算出する。この処理では、判別手段17は、まず、確率分布記憶手段14に記憶されている背景確率分布のうち、その対象画像と同一ジャンルに対応する背景確率分布を選択する(ステップS13)。そして、判別手段17は、その背景確率分布に基づいて即ちその背景確率分布のサイズを対象画像に合わせて拡大縮小し(ステップS14)、それを対象画像に当てはめることで、部分領域ごとに含まれる画像の各ブロック毎に対応する背景確率を求め、その平均値を算出する(ステップS15)。
本実施形態では、以上のように、画像中央から離れるほど背景の可能性が高いなど画像の部分ごとに背景である確率を設定し(例えば図4、図9)、画像から特徴量の共通性によるクラスタリングで分割した領域について(例えば図8)、領域内に分布する前記確率の平均値を算出しそれを基に背景かを判別することにより(例えば図10)、オブジェクトや背景の色や形などに拘わらず、主たるオブジェクトと背景を精度よく判別することができる。これにより、画像中のオブジェクトの特徴を精度よく表すことで、類似画像検索の精度を高めることができる。
上記実施形態(以下「第1実施形態」と呼ぶ)に対し、背景判別の手法を更に改良することで処理の精度と効率を両立させる例を第2実施形態として示す。すなわち、図5の例において特徴量を抽出する対象の画素を間引いたり、また、図6に例示したように特徴量をブロック単位に抽出することで特徴量を削減した場合、元画像の画素単位に背景か否かを判定する処理をさらに加えれば、処理効率を維持しつつ、特に領域間の境界付近における判定精度を改善することができる。
なお、上記各実施形態は例示に過ぎず、本発明は、以下に例示するものやそれ以外の他の実施態様も含むものである。例えば、ブロック毎の背景確率の設定について、ジャンル毎の背景確率分布を予め用意することは必須ではなく、ある固定された背景確率の基準に基づいて個々の元画像を構成するブロック毎に背景確率を計算して設定してもよい。
6 演算制御部
7 記憶装置
8 通信手段
11 元画像記憶手段
12 学習用データ記憶手段
13 設定手段
14 確率分布記憶手段
15 特徴量抽出手段
16 分割手段
17 判別手段
18 結果記憶手段
19 類似画像検索手段
B1,B2,B11,B12 ブロック
C1,C2,C11,C12 特徴量
G,G1,G2 画素
N 通信ネットワーク
R1〜R5 領域
T 端末
Claims (5)
- 画像内の背景を判別する背景判別装置であって、
判別の対象とする元画像の全画素に対応するブロック毎に特徴量を抽出する特徴量抽出手段と、
抽出された前記ブロックの特徴量に基づいてブロックをクラスタリングすることにより、前記画像を複数の領域に分割する分割手段と、
画像の各ブロック毎に背景である確率を設定する設定手段と、
分割された前記領域に対応する位置の前記ブロック毎に設定されている前記確率の平均値を前記領域毎に算出し、この平均値に基づいて各領域が背景であるか否かを判別する判別手段と、
分割された前記各領域毎に、その領域に含まれる各ブロックの特徴量に基づいて、領域の代表特徴量を算出し、抽出した前記元画像の全画素に対応するブロック毎の前記特徴量がいずれの領域の前記代表特徴量に最も類似するかを判定し、最も類似する領域が背景と判別されているかに基づいて、その画素が背景かを判別する画素判定手段と、
を備えることを特徴とする背景判別装置。 - 学習用データとしてジャンルごとの画像を記憶している学習用データ記憶手段を有し、
前記設定手段は、
画像のブロックごとに背景である確率を対応付けたデータである背景確率分布を、前記学習用データ記憶手段に記憶されている前記学習用データを用いてジャンルごとに予め生成して所定の確率分布記憶手段に記憶させ、
前記確率分布記憶手段に記憶されている前記背景確率分布に基づいて前記元画像の各ブロック毎に背景である確率を設定する
ことを特徴とする請求項1記載の背景判別装置。 - 前記設定手段は、前記背景である確率の分布を、二次元正規分布に関する係数を用いて表現することを特徴とする請求項1又は2記載の背景判別装置。
- 画像内の背景をコンピュータが判別する背景判別方法であって、
コンピュータが、判別の対象とする元画像の全画素に対応するブロック毎に特徴量を抽出する特徴量抽出ステップと、
コンピュータが、抽出された前記ブロックの特徴量に基づいてブロックをクラスタリングすることにより、前記画像を複数の領域に分割する分割ステップと、
コンピュータが、画像の各ブロック毎に背景である確率を設定する設定ステップと、
コンピュータが、分割された前記領域に対応する位置の前記ブロック毎に設定されている前記確率の平均値を前記領域毎に算出し、この平均値に基づいて各領域が背景であるか否かを判別する判別ステップと、
コンピュータが、分割された前記各領域毎に、その領域に含まれる各ブロックの特徴量に基づいて、領域の代表特徴量を算出し、抽出した前記元画像の全画素に対応するブロック毎の前記特徴量がいずれの領域の前記代表特徴量に最も類似するかを判定し、最も類似する領域が背景と判別されているかに基づいて、その画素が背景かを判別する画素判定ステップと、
を含むことを特徴とする背景判別方法。 - 画像内の背景をコンピュータに判別させる背景判別プログラムであって、
コンピュータに、判別の対象とする元画像の全画素に対応するブロック毎に特徴量を抽出させ、
コンピュータに、抽出された前記ブロックの特徴量に基づいてブロックをクラスタリングさせることにより、前記画像を複数の領域に分割させ、
コンピュータに、画像の各ブロック毎に背景である確率を設定させ、
コンピュータに、分割された前記領域に対応する位置の前記ブロック毎に設定されている前記確率の平均値を前記領域毎に算出させ、この平均値に基づいて各領域が背景であるか否かを判別させ、
コンピュータに、分割された前記各領域毎に、その領域に含まれる各ブロックの特徴量に基づいて、領域の代表特徴量を算出し、抽出した前記元画像の全画素に対応するブロック毎の前記特徴量がいずれの領域の前記代表特徴量に最も類似するかを判定し、最も類似する領域が背景と判別されているかに基づいて、その画素が背景かを判別させる
ことを特徴とする背景判別プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010135643A JP4967045B2 (ja) | 2010-06-15 | 2010-06-15 | 背景判別装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010135643A JP4967045B2 (ja) | 2010-06-15 | 2010-06-15 | 背景判別装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012003358A JP2012003358A (ja) | 2012-01-05 |
JP4967045B2 true JP4967045B2 (ja) | 2012-07-04 |
Family
ID=45535290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010135643A Active JP4967045B2 (ja) | 2010-06-15 | 2010-06-15 | 背景判別装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4967045B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101913319B1 (ko) | 2013-07-16 | 2019-01-14 | 삼성전자주식회사 | 깊이 영상에서 인터페이싱 영역을 검출하는 방법 및 장치 |
CN106156700B (zh) * | 2015-03-31 | 2019-06-18 | 北京数码视讯科技股份有限公司 | 一种图像处理中人体特征的提取方法及装置 |
CN113837998B (zh) * | 2021-08-19 | 2024-07-02 | 佛山市灵觉科技有限公司 | 一种基于深度学习的图片自动调整对齐的方法及装置 |
CN116137671A (zh) * | 2021-11-17 | 2023-05-19 | 北京字跳网络技术有限公司 | 一种封面生成方法、装置、设备及介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4622141B2 (ja) * | 2001-04-13 | 2011-02-02 | ソニー株式会社 | 画像処理装置および画像処理方法、記録媒体、並びにプログラム |
JP4098021B2 (ja) * | 2002-07-30 | 2008-06-11 | 富士フイルム株式会社 | シーン識別方法および装置ならびにプログラム |
JP2007102307A (ja) * | 2005-09-30 | 2007-04-19 | Seiko Epson Corp | 画像に表現された被写体の特定 |
-
2010
- 2010-06-15 JP JP2010135643A patent/JP4967045B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012003358A (ja) | 2012-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10896349B2 (en) | Text detection method and apparatus, and storage medium | |
CN109670500B (zh) | 一种文字区域获取方法、装置、存储介质及终端设备 | |
WO2014160426A1 (en) | Classifying objects in digital images captured using mobile devices | |
CN106296681B (zh) | 基于双通道低秩分解的协同学习显著性检测方法 | |
CN110399842B (zh) | 视频处理方法、装置、电子设备及计算机可读存储介质 | |
JP2014041476A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN108280190A (zh) | 图像分类方法、服务器及存储介质 | |
CN109903210B (zh) | 水印的去除方法、装置和服务器 | |
CN112651953B (zh) | 图片相似度计算方法、装置、计算机设备及存储介质 | |
US8953877B2 (en) | Noise estimation for images | |
WO2021159802A1 (zh) | 图形验证码识别方法、装置、计算机设备及存储介质 | |
CN109272526B (zh) | 图像处理方法、系统及电子设备 | |
JP6338429B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム | |
JP4967045B2 (ja) | 背景判別装置、方法及びプログラム | |
WO2024016632A1 (zh) | 亮点定位方法、亮点定位装置、电子设备及存储介质 | |
CN106682670B (zh) | 一种台标识别方法及系统 | |
CN113840135B (zh) | 色偏检测方法、装置、设备及存储介质 | |
JP2013105373A (ja) | データ取得装置、方法及びプログラム | |
CN110895811A (zh) | 一种图像篡改检测方法和装置 | |
JP5027201B2 (ja) | テロップ文字領域検出方法,テロップ文字領域検出装置およびテロップ文字領域検出プログラム | |
JP6546385B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2016081472A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN115063578A (zh) | 芯片图像中目标对象检测与定位方法、装置及存储介质 | |
JP5786838B2 (ja) | 画像領域分割装置、方法、およびプログラム | |
JP6580201B2 (ja) | 被写体検出装置、被写体検出方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120307 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120327 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4967045 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150406 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |