JP4967798B2 - Detection apparatus and method, program, and recording medium - Google Patents
Detection apparatus and method, program, and recording medium Download PDFInfo
- Publication number
- JP4967798B2 JP4967798B2 JP2007129517A JP2007129517A JP4967798B2 JP 4967798 B2 JP4967798 B2 JP 4967798B2 JP 2007129517 A JP2007129517 A JP 2007129517A JP 2007129517 A JP2007129517 A JP 2007129517A JP 4967798 B2 JP4967798 B2 JP 4967798B2
- Authority
- JP
- Japan
- Prior art keywords
- sub
- value
- telop
- block
- horizontal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
本発明は、検出装置および方法、プログラム、並びに記録媒体に関し、特に、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できるようにする検出装置および方法、プログラム、並びに記録媒体に関する。 The present invention relates to a detection apparatus and method, a program, and a recording medium, and in particular, a detection apparatus and method, a program, and a program that can realize edge detection that is robust to the sharpness characteristics of an input image with a smaller amount of calculation. The present invention relates to a recording medium.
近年、放送される画像信号の高精細化、高解像度(HD(high definition))化が進みつつあるが、依然として標準精細(SD(Standard Definition))の画像を、HDに変換(アップコンバート)した画像信号の放送も行われている。 In recent years, high definition and high definition (HD (high definition)) of broadcast image signals are progressing, but standard definition (SD (Standard Definition)) images are still converted (up-converted) to HD. Broadcasting of image signals is also performed.
さらに、HDの画像として収録された素材に対してHDのテロップとSDのテロップが混在する例も見受けられる。 In addition, there are cases where HD telops and SD telops are mixed for materials recorded as HD images.
また、近年、HDD(Hard Disk Drive)レコーダなどの普及に伴って、画像信号を解析して、特定の場面などを簡単に検索できるようにするニーズが高まっており、特に、テロップが含まれる画像を検出するニーズが高まっている。 In recent years, with the widespread use of HDD (Hard Disk Drive) recorders and the like, there has been a growing need to easily search for specific scenes by analyzing image signals, especially images containing telops. The need to detect is increasing.
解像度の向上したSD信号からHD信号へのアップコンバートできるようにする技術も提案されている(例えば、特許文献1参照)。 A technique that enables up-conversion from an SD signal with improved resolution to an HD signal has also been proposed (see, for example, Patent Document 1).
従来、テロップの検出は、画像の中のエッジを検出し、検出されたエッジ数などに基づいてテロップが存在するか否かを判定することにより行われていた。 Conventionally, telop detection is performed by detecting edges in an image and determining whether or not a telop exists based on the number of detected edges.
しかしながら、SDのテロップと、HDのテロップとが混在する画像においては、輪郭部が強調されたシャープネスの高い画像であるHDの素材の中から、輪郭が比較的曖昧なSDのテロップを検出することになり、従来の方式では、適切にテロップを検出することができない。 However, in an image in which SD telop and HD telop are mixed, SD telop whose outline is relatively ambiguous is detected from HD material which is an image with high sharpness and whose outline is emphasized. Therefore, the conventional method cannot detect the telop properly.
本発明はこのような状況に鑑みてなされたものであり、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できるようにするものである。 The present invention has been made in view of such a situation, and makes it possible to realize edge detection that is robust to the sharpness characteristics of an input image with a smaller amount of calculation.
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部とを備える検出装置である。 One aspect of the present invention is a detection device that detects information for specifying a region including a telop from input image data, and the image data is divided into N pixels in a horizontal direction and a vertical direction, respectively. Dividing means for dividing the plurality of sub-blocks composed of M pixels into a plurality of sub-blocks, and for each of the plurality of sub-blocks, an average value of pixel values of N pixels in the horizontal direction constituting the sub-blocks. Horizontal average value calculating means for calculating an average value in M horizontal directions, and an average value of pixel values of M pixels in the vertical direction constituting the sub-block for each of the plurality of sub-blocks. A vertical average value calculating means for calculating an average value in the N vertical directions, and a difference between a maximum value and a minimum value among the M average values in the horizontal direction, and an area including the telop Identify A horizontal index calculation unit that calculates a first index for the first index, and a second index for specifying a region that includes the telop, using a difference between a maximum value and a minimum value among the N average values in the vertical direction. And a vertical index calculation unit that calculates the index.
注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第1の指標を抽出して、前記第1の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる水平フィルタにより処理して得られる水平処理データと、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第2の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタにより処理して得られる垂直処理データとに基づいて、前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段をさらに備えるようにすることができる。 The first index is extracted for a subblock of interest and a plurality of subblocks adjacent to the subblock, and data in which the first index is arranged at a position corresponding to the position of each subblock, Horizontal processing data obtained by processing the first index of each of the plurality of sub-blocks by a horizontal filter that multiplies a preset numerical value, the sub-block of interest, and adjacent to the sub-block a plurality of sub-blocks by extracting the second index for the second index, the data are arranged in positions corresponding to the positions of the respective sub-blocks, each of said second plurality of sub-blocks Based on the vertical processing data obtained by processing each of the indicators by a vertical filter that multiplies a preset numerical value, A telop information output means for determining whether or not a telop is included in the sub-block to be noted, and outputting information indicating the determination result as a third index for specifying an area including the telop; Further, it can be provided.
前記テロップ情報出力手段は、前記水平処理データと、前記垂直処理データとに基づいて、斜処理データをさらに生成し、前記水平処理データの値が第1の閾値を超え、前記垂直処理データの値が第2の閾値を超え、かつ前記斜処理データの値が第3の閾値を超えた場合、前記注目するサブブロックに、テロップが含まれていると判定するようにすることができる。 The telop information output means further generates oblique processing data based on the horizontal processing data and the vertical processing data, the value of the horizontal processing data exceeds a first threshold value, and the value of the vertical processing data Exceeds the second threshold value and the value of the oblique processing data exceeds the third threshold value, it can be determined that the target sub-block contains a telop.
前記水平フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、水平方向のストライプ模様の画像が含まれる場合、高い値の前記水平処理データが得られるように、前記数値が設定され、前記垂直フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、垂直方向のストライプ模様の画像が含まれる場合、高い値の前記垂直処理データが得られるように、前記数値が設定されるようにすることができる。 In the horizontal filter, when the image of the stripe pattern in the horizontal direction is included in the sub-block of interest and a plurality of sub-blocks adjacent to the sub-block, the horizontal processing data having a high value is obtained. When a numerical value is set and the vertical filter includes an image of a stripe pattern in the vertical direction in the target sub-block and a plurality of sub-blocks adjacent to the sub-block, a high value of the vertical processing data is obtained. As described above, the numerical value can be set.
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置の検出方法であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出し、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出するステップを含む検出方法である。 One aspect of the present invention is a detection method of a detection device that detects information for specifying a region including a telop from input image data, and the image data is divided into N pixels in the horizontal direction. , Divided into a plurality of sub-blocks composed of M pixels in the vertical direction, and for each of the plurality of sub-blocks, an average value of pixel values of N pixels in the horizontal direction constituting the sub-block. An average value of M horizontal directions is calculated, and for each of the plurality of sub-blocks, an average value of pixel values of M pixels in the vertical direction constituting the sub-block, and N And calculating a difference between the maximum value and the minimum value among the M average values in the horizontal direction as a first index for specifying a region including the telop, N vertical directions The difference between the maximum value and the minimum value of the average value, is a detection method comprising the steps of calculating a second index for identifying a region including the telop.
本発明の一側面は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出処理をコンピュータに行わせるプログラムであって、コンピュータを、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部として機能させるプログラムである。 One aspect of the present invention is a program for causing a computer to perform detection processing for detecting information for specifying a region including a telop from input image data, the computer performing horizontal processing on the image data. Dividing means for dividing into a plurality of sub-blocks composed of N pixels in the direction and M pixels in the vertical direction, and for each of the plurality of sub-blocks, each of N in the horizontal direction constituting the sub-block Horizontal average value calculating means for calculating M average values in the horizontal direction, and for each of the plurality of sub-blocks, M in the vertical direction constituting each of the sub-blocks. A vertical average value calculating means for calculating an average value in N vertical directions, and a maximum value among the M horizontal average values; A horizontal index calculation unit that calculates a difference between the minimum values as a first index for specifying a region including the telop; and a difference between the maximum value and the minimum value among the N average values in the vertical direction. , A program that functions as a vertical index calculation unit that calculates a second index for specifying a region including the telop.
本発明の一側面においては、画像データが、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割され、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値が算出され、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値が算出され、前記M個の水平方向の平均値の中の最大値と最小値の差が、前記テロップが含まれる領域を特定するための第1の指標として算出され、前記N個の垂直方向の平均値の中の最大値と最小値の差が、前記テロップが含まれる領域を特定するための第2の指標として算出される。 In one aspect of the present invention, the image data is divided into a plurality of sub-blocks each composed of N pixels in the horizontal direction and M pixels in the vertical direction, and for each of the plurality of sub-blocks, An average value of pixel values of each of N pixels in the horizontal direction constituting the sub-block, and an average value in M horizontal directions is calculated, and each of the plurality of sub-blocks constitutes the sub-block. An average value of pixel values of each of M pixels in the vertical direction, N average values in the vertical direction are calculated, and a difference between the maximum value and the minimum value among the M horizontal average values is calculated. , Calculated as a first index for specifying the region including the telop, and the difference between the maximum value and the minimum value among the N average values in the vertical direction specifies the region including the telop. As a second indicator for It is calculated.
本発明によれば、入力画像のシャープネス特性に対してロバストなエッジ検出を、より少ない計算量で実現できる。 According to the present invention, edge detection that is robust to the sharpness characteristic of an input image can be realized with a smaller amount of calculation.
以下に本発明の実施の形態を説明するが、本発明の構成要件と、明細書または図面に記載の実施の形態との対応関係を例示すると、次のようになる。この記載は、本発明をサポートする実施の形態が、明細書または図面に記載されていることを確認するためのものである。従って、明細書または図面中には記載されているが、本発明の構成要件に対応する実施の形態として、ここには記載されていない実施の形態があったとしても、そのことは、その実施の形態が、その構成要件に対応するものではないことを意味するものではない。逆に、実施の形態が構成要件に対応するものとしてここに記載されていたとしても、そのことは、その実施の形態が、その構成要件以外の構成要件には対応しないものであることを意味するものでもない。 Embodiments of the present invention will be described below. Correspondences between constituent elements of the present invention and the embodiments described in the specification or the drawings are exemplified as follows. This description is intended to confirm that the embodiments supporting the present invention are described in the specification or the drawings. Therefore, even if there is an embodiment which is described in the specification or the drawings but is not described here as an embodiment corresponding to the constituent elements of the present invention, that is not the case. It does not mean that the form does not correspond to the constituent requirements. Conversely, even if an embodiment is described here as corresponding to a configuration requirement, that means that the embodiment does not correspond to a configuration requirement other than the configuration requirement. It's not something to do.
本発明の一側面の検出装置は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段(例えば、図5の領域抽出部201)と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段(例えば、図6の演算器221)と、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段(例えば、図6の演算器222)と、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標(例えば、水平方向エッジ強度)として算出する水平指標算出部(例えば、図6演算器241)と、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標(例えば、垂直方向エッジ強度)として算出する垂直指標算出部(例えば、図6演算器242)とを備える。
A detection device according to one aspect of the present invention is a detection device that detects information for specifying a region including a telop from input image data, and the image data is divided into N pixels in the horizontal direction. Dividing means (for example, the
この検出装置は、注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第1の指標を抽出して、前記第1の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータ(例えば、図7のデータh0)を、前記複数のサブブロックのそれぞれの前記第1の指標に対して、それぞれ予め設定された数値を乗じる水平フィルタ(例えば、図7の水平フィルタ262)により処理して得られる水平処理データ(例えば、図7のデータh1)と、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータ(例えば、図7のデータv0)を、前記複数のサブブロックのそれぞれの前記第2の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタ(例えば、図7の垂直フィルタ261)により処理して得られる垂直処理データ(例えば、図7のデータv1)とに基づいて、前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段(例えば、図5のテロップ領域検出部203)をさらに備えるようにすることができる。
The detection apparatus extracts the first index for a target sub-block and a plurality of sub-blocks adjacent to the sub-block, and sets the first index to a position corresponding to the position of each sub-block. A horizontal filter (for example, the
本発明の一側面の検出方法は、入力された画像データから、テロップが含まれる領域を特定するための情報を検出する検出装置の検出方法であって、前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し(例えば、図10のステップS101の処理)、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し(例えば、図11のステップS121の処理)、前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し(例えば、図11のステップS123の処理)、前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標(例えば、水平方向エッジ強度)として算出し、前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標(例えば、垂直方向エッジ強度)として算出する(例えば、図11のステップS125とS126の処理)ステップを含む。 A detection method according to one aspect of the present invention is a detection method of a detection device that detects information for specifying a region including a telop from input image data, and the image data is respectively N in the horizontal direction. It is divided into a plurality of sub-blocks composed of M pixels and M pixels in the vertical direction (for example, the process of step S101 in FIG. 10), and the horizontal lines that constitute the sub-blocks for each of the plurality of sub-blocks. An average value of pixel values of N pixels in each direction, and an average value in M horizontal directions is calculated (for example, the process of step S121 in FIG. 11). For each of the plurality of sub-blocks, An average value of pixel values of each of M pixels in the vertical direction constituting the sub-block, and an average value in N vertical directions is calculated (for example, processing in step S123 of FIG. 11). A difference between a maximum value and a minimum value among the M average values in the horizontal direction is calculated as a first index (for example, horizontal edge strength) for specifying a region including the telop, and the N The difference between the maximum value and the minimum value among the average values in the vertical direction is calculated as a second index (for example, vertical edge strength) for specifying the region including the telop (for example, FIG. 11). Steps S125 and S126).
以下、図面を参照して、本発明の実施の形態について説明する。 Embodiments of the present invention will be described below with reference to the drawings.
最初に従来のテロップの検出の処理について説明する。 First, conventional telop detection processing will be described.
画像の中に含まれるテロップを検出する場合、従来より、画像の中の所定の領域のエッジを検出し、検出されたエッジの強度などを表す情報に基づいてその領域にテロップが含まれているか否かを判定する方式が用いられている。通常、文字であるテロップは、ストロークの組み合わせにより構成されており、例えば、ストライプ模様の画像のように、エッジが繰り返し出現することが多いからである。 When detecting a telop included in an image, whether or not a telop is included in the area based on information indicating the edge strength of the detected edge, etc. A method of determining whether or not is used. This is because a telop that is a character is usually composed of a combination of strokes, and for example, an edge often appears repeatedly like a striped pattern image.
図1は、従来、テロップを検出するために行われていたエッジ検出の例を説明する図である。同図においては、Sobelフィルタが用いられている。 FIG. 1 is a diagram for explaining an example of edge detection that is conventionally performed to detect a telop. In the figure, a Sobel filter is used.
図1において、テロップを検出すべき画像は、水平方向および垂直方向に複数の画素で構成されるサブブロックと呼ばれる領域に分割されてSobelフィルタに入力される。この例では、矩形の領域に配置された所定の数の画素で構成されたサブブロックがSobelフィルタに入力されている。 In FIG. 1, an image for detecting a telop is divided into regions called sub-blocks composed of a plurality of pixels in the horizontal direction and the vertical direction, and is input to a Sobel filter. In this example, a sub-block composed of a predetermined number of pixels arranged in a rectangular area is input to the Sobel filter.
Sobelフィルタは、水平フィルタ21と垂直フィルタ22を有する構成とされ、入力されたサブブロックの中の注目画素と、注目画素に隣接する複数の画素の画素値に、それぞれ各フィルタに記載された数値が、乗算器31と乗算器32によってそれぞれ乗じられるようになされている。この例では、水平フィルタ21と垂直フィルタ22は、それぞれ中央の画素が注目画素とされ、注目画素に隣接する8つの画素に対応する構成とされている。このような、水平フィルタ21と垂直フィルタ22、および乗算器31と乗算器32による処理が、サブブロックの画素のそれぞれに対して行われる。
The Sobel filter is configured to include a
そして、水平フィルタ21と垂直フィルタ22、および乗算器31と乗算器32による処理を経たサブロックの画素のそれぞれに対して閾値判定部41および閾値判定部42による閾値判定の処理が行われる。これにより、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素が検出されることになる。
Then, threshold determination processing by the threshold determination unit 41 and the
さらに、集計器51および集計器52によって、水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素のそれぞれの合計値が検出され、その合計値が水平方向のエッジ強度および垂直方向のエッジ強度として出力される。
Further, the
このようにして得られた、水平方向のエッジ強度および垂直方向のエッジ強度に基づいて、そのサブブロックにテロップが含まれているか否かの判定が行われる。 Based on the edge strength in the horizontal direction and the edge strength in the vertical direction thus obtained, it is determined whether or not a telop is included in the sub-block.
しかしながら、図1を参照して上述した方式では、テロップが含まれているか否かを正確に検出できないことがある。 However, the method described above with reference to FIG. 1 may not accurately detect whether a telop is included.
図2は、テロップが含まれた画像の例を示す図である。同図に示される画像100においては、領域101と領域102にそれぞれテロップが表示されているが、領域101に表示されるテロップは、高解像度(HD(high definition))の画像として表示されるテロップであり、領域102に表示されるテロップは、HD画像より低い標準解像度(SD(Standard Definition))の画像として表示されるテロップである。
FIG. 2 is a diagram illustrating an example of an image including a telop. In the
すなわち、画像100は、HDの画像とSDの画像が混在する画像とされ、このような画像は、例えば、HDの画像として収録された素材に対してテロップの編集が行われた画像、またはSDの画像をHDに変換(アップコンバート)した画像などにおいて近年多く見受けられる。
That is, the
SDのテロップと、HDのテロップとが混在する画像においては、輪郭部が強調されたシャープネスの高い画像であるHD画像の素材の中から、輪郭が比較的曖昧なSD画像のテロップを検出することになり、従来の方式では、適切にテロップを検出することができない。 In an image in which SD telops and HD telops are mixed, SD image telops with relatively vague outlines are detected from HD image materials with high sharpness and enhanced outlines. Therefore, the conventional method cannot detect the telop properly.
すなわち、シャープネスの高い画像であるHD画像において、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素を検出する場合、図1の閾値判定部41および閾値判定部42にある程度高い閾値を設定しなければ、エッジとは関係ない画素までエッジを構成する画素として検出されてしまう。また、シャープネスの低い画像であるSD画像において、サブブロックの各画素について水平方向および垂直方向のそれぞれについてエッジを構成していると考えられる画素を検出する場合、図1の閾値判定部41および閾値判定部42にある程度低い閾値を設定しなければ、エッジ構成する画素であるにも係らず検出されない画素が増えてしまう。
That is, when detecting a pixel considered to constitute an edge in each of the horizontal direction and the vertical direction for each pixel of the sub-block in an HD image that is an image with high sharpness, the threshold value determination unit 41 and the threshold value in FIG. Unless a threshold value that is high to some extent is set in the
図3と図4は、図1を参照して上述した従来の方式により、HDの画像とSDの画像が混在する画像のエッジ検出を行う場合の問題点を説明する図である。 FIGS. 3 and 4 are diagrams for explaining problems in the case of performing edge detection of an image in which an HD image and an SD image are mixed according to the conventional method described above with reference to FIG.
図3は、従来の方式により、例えば、領域101の一部のHD画像のサブブロック141と、領域102の一部のSD画像のサブブロック142について、垂直方向のエッジ強度を検出する例を示しており、閾値判定部42にHD画像に適した閾値を設定した場合の例を示す図である。
FIG. 3 shows an example in which the edge strength in the vertical direction is detected by a conventional method, for example, for a sub-block 141 of a part of the HD image in the
サブブロック141には、例えば、文字の一部が図中左から数えて第10列目乃至第18列目の各画素で表示されており、第1列目乃至第9列目の各画素はその文字の背景を表示している。サブブロック141は、HD画像であり、文字の一部は、黒色で明確に表示され、背景は白色で明確に表示されている。 In the sub-block 141, for example, a part of the characters is displayed by the pixels in the 10th to 18th columns counting from the left in the figure, and the pixels in the 1st to 9th columns are The background of the character is displayed. The sub-block 141 is an HD image, and some characters are clearly displayed in black and the background is clearly displayed in white.
一方、サブブロック142は、SD画像であり、文字の一部と、背景との境界(エッジ)が曖昧に表示される。この例では、図中左から第7列目乃至第12列目の各画素が黒色でもなく、白色でもない色(図中のハッチング)として表示されている。 On the other hand, the sub-block 142 is an SD image, and a boundary (edge) between a part of a character and the background is displayed in an ambiguous manner. In this example, each pixel in the seventh to twelfth columns from the left in the figure is displayed as a color that is neither black nor white (hatching in the figure).
サブブロック141およびサブブロック142に対して、上述した垂直フィルタ22、および乗算器32による処理を施し、HD画像に適した閾値を設定した閾値判定部42による閾値判定の処理が行われた場合、図3の垂直フィルタ22の右側において、図中黒い四角形で表示された画素が、垂直方向にエッジを構成すると考えられる画素として検出されることになる。
When the threshold determination processing is performed on the sub-block 141 and the sub-block 142 by the
図3の場合、閾値判定部42にHD画像に適した閾値が設定されているので、サブブロック141においては、文字の一部と背景との境界に当たる画素であって、第9列目と第10列目の画素が全てエッジを構成する画素として検出されている。これにより、サブブロック141の垂直方向のエッジ強度は、第9列目と第10列目の画素数の合計値である「8」となる。
In the case of FIG. 3, since a threshold suitable for an HD image is set in the
しかしながら、SD画像のサブブロック142においては、第7列目乃至第12列目の各画素が白色から黒色に序々に変化していくため、HD画像に適した閾値が設定された閾値判定部42の閾値判定では、エッジを構成する画素として検出される画素がない。これにより、サブブロック142の垂直方向のエッジ強度は、「0」となってしまう。
However, in the sub-block 142 of the SD image, each pixel in the seventh column to the twelfth column gradually changes from white to black, so that the
図4は、従来の方式により、例えば、領域101の一部のHD画像のサブブロック141と、領域102の一部のSD画像のサブブロック142について、垂直方向のエッジ強度を検出する例を示しており、閾値判定部42にSD画像に適した閾値を設定した場合の例を示す図である。
FIG. 4 shows an example in which vertical edge strength is detected by using a conventional method, for example, for a sub-block 141 of a part of the HD image in the
図3の場合と同様に、サブブロック141およびサブブロック142に対して、上述した垂直フィルタ22、および乗算器32による処理を施し、SD画像に適した閾値を設定した閾値判定部42による閾値判定の処理が行われた場合、図4の垂直フィルタ22の右側において、図中黒い四角形で表示された画素が、垂直方向にエッジを構成すると考えられる画素として検出されることになる。
As in the case of FIG. 3, threshold determination by the
図4の場合、閾値判定部42にSD画像に適した閾値が設定されているので、サブブロック142においては、文字の一部と背景との境界に当たる画素であって、第7列目乃至第12列目の画素が全てエッジを構成する画素として検出されている。これにより、サブブロック142の垂直方向のエッジ強度は、第7列目乃至第12列目の画素数の合計値である「24」となる。
In the case of FIG. 4, since a threshold suitable for the SD image is set in the
しかしながら、HD画像のサブブロック141においては、第9列目と第10列目の間のみ画素の色が変化しているため、閾値判定部42の閾値判定では、エッジを構成する画素として検出される画素は、第9列目と第10列目の画素のみがエッジを構成する画素として検出される。これにより、サブブロック141の垂直方向のエッジ強度は、「8」となってしまう。
However, in the
このように、従来の方式では、閾値判定部42の閾値をHD画像に適したものとすると、SD画像では全くエッジが検出されなくなり、閾値をSD画像に適したものとすると、HD画像の場合よりSD画像の場合の方が、より大きなエッジ強度となってしまう。
As described above, in the conventional method, if the threshold value of the
なお、図3と図4では、説明を簡単にするために垂直方向のエッジ強度についてのみ説明したが、水平方向のエッジ強度も同様に、やはり従来の方式では正確に検出することが困難である。 3 and 4, only the edge strength in the vertical direction has been described for the sake of simplicity, but the edge strength in the horizontal direction is also difficult to accurately detect with the conventional method. .
さらに、HDの画像においては、画像のシャープネスが高いため、例えば、石や砂などのように、色の濃い画素が粒状に表示されている画像において、これらの画素がエッジを構成する画素として誤って検出されてしまうことがある。 In addition, since the sharpness of an image is high in an HD image, for example, in an image in which dark-colored pixels are displayed in a granular shape such as stone or sand, these pixels are mistaken as pixels constituting an edge. May be detected.
例えば、図2の領域103は、石造りの壁の一部が表示された画像であり、細かい粒状の模様が表示されている。このような画像も誤ってエッジとして検出されることがある。
For example, a
そこで、本発明においては、SD画像とHD画像が混在する画像においても適切にテロップを検出できるようにし、さらに、細かい粒状の模様などが表示された画像が誤ってエッジとして検出されないようにする。 Therefore, in the present invention, it is possible to appropriately detect a telop even in an image in which an SD image and an HD image are mixed, and further, an image on which a fine grain pattern or the like is displayed is not erroneously detected as an edge.
図5は、本発明の一実施の形態に係るテロップ検出装置の構成例を示すブロック図である。この例では、テロップ検出装置200が、領域抽出部201、サブブロックエッジ検出部202、テロップ領域検出部203、および制御部204により構成されており、例えば、バスなどにより、領域抽出部201乃至制御部204が相互に接続された構成とされている。
FIG. 5 is a block diagram illustrating a configuration example of the telop detection device according to the embodiment of the present invention. In this example, the
同図において、領域抽出部201は、例えば、制御部204を介して入力が受け付けられた画像データの画像において、テロップを検出すべき領域を抽出し、さらにその領域を、テロップの検出に適したサブブロックに分割する。
In the figure, an
サブブロックエッジ検出部202は、例えば、制御部204を介して、領域抽出部201により分割されたサブブロックの画像データの供給を受けて、サブブロックの、水平方向および垂直方向のエッジ強度をそれぞれ検出する。
For example, the sub-block
テロップ領域検出部203は、サブブロックエッジ検出部202により水平方向および垂直方向のエッジ強度のそれぞれが検出された複数のサブブロックからなるデータを、例えば、制御部204を介して取得し、その複数の各サブブロックがテロップを含むサブブロックであるか否かを判定し、テロップを含むサブブロックであると判定されたサブブロックからなる領域に関する情報を出力するようになされている。
The telop
制御部204は、例えば、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを含む構成とされ、例えば、図示せぬ操作部などを介して入力が受け付けられたユーザの指令、予めROMなどに記憶されているプログラムなどのソフトウェアなどに基づいて、テロップ検出装置200の各部を制御するようになされている。
The
図6は、図5のサブブロックエッジ検出部202の詳細な構成例を示す図である。ここでは、サブブロックとして、水平方向に8画素、垂直方向に4画素の32画素で構成される画像データがサブブロック220として供給された場合を例として、サブブロックエッジ検出部202の詳細な構成について説明する。
FIG. 6 is a diagram illustrating a detailed configuration example of the sub-block
同図に示されるように、サブブロックエッジ検出部202は、供給されたサブブロック220の水平方向の図中上から第1行目乃至第4行目の、それぞれ8個の画素の画素値の平均値を演算器221により、それぞれ演算する。すなわち、演算器221により、サブブロック220の第1行目の8つの画素の画素値の平均値、第2行目の8つの画素の画素値の平均値、第3行目の8つの画素の画素値の平均値、および第4行目の8つの画素の画素値の平均値がそれぞれ演算される。ここで演算された値を、水平方向の4つの平均値と称することとする。
As shown in the figure, the sub-block
また、サブブロックエッジ検出部202は、供給されたサブブロック220の垂直方向の図中左から第1列目乃至第8列目の、それぞれ4個の画素の画素値の平均値を演算器222により、それぞれ演算する。すなわち、演算器222により、サブブロック220の第1列目の4つの画素の画素値の平均値、第2列目の4つの画素の画素値の平均値、第3列目の4つの画素の画素値の平均値、・・・および第8列目の4つの画素の画素値の平均値がそれぞれ演算される。ここで演算された値を、垂直方向の8つの平均値と称することとする。
In addition, the sub-block
サブブロックエッジ検出部202は、水平方向の4つの平均値のうちの最小値を、最小値抽出部231により抽出し、水平方向の4つの平均値のうちの最大値を、最大値抽出部232により抽出する。また、サブブロックエッジ検出部202は、垂直方向の8つの平均値のうちの最小値を、最小値抽出部233により抽出し、垂直方向の8つの平均値のうちの最大値を、最大値抽出部234により抽出する。
The sub-block
そして、サブブロックエッジ検出部202は、最小値抽出部231により抽出された最小値と、最大値抽出部232により抽出された最大値の差を演算器241により演算し、その結果得られた値を水平方向のエッジ強度として出力する。同様に、サブブロックエッジ検出部202は、最小値抽出部233により抽出された最小値と、最大値抽出部234により抽出された最大値の差を演算器242により演算し、その結果得られた値を垂直方向のエッジ強度として出力する。
Then, the sub-block
このように、サブブロックを構成する各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、例えば、図3と図4のサブブロック142の場合のように、白色から黒色に序々に変化していく曖昧な画像であっても、適切なエッジ強度を算出することができるし、勿論、サブブロック141の場合のように、白色から黒色に急峻に変化する(シャープネスの高い)画像であっても、適切なエッジ強度を算出することができる。従って、サブブロックエッジ検出部202によれば、SD画像であっても、HD画像であってもエッジ部分のサブブロックでは、ほぼ同じエッジ強度を検出することが可能となる。
In this way, a plurality of average values in the horizontal direction and the vertical direction of each pixel constituting the sub block are calculated, and the difference between the maximum value and the minimum value is set as the edge strength in the horizontal direction and the vertical direction, respectively. Thus, for example, even in the case of an ambiguous image that gradually changes from white to black as in the case of the sub-block 142 in FIGS. 3 and 4, an appropriate edge strength can be calculated. As in the case of the sub-block 141, an appropriate edge strength can be calculated even for an image that sharply changes from white to black (high sharpness). Therefore, according to the sub-block
さらに、サブブロックを構成する各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、例えば、図2の領域103に示されるような、細かい粒状の模様が表示された画像などが誤ってエッジとして検出されることが抑止されるようにすることも可能となる。例えば、白色の背景に黒色の点が規則的に散りばめられた画像のサブブロックにおいて、各画素の水平方向(または垂直方向)の1行分の全画素(または1列分の全画素)の画素値の平均値を算出すると、どの行(または列)においても、灰色の画素の画素値と同様の値となり、それらの複数の平均値の最大値と最小値の差はほぼ「0」となるからである。
Furthermore, by calculating a plurality of average values in the horizontal direction and vertical direction of each pixel constituting the sub-block, the difference between the maximum value and the minimum value as the edge strength in the horizontal direction and vertical direction, respectively, For example, it is possible to prevent an image or the like on which a fine granular pattern is displayed as shown in the
また、このようにすることで、演算量を抑制することも可能となる。例えば、図1を参照して上述したsobelフィルタにおいては、水平フィルタ21と垂直フィルタ22を通すことで、水平フィルタ21と垂直フィルタ22の中の値が0でない位置における演算が行われて、1個の画素について合計12(=6+6)回の乗算処理が必要となるが、各画素の水平方向および垂直方向の複数個の平均値を算出し、それらの最大値と最小値の差を、それぞれ水平方向および垂直方向のエッジ強度とすることで、個々の画素に対して行われる演算量を少なくすることも可能となる。
In addition, by doing so, it is also possible to suppress the calculation amount. For example, in the sobel filter described above with reference to FIG. 1, by passing through the
ここでは、サブブロックとして、水平方向に8画素、垂直方向に4画素の32画素で構成される画像データが供給される例について説明したが、テロップを検出するために、エッジの検出を行う場合、サブブロックの水平方向および垂直方向の画素数は、それぞれ検出すべきテロップの文字のストロークの太さに対応する画素数とすることが望ましい。 Here, an example has been described in which image data composed of 32 pixels of 8 pixels in the horizontal direction and 4 pixels in the vertical direction is supplied as a sub-block. However, in the case of detecting edges in order to detect telops The number of pixels in the horizontal and vertical directions of the sub-block is preferably set to the number of pixels corresponding to the thickness of the telop character stroke to be detected.
また、サブブロックの一部がそれぞれ重複(オーバーラップ)するようになされてもよい。例えば、第n番目のサブブロックを構成する複数の画素の一部が、第n+1番目のサブブロックの画素として用いられるようにサブブロックの分割が行われるようにしてもよい。 Further, a part of the sub-blocks may be overlapped (overlapped). For example, the subblock may be divided so that some of the plurality of pixels constituting the nth subblock are used as pixels of the (n + 1) th subblock.
図7は、図5のテロップ領域検出部203の詳細な構成例を示す図である。
FIG. 7 is a diagram illustrating a detailed configuration example of the telop
上述したように、テロップ領域検出部203は、サブブロックエッジ検出部202により水平方向および垂直方向のエッジ強度のそれぞれが検出された複数のサブブロックからなるデータを、例えば、制御部204を介して取得する。この例では、水平方向に3個、垂直方向に3個の9個のサブブロックで構成されたデータv0とデータh0が取得されている。
As described above, the telop
データv0は、例えば、それぞれのサブブロックの位置に、それぞれのサブブロックの垂直方向のエッジ強度の値のみが埋め込まれた3行3列の行列のデータとして取得され、データh0は、例えば、それぞれのサブブロックの位置に、それぞれのサブブロックの水平方向のエッジ強度の値のみが埋め込まれた、3行3列の行列のデータとして取得される。 The data v0 is acquired, for example, as data of a 3 × 3 matrix in which only the value of the vertical edge strength of each subblock is embedded at the position of each subblock, and the data h0 is, for example, Is obtained as matrix data of 3 rows and 3 columns in which only the values of the edge strengths in the horizontal direction of the respective sub blocks are embedded at the positions of the sub blocks.
テロップ領域検出部203は、垂直フィルタ261と水平フィルタ262を有する構成とされ、入力されたデータv0とデータh0の各値に、それぞれ垂直フィルタ261と水平フィルタ262に記載された数値が、乗算器271と乗算器272によってそれぞれ乗じられるようになされている。
The telop
例えば、データv0の図中左から第1列目の3つの値には、それぞれ垂直フィルタ261の図中左から第1列目の値である「1、1、1」がそれぞれ乗じられ、データv0の第2列目の3つの値には、それぞれ垂直フィルタ261の第2列目の値である「2、2、2」がそれぞれ乗じられ、データv0の第3列目の3つの値には、それぞれ垂直フィルタ261の第3列目の値である「1、1、1」がそれぞれ乗じられる。さらに、それぞれの数値が乗じられた9つの値の合計値が、垂直方向エッジ指数として乗算器271により算出される。
For example, the three values in the first column from the left in the figure of the data v0 are respectively multiplied by “1, 1, 1” that are the values in the first column from the left in the figure of the
なお、この垂直方向エッジ指数は、データv0の中央の位置であって、第2行第2列目のサブブロックに対応する垂直方向エッジ指数として算出される。 The vertical edge index is calculated as a vertical edge index corresponding to the sub-block in the second row and the second column at the center position of the data v0.
また、データh0の図中上から第1行目の3つの値には、それぞれ水平フィルタ262の図中上から第1行目の値である「1、1、1」がそれぞれ乗じられ、データh0の第2列目の3つの値には、それぞれ水平フィルタ262の第2行目の値である「2、2、2」がそれぞれ乗じられ、データh0の第3行目の3つの値には、それぞれ水平フィルタ262の第3行目の値である「1、1、1」がそれぞれ乗じられる。さらに、それぞれの数値が乗じられた9つの値の合計値が、水平方向エッジ指数として乗算器272により算出される。
The three values in the first row from the top of the data h0 in the figure are respectively multiplied by “1, 1, 1” which is the value in the first row from the top in the drawing of the
なお、この水平方向エッジ指数は、やはりデータh0の中央の位置であって、第2行第2列目のサブブロックに対応する水平方向エッジ指数として算出される。 This horizontal edge index is also calculated as a horizontal edge index corresponding to the second row and second column sub-block, which is also the center position of the data h0.
テロップ領域検出部203において、垂直方向エッジ指数は、データv1として閾値判定部281に供給される。閾値判定部281は、データv1の値が予め設定された縦閾値より大きいか否かを判定し、例えば、データv1の値が予め設定された縦閾値より大きいと判定された場合、値「1」を出力し、データv1の値が縦閾値より大きくないと判定された場合、値「0」を出力するようになされている。
In the telop
また、テロップ領域検出部203において、垂直方向エッジ指数は、データh1として閾値判定部283に供給される。閾値判定部283は、データh1の値が予め設定された横閾値より大きいか否かを判定し、例えば、データh1の値が予め設定された横閾値より大きいと判定された場合、値「1」を出力し、データh1の値が予め設定された横閾値より大きくないと判定された場合、値「0」を出力するようになされている。
In the telop
さらに、テロップ領域検出部203において、データv1とデータh1は、加算器273により加算され、データd1として閾値判定部282に供給される。データd1は、いわば斜方向エッジ指数を表すことになる。閾値判定部282は、データd1の値が予め設定された斜閾値より大きいか否かを判定し、例えば、データd1の値が予め設定された斜閾値より大きいと判定された場合、値「1」を出力し、データd1の値が予め設定された斜閾値より大きくないと判定された場合、値「0」を出力するようになされている。
Further, in the telop
そして、論理積演算器291が、閾値判定部281乃至閾値判定部283の出力値の論理積を演算して出力する。例えば、論理積演算器291の演算結果が値「1」の場合、注目するサブブロック(データv0(h0)の第2行第2列目のサブブロック)は、テロップのサブブロックであるものとして、テロップ領域検出部203の検出結果が出力される。論理積演算器291の演算結果が値「0」の場合、注目するサブブロック(データv0(h0)の第2行第2列目のサブブロック)は、テロップのサブブロックではないものと判定される。
Then, the
なお、垂直フィルタ261と水平フィルタ262は、それぞれ垂直方向のストライプ模様と、水平方向のストライプ模様を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値となるように設定されており、例えば、垂直方向の一本線と、水平方向の一本線を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値とならないように設定されている。テロップは、ストライプ模様の画像を構成することが多いからである。
Note that the
例えば、図8(a)に示されるように「川」という文字が表示されたテロップについて考える。同図に示される「川」の文字は、黒線の囲み文字(白抜き文字)として表示されており、図中中央付近を矢印311で示されるように、画素の輝度の変化を調べると、図8(b)に示されるグラフのようになる。
For example, consider a telop on which characters “river” are displayed as shown in FIG. The character “river” shown in the figure is displayed as a black-lined encircled character (outlined character). When the change in the luminance of the pixel is examined as indicated by an
すなわち、文字の白抜き部分では輝度が極めて高くなり、文字の黒線の部分では輝度が極めて低くなる。また、文字の背景の部分では、白抜き部分と黒線の部分の中間程度の輝度となる。このように、文字「川」の周辺においては、画素の輝度値が12回変化し、あたかもストライプ模様の画像と同様の輝度の変化の特性が見られることになる。 That is, the brightness is extremely high in the white portion of the character, and the brightness is extremely low in the black line portion of the character. In the background portion of the character, the luminance is about halfway between the white portion and the black line portion. As described above, in the vicinity of the character “river”, the luminance value of the pixel changes 12 times, and the same luminance change characteristic as in the stripe pattern image is seen.
これに対して、テロップではない物体などの画像では、上述したような特性は見られない。図9(a)は、図中右側略半分に暗い色の物体が表示された画像の例を示している。このような画像において、図8(a)の場合と同様に、図中中央付近を矢印312で示されるように、画素の輝度の変化を調べると、図9(b)に示されるグラフのようになる。
On the other hand, the above-described characteristics are not seen in an image such as an object that is not a telop. FIG. 9A shows an example of an image in which a dark-colored object is displayed in approximately the right half of the drawing. In such an image, as in the case of FIG. 8A, when the change in the luminance of the pixel is examined as indicated by the
すなわち、物体の背景が表示された部分では輝度が高くなり、物体が表示された部分では輝度が低くなる。このように、テロップではなく、単に輝度の異なる物体などが表示された画像の周辺においては、画素の輝度値が1回変化し、あたかも一本線の画像と同様の輝度の変化の特性が見られることになる。 That is, the luminance is high in the portion where the background of the object is displayed, and the luminance is low in the portion where the object is displayed. In this way, the brightness value of the pixel changes once in the periphery of an image on which an object with different brightness is displayed instead of a telop, and the same brightness change characteristic as that of a single line image can be seen. It will be.
垂直フィルタ261は、自分(注目するサブブロック)とその周辺のサブブロックにおいて、例えば、図8(b)に示されるような輝度の変化の特性を有するサブブロックの垂直方向エッジ指数が高い値となるように設定されており、例えば、自分とその周辺のサブブロックにおいて、例えば、図9(b)に示されるような輝度の特性を有するサブブロックの垂直方向エッジ指数が高い値とならないように設定されている。
For example, the
そして、閾値判定部281も、サブブロックの垂直方向エッジ指数が高い値の場合のみ、値「1」を出力するようになされている。
The
ここでは、例として垂直方向のストライプ模様について説明したが、画像の中で文字が表示された領域においては、水平方向にも、やはりあたかもストライプ模様の画像と同様の特性が見られる。従って、水平フィルタ262も、あたかもストライプ模様の画像と同様の輝度の変化の特性を有するサブブロックの水平方向エッジ指数が高い値となるように設定されており、あたかも一本線の画像と同様の輝度の変化の特性を有するサブブロックの水平方向エッジ指数が高い値とならないように設定されており、閾値判定部283も、サブブロックの水平方向エッジ指数が高い値の場合のみ、値「1」を出力するようになされている。
Here, the vertical stripe pattern has been described as an example, but in the region where characters are displayed in the image, the same characteristics as in the stripe pattern image are also seen in the horizontal direction. Accordingly, the
さらに、閾値判定部282も同様に、サブブロックの垂直方向のエッジ指数(データv1)と水平方向エッジ指数(データh1)の加算値(データd1)が高い値の場合のみ、値「1」を出力するようになされている。
Similarly, the
なお、垂直フィルタ261と水平フィルタ262の設定は、それぞれ垂直方向のストライプ模様、または水平方向のストライプ模様を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値となり、垂直方向の一本線、または水平方向の一本線を含むサブブロックについて垂直方向エッジ指数、または水平方向エッジ指数が高い値とならないようにするものであれば、図7に示されたものとは異なる設定とされるようにしてもよい。
Note that the
次に、図10のフローチャートを参照して、テロップ検出装置200によるテロップ検出処理について説明する。
Next, telop detection processing by the
ステップS101において、領域抽出部201は、画像をサブブロックに分割する。このとき、領域抽出部201は、例えば、制御部204を介して入力が受け付けられた画像データの画像において、テロップを検出すべき領域を抽出し、さらにその領域を、テロップの検出に適したサブブロックに分割する。
In step S101, the
ステップS102において、サブブロックエッジ検出部202は、ステップS201の処理で分割された各サブブロックについて、図11を参照して後述するサブブロックエッジ検出処理を実行する。これにより、各サブブロックの水平方向エッジ強度と、垂直方向エッジ強度とが算出される。
In step S102, the sub-block
ここで、図11のフローチャートを参照して、図10のステップS102のサブブロックエッジ検出処理の詳細の例について説明する。 Here, an example of details of the sub-block edge detection process in step S102 of FIG. 10 will be described with reference to the flowchart of FIG.
ステップS121において、サブブロックエッジ検出部202は、供給されたサブブロックの水平方向の各行の画素値の平均値を演算器221により、それぞれ演算する。
In step S <b> 121, the sub-block
ステップS122において、サブブロックエッジ検出部202は、ステップS121の処理で演算された水平方向の各行の画素値の平均値のそれぞれについて最大値と最小値を求める。
In step S122, the sub-block
このとき、例えば、図6を参照して上述したように、供給されたサブブロック220の水平方向の第1行目乃至第4行目の、それぞれ8個の画素の画素値の平均値を演算器221により、それぞれ演算され、水平方向の4つの平均値のうちの最小値が、最小値抽出部231により抽出され、水平方向の4つの平均値のうちの最大値が、最大値抽出部232により抽出される。
At this time, for example, as described above with reference to FIG. 6, the average value of the pixel values of the eight pixels in the first to fourth rows in the horizontal direction of the supplied
ステップS123において、サブブロックエッジ検出部202は、供給されたサブブロックの垂直方向の各列の画素値の平均値を演算器222により、それぞれ演算する。
In step S123, the sub-block
ステップS124において、サブブロックエッジ検出部202は、ステップS123の処理で演算された垂直方向の各列の画素値の平均値のそれぞれについて最大値と最小値を求める。
In step S124, the sub-block
このとき、例えば、図6を参照して上述したように、供給されたサブブロック220の垂直方向の第1列目乃至第8列目の、それぞれ4個の画素の画素値の平均値が演算器222により、それぞれ演算され、垂直方向の8つの平均値のうちの最小値が、最小値抽出部233により抽出され、垂直方向の8つの平均値のうちの最大値が、最大値抽出部234により抽出される。
At this time, for example, as described above with reference to FIG. 6, the average value of the pixel values of the four pixels in the first to eighth columns in the vertical direction of the supplied
ステップS125において、サブブロックエッジ検出部202は、ステップS122の処理と、ステップS124の処理で求められたそれぞれの最大値と最小値の差を、それぞれ求める。
In step S125, the sub-block
このとき、例えば、図6を参照して上述したように、最小値抽出部231により抽出された最小値と、最大値抽出部232により抽出された最大値の差が演算器241により演算され、最小値抽出部233により抽出された最小値と、最大値抽出部234により抽出された最大値の差が演算器242により演算される。
At this time, for example, as described above with reference to FIG. 6, a difference between the minimum value extracted by the minimum
ステップS126において、サブブロックエッジ検出部202は、ステップS125の処理により得られた値を、当該サブブロックの水平方向のエッジ強度、または垂直方向のエッジ強度として出力する。
In step S126, the sub-block
このとき、例えば、図6を参照して上述したように、演算器241の演算結果の値が水平方向のエッジ強度とされ、演算器242の演算結果の値が垂直方向のエッジ強度とされて、サブブロック220の位置を表す情報などと対応付けられて出力される。
At this time, for example, as described above with reference to FIG. 6, the value of the calculation result of the
なお、上述したステップS121乃至S126は、サブブロックエッジ検出部202に供給される複数のサブブロックのそれぞれに対して実行され、複数のサブブロックのそれぞれの、水平方向のエッジ強度、または垂直方向のエッジ強度が出力されることになる。
Note that the above-described steps S121 to S126 are executed for each of the plurality of sub-blocks supplied to the sub-block
このようにして、サブブロックのエッジ強度が検出(算出)される。 In this way, the edge strength of the sub-block is detected (calculated).
図10に戻って、ステップS102の処理の後、ステップS103において、テロップ領域検出部203は、ステップS102の処理結果に基づいて、図12を参照して後述するテロップ領域検出処理を実行する。これにより、テロップのサブブロックに関する情報が出力される。
Returning to FIG. 10, after step S <b> 102, in step S <b> 103, the telop
ここで、図12のフローチャートを参照して、図10のステップS103のテロップ領域検出処理の詳細の例について説明する。 Here, an example of details of the telop area detection processing in step S103 in FIG. 10 will be described with reference to the flowchart in FIG.
ステップS151において、テロップ領域検出部203は、複数のサブブロックの水平方向のエッジ強度を抽出し、ステップS152において、複数のサブブロックの垂直方向のエッジ強度を抽出する。
In step S151, the telop
これにより、例えば、図7を参照して上述したように、それぞれのサブブロックの位置に、それぞれのサブブロックの垂直方向のエッジ強度の値のみが埋め込まれた行列のデータとしてデータv0が取得され、それぞれのサブブロックの位置に、それぞれのサブブロックの水平方向のエッジ強度の値のみが埋め込まれた行列のデータとしてデータh0が取得される。 As a result, for example, as described above with reference to FIG. 7, data v0 is acquired as matrix data in which only the value of the vertical edge strength of each sub-block is embedded at the position of each sub-block. The data h0 is obtained as matrix data in which only the edge strength values in the horizontal direction of the respective sub-blocks are embedded at the positions of the respective sub-blocks.
ステップS153において、テロップ領域検出部203は、フィルタ処理をする。
In step S153, the telop
このとき、例えば、図7を参照して上述したように、入力されたデータv0とデータh0の各値に、それぞれ垂直フィルタ261と水平フィルタ262に記載された数値が、乗算器271と乗算器272によってそれぞれ乗じられ、さらに、それぞれの数値が乗じられた9つの値の合計値が、垂直方向エッジ指数と水平方向エッジ指数として乗算器271と乗算器272により算出される。
At this time, for example, as described above with reference to FIG. 7, the numerical values described in the
なお、この水平方向エッジ指数と垂直方向エッジ指数は、データv0またはデータh0の中央の位置のサブブロックに対応する垂直方向エッジ指数(データv1)と水平方向エッジ指数(データh1)として算出される。 The horizontal edge index and the vertical edge index are calculated as the vertical edge index (data v1) and the horizontal edge index (data h1) corresponding to the sub-block at the center position of the data v0 or data h0. .
ステップS154において、テロップ領域検出部203は、縦、横、斜方向のストライプを検出する。
In step S154, the telop
このとき、例えば、図7を参照して上述したように、閾値判定部281により、データv1の値が予め設定された縦閾値より大きいか否かが判定され、例えば、データv1の値が予め設定された縦閾値より大きいと判定された場合、値「1」が出力され、データv1の値が縦閾値より大きくないと判定された場合、値「0」が出力される。同様に、閾値判定部283により、データh1の値が予め設定された横閾値と比較され、値「1」または値「0」が出力される。さらに、閾値判定部282により、データd1の値が予め設定された斜閾値と比較され、値「1」または値「0」が出力される。
At this time, for example, as described above with reference to FIG. 7, the threshold
ステップS155において、テロップ領域検出部203は、縦、横、斜の各方向にそれぞれストライプが検出されたか否かを判定する。例えば、図7の論理積演算器291が、閾値判定部281乃至閾値判定部283の出力値の論理積を演算し、その演算結果が値「1」である場合、縦、横、斜の各方向にそれぞれストライプが検出されたと判定し、処理はステップS156に進む。
In step S155, the telop
ステップS156において、テロップ領域検出部203は、当該サブブロックを、テロップのサブブロックであるものとして検出する。
In step S156, the telop
一方、ステップS155において、図7の論理積演算器291の演算結果が値「0」である場合、縦、横、斜の各方向にそれぞれストライプが検出されなかったと判定され、ステップS156の処理はスキップされて処理が終了する。
On the other hand, when the calculation result of the
このようにして、テロップのサブブロックが検出される。 In this way, the sub-block of the telop is detected.
図13と図14を参照して、本発明のテロップ検出装置200によるテロップの検出結果について説明する。
A telop detection result by the
図13は、画像の中に表示されているテロップの画像の特徴量の分布を説明するグラフである。同図は、図中横軸方向(x軸方向)が、図7を参照して上述したデータv1の値を表しており、図中縦軸方向(y軸方向)が図7を参照して上述したデータh1の値を表しており、それぞれのデータv1とデータh1の値のサブブロックにおいて、テロップが存在する確率の高さを、紙面と垂直となる軸方向(z軸方向)に表しており、同図に示される「20000」、「40000」などの数値は、テロップが存在する確率の高さを等高線として表すためのものである。 FIG. 13 is a graph for explaining the distribution of the feature amount of the telop image displayed in the image. In the figure, the horizontal axis direction (x-axis direction) in the figure represents the value of the data v1 described above with reference to FIG. 7, and the vertical axis direction (y-axis direction) in the figure refers to FIG. The value of the data h1 described above is represented, and in each of the data v1 and data h1 value sub-blocks, the probability of the presence of a telop is represented in the axial direction (z-axis direction) perpendicular to the paper surface. The numerical values such as “20000” and “40000” shown in the figure are for expressing the high probability of the presence of a telop as a contour line.
同図において、紙面の高さは、テロップが存在する確率の高さが約50%の位置に対応し、紙面から上に向かうほど、テロップが存在する確率は高くなり、紙面より下に向かうほど、テロップが存在する確率は低くなるものとする。従って、同図の紙面の高さでは、等高線の数値は「0」となる。 In the figure, the height of the paper surface corresponds to a position where the probability of the presence of a telop is about 50%. The probability that a telop exists will be low. Accordingly, the numerical value of the contour line is “0” at the height of the paper surface of FIG.
同図において、図中左下側は、等高線の数値が「−20000」、「−40000」などと表示されているように、テロップが存在する確率は極めて低い。すなわち、データv1と、データh1とがともに低い値となるサブブロックにおいて、テロップが存在している確率は極めて低い。この領域では、データv1、データh1ともに低い値であり、この領域のサブブロックの画像においては、例えば、ストライプ模様のようなエッジは検出されなかったことになる。 In the same figure, the probability that a telop exists is very low as the numerical values of the contour lines are displayed as “−20000”, “−40000”, etc. on the lower left side in the figure. That is, the probability that a telop exists in the sub-block where both the data v1 and the data h1 are low is very low. In this region, both the data v1 and the data h1 are low values, and for example, an edge like a stripe pattern is not detected in the sub-block image in this region.
また、同図の図中右下側も等高線の数値が「0」程度となり、やはりテロップが存在する確率は極めて低い。図中の領域351では、等高線の記載はないが、実際には「−20000」乃至「0」程度となる。領域351では、データh1の値は低いものの、データv1の値はかなり高いので、かなりのエッジ強度が検出されたはずである。しかしながら、領域351は、例えば、ブラインドの画像などが表示されたサブブロックである確率が高く、結果としてテロップが存在する確率は極めて低いものとなる。
Further, the numerical value of the contour line is also about “0” on the lower right side in the figure, and the probability that the telop exists is very low. In the
このように、テロップが存在する確率が極めて低い領域が除去されるように、図7の縦閾値、横閾値、斜閾値を設定する必要がある。本発明においては、例えば、図13の線371、線372、および線373で示されるように、それぞれ縦閾値、横閾値、斜閾値が設定される。このようにすることで、テロップが存在する確率が極めて低いサブブロックが、テロップが含まれるサブブロックとして検出されてしまうことが抑止される。特に、線371と線372に加えて、線373(斜閾値)を設定したことにより、図中左下側のテロップが存在する確率は極めて低い領域が、テロップが含まれるサブブロックとしての検出対象サブブロックから、適切に除去されるようになされている。
As described above, it is necessary to set the vertical threshold value, the horizontal threshold value, and the oblique threshold value in FIG. 7 so as to remove the region where the probability that the telop exists is extremely low. In the present invention, for example, as indicated by a
図14は、従来の方式により、テロップが含まれるサブブロックを検出した場合と、本発明のテロップ検出装置200によりテロップが含まれるサブブロックを検出した場合とを比較したグラフである。
FIG. 14 is a graph comparing the case where a sub-block including a telop is detected by the conventional method with the case where a sub-block including a telop is detected by the
同図においては、図中横軸が再現率とされ、図中縦軸が適合率とされており、従来の方式により、テロップが含まれるサブブロックを検出した場合と、本発明のテロップ検出装置200によりテロップが含まれるサブブロックを検出した場合の再現率と適合率の変化が、それぞれ線401と線402で示されている。
In the figure, the horizontal axis in the figure is the reproduction rate, and the vertical axis in the figure is the precision rate. When a sub-block including a telop is detected by a conventional method, the telop detection device of the present invention The change in the recall rate and the matching rate when a sub-block including a telop is detected by 200 is indicated by
ここで、再現率と適合率について説明する。 Here, the recall rate and the matching rate will be described.
例えば、テロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロックであって、実際にテロップが含まれていたサブブロックの集合をtp(true-positive)とし、テロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロックであって、実際にはテロップが含まれていなかったサブブロックの集合をfp(false-positive)とする。
For example, a set of sub-blocks that are detected as sub-blocks including a telop by the
また、実際にはテロップが含まれていたにも係らずテロップ検出装置200によりテロップが含まれるサブブロックとして検出されなかったサブブロックの集合をfn(false-negative)とし、実際にテロップが含まれておらずテロップ検出装置200によりテロップが含まれるサブブロックとして検出されなかったサブブロックの集合をtn(true-negative)とする。
In addition, a set of sub-blocks that are not detected as sub-blocks including the telop by the
例えば、1枚の画像を構成するサブブロック全体の集合の中でのtp、fp、fn、およびtnの関係は、図15に示されるようになる。すなわち、fnとtpの和が実際にテロップが含まれていたサブブロック(正解)であり、tpとfpの和がテロップ検出装置200によりテロップが含まれるサブブロックとして検出されたサブブロック(検出結果)である。
For example, the relationship between tp, fp, fn, and tn in the set of all the sub-blocks constituting one image is as shown in FIG. That is, the sum of fn and tp is a sub-block (correct answer) that actually includes a telop, and the sum of tp and fp is detected by the
再現率は、正解のうち、実際に検出された割合を表すものであって、次式により求められる。 The recall rate represents the proportion of correct answers actually detected, and is obtained by the following equation.
再現率=tp/(tp+fn) Reproducibility = tp / (tp + fn)
適合率は、検出結果の中での正解の割合を表すものであって、次式により求められる。 The relevance rate represents the proportion of correct answers in the detection result, and is obtained by the following equation.
適合率=tp/(tp+fp) Matching rate = tp / (tp + fp)
テロップ検出装置の検出性能の観点からのみいえば、再現率および適合率ともに100%を実現することが望ましいが、実際には、このような検出結果を得ることは難しい。 From the viewpoint of the detection performance of the telop detection device, it is desirable to realize both the recall rate and the matching rate, but in practice it is difficult to obtain such a detection result.
例えば、図2に示した画像において、図16に示されるような楕円で囲まれた領域のサブブロックがテロップ検出装置200によりテロップが含まれるサブブロックとして検出された場合、再現率100%となる。ただし、図16の楕円で囲まれた領域には、テロップではない画像も含まれている。
For example, in the image shown in FIG. 2, when a sub-block in an area surrounded by an ellipse as shown in FIG. 16 is detected as a sub-block including a telop by the
すなわち、極論すればテロップが含まれるか否かにかかわらず、全てのサブブロックを検出した場合、tn = fn = 0 となるため再現率は100%となるが、適合率は低くなる。 In other words, if all sub-blocks are detected regardless of whether or not a telop is included, tn = fn = 0 and the recall is 100%, but the precision is low.
また、例えば、図2に示した画像において、図17に示されるような楕円で囲まれた領域のサブブロックがテロップ検出装置200によりテロップが含まれるサブブロックとして検出された場合、適合率100%となる。ただし、図17の楕円で囲まれた領域には、テロップの画像のごく一部が含まれているにすぎず、他にも検出されるべき領域が残っている。
For example, in the image shown in FIG. 2, when a sub-block in an area surrounded by an ellipse as shown in FIG. 17 is detected as a sub-block including a telop by the
すなわち、極論すれば、画面全体の中から1個のサブブロックのみを検出し、それが正解であれば適合率は100% となるが、再現率は低くなる。 In other words, in the extreme case, only one sub-block is detected from the entire screen, and if it is correct, the precision is 100%, but the recall is low.
ここでは、テロップの文字列の中に存在する空白の領域なども正解(テロップが含まれている)として考え、文字の間隔等から文字列の中に存在する文字と空白の領域の比率を50%と想定し、再現率50%の検出結果が得られたときの適合率について従来の方式と本発明との違いを説明する。 Here, a blank area or the like existing in the text string of the telop is also considered as a correct answer (the telop is included), and the ratio between the character and the blank area existing in the character string is set to 50 based on the character spacing. The difference between the conventional method and the present invention will be described with respect to the matching rate when a detection result with a recall rate of 50% is obtained.
図14に戻って、例えば、再現率50%の検出結果が得られた場合、線401で示される従来の方式では、適合率が68%(0.68)であったのに対して、線402で示される本発明によれば、適合率は92%(0.92)となっている。また、再現率50%の検出結果が得られた場合、線401で示される従来の方式では、誤認識率が32%(=1−0.68)であったのに対して、線402で示される本発明によれば、誤認識率は8%(=1−0.92)となっている。
Returning to FIG. 14, for example, when a detection result with a recall rate of 50% is obtained, in the conventional method indicated by the
すなわち、本発明により、従来の方式と比較して適合率は24%程度向上し、誤認識率は、1/4程度に低下したと言える。 That is, according to the present invention, it can be said that the relevance rate is improved by about 24% compared to the conventional method, and the misrecognition rate is reduced to about 1/4.
また、線402は、再現率が0に近づくに従って適合率が1.0(100%)に近づいていくが、線401は、再現率が0に近づくに従って適合率が0.2(100%)程度に近づいている。
In addition, the precision of the
すなわち、従来の方式では、例えば、閾値を厳格に設定するなどして、再現率を犠牲にしてでも高い適合率を得ることが難しかったのに対して、本発明では、ある程度再現率を犠牲にすれば、それだけ高い適合率を得ることが可能である。 That is, in the conventional method, for example, it is difficult to obtain a high precision rate even at the sacrifice of the reproduction rate, for example, by setting a threshold value strictly, but in the present invention, the reproduction rate is sacrificed to some extent. If so, it is possible to obtain a higher precision.
なお、上述した一連の処理は、ハードウェアにより実行させることもできるし、ソフトウェアにより実行させることもできる。上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、専用のハードウェアに組み込まれているコンピュータ、または、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば図18に示されるような汎用のパーソナルコンピュータ500などに、ネットワークや記録媒体からインストールされる。
The series of processes described above can be executed by hardware, or can be executed by software. When the above-described series of processing is executed by software, a program constituting the software executes various functions by installing a computer incorporated in dedicated hardware or various programs. For example, a general-purpose
図18において、CPU(Central Processing Unit)501は、ROM(Read Only Memory)502に記憶されているプログラム、または記憶部508からRAM(Random Access Memory)503にロードされたプログラムに従って各種の処理を実行する。RAM503にはまた、CPU501が各種の処理を実行する上において必要なデータなども適宜記憶される。
In FIG. 18, a CPU (Central Processing Unit) 501 executes various processes according to a program stored in a ROM (Read Only Memory) 502 or a program loaded from a
CPU501、ROM502、およびRAM503は、バス504を介して相互に接続されている。このバス504にはまた、入出力インタフェース505も接続されている。
The
入出力インタフェース505には、キーボード、マウスなどよりなる入力部506、CRT(Cathode Ray Tube)、LCD(Liquid Crystal display)などよりなるディスプレイ、並びにスピーカなどよりなる出力部507、ハードディスクなどより構成される記憶部508、モデム、LANカードなどのネットワークインタフェースカードなどより構成される通信部509が接続されている。通信部509は、インターネットを含むネットワークを介しての通信処理を行う。
The input /
入出力インタフェース505にはまた、必要に応じてドライブ510が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブルメディア511が適宜装着され、それらから読み出されたコンピュータプログラムが、必要に応じて記憶部508にインストールされる。
A
上述した一連の処理をソフトウェアにより実行させる場合には、そのソフトウェアを構成するプログラムが、インターネットなどのネットワークや、リムーバブルメディア511などからなる記録媒体からインストールされる。
When the above-described series of processing is executed by software, a program constituting the software is installed from a network such as the Internet or a recording medium such as the
なお、この記録媒体は、図18に示される、装置本体とは別に、ユーザにプログラムを配信するために配布される、プログラムが記録されている磁気ディスク(フロッピディスク(登録商標)を含む)、光ディスク(CD-ROM(Compact Disk-Read Only Memory),DVD(Digital Versatile Disk)を含む)、光磁気ディスク(MD(Mini-Disk)(登録商標)を含む)、もしくは半導体メモリなどよりなるリムーバブルメディア511により構成されるものだけでなく、装置本体に予め組み込まれた状態でユーザに配信される、プログラムが記録されているROM502や、記憶部508に含まれるハードディスクなどで構成されるものも含む。
The recording medium shown in FIG. 18 is a magnetic disk (including a floppy disk (registered trademark)) on which a program is recorded, which is distributed to distribute the program to the user, separately from the apparatus main body. Removable media consisting of optical disks (including CD-ROM (compact disk-read only memory), DVD (digital versatile disk)), magneto-optical disks (including MD (mini-disk) (registered trademark)), or semiconductor memory It includes not only those configured by 511 but also those configured by a
本明細書において上述した一連の処理を実行するステップは、記載された順序に沿って時系列的に行われる処理はもちろん、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。 The steps of executing the series of processes described above in this specification are performed in parallel or individually even if they are not necessarily processed in time series, as well as processes performed in time series in the order described. It also includes processing.
200 テロップ検出装置, 201 領域抽出部, 202 サブブロックエッジ検出部, 203 テロップ領域検出部, 221 演算器, 222 演算器, 231 最小値抽出部, 232 最大値抽出部, 233 最小値抽出部, 234 最大値抽出部, 241 演算器, 242 演算器, 261 垂直フィルタ, 262 水平フィルタ, 271 乗算器, 272 乗算器, 273 加算器, 281 閾値判定部, 282 閾値判定部, 283 閾値判定部, 291 論理積演算器 200 telop detection device, 201 region extraction unit, 202 sub-block edge detection unit, 203 telop region detection unit, 221 arithmetic unit, 222 arithmetic unit, 231 minimum value extraction unit, 232 maximum value extraction unit, 233 minimum value extraction unit, 234 Maximum value extraction unit, 241 arithmetic unit, 242 arithmetic unit, 261 vertical filter, 262 horizontal filter, 271 multiplier, 272 multiplier, 273 adder, 281 threshold determination unit, 282 threshold determination unit, 283 threshold determination unit, 291 logic Product calculator
Claims (7)
前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、
前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、
前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部と
を備える検出装置。 A detection device that detects information for specifying a region including a telop from input image data,
Dividing means for dividing the image data into a plurality of sub-blocks each composed of N pixels in the horizontal direction and M pixels in the vertical direction;
For each of the plurality of sub-blocks, horizontal average value calculating means for calculating the average value of M horizontal directions, which is the average value of the N pixels in the horizontal direction constituting the sub-block, ,
For each of the plurality of sub-blocks, a vertical average value calculating unit that calculates an average value of N vertical values of M pixels in the vertical direction constituting the sub-block, and ,
A horizontal index calculation unit that calculates a difference between a maximum value and a minimum value among the M average values in the horizontal direction as a first index for specifying a region including the telop;
A vertical index calculation unit that calculates a difference between a maximum value and a minimum value among the N average values in the vertical direction as a second index for specifying a region including the telop.
前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックについて前記第2の指標を抽出して、前記第2の指標を、それぞれのサブブロックの位置に対応する位置に配置したデータを、前記複数のサブブロックのそれぞれの前記第2の指標に対して、それぞれ予め設定された数値を乗じる垂直フィルタにより処理して得られる垂直処理データとに基づいて、
前記注目するサブブロックに、テロップが含まれているか否かを判定し、その判定結果を表す情報を、前記テロップが含まれる領域を特定するための第3の指標として出力するテロップ情報出力手段をさらに備える
請求項1に記載の検出装置。 The first index is extracted for a subblock of interest and a plurality of subblocks adjacent to the subblock, and data in which the first index is arranged at a position corresponding to the position of each subblock, Horizontal processing data obtained by processing the first index of each of the plurality of sub-blocks by a horizontal filter that multiplies a predetermined numerical value;
The second index is extracted for the target subblock and a plurality of subblocks adjacent to the subblock, and data in which the second index is arranged at a position corresponding to the position of each subblock is obtained. , Based on the vertical processing data obtained by processing each of the second index of the plurality of sub-blocks by a vertical filter that multiplies a predetermined numerical value,
Telop information output means for determining whether or not a telop is included in the sub-block of interest, and outputting information indicating the determination result as a third index for specifying an area including the telop The detection device according to claim 1.
前記水平処理データと、前記垂直処理データとに基づいて、斜処理データをさらに生成し、
前記水平処理データの値が第1の閾値を超え、前記垂直処理データの値が第2の閾値を超え、かつ前記斜処理データの値が第3の閾値を超えた場合、前記注目するサブブロックに、テロップが含まれていると判定する
請求項2に記載の検出装置。 The telop information output means includes
Further generating oblique processing data based on the horizontal processing data and the vertical processing data;
When the value of the horizontal processing data exceeds a first threshold, the value of the vertical processing data exceeds a second threshold, and the value of the oblique processing data exceeds a third threshold, the target sub-block The detection device according to claim 2, wherein it is determined that a telop is included.
前記垂直フィルタは、前記注目するサブブロックと、そのサブブロックに隣接する複数のサブブロックにおいて、垂直方向のストライプ模様の画像が含まれる場合、高い値の前記垂直処理データが得られるように、前記数値が設定される
請求項2に記載の検出装置。 In the horizontal filter, when the image of the stripe pattern in the horizontal direction is included in the sub-block of interest and a plurality of sub-blocks adjacent to the sub-block, the horizontal processing data having a high value is obtained. A numerical value is set,
When the vertical filter includes an image of a stripe pattern in the vertical direction in the sub-block of interest and a plurality of sub-blocks adjacent to the sub-block, the vertical filter is configured to obtain the high-value vertical processing data. The detection device according to claim 2, wherein a numerical value is set.
前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割し、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出し、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向のそれぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出し、
前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出し、
前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出するステップ
を含む検出方法。 A detection method of a detection device for detecting information for specifying a region including a telop from input image data,
The image data is divided into a plurality of sub-blocks each composed of N pixels in the horizontal direction and M pixels in the vertical direction,
For each of the plurality of sub-blocks, an average value of pixel values of N pixels in the horizontal direction constituting the sub-block, and calculating an average value of M horizontal directions,
For each of the plurality of sub-blocks, an average value of pixel values of M pixels in the vertical direction constituting the sub-block, and calculating an average value of N vertical directions,
A difference between the maximum value and the minimum value among the M horizontal average values is calculated as a first index for specifying a region including the telop,
A detection method comprising: calculating a difference between a maximum value and a minimum value among the N average values in the vertical direction as a second index for specifying a region including the telop.
コンピュータを、
前記画像データを、それぞれ水平方向にN個の画素、垂直方向にM個の画素で構成される複数のサブブロックに分割する分割手段と、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する水平方向のそれぞれN個の画素の画素値の平均値であって、M個の水平方向の平均値を算出する水平平均値算出手段と、
前記複数のサブブロックのそれぞれについて、前記サブブロックを構成する垂直方向の
それぞれM個の画素の画素値の平均値であって、N個の垂直方向の平均値を算出する垂直平均値算出手段と、
前記M個の水平方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第1の指標として算出する水平指標算出部と、
前記N個の垂直方向の平均値の中の最大値と最小値の差を、前記テロップが含まれる領域を特定するための第2の指標として算出する垂直指標算出部として機能させる
プログラム。 A program for causing a computer to perform detection processing for detecting information for specifying a region including a telop from input image data,
Computer
Dividing means for dividing the image data into a plurality of sub-blocks each composed of N pixels in the horizontal direction and M pixels in the vertical direction;
For each of the plurality of sub-blocks, horizontal average value calculating means for calculating the average value of M horizontal directions, which is the average value of the N pixels in the horizontal direction constituting the sub-block, ,
For each of the plurality of sub-blocks, a vertical average value calculating unit that calculates an average value of N vertical values of M pixels in the vertical direction constituting the sub-block, and ,
A horizontal index calculation unit that calculates a difference between a maximum value and a minimum value among the M average values in the horizontal direction as a first index for specifying a region including the telop;
A program that functions as a vertical index calculation unit that calculates a difference between a maximum value and a minimum value among the N average values in the vertical direction as a second index for specifying a region including the telop.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007129517A JP4967798B2 (en) | 2007-05-15 | 2007-05-15 | Detection apparatus and method, program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007129517A JP4967798B2 (en) | 2007-05-15 | 2007-05-15 | Detection apparatus and method, program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008287353A JP2008287353A (en) | 2008-11-27 |
JP4967798B2 true JP4967798B2 (en) | 2012-07-04 |
Family
ID=40147038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007129517A Expired - Fee Related JP4967798B2 (en) | 2007-05-15 | 2007-05-15 | Detection apparatus and method, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4967798B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102273193A (en) * | 2009-01-06 | 2011-12-07 | 日本电气株式会社 | Credit information segment detection method, credit information segment detection device, and credit information segment detection program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3207690B2 (en) * | 1994-10-27 | 2001-09-10 | シャープ株式会社 | Image processing device |
JP4005243B2 (en) * | 1998-11-20 | 2007-11-07 | 株式会社東芝 | Image processing device |
JP3785935B2 (en) * | 2001-03-15 | 2006-06-14 | 日本電気株式会社 | Line detector |
JP4450785B2 (en) * | 2005-10-21 | 2010-04-14 | シャープ株式会社 | Image processing apparatus, image forming apparatus, image reading apparatus, image processing method, and program |
-
2007
- 2007-05-15 JP JP2007129517A patent/JP4967798B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008287353A (en) | 2008-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8768052B2 (en) | Image processing apparatus, image processing method, and non-transitory computer readable medium | |
JP3833153B2 (en) | Image processing method and apparatus | |
Roeder et al. | A computational image analysis glossary for biologists | |
JP6098319B2 (en) | Scanned image processing method and apparatus | |
KR101180570B1 (en) | Foreground area extracting program, foreground area extracting apparatus and foreground area extracting method | |
JP2012022654A (en) | Image processing apparatus, image processing method and program | |
CN103548056A (en) | Image-processing device, image-capturing device, and image-processing method | |
EP3038017A1 (en) | Method of generating descriptor for interest point in image and apparatus implementing the same | |
CN102810155B (en) | Method and device for extracting text stroke images from image | |
JP4967798B2 (en) | Detection apparatus and method, program, and recording medium | |
CN111553886A (en) | Self-adaptive identification method for particles in asphalt mixture CT image | |
WO2012127639A1 (en) | Image-processing device and image-processing method | |
CN108109120B (en) | Illumination compensation method and device for dot matrix two-dimensional code | |
US20120213439A1 (en) | Image processing apparatus, image processing method, and computer readable medium | |
JP2010176414A (en) | Apparatus and program for processing image | |
CN115330637A (en) | Image sharpening method and device, computing device and storage medium | |
CN100353381C (en) | Image inspecting apparatus, image inspecting method, control program and computer-readable storage medium | |
JP4894664B2 (en) | Image processing system and image processing program | |
JP2011090475A (en) | Digital image processing device, and method of replacing background color | |
KR101664185B1 (en) | Image processing apparatus, image processing method, and computer-readable recording medium | |
JP5489894B2 (en) | Image processing apparatus and image processing program | |
JP2011053456A (en) | Image display method, program, image display device, and imaging apparatus with the image display device | |
JP2006072839A (en) | Image processing method, image processing apparatus, image processing program and recording medium | |
KR101535196B1 (en) | Apparatus and Method of Image Segmentation based on the Texture Characteristics | |
JP4253265B2 (en) | Shadow detection apparatus, shadow detection method and shadow detection program, image processing apparatus using shadow detection apparatus, image processing method using shadow detection method, and image processing program using shadow detection program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120306 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120319 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150413 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |