JP2002016873A - 信号処理装置及び方法 - Google Patents
信号処理装置及び方法Info
- Publication number
- JP2002016873A JP2002016873A JP2000307907A JP2000307907A JP2002016873A JP 2002016873 A JP2002016873 A JP 2002016873A JP 2000307907 A JP2000307907 A JP 2000307907A JP 2000307907 A JP2000307907 A JP 2000307907A JP 2002016873 A JP2002016873 A JP 2002016873A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- section
- candidate
- detecting
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 61
- 238000001514 detection method Methods 0.000 claims abstract description 64
- 230000005236 sound signal Effects 0.000 claims description 89
- 238000001228 spectrum Methods 0.000 claims description 33
- 230000008859 change Effects 0.000 claims description 30
- 238000003672 processing method Methods 0.000 claims description 25
- 238000011156 evaluation Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 63
- 230000008569 process Effects 0.000 description 38
- 238000010586 diagram Methods 0.000 description 18
- 238000004364 calculation method Methods 0.000 description 16
- 230000002860 competitive effect Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 2
- 206010002953 Aphonia Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000010972 statistical evaluation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/58—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H60/00—Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
- H04H60/56—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54
- H04H60/59—Arrangements characterised by components specially adapted for monitoring, identification or recognition covered by groups H04H60/29-H04H60/54 of video
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/4104—Peripherals receiving signals from specially adapted client devices
- H04N21/4112—Peripherals receiving signals from specially adapted client devices having fewer capabilities than the client, e.g. thin client having less processing power or no tuning capabilities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/433—Content storage operation, e.g. storage operation in response to a pause request, caching operations
- H04N21/4334—Recording operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/44—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
- H04N21/44008—Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/454—Content or additional data filtering, e.g. blocking advertisements
- H04N21/4542—Blocking scenes or portions of the received content, e.g. censoring scenes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/812—Monomedia components thereof involving advertisement data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N5/9201—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving the multiplexing of an additional signal and the video signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/16—Analogue secrecy systems; Analogue subscription systems
- H04N7/162—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing
- H04N7/163—Authorising the user terminal, e.g. by paying; Registering the use of a subscription channel, e.g. billing by receiver means only
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/78—Television signal recording using magnetic recording
- H04N5/781—Television signal recording using magnetic recording on disks or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Marketing (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- Television Signal Processing For Recording (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
- Television Systems (AREA)
Abstract
出又は検索可能とする。 【解決手段】 アンテナ6を介しチューナ1にて受信
し、さらに復調器2にて復調されたTV放送信号の音声
及び映像信号から、15,30,60秒間隔で発生する
特徴的パターンに基づいて、CMの候補区間を検出し、
そのCM候補区間内又はその前後の音声及び映像信号か
ら、CMらしさを表わす特徴量を抽出し、その特徴量に
基づきCM区間を検出するCM検出部4を備える。
Description
方法に関し、特に、テレビジョン放送に付加されるコマ
ーシャルメッセージを自動的に検出或いは検索可能とす
る信号処理装置及び方法に関するものである。
付いているテレビジョン(以下、適宜TVとする)放送
では、本編(番組そのもの)の合間に、その番組を提供
しているスポンサーのコマーシャルメッセージ(以下、
単にCMとする。)が挿入される。
本編にあるため、CMを省略して視聴したいという要望
は多い。
トーリー性のあるCM、有名俳優が登場するCMなど、
CM自体を視聴対象とする場合も少なくない。
磁気ディスク等の媒体にTV放送番組等を録画する場合
において、放送番組から本編とCMとを分離/区別し
て、必要なときに必要な部分を視聴することが可能とな
れば、上述したような多様な要望に対する有効な解決手
段を与えることになると考えられる。
て試聴可能とする技術としては、従来より、いわゆるC
Mスキップ機能(広義のCMスキップ機能)が存在し、
例えば家庭用ビデオ録画再生装置には当該CMスキップ
機能が搭載されているものが多い。
プ機能)は、その仕組みに応じて4つに大別され、それ
ぞれ一般には、CM早送り機能、CMカット機能、放送
モードに基づくCMスキップ機能(狭義のCMスキップ
機能)、放送モードによらないCMスキップ機能(狭義
のCMスキップ機能)と呼ばれている。なお、これら4
つに大別されたCMスキップ機能のうち、上記CM早送
り機能とは、日本国内においては通例としてCMが15
秒の倍数で製作されていることを利用し、家庭用ビデオ
録画再生装置でのビデオ再生中に、例えばリモコンボタ
ン操作によって(30秒)ラ(ボタンを押した回数)の
時間だけ早送りを行うことにより、CM部分を飛ばす機
能である。このCM早送り機能に関する技術について
は、例えば特開平10−269651号公報などに公開
されている。また、特開平9−307841号公報に
は、上記CM早送り機能における早送り終了時刻を時間
で決定せず、映像信号のブラックフレームと音声信号の
無音部が同時に所定長さ以上にわたり生じる部分を、早
送り終了時刻とする技術が公開されている。
CMがステレオ放送されることが多く、また、TV放送
信号には音声がモノラルモード/ステレオモード/音声
多重モードの何れであるかを示すパイロット信号が多重
されていることを利用し、例えば音声がモノラルモード
又は音声多重モードとなされている本編を録画するよう
な場合に、ステレオモード区間(すなわちCM区間)の
み録画を停止することで、CM部分をカットすることを
可能にする機能である。このCMカット機能に関する技
術については、例えば特開平3−158086号、特開
平3−2622872号などの公報に公開されている。
義のCMスキップ機能)とは、CMカット機能と同様に
放送モードの違いを利用する仕組みであるが、上記CM
カット機能が録画時にCMをカットしているのに対し、
当該放送モードに基づくCMスキップ機能では、録画時
には全ての映像及び音声を記録すると同時にその放送モ
ードも記録しておき、再生時にステレオ放送区間(すな
わちCM区間)のみ自動的に早送りする機能である。こ
の放送モードに基づくCMスキップ機能に関する技術に
ついては、例えば特開平5−250762号公報などに
公開されている。
(狭義のCMスキップ機能)とは、放送信号中に含まれ
る音声信号の無音区間間隔や、映像信号の映像変換点
(映像が急激に変化する点)の出現間隔、映像信号の黒
レベル/白レベルの出現間隔などを利用して、これらが
15秒の倍数間隔に合致する部分をCMとして早送りす
る機能である。当該放送モードによらないCMスキップ
機能に関する技術については、特開平8−317342
号公報や、文献「TV放送のCM検出方式についての一
検討」(映像情報メディア学会技術報告、VIR97-22、19
/23(1997))などに公開されている。
M早送り機能自体は、家庭用ビデオ録画再生装置にて録
画したTV放送を再生して視聴する視聴者に対して、C
Mかどうかの判断を任せるものであり、TV放送から自
動的にCM部分を検出するようなCM検出機能は備えて
いない。
機能やCMスキップ機能(狭義のCMスキップ機能)で
は、放送モードの違い、すなわち例えばステレオモード
によるCM検出を行うようになされているが、例えば本
編自体がステレオモードとなされている場合や、CMが
モノラルモードや音声多重モードとなっている場合に
は、全く効果がない(すなわちCMカットやCMスキッ
プができない)。
機能(狭義のCMスキップ機能)では、視聴者や放送モ
ードに依存することなく、放送内容に基づいたCM検出
が可能となっている。ただし、当該機能の場合は、音声
信号の無音区間間隔や、映像信号の映像変換点(映像が
急激に変化する点)の出現間隔などが、予め想定されて
いる設定値と一致することなど、非常に狭い条件に基づ
いた決定論的な判定手続きによりCM区間を検出するよ
うになされている。これに対し、実際の放送番組では、
放送時間の調整の目的や人為的なスイッチングなどの要
因によって無音区間間隔が例えば短縮されていたりする
場合が少なからずあり、逆に、番組本編の中にも上記の
条件を満たす区間が多く存在している。このため、無音
区間間隔が予め想定されている長さより短いようなCM
の場合は全く検出ができくなる問題が発生し、逆に、上
記設定値の条件を満たす本編の場合は当該本編をCM区
間として誤って検出してしまう等の問題点が生じてしま
う。
のCMが連続されて放送されている場合には、CM全体
の区間を検出することはできても、個々のCMの検出は
できない。このため、CMを個別に抽出して視聴したい
ような場合(要望)には適さない。
CM部分を高精度に検出又は検索できることが望まれて
いる。
みてなされたものであり、例えばTV放送信号に含まれ
るコマーシャルメッセージ部分を高精度に検出又は検索
可能とする、信号処理装置及び方法を提供することを目
的とする。
は、少なくとも第1の信号の区間とそれ以外の信号の区
間とが時分割的に存在する入力信号から、所定の時間間
隔を持つ信号の特徴的パターンに基づいて第1の信号の
候補区間を検出する候補区間検出手段と、その候補区間
内又はその前後の入力信号から第1の信号らしさを表わ
す特徴量を抽出する特徴量抽出手段と、その特徴量に基
づき第1の信号の区間を検出する検出手段とを有するこ
とにより、上述した課題を解決する。
補区間が第1の信号である可能性を評価する特徴量評価
手段と、評価結果に基づいて第1の信号の区間を判定す
る判定手段とを有する。或いは、検出手段は、特徴量に
基づいて、候補区間の信号と、別途指定した第1の信号
との一致を判定する一致判定手段を有する。
も第1の信号の区間とそれ以外の信号の区間とが時分割
的に存在する入力信号から、所定の時間間隔を持つ信号
の特徴的パターンに基づいて、第1の信号の候補区間を
検出し、その候補区間内又はその前後の入力信号から第
1の信号らしさを表わす特徴量を抽出し、その特徴量に
基づき第1の信号の区間を検出することにより、上述し
た課題を解決する。
特徴量に基づいて候補区間が第1の信号である可能性を
評価し、評価結果に基づいて第1の信号の区間を判定す
る。或いは、第1の信号区間の検出の際には、特徴量に
基づいて、候補区間の信号と、別途指定した第1の信号
との一致を判定する。
本編とコマーシャルメッセージ部分のように、本編信号
とコマーシャルメッセージ信号(第1の信号)よりなる
TV放送信号の音声及び/又は映像信号から、所定の必
須条件に基づき、信号が特徴的パターンを示すCM候補
区間を抽出し、それらCM候補区間に対して、幾つかの
特徴からCMらしさを表わす指標である付加条件を検出
し、抽出した付加条件を総合してCMの判定を行うこと
により、精度良く個々のCMの検出を可能とするもので
ある。また、本発明は、上記検出する付加条件の一部又
は全部を記録し、TV放送信号や記録された他のCM候
補と比較することより、TV放送信号又はそれが記録さ
れたデータベースから所望のCMを検索可能とするもの
である。
態について、図面を参照しながら説明する。
いて述べる前に、本発明に基づき、例えばTV放送信号
からCM部分を検出する際の原理について概説する。
指定する規格に基づいて製作されるため、その「時間長
(1つのCMの時間)はごく少数の種類に限定」され
る。例えば日本国内においては、特殊な例を除くほぼ全
てのCMが、15秒、30秒、60秒の長さで製作され
ている。
CMとは独立に製作されたものがTV放送ストリーム中
に挿入されるため、各CMの前後では必然的に「音声レ
ベルが下がる(すなわち小音量となる)」こと、及び、
「映像信号が切り替わる」こと、という特徴を持つ。こ
こで、「音声レベルが下がる」とは、必ずしも無音(こ
こでは極微小なノイズしかない部分という意味)と同義
ではない。すなわち、実際には、CMと本編との切り替
えのタイミングなどにより、必ずしも完全に無音とはな
らないまま切り替わることがあるからである。
間長(少数種類の時間長)」、「小音量」、「映像切り
替わり」という3つの特徴は、ほぼ全てのCMが示すパ
ターンである。本発明では、このようにほぼ全てのCM
が示す信号のパターンを「特徴的パターン」と称し、そ
れを検出するための条件を「必須条件」と称することに
する。
件に対応する信号部分を検出するようにすれば、誤棄却
がほとんどなく決定論的にCMの候補(すなわちCMで
あろうと思われる信号部分)を検出することが可能とな
る。但し、番組本編内にも、偶然そのような必須条件を
満たしてしまう部分が多く存在するため、上記必須条件
を用いただけでは、番組本編の一部をCM候補として誤
検出してしまう虞が残る。
存在するものの、CMの性質上、多くのCMが満たすか
若しくは一定の傾向を示す特徴としては、以下のような
ものがある。
CMが終了して本編番組が開始又は再開される直前)で
は、通常の番組本編内よりも音声レベルが低くなること
が多い。
Mと他のCMとの間の、ほぼ無音となる区間長は、数百
ミリ秒程度であることが多い。
Mの規定時間長(15秒、30秒、60秒等)より百ミ
リ秒程度以上短いことが多く、また1秒程度以上短いこ
とは少ない。
チャンネル)と右チャンネル(Rチャンネル)の相関値
は、1より有意に小さいことが多い。
きめである傾向がある。
であることが多い。
放送されることが多い。
り頻度が高いことが多い。
の切り替わり頻度が極端に低いものがある(例えば静止
画によるCMなど)。
Mと他のCMの境界では、音質が大きく変化することが
多い。
とが多い。
は、CMが放送される確率が高い。
放送される確率が高い。
される確率の高い時間帯がある(例えばサッカー中継の
ハーフタイムなど)。
条件を「付加条件」と称することにする。すなわち、当
該付加条件は、CMが、規格に基づいて製作されるとい
う制約、短い時間で宣伝効果を上げるためのものである
という制約、及び、番組構成上の都合などによる制約の
元で製作された結果として、TV放送信号上に現れてく
ることによる条件である。したがって、この付加条件
は、決定論的な取り扱いができるほど確実な条件ではな
いものの、CMである可能性(CMらしさ)を評価する
際の有効な条件となる。
チャンネルで複数の映像及び音声が放送されることは物
理的にありえないという特徴がある。すなわち、TV放
送信号からCMであろうと思われる信号部分(CM候
補)を検出しようとする場合において、例えば、TV放
送信号中に、上記付加条件を満たす複数の映像及び音声
区間がオーバーラップして存在し、何らかの処理の結
果、当該オーバーラップ区間でCM候補が検出されたと
しても、そのオーバーラップしている複数の映像及び音
声内の少なくともどちらかの区間は、正しいCM区間で
はあり得ない。本発明では、TV放送におけるこのよう
な特徴に基づく条件を、「論理条件」と称することにす
る。
「論理条件」、「付加条件」を合理的かつ効果的に利用
することにより、TV放送信号から高精度でCM部分を
検出可能としている。
条件」に基づき、決定論的にTV放送信号中からCM候
補(CMであろうと思われる信号部分)を抽出し、「付
加条件」に基づくCMらしさ(CMである可能性)の統
計論的な評価によってCM候補を選択し、「論理条件」
によりCM候補のオーバーラップ関係を解消することに
より、精度の高いCM検出を実現するものである。
CMを検出可能とした、本発明の第1の実施の形態とし
ての映像音声記録装置の概略構成を示す。
たTV放送信号は、チューナ1により同調され、放送信
号1aとして復調器2に入力する。
まれるパイロット信号の変調周波数から、その入力時点
での放送モード(モノラルモード/ステレオモード/音
声多重モード)を判別し、また、放送信号1aに含まれ
る映像及び音声の変調信号を復調する。このとき、音声
変調信号は、上記判別した放送モードに応じて復調され
る。当該復調器2により復調された映像信号2a、音声
信号2b、及び放送モード信号2cは、CM検出部4に
入力される。また、映像信号2a、音声信号2bは、映
像音声記録部5にも入力される。
ィスク、光ディスク若しくは光磁気ディスク等を記録媒
体として用い、上記映像信号2a及び音声信号2bを記
録再生可能な装置である。なお、映像音声記録部5は、
映像信号及び音声信号に対して符号化や圧縮などを施し
て記録し、再生時にはその符号化や圧縮された映像信号
及び音声信号を復号化、伸張する装置であってもよい。
生し、当該時間信号3aをCM検出部4に供給する。
詳細については後述するが、上記復調器2からの映像信
号2a、音声信号2b、放送モード信号2cと、時計部
3からの時間情報3aとを入力とし、放送信号1aの映
像及び音声信号に含まれるCM区間を検出し、その開始
時刻と長さをCM検出出力4aとして出力する。当該C
M検出部4によるCM検出出力4aは、映像音声記録部
5に送られ、上記映像信号2a及び音声信号2bと共に
記録される。
から、上記同調された放送チャンネルを示すチャンネル
情報1bも供給される。当該チャンネル情報1bは、C
Mが含まれない放送チャンネルが指定されたか否かを、
CM検出部4において判断する為に用いられる。すなわ
ち、CM検出部4は、上記チャンネル情報1bにより、
上記チューナ1において明らかにCMが放送されない放
送チャンネルの指定がなされていると判断した場合、上
記CM検出動作を行わないようにする。なお、ここで
は、CM検出部4自身がチャンネル情報1bに基づいて
CM検出動作を行うか否か判断することとしているが、
チューナ1がチャンネル情報1bによりCM検出部4で
のCM検出動作を制御するようにしても良い。
映像音声記録部5に示した各構成要素は、現在広く知ら
れているビデオ装置などの磁気記録再生装置のものと同
様であるため、以下では、CM検出部4に限って詳細に
説明する。
例の詳細な構成を示す。なお、この図2中の各信号のう
ち、図1と共通の信号については、図1と同じ指示符号
を付している。また、当該CM検出部4は、大別して、
フロントエンド部とバックエンド部とから構成されてい
る。また、図中の動作制御部23は、チューナ1から供
給された上記チャンネル情報1bに基づいて、上記チュ
ーナ1において明らかにCMが放送されない放送チャン
ネルの指定がなされているか否か判断し、その判断結果
に応じて、当該図2の各部におけるCM検出動作を行わ
ないように制御するものである。
る。
給された映像信号2aは、A/D変換器10にてディジ
タル化され、フレームメモリ11に蓄えられる。なお、
フレームメモリ11は、少なくとも2フレーム分の映像
信号を蓄積可能なメモリである。当該フレームメモリ1
1からフレーム毎に読み出された映像信号は、カットチ
ェンジ検出器12に送られる。
モリ11より供給されたフレーム毎の映像信号に基づい
て、映像が急激に変化するフレーム(以下、映像変化フ
レームと呼ぶ)と、輝度が一様となるフレーム(以下、
一様輝度フレームと呼ぶ)を検出する。
フレームメモリ11に蓄えられた時間的に隣接する2つ
のフレーム映像間で、各画素毎に輝度の差分の自乗和を
求め、当該自乗和が所定の閾値を越えた場合に、上記隣
接する2つのフレームのうちの時間的に後のフレーム
を、上記映像が急激に変化する映像変化フレームとして
検出する。また、カットチェンジ検出器12は、フレー
ムメモリ11に蓄えられた各フレーム映像の輝度の分散
を求め、その輝度の分散値が所定の閾値以下である場合
に、そのフレームを一様輝度フレームであるとして検出
する。なお、フレームの間隔(NTSC方式では約30
ms)が、後述する音声信号処理において説明するフレ
ーム周期と一致しない場合には、当該フレーム間隔を再
離散化することによって、フレーム周期と一致させてお
くようにする。
ける映像変化フレームと一様輝度フレームの検出につい
て、より具体的に説明する。
をX、縦サイズをY、縦横の画素番号をx,yとし、第
nフレームの映像をIn(x,y)、当該第nフレーム
に対して時間的に1フレーム前の第n−1フレームの映
像をIn-1(x,y)として表わすと、第nフレームと
第n−1フレームの間の各画素毎の輝度差分の自乗和D
[n]は、式(1)により得られ、また、第nフレームの
輝度分散値V[n]は、式(2)により得られる。
2の検出出力C[n]は、式(3)により表わされる。
ームを検出する際の前記自乗和に対する所定の閾値であ
り、Vthsdは上記一様輝度フレームを検出する際の前記
輝度の分散値に対する所定の閾値である。
C[n]は、映像信号についての特徴量として特徴量バッ
ファ18へ送られる。
差分を求める際には、2フレーム分の映像信号を蓄積可
能なメモリが必要となり、また、2フレーム分の映像信
号に対する演算量も必要となる。そこで、例えばフレー
ム映像全面を同時に処理する代わりに、フレーム映像を
適切な小ブロック毎に分け、その小ブロック毎に輝度差
分を求めるようにしたり、或いは、フレーム映像間の各
画素毎に輝度差分を求めるのではなく、各フレーム映像
毎に輝度ヒストグラムを求めて、その輝度ヒストグラム
のフレーム間差分を求めるようにしたり、又は、各フレ
ーム映像毎に平均輝度を求めて、その平均輝度のフレー
ム間差分を求めるようにするで、メモリ容量や演算量を
減らすことも可能である。逆に、メモリや演算量に余裕
がある場合には、例えば、カラー映像におけるR
(赤),G(緑),B(青)成分のようなカラー成分毎
に、上記輝度差分やカラーヒストグラム差分を求めるこ
とで、より検出精度を高めることも可能である。
信号2bは、A/D変換器13にてディジタル化され、
音声信号バッファ14に蓄えられる。なお、音声信号バ
ッファ14は、少なくとも所定時間T1(例えば30m
s、以下、これを1フレーム長とする)分の左(L)右
(R)2チャンネルのステレオ音声信号を蓄積可能なメ
モリである。当該音声信号バッファ14から読み出され
た音声信号は、振幅検出器15、相関検出器16、スペ
クトル検出器17に送られる。
に蓄えられた音声信号を用いて、所定の時間T2(例え
ば15ms、以下、これを1フレーム周期とする)毎の
短時間平均自乗振幅を検出する。すなわち、振幅検出器
15は、音声信号バッファ14に左右2チャンネルのス
テレオ音声信号が蓄積されている場合、当該音声信号バ
ッファ14より読み出された左右2チャンネルのステレ
オ音声信号SL[m],S R[m]から、所定の時間T2(15
ms、1フレーム周期)毎に、短時間平均自乗振幅を検
出する。なお、上記m(m=0,・・・,M−1)は、
離散化された時間を表わすバッファ内のサンプル番号で
あり、最大番号Mが1フレーム長T1に対応する。
は、第nフレームにおける左右2チャンネルの音声信号
の平均自乗振幅A[n]を式(4)により計算する。すな
わち、平均自乗振幅は15ms(1/2フレーム)毎に計
算され、その15ms毎の平均自乗振幅の30ms(1フレ
ーム)の期間における平均値がさらに演算され、最終的
な、1フレームの平均自乗振幅とされる。
自乗振幅A[n]は、音声信号についての特徴量の一つと
して特徴量バッファ18へ送られる。
に蓄えられた音声信号を用いて、1フレーム毎の音声信
号について規格化前の相関係数を検出すると共に、後段
にて行われる規格化のための短時間エネルギーも同時に
検出する。すなわち、相関検出器16は、音声信号バッ
ファ14に左右2チャンネルのステレオ音声信号が蓄積
されている場合、当該音声信号バッファ14より読み出
された左右2チャンネルのステレオ音声信号SL[m],S
R[m]から、1フレーム毎の左右2チャンネルの音声信号
について規格化前の相関係数を検出すると共に、後段に
て行われる規格化のための短時間エネルギーも同時に検
出する。
は、第nフレームにおける左右2チャンネルの音声信号
の相関係数ALR[n]を式(5)により計算し、左チャン
ネルの音声信号エネルギーALL[n]を式(6)により計
算し、右チャンネルの音声信号エネルギーARR[n]を式
(7)により計算する。
係数ALR[n]と音声信号エネルギーALL[n]、ARR[n]
は、それぞれが音声信号についての特徴量の一つとして
特徴量バッファ18へ送られる。
ァ14に蓄えられた音声信号を用いて、短時間スペクト
ルを計算する。すなわち、スペクトル検出器17は、音
声信号バッファ14に左右2チャンネルのステレオ音声
信号が蓄積されている場合、当該音声信号バッファ14
より読み出された左右2チャンネルのステレオ音声信号
SL[m],SR[m]から、短時間スペクトルを計算する。
器17は、第nフレームにおける左右2チャンネルの音
声信号の離散スペクトルF[k;n]を求める。なお、k=
0,・・・,K−1を離散化された周波数を表わす番号
とすると、離散スペクトルF[k;n]は式(8)により表
わされる。
リエ変換(FFT)又は線形予測分析(LPC)などを
用いて実現される。
る短時間離散スペクトルF[k;n]は、音声信号について
の特徴量の一つとして特徴量バッファ18へ送られる。
モード信号2cは、上述した音声信号処理のフレームに
合わせて離散化された数値となされる。
おける放送モード信号2cは、例えば式(9)のような
数値B[n]となされる。
B[n]は、TV放送信号の特徴量の一つとして特徴量バ
ッファ18へ送られる。
間信号3aも、音声信号処理のフレームに合わせて離散
化された数値T[n]となされ、特徴量の一つとして特徴
量バッファ18へ送られる。
ジ検出器12からの検出出力C[n]と、振幅検出器15
からの平均自乗振幅A[n]と、相関検出器16からの相
関係数ALR[n]、音声信号エネルギーALL[n],ARR[n]
と、スペクトル検出器17からの短時間離散スペクトル
F[k;n]と、放送モード信号2cの離散化数値B[n]と、
時間信号3aの離散化数値T[n]とからなる、式(1
0)に示される特徴量G[n]を、所定の時間T3に渡って
蓄積する。なお、時間T3はCM部分を最低でも1つ以
上に渡って記憶できる時間であり、例えば80秒などと
する。G[n]={C[n],A[n],ALR[n],ALL[n],ARR[n],
F[k;n],B[n],T[n]} (10)
ァ18までが、図2に示したCM検出部4のフロントエ
ンド部の構成であり、以下、図3、図4のフローチャー
トを用いて当該フロントエンド部における処理の流れを
説明する。なお、図3のステップS30乃至S32まで
は映像信号2aについての処理の流れを表しており、図
4のステップS33乃至S40までは音声信号2b及び
放送モード信号2c、時間信号3aについての処理の流
れを表している。
を表す図3において、フロントエンド部は、ステップS
30の処理として、A/D変換器10によりディジタル
化された、少なくとも1フレーム分の映像信号2aをフ
レームメモリ11に蓄える。このフレームメモリ11
は、1フレーム分の映像信号2aを1サンプルとして扱
うようになされており、1フレーム分の映像信号2aが
入力されると、当該フレームメモリ11内に既に蓄積さ
れている映像信号2aが1フレーム分シフトし、最も時
間的に過去に入力された1フレームの映像信号2aが押
し出されて出力されるようになっている。
1の処理として、フレームメモリ11から映像信号2a
を読み出してカットチェンジ検出器12に送り、前述の
ようにして検出出力C[n]を求める。
32の処理として、当該検出出力C[n]を特徴量バッフ
ァ18に蓄える。
を表す図4において、フロントエンド部は、ステップS
33及びステップS34の処理として、A/D変換器1
3によりディジタル化された、音声信号2bを音声信号
バッファ14に入力すると共に、当該音声信号バッファ
14に少なくとも1フレーム周期T2分の音声信号2b
を蓄積する。この音声バッファ14は、1フレーム周期
T2分の音声信号2bを1サンプルとして扱うようにな
されており、1フレーム周期T2分の音声信号2bが入
力されると、当該音声バッファ14内に既に蓄積されて
いる音声信号2bが1フレーム周期T2分だけシフト
し、最も時間的に過去に入力された1フレーム周期T2
分の音声信号2bが押し出されて出力されるようになっ
ている。
フレーム周期T2分の音声信号2bが蓄積されると、フ
ロントエンド部は、ステップS35の処理として、当該
音声信号バッファ14に蓄積された音声信号2bを読み
出して振幅検出器15に送り、前述のようにして、平均
自乗振幅A[n]を求める。
36の処理として、音声信号バッファ14に蓄積された
音声信号2bを相関検出器16に送り、前述のようにし
て、相関係数ALR[n]と音声信号エネルギーALL[n]、A
RR[n]を求める。
プS37の処理として、音声信号バッファ14に蓄積さ
れた音声信号2bをスペクトル検出器17に送り、前述
のようにして、短時間離散スペクトルF[k;n]を求め
る。
38の処理として、図1の復調器2より供給された放送
モード信号2cから、前述のように離散化した数値B
[n]を求めると共に、図1の時計部3より供給された時
間信号3aから、前述のように離散化された数値T[n]
を求める。
められた、上記カットチェンジ検出器12からの検出出
力C[n]と、振幅検出器15からの平均自乗振幅A[n]
と、相関検出器16からの相関係数ALR[n]、音声信号
エネルギーALL[n],ARR[n]と、スペクトル検出器17
からの短時間離散スペクトルF[k;n]と、放送モード信
号2cの離散化数値B[n]と、時間信号3aの離散化数
値T[n]とからなる特徴量G[n]を、特徴量バッファ18
に蓄積する。
う。なお、以下の説明において、番号nは、特徴量バッ
ファ18内にフレーム毎に蓄積される特徴量の、各フレ
ーム番号を表わすものとする。また、最新のフレームの
特徴量をG[0]とし、過去のフレームの特徴量となるに
したがってnの値が増加し、新たなフレームの特徴量が
入力された場合には、全てのデータが1ずつシフト(フ
レーム番号が1ずつシフト)するものとする。
された特徴量は、フレーム毎にCM候補検出器19に送
られる。
Mが満たす、前述した「必須条件」に基づき、フレーム
毎にCM区間の候補を算出する。ここで、必須条件と
は、前述したように、CMの音声信号が「小音量」であ
ること、すなわち音声信号の音量が所定の閾値以下とな
っているフレーム(以下、音量条件と呼ぶ)であり、且
つ、CMの「映像切り替わり」があること、すなわち映
像信号が急激に変換するフレーム又は一様な輝度となる
フレーム(以下、映像条件と呼ぶ)であり、さらに、
「規定時間長(少数種類の時間長)」であること、すな
わち上記音量条件と映像条件を満たす2つのフレームの
間隔が所定のCM長と合致する区間(以下、時間条件と
呼ぶ)となるような条件であり、具体的には、前述の特
徴量を用いて、以下のような式(11)で且つ式(1
2)で且つ式(13)の条件として書き下すことができ
る。
n2,n3はそれぞれCM長として規定されている時間長
(本実施の形態では、一例として15秒、30秒、60
秒の3種類の時間長がある場合を説明に用いている)
を、フレーム周期単位に換算した数である。なお、CM
の実際の放送時間には誤差があるため、実用上は、
n1,n2,n3にはそれぞれ多少の幅を持たせる。
器19の動作の流れを説明する。
ステップS50のバッファシフト処理とステップS51
の特徴量入力処理として、図3のステップS32で説明
したフレームメモリと図4のステップS40で説明した
音声信号バッファと同様に、1フレーム単位の入力、シ
フト及び出力の動作を行うようになされている。すなわ
ち、特徴量バッファ18は、1フレーム分の特徴量を1
サンプルとして扱うようになされており、1フレーム分
の特徴量が入力されると、当該特徴量バッファ18内に
既に蓄積されている特徴量が1フレーム分だけシフト
し、最も時間的に過去に入力された1フレーム分の特徴
量が押し出されて出力されるようになっている。
処理により、特徴量バッファ18から1フレーム(1サ
ンプル)分の特徴量が入力されると、CM候補検出器1
9は、ステップS52及びステップS53の処理とし
て、1フレーム(サンプル)に特徴量が上記必須条件の
音量条件、映像条件、時間条件を満たすか否かの評価を
行う。すなわち。CM候補検出器19は、ステップS5
2において、先ず最初のフレームの平均自乗振幅A[0]
と所定の自乗振幅の閾値Athsdを比較し、次に、ステッ
プS53の処理として、前記検出出力C[0]が1となる
か否か調べることにより、当該フレームが上記必須条件
である音量条件、映像条件、時間条件を満たすか否かの
判定を行う。CM候補検出器19では、これらステップ
S52,S53の判定処理の結果、上記平均自乗振幅A
[0]が所定の自乗振幅の閾値Athsdを超えず、且つ、上
記必須条件を満たしていると判定した場合、当該フレー
ムをCM候補としてステップS57以降(ステップS5
4乃至S56については後述する)の処理に進み、逆
に、上記平均自乗振幅A[0]が所定の自乗振幅の閾値At
hsdを超えたか、或いは上記必須条件を満たしていない
と判定した場合、当該フレームがCM候補にはならない
としてステップS50の処理に戻る。
の結果、上記平均自乗振幅A[0]が所定の自乗振幅の閾
値Athsdを超えず、且つ、上記必須条件を満たしている
と判定された場合、CM候補検出器19は、ステップS
57の処理としてCM開始フレームnsを検索し、次
に、ステップS58の処理としてCM終了フレームne
の検索を行い、更に、ステップS59の処理としてCM
開始時刻Tsを計算し、ステップS60としてCM長さ
Wを計算する。
57乃至S60の検索及び計算を行った後、ステップS
61において後述するCM候補テーブルを参照し、も
し、CM開始時刻Ts及びCM長さTwの一致する候補が
すでに当該CM候補テーブル中に存在するならば、その
まま再びステップS54乃至S56の処理に戻り、逆に
存在しない場合には、新たなCM候補としてCM候補テ
ーブルに追加した後、再びステップS54乃至S56の
処理に戻る。
間長に対して上述同様の処理を行った後、ステップS5
0に戻り、次の入力に対して同じ処理を繰り返すことを
表している。
n1,n2,n3で表される各フレームのうち時間条件に
合致したフレームから、最新フレームの方向へ向かっ
て、平均自乗振幅A[n]が自乗振幅の閾値Athsdを越え
る最初のフレーム番号である。また、CM終了フレーム
neとは、0番目のフレームより過去の方向に向かっ
て、平均自乗振幅A[n]が自乗振幅の閾値Athsdを越え
ない最後のフレーム番号である。さらにCM開始時刻T
sは、CM開始フレーム番号nsを用いてTs=T[ns]と
して求められる。同様にCM長さTwは、Tw=T[ne]−
T[ns]として求められる。
示す。この図6に示すA[n]の項において、「o」は自
乗振幅の閾値Athsd未満の平均自乗振幅を持つフレーム
を示し、「x」は自乗振幅の閾値Athsd以上の平均自乗
振幅を持つフレームを示している。この例では、A
[0],C[0]及びA[n1],C[n1]が条件を満たし、n1よ
り左方で最初にA[n]=xとなるフレームがns、0より
右方に連続する最後のA[n]=oとなるフレームがneと
なる。
は、1フレーム(1サンプル)の特徴量が入力される毎
にCM候補の検出を行い、CM候補が検出された場合に
はCM候補テーブルにエントリーする。
す。この図7において、CM候補テーブルの項目は、開
始時刻Ts、長さTw、及び後述する付加条件算出器20
で算出する特徴量Q1乃至Q11、及び後述する付加条件
判定器21で算出するスコアRとスコア判定結果Zから
なる。CM候補検出器19によるCM候補テーブル19
aの段階では、開始時刻Ts、長さTwのみが記述され
る。このように、CM候補テーブルは、CM候補検出器
19で得られるCM開始時刻Ts、長さTwと、付加条
件算出器20で算出される特徴量Q1乃至Q11と、付加
条件判定器21で算出されるスコアR及びスコア判定結
果Zとを記述し、それら特徴量を管理するための表であ
る。また、CM候補テーブルは、そのエントリーがCM
であるかないかの判定を受けるまで保持され、CMであ
ると判断された場合には、後述するルール判定器22か
らCM検出出力4aとして出力され、CMでないと判断
された場合には破棄される。
s、長さTwのみが記述されたCM候補テーブル19a
は、付加条件算出器20に送られる。
ル19aにエントリーされた候補区間より、特徴量バッ
ファ18を参照しながら、以下に示すような特徴量Q1
乃至Q11を抽出し、それをCM候補テーブル19aに追
加記述し、CM候補テーブル20aとして付加条件判定
器21に出力する。
る特徴量Q1乃至Q11の算出例を示す。
(離散時間に相当)を表し、図8(A)はカットチェン
ジ検出出力C[n]、図8(B)は放送モード信号2cの
離散化数値B[n]、図8(C)は音声信号の短時間離散
スペクトルS[k,n]、図8(D)は音声信号の平均自乗
振幅A[n]を表わし、n1の間隔(図中点線で挟まれた区
間)がCM候補である。なお、図8(A)において、図
中CTで示す位置はカットチェンジ検出出力C[n]が1
となっている位置(すなわちカットチェンジが検出され
た位置)を示している。また、図8(B)において、図
中Mで示す区間はその区間が何らかの放送モードとなっ
ていることを示している。図8の(C)において、図中
S1,S2,S3,S4は何らかのスペクトル成分が存
在することを示し、図8(D)において、図中AMは自
乗振幅の変化を表している。また、図中Q1からQ
11は、上記付加条件算出器20にて特徴量Q1乃至Q11
が計算される場所を示している。
特徴量Q1乃至Q11について個々に説明する。
ブレーク長とは、CM候補区間直前の小音量区間(前ブ
レーク区間と称する)、すなわち連続してA[n]が所定
の閾値Athsd以下である時間長であり、図8中の一点鎖
線で挟まれた区間長BBが前ブレーク長Q1である。
ブレーク長とは、CM候補区間直後の小音量区間(後ブ
レーク区間と称する)、すなわち連続してA[n]が所定
の閾値Athsd以下である時間長であり、図8中の一点鎖
線で挟まれた区間長ABが後ブレーク長Q2である。
当該前ブレーク最小振幅Q3は、前記の前ブレーク区間
におけるA[n]の最小値である。
当該後ブレーク最小振幅Q4は、前記の後ブレーク区間
におけるA[n]の最小値である。
相関値Q5は、CM候補区間の音声の左右2チャンネル
の音声信号SL[m]、SR[m]の相関値である。これは、式
(5)乃至式(7)のALR[n],ALL[n],ARR[n]を利
用して、式(14)に従って算出することができる。
ーバーラップにより原波形が部分的に複数回加算される
ことになるが、そのことはこのシステムに実質的な影響
は及ぼさない。また、原波形をそのまま保持できるだけ
のメモリ容量及び処理速度がある場合には、この演算は
原波形の相互相関と置き換えることもできる。
振幅値Q6は、CM候補区間の音声信号の振幅のRMS
値(平均自乗振幅)である。これは、式(15)により
計算することができる。
演算の場合と同様に、フレームのオーバーラップ次第で
は原波形が部分的に複数回加算されることになるが、そ
のことは実質的な影響を及ぼさない。また、原波形をそ
のまま保持できるだけのメモリ容量及び処理速度がある
場合には、この演算は原波形のRMS演算と置き換える
こともできる。
数Q7は、CM候補区間中に存在するカットチェンジの
回数(上記CTの数)を数える演算となる。すなわちこ
れは、[ns,ne)の区間でC[n]=1となる回数を数える
演算となる。
放送モードは、CM候補区間中で最も支配的な放送モー
ドのことである。これは、[ns,ne)の区間のB[n]値
の中で、最も頻発する放送モードQ8を選ぶ演算であ
る。
候補数Q9は、あるCM候補に対して、その前後にある
有音区間もCM候補であるかどうかを表わし、両側とも
CM候補であれば「2」、片側のみCM候補であれば
「1」、どちらもCM候補でなければ「0」の値をと
る。この演算は、CM候補テーブルを検索することで行
われ、開始時刻Tsと長さTwと後ブレーク長Q2の和
(Ts+Tw+Q2)が、他のCM候補の開始時刻
(T's)と一致するかどうかで後側候補の判定が行われ
る。同様に、開始時刻Tsと前ブレーク長Q1の差(Ts
−Q1)が、他のCM候補の開始時刻T'sと長さT'wの
和(T's+T'w)と一致するかどうかで、前側候補の判
定が行われる。
ギーである。当該スペクトル差分エネルギーQ10,Q11
は、CMと番組本編やCMと他のCMとの境界での音質
変化を定量化するために用いられる。これは、上記境界
の両側における平均スペクトルの差の自乗和として定義
され、式(16)乃至(21)に従って計算される。
フレーム数、n'eはCM候補区間の直前の有音区間の終
了フレーム番号(図8参照)、n'sはCM候補区間の直
後の有音区間の開始フレーム番号、S1[k]はCM候補区
間の直前の有音区間の終了直前の平均スペクトラム、S
2[k]はCM候補区間開始直後の平均ズクトラム、S3[k]
はCM候補区間終了直前の平均スペクトラム、S4[k]は
CM候補区間の直後の有音区間の開始直後の平均スペク
トラム、Snormは適切な規格化定数である。
出したQ1からQ11までの特徴量を、CM候補テーブル
19aに追加記述し、CM候補テーブル20aとして出
力する。当該CM候補テーブル20aは、付加条件判定
器21に送られる。
20aを入力とし、CM候補の特徴量を、閾値関数など
により非線型にパラメータ変換した後、荷重加算するこ
とでCM候補に対するスコアRを算出し、Rが所定の閾
値以上である場合には有力CM候補と判定する。付加条
件判定器21は、これらスコアRとスコア判定結果Zを
CM候補テーブル20aに追加記述し、CM候補テーブ
ル21aとして出力する。
を示す。
aの各特徴量Q1乃至QLは、それぞれ対応する関数演算
器501乃至50Lに送られ、それぞれ対応するパラメー
タ変換関数H1()乃至HL()による変換演算が施された
後、さらにそれぞれ対応する重み付け器511乃至51L
により荷重W1乃至WLとの積がとられる。各重み付け器
511乃至51Lにより重み付けがなされた後の特徴量
は、総和加算器52での総和加算によりスコアRが算出
される。この総和加算器52から出力されたスコアR
は、スコア判定器53にて所定の閾値と比較され、スコ
アRが所定の閾値以上である場合には有力CM候補であ
る旨を示す判定結果が出力される。なお、スコア判定器
53によるスコア判定により所定の閾値未満であると判
定されたCM候補は、テーブルから消去される。
定器21におけるスコア算出演算は、式(22)に従っ
て行われる。
めるパラメータ変換関数、Wlは予め決定しておく荷
重、Lは特徴量数(=11)である。なお、lは1乃至
11のうちの任意の数である。
けるパラメータ変換関数Hl()は、最も簡単には矩形関
数でよい。すなわち例えば、図10(B)に示すような
矩形関数Rect(x;t1,t2)を用い、予め各特徴量につい
て決定しておく標準値の下上限値をt1l,t2lとし、式
(23)により例えばQ1が標準値の範囲内ならば1、
範囲外ならば0となるようにする。
移させるようにする場合には、例えば式(24)のよう
な、シグモイド関数Sigm(x;t1,t2)を用いることもでき
る。
す。ただし、s1l,s2lは推移の程度を表わす定数であ
り、予め特徴量の分布などに基づき決定しておく。
よる加算荷重Wlは、予め特徴量の統計的性質に基づき
人為的に決定しておくこともできるが、既知の学習サン
プルに対して、ニューラルネットワーク(例えば中川著
「パターン情報処理」丸善(1999)などに詳説)の要領
で学習することで、自動的に荷重を決定することも可能
である。なお、lは1乃至11のうちの任意の数であ
る。
定は、式(25)のように、スコアRの閾値処理により
行う。
x>0で1、x<0で0となる単位ステップ関数であ
り、trは予め定めるか或いは学習により自動的に決ま
る判定閾値である。
判定器21でのスコア判定により得られたCM候補テー
ブル21aを入力とし、後述するような所定のルール判
定により最終的なCM検出出力4aとしてCM開始時刻
と長さを出力する。すなわち、当該ルール判定器22で
は、同一時刻に複数のCM候補があった場合(以下、競
合関係という)に、どちらがよりCMとして確からしい
かをルール処理により判定する。
フローチャートを用いて説明する。
0として、CM候補テーブルより、判定すべきCM候補
を選択する。この選択は、CM候補テーブル中で最古の
候補であり、予め設定された時間T4が経過したものか
ら順に行われる。T4は、数個のCMが十分含まれる程
度の時間長であり、例えば150秒間とする。
71として、選択したCM候補の区間中(TsからTs
+Twまでの間)に、他のCM候補が存在するかどう
か、CM候補テーブル中を検索する。このステップS7
1において、他のCM候補が存在しないと判定した場合
(No)、このCM候補はCM検出出力として出力さ
れ、CM候補テーブルより消去される。
候補が存在すると判定された場合(Yes)、それらは
競合関係にあるとして、ステップS72にて先ず最小長
さ優先ルールが適用される。ここで、最小長さ優先ルー
ルは、ある時区間が、複数の長さの異なるCM候補の組
み合わせにより構成され得る場合、より短いCM候補で
構成されている方を優先するというルールである。すな
わち、例えば30秒という時区間に対して、1つの30
秒CMという可能性と、2つの15秒CMの組み合わせ
という可能性の、両方が同時に候補として存在する場合
には、15秒CMを選択し、30秒CMを棄却するとい
うルールである。
の一例を説明する。
実際には4つのCM1乃至CM4が連続して放送されて
いる区間に対し、図12(B)中A乃至Hで示すような
8つの候補がCM候補テーブルに存在する場合が示され
ている。
M候補が判定中であるとすると、この候補Aと競合する
候補はEとHである。しかしながら、Eの区間はAとB
で記述でき、また、Hの区間はAとBとCとD等で記述
できることから、それぞれ棄却され、Aが採用される。
続いて、図12(D)に示すように、Bが判定中となっ
たときには、Fが競合相手となる(このとき、E、Hは
Aの判定により棄却済みとなっている)が、Fの区間は
BとCで記述できることから棄却され、Bが採用され
る。同様に、図12(E)に示すように、Cが判定中の
場合には、Gが競合相手となるが、Gの区間はCとDで
記述されることから棄却され、Cが採用される。最後
に、図12(F)に示すように、Dが判定されるときに
は、すでに競合相手は存在しないので、そもそもこのル
ールを適用する必要はなく、当該Dがそのまま採用され
る。
としてA,B,C,Dが選択されることとなる。このル
ールが適用できない競合関係については、そのままCM
候補テーブルに残してこの処理を終了する。
定の後、ルール判定器22の処理は、ステップS73に
進む。ステップS73に進むと、ルール判定器22は、
最小長さ優先ルールを適用した結果、判定中のCMが棄
却されたか否か判断する。このステップS73におい
て、判定中のCMが棄却されと判断した場合(Ye
s)、ルール判定器22は、その候補をCM候補テーブ
ルから消去し、ステップS70に戻る。一方、ステップ
S73において、判定中のCMが棄却されていないと判
断した場合(No)、ルール判定器22は、ステップS
74において、再び判定中のCM候補の区間中に他のC
M候補が存在するかどうか、テーブル中を検索する。
が存在しないと判定した場合(No)、ルール判定器2
2は、ステップS80において判定中のCM候補をCM
検出出力から出力し、CM候補テーブルから消去する。
一方、ステップS74にて他のCM候補が存在すると判
断した場合(Yes)、ルール判定器22の処理は、ス
テップS75に進む。
2は、隣接優先ルールを適用する。ここで、隣接優先ル
ールとは、複数のCM候補が競合関係にある場合、それ
ぞれ直前又は直後に隣接するCM候補を検索し、それが
存在する方を優先するというルールである。
いて説明する。
実際には4つのCM11乃至CM14が連続して放送さ
れている区間に対し、図13(B)中I乃至Nで示すよ
うな6つの候補が存在する場合が示されている。また、
この例の場合、候補M及びNは、偶然CM中にカットチ
ェンジや小音量区間が存在したために候補となっている
が、このような候補は、実際には誤った区間であるとは
いえ、内容的にはCMを含んでいるため、CMらしさを
判定する付加条件のスコア判定によっても、棄却されな
い場合があるものである。
(C)に示すように、最古のIが判定される候補とな
る。当該Iと競合するものとしてMがあるが、Iには隣
接する候補Jが存在するのに対し、Mには隣接する候補
がないため、Iを採用し、Mを棄却する。次に、図13
(D)に示すように、Jが判定される候補となった場
合、Jと競合する候補としてNがあるが、Jには隣接す
る候補I、Kが存在するのに対し、Nには存在しないた
め、Jが採用されNが棄却される。次に、図13
(E),(F)に示すように、残りの候補K、Lには、
既に競合する候補がなくなるため、このルールは適用さ
れず、これらK、Lがそのまま採用される。
らは、I,J,K,LがCM候補として選択されること
となる。
補が無い場合、及び複数の候補にそれぞれ隣接候補があ
る場合には、それらはどちらも棄却されず、CM候補テ
ーブルに残される。
ルール判定器22の処理は、ステップS76に進む。ス
テップS76に進むと、ルール判定器22は、隣接優先
ルールを適用の結果、判定中のCMが棄却されたか否か
判断する。このステップS76において、判定中のCM
が棄却されたと判断した場合(Yes)、ルール判定器
22は、その候補をCM候補テーブルから消去し、ステ
ップS70の処理に戻る。一方、ステップS76におい
て棄却されていないと判定された場合(No)、ルール
判定器22は、次のステップS77において、再び判定
中のCM候補の区間中に、他のCM候補が存在するかど
うか、CM候補テーブル中を検索する。
補が存在しなと判定された場合(No)、ルール判定器
22は、ステップS80において、判定中のCM候補を
CM検出出力から出力し、CM候補テーブルから消去す
る。一方、ステップS77において、他のCM候補が存
在すると判定した場合(Yes)、ルール判定器22
は、ステップS78において、スコア優先ルールを適用
する。ここで、スコア優先ルールとは、上記の各ルール
によっても競合関係が解消されない場合、付加条件判定
器21により得られた判定スコアRの高い候補を優先す
るというルールである。このスコア優先ルールは、対象
となる競合関係が解消するまで繰り返し適用する。
ついて説明する。
実際には4つのCM21乃至CM24が連続して放送さ
れている区間に対し、図14(B)中P乃至Wで示すよ
うな7つの候補が存在する場合が示されている。
すように、最古のPが判定される候補となるが、この候
補PはUと競合関係がある。但し、このときの競合関係
は、前記最小長さ優先ルールによっても、また、隣接優
先ルールによっても競合が解消されない。
係にある候補と関連する全ての競合関係を、CM候補テ
ーブル中から検索する。すなわち、この場合は、(P−
U)、(U−Q)、(Q−V)、(V−R)、(R−W)、(W−
S)という、7候補に対する6つの競合関係が全て関連
しているので、スコア優先ルールでは、これら関連する
候補の中で最もスコアの高い候補を採用する。この例の
場合、判定スコアR(2.0)が最も高いスコアであるた
め、図14(D)に示すように、このスコアが採用さ
れ、その結果、Rと競合関係にある候補V、Wは棄却さ
れる。
に、これによっても(P−U)の競合関係は解消されて
いない。したがって、再びこれらと関連する全ての競合
関係を、CM候補テーブル中から検索する。今回は、V
が棄却されたことにより、(P−U)、(U−Q)という、
3つの候補が関係する2つの競合関係のみとなる。
高い候補Q(1.9)を採用し、図14(F)に示すよう
に、Qと競合関係にある候補Uを棄却する。
くなり、Pが採用される。また、U、V、Wは全て棄却
され、Q、R、Sが採用されることとなる。
索せず、対象となる競合関係(この例の場合、P,U)
のみでスコア優先ルールを適用すると、先ずUが採用さ
れ、Pは棄却される。後にUとQとの競合関係により、
一時採用されたUもまた棄却されてしまう。このよう
に、ルール判定器22では、偶然の処理順序により候補
Pが棄却されるようなことのないよう、関連競合関係の
検索を行っている。
た候補に関する競合関係は必ず解消されることになる。
ルール判定器22の処理は、ステップS79に進む。ス
テップS79に進むと、ルール判定器22は、スコア優
先ルールを適用の結果、判定中の候補が棄却されたか否
か判断する。このステップS79において、判定中の候
補が棄却されたと判断した場合(Yes)、ルール判定
器22は、その候補をCM候補テーブルより消去し、ス
テップS70に戻る。一方、ステップS79において、
棄却されなかった場合、ルール判定器22は、ステップ
S80のCM検出出力として、開始時刻とその長さを出
力し、CM候補テーブルから消去した後、ステップS7
0に戻る。
の具体例のCM検出部4においては、ほぼ全てのCMが
満足する必須条件に基づき、決定論的に番組中からCM
の候補を抽出し、CMらしさの指標である付加条件に基
づく特徴量の統計論的な評価により候補を選択し、論理
条件により候補のオーバーラップ関係を解消すること
で、精度の高いCM検出を実現している。また、本実施
の形態では、例えば現行のアナログTV放送の映像音声
記録装置を例にとったが、ディジタルTV放送等に適用
される場合にも同様のCM検出部4が適用できることは
明らかである。また、例えばラジオ放送に適用される場
合には、上記CM検出部4から映像信号の処理を担当す
る部分を省略することで同様の機能が実現できる。
検出部4について以下に説明する。
のCM検出部4の詳細な構成を示す。
した付加条件の中でも基本的なもののみを実装するよう
にしており、前述した1)乃至14)の付加条件のう
ち、11)乃至14)に関しては導入しないことで、装
置構成を簡略化している(複雑になることを防いでい
る)。
の例と同様にフロントエンド部とバックエンド部とから
構成されている。なお、この図15において、図2の各
構成要素と同じ動作を行う部分については、同一の指示
符号を付して、それらの説明は省略する。
された各構成要素(101,102,103)と、付加
条件算出器20において新たに拡張された機能について
のみ説明する。
101は、ディジタル化及びフレーム化された音声信号
2bを入力とし、この音声信号2bの該当フレームに関
する音源名を出力する。音源名としては、例えば、音
声、音楽、音声と音楽、その他を挙げることができる。
なお、入力された音声信号の音源識別を実現する技術と
しては、例えば、河地、他による、「VQ歪みに基づく
放送音の自動分類」信学技報、DSP97-95/SP97-50、43/4
8(1998)に記載された技術や、南、他による、「音情報
を用いた映像インデクシングとその応用」信学論、Vo1.
J81-D-II、No.3,529/537(1998)に記載された技術、安
部による、特願平11−190693号の明細書及び図
面に記載された技術などがあり、これらを利用すること
ができる。
音源名は、例えば音声=1、音楽=2、などのように、
各フレーム毎に適切に数値化され、特徴量U[n]として
特徴量バッファ18に入力される。
ルデータ又は番組ジャンル識別器102は、現在処理し
ている番組のジャンル名を出力するものである。番組ジ
ャンルは、例えば、ニュース、ドラマ、野球、サッカー
などである。番組ジャンルデータは、テレビ番組表など
から入力してもよく、また近年ではインターネット等を
通じて自動的に取得することもできる。または、外部情
報に頼らず音声及び映像信号から番組ジャンルを識別す
る装置を用いることも可能である。なお、音声及び映像
信号から番組ジャンルを識別する技術としては、例えば
安部による、特願平11−190693号の明細書及び
図面に記載された技術などを利用することができる。
識別器102により分類された番組ジャンル名は、例え
ばニュース=1、ドラマ=2、などのように、各フレー
ム毎に適切に数値化され、特徴量W[n]として特徴量バ
ッファ18に入力される。
は、図2の例と同様である。
部に、上記音源識別器101と番組ジャンルデータ又は
番組ジャンル識別器102を設け、これらにより得られ
た各特徴量U[n]とW[n]を特徴量バッファ18に蓄積
することで、当該特徴量バッファ18においては、式
(10)に示した特徴量G[n]が、式(26)のように
拡張されることになる。
と同様のものであるが、当該第2の具体例の場合、CM
候補テーブル19a乃至21aは、次のように拡張され
る。すなわち、この第2の具体例の場合のCM候補テー
ブル19a乃至21aは、前述したQ1からQ11までの
特徴量に加え、図16に示すように、後述する特徴量Q
12からQ15が拡張される。なお、図16は、Q1からQ
11までの特徴量についての図示を省略している。
ース103には、予め、時間帯に応じたCMの放送確
率、及び、番組ジャンルと経過時間に応じたCMの放送
確率をデータとして蓄積してある。このCM確率データ
ベース103からは、現在時刻に応じてそれらの確率が
読み出され、付加条件算出器20に入力するようになさ
れている。なお、これらの確率のデータは、実際の放送
を元に統計をとることで作成することができる。
20は、前述の特徴量Q1からQ11に加え、次の特徴量
Q12からQ15の演算を行うよう拡張される。
に、音声区間があったどうかを検出して求められるもの
である。音声の有無を表す特徴量Q12は、式(27)に
従って検出される。
CM候補区間中に、音楽区間があったどうかを検出して
求められるものである。この音楽の有無を表す特徴量Q
13は、式(28)に従って検出される。
生確率(時間帯確率)である。付加条件算出器20で
は、CM確率データベース103より提供されるCMの
放送確率を、そのまま特徴量Q14に代入する。
の開始からの経過時間に従うCMの放送確率(番組ジャ
ンル確率)である。付加条件算出器20では、CM確率
データベース103より提供されるCMの放送確率を、
そのまま特徴量Q15に代入する。
特徴量Q12乃至Q15が拡張されるだけであり、前述の図
2のCM検出部4の場合と同様であるため、説明を省略
する。
の拡張により、放送信号の音源に応じたCM検出を行う
ことができ、また、現在時間に応じたCM検出を行うこ
と、さらに、番組ジャンルに応じたCM検出を行うこと
が可能となる。
ば、図17に示すように、小振幅回数、小振幅区間、お
よび信号分散を、それぞれ特徴量Q16乃至Q18として、
付加条件算出器20により算出させるようにすることが
できる。
設定されている所定の閾値を下回る回数を意味する。付
加条件算出器20は、例えば、図18のフローチャート
に示すような処理を行うことで、小振幅回数を計算す
る。
CとフラグFがリセットされる。カウンタCには、小振
幅回数が保持され、フラグFは、小振幅区間であること
を表す。ステップS90においては、さらに、時刻nが
CM候補の開始時刻に設定される。
信号A[n]が取得される。nは、離散化された時刻に
対応する。
セットされているか否かが判定され、セットされていな
い場合、ステップS93に進み、ステップS91で取得
された信号振幅A[n]が、予め設定されている所定の
閾値A1より小さいか否かが判定される。音声信号の振
幅A[n]の値が閾値A1より等しいか、それより大き
いと判定された場合、ステップS97に進み、時刻nの
値がインクリメントされる。そして、ステップS98に
おいて、時刻nの値がCM候補の終了時刻に達したか否
かが判定され、終了時刻に達していない場合には、ステ
ップS91に戻り、次の時刻のタイミングにおける振幅
A[n]が取得される。
て、振幅A[n]の値が閾値A1より小さいと判定され
るまで繰り返し実行される。ステップS93において、
振幅A[n]の値が閾値A1より小さいと判定された場
合、ステップS94に進み、カウンタCの値が1だけイ
ンクリメントされ、かつ、フラグFがセットされる。
インクリメントされ、ステップS98において、インク
リメントされた時刻nの値がCM候補の終了時刻に達し
ているか否かが判定され、まだ達していない場合には、
ステップS91に戻り、次のタイミングの振幅A[n]
が取得される。
Fがセットされているか否かが判定され、いまの場合、
フラグFがセットされているので、ステップS95に進
み、ステップS91で取得された振幅A[n]の値が、
予め設定されている閾値A2より大きいか否かが判定さ
れる。なお、この閾値A2の値は、ステップS93にお
いて比較される閾値A1より大きい値(A2>A1)と
されている。
値が閾値A2より大きくないと判定された場合、ステッ
プS97に進み、時刻nの値がインクリメントされる。
M候補の終了時刻に達しているか否かが再び判定され、
達していない場合には、ステップS91に戻り、次のタ
イミングの振幅A[n]が取得される。
トされているか否かが再び判定され、いまの場合、まだ
セットされているので、ステップS95に進み、取得さ
れた振幅A[n]が閾値A2より大きくないと判定され
た場合、ステップS97に進み、上述した場合と同様の
処理が繰り返し実行される。
より小さい閾値A1より小さいと判定された場合、カウ
ンタCの値が1だけインクリメントされた後、振幅A
[n]の値が、閾値A1より若干大きい値の閾値A2よ
り大きくなるまで待期する。
値が閾値A2より大きいと判定された場合、ステップS
96に進み、フラグFがリセットされる。その後ステッ
プS97に進み、時刻nの値がインクメントされる。ス
テップS98において、時刻nの値がCM候補の終了時
刻に達したか否かが判定され、達していない場合には、
ステップS91に戻り、それ以降の処理が繰り返し実行
される。
M候補の終了時刻に達したと判定された場合、処理は終
了される。
A2の値を、ステップS93の処理において設定される
閾値A1より大きく設定することで、判定処理に、いわ
いるヒステリシス特性を持たせることが可能となる。す
なわち、振幅A[n]の値が、より小さい閾値A1より
小さくなったとき、小振幅区間に入ったと判定される
が、振幅A[n]の値が、閾値A1より若干大きくなっ
ても、閾値A2より小さい場合には、まだ小振幅期間中
であると判定され、閾値A1より大きい閾値A2よりさ
らに大きくなったとき、初めて、小振幅期間が終了した
と判定される。これにより、小振幅期間中のわずかな振
幅の変化に起因して、小振幅回数が必要以上に大きな値
にカウントされることが防止される。
る小振幅の回数がカウンタCに設定され、このカウンタ
Cの値が特徴量Q16として出力される。
の例を表している。図19における横軸は、小振幅回数
を表し、縦軸は、相対度数を表している。図19(A)
のグラフは、実験データから得られた490個のCM候
補のうち、実際にCMであった352個の度数分布を表
しており、図19(B)は、そのうちのCMでなかった
138個の度数分布を表している。すなわち、図19
(B)は、本編中で偶然、音量条件や映像条件が満たさ
れたためにCM候補として検出されたものである。
Mである場合(図19(A))、小振幅回数は、0回か
ら2回に集中するのに対して、CMでない場合には(図
19(B))、小振幅回数は、7回乃至9回と多くなる
ことがわかる。
て、CM検出部4の付加条件算出器20が実行する小振
幅区間長計算処理について説明する。最初に、ステップ
S110において、小振幅区間長を表すカウンタDの値
がリセットされ、かつ、時刻nの値がCM候補の開始時
刻にセットされる。
の振幅A[n]が取得され、ステップS112におい
て、ステップS111で取得された振幅A[n]の値
が、予め設定されている所定の閾値A1より小さいか否
かが判定される。この閾値A1は、図18のステップS
93における閾値A1と等しい値とされているが、異な
る値とすることも可能である。
の値が閾値A1と等しいか、それより大きいと判定され
た場合、ステップS114に進み、時刻nの値がインク
リメントされる。そして、ステップS115において、
インクメントされた時刻nの値が、CM候補の終了時刻
に達したか否かが判定され、終了時刻に達していない場
合には、ステップS111に戻り、次のタイミングの振
幅A[n]が取得される。
プS112において、閾値A1より小さいか否かが再び
判定され、振幅A[n]の値が閾値A1より小さくない
場合には、ステップS114に進み、時刻nの値がさら
にインクメントされる。
テップS112において、振幅A[n]の値が、閾値A
1と等しいか、それより大きいと判定された場合、ステ
ップS113に進み、カウンタDの値が1度だけインク
メントされる。その後、ステップS114に進み、時刻
nの値がインクリメントされる。ステップS115にお
いて、時刻nの値が、CM候補の終了時刻に達したか否
かが判定され、達していない場合には、ステップS11
1に戻り、次のタイミングの振幅A[n]が取得され、
ステップS112において、その振幅A[n]の値が、
閾値A1より小さいか否かが再び判定される。振幅A
[n]の値が閾値A1より小さい場合には、ステップS
113において、カウンタDの値が再び1だけインクリ
メントされる。
とで、カウンタDの値は、振幅A「n」の値が閾値A1
より小さい期間に対応する値となる。
CM候補の終了時刻に達したと判定された場合、ステッ
プS116に進み、カウンタDの値が規格化される。す
なわち、カウンタDの値は、サンプリング周波数fSで
割算されることで、規格化され、その値が特徴量Q17と
して出力される。
490個のCM候補のうちの352個の実際のCMと、
138個のCMでなかった場合の小振幅区間長の総和を
表している。図21において、横軸は、小振幅区間長の
総和(単位は秒)を表し、縦軸は、相対度数を表してい
る。図21(A)と図21(B)を比較して明らかなよ
うに、CMの小振幅区間長の総和は、20ms程度以下に
集中している(図21(A))のに対して、CMでない
場合には、1.0s以上の長さに集中している(図21
(B))。
の振幅の分散を式(29)に基づいて演算する。この式
(29)において、sは、CM候補の離散開始時刻を表
し、eは、CM候補の離散終了時刻を表し、vは、信号
の分散を表す。付加条件算出器20は、この値vをその
まま特徴量Q18として出力するか、あるいはその平方根
を取って、標準偏差を特徴量Q18として出力する。ある
いはまた、付加条件算出器20は、標準偏差を平均値で
割算し、相対標準偏差を特徴量Q18として出力すること
ができる。
図22(A)は、490個のCM候補のうちの、352
個の実際にCMであった場合の振幅の分散を表してお
り、図22(B)は、138個のCMでなかった場合の
分散を表している。なお、図22において、横軸は、相
対標準偏差を表しており、縦軸は、相対度数を表してい
る。
Mの場合(図22(A))、振幅の相対標準偏差がほぼ
0.6以下に集中しているのに対して、CMでない場合
には(図22(B))、0.7以上となることが多いこ
とがわかる。
び振幅分散を特徴量として利用することで、より正確に
CMを検出することが可能となる。
映像音声記録装置について以下に説明する。
記録装置の概略構成を示す。
要素と同じ動作を行う部分については、同一の指示符号
を付して、それらの説明は省略する。また、第2の実施
の形態の映像音声記録装置の場合のCM検出部4は、前
記第1の具体例、第2の具体例、および第3の具体例の
何れも適用できる。
された各構成要素(110,111)と、CM検出部4
において新たに拡張された機能についてのみ説明する。
録装置におけるCM検出部4は、前述のように、式(1
0)に示される各CM候補の特徴量G[n]を、内部で算
出している。また、当該第2の実施の形態の場合、CM
検出部4は、最終的にCMとして検出されたものに関し
て、その開始時刻及び時間長と共に、CM開始フレーム
n=nsから終了フレームn=neに渡って、G[n]をC
Mデータベース110に出力するように機能が拡張され
ている。
たCMに関して、その開始時刻、時間長、特徴量G[n]
を保存する。
する検索指令に基づき、データベース110に保存され
ている全て又は一部のCMから、ユーザが指定したCM
と同じCMを抽出し、CM検索出力111aとして出力
する。
24を用いて説明する。
による映像信号及び音声信号を視聴することにより、検
索したいCMを選択したとする。このとき、CM特徴量
比較器111には、ステップS120として、上記ユー
ザによる選択に応じた検索指令が入力されることにな
る。
テップS121の処理として、上記入力された検索指令
に基づいて、CMデータベース110から、その検索指
令に該当するCMの特徴量G[n]を取得する。
ップS122としてCMデータベース110より、検索
される候補CMを一つ選択し、さらにステップS123
として、その候補CMに対応する特徴量G'[n]を取得す
る。
プS124として、上記選択されたCMについて、式
(30)の計算を行い、それを予め定める所定の閾値J
thsdと比較する。
J(G,G')<Jthsdと判定したならば(Yes)、
CM特徴量比較器111は、ステップS125に進み、
特徴量が一致したとして検索結果を出力し、ステップS
122に戻って再び他の候補CMについて同様の処理を
行う。一方、ステップS124において、J(G、G')
<Jthsdでないと判定した場合(No)、CM特徴量比
較器111は、特徴量が一致しなかったとして、ステッ
プS122に戻り、再び他の候補CMについて同様の処
理を行う。
は、ユーザにより指定されたCMと同じCMを、映像音
声記録部5に記録されているデータの中から検索するこ
とができる。
に示したCM検出部4を実装する場合のハードウェア構
成の一例を示す。
は、前記図2や図15のA/D変換器10及び13の機
能を備え、メモリ41は、前記フレームメモリ11及び
音声信号バッファ14の機能を備えている。
ルシグナルプロセッサ)42は、前記カットチェンジ検
出器112、振幅検出器15、相関検出器16、スペク
トル検出器17、音源識別器101等の機能を備え、メ
モリ43は、前記特徴量バッファ18の機能を備えてい
る。
9、付加情報算出器20、付加条件判定器21、ルール
判定器22、CM確率データベース103等の機能を備
えている。
/VプロセッサまたはDSP(ディジタルシグナルプロ
セッサ)42か、或いは、プロセッサ44が備えること
ができる。
によれば、TV放送信号からCM部分を正確に検出可能
とすることにより、例えばCMを不要としている視聴者
や、CMを必要としている視聴者の双方に対して利便を
図ることが可能となる。すなわち例えばCM部分を不要
とする場合、テレビ放送信号からCM部分をスキップし
て視聴可能とする装置を実現でき、これは例えば番組本
編のみを連続視聴する要求に対して有用な装置となる。
また例えば、CM部分のみを必要とする場合、TV放送
信号からCM部分のみを視聴できる装置を実現でき、こ
れは例えばCMのみを連続視聴する要求に対して有用な
装置となる。
に検出可能とすることにより、例えば特定のCMの放送
状況を調査する場合などにも有用となる。
は、入力信号から所定の時間間隔で発生する信号の特徴
的パターンに基づいて、第1の信号の候補区間を検出
し、その候補区間内又はその前後の入力信号から第1の
信号らしさを表わす特徴量を抽出し、その特徴量に基づ
き第1の信号の区間を検出するようにしたので、例え
ば、TV放送信号に含まれるコマーシャルメッセージ部
分を高精度に検出又は検索可能となる。
の概略構成図である。
る。
号処理の流れを示すフローチャートである。
号処理の流れを示すフローチャートである。
れを示すフローチャートである。
ーブルを示す図である。
算出例の説明に用いる図である。
形関数、シグモイド型関数の説明に用いる図である。
ートである。
る。
ある。
テーブル(拡張部分のみ)を示す図である。
テーブル(拡張部分のみ)を示す図である。
回数計算処理を説明するフローチャートである。
区間長計算処理を説明するフローチャートである。
置の概略構成図である。
チャートである。
ードウェア構成図である。
M検出器、 5 映像音声記録部、 10,13 A/
D変換器、 11 フレームメモリ、 14音声信号バ
ッファ、 12 カットチェンジ検出器、 15 振幅
検出器、 16 相関検出器、 17 スペクトル検出
器、 18 特徴量バッファ、 19CM候補検出器、
20 付加条件算出器、 21 付加条件判定器、
22ルール判定器、 23 動作制御部、 101 音
源識別器、 102 番組ジャンルデータまたは番組ジ
ャンル識別器、 103 CM確率データベース、11
0 CMデータベース、 111 CM特徴量比較器
Claims (53)
- 【請求項1】 少なくとも第1の信号の区間とそれ以外
の信号の区間とが時分割的に存在する入力信号から、所
定の時間間隔を持つ信号の特徴的パターンに基づいて、
第1の信号の候補区間を検出する候補区間検出手段と、 上記候補区間内又はその前後の入力信号から、上記第1
の信号らしさを表わす特徴量を抽出する特徴量抽出手段
と、 上記特徴量に基づき、上記第1の信号の区間を検出する
検出手段とを有することを特徴とする信号処理装置。 - 【請求項2】 上記検出手段は、上記特徴量に基づいて
上記候補区間が上記第1の信号である可能性を評価する
特徴量評価手段と、上記評価結果に基づいて上記第1の
信号の区間を判定する判定手段とを有することを特徴と
する請求項1記載の信号処理装置。 - 【請求項3】 上記検出手段は、上記特徴量に基づい
て、上記候補区間の信号と、別途指定した第1の信号と
の一致を判定する一致判定手段を有することを特徴とす
る請求項1記載の信号処理装置。 - 【請求項4】 上記入力信号の振幅を検出する振幅検出
手段を有し、 上記候補区間を検出する際の特徴的パターンとして、所
定の時間間隔に対応して上記入力信号の振幅が所定の値
より小さくなるパターンを検出することを特徴とする請
求項1記載の信号処理装置。 - 【請求項5】 上記入力信号の変化を検出する変化検出
手段を有し、 上記候補区間を検出する際の特徴的パターンとして、所
定の時間間隔に対応して上記入力信号が急激に所定の変
化量を超えて変化するパターンを検出することを特徴と
する請求項1記載の信号処理装置。 - 【請求項6】 上記入力信号の所定の信号成分が、所定
の範囲内に収まる単位区間を検出する一様成分検出手段
を有し、 上記候補区間を検出する際の特徴的パターンとして、所
定の時間間隔に対応して上記入力信号の単位区間につい
ての所定の信号成分が一様になるパターンを検出するこ
とを特徴とする請求項1記載の信号処理装置。 - 【請求項7】 上記特徴量抽出手段は、上記入力信号の
振幅を検出する振幅検出手段を有し、上記第1の信号ら
しさを表わす特徴量として、上記第1の信号の候補区間
の前及び/又は後の入力信号の振幅の大きさを抽出する
ことを特徴とする請求項1記載の信号処理装置。 - 【請求項8】 上記特徴量抽出手段は、上記入力信号の
振幅を検出する振幅検出手段を有し、上記第1の信号ら
しさを表わす特徴量として、上記第1の信号の候補区間
の前及び/又は後の入力信号の振幅が、所定の閾値より
小さい区間の時間長を抽出することを特徴とする請求項
1記載の信号処理装置。 - 【請求項9】 上記特徴量抽出手段は、上記入力信号の
相関を検出する相関検出手段を有し、上記第1の信号ら
しさを表わす特徴量として、上記第1の信号の候補区間
における入力信号の相互相関を抽出することを特徴とす
る請求項1記載の信号処理装置。 - 【請求項10】 上記特徴量抽出手段は、上記入力信号
の振幅を検出する振幅検出手段を有し、上記第1の信号
らしさを表わす特徴量として、上記第1の信号の候補区
間における入力信号の平均振幅を抽出することを特徴と
する請求項1記載の信号処理装置。 - 【請求項11】 上記特徴量抽出手段は、上記入力信号
の変化を検出する変化検出手段を有し、上記第1の信号
らしさを表わす特徴量として、上記第1の信号の候補区
間において入力信号が急激に変化する回数又は頻度を抽
出することを特とする請求項1記載の信号処理装置。 - 【請求項12】 上記特徴量抽出手段は、上記入力信号
の所定の信号成分が一様となる単位区間を検出する一様
成分検出手段を有し、上記第1の信号らしさを表わす特
徴量として、上記第1の信号の候補区間において上記入
力信号の所定の信号成分が一様となる単位区間の発生回
数又は頻度を抽出することを特徴とする請求項1記載の
信号処理装置。 - 【請求項13】 上記特徴量抽出手段は、複数のモード
を取り得る入力信号の当該モードを検出するモード検出
手段を有し、上記第1の信号らしさを表わす特徴量とし
て、上記第1の信号の候補区間における上記モードを抽
出することを特徴とする請求項1記載の信号処理装置。 - 【請求項14】 上記特徴量抽出手段は、上記第1の信
号らしさを表す特徴量として、上記第1の信号の候補区
間の前又は後に続く第1の信号の有無を抽出することを
特徴とする請求項1記載の信号処理装置。 - 【請求項15】 上記特徴量抽出手段は、上記入力信号
のスペクトルを検出するスペクトル検出手段を有し、上
記第1の信号らしさを表す特徴量として、上記第1の信
号の候補区間の前又は後の境界における上記スペクトル
の変化を抽出することを特徴とする請求項1記載の信号
処理装置。 - 【請求項16】 上記特徴量抽出手段は、上記第1の信
号らしさを表す特徴量として、複数のチャンネルの何れ
かを取り得る入力信号の上記チャンネル情報を抽出する
ことを特徴とする請求項1記載の信号処理装置。 - 【請求項17】 上記特徴量抽出手段は、上記第1の信
号らしさを表す特徴量として、地域毎のコードを取り得
る入力信号の当該地域コードを抽出することを特徴とす
る請求項1記載の信号処理装置。 - 【請求項18】 上記特徴量抽出手段は、上記入力信号
の信号源を識別する信号源識別手段を有し、上記第1の
信号らしさを表す特徴量として、上記第1の信号の候補
区間における信号源の種類を抽出することを特徴とする
請求項1記載の信号処理装置。 - 【請求項19】 時間を計測する時計を有し、上記特徴
量抽出手段は、上記第1の信号らしさを表す特徴量とし
て、上記第1の信号の候補区間が入力される時刻を抽出
することを特徴とする請求項1記載の信号処理装置。 - 【請求項20】 上記特徴量抽出手段は、複数のジャン
ルに分け得る上記入力信号のジャンルを識別するジャン
ル識別手段を有し、上記第1の信号らしさを表す特徴量
として、上記第1の信号の候補区間の前後の信号のジャ
ンルを抽出することを特徴とする請求項1記載の信号処
理装置。 - 【請求項21】 上記特徴量抽出手段は、時間を計測
する時計と、複数のジャンルに分け得る上記入力信号の
上記ジャンルを識別するジャンル識別手段とを有し、上
記第1の信号らしさを表す特徴量として、上記第1の信
号の候補区間の前後の信号のジャンル、及び、上記第1
の信号の候補区間の入力時刻からの経過時間を抽出する
ことを特徴とする請求項1記載の信号処理装置。 - 【請求項22】 上記特徴量抽出手段は、上記第1の信
号らしさを表す特徴量として、上記入力信号の振幅が基
準値より小さいときの回数、その長さ、または上記入力
信号の振幅の分散を抽出することを特徴とする請求項1
記載の信号処理装置。 - 【請求項23】 上記特徴量評価手段は、上記特徴量を
荷重加算し、当該加重加算後の特徴量に基づき、上記候
補区間が上記第1の信号である可能性を評価することを
特徴とする請求項2記載の信号処理装置。 - 【請求項24】 上記特徴量評価手段は、上記特徴量の
評価の際に、多層パーセプトロンを用いることを特徴と
する請求項2記載の信号処理装置。 - 【請求項25】 上記入力信号を記録及び/又は再生す
る記録及び/又は再生手段を有することを特徴とする請
求項1記載の信号処理装置。 - 【請求項26】 上記入力信号を編集する編集手段を有
することを特徴とする請求項1記載の信号処理装置。 - 【請求項27】 上記第1の信号の区間をスキップする
スキップ手段を有することを特徴とする請求項1記載の
信号処理装置。 - 【請求項28】 上記第1の信号の区間のみを取り出す
取り出し手段を有することを特徴とする請求項1記載の
信号処理装置。 - 【請求項29】 上記入力信号は映像及び/又は音声信
号からなり、上記第1の信号の区間はコマーシャルメッ
セージ区間であることを特徴とする請求項1記載の信号
処理装置。 - 【請求項30】 少なくとも第1の信号の区間とそれ以
外の信号の区間とが時分割的に存在する入力信号から、
所定の時間間隔を持つ信号の特徴的パターンに基づい
て、第1の信号の候補区間を検出し、 上記候補区間内又はその前後の入力信号から、上記第1
の信号らしさを表わす特徴量を抽出し、 上記特徴量に基づき、上記第1の信号の区間を検出する
ことを特徴とする信号処理方法。 - 【請求項31】 上記第1の信号区間の検出の際には、
上記特徴量に基づいて上記候補区間が上記第1の信号で
ある可能性を評価し、上記評価結果に基づいて上記第1
の信号の区間を判定することを特徴とする請求項30記
載の信号処理方法。 - 【請求項32】 上記第1の信号区間の検出の際には、
上記特徴量に基づいて、上記候補区間の信号と、別途指
定した第1の信号との一致を判定することを特徴とする
請求項30記載の信号処理方法。 - 【請求項33】 上記候補区間を検出する際の特徴的パ
ターンとして、所定の時間間隔に対応して上記入力信号
の振幅が所定の値より小さくなるパターンを検出するこ
とを特徴とする請求項30記載の信号処理方法。 - 【請求項34】 上記候補区間を検出する際の特徴的パ
ターンとして、所定の時間間隔に対応して上記入力信号
が所定の変化量を超えて急激に変化するパターンを検出
することを特徴とする請求項30記載の信号処理方法。 - 【請求項35】 上記候補区間を検出する際の特徴的パ
ターンとして、所定の時間間隔に対応して上記入力信号
の単位区間についての所定の信号成分が所定の範囲内に
収まるパターンを検出することを特徴とする請求項30
記載の信号処理方法。 - 【請求項36】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間の前及び/又は後の
入力信号の振幅の大きさを抽出することを特徴とする請
求項30記載の信号処理方法。 - 【請求項37】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間の前及び/又は後の
入力信号の振幅が、所定の閾値より小さい区間の時間長
を抽出することを特徴とする請求項30記載の信号処理
方法。 - 【請求項38】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間における入力信号の
相互相関を抽出することを特徴とする請求項30記載の
信号処理方法。 - 【請求項39】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間における入力信号の
平均振幅を抽出することを特徴とする請求項30記載の
信号処理方法。 - 【請求項40】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間において入力信号が
急激に変化する回数又は頻度を抽出することを特徴とす
る請求項30記載の信号処理方法。 - 【請求項41】 上記第1の信号らしさを表わす特徴量
として、上記第1の信号の候補区間において上記入力信
号の所定の信号成分が一様となる単位区間の発生回数又
は頻度を抽出することを特徴とする請求項30記載の信
号処理方法。 - 【請求項42】 複数のモードを取り得る入力信号の当
該モードを検出し、上記第1の信号らしさを表わす特徴
量として、上記第1の信号の候補区間における上記モー
ドを抽出することを特徴とする請求項30記載の信号処
理方法。 - 【請求項43】 上記第1の信号らしさを表す特徴量と
して、上記第1の信号の候補区間の前又は後に続く第1
の信号の有無を抽出することを特徴とする請求項30記
載の信号処理方法。 - 【請求項44】 上記入力信号のスペクトルを検出し、
上記第1の信号らしさを表す特徴量として、上記第1の
信号の候補区間の前又は後の境界における上記スペクト
ルの変化を抽出することを特徴とする請求項30記載の
信号処理方法。 - 【請求項45】 上記第1の信号らしさを表す特徴量と
して、複数のチャンネルの何れかを取り得る入力信号の
上記チャンネル情報を抽出することを特徴とする請求項
30記載の信号処理方法。 - 【請求項46】 上記第1の信号らしさを表す特徴量と
して、地域毎のコードを取り得る入力信号の当該地域コ
ードを抽出することを特徴とする請求項30記載の信号
処理方法。 - 【請求項47】 上記入力信号の信号源を識別し、上記
第1の信号らしさを表す特徴量として、上記第1の信号
の候補区間における信号源の種類を抽出することを特徴
とする請求項30記載の信号処理方法。 - 【請求項48】 上記第1の信号らしさを表す特徴量と
して、上記第1の信号の候補区間が入力される時刻を抽
出することを特徴とする請求項30記載の信号処理方
法。 - 【請求項49】 複数のジャンルに分け得る上記入力信
号の上記ジャンルを識別し、上記第1の信号らしさを表
す特徴量として、上記第1の信号の候補区間の前後の信
号のジャンルを抽出することを特徴とする請求項30記
載の信号処理方法。 - 【請求項50】 複数のジャンルに分け得る上記入力信
号のジャンルを識別し、上記第1の信号らしさを表す特
徴量として、上記第1の信号の候補区間の前後の信号の
ジャンル、及び、上記第1の信号の候補区間の入力時刻
からの経過時間を抽出することを特徴とする請求項30
記載の信号処理方法。 - 【請求項51】 上記第1の信号らしさを表す特徴量と
して、上記入力信号の振幅が基準値より小さいときの回
数、その長さ、または上記入力信号の振幅の分散を抽出
することを特徴とする請求項30記載の信号処理方法。 - 【請求項52】 上記特徴量に基づく評価の際には、上
記特徴量を荷重加算し、当該加重加算後の特徴量に基づ
き、上記候補区間が上記第1の信号である可能性を評価
することを特徴とする請求項31記載の信号処理方法。 - 【請求項53】 上記特徴量に基づく評価の際には、多
層パーセプトロンを用いることを特徴とする請求項31
記載の信号処理方法。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000307907A JP4300697B2 (ja) | 2000-04-24 | 2000-10-06 | 信号処理装置及び方法 |
KR1020010021653A KR100903160B1 (ko) | 2000-04-24 | 2001-04-21 | 신호처리장치 및 방법 |
US09/840,939 US7742680B2 (en) | 2000-04-24 | 2001-04-24 | Apparatus and method for processing signals |
EP01109928A EP1150446A3 (en) | 2000-04-24 | 2001-04-24 | Apparatus and method for processing signals and for recognising predetermined patterns in a signal, for example for detecting commercial messages in a broadcast signal |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000-127658 | 2000-04-24 | ||
JP2000127658 | 2000-04-24 | ||
JP2000307907A JP4300697B2 (ja) | 2000-04-24 | 2000-10-06 | 信号処理装置及び方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002016873A true JP2002016873A (ja) | 2002-01-18 |
JP2002016873A5 JP2002016873A5 (ja) | 2007-04-19 |
JP4300697B2 JP4300697B2 (ja) | 2009-07-22 |
Family
ID=26590976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000307907A Expired - Fee Related JP4300697B2 (ja) | 2000-04-24 | 2000-10-06 | 信号処理装置及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7742680B2 (ja) |
EP (1) | EP1150446A3 (ja) |
JP (1) | JP4300697B2 (ja) |
KR (1) | KR100903160B1 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001313960A (ja) * | 2000-04-27 | 2001-11-09 | Sony Corp | 信号処理装置及び方法 |
JP2004531766A (ja) * | 2001-05-11 | 2004-10-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 無音検出 |
WO2005104124A1 (ja) * | 2004-04-19 | 2005-11-03 | Pioneer Corporation | 動画像情報記録装置、動画像情報記録方法、並びに、動画像情報記録プログラムおよびそれを記録した記録媒体 |
WO2005104547A1 (ja) * | 2004-04-19 | 2005-11-03 | Pioneer Corporation | 動画像情報記録装置、動画像情報記録方法、並びに、動画像情報記録プログラムおよびそれを記録した記録媒体 |
JP2006215418A (ja) * | 2005-02-07 | 2006-08-17 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2006237879A (ja) * | 2005-02-23 | 2006-09-07 | Sony Corp | Cm検索方法、cm検索結果受給方法、cm検索装置、cm検索結果受給装置及びcm録画予約システム |
JP2007264652A (ja) * | 2003-02-25 | 2007-10-11 | Mitsubishi Electric Corp | ハイライト抽出装置、ハイライト抽出方法、ハイライト抽出プログラム、およびハイライト抽出プログラムが記憶された記録媒体 |
JP2008216618A (ja) * | 2007-03-05 | 2008-09-18 | Fujitsu Ten Ltd | 音声判別装置 |
US8009965B2 (en) | 2008-11-28 | 2011-08-30 | Kabushiki Kaisha Toshiba | Video analyzer and computer program product |
US8312489B2 (en) | 2005-02-23 | 2012-11-13 | Sony Corporation | CM searching method and apparatus, and CM-appendant information supplying method and apparatus |
JP2019144916A (ja) * | 2018-02-22 | 2019-08-29 | 株式会社野村総合研究所 | 広告効果予測システム、方法およびプログラム |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002010237A (ja) * | 2000-06-22 | 2002-01-11 | Sony Corp | 情報送受信システム及び方法、情報処理装置及び方法 |
JP3794257B2 (ja) * | 2000-09-27 | 2006-07-05 | 日本ビクター株式会社 | 映像信号再生装置 |
US7376159B1 (en) | 2002-01-03 | 2008-05-20 | The Directv Group, Inc. | Exploitation of null packets in packetized digital television systems |
US7286473B1 (en) | 2002-07-10 | 2007-10-23 | The Directv Group, Inc. | Null packet replacement with bi-level scheduling |
US7647221B2 (en) | 2003-04-30 | 2010-01-12 | The Directv Group, Inc. | Audio level control for compressed audio |
US7912226B1 (en) | 2003-09-12 | 2011-03-22 | The Directv Group, Inc. | Automatic measurement of audio presence and level by direct processing of an MPEG data stream |
JP4321518B2 (ja) * | 2005-12-27 | 2009-08-26 | 三菱電機株式会社 | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
JP4442585B2 (ja) | 2006-05-11 | 2010-03-31 | 三菱電機株式会社 | 楽曲区間検出方法、及びその装置、並びにデータ記録方法、及びその装置 |
JP4611952B2 (ja) | 2006-09-26 | 2011-01-12 | 株式会社日立製作所 | 番組録画装置及びコマーシャル検出方法 |
JP4840325B2 (ja) * | 2007-10-19 | 2011-12-21 | 三菱電機株式会社 | 映像音声記録装置 |
PA8847601A1 (es) * | 2008-11-03 | 2010-06-28 | Telefonica Sa | Metodo y sistema de clasificacion de informacion audiovisual |
US9729120B1 (en) | 2011-07-13 | 2017-08-08 | The Directv Group, Inc. | System and method to monitor audio loudness and provide audio automatic gain control |
CN103426439B (zh) * | 2013-05-08 | 2016-04-27 | 杭州联汇数字科技有限公司 | 一种广播电视音频信号内容一致性检测方法 |
JP7075405B2 (ja) * | 2016-12-28 | 2022-05-25 | コーニンクレッカ フィリップス エヌ ヴェ | 睡眠呼吸障害の特徴付け方法 |
JP7275711B2 (ja) | 2019-03-20 | 2023-05-18 | ヤマハ株式会社 | オーディオ信号の処理方法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0721823B2 (ja) | 1985-10-25 | 1995-03-08 | ソニー株式会社 | 画像入力装置 |
JP3158291B2 (ja) | 1991-07-22 | 2001-04-23 | ソニー株式会社 | 表示装置 |
JPH05137041A (ja) * | 1991-08-30 | 1993-06-01 | Fuji Photo Film Co Ltd | デジタル電子スチルカメラ |
US6208271B1 (en) * | 1998-09-04 | 2001-03-27 | Brad A. Armstrong | Remote controller with analog button(s) |
US5436653A (en) * | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
US5692093A (en) | 1993-01-08 | 1997-11-25 | Srt, Inc. | Method and apparatus for eliminating television commercial messages |
JP3006338B2 (ja) * | 1993-03-26 | 2000-02-07 | 松下電器産業株式会社 | 運動領域輪郭検出装置 |
JP2785641B2 (ja) | 1993-04-14 | 1998-08-13 | 日本電気株式会社 | 画像符号化装置 |
US5343251A (en) * | 1993-05-13 | 1994-08-30 | Pareto Partners, Inc. | Method and apparatus for classifying patterns of television programs and commercials based on discerning of broadcast audio and video signals |
US6002393A (en) * | 1995-08-22 | 1999-12-14 | Hite; Kenneth C. | System and method for delivering targeted advertisements to consumers using direct commands |
JP3332756B2 (ja) | 1996-03-14 | 2002-10-07 | 三洋電機株式会社 | テレビジョン放送信号の記録再生装置 |
JPH09312827A (ja) | 1996-05-22 | 1997-12-02 | Sony Corp | 記録再生装置 |
JP3315879B2 (ja) * | 1996-10-25 | 2002-08-19 | 松下電器産業株式会社 | 画像記録装置及び画像再生装置 |
US6278836B1 (en) * | 1996-08-27 | 2001-08-21 | Matsushita Electric Industrial Co., Ltd. | Information reproducing apparatus for reproducing video signals and program information which are recorded in information recording media |
JPH10215436A (ja) | 1997-01-30 | 1998-08-11 | Sony Corp | 記録再生装置および方法、並びに記録媒体 |
US6128712A (en) * | 1997-01-31 | 2000-10-03 | Macromedia, Inc. | Method and apparatus for improving playback of interactive multimedia works |
JPH10222933A (ja) | 1997-02-05 | 1998-08-21 | Sony Corp | 情報記録装置および情報記録方法、並びに情報伝送装置および情報伝送方法 |
JPH10224722A (ja) * | 1997-02-07 | 1998-08-21 | Sony Corp | コマーシャル検出装置及び検出方法 |
JP3138235B2 (ja) * | 1997-06-17 | 2001-02-26 | 三洋電機株式会社 | テレビジョン放送の記録再生装置 |
JPH1153783A (ja) | 1997-07-31 | 1999-02-26 | Hitachi Ltd | テレビジョン信号記録再生装置 |
JPH1169322A (ja) | 1997-08-20 | 1999-03-09 | Victor Co Of Japan Ltd | Tvコマーシャル放送チェック用信号挿入方法及びシステム並びにtvコマーシャル放送チェック方法及びシステム |
US6226444B1 (en) * | 1997-09-30 | 2001-05-01 | Intel Corporation | Method and apparatus for recording program data without commercials |
JPH11136634A (ja) * | 1997-10-31 | 1999-05-21 | Victor Co Of Japan Ltd | コマーシャル検出装置及びコマーシャル検出方法並びにコマーシャル検出プログラムの記録された記録媒体及びコマーシャルスキップ記録装置 |
US6029045A (en) * | 1997-12-09 | 2000-02-22 | Cogent Technology, Inc. | System and method for inserting local content into programming content |
US6100941A (en) * | 1998-07-28 | 2000-08-08 | U.S. Philips Corporation | Apparatus and method for locating a commercial disposed within a video data stream |
JP2000115726A (ja) * | 1998-10-06 | 2000-04-21 | Toshiba Corp | ディジタル放送送信装置及びディジタル放送受信装置 |
US6671880B2 (en) * | 1998-10-30 | 2003-12-30 | Intel Corporation | Method and apparatus for customized rendering of commercials |
JP2000209553A (ja) * | 1998-11-13 | 2000-07-28 | Victor Co Of Japan Ltd | 情報信号記録装置及び再生装置 |
US7653925B2 (en) * | 1999-11-17 | 2010-01-26 | Ricoh Company, Ltd. | Techniques for receiving information during multimedia presentations and communicating the information |
US6882269B2 (en) * | 2000-07-14 | 2005-04-19 | Darren Murrey | System and method for remotely coordinating the secure delivery of goods |
-
2000
- 2000-10-06 JP JP2000307907A patent/JP4300697B2/ja not_active Expired - Fee Related
-
2001
- 2001-04-21 KR KR1020010021653A patent/KR100903160B1/ko not_active IP Right Cessation
- 2001-04-24 US US09/840,939 patent/US7742680B2/en not_active Expired - Fee Related
- 2001-04-24 EP EP01109928A patent/EP1150446A3/en not_active Withdrawn
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001313960A (ja) * | 2000-04-27 | 2001-11-09 | Sony Corp | 信号処理装置及び方法 |
JP2004531766A (ja) * | 2001-05-11 | 2004-10-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 無音検出 |
JP2007264652A (ja) * | 2003-02-25 | 2007-10-11 | Mitsubishi Electric Corp | ハイライト抽出装置、ハイライト抽出方法、ハイライト抽出プログラム、およびハイライト抽出プログラムが記憶された記録媒体 |
WO2005104547A1 (ja) * | 2004-04-19 | 2005-11-03 | Pioneer Corporation | 動画像情報記録装置、動画像情報記録方法、並びに、動画像情報記録プログラムおよびそれを記録した記録媒体 |
WO2005104124A1 (ja) * | 2004-04-19 | 2005-11-03 | Pioneer Corporation | 動画像情報記録装置、動画像情報記録方法、並びに、動画像情報記録プログラムおよびそれを記録した記録媒体 |
JP2006215418A (ja) * | 2005-02-07 | 2006-08-17 | Nissan Motor Co Ltd | 音声入力装置及び音声入力方法 |
JP2006237879A (ja) * | 2005-02-23 | 2006-09-07 | Sony Corp | Cm検索方法、cm検索結果受給方法、cm検索装置、cm検索結果受給装置及びcm録画予約システム |
JP4534791B2 (ja) * | 2005-02-23 | 2010-09-01 | ソニー株式会社 | Cm検索方法、cm検索結果受給方法、cm検索装置、cm検索結果受給装置及びcm録画予約システム |
US8312489B2 (en) | 2005-02-23 | 2012-11-13 | Sony Corporation | CM searching method and apparatus, and CM-appendant information supplying method and apparatus |
JP2008216618A (ja) * | 2007-03-05 | 2008-09-18 | Fujitsu Ten Ltd | 音声判別装置 |
US8009965B2 (en) | 2008-11-28 | 2011-08-30 | Kabushiki Kaisha Toshiba | Video analyzer and computer program product |
JP2019144916A (ja) * | 2018-02-22 | 2019-08-29 | 株式会社野村総合研究所 | 広告効果予測システム、方法およびプログラム |
JP7000200B2 (ja) | 2018-02-22 | 2022-01-19 | 株式会社野村総合研究所 | 広告効果予測システム、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20020021759A1 (en) | 2002-02-21 |
US7742680B2 (en) | 2010-06-22 |
EP1150446A2 (en) | 2001-10-31 |
KR20010099712A (ko) | 2001-11-09 |
JP4300697B2 (ja) | 2009-07-22 |
EP1150446A3 (en) | 2006-02-01 |
KR100903160B1 (ko) | 2009-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4300697B2 (ja) | 信号処理装置及び方法 | |
US7170566B2 (en) | Family histogram based techniques for detection of commercials and other video content | |
US6819863B2 (en) | System and method for locating program boundaries and commercial boundaries using audio categories | |
JP4615166B2 (ja) | 映像情報要約装置、映像情報要約方法及び映像情報要約プログラム | |
EP1067800A1 (en) | Signal processing method and video/voice processing device | |
KR100957902B1 (ko) | 영상 요약 장치 | |
JP4332988B2 (ja) | 信号処理装置及び方法 | |
JP2005173569A (ja) | オーディオ信号の分類装置及び方法 | |
US7214868B2 (en) | Acoustic signal processing apparatus and method, signal recording apparatus and method and program | |
EP1081960A1 (en) | Signal processing method and video/voice processing device | |
US20120089393A1 (en) | Acoustic signal processing device and method | |
JP2005514841A (ja) | マルチメディア・コンテンツをリンクするよう複数モードのストーリーをセグメントする方法及び装置 | |
US20070286579A1 (en) | Information signal processing method and apparatus, and computer program product | |
US7962330B2 (en) | Apparatus and method for automatic dissection of segmented audio signals | |
JP4253934B2 (ja) | 信号処理装置及び方法 | |
US7734096B2 (en) | Method and device for discriminating obscene video using time-based feature value | |
JP4512969B2 (ja) | 信号処理装置及び方法、記録媒体、並びにプログラム | |
JP2005167456A (ja) | Avコンテンツ興趣特徴抽出方法及びavコンテンツ興趣特徴抽出装置 | |
JP4396914B2 (ja) | 動画像データの分類装置 | |
JP4507351B2 (ja) | 信号処理装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081007 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081225 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090225 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090311 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090331 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090413 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140501 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |