[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP5189536B2 - Monitoring device - Google Patents

Monitoring device Download PDF

Info

Publication number
JP5189536B2
JP5189536B2 JP2009077452A JP2009077452A JP5189536B2 JP 5189536 B2 JP5189536 B2 JP 5189536B2 JP 2009077452 A JP2009077452 A JP 2009077452A JP 2009077452 A JP2009077452 A JP 2009077452A JP 5189536 B2 JP5189536 B2 JP 5189536B2
Authority
JP
Japan
Prior art keywords
sound
sound source
image
abnormal
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009077452A
Other languages
Japanese (ja)
Other versions
JP2010232888A (en
Inventor
弘美 青柳
孝一 水谷
尚斗 若槻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ikegami Tsushinki Co Ltd
Original Assignee
Ikegami Tsushinki Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ikegami Tsushinki Co Ltd filed Critical Ikegami Tsushinki Co Ltd
Priority to JP2009077452A priority Critical patent/JP5189536B2/en
Publication of JP2010232888A publication Critical patent/JP2010232888A/en
Application granted granted Critical
Publication of JP5189536B2 publication Critical patent/JP5189536B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Burglar Alarm Systems (AREA)
  • Alarm Systems (AREA)
  • Closed-Circuit Television Systems (AREA)

Description

本発明は、監視装置に関するものであり、特に、画像および音の双方を監視する監視装置に関するものである。   The present invention relates to a monitoring device, and more particularly to a monitoring device that monitors both images and sound.

店舗または各種施設などにおいて、防犯上の理由から、監視カメラ装置を設置することが多い。このような監視カメラ装置は、常に稼動させておく仕様のものが多く、絶えず映像を撮像し続けることにより、異常が発生した場合に、記録された異常発生時の映像を後から確認することができる。このようにして撮像された画像は、異常発生時の状況を知るための有力な手がかりになり得る。   Monitoring cameras are often installed in stores or various facilities for security reasons. Many of these surveillance camera devices have specifications that are always in operation, and by continuously capturing images, if an abnormality occurs, the recorded video at the time of the abnormality can be confirmed later. it can. The image captured in this way can be a powerful clue for knowing the situation when an abnormality occurs.

従来、画像を撮像するとともに異常音を検知して、その異常音を発する音源の画像を撮像できるようにした監視カメラ装置が提案されている。例えば、異常音が発生した時だけ、その発生位置を中心に撮影することができる監視カメラが提案されている(特許文献1参照)。この特許文献1に記載の監視カメラは、音声入力手段に入力された外部音が異常音であるか否かを判定するとともに外部音の発生位置を検出し、外部音が異常音であると判定された場合には、外部音の発生位置を撮影するようにカメラ本体を駆動するものである。   2. Description of the Related Art Conventionally, there has been proposed a surveillance camera device that captures an image, detects abnormal sound, and can capture an image of a sound source that emits the abnormal sound. For example, there has been proposed a surveillance camera that can take an image centering on the occurrence position only when an abnormal sound occurs (see Patent Document 1). The surveillance camera described in Patent Document 1 determines whether or not the external sound input to the sound input unit is an abnormal sound, detects the generation position of the external sound, and determines that the external sound is an abnormal sound. In such a case, the camera body is driven so as to photograph the position where the external sound is generated.

また、装置本体の周囲の状況を、音センサが検出する音から判断することのできる監視カメラ装置も提案されている(例えば、特許文献2参照)。この特許文献2に記載の監視カメラ装置は、装置に設置された音センサから出力される信号の中に存在する、所定の音を特徴付ける成分を検知する。このようにして検知した所定の音を特徴付ける成分を、予め設定した条件と比較することにより、所定の音に対する異常の種類を判別する。このようにして、特許文献2に記載の監視カメラ装置は、異常音と判定された音が発生した方向に監視カメラ装置を向けることもでき、また、監視カメラの撮像領域外で発生する音であっても、周囲の状況を音から判断することができる。   There has also been proposed a surveillance camera device capable of determining the situation around the device main body from sound detected by a sound sensor (see, for example, Patent Document 2). The surveillance camera device described in Patent Document 2 detects a component characterizing a predetermined sound, which is present in a signal output from a sound sensor installed in the device. By comparing the component characterizing the predetermined sound detected in this way with a preset condition, the type of abnormality for the predetermined sound is determined. In this way, the monitoring camera device described in Patent Document 2 can also direct the monitoring camera device in the direction in which the sound determined to be abnormal sound is generated, and can also be a sound generated outside the imaging area of the monitoring camera. Even if it exists, the surrounding situation can be judged from the sound.

特開2006−94251号公報JP 2006-94251 A 特開2002−123878号公報JP 2002-123878 A

上述したような監視カメラ装置を用いれば、異常音が発生した箇所(音源)の画像を記録して確認することができる。さらに、このような監視カメラ装置によれば、異常音を検知した際にのみカメラによる撮像を行うことにより、記録媒体の消費および消費電力を大幅に節約することができる。   By using the monitoring camera device as described above, it is possible to record and confirm an image of a location (sound source) where an abnormal sound has occurred. Furthermore, according to such a monitoring camera device, it is possible to greatly save the consumption and power consumption of the recording medium by performing imaging with the camera only when abnormal sound is detected.

しかしながら、上述した特許文献1および特許文献2に記載の監視カメラ装置は、いずれも、監視カメラの撮像領域外で発生する音に対しては、異常音を検知してからカメラ装置の向きを変更している。このため、異常音が一瞬の短い音であった場合、異常音を検知した後にカメラ装置の向きを合わせても、異常音が検知された瞬間の画像は撮影できないことも考えられる。このような問題に対処するためには、予めカメラの撮像領域の範囲を広角にしておいたり、あるいはカメラを多数設置して死角を減らす等の措置を講じなければならない。   However, the surveillance camera devices described in Patent Literature 1 and Patent Literature 2 described above change the orientation of the camera device after detecting abnormal sounds for sounds generated outside the imaging area of the surveillance camera. doing. For this reason, when the abnormal sound is a short instantaneous sound, it is possible that the image at the moment when the abnormal sound is detected cannot be taken even if the orientation of the camera device is adjusted after detecting the abnormal sound. In order to cope with such a problem, it is necessary to take measures such as widening the range of the imaging area of the camera in advance or reducing the blind spot by installing a large number of cameras.

また、上述した監視カメラ装置においては、異常音が発生した際に、その音が発生した位置の画像を撮像できた場合であっても、その画像のみからでは音源の位置が視覚的に認識できない場合も考えられる。例えば、異常音が発生した位置において、何かが物理的に破壊されたような画像が撮像できれば、その画像を確認することにより、異常音の発生原因を容易に特定することができる。しかしながら、外見上の変化がない(異常がみられない)状態の画像が撮像された場合には、異常音の発生した位置を画像から判別することはできず、その音源を視覚的に認識することはできない。   Further, in the above-described monitoring camera device, when an abnormal sound is generated, even if an image of the position where the sound is generated can be captured, the position of the sound source cannot be visually recognized only from the image. Cases are also conceivable. For example, if an image in which something is physically destroyed can be captured at the position where the abnormal sound is generated, the cause of the abnormal sound can be easily identified by checking the image. However, when an image having no appearance change (no abnormality) is captured, the position where the abnormal sound is generated cannot be determined from the image, and the sound source is visually recognized. It is not possible.

例えば、箱の中で破裂が発生したが、その箱が破壊されなかった場合や、化学反応により音が発生する場合などは、異常音が発生した瞬間の画像を確認できても、画像の中のどの位置において異常音が発生したのか特定できないことも考えられる。あるいは、異常音が発生した箇所の手前に、音響的に透明な視覚的障害物などが存在する場合も、カメラが撮像した画像上の変化からは音源の位置が特定できない。顕著な例としては、例えば監視カメラ装置の付近で火災などが発生したために、撮像された画像には煙しか写っていない場合も考えられる。   For example, if a rupture occurs in a box but the box is not destroyed, or if a sound is generated due to a chemical reaction, even if the image at the moment when the abnormal sound is generated can be confirmed, It is also conceivable that the position where the abnormal sound has occurred cannot be specified. Alternatively, even when an acoustically transparent visual obstacle or the like is present in front of the location where the abnormal sound is generated, the position of the sound source cannot be specified from the change on the image captured by the camera. As a prominent example, for example, a fire may have occurred in the vicinity of the monitoring camera device, so that only smoke is captured in the captured image.

さらに、異常音を発する音源は、常に静止した位置に存在するとは限らない。例えば、音源が高速で移動する場合や、複数の異なる箇所で順次連続して音が発生するような場合は、カメラ装置の向きを移動させて音源に追尾させることは困難と考えられる。このような場合も、予めカメラの撮像領域の範囲を広角にしておくこと等の措置は可能であるが、上述したように、音源に外見上の変化がない場合は、撮像された画像を確認しても、その画像のどの箇所が音の発生源なのかを知ることはできない。   Furthermore, a sound source that emits an abnormal sound is not always present at a stationary position. For example, when the sound source moves at a high speed or when sound is continuously generated at a plurality of different locations, it is considered difficult to move the direction of the camera device to track the sound source. Even in such a case, measures such as setting the range of the imaging area of the camera in advance to a wide angle are possible. However, as described above, if there is no change in the appearance of the sound source, check the captured image. Even so, it is impossible to know which part of the image is the source of the sound.

したがって、かかる事情に鑑みてなされた本発明の目的は、異常音を発生する音源が移動する場合であっても、その音源の時間的な軌跡を、視覚的に認識可能に出力することができる監視装置を提供することにある。   Therefore, an object of the present invention made in view of such circumstances is to output a temporal trajectory of the sound source so that it can be visually recognized even when the sound source generating the abnormal sound moves. It is to provide a monitoring device.

また、本発明の他の目的は、異常音を発生する音源が、カメラにより撮像できる撮像領域外に位置する場合であっても、その音源の存在する方向を、視覚的に認識可能に出力することができる監視装置を提供することにある。   Another object of the present invention is to output the direction in which the sound source exists so that it can be visually recognized even when the sound source that generates the abnormal sound is located outside the imaging region that can be imaged by the camera. An object of the present invention is to provide a monitoring device capable of performing the above.

さらに、本発明の他の目的は、異常音を検出する精度を高めることができる監視装置を提供することにある。   Furthermore, the other object of this invention is to provide the monitoring apparatus which can raise the precision which detects abnormal sound.

上記目的を達成する請求項1に係る発明は、
画像を撮像する撮像手段と、
前記撮像手段の周りに配置され、音源からの音を受音する複数の無指向性マイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイが集音した音の到来時間差または位相差から、前記監視装置に対する前記音源からの音の方向を算出するとともに、該算出した前記音源からの音の方向に基づいて、前記撮像手段が撮像した画像における前記音源の位置を算出する音源位置算出手段と、
前記音源位置算出手段が算出した前記音源の位置を示す表示を、時間の経過に応じた表示態様で、前記撮像手段が撮像した画像に組み合わせて出力し、前記算出した音源の位置が、前記撮像手段が撮像した画像における所定の撮像領域外である場合、当該音源の位置が前記所定の撮像領域外である旨を示す表示を、当該音源の位置に対応する前記所定の撮像領域の縁辺において、当該画像に組み合わせて出力する組合せ手段と、
を備えることを特徴とするものである。
The invention according to claim 1 that achieves the above object is as follows:
An imaging means for capturing an image;
A microphone array having a plurality of omnidirectional microphones arranged around the imaging means and receiving sound from a sound source;
From the arrival time difference or phase difference of the sound collected by the microphone array, the direction of the sound from the sound source with respect to the monitoring device is calculated, and the imaging means is based on the calculated direction of the sound from the sound source. Sound source position calculating means for calculating the position of the sound source in the captured image;
A display indicating the position of the sound source calculated by the sound source position calculating unit is output in combination with an image captured by the imaging unit in a display mode corresponding to the passage of time, and the calculated position of the sound source is the imaging When it is outside the predetermined imaging area in the image captured by the means, a display indicating that the position of the sound source is outside the predetermined imaging area is displayed on the edge of the predetermined imaging area corresponding to the position of the sound source. Combination means for outputting in combination with the image ;
It is characterized by providing.

請求項に係る発明は、請求項1に記載の監視装置において、
前記音源位置算出手段は、
前記マイクロホンアレイが集音した音の音圧の最初のピークを検出したら、所定期間、前記音源の位置の算出を行わないようにするとともに、当該最初のピーク近傍の音圧波形に基づいて前記音源の位置を算出するものである。
The invention according to claim 2 is the monitoring device according to claim 1,
The sound source position calculating means includes
When the first peak of the sound pressure of the sound collected by the microphone array is detected, the position of the sound source is not calculated for a predetermined period, and the sound source is based on the sound pressure waveform near the first peak. Is calculated.

また、請求項に係る発明は、請求項1に記載の監視装置において、
前記マイクロホンアレイが集音する音のレベルが、前記マイクロホンアレイに所定期間集音された音のレベルの時間的な平均に基づいて更新される閾値を超える場合に、当該音が異常音であると判定する異常音判定手段をさらに備え、
前記音源位置算出手段は、
前記マイクロホンアレイが集音した音が、前記異常音判定手段により異常音であると判定された場合にのみ、前記音源の位置を算出するものである。

The invention according to claim 3 is the monitoring apparatus according to claim 1,
When the sound level collected by the microphone array exceeds a threshold value updated based on a temporal average of the sound levels collected for a predetermined period of time in the microphone array, the sound is an abnormal sound. Further comprising an abnormal sound determination means for determining,
The sound source position calculating means includes
The position of the sound source is calculated only when the sound collected by the microphone array is determined to be an abnormal sound by the abnormal sound determination means.

本発明による監視装置は、マイクロホンアレイが集音した音の到来時間差または位相差に基づいて算出した音源からの音の方向に基づいて、カメラが撮像した画像における音源の位置を算出する。それとともに、本発明による監視装置は、音源の位置を示す表示を、時間の経過に応じた表示態様で、その画像に組み合わせて出力する。したがって、本発明による監視装置は、異常音を検出すると、カメラが撮像した画像の中で異常音が発生した位置を示すことができ、さらに、その異常音の発生した位置が移動する場合でも、その移動の時間的な軌跡を視覚的に認識可能に示すことができる。   The monitoring device according to the present invention calculates the position of the sound source in the image captured by the camera based on the direction of the sound from the sound source calculated based on the arrival time difference or phase difference of the sound collected by the microphone array. At the same time, the monitoring apparatus according to the present invention outputs a display indicating the position of the sound source in combination with the image in a display mode corresponding to the passage of time. Accordingly, when the monitoring device according to the present invention detects abnormal sound, it can indicate the position where the abnormal sound has occurred in the image captured by the camera, and even if the position where the abnormal sound occurs moves, The temporal trajectory of the movement can be shown visually recognizable.

また、本発明によれば、異常音を発生する音源が、カメラにより撮像できる領域外に位置する場合、その撮像領域外の方向を、撮像領域の縁辺において、時間の経過に応じた表示態様で示すことができる。したがって、異常音を発生する音源が、カメラの撮像領域外にある場合でも、その音源の方向を知ることができる。   Further, according to the present invention, when the sound source that generates abnormal sound is located outside the area that can be imaged by the camera, the direction outside the imaging area is displayed in a display mode according to the passage of time on the edge of the imaging area. Can show. Therefore, the direction of the sound source can be known even when the sound source that generates the abnormal sound is outside the imaging region of the camera.

さらに、本発明によれば、マイクロホンアレイが集音した音を異常音と判断するにあたり、異常音を判定する閾値を時間の経過に応じて更新する。また、本発明によれば、異常音の最初のピークを検出したら、所定期間、音源の位置の算出を行わずに、当該最初のピークのみに基づいて音源の位置を算出する。したがって、異常音の検出に際し、直接波の後に到来する反射波による悪影響を抑圧することができる。   Furthermore, according to the present invention, when determining the sound collected by the microphone array as an abnormal sound, the threshold value for determining the abnormal sound is updated as time passes. According to the present invention, when the first peak of the abnormal sound is detected, the position of the sound source is calculated based on only the first peak without calculating the position of the sound source for a predetermined period. Therefore, when detecting an abnormal sound, it is possible to suppress an adverse effect caused by a reflected wave that arrives after the direct wave.

本発明の実施の形態による監視装置の概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the monitoring apparatus by embodiment of this invention. 単一指向性マイクロホン間のレベル差による音の到来方向の算出を説明するための図である。It is a figure for demonstrating calculation of the arrival direction of the sound by the level difference between unidirectional microphones. 音の到来時間差による音の到来方向の算出を説明するための図である。It is a figure for demonstrating calculation of the arrival direction of the sound by the arrival time difference of a sound. 複数の無指向性マイクロホンの配置例を示す図である。It is a figure which shows the example of arrangement | positioning of a some omnidirectional microphone. 本発明による監視装置によって取得される画像の例を示す図である。It is a figure which shows the example of the image acquired by the monitoring apparatus by this invention. 本発明による監視装置の実施の形態の動作を説明するフローチャートである。It is a flowchart explaining operation | movement of embodiment of the monitoring apparatus by this invention. 本発明による監視装置によって取得される画像の例を示す図である。It is a figure which shows the example of the image acquired by the monitoring apparatus by this invention. 撮像領域外の方向の特定を説明する図である。It is a figure explaining specification of the direction outside an imaging region. 図6の組合せ画像出力処理と、音の時間経過表示処理とを含めた動作を説明するフローチャートである。It is a flowchart explaining the operation | movement including the combination image output process of FIG. 6, and the sound time passage display process. 時間経過表示処理により、移動する音源の時間的な履歴を表示した例を示す図である。It is a figure which shows the example which displayed the time history of the moving sound source by time progress display processing. 時間経過表示処理を、撮像領域外の方向を示す処理に適用した例を説明する図である。It is a figure explaining the example which applied the time passage display process to the process which shows the direction outside an imaging region. ガラスの破壊音のパワースペクトルおよび包絡線プロフィールを示す図である。It is a figure which shows the power spectrum and envelope profile of the breaking sound of glass. 反射音による影響を低減する手法を説明するタイムチャートである。It is a time chart explaining the method of reducing the influence by reflected sound.

本発明による監視装置の実施の形態を、図面を参照して詳細に説明する。図1は、本発明による監視装置1の実施の形態を示す図である。図1に示す監視装置1は、カメラ10と、マイクロホンアレイ20と、音響処理部30と、異常音判定部40と、音源位置算出部50と、画像組合せ部60と、アラーム処理部70と、ネットワーク処理部80と、を備えている。     An embodiment of a monitoring device according to the present invention will be described in detail with reference to the drawings. FIG. 1 is a diagram showing an embodiment of a monitoring device 1 according to the present invention. The monitoring apparatus 1 shown in FIG. 1 includes a camera 10, a microphone array 20, an acoustic processing unit 30, an abnormal sound determination unit 40, a sound source position calculation unit 50, an image combination unit 60, an alarm processing unit 70, A network processing unit 80.

カメラ10は、画像を撮像する撮像手段を構成する。カメラ10で撮像した画像の出力は、画像組合せ部60を経て、外部の表示手段としてのモニタ100に表示される。このとき、カメラ10で撮像された画像は、画像組合せ部60により、後述する音源位置についての情報、および音の異常性についての情報と組み合わされて出力される。   The camera 10 constitutes an imaging unit that captures an image. The output of the image captured by the camera 10 is displayed on the monitor 100 as an external display unit via the image combination unit 60. At this time, the image captured by the camera 10 is output by the image combination unit 60 in combination with information on the sound source position, which will be described later, and information on the abnormality of the sound.

マイクロホンアレイ20は、カメラ10のレンズの光軸の周りに配置された複数の無指向性マイクロホンを有する。すなわち、マイクロホンアレイ20は、カメラ10に取り付けられたレンズの画角により撮像して表示できるエリアの水平方向(x軸)および垂直方向(y軸)に複数の無指向性マイクロホンを配置することによって構成される。なお、このマイクロホンアレイ20における複数の無指向性マイクロホンの配置については後述する。   The microphone array 20 has a plurality of omnidirectional microphones arranged around the optical axis of the lens of the camera 10. That is, the microphone array 20 is configured by arranging a plurality of omnidirectional microphones in the horizontal direction (x axis) and the vertical direction (y axis) of an area that can be captured and displayed by the angle of view of a lens attached to the camera 10. Composed. The arrangement of a plurality of omnidirectional microphones in the microphone array 20 will be described later.

音響処理部30は、マイクロホンアレイ20が集音した音の残響や雑音の除去、およびレベルの補正などを行う。すなわち、音響処理部30は、マイクロホンアレイ20が集音した音から、部屋の残響の影響や周囲の環境雑音を排除し、その音がマイクロホンアレイ20から離れることにより減衰している場合には、受信信号のレベルを上げる等の処理を行う。このようにすることで、後の処理、例えば、異常音判定部40における音の異常性の判定や、音源位置算出部50による音源の方向および位置の算出を容易かつ正確に行うことができるようになる。   The acoustic processing unit 30 performs reverberation and noise removal of the sound collected by the microphone array 20 and level correction. That is, the acoustic processing unit 30 eliminates the influence of room reverberation and ambient environmental noise from the sound collected by the microphone array 20, and when the sound is attenuated by moving away from the microphone array 20, Processing such as increasing the level of the received signal is performed. By doing so, it is possible to easily and accurately perform subsequent processing, for example, determination of the abnormality of the sound in the abnormal sound determination unit 40, and calculation of the direction and position of the sound source by the sound source position calculation unit 50. become.

異常音判定部40は、音響処理部30により各種処理が施された音について、所定の基準に基づいて、当該音が異常音であるか否かを判定する異常音判定部を構成する。例えば、異常音判定部40は、包絡線プロフィール、周波数解析、音のレベルおよび音の時間的経過などを解析することによって音の異常性を判定する。また、当該音が異常音であると判定された場合、異常音の異常性のランクを可視化するために、異常音判定部40は、所定の条件に従って、当該異常音のランク付けも行う。このランク付けは、異常音判定部40が、異常性を判定する際の解析結果による重み付けに基づいて行うことができる。   The abnormal sound determination unit 40 constitutes an abnormal sound determination unit that determines whether or not the sound subjected to various processes by the acoustic processing unit 30 is an abnormal sound based on a predetermined reference. For example, the abnormal sound determination unit 40 determines sound anomaly by analyzing an envelope profile, frequency analysis, sound level, sound time course, and the like. When it is determined that the sound is an abnormal sound, the abnormal sound determination unit 40 also ranks the abnormal sound according to a predetermined condition in order to visualize the rank of the abnormality of the abnormal sound. This ranking can be performed based on the weighting by the analysis result when the abnormal sound determination unit 40 determines abnormality.

音源位置算出部50は、マイクロホンアレイ20が集音した音の到来時間差または位相差から、監視装置1に対する音源からの音の方向を算出する。また、これとともに、音源位置算出部50は、算出した前記音源からの音の方向に基づいて、カメラ10が撮像した画像における音源の位置を算出する。したがって、本実施の形態では、音源位置算出部50は音源位置算出手段を構成する。なお、音源位置算出部50が算出する「音源の位置」とは、実際に音源が存在する空間における位置を意味するものではなく、カメラ10が撮像した画像上のピクセル(画素)位置を意味する。この音源位置算出部50は、異常音の到来方向(すなわち音源の位置)を可視化するために、カメラ10で撮像する領域と同一の座標を使用して、到来する異常音の水平方向の方位角(φ)および垂直方向の仰角(θ)をx軸およびy軸の座標に変換して、異常音の音源の位置を算出する。   The sound source position calculation unit 50 calculates the direction of the sound from the sound source with respect to the monitoring device 1 from the arrival time difference or phase difference of the sound collected by the microphone array 20. At the same time, the sound source position calculation unit 50 calculates the position of the sound source in the image captured by the camera 10 based on the calculated sound direction from the sound source. Therefore, in the present embodiment, the sound source position calculation unit 50 constitutes a sound source position calculation unit. The “sound source position” calculated by the sound source position calculation unit 50 does not mean the position in the space where the sound source actually exists, but means the pixel position on the image captured by the camera 10. . The sound source position calculation unit 50 uses the same coordinates as the area imaged by the camera 10 to visualize the direction of arrival of abnormal sound (ie, the position of the sound source), and the horizontal azimuth angle of the incoming abnormal sound. (Φ) and the vertical elevation angle (θ) are converted into x-axis and y-axis coordinates to calculate the position of the abnormal sound source.

画像組合せ部60は、音源位置算出部50が算出した音源の位置を示す表示を、カメラ10が撮像した画像に組み合わせて出力する組合せ手段を構成する。この画像組合せ部60は、カメラ10により表示することができる画像の表示領域のx軸およびy軸の座標と、異常音の音源の位置のx軸およびy軸の座標の一致するポイントとを音源の中心位置として、モニタ100にマークなどで表示する。あるいは、画像組合せ部60は、表示画面を多分割(36分割、64分割など)することにより、異常音の到来方向(すなわち音源の位置)に対応するエリアの輝度値の変更、着色、網掛け等によってモニタ100に表示させることもできる。   The image combination unit 60 constitutes combination means for outputting a display indicating the position of the sound source calculated by the sound source position calculation unit 50 in combination with an image captured by the camera 10. The image combination unit 60 uses the x-axis and y-axis coordinates of the image display area that can be displayed by the camera 10 and the point where the x- and y-axis coordinates of the position of the abnormal sound source coincide with each other as a sound source. Is displayed on the monitor 100 with a mark or the like. Alternatively, the image combination unit 60 can change, color, and shade the luminance value of the area corresponding to the arrival direction of the abnormal sound (that is, the position of the sound source) by dividing the display screen into multiple parts (36 parts, 64 parts). It is also possible to display it on the monitor 100 by, for example.

さらに、画像組合せ部60は、音源位置算出部50により算出された異常音の音源位置と、異常音判定部40により判定された異常性のランクとを、短期間の間隔で更新したものを連続して出力することにより、モニタ100に最新の表示を行う。これにより、異常音の音源位置および異常性のランクのリアルタイム表示を可能にし、また、処理した異常音の表示を所定の期間保持することによって、異常音の移動状態および複数の音源をモニタ100に表示させることができる。さらに、異常音の移動状態および複数の音源をモニタ100に表示させる際に、音源の位置を示す表示を時間の経過に応じた表示態様で行う。これにより、異常音の移動状態や複数の音源による音の発生を、任意の時点の画像において、時間の履歴と共に表すことができる。なお、このような、音源の位置を示す表示の、時間の経過に応じた表示態様については後述する。   Furthermore, the image combination unit 60 continuously updates the sound source position of the abnormal sound calculated by the sound source position calculation unit 50 and the abnormality rank determined by the abnormal sound determination unit 40 at short-term intervals. The latest display is performed on the monitor 100. Accordingly, the real-time display of the abnormal sound source position and the rank of the abnormal sound is enabled, and the abnormal sound moving state and the plurality of sound sources are displayed on the monitor 100 by holding the processed abnormal sound display for a predetermined period. Can be displayed. Furthermore, when the moving state of the abnormal sound and the plurality of sound sources are displayed on the monitor 100, the display indicating the position of the sound source is performed in a display mode corresponding to the passage of time. Thereby, the movement state of the abnormal sound and the sound generation by a plurality of sound sources can be represented together with the time history in the image at an arbitrary time point. Note that a display mode corresponding to the passage of time of the display indicating the position of the sound source will be described later.

また、音源位置算出部50により算出された異常音の音源位置が、カメラ10が撮像した画像における所定の撮像領域外である場合、例えばカメラ10のレンズの画角による表示画面の範囲からはみ出している場合なども考えられる。この場合、画像組合せ部60は、モニタ100の画面端の上部、下部、右部、または左部に棒状、波状などの着色したマークなどを表示させ、音源のおおよその位置として、異常音の到来する方向を示す。例えば、音源位置算出部50により算出された異常音の音源位置が、表示画面の上方向の領域外である場合、モニタ100の画面上部の縁辺に所定のマークなどを表示して音源の方向が画面外の上方向にあることを示す。さらに、音源位置算出部50により算出された異常音の音源位置が、カメラ10が撮像した画像における上下左右以外の撮像領域外である場合、すなわち斜め方向にある場合、当該方向が分かるようなマークなどを表示する。なお、上述した撮像領域外である場合の表示についても、詳細は後述する。   In addition, when the sound source position of the abnormal sound calculated by the sound source position calculation unit 50 is outside a predetermined imaging region in the image captured by the camera 10, for example, it protrudes from the display screen range due to the angle of view of the lens of the camera 10. There may be cases where In this case, the image combination unit 60 displays a colored mark such as a bar shape or a wave shape on the upper, lower, right, or left portion of the screen end of the monitor 100, and an abnormal sound arrives as an approximate position of the sound source. Indicates the direction to do. For example, when the sound source position of the abnormal sound calculated by the sound source position calculation unit 50 is outside the upper area of the display screen, a predetermined mark or the like is displayed on the upper edge of the screen of the monitor 100 to indicate the direction of the sound source. Indicates that it is in the upward direction outside the screen. Furthermore, when the sound source position of the abnormal sound calculated by the sound source position calculation unit 50 is outside the imaging region other than the top, bottom, left, and right in the image captured by the camera 10, that is, in a diagonal direction, a mark that indicates the direction Etc. are displayed. Details of the display in the case of outside the imaging area described above will be described later.

また、画像組合せ部60は、異常音判定部40による音の異常性のランク付けに基づいて、音源の中心位置のマーク表示を変化させることもできる。この場合、画像組合せ部60は、例えば音源の中心位置のマークの輝度値、色、形状等を変更したり、また、表示画面を多分割してエリアを表示する場合には、輝度値を更に高く変化させたり色をより赤色系に変化させることによってランク付けを表すことができる。   Further, the image combination unit 60 can also change the mark display of the center position of the sound source based on the ranking of the sound abnormality by the abnormal sound determination unit 40. In this case, the image combination unit 60 changes the luminance value, color, shape, etc. of the mark at the center position of the sound source, or further displays the luminance value when the display screen is divided into multiple areas. Ranking can be expressed by changing it higher or changing the color to a more red color.

アラーム処理部70は、音の異常性ランクが所定のレベルを超えた場合にアラームを出力し、監視者にリアルタイムの異常音発生情報を知らせる。また、アラーム処理部70は、図示しない別のパン・チルト・ズーム(PTZ)カメラなどに異常音の音源位置の方向の情報を通知することによって、別のPTZカメラで音源方向をズームして詳細表示を行うなどの連携した確認動作を行うようにできる。   The alarm processing unit 70 outputs an alarm when the abnormality rank of the sound exceeds a predetermined level, and notifies the monitor of real-time abnormal sound occurrence information. Further, the alarm processing unit 70 notifies the information of the direction of the sound source position of abnormal sound to another pan / tilt / zoom (PTZ) camera (not shown) or the like, thereby zooming the sound source direction with another PTZ camera. It is possible to perform linked confirmation operations such as displaying.

ネットワーク処理部80は、画像組合せ部60から出力される画像のデータ、およびアラーム処理部70から出力されたアラームを、ネットワーク200を経由して携帯端末などに配信する。   The network processing unit 80 distributes the image data output from the image combination unit 60 and the alarm output from the alarm processing unit 70 to a mobile terminal or the like via the network 200.

次に、本実施の形態に係るマイクロホンアレイ20による、マイクロホン間のレベル差による音の到来方向の算出について、さらに説明する。   Next, calculation of the direction of arrival of sound by the microphone array 20 according to the present embodiment due to the level difference between the microphones will be further described.

図2は、一般的な単一指向性マイクロホン群により構成されるマイクロホンアレイを示す図である。このような、単一指向性マイクロホン群21により構成されるマイクロホンアレイを用いて、マイクロホン間のレベル差による音の到来方向を算出することができる。図2において、音源500から到来する音の方向を算出する単一指向性マイクロホン群21は、天井300の窪みに配置されている。また、これら単一指向性マイクロホン群21に近接して、ドーム型カメラ11が天井300の平坦部に配置されている。この場合、音源500から音が発生すると、ひとつの単一指向性マイクロホン22が受音する音のレベルが最大となることに基づいて、音源500の方向を特定することができる。   FIG. 2 is a diagram showing a microphone array including a general unidirectional microphone group. Using such a microphone array composed of the unidirectional microphone group 21, it is possible to calculate the sound arrival direction due to the level difference between the microphones. In FIG. 2, the unidirectional microphone group 21 that calculates the direction of the sound coming from the sound source 500 is arranged in a recess of the ceiling 300. In addition, the dome type camera 11 is disposed on the flat portion of the ceiling 300 in the vicinity of the unidirectional microphone group 21. In this case, when sound is generated from the sound source 500, the direction of the sound source 500 can be specified based on the maximum sound level received by one unidirectional microphone 22.

このようにして、複数のマイクロホンにより、マイクロホン間のレベル差を用いて音源方向を算出することができる。しかしながら、この場合、単一指向性マイクロホンを多数用いる必要があるため、その機器構成が複雑となり、設備コストも増大する。図2においては、7方向に対応するため、単一指向性マイクロホンを7つ用いている。方位分解能は、基本的にはマイクロホンの個数と指向性の鋭さとによって決定される。ここでは、複数の単一指向性マイクロホンを一列に配列させた単一指向性マイクロホン群21により、レベル差による1次元の方向を算出する構成を示している。しかしながら、ドーム型カメラ11により撮像できる画像は2次元であり、音源の位置を2次元平面で特定するためには、同様の構成が更に1軸必要となり、必要なチャネル数が倍増し、それにともない、設置するマイクロホンの数も増大する。また、このような単一指向性マイクロホン群21は、構成の複雑さから小型化が困難であり、ドーム型カメラ11それ自体に搭載したり内蔵したりすることは困難である。さらに、基本的な角度分解能はマイクロホンの個数に依存するため、分解能を向上させるためには、マイクロホンの個数を増やす必要がある。このように、単一指向性マイクロホンを用いてマイクロホンアレイを構成すると、一般的に、多数のマイクロホンが必要になる。   In this way, the direction of the sound source can be calculated using a plurality of microphones using the level difference between the microphones. However, in this case, since it is necessary to use a large number of unidirectional microphones, the device configuration becomes complicated and the equipment cost increases. In FIG. 2, seven unidirectional microphones are used in order to correspond to seven directions. The azimuth resolution is basically determined by the number of microphones and the sharpness of directivity. Here, a configuration is shown in which a one-dimensional direction due to a level difference is calculated by a unidirectional microphone group 21 in which a plurality of unidirectional microphones are arranged in a line. However, the image that can be picked up by the dome-type camera 11 is two-dimensional, and in order to specify the position of the sound source on a two-dimensional plane, one more axis is required, and the number of necessary channels is doubled. The number of microphones to be installed also increases. In addition, such a unidirectional microphone group 21 is difficult to reduce in size because of the complexity of the configuration, and it is difficult to mount or incorporate it in the dome camera 11 itself. Furthermore, since the basic angular resolution depends on the number of microphones, it is necessary to increase the number of microphones in order to improve the resolution. When a microphone array is configured using unidirectional microphones as described above, a large number of microphones are generally required.

図3は、少数の無指向性のマイクロホンを用いて、音の到来時間差による音の到来方向の算出を説明する図である。図3において、音源510の到来方向を算出する無指向性のマイクロホン25,26から構成されるマイクロホンアレイを備えるドーム型カメラ12が、天井310の平坦部に配置されている。図3に示すように、音源510の方向を算出する際に、音源510からマイクロホン25および26までのそれぞれの距離の差Lに起因する、音の到達時間差を用いる場合、マイクロホン25,26は無指向性のものを用いることができる。したがって、この場合、マイクロホンアレイを構成する無指向性のマイクロホンは、小型のものを少数用いることで足り、1次元の方向を算出するのであれば、2個のマイクロホンで十分である。また、2次元の方向を算出する場合には、3個のマイクロホンで済むため、装置の構成を簡単にすることができる。このように、無指向性のマイクロホンを用いて音の到来時間差による音源の方向の算出を行う場合、複数のマイクロホンを、カメラ本体を含む筐体に搭載したり、図3に示すように、ドーム型カメラのドームに設置したりすることが可能になる。   FIG. 3 is a diagram for explaining the calculation of the sound arrival direction based on the sound arrival time difference using a small number of omnidirectional microphones. In FIG. 3, a dome-type camera 12 including a microphone array composed of omnidirectional microphones 25 and 26 that calculate the direction of arrival of a sound source 510 is disposed on a flat portion of a ceiling 310. As shown in FIG. 3, when calculating the direction of the sound source 510, when using the sound arrival time difference resulting from the distance difference L between the sound source 510 and the microphones 25 and 26, the microphones 25 and 26 are not used. Directional ones can be used. Therefore, in this case, it is sufficient to use a small number of non-directional microphones constituting the microphone array, and two microphones are sufficient if a one-dimensional direction is calculated. Further, when calculating a two-dimensional direction, only three microphones are required, so that the configuration of the apparatus can be simplified. Thus, when calculating the direction of the sound source by the difference in arrival time of sound using an omnidirectional microphone, a plurality of microphones are mounted on a housing including a camera body, or a dome is used as shown in FIG. It can be installed in the dome of a type camera.

図4は、無指向性のマイクロホンを配置したマイクロホンアレイの例を示す図である。図4においては、上述した図3のマイクロホンアレイの配置のような、小型の無指向性マイクロホンをドーム型カメラのドームに設置する場合とは別の例を示す。図4は、小型の無指向性マイクロホンを、(例えば固定式監視カメラのような)箱型カメラのレンズ周囲に設置する例を示す。   FIG. 4 is a diagram showing an example of a microphone array in which omnidirectional microphones are arranged. FIG. 4 shows an example different from the case where a small omnidirectional microphone, such as the arrangement of the microphone array in FIG. FIG. 4 shows an example in which a small omnidirectional microphone is placed around the lens of a box camera (such as a fixed surveillance camera).

図4(A)は、カメラ10のレンズ15の光軸17を中心にして、x軸上の左右に等間隔に配置した2つのマイクロホン28を使用する場合を示す。これによって、音源の位置をx軸上で1次元的に検出することができる。なお、マイクロホン28の参照番号は、各図において1つのマイクロホンのみに付してある。図4(B)は、カメラ10のレンズ15の光軸17を中心にして、y軸上の上下に等間隔に配置した2つのマイクロホン28を使用する場合を示す。これによって、音源の位置をy軸上で1次元的に検出することができる。図4(C)は、カメラ10のレンズ15の光軸17を中心にして、y軸上の上下およびx軸上の左右に等間隔に配置した4つのマイクロホン28を使用する場合を示す。これによって、音源の位置をxy平面上で2次元的に検出することができる。図4(D)は、カメラ10のレンズ15の光軸17を中心にして、y軸およびx軸からの距離が等間隔でL字状に配置された3つのマイクロホン28を使用する場合を示す。これによっても、音源の位置をxy平面上で2次元的に検出することができる。したがって、音源の位置をxy平面上で2次元的に特定するためには、3つのマイクロホンがあれば、マイクロホンアレイを構成することができる。   FIG. 4A shows a case in which two microphones 28 arranged at equal intervals on the x axis about the optical axis 17 of the lens 15 of the camera 10 are used. Thereby, the position of the sound source can be detected one-dimensionally on the x-axis. Note that the reference number of the microphone 28 is attached to only one microphone in each drawing. FIG. 4B shows a case in which two microphones 28 arranged at equal intervals on the y-axis with the optical axis 17 of the lens 15 of the camera 10 as the center are used. Thereby, the position of the sound source can be detected one-dimensionally on the y-axis. FIG. 4C shows a case in which four microphones 28 arranged at equal intervals on the top and bottom on the y-axis and on the left and right on the x-axis with the optical axis 17 of the lens 15 of the camera 10 as the center are shown. Thereby, the position of the sound source can be detected two-dimensionally on the xy plane. FIG. 4D shows a case in which three microphones 28 are used in which the distances from the y-axis and the x-axis are arranged at equal intervals around the optical axis 17 of the lens 15 of the camera 10. . This also allows the position of the sound source to be detected two-dimensionally on the xy plane. Therefore, in order to specify the position of the sound source two-dimensionally on the xy plane, if there are three microphones, a microphone array can be configured.

次に、本実施の形態による、組合せ画像について説明する。本実施の形態においては、マイクロホンアレイ20が異常音を検知すると、画像組合せ部60は、カメラ10が撮像した画像に、異常音の音源の位置の表示を重ねた画像を出力する。この際の、カメラ10が撮像した画像に、異常音の音源の位置の表示を重ねた画像を、以下、「組合せ画像」と記す。   Next, the combination image according to the present embodiment will be described. In the present embodiment, when the microphone array 20 detects abnormal sound, the image combination unit 60 outputs an image obtained by superimposing the display of the position of the abnormal sound source on the image captured by the camera 10. In this case, an image obtained by superimposing the display of the position of the abnormal sound source on the image captured by the camera 10 is hereinafter referred to as a “combination image”.

組合せ画像の生成にあたり、まず、音源位置算出部50は、マイクロホンアレイ20の各マイクロホンが受音した音の到来時間差または位相差を計測することにより、監視装置1に対する音源からの音の方向を算出する。この算出により、到来する異常音の音源からマイクロホンアレイ20に対する水平方向の方位角(φ)および垂直方向の仰角(θ)が得られる。次に、音源位置算出部50は、このようにして得た音源からの音の方向を、カメラ10が撮像した画像の領域と同一の座標系におけるx軸およびy軸上の座標に変換する。音源からの音の方向がx軸およびy軸上の座標に変換されたら、画像組合せ部60は、カメラ10が撮像した画像と、算出された座標に音源の位置を示す表示を行った画像とを、組み合わせて出力する。この際、音源の位置を示す表示として、音源の中心位置に小さな円盤状のマークなどの画像を組み合わせて出力するのが好適である。   In generating the combination image, first, the sound source position calculation unit 50 calculates the direction of the sound from the sound source with respect to the monitoring device 1 by measuring the arrival time difference or phase difference of the sound received by each microphone of the microphone array 20. To do. With this calculation, a horizontal azimuth angle (φ) and a vertical elevation angle (θ) with respect to the microphone array 20 are obtained from the sound source of the incoming abnormal sound. Next, the sound source position calculation unit 50 converts the direction of the sound from the sound source obtained in this way into coordinates on the x-axis and the y-axis in the same coordinate system as the area of the image captured by the camera 10. When the direction of the sound from the sound source is converted into coordinates on the x-axis and the y-axis, the image combination unit 60, an image captured by the camera 10, and an image that displays the position of the sound source at the calculated coordinates are displayed. Are combined and output. At this time, it is preferable to output an image such as a small disk-shaped mark in combination with the center position of the sound source as a display indicating the position of the sound source.

図5(A)および図5(B)は、本発明による監視装置1によって出力される組合せ画像を出力して、モニタ100に表示した例を示す。図5(A)は、マイクロホンアレイ20を取り付けたカメラ10を、床に対して水平に配置した状態で撮像したものをモニタ100に出力して表示したものである。図5(B)は、マイクロホンアレイ20を取り付けたカメラ10を天井に配置した状態で撮像したものをモニタ100に出力して表示したものである。図5(A)および図5(B)のいずれも、音源となっている被撮影者がたたく手に対応して、その音源の位置が、小さな円盤状のマークで表示された組合せ画像が出力されている。図5(A)および図5(B)いずれも、音源の位置についての情報を、カメラ10が撮像した画像に正確に組み合わせることができることを示している。   FIGS. 5A and 5B show an example in which a combination image output by the monitoring apparatus 1 according to the present invention is output and displayed on the monitor 100. FIG. FIG. 5A shows the camera 10 with the microphone array 20 attached, taken in a state of being arranged horizontally with respect to the floor, output to the monitor 100 and displayed. FIG. 5B shows an image captured with the camera 10 with the microphone array 20 attached on the ceiling being output and displayed on the monitor 100. In both FIGS. 5A and 5B, a combined image in which the position of the sound source is displayed with a small disk-shaped mark corresponding to the hand of the subject who is the sound source is clapping is output. Has been. Both FIG. 5A and FIG. 5B show that information about the position of the sound source can be accurately combined with an image captured by the camera 10.

次に、本実施の形態による、組合せ画像出力処理について説明する。この処理は、マイクロホンアレイ20を構成する複数のマイクロホンが音を受音した時点から、当該音が異常音であるか否かを判定し、異常音の音源の位置をカメラ10の映像に組み合わせて出力するまでの処理である。すなわち、組合せ画像出力処理とは、上述した組合せ画像を出力する動作を含めた、監視装置1が画像および音を監視する動作を表す処理である。   Next, the combination image output process according to the present embodiment will be described. This process determines whether or not the sound is an abnormal sound from the time when a plurality of microphones constituting the microphone array 20 receive the sound, and combines the position of the sound source of the abnormal sound with the image of the camera 10. Processing until output. That is, the combined image output process is a process that represents the operation of monitoring the image and sound by the monitoring device 1 including the operation of outputting the above-described combined image.

図6は、本発明による監視装置1の実施の形態による、組合せ画像出力処理を説明するフローチャートである。図6において、何らかの音が発生し、その音を、マイクロホンアレイ20を構成するマイクロホンが受音した時点から、本実施の形態による組合せ画像出力処理は開始する。発生した音をマイクロホンアレイ20が集音すると、音響処理部30は、集音した音声信号から残響や雑音を除去し、さらに、必要に応じてレベル補正を行う(ステップS11)。   FIG. 6 is a flowchart for explaining combination image output processing according to the embodiment of the monitoring device 1 of the present invention. In FIG. 6, the combined image output process according to the present embodiment starts from the time when some sound is generated and received by the microphones constituting the microphone array 20. When the microphone array 20 collects the generated sound, the acoustic processing unit 30 removes reverberation and noise from the collected audio signal, and further performs level correction as necessary (step S11).

次いで、異常音判定部40は、音響処理部30により音響処理された音の異常性の解析を行う(ステップS12)。この際、異常音判定部40は、集音した音の信号から、音のレベル、音の包絡線プロフィール、周波数による解析などに基づいて、必要に応じて統計データとの相関により異常音を抽出し、状況により時間的経過からの判定なども加えて、音の異常性を判定する。ステップS12において、異常音判定部40が音の異常性を判定した結果、異常音ではないと判定した場合、異常音ではない音については組合せ画像を出力しないものとして、組合せ画像出力処理は終了する。これは、マイクロホンアレイ20が集音した音が、異常音ではなく環境音の一部などであると判定された場合に行う。この場合、音源の位置を示す表示が組合せ画像に含まれないため、監視装置1からは、カメラ10が撮像した画像がそのまま出力される。   Next, the abnormal sound determination unit 40 analyzes the abnormality of the sound acoustically processed by the acoustic processing unit 30 (step S12). At this time, the abnormal sound determination unit 40 extracts an abnormal sound from the collected sound signal based on the sound level, the sound envelope profile, the analysis based on the frequency, and the like, if necessary, by correlation with statistical data. However, the abnormality of the sound is determined by adding the determination from the passage of time depending on the situation. In step S12, when the abnormal sound determination unit 40 determines that the sound is abnormal, if it is determined that the sound is not an abnormal sound, the combined image is not output for a sound that is not an abnormal sound, and the combined image output process ends. . This is performed when it is determined that the sound collected by the microphone array 20 is not an abnormal sound but a part of the environmental sound. In this case, since the display indicating the position of the sound source is not included in the combined image, the image captured by the camera 10 is output as it is from the monitoring device 1.

ステップS12にて音が異常音であると判定された場合、異常音判定部40は、例えば、音のレベル、音の包絡線プロフィール、周波数解析、音の発生回数および継続時間等からの判定などを項目別に点数化し、合計点で異常性をランク分けする(ステップS13)。これにより、異常音判定部40は、音の異常性のランクを例えば「異常性=高/中/低」などにランク分けする。   If it is determined in step S12 that the sound is an abnormal sound, the abnormal sound determination unit 40 determines, for example, from the sound level, the sound envelope profile, the frequency analysis, the number of sound occurrences, the duration, and the like. Is scored for each item, and the anomaly is ranked by the total score (step S13). Thereby, the abnormal sound determination unit 40 ranks the rank of the abnormality of the sound into, for example, “abnormality = high / medium / low”.

ステップS13において音の異常性のランクが特定されたら、次に、音源位置算出部50は、音源位置の算出を行う(ステップS14)。このステップS14では、上述したように、マイクロホンアレイ20のマイクロホンに到達する音のマイクロホン間の距離による時間差を計測することによって、音源からの角度を算出し、この算出された方向に基づいて、x軸方向およびy軸方向における音源の位置を算出する。   If the rank of the abnormality of sound is specified in step S13, the sound source position calculation unit 50 next calculates the sound source position (step S14). In step S14, as described above, the angle from the sound source is calculated by measuring the time difference due to the distance between the microphones of the sound that reaches the microphones of the microphone array 20, and the x direction is calculated based on the calculated direction. The position of the sound source in the axial direction and the y-axis direction is calculated.

ステップS14において音源の位置が算出されたら、画像組合せ部60は、算出された音源位置の座標が、カメラ10の撮像領域内にあるか否か判定する(ステップS15)。ステップS15において、音源位置の座標がカメラ10の所定の撮像領域内にある場合、すなわち、カメラ10の画角の範囲内にあるため画像として直接表示できる場合、画像組合せ部60は、上述した処理により、組合せ画像を出力する(ステップS16)。すなわち、ステップS16では、画像組合せ部60は、カメラ10が撮像した画像と、算出された座標に音源の位置を表示した画像とを、組み合わせて(重ね合わせて)出力する。   When the position of the sound source is calculated in step S14, the image combination unit 60 determines whether or not the coordinates of the calculated sound source position are within the imaging region of the camera 10 (step S15). In step S15, when the coordinates of the sound source position are within the predetermined imaging area of the camera 10, that is, when the coordinates of the sound source position are within the range of the angle of view of the camera 10, they can be directly displayed as an image. Thus, a combination image is output (step S16). That is, in step S16, the image combination unit 60 combines (superimposes) an image captured by the camera 10 and an image displaying the position of the sound source at the calculated coordinates.

ここで、必要に応じて、異常性のランクについての情報も含めて、画像を組み合わせることもできる。すなわち、画像組合せ部60は、ステップS13において異常音判定部40が特定した音の異常性のランクに基づいて、組み合わせる画像に表示する音源を表すマークの色を変更するなどの処理を行うことができる。例えば、異常音判定部40が「異常性=中」と判定した音の音源を示すマークは黄色で出力し、「異常性=高」と判定した音の音源を示すマークは赤色で出力する、などの処理を行うことができる。   Here, if necessary, images can be combined including information on the rank of abnormality. That is, the image combination unit 60 may perform processing such as changing the color of the mark representing the sound source displayed in the combined image based on the rank of the abnormality of the sound specified by the abnormal sound determination unit 40 in step S13. it can. For example, a mark indicating a sound source of a sound determined by the abnormal sound determination unit 40 as “abnormality = medium” is output in yellow, and a mark indicating a sound source of a sound determined as “abnormality = high” is output in red. Etc. can be performed.

このようにして、ステップS16において、画像組合せ部60により組合せ画像が出力されたら、その後は、その画像をモニタ100などに表示させることができる。したがって、この画像を監視者が見れば、異常音と判定された音の音源の位置と、その音の異常性のランクとを、視覚的に容易に認識することができる。   In this way, after the combined image is output by the image combining unit 60 in step S16, the image can be displayed on the monitor 100 or the like thereafter. Therefore, if the supervisor looks at this image, the position of the sound source of the sound determined as an abnormal sound and the rank of the abnormality of the sound can be easily recognized visually.

この後、ステップS13において特定した音の異常性のランクが、予め定められた所定のランク以上であるか否かを判定する(ステップS17)。ステップS17において、音の異常性のランクが所定のランク以上ではないと判定される場合、これにて本処理は終了する。これにより、例えば「異常性=低」と判定される音のように、異常音ではあるが比較的危険度の低い音を検知した際に、監視者に逐一報知がなされるということを回避することができる。   Thereafter, it is determined whether or not the rank of the abnormality of the sound specified in step S13 is equal to or higher than a predetermined rank (step S17). In step S17, when it is determined that the rank of the sound abnormality is not equal to or higher than the predetermined rank, the process is terminated. Thus, for example, when a sound that is abnormal but relatively low in danger is detected, such as a sound determined to be “abnormality = low”, it is avoided that notification is made to the supervisor one by one. be able to.

一方、ステップS17において音の異常性のランクが所定のランク以上と判定される場合、ネットワーク処理部80および/またはアラーム処理部70は、予め定めた設定に基づいて、外部にアラーム情報を出力する(ステップS18)。このステップS18では、アラーム処理部70は、異常音判定部40が特定した音の異常性のランクに基づいて、アラーム情報を出力する。また、アラーム処理部70からの通知を受けたネットワーク処理部80が、ネットワーク200を経由して、遠隔地の監視場所や携帯電話等に、このアラーム情報を配信し、監視者に音の異常を通知することもできる。この際、監視者側で音源位置の情報や異常性のランクの情報を望む場合には、これらの情報を、ネットワーク200を経由して監視者に通知することもできる。   On the other hand, if it is determined in step S17 that the rank of the sound abnormality is equal to or higher than the predetermined rank, the network processing unit 80 and / or the alarm processing unit 70 outputs alarm information to the outside based on a predetermined setting. (Step S18). In step S18, the alarm processing unit 70 outputs alarm information based on the rank of the abnormality of the sound specified by the abnormal sound determination unit 40. In addition, the network processing unit 80 that has received the notification from the alarm processing unit 70 distributes the alarm information to a remote monitoring location, a mobile phone, etc. via the network 200, so that the monitor is informed of the abnormal sound. You can also be notified. At this time, if the monitor side wants the information on the sound source position and the information on the abnormality rank, the information can be notified to the monitor via the network 200.

なお、別個にPTZカメラが設置されている場合には、このアラーム情報を使用することにより、PTZカメラを異常音の方向に向けて、さらにズームアップなどさせることにより、音源の画像を確認することができる。さらに、マイクロホンアレイ20で取得しているライブ音を、ネットワーク200経由でリアルタイムに監視室に送ることによって、異常音を人間の耳で確認するようにもできる。   If a separate PTZ camera is installed, use this alarm information to check the image of the sound source by pointing the PTZ camera in the direction of abnormal sound and zooming in further. Can do. Furthermore, by sending live sound acquired by the microphone array 20 to the monitoring room in real time via the network 200, the abnormal sound can be confirmed by a human ear.

このように処理を行うことにより、異常性が低いと特定された音が逐一外部に通知されることを防ぎ、また、外部に通知する必要のある異常性の高い音が検知された際に、確実に外部に通知されるようにできる。   By performing processing in this way, it is possible to prevent the sound identified as having low anomaly from being notified to the outside one by one, and when a highly abnormal sound that needs to be notified to the outside is detected, It can be surely notified to the outside.

図7(A)は、上述した組合せ画像出力処理により、モニタ100に出力される画像の例として、音源位置を小さな円盤状のマークで画面に表示した画面表示例を示す。図7(A)において、カメラ10の画角の範囲内で画像に直接表示できる音源A,Bを、円盤状のマークで表示している。この場合、音源A,Bは、異常性のランクに応じて色分けされる。このような表示により、当該画像が撮像された時点において、異常と判定された音がAおよびBの位置において発生したことを監視者は容易に認識することができる。また、AおよびBの位置に示したマークの色により、A,Bそれぞれの位置で発生した音の異常性のランクも容易に認識することができる。   FIG. 7A shows a screen display example in which the sound source position is displayed on the screen with small disk-like marks as an example of an image output to the monitor 100 by the above-described combination image output processing. In FIG. 7A, the sound sources A and B that can be directly displayed on the image within the range of the angle of view of the camera 10 are displayed as disk-shaped marks. In this case, the sound sources A and B are color-coded according to the rank of abnormality. With such a display, the supervisor can easily recognize that the sound determined to be abnormal has occurred at the positions A and B when the image is captured. Further, the rank of the abnormality of the sound generated at each of the positions A and B can be easily recognized by the colors of the marks shown at the positions A and B.

図7(B)は、上述した組合せ画像出力処理により、モニタ100に出力される画像の他の例として、画面を64分割することにより、分割した小領域に音源の位置および音の異常性のレベルを表示した画面表示例を示す。図7(B)に示すように、カメラ10の画角の範囲内に存在する音源A,Bに対応する画面分割した小領域を、異常性のランクに応じて色分けして表示してもよい。このような表示によっても、当該画像が撮像された時点において、異常と判定された音がAおよびBの位置において発生したことを監視者は容易に認識することができる。   FIG. 7B shows another example of an image output to the monitor 100 by the combination image output process described above, and the screen is divided into 64 parts, so that the position of the sound source and the abnormality of the sound are divided into the divided small areas. An example of screen display showing levels is shown. As shown in FIG. 7B, the screen-divided small areas corresponding to the sound sources A and B existing within the range of the angle of view of the camera 10 may be displayed in different colors according to the abnormality rank. . Even with such a display, the supervisor can easily recognize that the sound determined to be abnormal has occurred at the positions A and B when the image is captured.

また、図6のステップS15において、音源位置の座標がカメラ10の撮像領域内にない場合、すなわち、カメラ10の画角の範囲内に音源位置の画像を直接表示できない場合、画像組合せ部60は、音源のおおよその位置を示すために、撮像領域外の方向を特定する処理を行う(ステップS19)。具体的には、音源の位置が、カメラ10の画角の範囲内からはみ出す場合、はみ出す方向に対応するカメラ10の画角の範囲内の縁辺を特定する。   In step S15 of FIG. 6, if the coordinates of the sound source position are not within the imaging area of the camera 10, that is, if the image of the sound source position cannot be directly displayed within the range of the angle of view of the camera 10, the image combination unit 60 In order to indicate the approximate position of the sound source, a process for specifying the direction outside the imaging region is performed (step S19). Specifically, when the position of the sound source protrudes from the range of the angle of view of the camera 10, an edge in the range of the angle of view of the camera 10 corresponding to the protruding direction is specified.

図8は、撮像領域外の方向の特定を説明する図である。図8において、マイクロホンアレイ20により集音可能な領域の範囲は、x軸方向の方位角が−180度〜180度であり、y軸方向の仰角が−180度〜180度であるものとする。このような範囲のうち、カメラ10により撮像できる画角の範囲は、x軸方向の方位角が−φm〜φmであり、y軸方向の仰角が−θm〜θmであるものとし、この範囲で表現される画角の領域をeとする。この領域eは、モニタ100の表示部に表示できる限界に対応している。   FIG. 8 is a diagram illustrating the specification of the direction outside the imaging region. In FIG. 8, the range of the region that can be collected by the microphone array 20 is such that the azimuth angle in the x-axis direction is −180 degrees to 180 degrees and the elevation angle in the y-axis direction is −180 degrees to 180 degrees. . Of these ranges, the range of the field of view that can be captured by the camera 10 is such that the azimuth angle in the x-axis direction is −φm to φm and the elevation angle in the y-axis direction is −θm to θm. Let e be the field of view angle to be expressed. This region e corresponds to the limit that can be displayed on the display unit of the monitor 100.

この場合、領域e内において異常音が発生した場合(ステップS15のYes)は、カメラ10が撮像する画像の領域内に音源の位置のマークなどをそのまま表示することができる。しかしながら、カメラ10が撮像する画像の領域外である、領域b,d,f,hに音源の位置がある場合(ステップS15のNo)、その音源のおおよその位置として、各領域に対応する領域eの縁辺を特定する。また、領域a,c,g,iに音源の位置がある場合(ステップS15のNo)は、その音源のおおよその位置として、領域eの四隅のうち各領域に対応する、2本の縁辺が交わる位置を特定する。   In this case, if an abnormal sound is generated in the area e (Yes in step S15), the mark of the position of the sound source can be displayed as it is in the area of the image captured by the camera 10. However, if the position of the sound source is in the areas b, d, f, and h outside the area of the image captured by the camera 10 (No in step S15), the area corresponding to each area as the approximate position of the sound source Specify the edge of e. When the sound source is located in the areas a, c, g, and i (No in step S15), as the approximate position of the sound source, two edges corresponding to each area of the four corners of the area e are included. Identify the intersection.

このように、ステップS19において、撮像領域外の方向が特定されたら、その後、ステップS16にて、画像組合せ部60は、カメラ10が撮像した画像と、音源の方向を表示した画像とを、組み合わせて出力する。すなわち、図8の領域bに音源の位置がある場合には、領域eの上側の縁辺に例えば細長のマークを表示し、領域fに音源の位置がある場合には、領域eの右側の縁辺に細長のマークを表示する。   Thus, when the direction outside the imaging region is specified in step S19, then in step S16, the image combination unit 60 combines the image captured by the camera 10 and the image displaying the direction of the sound source. Output. That is, when the position of the sound source is in the area b of FIG. 8, for example, a long and narrow mark is displayed on the upper edge of the area e, and when the position of the sound source is in the area f, the right edge of the area e is displayed. A long and narrow mark is displayed.

例えば、図7(A)および図7(B)においては、音源の方向を示す細長のマークCが、撮像した画像における画角の右側の縁辺上に表示されているが、これは、図8におけるfの領域に異常音の音源が存在することを意味している。すなわち、音源Cの位置は、カメラ10が撮像する画像の領域外(画角外)にあるため、モニタ100に表示することができないが、音源を示す通常のマークとは異なる表示を行うことにより、画像の領域外の右側に、異常音の音源の位置があることを示している。なお、この場合も、音源Cが発する音の異常性のランクに応じて、マークを色分けして表示することができる。   For example, in FIGS. 7A and 7B, an elongated mark C indicating the direction of the sound source is displayed on the right edge of the angle of view in the captured image. This means that an abnormal sound source exists in the region f. That is, since the position of the sound source C is outside the region of the image captured by the camera 10 (out of the angle of view), it cannot be displayed on the monitor 100, but by performing a display different from the normal mark indicating the sound source. This shows that the position of the abnormal sound source is on the right side outside the image area. In this case as well, the marks can be displayed in different colors according to the rank of the abnormality of the sound generated by the sound source C.

また、図8に示す領域a,c,g,iに音源の位置がある場合は、各領域に対応する領域eの隅角部において、2本の縁辺が交わる位置に沿うように、L字形状のマークを表示する。これにより、カメラ10が撮像する画像の領域外にある音源の位置が、領域b,d,f,h以外の斜め方向の領域であることを示すことができる。   In addition, when the positions of the sound sources are in the areas a, c, g, and i shown in FIG. 8, L-shaped so that the two edges meet at the corners of the area e corresponding to each area. Display the shape mark. Thereby, it can be shown that the position of the sound source outside the region of the image captured by the camera 10 is an oblique region other than the regions b, d, f, and h.

次に、本実施の形態による、音の時間経過表示処理について説明する。本処理は、音源の位置の時間的な履歴を表示することにより、音源が移動したり、複数の音源が連続的に音を発生する場合でも、監視者がその様子をひと目で確認できるような表示を行う処理である。   Next, the sound time-lapse display process according to the present embodiment will be described. This process displays the time history of the sound source position, so that even if the sound source moves or multiple sound sources continuously generate sound, the supervisor can check the situation at a glance. This is a process for displaying.

図9は、図6で説明した組合せ画像出力処理と、音の時間経過表示処理とを含めた監視装置1の動作を説明するフローチャートである。ステップS31においてマイクロホンアレイ20が音を検出したら、ステップS32において、図6で説明した組合せ画像出力処理を行った後に、ステップS33に移行する。ステップS31においてマイクロホンアレイ20が音を集音しない場合は、そのままステップS33に移行する。   FIG. 9 is a flowchart for explaining the operation of the monitoring device 1 including the combined image output process described in FIG. 6 and the sound time lapse display process. If the microphone array 20 detects a sound in step S31, in step S32, after performing the combination image output process demonstrated in FIG. 6, it will transfer to step S33. If the microphone array 20 does not collect sound in step S31, the process proceeds to step S33 as it is.

次に、ステップS33において、画像組合せ部60は、予め定めた所定の時間が経過したか否かを判定し、所定の時間が経過していない場合には、ステップS31に戻って処理を続行する。一方、ステップS33において、所定の時間が経過した場合には、画像組合せ部60は、時間経過表示処理を行ってから(ステップS34)、ステップS31に戻って処理を続行する。ステップS33にて判定する所定の時間は、その時間を単位として音源の位置を示す表示の態様を変化(更新)させるため、例えば0.5秒ごと、1秒ごと、または3秒ごと等、監視する対象(想定される音源)に応じて予め好適と思われる時間を設定する。   Next, in step S33, the image combination unit 60 determines whether or not a predetermined time has elapsed. If the predetermined time has not elapsed, the image combination unit 60 returns to step S31 and continues the processing. . On the other hand, if the predetermined time has elapsed in step S33, the image combination unit 60 performs the time elapsed display process (step S34), and then returns to step S31 to continue the process. The predetermined time determined in step S33 is monitored every 0.5 seconds, every 1 second, or every 3 seconds, for example, to change (update) the display mode indicating the position of the sound source in units of that time. The time which seems to be suitable is set in advance according to the target (assumed sound source).

図9に示す動作を行うにあたり、音源位置算出部50により算出された音源の位置がひとたび画像組合せ部60に入力されたら、画像組合せ部60は、その音源の位置が、順次入力されるカメラ10が撮像した画像に表示されたままになるように画像を組み合わせる。すなわち、例えば一瞬で止む音であっても、その音源の位置を示すマークは一瞬表示されてすぐに消えるのではなく、表示されたままになるようにする。ただし、このような表示を行うと、音源が移動する場合などは、モニタ100に表示される画面が、音源の位置を示すマークの画像の履歴で満たされてしまい、カメラ10が撮像する画像が見難くなることも想定される。   In performing the operation shown in FIG. 9, once the position of the sound source calculated by the sound source position calculation unit 50 is input to the image combination unit 60, the image combination unit 60 receives the position of the sound source sequentially from the camera 10. The images are combined so that they remain displayed on the captured image. That is, for example, even if the sound stops for a moment, the mark indicating the position of the sound source is displayed for a moment, but does not disappear immediately, but remains displayed. However, when such a display is performed, when the sound source moves, the screen displayed on the monitor 100 is filled with the history of the mark image indicating the position of the sound source, and the image captured by the camera 10 is captured. It may be difficult to see.

そこで、図10(A)に示すように、画像組合せ部60は、音源の位置を表示するマークの画像を、時間の経過に応じた表示態様で変化させる。図10(A)に示した円盤型のマークは、或る音源が一瞬で止む音を発した場合に、音源位置を示すマークの画像として最初に出力されるものがマークaであることを示している。また、図10(A)は、音源の音が止んだ後も、所定の時間の経過とともに、マークb,c,d,eの順に表示が変化する様子を表している。図10(A)に示すように、音源を示すマークの画像は、時間の経過と共に小さくなるようにし、ある程度の時間が経過した後には完全に消去するようにするのが好適である。   Therefore, as shown in FIG. 10A, the image combination unit 60 changes the image of the mark for displaying the position of the sound source in a display mode corresponding to the passage of time. The disc-shaped mark shown in FIG. 10A indicates that when a certain sound source emits a sound that stops instantaneously, the first output as a mark image indicating the sound source position is the mark a. ing. FIG. 10A shows a state in which the display changes in the order of marks b, c, d, and e as the predetermined time elapses even after the sound of the sound source stops. As shown in FIG. 10A, it is preferable that the mark image indicating the sound source is made smaller with the passage of time and is completely erased after a certain amount of time has passed.

このような表示を行うことにより、音源の位置を示すマークが比較的大きい場合は、最近に近い時刻で音が発生していることが監視者に容易に認識できる。一方、音源の位置を示すマークが比較的小さい場合は、その位置で音が発生してから若干の時間が経過していることが監視者に容易に認識できる。また、音源の位置を示すマークの箇所に、音源となり得る物体が画像から確認できない場合であっても、近い過去に、その位置に音源が存在したことを示すことができ、さらに、その音源の移動の履歴も監視者が容易に確認できるように示すことができる。   By performing such a display, when the mark indicating the position of the sound source is relatively large, the monitor can easily recognize that the sound is being generated at the nearest time. On the other hand, if the mark indicating the position of the sound source is relatively small, it can be easily recognized by the supervisor that some time has elapsed since the sound was generated at that position. In addition, even if an object that can be a sound source cannot be confirmed from the image at the mark indicating the position of the sound source, it can indicate that the sound source existed at that position in the near past. The movement history can also be shown so that the observer can easily confirm.

図10(B)は、時間経過表示処理によって、移動する音源の履歴を表示した例を示す図である。図10(B)は、歩行する人物がカメラ10により撮像され、音源の位置を表示した画像と組み合わされて、モニタ100に出力された例を示している。例えば、この歩行する人物が、大きな音を立てて、監視装置1の方向に歩いてきた状態であるとする。この場合、歩行する人物が立てる音は、ほぼ同じ大きさで連続して発生する音であるが、その音源は移動しているため、図10(B)に示す音源位置のマークは、a,b,c,d,eの順に、最近から過去の音へと移動する音の履歴を表している。このような表示により、監視者は、或る時刻の画像をひと目見るだけで、ある程度過去の音の履歴をも、迅速かつ容易に確認することができる。   FIG. 10B is a diagram illustrating an example in which the history of the moving sound source is displayed by the time passage display process. FIG. 10B shows an example in which a walking person is captured by the camera 10 and is output to the monitor 100 in combination with an image displaying the position of the sound source. For example, it is assumed that this walking person makes a loud noise and walks in the direction of the monitoring device 1. In this case, the sound made by the walking person is a sound that is continuously generated with substantially the same magnitude, but since the sound source is moving, the mark of the sound source position shown in FIG. In the order of b, c, d, and e, a history of sounds moving from the latest to the past is shown. With such a display, the supervisor can quickly and easily confirm the past sound history to a certain degree by simply looking at an image at a certain time.

図11は、上述した音の履歴を表示する時間経過表示処理を、カメラ10が撮像する画像の領域外の方向を示す処理に適用した例を説明する図である。図11(A)の上側の縁辺に示す細長のマークa,b,c,d,eのそれぞれは、マイクロホンアレイ20が集音した音の音源の位置が、図8に示した範囲bに存在することを示すものである。この音が一瞬で止む音であった場合、音源が音を発した直後には、マークaを表示し、その後、所定の時間が経過するごとに、マークb,c,d,eのように、順に小さな表示に変化させることで、過去の音の履歴を表示する。図11(A)の左側の縁辺に示す細長のマークf,g,h,i,jのそれぞれは、マイクロホンアレイ20が集音した音の音源の位置が、図8に示した範囲dに存在することを示すものである。この場合も、音が一瞬で止む音であった場合、音源が音を発した直後にはマークfを表示し、その後、所定の時間が経過するごとに、マークg,h,i,jのように、順に小さな表示に変化させる。   FIG. 11 is a diagram for explaining an example in which the above-described time-lapse display process for displaying a sound history is applied to a process indicating a direction outside an area of an image captured by the camera 10. In each of the elongated marks a, b, c, d, and e shown on the upper edge of FIG. 11A, the position of the sound source of the sound collected by the microphone array 20 exists in the range b shown in FIG. It shows what to do. If this sound is a sound that stops instantaneously, the mark a is displayed immediately after the sound source emits the sound, and thereafter, every time a predetermined time elapses, the mark b, c, d, e, etc. The history of the past sound is displayed by changing to small display in order. In each of the elongated marks f, g, h, i, and j shown on the left edge of FIG. 11A, the position of the sound source collected by the microphone array 20 exists in the range d shown in FIG. It shows what to do. Also in this case, if the sound is a sound that stops instantaneously, the mark f is displayed immediately after the sound source emits the sound, and thereafter, every time a predetermined time elapses, the marks g, h, i, j In this way, the display is changed to smaller ones in order.

図11(B)の左上端の隅角部の縁辺において示す細長のマークa,b,c,d,eのそれぞれは、マイクロホンアレイ20が集音した音の音源の位置が、図8に示した範囲aに存在することを示すものである。この音が一瞬で止む音であった場合、音源が音を発した直後にはマークaを表示し、その後、所定の時間が経過するごとに、マークb,c,d,eのように、順に小さな表示に変化させる。以上のような表示を行うことにより、異常音を発する音源の位置が画像の領域外であったとしても、その音源の方向を示すとともに、その音の履歴を示すことができる。   Each of the elongated marks a, b, c, d, and e shown at the edge of the upper left corner of FIG. 11B indicates the position of the sound source collected by the microphone array 20, as shown in FIG. In other words, it is present in the range a. When this sound is a sound that stops in a moment, the mark a is displayed immediately after the sound source emits the sound, and thereafter, every time a predetermined time elapses, like the marks b, c, d, e, Change to small display in order. By performing the display as described above, even if the position of the sound source that emits the abnormal sound is outside the region of the image, the direction of the sound source and the history of the sound can be shown.

次に、本実施の形態の音響処理部30および異常音判定部40によって、異常音を検出する精度を向上するために行うことができる種々の措置について説明する。   Next, various measures that can be taken to improve the accuracy of detecting abnormal sounds by the acoustic processing unit 30 and the abnormal sound determination unit 40 of the present embodiment will be described.

まず、本発明による監視装置1において、異常音判定部40が異常音を判定するために用いる音の法絡線プロフィールを、比較のためにパワースペクトルとともに説明する。従来、異常音を判断するために、主として2つの判断、すなわち、(1)音のレベルがしきい値を超えたか否かの判断、および、(2)パワースペクトルが予め設定した基準に合致するか否かの判断、が行われている。   First, in the monitoring device 1 according to the present invention, a normal line profile of sound used by the abnormal sound determination unit 40 to determine abnormal sound will be described together with a power spectrum for comparison. Conventionally, in order to determine an abnormal sound, there are mainly two determinations: (1) determination as to whether the sound level exceeds a threshold; and (2) the power spectrum meets a preset criterion. Whether or not is being determined.

上記(1)の判断によれば、しきい値を超える大きな音であれば、どのような音でも異常音と判断される。上記(2)の判断は、パワースペクトルを用いて音の種類を見分けようとするものであり、(1)の判断と比べた場合、音の異常性を判断する手がかりとしての情報が多く、判断の確度が著しく向上すると考えられる。   According to the determination of (1) above, any sound is determined to be an abnormal sound as long as it is a loud sound exceeding the threshold. The determination in (2) is intended to identify the type of sound using the power spectrum. Compared with the determination in (1), there is much information as a clue to determine the abnormality of the sound. It is considered that the accuracy of the remarkably improves.

しかしながら、(2)の判断は時間方向の情報を利用していないため、似たような音色を持ちつつ持続時間が異なるような音を判別することができない。例えば、エアコンディショナーの運転に伴うモータ音や風切り音は、異常音ではないと判断すべき場合が多いと考えられる。しかしながら、類似する音が一瞬だけ発生したり急激にレベルが変動したりする際には、エアコンディショナーの運転音ではなく、異常音であると判断すべき場合もある。   However, since the determination in (2) does not use information in the time direction, it is impossible to determine a sound having a similar tone color but having a different duration. For example, it is considered that there are many cases where it should be determined that motor sounds and wind noises associated with the operation of an air conditioner are not abnormal sounds. However, when a similar sound is generated for a moment or the level is suddenly changed, it may be determined that the sound is not an air conditioner operation sound but an abnormal sound.

本発明による監視装置1で用いられる包絡線プロフィールは、音のレベルの時間変動情報であり、(1)および(2)の判断では欠落している時間変動の情報を加味することによって異常性判断の確度を高めるものである。例えば、ガラス破壊音のサンプルのパワースペクトルは、図12(A)に示す例のようになる。図12(A)では、スペクトルがかなり広帯域に亘っており、通常ではほとんど発生しない音であると考えられる。しかしながら、このようなパワースペクトルでは、周波数を横軸として表しているため時間情報が欠落している。したがって、検知した音が衝撃音であるのか、またはエアーノズルなどが発するホワイトノイズ性の持続音であるのかを判断することはできない。   The envelope profile used in the monitoring device 1 according to the present invention is sound level time variation information, and anomaly judgment is made by taking into account the time variation information that is missing in the judgments of (1) and (2). To improve the accuracy. For example, the power spectrum of a sample of glass breaking sound is as shown in FIG. In FIG. 12A, the spectrum has a fairly wide band, and it is considered that the sound hardly occurs normally. However, in such a power spectrum, time information is missing because the frequency is represented on the horizontal axis. Therefore, it cannot be determined whether the detected sound is an impact sound or a white noise continuous sound emitted by an air nozzle or the like.

一方、ガラス破壊音のサンプルの包絡線プロフィールは、図12(B)に示すようになる。図12(B)では、ガラス破壊音は、突然立ち上がる鋭いピークを数回示した後に収まっており、何らかの衝撃音であると判断することができる。したがって、予め設定された判断基準に照らし合わせることによって、異常性の判断の手がかりを増やすことができる。このように、本実施の形態によれば、包絡線プロフィール、周波数解析、音のレベルまたは音の時間的経過を用いて音の異常性を判定することによって、多様な異常音の判定を行うことができる。   On the other hand, the envelope profile of the sample of the glass breaking sound is as shown in FIG. In FIG. 12B, the glass breaking sound is settled after showing a sharp peak that rises suddenly several times, and can be determined to be some kind of impact sound. Therefore, the clues for determining the abnormality can be increased by comparing with the preset determination criteria. Thus, according to the present embodiment, various abnormal sounds can be determined by determining sound anomalies using an envelope profile, frequency analysis, sound level, or sound time course. Can do.

また、到来する音から、部屋の残響の影響や、周囲の環境雑音を排除したり、到来する音のレベルの適正化を行うことによって、異常音が認識しやすくなり、音の到来方向および異常判定の精度を向上することができる。   In addition, by removing the effects of room reverberation and ambient noise from the incoming sound, and by optimizing the level of the incoming sound, it becomes easier to recognize abnormal sounds, and the direction and direction of sound arrival. The accuracy of determination can be improved.

以下、壁や障害物からの反射音が音の到来方向の算出に及ぼす影響を低減する手法について説明する。図13は、反射音による影響を低減する手法を説明する図であり、横軸に時間をとったタイムチャートで示している。図13のタイムチャートAは、反射音が存在する場合にマイクロホンアレイ20を構成するマイクロホンの1つによって集音され、音響処理部30によって補正された音の音圧レベルを示す。また、タイムチャートB,C及びDは、それぞれ、音圧レベルのピーク検出区間、音の取り込みを待機するホールドオフ区間及び到来方向処理のタイムアウト区間を示す。   Hereinafter, a method for reducing the influence of sound reflected from a wall or an obstacle on the calculation of the arrival direction of the sound will be described. FIG. 13 is a diagram for explaining a method for reducing the influence of reflected sound, and is shown in a time chart with time on the horizontal axis. A time chart A in FIG. 13 shows the sound pressure level of the sound collected by one of the microphones constituting the microphone array 20 and corrected by the acoustic processing unit 30 when there is reflected sound. In addition, time charts B, C, and D respectively show a sound pressure level peak detection section, a hold-off section that waits for sound acquisition, and a time-out section for arrival direction processing.

図13のタイムチャートについて説明する。タイムチャートAに示すように、マイクロホンによって集音された音圧レベルは、時間の経過に伴い、音源からの直接音や反射音によって変化する。このとき、異常音判定部40は、音圧レベルが所定の閾値Thを超えた場合に環境音とは異なる異常音を検出したと判定し、タイムチャートBに示すように、ピーク検出信号が立ち上がる。その後、音源からの直接音が到来して第1のピークP1が観察されると、タイムチャートBのピーク検出信号が立ち下がる。   The time chart of FIG. 13 will be described. As shown in the time chart A, the sound pressure level collected by the microphone varies with the direct sound or reflected sound from the sound source as time passes. At this time, the abnormal sound determination unit 40 determines that an abnormal sound different from the environmental sound is detected when the sound pressure level exceeds a predetermined threshold Th, and the peak detection signal rises as shown in the time chart B. . Thereafter, when the direct sound from the sound source arrives and the first peak P1 is observed, the peak detection signal of the time chart B falls.

タイムチャートAに示すように、音源からの直接音が到来して第1のピークP1が生じた後、反射音により第2のピークP2が生じている。このとき、反射音である第2のピークP2を検出したときに音の到来方向の算出を行うことは、音源位置の算出処理に誤差を生じさせるため好ましくない。したがって、タイムチャートBにおいて第1のピークP1の検出後にピーク検出信号が立ち下がると、タイムチャートCに示すように、ホールドオフ信号が立ち上がる。その後、ホールドオフ信号は、音圧レベルが所定の閾値Thを下回ると立ち下がる。   As shown in the time chart A, after the direct sound from the sound source arrives and the first peak P1 is generated, the second peak P2 is generated by the reflected sound. At this time, it is not preferable to calculate the arrival direction of the sound when the second peak P2 that is the reflected sound is detected, because an error is caused in the calculation process of the sound source position. Therefore, when the peak detection signal falls after the detection of the first peak P1 in the time chart B, as shown in the time chart C, the hold-off signal rises. Thereafter, the hold-off signal falls when the sound pressure level falls below a predetermined threshold Th.

このように、音圧レベルが第1のピークP1を超えてから所定の閾値Thを下回るまでの区間を取込禁止区間(ホールドオフ区間)T1とし、音源位置算出部50は、この区間には、音圧レベルのピークが観察されても、音源位置の算出処理を行わないようにする。すなわち、音源位置算出部50は、マイクロホンアレイ20が集音した音の音圧の最初のピークを検出したら、所定期間、音源の位置の算出処理を行わずに、その最初のピーク近傍の音圧波形に基づいて、音源の位置を算出する。このようにすることで、反射音による影響を加味することにより音源位置の算出に誤差を生じさせてしまうことを防ぐことができる。   As described above, a section from when the sound pressure level exceeds the first peak P1 to below the predetermined threshold Th is defined as a prohibition section (hold-off section) T1, and the sound source position calculation unit 50 includes Even if the peak of the sound pressure level is observed, the calculation process of the sound source position is not performed. That is, when the sound source position calculation unit 50 detects the first peak of the sound pressure of the sound collected by the microphone array 20, the sound pressure near the first peak is not calculated for a predetermined period of time. Based on the waveform, the position of the sound source is calculated. By doing so, it is possible to prevent an error from being generated in the calculation of the sound source position by taking into account the influence of the reflected sound.

なお、この取込禁止区間T1は、タイムチャートAにおいて、所定の閾値Thを下回ると同時に解除し、次に到来する音(第3のピークP3)を取り込むようにするのが好適である。したがって、ホールドオフを行う区間の上限値(タイムアウト区間)T2を設け、音圧レベルがタイムアウト区間T2を経過しても閾値Thを下回らない場合はタイムアウトし、音の取り込みが再開されるようにする。すなわち、タイムチャートBにおいてピーク検出信号が立ち下がると、タイムチャートDのようにタイムアウト処理信号が立ち上がり、タイムアウト処理信号は、タイムアウト区間T2が経過すると立ち下がるようにする。そして、タイムアウト区間T2が立ち下がった際に音圧レベルが所定の閾値Thを上回っている場合は、第3のピークP3を検出したとして、タイムチャートBに示すようにピーク検出信号が立ち上がる。なお、タイムアウト区間T2としては、例えば最大1.5秒とすることができる。   In the time chart A, it is preferable to cancel the capture prohibition section T1 as soon as it falls below a predetermined threshold Th and capture the next incoming sound (third peak P3). Therefore, an upper limit value (timeout period) T2 of a section in which hold-off is performed is provided, and if the sound pressure level does not fall below the threshold value Th even after the time-out period T2, a time-out occurs and sound capturing is resumed. . That is, when the peak detection signal falls in the time chart B, the timeout processing signal rises as in the time chart D, and the timeout processing signal falls when the timeout section T2 has elapsed. If the sound pressure level exceeds a predetermined threshold Th when the timeout period T2 falls, the peak detection signal rises as shown in the time chart B, assuming that the third peak P3 is detected. The timeout period T2 can be set to 1.5 seconds at the maximum, for example.

なお、音圧レベルを測定するマイクロホンとしては、マイクロホンアレイ20とは別のマイクロホン(図示せず)を別個設けてもよい。このとき、音圧レベルを測定するマイクロホンが集音した音に対しても、レベル補正を行うのが好適である。   Note that a microphone (not shown) different from the microphone array 20 may be separately provided as a microphone for measuring the sound pressure level. At this time, it is preferable to perform level correction on the sound collected by the microphone for measuring the sound pressure level.

上述のように、異常音判定部40は、マイクロホンアレイ20を構成するマイクロホンの少なくとも1つ、またはマイクロホンアレイ20とは別個に設けたマイクロホンによって集音された音のレベルが所定の閾値Thを上回る音のうち、所定時間(タイムアウト区間T2またはホールドオフ区間T1)以内に、所定の閾値Thを上回る音が先行して集音されていない音を選択して、音源位置算出部50に出力する。このようにすることで、反射音の影響を取り除くことができ、直接音のみで、より精度良く音源位置の算出を行うことが可能となる。   As described above, in the abnormal sound determination unit 40, the level of sound collected by at least one of the microphones constituting the microphone array 20 or the microphone provided separately from the microphone array 20 exceeds a predetermined threshold Th. Among sounds, a sound that has not been collected prior to a sound exceeding a predetermined threshold Th within a predetermined time (timeout section T2 or hold-off section T1) is selected and output to the sound source position calculation unit 50. In this way, the influence of the reflected sound can be removed, and the sound source position can be calculated with higher accuracy using only the direct sound.

また、異常音判定部40は、マイクロホンアレイ20が集音する音を異常音と判定する、上述の所定の閾値Thを周囲の環境音レベルに応じて適宜変化させることもできる。監視装置1によって異常音を検出する場合、人の出入りが不定期に変動する場所や、昼夜で周囲の騒音レベルが大きく異なる場所で所定の閾値Thを一定値とすると、環境音を異常音と判定したり、逆に異常音を異常音として判定しなかったりする不都合が生じる。したがって、異常音判定部40は、環境音の変化に適応させて所定の閾値Thの値を変化させる。   Further, the abnormal sound determination unit 40 can appropriately change the above-described predetermined threshold Th, which determines the sound collected by the microphone array 20 as an abnormal sound, according to the ambient environmental sound level. When the monitoring device 1 detects abnormal sound, if the predetermined threshold Th is a constant value in places where the person's coming and going fluctuates irregularly or in places where the ambient noise level varies greatly between day and night, the environmental sound is regarded as abnormal sound. Inconvenience occurs in that it is determined or, on the contrary, abnormal sound is not determined as abnormal sound. Accordingly, the abnormal sound determination unit 40 changes the value of the predetermined threshold Th in accordance with the change in the environmental sound.

具体的には、異常音判定部40は、音響処理部30によって補正された音のレベルの、時間フレーム毎の最大値(最大音レベル)を求める。時間フレームとしては、例えば、1/30秒とする。そして、異常音判定部40は、数フレームにわたって最大音レベルの平均値を算出し、算出した値を所定の閾値Thとする。すなわち、1フレーム目の最大音レベルをa、2フレーム目の最大音レベルをa、nフレーム目の最大音レベルをaとすると、nフレームにわたった最大音レベルの平均値aaveは、以下の式(1)で表すことができる。
このようにして求めたaaveを用いることによって、周囲の環境音に応答して適応的に閾値を変化させて、より精度の良い音源位置の算出を行うことができる。すなわち、この場合、異常音判定部40は、マイクロホンアレイ20が集音する音のレベルが、マイクロホンアレイ20に所定期間集音された音のレベルの時間的な平均に基づいて更新される閾値を超える場合に、その音を異常音であると判定する。そして、音源位置算出部50は、マイクロホンアレイ20が集音した音が、このようにして異常音判定部40により異常音であると判定された場合にのみ、音源の位置を算出する処理を行う。
Specifically, the abnormal sound determination unit 40 obtains the maximum value (maximum sound level) for each time frame of the sound level corrected by the sound processing unit 30. The time frame is, for example, 1/30 seconds. And the abnormal sound determination part 40 calculates the average value of the maximum sound level over several frames, and makes the calculated value the predetermined threshold value Th. That is, 1 the maximum sound level of the first frame a, the 2 maximum sound level th frame the maximum sound level of a 2, n th frame and a n, the average value of the maximum sound level over n frames a ave Can be represented by the following formula (1).
By using a ave obtained in this way, the threshold value can be adaptively changed in response to the surrounding environmental sound, and the sound source position can be calculated with higher accuracy. That is, in this case, the abnormal sound determination unit 40 sets a threshold value at which the sound level collected by the microphone array 20 is updated based on the temporal average of the sound levels collected by the microphone array 20 for a predetermined period. If so, it is determined that the sound is abnormal. The sound source position calculation unit 50 calculates the position of the sound source only when the sound collected by the microphone array 20 is determined as an abnormal sound by the abnormal sound determination unit 40 in this way. .

なお、式(1)において、平均に用いるフレーム数nを変化させることによって、環境音の時間変動に追随させて閾値を変化させることができる。例えば環境音の変動が大きい場合には、平均に求めるフレーム数nを少なくすればよい。逆に、環境音の変動が小さい場合には、平均に求めるフレーム数nを多くすればよい。   In Expression (1), by changing the number of frames n used for averaging, the threshold value can be changed in accordance with the temporal fluctuation of the environmental sound. For example, when the environmental sound varies greatly, the average number of frames n may be reduced. On the contrary, when the environmental sound fluctuation is small, the average number of frames n may be increased.

以上説明したように、本発明によれば、異常音の音源位置と音の異常性のランクが画面上のマーク表示または多分割でのエリア表示されることにより、監視者は、音を聞いて異常を認識しなくても、画面を見るだけで異常性の度合いおよび異常音の音源位置を知ることができる。さらに、本発明によれば、音源が移動する場合でも、監視者は移動する音の履歴も視覚的に即座に知ることができる。   As described above, according to the present invention, the sound source position of the abnormal sound and the rank of the sound abnormality are displayed on the screen as a mark display or multi-divided area display, so that the supervisor can hear the sound. Even without recognizing the abnormality, it is possible to know the degree of abnormality and the position of the sound source of the abnormal sound simply by looking at the screen. Furthermore, according to the present invention, even when the sound source moves, the supervisor can immediately and visually know the history of the moving sound.

また、人間は複数の異なる音(異常音)を聞き分けることができないが、モニタに可視化することによって、複数の音の発生およびその異常性のランクを瞬時に認識し、適切な判断を行うことができる。また、リアルタイムで処理を行うことによって、異常状態の認識をリアルタイムで行うことができる。さらに、異常音発生後の画像を見れば、その原因となった音源の移動や、複数の音源から連続して発生した音の順番などを、ひと目で確認することができる。したがって、監視者が音の発生の履歴を知りたい場合に、監視装置1から出力された画像を継続的に記録媒体などに記録した画像を読み出して、過去の画像まで遡って異常音発生前後の画像(映像)を確認し続ける必要はない。   In addition, humans cannot distinguish between multiple different sounds (abnormal sounds), but by visualizing them on a monitor, they can instantly recognize the occurrence of multiple sounds and their ranks of abnormalities and make appropriate decisions. it can. Also, by performing processing in real time, the abnormal state can be recognized in real time. Furthermore, by looking at the image after the abnormal sound is generated, it is possible to confirm at a glance the movement of the sound source that caused the abnormal sound and the order of the sounds generated continuously from the plurality of sound sources. Therefore, when the monitor wants to know the history of sound generation, the image output from the monitoring device 1 is continuously recorded on a recording medium and the like is read back to the past image before and after the occurrence of abnormal sound. There is no need to continue to check the image.

また、必要に応じて、特定の異常音を監視室などから直接モニタリングすることもできる。さらに、携帯端末などを利用して、異常音の位置および音の異常性の度合いを遠方で容易に視認することもできる。   Also, if necessary, specific abnormal sounds can be directly monitored from a monitoring room or the like. Further, the position of the abnormal sound and the degree of the abnormal sound can be easily visually confirmed at a distance using a portable terminal or the like.

なお、マイクロホンアレイ20を取り付けたカメラ10を床に対して垂直な位置に配置する場合は、捉える音の範囲が広くなるという利点を有し、マイクロホンアレイ20を取り付けたカメラを天井に配置した場合は、音を無方向に捉えることができるという利点を有する。   When the camera 10 to which the microphone array 20 is attached is arranged at a position perpendicular to the floor, there is an advantage that the range of sound to be captured is widened, and the camera to which the microphone array 20 is attached is arranged on the ceiling. Has the advantage that the sound can be captured in any direction.

本実施の形態によれば、マイクロホンアレイによって集音した音の到来方向を、音の到来時間差または位相差を用いて算出する。これにより、少数の(最少で3つ)無指向性のマイクロホンを用いても、音源の位置や音の異常性についての情報を高精度に検出することができる。このように、音源の位置についての情報を高精度に算出できるので、算出された音源の位置と実際の音の到来方向は高い精度で一致させることができ、音源の位置および音の異常性についての情報を、撮像した画像に正確に組み合わせることができる。また、少数の無指向性のマイクロホンを使用するので、装置を大型化せずに構成することができ、さらに、コストの増大を招来しない。   According to this embodiment, the arrival direction of the sound collected by the microphone array is calculated using the arrival time difference or the phase difference of the sound. As a result, even if a small number (minimum of three) omnidirectional microphones are used, information on the position of the sound source and the abnormality of the sound can be detected with high accuracy. As described above, since the information about the position of the sound source can be calculated with high accuracy, the calculated position of the sound source and the actual direction of arrival of the sound can be matched with high accuracy. Can be accurately combined with the captured image. In addition, since a small number of omnidirectional microphones are used, the apparatus can be configured without increasing the size, and further, the cost is not increased.

また、算出した音源の位置がカメラ10の撮像領域外である場合でも、音源の位置に対応する表示領域の上下左右の各縁辺、または表示領域の四隅のうち音源位置に対応する箇所にL字形状のマークなどを表示して、音源の存在する方向を表示することができる。このような表示により、異常音がカメラ10の撮像領域外で生じたとしても、監視者は異常音の到来する方向を認識することができる。   Further, even when the calculated sound source position is outside the imaging area of the camera 10, an L-shape is formed at each of the top, bottom, left, and right edges of the display area corresponding to the sound source position, or at the four corners of the display area corresponding to the sound source position The direction of the sound source can be displayed by displaying a shape mark or the like. With such a display, even if an abnormal sound is generated outside the imaging area of the camera 10, the supervisor can recognize the direction in which the abnormal sound comes.

本実施の形態によれば、停電等で照明が消えたり、火事で煙が充満して監視カメラによる映像監視が機能し得ない場合でも、異常音は検出可能であるので、異常状態を知ることができる。また、通常のカメラで表示されている映像の範囲内でも、ドアや壁の外側で発生している異常音や、カメラの画角範囲外(カメラには映らない領域)で発生した異常音も検出して表示するため、異常の生じた位置の特定が容易に行われ、早急な対応が可能になる。   According to the present embodiment, even when the lighting is turned off due to a power failure or the like, and the smoke is filled with fire and the video monitoring by the surveillance camera cannot function, the abnormal sound can be detected, so that the abnormal state is known. Can do. Also, even within the range of images displayed by a normal camera, abnormal sounds that are generated outside the door or wall, and abnormal sounds that are generated outside the range of view angle of the camera (area that is not reflected in the camera) Since it is detected and displayed, the position where the abnormality has occurred is easily identified, and an immediate response is possible.

なお、本発明は、上記実施の形態に限定されるものではなく、幾多の変更および変形が可能である。例えば、カメラに対して予めキャリブレーションを行い、レンズ広角歪み(樽型歪み等)を直交座標に変換する補正を行うことによって、音源の位置情報と、取得した画像との組み合わせにおける誤差を最小化することができる。また、複数のマイクロホンの配置についても、カメラのレンズの光軸を中心に上下左右に等間隔にマイクロホンを配置する構成に限定されるものではない。例えば、レンズの光軸を中心に頂点までの距離が等間隔になるような三角形の形状を成すように複数のマイクロホンを設置したり、その他の多角形の形状を成すようにマイクロホンを配置する構成にもできる。また、レンズの光軸を中心に半径rの円周上にマイクロホンを配置する構成にしてもよい。   In addition, this invention is not limited to the said embodiment, Many change and deformation | transformation are possible. For example, by pre-calibrating the camera and correcting the lens wide-angle distortion (barrel distortion etc.) to Cartesian coordinates, errors in the combination of the sound source position information and the acquired image are minimized. can do. Also, the arrangement of the plurality of microphones is not limited to the configuration in which the microphones are arranged at equal intervals in the vertical and horizontal directions around the optical axis of the camera lens. For example, a configuration in which a plurality of microphones are installed so as to form a triangular shape with the distance from the apex centered on the optical axis of the lens at equal intervals, or microphones are arranged so as to form other polygonal shapes. You can also. Further, the microphone may be arranged on the circumference of the radius r around the optical axis of the lens.

1 監視装置
10 カメラ
11,12 ドーム型カメラ
15 レンズ
17 光軸
20 マイクロホンアレイ
21 単一指向性マイクロホン群
22 単一指向性マイクロホン
25,26,28 無指向性マイクロホン
30 音響処理部
40 異常音判定部
50 音源位置算出部
60 画像組合せ部
70 アラーム処理部
80 ネットワーク処理部
100 モニタ
200 ネットワーク
300,310 天井
500,510 音源
DESCRIPTION OF SYMBOLS 1 Monitoring apparatus 10 Cameras 11 and 12 Dome type camera 15 Lens 17 Optical axis 20 Microphone array 21 Unidirectional microphone group 22 Unidirectional microphones 25, 26, and 28 Omnidirectional microphone 30 Acoustic processing unit 40 Abnormal sound determination unit 50 Sound source position calculation unit 60 Image combination unit 70 Alarm processing unit 80 Network processing unit 100 Monitor 200 Network 300, 310 Ceiling 500, 510 Sound source

Claims (3)

画像を撮像する撮像手段と、
前記撮像手段の周りに配置され、音源からの音を受音する複数の無指向性マイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイが集音した音の到来時間差または位相差から、前記監視装置に対する前記音源からの音の方向を算出するとともに、該算出した前記音源からの音の方向に基づいて、前記撮像手段が撮像した画像における前記音源の位置を算出する音源位置算出手段と、
前記音源位置算出手段が算出した前記音源の位置を示す表示を、時間の経過に応じた表示態様で、前記撮像手段が撮像した画像に組み合わせて出力し、前記算出した音源の位置が、前記撮像手段が撮像した画像における所定の撮像領域外である場合、当該音源の位置が前記所定の撮像領域外である旨を示す表示を、当該音源の位置に対応する前記所定の撮像領域の縁辺において、当該画像に組み合わせて出力する組合せ手段と、
を備えることを特徴とする監視装置。
An imaging means for capturing an image;
A microphone array having a plurality of omnidirectional microphones arranged around the imaging means and receiving sound from a sound source;
From the arrival time difference or phase difference of the sound collected by the microphone array, the direction of the sound from the sound source with respect to the monitoring device is calculated, and the imaging means is based on the calculated direction of the sound from the sound source. Sound source position calculating means for calculating the position of the sound source in the captured image;
A display indicating the position of the sound source calculated by the sound source position calculating unit is output in combination with an image captured by the imaging unit in a display mode corresponding to the passage of time, and the calculated position of the sound source is the imaging When it is outside the predetermined imaging area in the image captured by the means, a display indicating that the position of the sound source is outside the predetermined imaging area is displayed on the edge of the predetermined imaging area corresponding to the position of the sound source. Combination means for outputting in combination with the image ;
A monitoring device comprising:
前記音源位置算出手段は、
前記マイクロホンアレイが集音した音の音圧の最初のピークを検出したら、所定期間、前記音源の位置の算出を行わないようにするとともに、当該最初のピーク近傍の音圧波形に基づいて前記音源の位置を算出する、
請求項1に記載の監視装置。
The sound source position calculating means includes
When the first peak of the sound pressure of the sound collected by the microphone array is detected, the position of the sound source is not calculated for a predetermined period, and the sound source is based on the sound pressure waveform near the first peak. To calculate the position of
The monitoring apparatus according to claim 1.
前記マイクロホンアレイが集音する音のレベルが、前記マイクロホンアレイに所定期間集音された音のレベルの時間的な平均に基づいて更新される閾値を超える場合に、当該音が異常音であると判定する異常音判定手段をさらに備え、
前記音源位置算出手段は、
前記マイクロホンアレイが集音した音が、前記異常音判定手段により異常音であると判定された場合にのみ、前記音源の位置を算出する、
請求項1に記載の監視装置。
When the sound level collected by the microphone array exceeds a threshold value updated based on a temporal average of the sound levels collected for a predetermined period of time in the microphone array, the sound is an abnormal sound. Further comprising an abnormal sound determination means for determining,
The sound source position calculating means includes
Only when the sound collected by the microphone array is determined to be an abnormal sound by the abnormal sound determination means, the position of the sound source is calculated.
The monitoring apparatus according to claim 1.
JP2009077452A 2009-03-26 2009-03-26 Monitoring device Expired - Fee Related JP5189536B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009077452A JP5189536B2 (en) 2009-03-26 2009-03-26 Monitoring device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009077452A JP5189536B2 (en) 2009-03-26 2009-03-26 Monitoring device

Publications (2)

Publication Number Publication Date
JP2010232888A JP2010232888A (en) 2010-10-14
JP5189536B2 true JP5189536B2 (en) 2013-04-24

Family

ID=43048298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009077452A Expired - Fee Related JP5189536B2 (en) 2009-03-26 2009-03-26 Monitoring device

Country Status (1)

Country Link
JP (1) JP5189536B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049807A (en) * 2015-07-31 2015-11-11 小米科技有限责任公司 Method and apparatus for acquiring monitoring picture sound

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5626372B2 (en) * 2011-02-09 2014-11-19 日本電気株式会社 Event detection system
US9761248B2 (en) 2013-04-26 2017-09-12 Nec Corporation Action analysis device, action analysis method, and action analysis program
KR102066939B1 (en) 2013-09-27 2020-01-16 한화테크윈 주식회사 Image monitoring system
JP6456171B2 (en) * 2015-02-02 2019-01-23 キヤノン株式会社 Information processing apparatus, information processing method, and program
SG10201501222XA (en) * 2015-02-17 2016-09-29 Nec Asia Pacific Pte Ltd System for monitoring event related data
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
JP6493860B2 (en) * 2015-07-23 2019-04-03 パナソニックIpマネジメント株式会社 Monitoring control system and monitoring control method
JP5939341B1 (en) * 2015-07-14 2016-06-22 パナソニックIpマネジメント株式会社 Monitoring system and monitoring method
JP5979458B1 (en) 2015-11-06 2016-08-24 パナソニックIpマネジメント株式会社 Unmanned air vehicle detection system and unmanned air vehicle detection method
JP2017156122A (en) * 2016-02-29 2017-09-07 沖電気工業株式会社 Control device, control method, and detection system
JP6601680B2 (en) * 2016-03-09 2019-11-06 パナソニックIpマネジメント株式会社 Lighting system
JP6865371B2 (en) * 2016-03-24 2021-04-28 パナソニックIpマネジメント株式会社 Monitoring system and monitoring method
CN106231242A (en) * 2016-06-28 2016-12-14 安徽华脉科技发展有限公司 A kind of library monitoring system
JP2018026792A (en) * 2016-07-28 2018-02-15 パナソニックIpマネジメント株式会社 Unmanned flying object detection system and unmanned flying object detection method
JP7056564B2 (en) * 2016-08-23 2022-04-19 日本電気株式会社 Video processing equipment, video processing methods and programs
JP6748044B2 (en) * 2017-09-08 2020-08-26 株式会社日立ビルシステム Passenger conveyor inspection device and passenger conveyor inspection system
JP2019193163A (en) * 2018-04-26 2019-10-31 シャープ株式会社 Content output device
WO2020084680A1 (en) * 2018-10-23 2020-04-30 三菱電機株式会社 Information processing device, program, and information processing method
JP2021072575A (en) * 2019-10-31 2021-05-06 パナソニックIpマネジメント株式会社 Sound source display system and sound source display device
CN113794830A (en) * 2021-08-04 2021-12-14 深圳市沃特沃德信息有限公司 Target track calibration method and device based on video and audio and computer equipment

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003011183A (en) * 2001-06-28 2003-01-15 Pentel Corp Mold assembly
JP2007053586A (en) * 2005-08-18 2007-03-01 Sony Corp Imaging apparatus, image processing method, and computer program
JP4652191B2 (en) * 2005-09-27 2011-03-16 中部電力株式会社 Multiple sound source separation method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105049807A (en) * 2015-07-31 2015-11-11 小米科技有限责任公司 Method and apparatus for acquiring monitoring picture sound
CN105049807B (en) * 2015-07-31 2018-05-18 小米科技有限责任公司 Monitored picture sound collection method and device
US10354678B2 (en) 2015-07-31 2019-07-16 Xiaomi Inc. Method and device for collecting sounds corresponding to surveillance images

Also Published As

Publication number Publication date
JP2010232888A (en) 2010-10-14

Similar Documents

Publication Publication Date Title
JP5189536B2 (en) Monitoring device
JP5235070B2 (en) Sound monitoring device
KR101073076B1 (en) Fire monitoring system and method using compound camera
US7301557B2 (en) Composite camera system, zoom camera image display control method, zoom camera control method, control program, and computer readable recording medium
KR100716306B1 (en) System to monitoring forest fire
US20210049367A1 (en) Pilotless flying object detection system and pilotless flying object detection method
JP6493860B2 (en) Monitoring control system and monitoring control method
US20150281832A1 (en) Sound processing apparatus, sound processing system and sound processing method
JP2018026792A (en) Unmanned flying object detection system and unmanned flying object detection method
JP2003259350A (en) Omnidirectional monitor control system, omnidirectional monitor control method, and omnidirectional monitor control program
JP2006523043A (en) Method and system for monitoring
KR20020094915A (en) Image surveillance apparatus, image surveillance method, and image surveillance processing program
JP2011182176A (en) Wide viewing angle image processing method, and wide viewing angle image photographing device
KR20100013921A (en) Omni-directional camera and ptz camera linkage possible photographing apparatus and method therewith, and a computer-readable medium thereof
JP2016152557A (en) Sound collection system and sound collection setting method
JP2019009520A (en) Information processing apparatus, information processing method, and program
JP2017092938A (en) Audio source detection system and audio source detection method
JP2005252660A (en) Photographing system and photographing control method
KR20100121086A (en) Ptz camera application system for photographing chase using sound source recognition and method therefor
JP2018101987A (en) Sound source display system in monitoring area and sound source display method
TWI556651B (en) 3d video surveillance system capable of automatic camera dispatching function, and surveillance method for using the same
WO2018020965A1 (en) Unmanned aerial vehicle detection system and unmanned aerial vehicle detection method
KR101268076B1 (en) Closed circuit television system and method of object tracking
KR101709919B1 (en) Fire detecting system capable of controlling sensitivity and control method thereof
JP2015041913A (en) Monitor system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160201

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5189536

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees