JP2022148507A - 音声処理装置、制御方法、およびプログラム - Google Patents
音声処理装置、制御方法、およびプログラム Download PDFInfo
- Publication number
- JP2022148507A JP2022148507A JP2021050221A JP2021050221A JP2022148507A JP 2022148507 A JP2022148507 A JP 2022148507A JP 2021050221 A JP2021050221 A JP 2021050221A JP 2021050221 A JP2021050221 A JP 2021050221A JP 2022148507 A JP2022148507 A JP 2022148507A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- microphone
- audio
- audio signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims description 24
- 230000005236 sound signal Effects 0.000 claims abstract description 76
- 230000007613 environmental effect Effects 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 claims description 25
- 238000001514 detection method Methods 0.000 claims description 25
- 238000006243 chemical reaction Methods 0.000 claims description 21
- 230000002708 enhancing effect Effects 0.000 claims description 8
- 230000001131 transforming effect Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 description 80
- 238000003384 imaging method Methods 0.000 description 47
- 230000003287 optical effect Effects 0.000 description 9
- 230000006866 deterioration Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000007774 longterm Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 229920002943 EPDM rubber Polymers 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 229910001220 stainless steel Inorganic materials 0.000 description 1
- 239000010935 stainless steel Substances 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1785—Methods, e.g. algorithms; Devices
- G10K11/17853—Methods, e.g. algorithms; Devices of the filter
- G10K11/17854—Methods, e.g. algorithms; Devices of the filter the filter being an adaptive filter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1781—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
- G10K11/17821—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the input signals only
- G10K11/17823—Reference signals, e.g. ambient acoustic environment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/178—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
- G10K11/1787—General system configurations
- G10K11/17873—General system configurations using a reference signal without an error signal, e.g. pure feedforward
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3023—Estimation of noise, e.g. on error signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3027—Feedforward
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K2210/00—Details of active noise control [ANC] covered by G10K11/178 but not provided for in any of its subgroups
- G10K2210/30—Means
- G10K2210/301—Computational
- G10K2210/3028—Filtering, e.g. Kalman filters or special analogue or digital filters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/05—Noise reduction with a separate noise microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/11—Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Studio Devices (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
【課題】レンズ駆動雑音を低減しつつも音質の劣化や不連続感のある音などの不快な音声が含まれることを防ぐノイズ低減処理を実行する音声処理装置を提供する。【解決手段】撮像装置において、音声処理装置は、環境音を取得するための外部音声用マイク301及びノイズ源からの音を取得するための雑音参照マイク302を備える収音部300と、雑音参照マイク302によって生成された音声信号に対しノイズ源のノイズを強調する雑音強調部205及び雑音強調部205によって生成された音声信号に基づいて外部音声用マイク301によって生成された音声信号からノイズ源のノイズを減算する雑音低減部207を有する音声処理部200と、を備える。【選択図】図4
Description
本発明はノイズを低減することができる音声処理装置に関する。
カメラは、筐体内部に設置されたマイクを用いて筐体内部において発生した雑音を低減する処理を実行することができる。特許文献1では、筐体内部において発生したノイズを筐体内部に配置されたマイクによって収音し、そのマイクによって生成された音声信号に基づいて、被写体に係わる音声を収音するマイクからそのノイズを低減するビデオカメラが開示されている。
しかしながら、カメラの筐体内部に配置されたマイクが生成する音声信号には筐体内部のノイズ信号以外にも、マイクのセルフノイズや筐体外部からの音声等、筐体内部以外から発生する信号や音声信号が含まれる。そのため、筐体内部のマイクから生成された音声信号は、筐体内部において発生したノイズよりも振幅の大きい音声信号となる。カメラがこの筐体内部のマイクによって生成された音声信号によってノイズ低減処理を行った場合、被写体の音声などを過剰に低減しすぎてしまい、音質の劣化を招くおそれがあった。
そこで本発明は、レンズ駆動雑音を低減しつつも音質の劣化等を防ぐことのできるノイズ低減処理を実現することを目的とする。
環境音を取得するための第一のマイクと、ノイズ源からの音を取得するための第二のマイクと、前記第二のマイクによって生成された音声信号から、前記ノイズ源のノイズを強調する強調手段と、前記強調手段によって生成された音声信号に基づいて、前記第一のマイクによって生成された音声信号から前記ノイズ源のノイズを減算する減算手段と、を有することを特徴とする音声処理装置。
本発明によれば、レンズ駆動雑音を低減しつつも音質の劣化等を防ぐことのできるノイズ低減処理を実現することができる。
以下、本発明の実施形態について、図面を参照して説明する。なお、以下の実施形態は本発明を限定するものではなく、また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。なお、同一の構成については、同じ符号を付して説明する。
[第一の実施形態]
図1は第一の実施形態に係る音声処理装置の一例である撮像装置100の構成の一例を示すブロック図である。本実施形態の撮像装置100はレンズ部101、レンズ制御部102、撮像部103、画像処理部104、制御部105、操作部106、表示部107、記録部108、音声処理部200、および収音部300からなる。
図1は第一の実施形態に係る音声処理装置の一例である撮像装置100の構成の一例を示すブロック図である。本実施形態の撮像装置100はレンズ部101、レンズ制御部102、撮像部103、画像処理部104、制御部105、操作部106、表示部107、記録部108、音声処理部200、および収音部300からなる。
レンズ部101は、レンズユニットである。例えばレンズ部101はズームレンズまたはバリフォーカルレンズである。レンズ部101は光学レンズ、光学レンズを駆動させるためのモータ、および後述する撮像装置100のレンズ制御部102と通信する通信部を有する。レンズ部101は、通信部によって受信した制御信号に基づいて、光学レンズをモータによって移動させることで、被写体に対するフォーカスおよびズーミング、並びに、手ブレの補正ができる。
レンズ制御部102は、後述する画像処理部104から出力されたデータ、および後述する制御部105から出力された制御信号に基づいて、レンズ部101に制御信号を送信し、レンズ部101を制御する。
撮像部103は、レンズ部101を経て撮像面に結像された被写体の光学像を電気信号に変換するための撮像素子を有し、撮像素子で生成された電気信号を画像処理部104に出力する。撮像素子は、例えばCCD(Charge Coupled Device)、およびCMOS(Complementary Metal Oxide Semiconductor)である。
画像処理部104は、撮像部103から入力された電気信号から画像データまたは動画データを生成して出力する。本実施形態では、撮像部103および画像処理部104において静止画像データや動画データを含む画像データを生成して撮像部103から出力する一連の処理を「撮影」という。撮像装置100では、画像データは、DCF(Design rule for Camera File system)規格に従って、後述する記録部108に記録される。
制御部105は、入力された信号、および後述のプログラムに従ってデータバス110を介して撮像装置100の各部を制御する。制御部105は、各種制御を実行するためのCPU、ROM、およびRAMを有する。なお、制御部105が撮像装置100全体を制御する代わりに、複数のハードウェアが分担して撮像装置全体を制御してもよい。制御部105が有するROMには、各構成要素を制御するためのプログラムが格納されている。また制御部105が有するRAMは演算処理等に利用される揮発性メモリである。
操作部106は、撮像装置100に対する指示をユーザから受け付けるためのユーザインタフェースである。操作部106は、例えば電源をオン状態またはオフ状態にするための電源スイッチ、撮影を指示するためのレリーズスイッチ、画像データまたは動画データの再生を指示するための再生ボタン、および撮影モードを切り替えるための切替スイッチ等を有する。
表示部107は、画像処理部104から出力された画像データ、対話的な操作のための文字並びに、メニュー画面等を表示する。また、表示部107は静止画撮影および動画撮影の際、画像処理部104から出力されたデジタルデータを逐次表示することで、電子ビューファインダとして機能することができる。例えば表示部107は、液晶ディスプレイまたは有機ELディスプレイである。
記録部108は、データの記録、および読み出しができる。例えば、制御部105は、記録部108から、静止画像データ、動画データ、および音声データの記録、および読み出しができる。記録部108は例えばSDカード、CFカード、XQDメモリーカード、HDD(磁気ディスク)、光学式ディスク、および半導体メモリである。記録部108は、撮像装置100に着脱可能なように構成してもよいし、撮像装置100に内蔵されていてもよい。すなわち、制御部105は少なくとも記録部108にアクセスする手段を有していればよい。
不揮発性メモリ109は不揮発性メモリであり、制御部105で実行される後述のプログラム等が格納される。また、不揮発性メモリ109には、音声データが記録されている。この音声データは例えば、被写体に合焦した場合に出力される合焦音、撮影を指示された場合に出力される電子シャッター音、撮像装置100を操作された場合に出力される操作音等の電子音の音声データである。
データバス110は、音声データ、動画データ、および画像データ等の各種データ、各種制御信号を撮像装置100の各ブロックへ伝達するためのデータバスである。
次に、撮像装置100の外観の一例について説明する。図2(a)は撮像装置100の正面の外観図の一例を示す図である。図2(b)は撮像装置100の背面の外観図の一例を示す図である。レリーズスイッチ106a、再生ボタン106b、モードダイヤル106c、およびタッチパネル106dは、前述の操作部106に含まれる操作部材である。レリーズスイッチ106a、再生ボタン106b、モードダイヤル106c、およびタッチパネル106dは制御部105に各種の動作指示を入力するための操作手段である。また、表示部107には、静止画または動画などが表示される。Lマイク301aおよびRマイク301bはユーザの音声等を収音するためのマイクである。撮像装置100の背面から見て、左側にLマイク301aが、右側にRマイク301bが配置される。
次に図3および図4を用いて、音声処理部200、および収音部300について説明する。
まず、収音部300について説明する。収音部300は外部音声用マイク301および雑音参照マイク302からなる。なお、本実施形態では、外部音声用マイク301および雑音参照マイク302は無指向性のマイクで構成される。
外部音声用マイク301は、撮像装置100の筐体外部の音(すなわち、環境音)を主に収音するためのマイクである。外部音声用マイク301は、収音された環境音から音声信号を生成する。本実施形態では、外部音声用マイク301は、Lマイク301aおよびRマイク301bの2つのマイクを有する。本実施形態では、撮像装置100は環境音をLマイク301aおよびRマイク301bによって収音し、Lマイク301aおよびRマイク301bによって生成された音声信号をステレオ方式で記録する。例えば環境音は、ユーザの音声、動物の鳴き声、雨音、および楽曲等の撮像装置100の筐体外および光学レンズの筐体外において発生する音である。なお、外部音声用マイク301付近の筐体には図2に示すように環境音をマイクに入力しやすくするための穴が設けられている。
雑音参照マイク302は、撮像装置100の筐体内部およびレンズ部101で発生する所定の雑音源(ノイズ源)からの駆動音等の雑音(ノイズ)を、取得するためのマイクである。雑音参照マイク302は、収音された雑音等から音声信号を生成する。本実施形態では、雑音参照マイク302は、雑音以外の収音を低減するため、外装によって外部から遮蔽されるように配置される。ここで、ノイズ源は例えば、レンズ部101のモータ、撮像装置100の筐体内部にあるミラーを駆動させるためのモータなどの駆動部である。モータは例えば、超音波モータ(Ultrasonic Motor、以下USM)およびステッピングモータ(Stepper Motor、以下STM)などのモータである。雑音(ノイズ)は例えば、USMおよびSTM等のモータの駆動によって発生する振動音である。例えば、モータは被写体に合焦するためのAF処理において駆動する。本実施形態では、雑音参照マイク302は、撮像装置100の主なノイズ源であるレンズ部101の近傍に配置される。
図3は、Lマイク301a、Rマイク301b、および雑音参照マイク302が取り付けられた撮像装置100の部分の断面図の一例である。この撮像装置100の部分は、外装部303、マイクブッシュ304、および固定部305により構成される。
外装部303は、マイクに環境音を入力するための穴を有する。本実施例では、穴はLマイク301a、およびRマイク301bの上方に形成される。一方、雑音参照マイク302は、撮像装置100の筐体内および光学レンズの筐体内において発生する駆動音を取得するために設けられており、環境音を取得する必要はない。したがって、本実施例では、外装部303には雑音参照マイク302の上方に穴は形成されない。なお、本実施形態では、外装部303に形成される穴の形状は楕円状であるが、円状または方形状等の他の形状でもよい。また、Lマイク301a上の穴の形状とRマイク301b上の穴の形状とは、互いに異なっていてもよい。
マイクブッシュ304は、Lマイク301a、Rマイク301b、および雑音参照マイク302を固定するための部材である。固定部305は、マイクブッシュ304を外装部303に固定する部材である。
なお、本実施例では、外装部303および固定部305はPC材等のモールド部材で構成される。また、外装部303および固定部305はアルミまたはステンレス等の金属部材で構成されてもよい。また、本実施例では、マイクブッシュ304は、エチレンプロピレンジエンゴム等のゴム材で構成される。
次に図4を用いて音声処理部200について説明する。例えば、音声処理部200は音声信号の信号処理に特化したICチップである。音声処理部200は制御部105によって制御されることで、音声信号の信号処理を行う。音声処理部200は、A/D変換部201、波形切出部202、時間周波数変換部203、雑音検出部204、雑音強調部205、補正部206、雑音低減部207、および周波数時間変換部208からなる。
A/D変換部201は、外部音声用マイク301および雑音参照マイク302から入力されたアナログ音声信号をデジタル音声信号に変換する。A/D変換部201は変換されたデジタル音声信号を波形切出部202に出力する。本実施形態においてA/D変換部201はサンプリング周波数を48kHz、およびビット深度を16bitとして標本化処理を実行することで、アナログ音声信号をデジタル音声信号に変換する。なお、A/D変換部201から出力されたデジタル音声信号は、時間領域のデジタル音声信号である。
波形切出部202は、A/D変換部201から入力されたデジタル音声信号を所定の長さに切り出し、切り出されたデジタル音声信号を時間周波数変換部203へ出力する。これ以降、所定の長さのことをフレームと呼ぶ。本実施形態では、波形切出部202は、1024サンプルの音声信号を1フレームの音声信号として切り出しを行う。加えて、波形切出部202は、512サンプルごと時間シフトしながら、フレームの切り出しを行う。すなわち、本実施形態では、波形切出部202は、いわゆるハーフオーバラップ処理を行う。また、波形切出部202は、切り出された1フレームのデジタル音声信号に対して、ハン窓を用いて窓かけ処理を行う。なお、波形切出部202から出力された音声信号は、以後、フレーム単位で音声信号処理が行われる。なお、本実施形態では、波形切出部202は窓かけ処理における窓関数としてハン窓を用いるが、ハン窓に代えてハミング窓またはガウス窓などの任意の窓関数を用いてもよい。
時間周波数変換部203は、波形切出部202から入力された時間領域のデジタル音声信号に対してフーリエ変換処理を行い、周波数領域のデジタル音声信号に変換する。本実施形態では、時間周波数変換部203は、デジタル音声信号に対して高速フーリエ変換処理を行う。これ以降、周波数領域のデジタル音声信号を音声スペクトル信号ともいう。外部音声用マイク301によって取得された音声から生成された音声スペクトル信号は、雑音低減部207へ出力される。他方、雑音参照マイク302によって取得された音声から生成された音声スペクトル信号は、雑音検出部204および雑音強調部205へ出力される。なお、本実施形態において、音声スペクトル信号は、0Hzから48kHzまでの周波数帯域において、1024ポイントの周波数スペクトルを有する。また、音声スペクトル信号は、0Hzからナイキスト周波数である24kHzまでの周波数帯域においては、513ポイントの周波数スペクトルを有する。本実施形態では、撮像装置100は、時間周波数変換部203から出力された音声データのうち、0Hzから24kHzまでの513ポイントの周波数スペクトルを利用して、ノイズ低減の処理を行う。
雑音検出部204は、時間周波数変換部203から入力された音声スペクトル信号から雑音の検出処理を行う。本実施形態では、雑音検出部204は、入力された音声スペクトル信号に対して、フレームごとに雑音が存在するか否かを判定する。以降、雑音が存在すると判定されたフレームを雑音区間のフレーム、雑音が存在しないと判定されたフレームを非雑音区間のフレームという。本実施形態では、雑音検出部204は、次のように雑音の検出処理を行う。雑音検出部204は、非雑音区間のフレームの音声スペクトル信号と、切り出されたフレームの音声スペクトル信号とのそれぞれの周波数スペクトルの差分の平均値を算出する。そして、雑音検出部204は、算出された平均値が所定の閾値を超えた場合、そのフレームを雑音区間のフレームと判定する。このように雑音検出部204はノイズ源からノイズが発生している期間を検出する。また、本実施形態では、雑音検出部204は、雑音源である駆動部の動作に起因する一定時間継続される長期雑音と、長期雑音の前後に発生する短期雑音をそれぞれ検出することができる。長期雑音は、例えば光学レンズの筐体内における摺動音である。また、短期雑音は、例えば、光学レンズ内のギアがかみ合わさることによって発生する雑音である。長期雑音と短期雑音とを異なる雑音として判定する理由は、撮像装置100が、それぞれの雑音によって異なる周波数特性に応じたノイズ低減処理を行うためである。雑音検出部204は、検出結果を雑音強調部205へ出力する。
雑音強調部205は、雑音検出部204において雑音区間と判定されたフレームに対して時間周波数変換部203から入力された音声スペクトル信号に含まれる雑音を強調する処理を行う。雑音強調部205において強調された音声スペクトル信号は、補正部206において補正される。補正された音声スペクトル信号は、雑音低減部207において、外部音声用マイク301から入力された音声信号から生成された音声スペクトル信号から減算される。補正部206の処理および雑音低減部207の処理の詳細については後述する。本実施形態では、雑音強調部205は、雑音参照マイク302に混入するマイクのセルフノイズを抑制することでレンズ部101のレンズが駆動したことによって発生した雑音を強調する。以降、レンズが駆動したことによって発生した雑音をレンズ駆動雑音ともいう。これから雑音強調部205の具体的な処理について説明する。
初めに、セルフノイズを抑制する理由について説明する。マイクのセルフノイズの周波数帯域とレンズ駆動雑音の周波数帯域とを比較すると、次の2つの領域に分けられる。一方は、レンズ駆動雑音の振幅がセルフノイズの振幅に対して所定値以上の大きい周波数帯域である。他方は、レンズ駆動雑音の振幅がセルフノイズの振幅に対して所定値より小さい周波数帯域である。すなわち、後者の帯域では、レンズ駆動雑音とセルフノイズとの音の大きさは同程度である。したがって、ユーザには前者の周波数帯域に存在する雑音が主な雑音として聞こえることになる。
それゆえ、撮像装置100は、ノイズ低減処理を行う場合、前者の周波数帯域に存在するレンズ駆動雑音を十分に低減するためのノイズ低減処理を行う必要がある。しかし、前者の周波数帯域に含まれる音声にも当然、セルフノイズが含まれている。そのため、前者の周波数帯域には、実際のレンズ駆動雑音の音声スペクトル信号よりも振幅の大きい音声スペクトル信号が存在する。このような音声スペクトル信号に基づいて、撮像装置100が前者の周波数帯域に存在するレンズ駆動雑音を十分に低減するためのノイズ低減処理を行ってしまうと、後者の周波数帯域に含まれる音声信号の振幅までもが過剰に低減されてしまうおそれがある。この場合、ノイズ低減された音声信号は、音質の劣化や不連続感のある音などの不快な音声が含まれる音声信号となってしまう。
そこで、本実施形態では雑音強調部205が、セルフノイズのようなレンズ駆動雑音とは相関のない定常的な雑音の振幅を抑制する抑制処理を行うことで、レンズ駆動雑音を低減しつつも音質の劣化等を防ぐことのできるノイズ低減処理を実現する。なお、レンズ駆動雑音とは相関のない定常的な雑音は、セルフノイズのほかに、背景雑音や定常的な環境音の漏れこみ等がある。本実施形態では、雑音強調部205は、抑制処理において例えば数式1に示すウィーナーフィルタを用いる。
[数1] WF(f)=NRefenh(f-1)/{NRefenh(f-1)+NRefsn}
[数1] WF(f)=NRefenh(f-1)/{NRefenh(f-1)+NRefsn}
雑音強調部205は上記ウィーナーフィルタを用いて数式2に示す計算を行うことにより、抑制処理を実現する。
[数2] NRefenh(f)=WF(f)*NRef(f)
[数2] NRefenh(f)=WF(f)*NRef(f)
ここで、fはフレーム番号、WF(f)はウィーナーフィルタ係数、NRefenh(f)は雑音強調部205から出力される音声スペクトル信号の振幅、NRef(f)は時間周波数変換部203から入力された音声スペクトル信号の振幅を示す。また、NRefsnは雑音参照マイク302から入力された音声スペクトル信号に含まれるセルフノイズの音声スペクトル信号の振幅を示す。なお、NRefsnは、事前にレンズ駆動雑音が発生しない状態で測定されたデータである。
上述のように、ウィーナーフィルタは、例えばセルフノイズのような、主音声とは相関のない定常的な雑音を低減するために用いられるフィルタである。数式1のフィーナーフィルタでは、この主音声に当たるものがレンズ駆動雑音の音声信号、主音声とは相関のない定常的な雑音に当たるものがセルフノイズの音声信号となるように式が構成されている。雑音強調部205は、このウィーナーフィルタを雑音参照マイク302からの音声信号に対して適用することにより、雑音参照マイク302に収音された音声信号から、レンズ駆動雑音以外の音を低減することができる。特にセルフノイズのように、雑音検出部204において長期雑音と検出されるような音は、ウィーナーフィルタによって効果的に低減可能な種別の音である。
このように、雑音強調部205は、ノイズ源から発生した雑音以外の音を低減することにより、ノイズ源から発生した雑音そのものに近い音声信号を生成する。本実施形態では、雑音強調部205は、ウィーナーフィルタを用いることで、セルフノイズのように、レンズ駆動雑音とは相関のない定常的な雑音が抑制された、レンズ駆動雑音そのものに近い音声スペクトル信号を生成する。これによって、雑音強調部205は、相対的にレンズ駆動雑音を強調した音声スペクトル信号を生成することができる。撮像装置100は、レンズ駆動雑音そのものに近い音声スペクトル信号を用いることで、外部音声用マイク301からの音声スペクトル信号に含まれるレンズ駆動雑音を低減するとともに、それ以外の音が過剰に低減されることを防ぐことができる。つまり、撮像装置100は、雑音強調部205によって生成された音声スペクトル信号を用いることで、レンズ駆動雑音を低減しつつも音質の劣化等を防ぐことのできるノイズ低減処理を実現することができる。なお、雑音強調部205は、このセルフノイズ低減処理を雑音検出部204で雑音区間として判定された区間のみにおいて実施する。また、このセルフノイズ低減処理は雑音検出部204で検出された雑音の種別ごとに異なる処理が行われてもよい。雑音強調部205は、抑制処理を行った音声スペクトル信号を補正部206へ出力する。
補正部206は、雑音強調部205から入力された音声スペクトル信号を補正する。補正部206は、雑音強調部205から入力された音声スペクトル信号を補正することで、外部音声用マイク301に含まれるノイズ駆動雑音の音声スペクトル信号に近づける。補正処理が必要な理由は、外部音声用マイク301と雑音参照マイク302とでは、同じレンズ駆動雑音からでも生成される音声信号が異なるからである。これは外部音声用マイク301の付近には筐体に穴が設けられていることに対し、雑音参照マイクは外装によって外部から遮蔽されるように配置されていることに起因する。本実施形態では、補正部206は、雑音強調部205から入力された音声スペクトル信号を外部音声用マイク301から入力された音声信号に含まれる雑音成分に近づけるために、予め記録された補正係数を用いる。この補正係数は不揮発性メモリ109に記録されている。本実施形態では、補正部206は、雑音強調部205から入力された音声スペクトル信号にこの補正係数を乗算する。補正部206は補正係数によって補正された音声スペクトル信号を雑音低減部207へ出力する。
雑音低減部207は、時間周波数変換部203から入力された外部音声用マイク301の音声スペクトル信号に対して、補正部206から入力された音声スペクトル信号を用いて雑音を低減する。本実施形では、雑音低減部207は、ウィーナーフィルタを用いて雑音を低減する。雑音が低減された音声スペクトル信号を周波数時間変換部208へ出力する。
周波数時間変換部208は、雑音低減部207から入力された音声スペクトル信号に逆フーリエ変換処理を行うことにより時間領域の音声信号に変換する。また、周波数時間変換部208は、フレームごとにハーフオーバラップで加算しながら出力する。出力された音声信号は、制御部105により、記録部108に記録される。例えば、動画記録モードの場合、制御部105は画像処理部104からの画像信号と周波数時間変換部208からの音声信号とから動画データを生成し、記録部108に記録する。
<音声記録処理>
図5を用いて、本実施形態における撮像装置100の音声の記録処理について説明する。図5は本実施形態における音声記録処理のフローチャートである。本フローチャートに示す処理は、撮像装置100の制御部105が入力信号やプログラムに従い、音声処理部200を制御することにより実現される。本フローチャートの処理は、例えば、ユーザから操作部106によって動画記録開始や音声記録開始の指示を受け付けたことに応じて開始される。
図5を用いて、本実施形態における撮像装置100の音声の記録処理について説明する。図5は本実施形態における音声記録処理のフローチャートである。本フローチャートに示す処理は、撮像装置100の制御部105が入力信号やプログラムに従い、音声処理部200を制御することにより実現される。本フローチャートの処理は、例えば、ユーザから操作部106によって動画記録開始や音声記録開始の指示を受け付けたことに応じて開始される。
ステップS501では、音声処理部200は、波形切出部202によって、A/D変換部201から出力されたデジタル音声信号から波形を1フレーム切り出す。
ステップS502では、音声処理部200は、時間周波数変換部203によって、波形切出部202によって生成されたデジタル音声信号に対して高速フーリエ変換(FFT)処理を行う。音声処理部200は、時間周波数変換部203によって、外部音声用マイク301によって取得されたデジタル音声信号から音声スペクトル信号を生成する。この音声スペクトル信号は雑音低減部207において利用される。また、音声処理部200は、時間周波数変換部203によって、雑音参照マイク302によって取得されたデジタル音声信号から音声スペクトル信号を生成する。この音声信号は、雑音検出部204および雑音強調部205において利用される。
ステップS503では、音声処理部200は、雑音検出部204によって、時間周波数変換部203によって生成された音声スペクトル信号から雑音の検出処理を行う。
ステップS504では、音声処理部200は、雑音強調部205によって、雑音検出部204において雑音区間と判定されたフレームに対して、時間周波数変換部203によって生成された音声スペクトル信号に含まれる雑音を強調する処理を行う。
ステップS505では、音声処理部200は、補正部206によって、雑音強調部205によって生成された音声スペクトル信号を補正する。
ステップS506では、音声処理部200は、雑音低減部207によって、時間周波数変換部203によって生成された音声スペクトル信号に対して、補正部206によって生成された音声スペクトル信号を用いて雑音を低減する。
ステップS507では、音声処理部200は、周波数時間変換部208によって、雑音低減部207によって生成された音声スペクトル信号に対して逆高速フーリエ変換処理(IFFT)処理を行う。変換された信号は逐次、制御部105によって記録部108に記録される。
ステップS508では、制御部105は、撮影を終了するか否かを判定する。例えば、ユーザによってレリーズスイッチが押下された場合、制御部105は、撮影を終了すると判定する。制御部105が撮影を終了すると判定した場合、本フローチャートの一連の処理は終了する。制御部105が撮影を終了しないと判定した場合、ステップS501の処理が実行される。すなわち、ユーザが撮影の終了を指示する操作をするまでステップS501からS507の処理は繰り返される。
以上、撮像装置100の音声記録処理について説明した。これにより、撮像装置100は、レンズ駆動雑音を低減しつつも音質の劣化等を防ぐことのできるノイズ低減処理を実現することができる。
なお、本実施形態では、音声処理部200は、雑音検出部204によって、音声スペクトル信号に基づいて雑音区間の検出を行ったが、雑音の発生源である駆動部の制御情報を取得し、その制御情報に基づいて雑音の検出を行ってもよい。例えば、音声処理部200は、雑音検出部204によって、レンズ制御部102からレンズ駆動のための制御信号を取得し、その制御信号に基づいて雑音検出を行ってもよい。
なお、音声処理部200は、雑音検出部204によって、外部音声用マイク301によって取得された音声から生成された音声スペクトル信号を用いて、雑音区間の検出を行ってもよい。
なお、雑音強調部205および雑音低減部207ではウィーナーフィルタを用いて抑制処理を実施したが、他のノイズ低減手法を用いてもよい。他のノイズ低減手法は例えば、スペクトルサブトラクション法(SS法)がある。SS法によるノイズ低減では、例えば、音声処理部200は、雑音強調部205によって、不揮発性メモリ109に記録されているセルフノイズ減算用の音声スペクトル信号を、時間周波数変換部203によって生成された音声スペクトル信号から減算する。また、例えば、SS法によるノイズ低減では、音声処理部200は、雑音低減部207によって、時間周波数変換部203によって生成された外部音声用マイク301の音声スペクトル信号から、補正部206によって生成された音声スペクトル信号を減算する。なお、SS法では、レンズの絞り駆動のように定常的ではない音も、その音を減算するための音声スペクトル信号を用いることで、低減可能である。このような定常的ではない音は、例えば、雑音検出部204によって、短期雑音として検出される。また、他にも、音声処理部200は、音声スペクトル信号の振幅が所定の閾値以下である信号に対して振幅を低減する処理を行うことで、抑制処理を行ってもよい。また、他にも、ウィーナーフィルタの代わりに、バンドパスフィルタやハイパスフィルタなどを用いて抑制処理を行ってもよい。
なお、雑音強調部205では、雑音検出部204によって検出された雑音の種別に応じてノイズ低減方法を異ならせてもよい。例えば、雑音強調部205では、レンズ駆動ノイズ以外の長期雑音を抑制する場合はウィーナーフィルタが、レンズ駆動ノイズ以外の短期雑音を抑制する場合はSS法が用いられるようにしてもよい。
なお、本実施形態では、音声処理部200は、雑音強調部205によって、補正部206の前段で雑音を強調する処理を実施したが、補正部206で補正された信号に対して雑音を強調する処理を行うように順番を変更してもよい。
なお、本実施形態では、セルフノイズNRefsnは、事前にレンズ駆動雑音が発生しない状態で測定されたデータであるとしたが、音声記録中に計算されてもよい。例えば、セルフノイズNRefsnは、雑音検出部204によって雑音区間でないと判定されたフレームの平均値にしてもよい。このようにすれば、撮像装置100は、事前にデータを測定する必要性がなくなると同時に、マイクの経年劣化等によってセルフノイズが変化した場合でも、そのセルフノイズに合わせたセルフノイズNRefsnを用いることができる。
なお、音声処理部200は、補正部206によって、雑音検出部204によって検出された雑音種別に応じて異なる補正処理を行ってもよい。
なお、本実施形態では、補正部206によって用いられる補正係数はあらかじめ記録されていたが、逐次計算されるようにしてもよい。例えば、制御部105が、補正係数を、外部音声用マイク301によって取得された信号と雑音参照マイク302によって取得された信号と用いて計算してもよい。この計算には、例えば適応フィルタが用いられる。
なお、本実施形態では、外部音声用マイク301は2つのマイクとしたが、マイクの数は2つに限られない。例えば、外部音声用マイク301はモノラル方式であれば1つ、サラウンド方式であれば3つ、アンビソニックス方式では4つのマイクを有してもよい。
[第二の実施形態]
第一の実施形態では、雑音強調部205が、雑音参照マイク302によって取得された音声から生成された音声スペクトル信号のみを用いて雑音を強調する方法を説明した。第二の実施形態では、雑音強調部205が、さらに外部音声用マイク301によって取得された音声から生成された音声スペクトル信号も用いて雑音を強調する方法について説明する。
第一の実施形態では、雑音強調部205が、雑音参照マイク302によって取得された音声から生成された音声スペクトル信号のみを用いて雑音を強調する方法を説明した。第二の実施形態では、雑音強調部205が、さらに外部音声用マイク301によって取得された音声から生成された音声スペクトル信号も用いて雑音を強調する方法について説明する。
このような方法は、雑音参照マイク302が環境音を収音してしまった場合に特に有効である。このような場合は、環境音が筐体によって伝送されて雑音参照マイクによって収音されてしまうことによって発生する。本実施形態では、雑音強調部205がさらに、雑音参照マイク302によって取得された環境音を抑制することで、レンズ駆動雑音を強調する例について説明する。
第二の実施形態では、第一の実施形態と異なる点を中心に簡潔に説明する。なお、撮像装置100の構成は第一の実施形態と同様である。
本実施形態では図6に示すように、雑音強調部205には、時間周波数変換部203および雑音検出部204からの出力に加えて、外部音声用マイク301によって取得された音声から生成された音声スペクトル信号が入力される。
本実施形態では、雑音強調部205は、例えば数式3および数式4に示すウィーナーフィルタを用いる。
[数3] LS(f)=NR(f-1)*G
[数4] WF(f)=NRefenh(f-1)/{NRefenh(f-1)+LS(f)}
[数3] LS(f)=NR(f-1)*G
[数4] WF(f)=NRefenh(f-1)/{NRefenh(f-1)+LS(f)}
雑音強調部205は数式3および数式4に示すウィーナーフィルタを用いて、数式5に示す計算を行うことにより、抑制処理を実現する。
[数5] NRefenh(f)=WF(f)*NRef(f)
[数5] NRefenh(f)=WF(f)*NRef(f)
LS(f)は雑音参照マイク302によって取得された環境音の音声スペクトル信号の振幅、NR(f)は雑音低減部207から出力された音声スペクトル信号の振幅である。Gは雑音低減部207から出力された音声スペクトル信号を、雑音参照マイク302によって取得された環境音の振幅に補正するための補正係数である。補正係数Gはあらかじめ実測値から計算された係数である。その他の係数は第一の実施形態と同様であるため説明を省略する。
ここで、LS(f)の計算において、雑音低減部207から出力された音声スペクトル信号が用いられる理由を説明する。雑音低減部207から出力された音声スペクトル信号はノイズ駆動雑音を含まない音声とみなせる。また、ノイズ低減された音声スペクトル信号では、セルフノイズは完全に除去されているわけではなく、ある程度残存している。したがって、雑音低減部207から出力された音声スペクトル信号は、環境音とセルフノイズとを含み、雑音を含まない音声スペクトル信号と考えることができる。すなわち、雑音低減部207から出力された音声スペクトル信号を補正することによって算出されたLS(f)は、セルフノイズおよび環境音の音声スペクトル信号の振幅を示す係数とみなせる。上述のウィーナーフィルタ係数の計算式では、LS(f)がノイズとみなされるため、セルフノイズおよび環境音がノイズとして低減される対象となる。これがLS(f)の計算において、雑音低減部207から出力された音声スペクトル信号が用いられる理由である。
したがって、雑音強調部205は、雑音低減部207から出力された音声スペクトル信号をウィーナーフィルタに用いることによって、セルフノイズと環境音との音声スペクトル信号の振幅を抑制することができる。すなわち、雑音強調部205は、雑音低減部207から出力された音声スペクトル信号を用いることで、レンズ駆動雑音を強調することができる。
この雑音強調部205から出力された音声スペクトル信号を用いてノイズ低減処理を行うことで、撮像装置100は、より多くの雑音を低減することが可能になり、高品質な音声を生成することができる。
なお、雑音強調部205は、NR(f)を計算する場合には、外部音声用マイク301に含まれるマイクのうち少なくとも1つによって取得された音声から生成された音声スペクトル信号を用いればよい。
なお、雑音強調部205は、LS(f)の計算のために雑音低減部207から出力された音声スペクトル信号を使用する方法を説明したが、その他の音声スペクトル信号が用いられてもよい。例えば、外部音声用マイク301によって取得された音声から生成された音声スペクトル信号に対してあらかじめ用意されたレンズ駆動雑音を低減するためのマスクによるマスキング処理が行われた音声スペクトル信号が用いられてもよい。また、例えば、外部音声用マイク301によって取得された音声から生成された音声スペクトル信号に対して、バンドストップフィルタによってレンズ駆動雑音を低減された音声スペクトル信号が用いられてもよい。
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
Claims (15)
- 環境音を取得するための第一のマイクと、
ノイズ源からの音を取得するための第二のマイクと、
前記第二のマイクによって生成された音声信号から、前記ノイズ源のノイズを強調する強調手段と、
前記強調手段によって生成された音声信号に基づいて、前記第一のマイクによって生成された音声信号から前記ノイズ源のノイズを減算する減算手段と、
を有することを特徴とする音声処理装置。 - 前記強調手段は、前記ノイズ源のノイズ以外の音声信号を低減することで、前記ノイズ源のノイズを強調することを特徴とする請求項1に記載の音声処理装置。
- 前記ノイズ源のノイズ以外の音声信号は、少なくとも環境音の音声信号、前記第一のマイクのセルフノイズ、および前記第二のマイクのセルフノイズのいずれか一つを含むことを特徴とする請求項2に記載の音声処理装置。
- 前記強調手段は、前記ノイズ源のノイズとは相関のない音声の音声信号を低減することを特徴とする請求項1から3のいずれか1項に記載の音声処理装置。
- 前記強調手段は、前記ノイズ源のノイズ以外の音の種別に応じて、ノイズ低減処理を異ならせることを特徴とする請求項1から4のいずれか1項に記載の音声処理装置。
- 前記強調手段は、前記第二のマイクによって生成された音声信号から、前記ノイズ源のノイズ以外の音声信号を減算することを特徴とする請求項1から5のいずれか1項に記載の音声処理装置。
- 前記強調手段は、フィルタを用いて、前記第二のマイクによって生成された音声信号から前記ノイズ源のノイズ以外の音声信号を低減することを特徴とする請求項1から6のいずれか1項に記載の音声処理装置。
- 前記強調手段は、ウィーナーフィルタによって、前記第二のマイクによって生成された音声信号から前記ノイズ源のノイズ以外の音声信号を低減することを特徴とする請求項7に記載の音声処理装置。
- 前記ノイズ源のノイズが発生している期間を検出する検出手段をさらに有し、
前記強調手段は、前記検出手段によって検出された前記ノイズ源のノイズが発生している期間において、前記ノイズ源のノイズを強調する
ことを特徴とする請求項1から8のいずれか1項に記載の音声処理装置。 - 前記検出手段は、前記第二のマイクによって生成された音声信号に基づいて前記ノイズ源のノイズが発生している期間を検出することを特徴とする請求項9に記載の音声処理装置。
- 前記強調手段によって生成された音声信号を補正する補正手段をさらに有し、
前記減算手段は、前記補正手段によって生成された音声信号を、前記第一のマイクから生成された音声信号から減算することを特徴とする請求項1から10のいずれか1項に記載の音声処理装置。 - 前記第一のマイクから生成された時間領域の音声信号および前記第二のマイクから生成された時間領域の音声信号を周波数領域の音声信号に変換する変換手段をさらに有し、
前記強調手段は、前記変換手段によって変換された前記第二のマイクによって生成された音声信号から、前記ノイズ源のノイズを強調し、
前記減算手段は、前記強調手段によって生成された音声信号に基づいて、前記変換手段によって変換された前記第一のマイクによって生成された音声信号から、前記ノイズ源のノイズを減算することを特徴とする請求項1から11のいずれか1項に記載の音声処理装置。 - 前記ノイズ源は前記音声処理装置に取り付け可能なレンズに含まれることを特徴とする請求項1から12のいずれか1項に記載の音声処理装置。
- 環境音を取得するための第一のマイクと、
ノイズ源からの音を取得するための第二のマイクと、を有する音声処理装置の制御方法であって、
前記第二のマイクによって生成された音声信号から、前記ノイズ源のノイズを強調する強調ステップと、
前記強調ステップにおいて生成された音声信号に基づいて、前記第一のマイクによって生成された音声信号から前記ノイズ源のノイズを減算する減算ステップと、
を有することを特徴とする制御方法。 - コンピュータを請求項1から13のいずれか1項に記載の音声処理装置の各手段として機能させるための、コンピュータが読み取り可能なプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050221A JP2022148507A (ja) | 2021-03-24 | 2021-03-24 | 音声処理装置、制御方法、およびプログラム |
US17/686,203 US11682377B2 (en) | 2021-03-24 | 2022-03-03 | Sound processing apparatus, control method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021050221A JP2022148507A (ja) | 2021-03-24 | 2021-03-24 | 音声処理装置、制御方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022148507A true JP2022148507A (ja) | 2022-10-06 |
JP2022148507A5 JP2022148507A5 (ja) | 2024-03-15 |
Family
ID=83363568
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021050221A Pending JP2022148507A (ja) | 2021-03-24 | 2021-03-24 | 音声処理装置、制御方法、およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11682377B2 (ja) |
JP (1) | JP2022148507A (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2839815B2 (ja) | 1993-02-26 | 1998-12-16 | 松下電器産業株式会社 | ビデオカメラ用収音装置 |
US9922637B2 (en) * | 2016-07-11 | 2018-03-20 | Microsoft Technology Licensing, Llc | Microphone noise suppression for computing device |
US10522129B2 (en) * | 2016-10-06 | 2019-12-31 | Gopro, Inc. | Active acoustic and vibration noise canceling in waterproof camera |
-
2021
- 2021-03-24 JP JP2021050221A patent/JP2022148507A/ja active Pending
-
2022
- 2022-03-03 US US17/686,203 patent/US11682377B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11682377B2 (en) | 2023-06-20 |
US20220310054A1 (en) | 2022-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5594133B2 (ja) | 音声信号処理装置、音声信号処理方法及びプログラム | |
JP5529635B2 (ja) | 音声信号処理装置および音声信号処理方法 | |
US9495950B2 (en) | Audio signal processing device, imaging device, audio signal processing method, program, and recording medium | |
JP2008263498A (ja) | 風雑音低減装置、音響信号録音装置及び撮像装置 | |
US20150271439A1 (en) | Signal processing device, imaging device, and program | |
JP2004341339A (ja) | 雑音抑圧装置 | |
JP4952769B2 (ja) | 撮像装置 | |
JP2018205547A (ja) | 音声処理装置及びその制御方法 | |
US9734840B2 (en) | Signal processing device, imaging apparatus, and signal-processing program | |
JP5998483B2 (ja) | 音声信号処理装置、音声信号処理方法、プログラム及び記録媒体 | |
JP5349062B2 (ja) | 音響処理装置及びそれを備えた電子機器並びに音響処理方法 | |
JP2017229086A (ja) | 音処理装置および音処理プログラム | |
JP2004020679A (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2022148507A (ja) | 音声処理装置、制御方法、およびプログラム | |
JP4505597B2 (ja) | 雑音除去装置 | |
JP2013250449A (ja) | ノイズ低減装置、撮像装置及びプログラム | |
US20230164485A1 (en) | Imaging apparatus and method for controlling the same | |
JP2012185445A (ja) | 信号処理装置、撮像装置、及び、プログラム | |
JP5018860B2 (ja) | 信号処理装置及び撮像装置 | |
JP2023077339A (ja) | 撮影装置、制御方法、およびプログラム | |
JP2013178458A (ja) | 信号処理装置及び信号処理プログラム | |
JP2014232267A (ja) | 信号処理装置、撮像装置、およびプログラム | |
JP2014026032A (ja) | 信号処理装置、撮像装置、及び、プログラム | |
JP2018207316A (ja) | 音声処理装置及びその制御方法 | |
JP5246134B2 (ja) | 信号処理装置及び撮像装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20231213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240307 |