[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2008193196A - 撮像装置および指定音声出力方法 - Google Patents

撮像装置および指定音声出力方法 Download PDF

Info

Publication number
JP2008193196A
JP2008193196A JP2007022818A JP2007022818A JP2008193196A JP 2008193196 A JP2008193196 A JP 2008193196A JP 2007022818 A JP2007022818 A JP 2007022818A JP 2007022818 A JP2007022818 A JP 2007022818A JP 2008193196 A JP2008193196 A JP 2008193196A
Authority
JP
Japan
Prior art keywords
subject
unit
image
specific subject
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007022818A
Other languages
English (en)
Inventor
Koichi Nakagome
浩一 中込
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2007022818A priority Critical patent/JP2008193196A/ja
Publication of JP2008193196A publication Critical patent/JP2008193196A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Studio Devices (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

【課題】撮影中、または撮影した画像のうち、特定の画像について、簡便かつ迅速に指定された特定の被写体の音声のみを強調して再生する。
【解決手段】画像を撮像し、前記画像表示手段に表示するとともに、入力された外部音声を複数の音声信号に変換して音声信号に変換して出力する。次に、画像表示手段に表示された画像に対して、画像内の特定の被写体を指定し、指定された被写体の座標情報と撮影画角とに基づいて、特定の被写体の方向を算出する。そして、算出された特定の被写体の方向に基づいて、複数の音声信号から特定の被写体の方向に対応した合成音声信号を生成し、合成音声信号を外部に出力する。
【選択図】図7

Description

本発明は、撮像装置および撮像装置における指定音声出力方法に関する。
近年、パーソナルコンピュータの目覚しい普及やその使い勝手の良さから、従来の銀塩フィルムを用いたカメラに替わって、CCD(Charge Coupled Device)等の撮像素子を用いたデジタルカメラが急速に普及している。
上述のデジタルカメラは、撮像した画像をデジタルデータに変換して表示、保存することができるため、従来の銀塩フィルムを用いたカメラと異なり、様々な機能が提案されている。
例えば、こうした機能の一例として、デジタルカメラで撮影を行う際、デジタルカメラが撮影画面中の被写体の位置を検出するとともに、デジタルカメラが被写体と交信を行うことにより被写体に関する関連情報を収集し、その関連情報を撮影画面内の位置に関連付けて画像データに付加して記憶する。そして、その画像データを再生して閲覧する際に、ユーザが興味を持った被写体を再生画面上で指定すると、指定された再生画面上の位置に応じた関連情報を読み出して表示するようなものが知られている(例えば、特許文献1参照。)。
特開2003−174578号公報
そのため、上述の従来技術によれば、例えば、画像を閲覧している最中に、画像に写されている歴史的建造物などについて知りたいと思った場合に、一旦画像の閲覧を中止して百科事典で調べたり、インターネットで検索したりすることなく、迅速に、必要な情報を入手できる。しかしながら、例えば、撮影中、または撮影された特定の場面において、画像に映し出されている特定の被写体の音声のみを強調して再生したいというような要求に対して、これに応えられるものではなかった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、撮影中、または撮影した画像のうち、特定の画像について、簡便かつ迅速に指定された特定の被写体の音声のみを強調して再生することができる撮像装置および指定音声出力方法を提供することを目的とする。
本発明は、上記の課題を解決するために、以下の事項を提案している。
(1)本発明は、画像を撮像する撮像手段と、該撮像手段により撮像された画像を表示する画像表示手段を備えた撮像装置であって、入力された外部音声を複数の音声信号に変換して音声信号に変換して出力する音声入力段と、前記画像表示手段に表示された画像に対して、画像内の特定の被写体を指定する被写体指定手段と、該被写体指定手段において指定された被写体の座標情報と撮影画角とに基づいて、特定の被写体の方向を算出する方向算出手段と、前記方向算出手段において算出された特定の被写体の方向に基づいて、前記複数の音声信号から前記特定の被写体の方向に対応した合成音声信号を生成する合成音声信号生成手段と、該合成音声信号を外部に出力する出力手段と、を備えたことを特徴とする撮像装置を提案している。
(2)本発明は、(1)の撮像装置について、さらに、前記複数の音声信号と前記撮像手段が撮像した画像とを記憶する記憶手段を備えたことを特徴とする撮像装置を提案している。
(3)本発明は、(1)または(2)の撮像装置について、前記音声入力手段は、2次元に配置されるマイクロフォンアレーであることを特徴とする撮像装置を提案している。
(4)本発明は、(2)の撮像装置について、前記合成音声信号生成手段は、前記方向算出手段において算出された特定の被写体の方向に基づいて、前記複数の音声信号から特定の被写体の方向に対応した合成音声信号を生成する際に、前記記憶手段から読み出した前記複数の音声信号を用いることを特徴とする撮像装置を提案している。
(5)本発明は、(1)から(4)のいずれかの撮像装置について、前記被写体指定手段は、タッチパネルにより指定された任意の被写体を特定の被写体として指定することを特徴とする撮像装置を提案している。
(6)本発明は、(1)から(4)のいずれかの撮像装置について、さらに、顔認識手段を備え、前記被写体指定手段は、該顔認識手段によって顔として認識された被写体を特定の被写体として指定することを特徴とする請求項1から4のいずれかに記載の撮像装置を提案している。
(7)本発明は、(1)から(4)のいずれかの撮像装置について、さらに、被写体追従手段を備え、前記被写体指定手段は、該被写体追従手段の追従対象である被写体を特定の被写体として指定することを特徴とする撮像装置を提案している。
(8)本発明は、画像を撮像する撮像手段と、該撮像手段により撮像された画像を表示する画像表示手段を備えた撮像装置における指定音声出力方法であって、前記画像を撮像し、前記画像表示手段に表示するとともに、入力された外部音声を複数の音声信号に変換して音声信号に変換して出力する第1のステップと、前記画像表示手段に表示された画像に対して、画像内の特定の被写体を指定する第2のステップと、該指定された被写体の座標情報と撮影画角とに基づいて、前記特定の被写体の方向を算出する第3のステップと、該算出された特定の被写体の方向に基づいて、前記複数の音声信号から前記特定の被写体の方向に対応した合成音声信号を生成する第4のステップと、該合成音声信号を外部に出力する第5のステップと、を備えたことを特徴とする指定音声出力方法を提案している。
本発明によれば、撮影中、または撮影した画像のうち、特定の画像について、簡便かつ迅速に指定された特定の被写体の音声のみを強調して再生することができるという効果がある。
以下、本発明の実施形態について、図1から図10を用いて詳細に説明する。
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組み合わせを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
<第1の実施形態>
図1から図7を用いて、第1の実施形態に係る撮像装置について説明する。
本実施形態は、撮像待機時に表示されるスルー画像において、ユーザが、指定した特定の被写体(人、動物)の音声を再生するものである。
<撮像装置の外観構成>
本実施形態に係る撮像装置(デジタルカメラ100)の外観構成は、図1に示すようになっており、図1(A)はその正面図、図1(B)はその背面図を示している。撮像装置(デジタルカメラ100)の正面には、図1(A)に示すように、その正面側にストロボ発光部1と撮像レンズ(レンズ群)2とを備え、さらに、所定の間隔をもって2次元状に複数のマイク11a〜11iを備えている。なお、複数のマイク11a〜11iは、マイクロフォンアレーで構成されていてもよい。この場合、単体のマイクロフォンと異なり、組み立てが容易である上に、コストダウンを図ることも可能となる。
また、撮像装置(デジタルカメラ100)の背面には、図1(B)に示すように、モードダイヤル3と、表示モニタ4と、カーソルキー5と、SETキー6と、望遠撮影時に用いられるズームキー(Wideボタン7−1、Teleボタン7−2)7と、撮像モードを選択する選択手段としての撮影モード選択キー10と、スピーカ12等が設けられている。なお、本発明の音声出力機能は、常に、ON状態としてもよいし、省電力のためにモードダイヤル3を用いて設定してもよい。
さらに、撮像装置(デジタルカメラ100)の上面には、図1(A)、(B)に示すように、シャッターキー8と、電源ボタン9等が設けられ、図示しない撮像装置(デジタルカメラ100)の側面には、パーソナルコンピュータやモデム等の外部装置をUSBケーブルで接続する場合に用いられるUSB(Universal Serial Bus)端子の接続部や、メモリカード等を挿入するスロット等が設けられている。
<撮像装置の電気的構成>
本実施形態に係る撮像装置(デジタルカメラ100)は、図2に示すように、撮像レンズ62と、レンズ駆動ブロック63と、絞り兼用シャッター64と、CCD50と、TG(Timing Generator)66と、ユニット回路67と、DRAM(Dynamic Random Access Memory)68と、メモリ69と、CPU(Central Processing Unit)70と、画像表示部71と、キー入力部72と、外部通信I/F(Interface)73と、ストロボ駆動部74と、ストロボ発光部75と、カードI/F(Interface)76と、音声入力部81と、音声出力部82と、被写体指定部83と、音声信号処理部90とを備えており、カードI/F76には、図示しないデジタルカメラ100本体のカードスロットにメモリカードが着脱可能に接続される。
撮像レンズ62は、フォーカスレンズ、ズームレンズを含み、レンズ駆動ブロック63が接続されている。このレンズ駆動ブロック63は、図示しないフォーカスレンズ、ズームレンズをそれぞれ撮像面と平行な光軸方向に駆動させるフォーカスモータ及びズームモータと、CPU70からの制御信号にしたがってフォーカスモータ及びズームモータをそれぞれ駆動させるフォーカスドライバ及びズームモータドライバから構成されている。
絞り兼用シャッター64は、図示しない駆動回路を含み、この駆動回路はCPU70から送られてくる制御信号にしたがって絞り兼用シャッターを動作させる。なお、この絞り兼用シャッター64は、絞りとシャッターとして機能する。
ここで、絞りとは、撮像レンズ62から入ってくる光の量を制御する機構をいい、シャッターとは、CCD50に光を当てる時間を制御する機構をいう。また、CCD50に光を当てる時間(露出時間)は、シャッターの開閉間隔時間(シャッター速度)によって変化するため、露出量は、この絞りとシャッター速度とによって定めることができる。
CCD50は、撮像レンズ62及び絞り兼用シャッター64を介して投影された被写体の光を電気信号に変換し、撮像信号としてユニット回路67に出力する。また、CCD50は、TG66によって生成された所定周波数のタイミング信号にしたがって駆動する。なお、TG66にはユニット回路(CDS/AGC/AD)67が接続されている。
ユニット回路(CDS/AGC/AD)67は、CCD50から出力される撮像信号を相関二重サンプリングして保持するCDS(Correlated Double Sampling)回路、そのサンプリング後の撮像信号の自動利得調整を行うAGC(Automatic Gain Control)回路、その自動利得調整後のアナログの撮像信号をデジタル信号に変換するA/D変換器から構成されており、CCD50の撮像信号は、ユニット回路67を経てデジタル信号としてCPU70に送られる。
CPU70は、ユニット回路67から送られてきた画像データの画像処理(画素補間処理、γ補正、輝度色差信号の生成、ホワイトバランス処理、露出補正処理等)、ブレ補正処理、画像データの圧縮・伸張(例えば、JPEG形式の圧縮・伸張)の処理等を行う機能を有するとともに、デジタルカメラ100の各部を制御プログラムにしたがって制御するワンチップマイコンであって、時刻を計時するクロック回路を含む。
DRAM68は、CPU70のワーキングメモリとしても使用される。画像表示部71は、カラーLCD(Liquid Crystal Display)とその駆動回路とを含み、撮影待機状態において、CCD50によって撮像された被写体をスルー画像として表示する。なお、画像表示部71の表面には、タッチパネルが組み込まれている。これにより、ユーザが画像表示部71に表示された画像の中から特定の被写体を容易に指定することが可能となる。
キー入力部72は、シャッターボタンやモードキー、SETキー、十字キー、撮影モード選択キー等の複数の操作キーを含み、ユーザのキー操作に応じた操作信号をCPU70に出力する。
外部通信I/F73は、外部の電子機器(例えば、パーソナルコンピュータ)との間でデータの入出力を行うものであり、USB規格、IEEE1394規格などの各種インターフェース規格による入出力を可能としており、これらの規格によるデータ入出力が可能なパソコンなどの電子機器と接続可能となっている。また、IrDA規格による赤外線通信、Bluetooth(TM)規格による無線通信により外部の電子機器と画像データの入出力を可能としているものでもよい。
ストロボ駆動部74は、CPU70の制御信号にしたがって、ストロボ発光部75を閃光駆動させ、ストロボ発光部75は、これによりストロボを閃光させる。CPU70は、図示しない測光回路により、撮影シーンが暗いか否かを判断し、撮影シーンが暗いと判断し、かつ、撮影を行う場合(シャッターボタンの押下時)には、ストロボ駆動部74に制御信号を出力する。
メモリ69は、CPU70によるデジタルカメラ100の各部の制御に必要なプログラム及び各部の制御に必要なデータを記録格納しており、CPU70は、このプログラムにしたがって処理を実行する。
音声入力部81は、入力された外部音声をマイク11a〜11iによって複数の音声信号に変換し、後述する音声信号処理部90に音声信号を出力する。音声出力部82は、音声信号処理部90において信号処理された音声をスピーカ12に対して出力する。被写体指定部83は、例えば、タッチパネルによって構成された画像表示部71に表示された特定の被写体(人、動物)を指定するために、ユーザがタッチペン等によって、指定する特定の被写体の画像に触れたときに、その特定の被写体に対応する座標情報を認識し、この座標情報を音声信号処理部90に出力する。音声信号処理部90は、入力した座標情報および音声信号に基づいて、ユーザが被写体指定部83において指定した特定の被写体の音声信号のみを強調する処理を実行し、処理した音声信号を音声出力部82に出力する。
<主要部の構成ブロック>
本実施形態に係る撮像装置(デジタルカメラ100)の主要構成ブロックは、図3に示すように、音声入力部81と、CCD(画像入力部)50と、画像表示部71と、被写体指定部83と、音声信号処理部90と、音声出力部82とから構成されており、図4に示すように、音声信号処理部90は、さらに、被写体方向演算部91と、遅延量演算部92と、遅延量調整部93と、合成部94とから構成されている。
ここで、被写体方向演算部91は、被写体指定部83から入力した座標情報とCPU70から入力した画角情報とに基づいて、画像内の指定された特定の被写体の被写体方向を演算する。なお、演算方法の詳細については、後述する。
また、遅延量演算部92は、被写体方向演算部91において演算された被写体方向と各マイク11a〜11iの配列位置情報とから各マイク11a〜11iにおける被写体からの音声信号の到達遅延量を演算する。
遅延量調整部93は、遅延量演算部92が演算した各マイク11a〜11iにおける被写体からの音声信号の到達遅延量に基づいて、各マイク11a〜11iからの音声信号の遅延量を調整して、各音声信号の位相を合わせる。そして、合成部94は、遅延量調整部93から出力される遅延量が調整された各音声信号を合成して音声出力部82に出力する。これにより、被写体指定部83を用いて、ユーザに指定された撮像画像上の特定の被写体に対応する音声のみを強調して出力することができる。
<被写体方向演算部の演算処理>
次に、被写体方向演算部91における演算処理について、図5を用いて、説明する。
図5は、説明の便宜上、画像表示部の横方向の画素配列をX方向とした1次元のモデルを例示している。なお、画像表示部の横方向の画素配列をX方向、縦方向の画素配列をY方向とした2次元のモデルの場合でも、以下、詳述する方法によって、被写体方向角を演算することができる。
図5において、θは、撮影時のデジタルカメラの画角を示している。ここで、画角θは、ズーム撮影であれば、ズームレンズのズームリングの移動量により、固定レンズによる撮影であれば、固定レンズの固定値により求めることができ、この情報は、CPU70から供給される。
図5において、レンズ主点から被写体までの距離をYとする。図中、Xは、距離Yにおいて画像の中央から端までに対応する長さである。また、xは、ユーザが被写体指定部83において指定した画像表示部71上の特定の人物の光軸中心からの距離を示しており、θxは、xにおける光軸中心からの角度を示している。ここで、xとYとの間には、
x=Ytanθx・・・(1)
の関係式が成立し、XとYとの間には、
Y=Xtanθ
・・・(2)
の関係式が成立する。
ここで、上記式(1)、式(2)から、Yを消去すると、θxは、以下、式(3)のようになる。
θx=arctan(x/(X・tanθ))・・・(3)
したがって、(3)式から、x/Xとθとがわかれば、被写体の方向角θxを求めることができる。ここで、x/Xは、撮像された画像の横方向の画素数(=2X)と指定された特定の人物が画像中心から何画素離れているか(=x)から決まり、θはレンズ状態((レンズの焦点距離から算出可能な画角)/2 )から決まるので、レンズ状態と画像内の位置から被写体の方向角θxが求まる。
<遅延量演算部の演算処理>
次に、遅延量演算部における演算処理について、図6を用いて、説明する。
図6は、ユーザが被写体指定部83において指定した特定の被写体(人、動物)の音声(図中、音源と表示)が、各マイク11b、11eに対して到来する方向を模式的に示した図である。
図6に示すように、光軸中心と被写体の音声(音源)の到来方向とがなす角は、上記、被写体方向演算部91で求められるθxとなる。ここで、デジタルカメラ100の撮像レンズ搭載面に設けられた例えば、2つのマイク11b、11eの間隔をLとすると、マイク11b、11eの間隔Lは、被写体の位置(音源)からマイク11b、11eまでの距離に比べて十分に短いため、各マイク11b、11eと被写体の音声(音源)の到来方向とがなす角も、上記の光軸中心と被写体の音声(音源)の到来方向とがなす角θxと同様にみなすことができる。
そこで、遅延量を求めるために、図6において、マイク11eの中心から、マイク11bに対する被写体の音声(音源)の到来方向に対して、垂線を下すと、その遅延量は、以下、式(4)のようになる。
Lsinθx・・・(4)
このように、他のマイクに対しても同様の演算を行うことにより、基準となるマイクからの遅延量を求めることができる。
<撮像装置の処理>
次に、図7を用いて、本実施形態に係る撮像装置の処理について説明する。
まず、画像表示部71が、撮影待機状態において、CCD50によって撮像された画像をスルー画像として表示するとともに、音声入力部81が各マイク11a〜11iからの音声を各マイク11a〜11iごとに取り込んで、音声信号処理部90に出力する(ステップS101)。
次に、被写体指定部83によって、ユーザが画像表示部71に表示された特定の被写体(人、動物)を指定すると、被写体指定部83が、画像表示部71に表示された特定の被写体の座標情報を被写体方向演算部91に出力する(ステップS102)。
被写体方向演算部91は、被写体指定部83から入力した座標情報とCPU70から入力した画角情報とに基づいて、上記(3)の演算式から、被写体の音声の到来方向(角度)θxを算出し、遅延量演算部92に出力する(ステップS103)。遅延量演算部92は、入力した到来方向(角度)θxと各マイクの設置間隔Lとに基づいて、上記(4)の演算式から、各マイクの遅延量を演算し、遅延量調整部93に出力する(ステップS104)。
遅延量調整部93は、入力した各マイクごとの遅延量に基づいて、対応する音声信号の遅延量を調整して、位相を合わせた音声信号を合成部94に出力する(ステップS105)。合成部94は、遅延量調整部93からの音声信号を合成して、音声出力部82に出力する(ステップS106)。音声出力部82は、合成部94から入力した信号を電気信号に変換して、スピーカ12に供給することにより、音声を外部に放音する(ステップS107)。
したがって、本実施形態によれば、撮影待機状態で、ユーザが被写体指定部83によって指定した特定の被写体の音声を強調して再生することができる。また、ユーザが音声を聞きたい特定の被写体を画像表示部上でタッチペンなどを用いて、指定すればよいため、ヒューマンインターフェースに優れているという利点を有する。
さらに、ユーザが画像表示部上で指定した画像から座標情報を生成し、この座標情報と画角情報とから、音声を聞きたい特定の被写体の音声の到来方向を算出し、さらに、各マイクの設置間隔からそれぞれのマイクに対応した遅延量を求めて、遅延量の調整を行った音声信号を合成して出力することから、音声を聞きたい特定の被写体の音声のみを強調して出力することができる。
<第2の実施形態>
図8から図10を用いて、第2の実施形態について説明する。
本実施形態は、すでに撮像された画像を画像表示部71に表示し、ユーザが、指定した特定の被写体(人、動物)の音声を再生するものである。なお、本実施形態における撮像装置の外観構成は、第1の実施形態と同様であり、また、第1の実施形態と同一の符号を付す構成要素については、同様の機能を有するものであることから、その詳細な説明は省略する。
<主要部の構成ブロック>
本実施形態に係る撮像装置(デジタルカメラ100)の主要構成ブロックは、図8に示すように、音声入力部81と、CCD(画像入力部)50と、記憶部84と、画像表示部71と、被写体指定部83と、音声信号処理部90と、音声出力部82とから構成されており、音声信号処理部90は、図9に示すように、さらに、被写体方向演算部91と、遅延量演算部92と、遅延量調整部93と、合成部94とから構成されている。
第1の実施形態と異なる部分は、記憶部84を備えた点にある。記憶部84は、音声入力部81に入力された各マイク11a〜11iからの音声を各マイク11a〜11iに対応してトラックを分けて記憶する。また、記憶部84は、撮影した画像情報と上記の音声情報とを対応づけて記憶する。こうすることによって、すでに撮像された画像において、ユーザが、指定した特定の被写体(人、動物)の音声を強調して再生することができる。
なお、記憶部84は、別個に設けてもよいし、DRAM68を記憶部84として、撮像された画像データに対応させて、マイク11a〜11iから入力された音声信号を一時記憶するバッファメモリとして使用してもよい。また、記憶部84として外部記憶素子であるメモリカードに、圧縮された画像データとこれに対応した各マイク11a〜11iからの圧縮された音声信号を保存してもよい。
<撮像装置の処理>
次に、図10を用いて、本実施形態に係る撮像装置の処理について説明する。
まず、ユーザの操作により、記憶部84から画像データを読み出して、画像表示部71に選択する画像データを表示する(ステップS201)。選択される画像データが、記憶部84から読み出されたら、関連する音声データを読み出す(ステップS202)。
次に、被写体指定部83によって、ユーザが画像表示部71に表示された特定の被写体(人、動物)を指定すると、被写体指定部83が、画像表示部71に表示された特定の被写体の座標情報を被写体方向演算部91に出力する(ステップS203)。
被写体方向演算部91は、被写体指定部83から入力した座標情報とCPU70から入力した画角情報とに基づいて、上記(3)の演算式から、被写体からの音声の到来方向(角度)θxを算出し、遅延量演算部92に出力する(ステップS204)。遅延量演算部92は、入力した到来方向(角度)θxと各マイクの設置間隔Lとに基づいて、上記(4)の演算式から、各マイクの遅延量を演算し、遅延量調整部93に出力する(ステップS205)。
遅延量調整部93は、記憶部84から音声データをトラックごとに読み出すとともに、入力した各マイクごとの遅延量に基づいて、対応する音声信号の遅延量を調整して、位相を合わせた音声信号を合成部94に出力する(ステップS206)。合成部94は、遅延量調整部93からの音声信号を合成して、音声出力部82に出力する(ステップS207)。音声出力部82は、合成部94から入力した信号を電気信号に変換して、スピーカ12に供給することにより、音声を外部に放音する(ステップS208)。
したがって、本実施形態によれば、画像データを記憶するとともに、画像データと関連付けて音声データを各マイクに対応したトラックごとに記憶することから、すでに撮像された画像データについて、ユーザが被写体指定部83によって指定した特定の被写体(人、動物)の音声を強調して再生することができる。
また、ユーザが音声を聞きたい特定の被写体を画像表示部上でタッチペンなどを用いて、指定すればよいため、ヒューマンインターフェースに優れているという利点を有する。さらに、ユーザが画像表示部上で指定した画像から座標情報を生成し、この座標情報と画角情報とから、音声を聞きたい特定の被写体の音声の到来方向を算出し、さらに、各マイクの設置間隔からそれぞれのマイクに対応した遅延量を求めて、遅延量の調整を行った音声信号を合成して出力することから、音声を聞きたい特定の被写体の音声のみを強調して出力することができる。
以上、この発明の実施形態につき、図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。例えば、本実施形態では、被写体の指定をタッチパネルによりユーザが手動で行う方法について説明したが、顔認識による自動指定であってもよい。
また、顔認識により候補となる被写体を絞り込んだ後にユーザが任意に被写体を指定するようにしてもよい。さらに、オートフォーカスの対象となる被写体を、音声を聞きたい特定の被写体としてもよい。また、被写体追従モードにより、追従対象の被写体を音声を聞きたい特定の被写体としてもよい。
また、指向性を調整できるマイクを用いて、被写体方向角に応じた指向性を設定し、さらに、音声を聞きたい特定の被写体の音声のみを強調するようにしてもよいし、被写体からマイクまでの距離に応じて、感度を可変して、音声を聞きたい特定の被写体の音声のみを強調するようにしてもよい。
また、上記で述べたように、被写体の方向は、ユーザの指定した座標情報と画角とにより決定され、遅延量は、被写体の方向角とマイク間距離により決定されるため、これらを変数とするデータテーブルを格納して、このデータテーブルと、各マイクに対応してトラックに分けて記憶された音声データを外部機器に出力し、この外部機器において上記遅延量の演算や音声の合成処理を行うようにしてもよい。
第1の実施形態に係る撮像装置の外観構成図である。 第1の実施形態に係る撮像装置の電気的構成ブロック図である。 第1の実施形態に係る撮像装置の主要構成ブロック図である。 第1の実施形態に係る撮像装置の音声処理部の構成ブロック図である。 第1の実施形態に係る撮像装置における被写体方向演算部の演算処理を説明するための図である。 第1の実施形態に係る撮像装置における遅延量演算部の演算処理を説明するための図である。 第1の実施形態に係る撮像装置の処理フローである。 第2の実施形態に係る撮像装置の主要構成ブロック図である。 第2の実施形態に係る撮像装置の音声処理部の構成ブロック図である。 第2の実施形態に係る撮像装置の処理フローである。
符号の説明
1・・・ストロボ発光部、2・・・撮像レンズ(レンズ群)、3・・・モードダイヤル、4・・・液晶モニタ画面、5・・・カーソルキー、6・・・SETキー、7・・・ズームキー、8・・・シャッターキー、9・・・電源ボタン、10・・・撮影モード選択キー、11a〜11i・・・マイク、12・・スピーカ、20・・・第1のレンズ、21・・・第2のフォーカスレンズ、30・・・第2のレンズ、31・・・反射ミラー、32・・・光学ズームレンズ、33・・・第1のフォーカスレンズ、40・・・光可動反射ミラー、50・・・CCD、62・・・撮像レンズ、63・・・レンズ駆動ブロック、64・・・絞り兼用シャッター、66・・・TG、67・・・ユニット回路、68・・・DRAM、69・・・メモリ、70・・・CPU、71・・・画像表示部、72・・・キー入力部、73・・・外部通信I/F、74・・・ストロボ駆動部、75・・・ストロボ発光部、76・・・カードI/F、81・・・音声入力部、82・・・音声出力部、83・・・被写体指定部、84・・・記憶部、90・・・音声信号処理部、91・・・被写体方向演算部、92・・・遅延量演算部、93・・・遅延量調整部、94・・・合成部、100・・・デジタルカメラ

Claims (8)

  1. 画像を撮像する撮像手段と、該撮像手段により撮像された画像を表示する画像表示手段を備えた撮像装置であって、
    入力された外部音声を複数の音声信号に変換して音声信号に変換して出力する音声入力段と、
    前記画像表示手段に表示された画像に対して、画像内の特定の被写体を指定する被写体指定手段と、
    該被写体指定手段において指定された被写体の座標情報と撮影画角とに基づいて、特定の被写体の方向を算出する方向算出手段と、
    前記方向算出手段において算出された特定の被写体の方向に基づいて、前記複数の音声信号から前記特定の被写体の方向に対応した合成音声信号を生成する合成音声信号生成手段と、
    該合成音声信号を外部に出力する出力手段と、
    を備えたことを特徴とする撮像装置。
  2. さらに、前記複数の音声信号と前記撮像手段が撮像した画像とを記憶する記憶手段を備えたことを特徴とする請求項1に記載の撮像装置。
  3. 前記音声入力手段は、2次元に配置されるマイクロフォンアレーであることを特徴とする請求項1または請求項2に記載の撮像装置。
  4. 前記合成音声信号生成手段は、前記方向算出手段において算出された特定の被写体の方向に基づいて、前記複数の音声信号から特定の被写体の方向に対応した合成音声信号を生成する際に、前記記憶手段から読み出した前記複数の音声信号を用いることを特徴とする請求項2に記載の撮像装置。
  5. 前記被写体指定手段は、タッチパネルにより指定された任意の被写体を特定の被写体として指定することを特徴とする請求項1から4のいずれかに記載の撮像装置。
  6. さらに、顔認識手段を備え、前記被写体指定手段は、該顔認識手段によって顔として認識された被写体を特定の被写体として指定することを特徴とする請求項1から4のいずれかに記載の撮像装置。
  7. さらに、被写体追従手段を備え、前記被写体指定手段は、該被写体追従手段の追従対象である被写体を特定の被写体として指定することを特徴とする請求項1から4のいずれかに記載の撮像装置。
  8. 画像を撮像する撮像手段と、該撮像手段により撮像された画像を表示する画像表示手段を備えた撮像装置における指定音声出力方法であって、
    前記画像を撮像し、前記画像表示手段に表示するとともに、入力された外部音声を複数の音声信号に変換して音声信号に変換して出力する第1のステップと、
    前記画像表示手段に表示された画像に対して、画像内の特定の被写体を指定する第2のステップと、
    該指定された被写体の座標情報と撮影画角とに基づいて、前記特定の被写体の方向を算出する第3のステップと、
    該算出された特定の被写体の方向に基づいて、前記複数の音声信号から前記特定の被写体の方向に対応した合成音声信号を生成する第4のステップと、
    該合成音声信号を外部に出力する第5のステップと、
    を備えたことを特徴とする指定音声出力方法。
JP2007022818A 2007-02-01 2007-02-01 撮像装置および指定音声出力方法 Pending JP2008193196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007022818A JP2008193196A (ja) 2007-02-01 2007-02-01 撮像装置および指定音声出力方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007022818A JP2008193196A (ja) 2007-02-01 2007-02-01 撮像装置および指定音声出力方法

Publications (1)

Publication Number Publication Date
JP2008193196A true JP2008193196A (ja) 2008-08-21

Family

ID=39752899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007022818A Pending JP2008193196A (ja) 2007-02-01 2007-02-01 撮像装置および指定音声出力方法

Country Status (1)

Country Link
JP (1) JP2008193196A (ja)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093671A (ja) * 2008-10-10 2010-04-22 Olympus Imaging Corp カメラ、再生装置、および再生方法
JP2010278725A (ja) * 2009-05-28 2010-12-09 Sanyo Electric Co Ltd 画像音響処理装置及び撮像装置
JP2011227199A (ja) * 2010-04-16 2011-11-10 Nec Casio Mobile Communications Ltd 雑音抑圧装置、雑音抑圧方法及びプログラム
JP2013236136A (ja) * 2012-05-02 2013-11-21 Kyocera Corp 電子機器、制御方法及び制御プログラム
WO2014103331A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 音声処理システム及び音声処理方法
WO2014132533A1 (ja) * 2013-03-01 2014-09-04 シャープ株式会社 音声入力装置およびその音声入力装置を備えた画像表示装置
CN104243779A (zh) * 2013-06-24 2014-12-24 松下电器产业株式会社 指向性控制系统及声音输出控制方法
JP2015019371A (ja) * 2013-07-09 2015-01-29 ノキア コーポレイション オーディオ処理装置
JP2015080194A (ja) * 2013-07-19 2015-04-23 パナソニックIpマネジメント株式会社 指向性制御システム、指向性制御方法、収音システム及び収音制御方法
JP2015100125A (ja) * 2012-12-27 2015-05-28 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
JP2015139162A (ja) * 2014-01-23 2015-07-30 キヤノン株式会社 音響信号処理装置、動画撮影装置およびそれらの制御方法
WO2015151130A1 (ja) * 2014-03-31 2015-10-08 パナソニックIpマネジメント株式会社 音声処理装置、音声処理システム、及び音声処理方法
JP2016178691A (ja) * 2013-06-24 2016-10-06 パナソニックIpマネジメント株式会社 指向性制御システム及び音声出力制御方法
WO2017034166A1 (en) * 2015-08-21 2017-03-02 Samsung Electronics Co., Ltd. Method for processing sound by electronic device and electronic device thereof
US20180158446A1 (en) * 2015-05-18 2018-06-07 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
US10063967B2 (en) 2016-03-22 2018-08-28 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device and sound collecting method
CN109313904A (zh) * 2016-05-30 2019-02-05 索尼公司 视频音频处理设备、视频音频处理方法和程序
US10248375B2 (en) 2017-07-07 2019-04-02 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device capable of obtaining and synthesizing audio data
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
US10939030B2 (en) 2018-09-07 2021-03-02 Canon Kabushiki Kaisha Video audio processing system and method of controlling the video audio processing system

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62258575A (ja) * 1986-05-02 1987-11-11 Hitachi Ltd 自動追尾カメラシステム
JPH05308553A (ja) * 1992-04-28 1993-11-19 Sanyo Electric Co Ltd ビデオカメラの録音装置
JPH07110429A (ja) * 1993-10-08 1995-04-25 Nikon Corp 被写体追尾機能を有するカメラ
JPH11150676A (ja) * 1997-11-17 1999-06-02 Canon Inc 画像処理装置及び追尾装置
JP2001086588A (ja) * 1999-09-10 2001-03-30 Canon Inc 音声信号処理装置及び方法、並びに電子機器
JP2002252805A (ja) * 2001-02-22 2002-09-06 Ricoh Co Ltd 撮像装置、撮像方法、プログラムおよび記録媒体
JP2004173095A (ja) * 2002-11-21 2004-06-17 Matsushita Electric Ind Co Ltd 携帯テレビ電話装置
JP2005124090A (ja) * 2003-10-20 2005-05-12 Sony Corp マイクロホン装置、再生装置及び撮像装置
JP2005323139A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 会議記録装置、会議記録方法、設計方法およびプログラム
JP2006031678A (ja) * 2004-05-28 2006-02-02 Sony United Kingdom Ltd 画像処理
JP2006113265A (ja) * 2004-10-14 2006-04-27 Fujinon Corp オートフォーカスシステム
JP2006222618A (ja) * 2005-02-09 2006-08-24 Casio Comput Co Ltd カメラ装置、カメラ制御プログラム及び記録音声制御方法
JP2006235712A (ja) * 2005-02-22 2006-09-07 Canon Inc 会話収録装置
JP2006261900A (ja) * 2005-03-16 2006-09-28 Casio Comput Co Ltd 撮像装置、撮像制御プログラム
JP2006287735A (ja) * 2005-04-01 2006-10-19 Fuji Photo Film Co Ltd 画像音声記録装置及び集音方向調整方法
JP2006352687A (ja) * 2005-06-17 2006-12-28 Kddi Corp 人物追跡システム
JP2007005849A (ja) * 2005-06-21 2007-01-11 Sony Corp 記録装置、記録方法、再生装置、再生方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62258575A (ja) * 1986-05-02 1987-11-11 Hitachi Ltd 自動追尾カメラシステム
JPH05308553A (ja) * 1992-04-28 1993-11-19 Sanyo Electric Co Ltd ビデオカメラの録音装置
JPH07110429A (ja) * 1993-10-08 1995-04-25 Nikon Corp 被写体追尾機能を有するカメラ
JPH11150676A (ja) * 1997-11-17 1999-06-02 Canon Inc 画像処理装置及び追尾装置
JP2001086588A (ja) * 1999-09-10 2001-03-30 Canon Inc 音声信号処理装置及び方法、並びに電子機器
JP2002252805A (ja) * 2001-02-22 2002-09-06 Ricoh Co Ltd 撮像装置、撮像方法、プログラムおよび記録媒体
JP2004173095A (ja) * 2002-11-21 2004-06-17 Matsushita Electric Ind Co Ltd 携帯テレビ電話装置
JP2005124090A (ja) * 2003-10-20 2005-05-12 Sony Corp マイクロホン装置、再生装置及び撮像装置
JP2005323139A (ja) * 2004-05-10 2005-11-17 Fuji Xerox Co Ltd 会議記録装置、会議記録方法、設計方法およびプログラム
JP2006031678A (ja) * 2004-05-28 2006-02-02 Sony United Kingdom Ltd 画像処理
JP2006113265A (ja) * 2004-10-14 2006-04-27 Fujinon Corp オートフォーカスシステム
JP2006222618A (ja) * 2005-02-09 2006-08-24 Casio Comput Co Ltd カメラ装置、カメラ制御プログラム及び記録音声制御方法
JP2006235712A (ja) * 2005-02-22 2006-09-07 Canon Inc 会話収録装置
JP2006261900A (ja) * 2005-03-16 2006-09-28 Casio Comput Co Ltd 撮像装置、撮像制御プログラム
JP2006287735A (ja) * 2005-04-01 2006-10-19 Fuji Photo Film Co Ltd 画像音声記録装置及び集音方向調整方法
JP2006352687A (ja) * 2005-06-17 2006-12-28 Kddi Corp 人物追跡システム
JP2007005849A (ja) * 2005-06-21 2007-01-11 Sony Corp 記録装置、記録方法、再生装置、再生方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010093671A (ja) * 2008-10-10 2010-04-22 Olympus Imaging Corp カメラ、再生装置、および再生方法
JP2010278725A (ja) * 2009-05-28 2010-12-09 Sanyo Electric Co Ltd 画像音響処理装置及び撮像装置
JP2011227199A (ja) * 2010-04-16 2011-11-10 Nec Casio Mobile Communications Ltd 雑音抑圧装置、雑音抑圧方法及びプログラム
JP2013236136A (ja) * 2012-05-02 2013-11-21 Kyocera Corp 電子機器、制御方法及び制御プログラム
US10536681B2 (en) 2012-12-27 2020-01-14 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and sound processing method that emphasize sound from position designated in displayed video image
JP2014143678A (ja) * 2012-12-27 2014-08-07 Panasonic Corp 音声処理システム及び音声処理方法
CN104904236B (zh) * 2012-12-27 2018-09-14 松下知识产权经营株式会社 声音处理系统以及声音处理方法
US9826211B2 (en) 2012-12-27 2017-11-21 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and processing method that emphasize sound from position designated in displayed video image
US10244219B2 (en) 2012-12-27 2019-03-26 Panasonic Intellectual Property Management Co., Ltd. Sound processing system and sound processing method that emphasize sound from position designated in displayed video image
JP2015100125A (ja) * 2012-12-27 2015-05-28 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
JP2015118386A (ja) * 2012-12-27 2015-06-25 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
JP2015122756A (ja) * 2012-12-27 2015-07-02 パナソニックIpマネジメント株式会社 音声処理システム及び音声処理方法
WO2014103331A1 (ja) * 2012-12-27 2014-07-03 パナソニック株式会社 音声処理システム及び音声処理方法
CN104904236A (zh) * 2012-12-27 2015-09-09 松下知识产权经营株式会社 声音处理系统以及声音处理方法
WO2014132533A1 (ja) * 2013-03-01 2014-09-04 シャープ株式会社 音声入力装置およびその音声入力装置を備えた画像表示装置
JPWO2014132533A1 (ja) * 2013-03-01 2017-02-02 シャープ株式会社 音声入力装置およびその音声入力装置を備えた画像表示装置
US9747454B2 (en) 2013-06-24 2017-08-29 Panasonic Intellectual Property Management Co., Ltd. Directivity control system and sound output control method
JP2016178691A (ja) * 2013-06-24 2016-10-06 パナソニックIpマネジメント株式会社 指向性制御システム及び音声出力制御方法
JP2015029241A (ja) * 2013-06-24 2015-02-12 パナソニックIpマネジメント株式会社 指向性制御システム及び音声出力制御方法
CN104243779A (zh) * 2013-06-24 2014-12-24 松下电器产业株式会社 指向性控制系统及声音输出控制方法
CN104243779B (zh) * 2013-06-24 2018-11-09 松下电器产业株式会社 指向性控制系统及声音输出控制方法
JP2015019371A (ja) * 2013-07-09 2015-01-29 ノキア コーポレイション オーディオ処理装置
US9549244B2 (en) 2013-07-19 2017-01-17 Panasonic Intellectual Property Management Co., Ltd. Directivity control system, directivity control method, sound collection system and sound collection control method
JP2015080194A (ja) * 2013-07-19 2015-04-23 パナソニックIpマネジメント株式会社 指向性制御システム、指向性制御方法、収音システム及び収音制御方法
JP2015139162A (ja) * 2014-01-23 2015-07-30 キヤノン株式会社 音響信号処理装置、動画撮影装置およびそれらの制御方法
WO2015151130A1 (ja) * 2014-03-31 2015-10-08 パナソニックIpマネジメント株式会社 音声処理装置、音声処理システム、及び音声処理方法
US20180158446A1 (en) * 2015-05-18 2018-06-07 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
US10497356B2 (en) * 2015-05-18 2019-12-03 Panasonic Intellectual Property Management Co., Ltd. Directionality control system and sound output control method
US10909384B2 (en) 2015-07-14 2021-02-02 Panasonic Intellectual Property Management Co., Ltd. Monitoring system and monitoring method
WO2017034166A1 (en) * 2015-08-21 2017-03-02 Samsung Electronics Co., Ltd. Method for processing sound by electronic device and electronic device thereof
US9967658B2 (en) 2015-08-21 2018-05-08 Samsung Electronics Co., Ltd Method for processing sound by electronic device and electronic device thereof
US10063967B2 (en) 2016-03-22 2018-08-28 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device and sound collecting method
JPWO2017208820A1 (ja) * 2016-05-30 2019-03-28 ソニー株式会社 映像音響処理装置および方法、並びにプログラム
CN109313904A (zh) * 2016-05-30 2019-02-05 索尼公司 视频音频处理设备、视频音频处理方法和程序
US11184579B2 (en) 2016-05-30 2021-11-23 Sony Corporation Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object
JP2022036998A (ja) * 2016-05-30 2022-03-08 ソニーグループ株式会社 映像音響処理装置および方法、並びにプログラム
CN109313904B (zh) * 2016-05-30 2023-12-08 索尼公司 视频音频处理设备和方法以及存储介质
JP7396341B2 (ja) 2016-05-30 2023-12-12 ソニーグループ株式会社 映像音響処理装置および方法、並びにプログラム
US11902704B2 (en) 2016-05-30 2024-02-13 Sony Corporation Apparatus and method for video-audio processing, and program for separating an object sound corresponding to a selected video object
US10248375B2 (en) 2017-07-07 2019-04-02 Panasonic Intellectual Property Management Co., Ltd. Sound collecting device capable of obtaining and synthesizing audio data
US10939030B2 (en) 2018-09-07 2021-03-02 Canon Kabushiki Kaisha Video audio processing system and method of controlling the video audio processing system

Similar Documents

Publication Publication Date Title
JP2008193196A (ja) 撮像装置および指定音声出力方法
JP5787907B2 (ja) 自分撮り画像を撮影するための撮像装置
US8976270B2 (en) Imaging device and imaging device control method capable of taking pictures rapidly with an intuitive operation
JP4872797B2 (ja) 撮像装置、撮像方法および撮像プログラム
US20090128644A1 (en) System and method for generating a photograph
US8514285B2 (en) Image processing apparatus, image processing method and program
US10200585B2 (en) Imaging device, imaging system, imaging method, and computer-readable recording medium for use in an imaging system including an external communication device
JP2019030007A (ja) 複数のカメラを用いて映像を取得するための電子装置及びこれを用いた映像処理方法
JP2007028536A (ja) デジタルカメラ
JP5230013B2 (ja) 撮像装置
WO2022057723A1 (zh) 一种视频的防抖处理方法及电子设备
US20100053363A1 (en) Photographing method and apparatus
JP2006020166A (ja) 地図表示システム及びデジタルカメラ
JP2011188065A (ja) 撮像制御装置、被写体検出方法、プログラム
JP2012002951A (ja) 撮像装置、合焦位置検出方法および合焦位置検出プログラム
US8525913B2 (en) Digital photographing apparatus, method of controlling the same, and computer-readable storage medium
JP2014531829A (ja) 遠隔制御可能なデジタル・ビデオ・カメラ・システム
JPWO2020158069A1 (ja) 撮像装置、撮像方法、及びプログラム
CN105744170A (zh) 一种照片拍摄装置和方法
CN103888684A (zh) 图像处理装置以及图像处理方法
CN102611835A (zh) 数字拍摄设备及其控制方法
JPWO2020158070A1 (ja) 撮像装置、撮像方法、及びプログラム
JP2012257112A (ja) 撮像装置およびプログラム
KR20090083713A (ko) 디지털 영상 처리장치 및 그 제어방법
JP2011066699A (ja) 撮像装置及び撮像装置の表示用プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091002

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110329

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110913