[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4373645B2 - 映像配信システム、プログラム及び記録媒体 - Google Patents

映像配信システム、プログラム及び記録媒体 Download PDF

Info

Publication number
JP4373645B2
JP4373645B2 JP2002160646A JP2002160646A JP4373645B2 JP 4373645 B2 JP4373645 B2 JP 4373645B2 JP 2002160646 A JP2002160646 A JP 2002160646A JP 2002160646 A JP2002160646 A JP 2002160646A JP 4373645 B2 JP4373645 B2 JP 4373645B2
Authority
JP
Japan
Prior art keywords
video
wide
angle
unit
camera
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002160646A
Other languages
English (en)
Other versions
JP2004007283A5 (ja
JP2004007283A (ja
Inventor
憲彦 村田
青木  伸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002160646A priority Critical patent/JP4373645B2/ja
Publication of JP2004007283A publication Critical patent/JP2004007283A/ja
Publication of JP2004007283A5 publication Critical patent/JP2004007283A5/ja
Application granted granted Critical
Publication of JP4373645B2 publication Critical patent/JP4373645B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Closed-Circuit Television Systems (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、広角の視野を有する撮像手段を用いて取得された広範囲のシーンの映像を配信するシステムに関するものである。具体的には監視システム、遠隔会議システム、遠隔教育システム等の用途に使用される。
【0002】
【従来の技術】
電気通信技術の発展により、あるシーンを撮影した映像を遠隔地に転送し、表示するための遠隔監視システムやテレビ会議システムが、多くの場面で活用されるようになった。かかるシステムの利便性をより向上させるために、通常のカメラでは撮影不可能な広範囲のシーンを撮影できるカメラ装置及び必要なシーンのみを切り出した部分映像を表示するためのシステムが数多く提案されている。
【0003】
例えば、特開平5-122689号公報において、マイクから入力される音声を検出して話者を判定し、該判定結果に基づいてカメラ制御部においてカメラを自動制御し、話者を捉えるというカメラ装置及びテレビ会議システムが提案されている。また、集約的視野を形成するよう複数のカメラを配列させたカメラ装置がある。
【0004】
しかし、特開平5-122689号公報に開示された発明では、話者を捉えるためにカメラを制御するのに時間がかかる、またカメラを回動させる駆動ユニットが壊れやすいという問題点がある。また、上記2つの従来技術においては、シーン全体を記録した映像を取得できないという問題点がある。本出願人は被験者に対し、(1) シーンの注目部分を映した部分映像のみを表示する、(2) シーンの全体を映した映像のみを表示する、(3) (1)及び(2)の映像を同時に表示する、という3種類の映像表示形態を提示し、どれが最も好ましいかを評価する試験を行った。その結果、圧倒的に(3)の表示形態が望ましく、次いで(2)の表示形態が望ましいという評価結果を得た。このように、かかるシステムにおいては、シーン全体が含まれた映像を転送することの重要性が認識されているが、上記従来技術はこの問題点を解消するものではなかった。
【0005】
一方、シーン全体を記録した1枚の映像を取得するために、様々な広角撮影装置が提案されている。例えば、特許番号第2939087号公報及び特許番号第3054146号公報において、双曲線ドーム型ミラーによる360度パノラマ撮影カメラに関する発明が公開されている。これらの公報によると、ドーム型のミラーに反射させた像を撮影することで、魚眼カメラに比較して側方の解像度が高い360度 (半球)分の情景が撮影できる。このカメラを机の上や天井などに設置すれば、室内の全体を観察することができるため監視用途などに適している。撮影された画像は、図7のように円形状に歪んだ形となるが、特許番号第3054146号公報にはこれを通常のカメラで撮影したように変形する手段が記載されている。これらの公報によると、シーン全体を記録した画像のみならず、切り出し処理を適用することにより部分映像をも生成することが可能である。しかし、これらの公報に記載された広角撮影装置の場合、全方位の映像を1枚の円形状の映像に取得することにより、図7の黒塗り部分のように何も映されない無駄な領域が生じ、その結果得られる部分映像の画質が不十分となる。
【0006】
このほか、特開平2001-94857号公報において、カメラアレイにより同期的に捕捉された1組の映像を共通座標系にワープさせることにより、継ぎ目のない1つの広角画像を生成するという発明が公開されている。該公報によると、通常のカメラで捉えた映像を1枚に結合することで、画面上全体にわたって高い解像度を有する広角画像を取得できる。しかし、複数の映像信号を実時間でワープさせるのに膨大な処理コストが必要となる、カメラアレイが事前に校正されている必要があるなどの問題点がある。
【0007】
【発明が解決しようとする課題】
本発明は、上述の問題点に鑑みてなされたものであり、その第1の目的は、簡素な構成・処理で、広範囲の映像を取得・配信すると同時に、所望のシーンの映像を高い解像度で取得・配信することを可能とならしめる映像配信システム並びに該システムの各部の処理を実行させるためのプログラム及び記録媒体を提供しようとするものである。
【0008】
また、本発明の第2の目的は、閲覧者に対し、高い解像度を持つ所望のシーンの映像を一層容易に選択可能とならしめる映像配信システムを提供しようとするものである。
【0009】
また、本発明の第3の目的は、ユーザに面倒な操作を強いることなく、所望のシーンの映像を高い解像度で取得・配信することを可能とならしめる映像配信システムを提供しようとするものである。
【0010】
また、本発明の第4の目的は、取得された広範囲の映像を、更に閲覧者に観察しやすい形で表示することを可能とならしめる映像配信システムを提供しようとするものである。
また、本発明の第5の目的は、更に所望のシーンの映像を高い解像度で漏れなく取得・表示することを可能とならしめる映像配信システムを提供しようとするものである。
【0011】
【課題を解決するための手段】
請求項1に記載の発明は、映像配信システムであって、広角の映像を取得する第一の撮像手段と、互いに異なる所定の領域が複数撮影された映像を同期的に取得する第二の撮像手段と、前記広角の映像と前記第二の撮像手段により取得された各々の映像との対応関係を特定する特定手段と、前記第二の撮像手段により取得された映像の少なくとも一つ、前記広角の映像、及び前記特定手段により特定された対応関係を配信する配信手段とを有し、前記第二の撮像手段は複数のカメラにより構成され、前記複数のカメラは各々識別子が付されており、前記第一の撮像手段は、前記複数のカメラに付された識別子を撮影範囲に含み、前記特定手段は、前記広角の映像において含まれる識別子の撮影位置に基づき、前記対応関係を特定するものである。
【0015】
請求項に記載の発明は、映像配信システムであって、特定手段は、前記広角の映像と前記第二の撮像手段により取得された各々の映像との類似度に基づき、前記対応関係を特定するものである。
【0016】
請求項1、2に記載の発明により、第1撮像部により取得された広角の映像と、第2撮像部により取得された各々の部分映像との対応関係を特定する特定部を備えることにより、閲覧者に対して、高い解像度を持つ所望のシーンの映像を一層容易に選択することが可能となる。
【0017】
請求項に記載の発明は、映像配信システムであって、広角の映像を取得する第一の撮像手段と、互いに異なる所定の領域が複数撮影された映像を同期的に取得する第二の撮像手段と、前記第二の撮像手段により取得された複数の映像より所定の映像を選択する映像選択手段と、前記映像選択手段により選択された所定の映像及び前記広角の映像を配信する配信手段と、音声強度を取得する複数の音声取得手段と、前記複数の音声取得手段により取得された複数の音声強度のうち、音声強度が最大の音声取得手段と、残りの音声取得手段の相対的な強度差とに基づいて音源の位置又は方向を検出する音源検出手段とを有し、前記映像選択手段は、前記音源検出手段により出力された音源の位置若しくは方向に基づいて、前記所定の映像を選択するものである。
【0019】
請求項に記載の発明は、映像配信システムであって、更に、前記広角の映像又は前記第二の撮像手段により取得された複数の映像における被写体の動きを検出する動き検出手段を有し、前記映像選択手段は、前記動き検出手段により出力された被写体の動きに基づいて、前記所定の映像を選択するものである。
【0020】
請求項、4に記載の発明により、音源検出部により出力された音源の位置若しくは方向により、所定の映像を選択する映像選択部を備えることにより、ユーザに面倒な操作を強いることなく、所望のシーンの映像を高い解像度で取得・配信することが可能となる。
【0021】
請求項に記載の発明は、コンピュータに、映像配信システムの各手段に係る処理を実行させることを特徴とするプログラムである。
【0022】
更に、広角の映像を変形する変形部を備えることにより、取得された広範囲の映像を、更に閲覧者に観察しやすい形で表示することが可能となる。
【0023】
また、第2撮像部により取得される各々の映像が、少なくとも一の他の映像と一部の共通する領域を含むことにより、更に所望のシーンの映像を高い解像度で漏れなく取得・表示することが可能となる。
【0024】
請求項5、6に記載の発明により、第1撮像部により取得された広角の映像と、第2撮像部により取得された各々の部分映像との対応関係を特定する特定部を備えることにより、閲覧者に対して、高い解像度を持つ所望のシーンの映像を一層容易に選択することが可能となる。
【0025】
【発明の実施の形態】
まず、映像配信システムがどのように使用されるかの使用例について簡単に概説し、次に、映像配信システムの実施の形態を具体的に説明する。各実施の形態においては、それを構成する要素及びその動作を説明し、最後に処理の流れについて説明する。
【0026】
先ず最初に映像配信システムの使用例について説明する。
【0027】
図1は、本発明を会議場面に設置した使用例を概説する説明図である。映像配信システムは、広角の映像を取得する広角カメラ200と、通常の画角を持つ複数のカメラ401-1から401-4より構成されたカメラアレイ400と、会議中の音声を取得するマイクロフォン501と、広角カメラ200及びカメラアレイ400で取得された映像データ並びにマイクロフォン501により取得された音声データを取り込み、配信するためのサーバ300とを有する。
【0028】
図1に示したように、広角カメラ200は、テーブル1に設置され、会議の参加者(話者)2-1から2-4のいる方向、例えば水平面を見渡す全周囲の画像を一括して撮像する。また、カメラアレイ400を構成する各々のカメラ401-1から401-4は、例えばそれぞれ会議の参加者の前面に置かれ、各参加者の姿を撮影する。これらのカメラ401-1から401-4により取得される映像を、以後「部分映像」と呼ぶ。また、サーバ300はキャビネット3に格納され、広角カメラ200及びカメラアレイ400からの映像データ並びにマイクロフォン501により取得された音声データを取得する。このほかサーバ300は、クライアントからの要求に応じて、電気通信回線を介して、クライアントが持つPC (Personal Computer)やPDA (Personal Digital Assistant)などの端末に対し、取得された上記映像データを配信する(なお、図1では電気通信回線及びクライアントが持つ端末を省略している)。図2は、クライアントが持つPCの映像表示端末における表示画面を示した図である。図2に示すように、カメラアレイ400により取得された少なくとも一の部分映像601及び広角カメラにより取得された映像602が、表示用ウィンドウ600の上に表示される。ここで、映像選択ボタン603を操作すると、サーバ300に対して配信要求する部分映像の選択情報が送信され、サーバ300を介して送られるカメラアレイ400からの映像601が切り替えられる。
【0029】
一方、図3は、本発明を美術館などの会場の様子を映像として配信するシステムに適用した例を概説する説明図である。映像配信システム100は、広角の映像を取得する広角カメラ200と、通常の画角を持つ少なくとも1つのカメラ401-1、401-2より構成されたカメラアレイ400と、広角カメラ200及びカメラアレイ400で取得された映像データを取り込むためのサーバ300とを有する(なお、図3ではサーバ300を省略している)。
【0030】
図3示したように、広角カメラ200は、天井に設置され、会場全体を見渡す全周囲の画像を一括して撮像する。また、カメラアレイ400を構成する各々のカメラ401-1、401-2は、会場内の所々に設置され、例えば館内に展示された各々の絵画の前面を映すために、天井から吊るされた状態で固定される。また、サーバ300は会場内の人目につかない場所に設置され、広角カメラ200及びカメラアレイ400からの映像データを取得する。このほかサーバ300は、クライアントからの要求に応じて、電気通信回線を介して、クライアントが持つ端末に対し、取得された上記映像データを配信する(なお、図には電気通信回線及びクライアントが持つ端末を省略している)。
【0031】
以下の各実施の形態では、本発明の映像配信システムを、会議の撮影及びその映像の配信に適用した場合について説明する。
【0032】
1.実施の形態1
先ず最初に、本発明の実施の形態1について説明する。
【0033】
1.1 構成
図4は、本発明の実施の形態1に係る映像配信システムの構成を示す図である。サーバ300には、USBハブ320及びバス310を介して広角カメラ200と、カメラアレイ400とが接続され、広角の映像データ及びカメラアレイ400により取得された複数の部分映像データが取得される。サーバ300により取得された映像データは、インターネット330を介して配信され、該インターネットに接続されたクライアントPCにおいて表示される。
【0034】
次に、上記各部の構成について説明する。
【0035】
1.1.1 広角カメラ
図5は、実施の形態1に係る、第一の撮像手段としての、広角カメラ200の構成を示す図である。この第一の撮像手段としての広角カメラ200は、所定形状の曲面を有するミラー211と、レンズ212と、絞り213と、CCD(Charge Coupled Device)等の撮像素子214と、上記撮像素子214のタイミング制御、並びに上記撮像素子214により得られた映像信号に対してアナログ−デジタル変換等のデジタル化処理を行う駆動部215と、前記駆動部215により得られたデジタル信号に対してエッジ強調やγ補正等の前処理を行う前処理回路216と、アイリスを制御するために絞り213を駆動するモータ駆動部217とを備えている。
【0036】
ミラー211は、光学系に入射する光を反射させることにより広角の撮影を可能とするためのものであり、ここでは所定形状の曲面有するミラーとして、双曲面ミラーを使用する。図6は、本実施の形態の双曲面ミラー211を用いた場合の光路を説明する図である。また、図7は、本実施の形態の双曲面ミラー211により撮像素子214の表面に結像される広角画像の様子を示した図である。図7に示すように、双曲面ミラー211から反射されて撮像素子214に取り込まれる画像はドーナツ形状となっている(このドーナッツ形状の映像を以後「ドーナッツ映像」と呼ぶ)。該ドーナッツ映像は、前記撮像素子214において結像され、さらに前記駆動部215においてデジタル化され、前処理回路216を介して後述するサーバ300に送出される。なお、図6の中の中心部は、撮像素子214の方向を映し出し、これは重要でない画像情報である。したがって、双曲面ミラー211の頭頂部218を黒く塗りつぶして、黒色情報としてもよい。なお、使用の態様によっては、頭頂部218に基準線を描画し、広角カメラ200の立ち上げの際、モータ駆動部217を駆動することにより、ピント調整などの初期設定に利用してもよい。
【0037】
上記のように、通常のカメラとミラーの組み合わせにより、安価かつ簡素な構成で広角の映像を撮影することができる。
1.1.2 カメラアレイ
カメラアレイ400は少なくとも1つのカメラより構成され、各々のカメラは、前記広角カメラ200の撮影範囲の一部のシーンを、より高い解像度で撮影する。カメラアレイ400を構成するカメラ401は、図1及び図3のようにバラバラに配置されても、図8のように各々のカメラ401-1から401-3を筐体402に固定して配置したものであっても構わない。カメラ401に使用される撮像素子は、CCD、CMOS (Complementary Metal-Oxide Semiconductor)型など様々な種類のものを使用することができる。該撮像素子において結像された映像信号は、カメラ内部でデジタル化された後、後述するサーバ300に送出される。
【0038】
上記の構成を有するカメラ401を少なくとも1つ用意することにより、安価かつ簡素な構成で部分映像を取得することができる。
【0039】
1.1.3 サーバ
図9は、本実施の形態におけるサーバ300の構成例を示した図である。すなわち、映像配信システム100における各種の制御及び処理を行うCPU (Central Processing Unit) 301と、SDRAM (Synchronous Dynamic Random Access Memory) 302と、HDD (Hard Disk Drive) 303と、マウス311等のポインティングデバイス、キーボード312等の各種入力インターフェース(以下I/Fと略す)304と、電源305と、CRT (Cathode Ray Tube)等のディスプレイとを接続するための表示I/F 306と、前記広角カメラ200や前記カメラアレイ400などの外部機器を接続するための外部I/F 307とを、バス313を介して接続することにより構成される。
【0040】
次 に、サーバ300の各構成部について説明する。CPU 301は、HDD 303に格納された所定のプログラムにしたがって、広角カメラ200及びカメラアレイ400からの映像取得、取得された映像の配信などの各種処理及び制御を行う。SDRAM 302は、CPU 301の作業領域として利用されるとともに、HDD 303に格納された各処理プログラムや、Windows (登録商標) NT Server (米国Microsoft社の登録商標)などのOS (Operating System)の記憶領域として利用される。
【0041】
外部I/F307の一例として各種I/Fボード、USB (Universal Serial Bus)、IEEE 1394、或いはIrDA、Bluetooth等の無線I/Fが挙げられる。前記広角の映像データ及び前記カメラアレイ400により取得される複数の部分映像データは、前記広角カメラ200及びカメラアレイ400をUSB2.0のような高速シリアルインターフェース経由でサーバ300に接続することにより、同期的に取得することが可能である。
【0042】
1.2 動作
図10は、図4に示された本実施の形態に係る映像配信システムを、機能別のブロック図に書き直した図である。以下において、図10に示された各部の動作を具体的に説明する。
【0043】
1.2.1 第1撮像部
第1撮像部31は、上記の1.1.1に記載した広角カメラ200により構成され、取得され且つデジタル化された広角の映像データを出力する動作を行う。
【0044】
1.2.2 第2撮像部
第2撮像部32は、上記の1.1.2に記載されたカメラアレイ400により構成され、取得され且つデジタル化された部分映像データを出力する動作を行う。
【0045】
1.2.3 変形部
図11は、実施の形態1における変形部33の動作を説明する図である。変形部33は、第1撮像部31により取得された広角の映像データを、図11に示すように、通常のカメラで捉えた透視変換像に近い映像 (以下パノラマ映像と呼ぶ)に変形する。一般に、広角の範囲を撮影可能なカメラによって得られる映像は、上述したように、人間の眼で確認できる像の形状と異なり、大きな歪みが含まれるために、後に閲覧するときの便宜を図るために変形処理を施すと好適である。以下、文献 (A.M.Bruckstein and T.J.Richardson: “Omniview Cameras with Curved Surface Mirrors”, Proc. of the IEEE Workshop on Omnidirectional Vision 2000, pp.79-84) に記載された方法を参考に、広角の映像データ(図7に示したドーナッツ映像を)をパノラマ映像に変形する方法を説明する。
【0046】
図12は、双曲面ミラーを使用したカメラにおける映像の変形原理を説明するための図である。また図12 (a)は、変形部33の動作例を示し、ドーナッツ映像を、横軸を方位角とし且つ縦軸を仰角とする円柱面に映されたパノラマ映像に座標変換する。また 図12(b)は、広角カメラ200の幾何的構造を示す図であり、図12(b)の中のカメラの光学系は中心射影モデルである。ここで、図中の各変数の意味は、下記の通りである。
(u, v):ドーナッツ映像における座標
(u0, v0):ドーナッツ映像における双曲面ミラーの中心の座標
(θ, φ):パノラマ映像における座標
r: (u0, v0)から(u, v)への画素単位の距離
rmax:ドーナッツ映像における双曲面ミラーの画素単位の半径
θ:方位角
φ:仰角
ψ:カメラの光軸からの頂角
F:双曲面ミラーの焦点
F’:双曲面ミラーと対をなす双曲面の焦点、カメラの光学中心に一致する。
【0047】
このとき、頂角ψと仰角φとの間に、以下の関係が成立する。
【0048】
【数1】
Figure 0004373645
ここで、
【0049】
【数2】
Figure 0004373645
である。また、φminはドーナッツ映像上の半径rmaxの位置に対応する仰角φの値であり、これはカメラの仰角方向の撮影限界値を表す。rmaxとφminの値は一般に容易に知ることができる。
以下、変形の手順を説明する。
(i) 点(u, v)に対応する極座標 (r, θ)を、次式を解くことにより求める。
【0050】
【数3】
Figure 0004373645
(ii) (3)式により算出されたrに対応する頂角ψを次式により求める。
【0051】
【数4】
Figure 0004373645
ここで、
【0052】
【数5】
Figure 0004373645
であり、ψmaxはドーナッツ映像上の半径rmaxの位置及び仰角φminに対応する頂角ψの値である。ψmaxの値は、(1)式にφminを代入することにより求めることができる。
【0053】
(iii) (4)式により算出されたψに対応する仰角φを、(1)式により求める。
【0054】
以上の手順により、双曲面ミラーにより撮影されたドーナッツ映像における任意の点(u, v)を、パノラマ映像における点(θ, φ)に座標変換することができる。すなわち、ドーナッツ映像がパノラマ映像に変形される。
【0055】
図13は、変形部33で使用される座標変換テーブルを説明する図である。撮影からパノラマ映像の配信を一時に行う場合、上記の変形処理に要する計算時間が問題となるため、図13のように、上記の手順に基づいた座標変換テーブルを予め作成しておくと好適である。図13の座標変換テーブルにおいては、各点(θ, φ)に対応するドーナッツ映像の座標(u, v)を格納しておく。
【0056】
以上の変形処理は、前記サーバ300内の前記CPU 301により実行される。このとき、前記HDD 303には該変形処理を施すための所定のプログラムを予め格納しておく。
【0057】
1.2.4 エンコード部
図10のエンコード部34は、図10の前記第2撮像部32により取得された部分映像データの少なくとも一つと、前記変形部33により出力されたパノラマ映像データを、映像配信に適した形式にエンコードする。ここで、映像配信に適した形式として、RealNetworks社から提供されているRealVideoを使用した場合の動作を説明する。同社より提供されているRealProducerというエンコードプログラムにより、取得された映像データからRealVideo形式へのエンコードを実行する。RealProducerは、映像データの取得が継続している限り常に映像や音声をエンコードし続け、エンコードされたデータを連続して配信部35に送信する。以上のエンコード処理は、前記サーバ300内の前記CPU 301により実行される。このとき、前記HDD 303にRealProducerを予めインストールしておく。
【0058】
1.2.5 配信部
配信部35は、クライアントが持つ映像表示端末からの要求に応じて、前記エンコード部34によりエンコードされた広角の映像データと、少なくとも一つの部分映像データを、インターネットを介して配信する。ここで、映像配信を実行するものとして、RealNetworks社から提供されているRealServerというプログラムを使用した場合の動作の一例を説明する。
【0059】
クライアントはサーバ300に対して、要求対象である部分映像データを、インターネット経由で指示する。ここで、要求対象である部分映像データの選択は、図2の映像選択ボタン603を操作することにより行われる。また、インターネットによる通信は、TCP (Transport Control Protocol)接続、また映像表示端末とサーバ300との通信はHTTP (HyperText Transfer Protocol)やRTSPを通じて行われる。
【0060】
クライアントからの要求を受け取ると、サーバ300は該要求に従って、広角の映像データと所定の部分映像データを、インターネット経由で送信する。このとき、UDP (User Datagram Protocol)接続によりインターネットによる通信を行い、またRDT (Real Data Transport)を通じて映像データの送信を実行する。
【0061】
以上の動作により、映像表示端末に配信された映像データは、クライアントが持つ映像表示プログラム (例えばRealNetworks社から提供されているRealPlayer)により表示される。
【0062】
2.実施の形態2
また、一方向に曲率をもった曲面ミラーを、広角カメラ200に使用することもできる。
【0063】
2.1 構成
実施の形態2の構成は、上述の実施の形態1と同様に、図4に示されている。
【0064】
以下、本実施の形態における広角カメラ200の構成について説明する。なお、サーバ300及びカメラアレイ400の構成も、実施の形態1で説明した通りであるので、説明を省略する。
【0065】
2.1.1 広角カメラ
図14は、本実施の形態における広角カメラ200の構成を示した図である。図14に示すように、広角カメラ200は、通常の画角を有するカメラ219と一方向に曲率をもったミラー211とにより構成されており、全方位を撮影することはできないが、広い範囲のシーンを撮影することができる。図15は、該ミラー211を使用したときのカメラ219に映される広角画像の様子を示した図であり、カメラ219の背後のシーンを撮影することができる。図15に示したように、取り込まれる画像は、入射光の水平方向の角度と、撮影される画像の位置の横方向の座標が比例した状態で、横方向に圧縮された形状となっている。また、カメラ219自身の画像への写り込みを低減するように改良することも可能である。
【0066】
上記のように、通常のカメラとミラーの組み合わせにより、安価かつ簡素な構成で広角の映像を撮影することができる。
【0067】
2.2 動作
本実施の形態における機能別のブロック図は、上述の実施の形態1と同様に、図10に示されている。以下において、図10に示された各部の動作を具体的に説明する。なお、第1撮像部31、第2撮像部32、及び配信部35の動作は、上述の実施の形態1と同様であるので、説明を省略する。
【0068】
2.2.1 変形部
本発明の実施の形態2においては、広角カメラ200により取得された映像データを、横方向に一様に引き伸ばすだけでパノラマ映像を得ることが可能である。双曲面ミラーを使用した場合と同様に、図13に示すような座標変換テーブルを作成し、パノラマ映像の各点に対応する変形前の映像の座標(u, v)を格納するようにすればよい。
【0069】
また、この広角カメラ200を使用した場合、映像配信システム100に変形部33を設けなくとも、映像を表示するクライアント側でパノラマ映像を表示することが可能である。今、横 (水平)方向の撮影範囲が180度、縦 (鉛直)方向の撮影範囲が60度であり、サイズが352×240画素の映像が、該広角カメラ200により取得されているとする。この場合、横方向の長さを3倍、すなわち1056画素に引き伸ばすことによりパノラマ映像を得ることができる。また、サーバ300のマシン名を”vidserv”、映像配信システムから配信される広角の映像データ名を”movie.rm” (後述するRealVideoというデータ形式)、及び映像表示端末とサーバ300との通信に使用されるプロトコルをRTSP (Real Time Streaming Protocol)とする。このとき、該引き伸ばし処理を実行する処理は、図16に示すように、W3C (World Wide Web Consortium)によって勧告されたSMIL (Synchronized Multimedia Integrated Language)を用いて記述することができる。図16に示すように、<region>タグにおいて指定された表示領域の大きさと、関連付けられる映像データ”movie.rm”の画像サイズが異なる場合、fit属性を"fill"と指定することにより、表示領域のサイズに合わせて、映像データが拡大縮小表示される。すなわち、映像データに対して所望の拡大率を有する表示領域を指定し、かつ属性値を上記のように指定することにより、パノラマ映像を表示することができる。以上の変形処理は、クライアントが持つ映像表示端末において、映像の表示と同時に実行される。すなわち、サーバ300が変形処理を実行する必要がないので、小さい処理コストで広角の映像データを配信することが可能となる。
【0070】
2.2.2 エンコード部
エンコード部34の動作は、上述の実施の形態1と同様であり、前記第2撮像部32により取得された部分映像データの少なくとも一つ及び前記変形部33により出力されたパノラマ映像データを、それぞれ映像配信に適した形式にエンコードする。
【0071】
なお、変形部33が存在しない場合、エンコード部34は、前記変形部33により変形された広角の映像データの代わりに、前記第1撮像部31により取得された広角の映像データをエンコードする。
【0072】
3.実施の形態3
本発明の実施の形態3は、前記広角カメラ200により取得された広角の映像データと、前記カメラアレイ400により取得された各々の部分映像データとの対応関係を特定する映像配信システムに関するものである。ここでいう「対応関係」の例として、以下のものが挙げられる。
・広角カメラ200とカメラアレイ400を構成する各々のカメラ401との位置関係
・広角の映像データと各々の部分映像データとの位置関係
上記の対応関係が不明である場合、クライアントにとっては、図2の映像選択ボタン603の操作により、部分映像の配信の切り替えを要求しても、所望の部分映像データがサーバ300より配信される保証はない。この問題を解消するために、映像選択ボタン603の左向き矢印ボタンを順に押すと、配信される部分映像データが半時計回りに切り替わるように、カメラアレイ400を設置するなどの対策が考えられる。しかし、部分映像の切り替え順序と、カメラの配置順序を対応させなくてはならないため、映像配信システム100の設置作業が面倒になるという問題点がある。
【0073】
図17は、クライアントが持つ映像表示端末において、上記の対応関係を利用した表示画面の一例を示す図である。図において、広角の映像602の下側にバー604が設置され、現在表示されている部分映像601に対応する撮影範囲が、黒色のバー605で示されている。また、現在表示されている部分映像601以外の部分映像の撮影範囲が、それぞれ灰色のバー606で示されている。ここで、クライアントは、マウス (図示せず)を操作することによりカーソル607を動かし、所定の部分映像を示す灰色のバー606の上をクリックすると、サーバ300に対して配信要求する部分映像の選択情報が送信され、サーバ300を介して送られるカメラアレイ400からの部分映像601が、該当する部分映像に切り替えられる。このように、上記の対応関係が特定されることにより、映像配信システム100の設置作業が楽になる。また、クライアントは一層容易に所望の映像を選択することができると共に、配信された映像から、撮影対象となるシーンをより深く理解することができる。
【0074】
本発明の実施の形態3は、このような動作を実現するための映像配信システムに関するものである。
【0075】
3.1 構成
前述の実施の形態1と同様に、本発明の実施の形態3の構成は、図4乃至図9に示されている。
【0076】
3.2 動作
図18は、本発明の実施の形態3に係る映像配信システムを、機能別のブロックで示した図であり、図10に示された前述の実施の形態1のブロック図に更に加えて、特定部36を追加したものである。以下に、図18に示された各部の動作を具体的に説明する。なお、第1撮像部31、第2撮像部32、変形部33、及びエンコード部34の動作は、前述の実施の形態1と同様であるので、説明を省略する。
【0077】
3.2.1 特定部
特定部36は、前記広角カメラ200により取得された広角の映像データと、前記カメラアレイ400により取得された各々の部分映像データとの対応関係を特定する動作を行う。この動作を、以下に説明する。
【0078】
(1) カメラアレイ400を構成する各カメラ401に付された識別子を利用する方法
図19は、特定部36の別の動作例を示す図である。 図19(a)に示すように、カメラアレイ400を構成する各カメラ401に識別子403を付し、該カメラ401を前記広角カメラ200で捕捉できる位置にそれぞれ配置する。この状態で、前記広角カメラ200により取得される映像データは、図19 (b)のようになる。この映像データにおいて、前記識別子403が映されている画像座標を検出することにより、広角カメラ200と各々のカメラ401との位置関係を特定することができる。ここで、前記識別子403には、
・算用数字を付したシール、
・バーコード、
・カラーコード、
・2次元バーコード、
などを使用することが可能であり、これらの識別子を映像データから読み取る動作は、パターン認識の分野で既に周知技術となっている。
(2) 広角カメラ200及びカメラアレイ400により取得された映像データを利用する方法
図20は、特定部36の別の動作例を示す図である。本動作例においては、広角の映像データと各々の部分映像データとの類似度が高い部分を検出する。
【0079】
ここで、前記類似度の高い部分を検出する手段として、テンプレートマッチングを利用した場合の動作を説明する。まず、 図20(a)のように、カメラアレイ400により取得される各々の部分映像より、( 2DX + 1 )×( 2DY + 1 )の大きさのテンプレート608を生成する。次に、 Z20(b)のように、該テンプレート608を広角の映像602上で移動させ、テンプレート608と広角の映像602における点(m, n)との正規化相互相関値Sを、次式に基づき計算する。
【0080】
【数6】
Figure 0004373645
ここで、(6)式における各記号の意味は以下の通りである。
・I1(x, y):テンプレート上の点(x, y)における濃度
・I2(x, y):広角の映像上の点(x, y)における濃度
以上の計算に基づき、正規化相互相関値Sが最大となる広角の映像602における点(m, n)を求め、該点の位置に対応するカメラ401を特定すればよい。以上の動作を、全ての部分映像に対して実行することにより、広角カメラ200と各々のカメラ401との位置関係を特定することができる。
【0081】
なお、濃度の相互相関に基づいて、映像の類似度を求めると述べたが、これはあくまでも一例である。映像の色空間や輪郭など、別の特徴に基づいて映像の類似度を求めても構わない。
【0082】
(3) 手動で特定する方法
図21は、本実施の形態3におけるサーバ300の表示画面を示す図である。この表示画面は、映像配信システム100を起動し、映像の配信を開始する直前に出現する。その後ユーザは、まず映像選択ボタン603を操作することにより、表示される部分映像601を切り替える。すると、現在表示されている部分映像601と広角の映像602との位置関係を手動入力するよう促すメッセージ609が、該表示画面において提示される。この時ユーザは、マウス (図示せず)を操作してカーソル607を動かし、広角の映像602の上の所定の点をクリックすることにより、該位置関係を手動入力する。手動入力が完了すると、広角の映像602において、その部分映像601に対応する位置に十字形状のポインタ610が付される。以上の動作を、全ての部分映像に対して実行することにより、広角の映像602と各々の部分映像301との位置関係を特定することができる。
【0083】
この方法は、映像配信の開始から終了に至るまで、広角カメラ200及びカメラアレイ400の配置位置が不変である場合に、特に大きな効果を奏する。これに対して、上記(1)乃至(2)の方法は、途中でカメラ401の配置位置を変更しても有効である。
【0084】
以上の処理は、前記サーバ300内の前記CPU 301により実行される。このとき、前記HDD 303には該特定処理を施すための所定のプログラムを予め格納しておく。
【0085】
3.2.3 配信部
配信部35は、クライアントが持つ映像表示端末からの要求に応じて、前記エンコード部34によりエンコードされた広角の映像データ及び少なくとも一つの部分映像データを、インターネットを介して配信する。このとき、映像データのみならず、前記特定部36が特定した対応関係を併せて、クライアントに配信すると、映像表示端末において、図17に示されている表示画面を提示することが可能となるので好適である。映像配信の動作については、前述の実施の形態1と同様である。
【0086】
4.実施の形態4
本発明の実施の形態4は、前記カメラアレイ400により取得された各々の部分映像データを自動的に選択する映像配信システムに関するものである。
【0087】
実施の形態1乃至実施の形態3は、クライアントが配信を要求する部分映像を選択するものであった。しかし、部分映像を毎回手動で選択するのは面倒である。
【0088】
図22は、クライアントが持つ映像表示端末において、表示される部分映像601が自動的に選択される表示画面を示す図である。図のように、「AUTO」と書かれたチェックボックス611をチェックすると、部分映像601を自動的に選択して配信するモードに切り替えられる。これに対し、サーバ300は、発言者などの重要なシーンが映された部分映像を自動的に選択して、広角の映像と共にクライアントに配信する。これにより、クライアントは面倒な操作無しに、配信された映像から、撮影対象となるシーンをより深く理解することができる。
【0089】
本実施の形態4は、このような動作を実現するための映像配信システムに関するものである。
【0090】
4.1 構成
図23に本発明の実施の形態4に係る映像配信システムの構成を示す。サーバ300には広角カメラ200と、カメラアレイ400と、マイクアレイ500とが接続され、広角の映像データ及び複数の部分映像データ及び複数の音声データが取得される。サーバ300により取得された映像データは、インターネットを介して配信され、該インターネットに接続されたクライアントPCにおいて表示される。また、サーバ300により取得された音声データは、後述する映像選択のために使用されるほか、必要に応じてインターネットを介して配信され、該インターネットに接続されたクライアントPCにおいて再生される。
【0091】
次に、上記各部の構成について説明する。なお、広角カメラ200、カメラアレイ400、及びサーバ300の構成は、実施の形態1と同様であるので、説明を省略する。
【0092】
4.1.1 マイクアレイ
マイクアレイ500は、少なくとも2つのマイクロフォン501-1、501-2より構成される。使用されるマイクロフォン501-1、501-2は、圧電型、容量型 (いわゆるコンデンサマイクロフォン)など様々な種類のものを使用することができる。各々のマイクロフォン501-1、501-2は、カメラ401と同様に、別々に離れて配置されたものであっても、各々のマイクロフォン501-1、501-2を共通の筐体に固定して配置したものであっても構わない。図24は、実施の形態4における広角カメラ200及びマイクアレイ500の構成を説明する図であり、このように、広角カメラ200とマイクアレイ500とを1つの筐体に一体化してもよい。図24に示したように、広角カメラ200を構成するカメラ部201の撮像素子214と、マイクアレイ500を構成するマイクロフォン501-1、501-2とは、台座202に配置されている。
【0093】
該マイクロフォン501-1、501-2において取得された音声信号は、マイクロフォン内部でデジタル化された後、サーバ300に送出される。カメラアレイ400と同様に、マイクアレイ500をサーバ300の外部I/F 307、具体的にはUSB2.0のような高速シリアルインターフェースを経由して接続することにより、部分映像と音声とを同期的に取得することが可能である。
【0094】
4.2 動作
図25は、本実施の形態4に係る映像配信システムの、機能別のブロックを示す図である。図18に示された実施の形態3のブロック図に加えて、音声取得部37、音源検出部38、及び映像選択部39を追加したものである。以下において、図25に示された各部の動作を具体的に説明する。なお、第1撮像部31、第2撮像部32、変形部33、及び特定部36の動作は、前述の実施の形態と同様であるので、説明を省略する。
【0095】
4.2.1 音声取得部
音声取得部37の構成・動作は、前述の4.1.1に記載されたカメラアレイ400により取得され、デジタル化された音声データを出力するものである。
【0096】
4.2.2 音源検出部
音源検出部38は、前記音声取得部37により取得された音声データに基づき、発言者のいる位置又は方向を検出するものである。その動作例を、以下において説明する。
【0097】
(1) マイクアレイ500に入力される音声の到達時間差による方法
本方法は、複数のマイクロフォン501が、ある筐体の既知の位置に固定された場合に有効である。図26は、本発明の実施の形態4の音源検出部38の動作原理を説明するための図である。図26に示すように、2つのマイクロフォン501-1、501-2(それぞれマイク1、マイク2と便宜的に称することとする)が間隔lだけ離れて並んでおり、音声がθ方向から入射する場合、マイク1が出力する音声データs1(t)と、マイク1が出力する音声データs1(t)との関係は、
【0098】
【数7】
Figure 0004373645
v:音速
となり、マイク1の音声データがマイク2の音声データに対して
【0099】
【外1】
Figure 0004373645
だけ時間が進んでいることとなる。この原理を利用して、話者の音声の方向を特定する手順を説明する。
【0100】
まず、マイク1とマイク2の音声データの到達時間差を検出する。この到達時間差は、例えばマイク1の音声データs1(t)とマイク2の音声データs2(t+dt)との相互相関値により計算される。ここで、相互相関値C (t, dt)は、次式により算出される。
【0101】
【数8】
Figure 0004373645
ここで、Nは相関窓の大きさを示す正の整数であり、(8)式は時刻t以前のN個のサンプルを用いて積和演算が行われることを示す。このとき、C (t, dt)を最大化するdtが到達時間差となる。
【0102】
次に、マイクの間隔l、到達時間差dt及び音速vを用いて、音声とマイクロフォンの基線とがなす角θを計算する。
【0103】
【数9】
Figure 0004373645
ここで、θの値域は0 °以上180°以下とする。
【0104】
なお、以上の手順のみでは、マイクロフォン501-1、501-2の前側の180°の範囲しか方向が検出されず、音源方向が特定されない。すなわち、音源検出部38が出力する角度θは、実際には音声の到達方向と2つのマイク間の基線とがなす角度であり、実際の音声の方向は図27に示すように、2つのマイクの中点を頂点とする頂角θの円錐の側面上のいずれかに存在している。
【0105】
この問題を解消するために、マイク1とマイク2より構成される組と平行でない別のマイクロフォンの組を用いて補正を行う。図28は、4つのマイクロフォン501-1、501-2、501-3、501-4を2組に分けて音源方向を検出する場合の組分けの様子を示した説明図である。図28示したように、組分けは、あるマイクロフォン501-1と501-3(例えばマイク1(マイク3))と、そのマイクロフォンと最も距離の離れたマイクロフォン501-2と501-4(マイク2(マイク4))とを組み合わせる。
【0106】
最も距離の離れた2つのマイクの組を用いることで、音声の到達時間差が最大となり、方向検知の精度が向上する。なお、ここでは、マイクアレイ500には4つのマイクロフォン501-1、501-2、501-3、501-4が備わっているが、3つのマイクロフォンによっても、音源方向を精度良く検出できる。図29は、3つのマイクロフォン501-1、501-2、501-3によってマイクアレイ500が構成される場合のマイクロフォンの組の採り方を説明する説明図である。図示したように、マイクロフォンを正三角形に配置することにより、どのマイクの組を採用しても、精度良く音源方向を検出することができるようになる。なお、図29に示した例では、第1の組と第2の組を採用して全方向の音源を検出できるが、補完的に第3の組を使用してもよい。
【0107】
(2) 指向性マイクアレイによる方法
また、限られた範囲の音声のみを入力可能な指向性マイクロフォンを利用することにより、発言者の方向を検出することも可能である。図30は、本実施の形態4におけるマイクアレイ500と音源方向との関係を説明する説明図である。このマイクアレイ500は、指向性を有するマイクロフォン501-1、501-2、501-3、501-4を4つ有し、その音声の強度に基づいて音源方向を決定する。便宜的に4つのマイクロフォン501-1、501-2、501-3、501-4をマイク1〜4とする。
【0108】
今、音声強度が、マイク1で20 、マイク2で30、マイク3で20,マイク4で5という数値であったとする。この場合はマイク2 の方向に音源があると判断する。マイク1とマイク3の強度を比較するといずれも同じ値20であるので、最終的に音源方向はマイク2の方向(図でθ=45°と示した方向)と決定する
図31は、実施の形態4における音源検出部38の動作の別の例を説明する図である。音声強度がマイク1で15、マイク2で30、マイク3で25、マイク4で5であったとする。この場合はマイク2の方向に音源があると初期判断する。マイク1とマイク3の強度を比較すると、マイク3の強度がマイク1より大きいので、音源方向をマイク2方向からマイク3 方向に若干量移動させた方向(図でθ=30°と示した方向)と決定する。この方向の移動量は指向性マイクの特性にしたがって予め決定しておけばよい。
【0109】
以上で説明した音源検出部38の機能は、サーバ300におけるCPU 301により実行される。このとき、前記HDD 303には該機能を実現するための所定のプログラムが予め格納されている。
【0110】
4.2.3 映像選択部
映像選択部39は、前記特定部36により特定された対応関係と、前記音源検出部38により検出された発言者の位置又は方向とを用いて、クライアントに配信する部分映像を自動的に選択するものである。
【0111】
図32は、実施の形態4における映像選択部39の動作の一例を示す図であり、A〜Fの6人の参加者2がテーブル1を囲んで会議を開いている様子を上から眺めたものである。テーブル1の上には、広角カメラ200及びマイクアレイ500が設置されており、また参加者毎にカメラ401(図示せず)が1台設置されている。今、音源検出部38が検出した音源の方向が、図における矢印381のようであったとする。このとき、映像選択部39は、該音源の方向と、前記特定部36により特定された広角カメラ200と各カメラ401との対応関係に基づき、該音源の方向に対し最も近くに配置されたカメラ401を選択する。すなわち、図においては、参加者Eを撮影しているカメラ401を選択する。
【0112】
以上で説明した映像選択部39の機能は、サーバ300におけるCPU 301により実現させることができる。このとき、前記HDD 303には該機能を実現するための所定のプログラムを予め格納しておく。
【0113】
4.2.4 エンコード部
エンコード部34の動作は、前記映像選択部39により選択された部分映像データ及び前記変形部33により出力されたパノラマ映像データを、それぞれ映像配信に適した形式にエンコードする。エンコード動作については、前述の実施の形態1と同様である。
【0114】
なお、変形部33が存在しない場合には、エンコード部34は、前記変形部33により変形された広角の映像データの代わりに、前記第1撮像部31により取得された広角の映像データをエンコードする。
【0115】
4.2.5 配信部
配信部35は、前記エンコード部34によりエンコードされた広角の映像データ及び部分映像データを、インターネットを介して配信する。このとき、映像データのみならず、前記特定部36が特定した対応関係及び前記映像選択部39が選択した部分映像の撮影範囲を併せて、クライアントに配信すると、映像表示端末において、図22に示された表示画面を提示することが可能となるので好適である。映像配信の動作については、前述の実施の形態1と同様である。
【0116】
5. 実施の形態5
本発明の実施の形態5は、前述の実施の形態4と同様に、前記カメラアレイ400により取得された各々の部分映像データを自動的に選択する映像配信システムに関するものであり、カメラアレイ400を構成する各々のカメラ401と、マイクアレイ500を構成する各々のマイクロフォン501とを、1対1の対応関係となるよう構成したものである。ここでは「1対1の対応関係」を、「個々のカメラ401に対し、略一致する位置又は方角に配置されたマイクロフォン501が1つあること」と定義する。
【0117】
5.1 構成
本実施の形態における映像配信システム100の構成は、前述の実施の形態4と同様に、図23に示されている。
【0118】
次に、上図の各部の構成について説明する。なお、広角カメラ200及びサーバ300の構成は、前述の実施の形態1と同様であるので、説明を省略する。
【0119】
5.1.1 カメラアレイ及びマイクアレイ
図33は、本発明の実施の形態5におけるカメラ401及びマイクロフォン501の外観を示す図である。図示したように、カメラ401とマイクロフォン501とは、共通の筐体502に一体化した構造となっている。また、マイクロフォン501は指向性を有し、限られた範囲の音声のみを入力可能である。この一体化されたカメラ401及びマイクロフォン501を、参加者につき1台設置する。
【0120】
5.2 動作
図34は、本発明の実施の形態5に係る映像配信システムを、機能別のブロック図に書き直した図であり、図25に示された実施の形態4のブロック図から音源検出部38を削除し、また特定部36から映像選択部39への接続を削除したものである。第1撮像部31、第2撮像部32、変形部33、エンコード部34、配信部35、特定部36、及び音声取得部37の動作は、前述の実施の形態4と同様である。
【0121】
5.2.1 映像選択部
前述の一体化されたカメラ401及びマイクロフォン501を使用することにより、各々のカメラ401とマイクロフォン501との対応関係が既知である。したがって、映像選択部39は、最も大きな信号振幅が得られたマイクロフォン501に対応するカメラ401により取得された部分映像を選択すると良い。
【0122】
6. 実施の形態6
本実施の形態は、前述の実施の形態4或は5と同様に、前記カメラアレイ400により取得された各々の部分映像データを自動的に選択する映像配信システムに関するものである。
【0123】
6.1 構成
前述の実施の形態1乃至3と同様に、図4乃至図9に示される。
【0124】
6.2 動作
図35は、本発明の実施の形態6に係る映像配信システムを、機能別のブロック図に書き直した図であり、図「18に示された実施の形態3のブロック図に更に加えて、映像選択部39及び動き検出部40を追加したものである。以下において、図35に示された各部の動作を具体的に説明する。なお、第1撮像部31、第2撮像部32、変形部33、エンコード部34、配信部35、及び特定部36の動作は、前述の実施の形態と同様であるので、説明を省略する。
【0125】
6.2.1 動き検出部
動き検出部40は、広角の映像データにおける被写体の動きを検出し、映像中の各部位における動きの特徴量を出力するものである。ここで、「動きの特徴量」とは、被写体の動きの大小を指すものとする。
【0126】
動画における動きの検出は、前の時刻と現在の時刻のフレーム間の差分をとる方法、オプティカルフローによる方法などの周知技術により実現可能である。これらの技術により、広角の映像データにおいて、被写体が動いた位置及びその動きの大小を検出することができる。この動作によれば、本発明を遠隔監視システムとして使用する場合、動いている被写体を捉えたカメラからの部分映像が配信されるため、好適である。
【0127】
また、本実施の形態6に係る映像配信システムが、遠隔会議システムとして使用される場合、参加者の唇の動きを検出することにより、発言者の位置又は方向を自動的に検出すると好適である。唇の動きの検出は、例えば文献 (M.Kass, A.Witkin and D.Terzopoulos: “SNAKES: Active Contour Models”, ICCV, pp.259-268 (1987) )等の周知技術により実現できる。また、実施の形態4乃至5のように、マイクロフォン501が使用できる場合には、音声データに基づく発話区間の抽出結果と併せて唇の動きを検出することにより、発言者の検出精度を向上させることもできる。例えば、当出願人により出願された特開平6-43897公報には、音声データから抽出された音声特徴と、映像データより抽出された顔面の動的視覚特徴とを用いて、会話を認識するシステムが開示されている。この動作により、音声データ中に発話以外の雑音が多く占められる場合でも、一層安定的に発言者の位置又は方向を検出することが可能となる。
【0128】
以上で説明した動き検出部40の機能は、広角カメラ200の内部に実装してもよいし、またサーバ300におけるCPU 301により実現させても構わない。後者の場合、前記HDD 303には該機能を実現するための所定のプログラムを予め格納しておく。
【0129】
6.2.2 映像選択部
本実施の形態6における映像選択部39は、前記特定部36により特定された対応関係と、前記動き検出部40により検出された被写体の動きの特徴量とを用いて、クライアントに配信する部分映像を自動的に選択するものである。映像選択部39は、まず該被写体の動きの特徴量に基づき、広角の映像データにおいて最も大きな動きが検出された画像位置を特定する。次に、特定された画像位置と、前記特定部36により特定された広角カメラ200と各カメラ401との対応関係とに基づき、前述の実施の形態4において説明したのと同様の手順により、該位置に対し最も近くに配置されたカメラ401を選択する。これにより、最も大きな動きが検出された被写体を撮影した部分映像を自動的に選択することができる。
【0130】
以上で説明した映像選択部39の機能は、サーバ300におけるCPU 301により実行される。このとき、前記HDD 303には該機能を実現するための所定のプログラムを予め格納しておく。
【0131】
7. 実施の形態7
また、上述の実施の形態6においては、広角の映像において被写体の動きを検出したが、前記カメラアレイ400により取得された各々の部分映像データにおいて、被写体の動きを検出してもよい。
【0132】
7.1 構成
本発明の実施の形態7の構成は、前述の実施の形態1乃至3と同様に、図4乃至図9に示される。
【0133】
7.2 動作
図36は、本発明の実施の形態7に係る映像配信システムの、機能別のブロックを示す図である。以下において、図36に示された各部の動作を具体的に説明する。なお、第1撮像部31、第2撮像部32、変形部33、エンコード部34、及び配信部35の動作は、前述の実施の形態と同様であるので、説明を省略する。
【0134】
7.2.1 動き検出部
本実施の形態7における動き検出部40は、各々の部分映像データにおける被写体の動きを検出し、各部分映像データにおける動きの特徴量を出力するものである。ここで、「動きの特徴量」は、実施の形態6と同様に、被写体の動きの大小を指すものとする。また、各々の部分映像データにおける被写体の動きも、上述の実施の形態6で説明した周知技術により検出する。
【0135】
また、本実施の形態に係る映像配信システムが、遠隔会議システムとして使用される場合、部分映像における参加者の唇の動きを検出することにより、発言者の位置又は方向を自動的に検出すると好適である。この動作も、上述の実施の形態6で説明した周知技術により実現可能である。また、本実施の形態では、カメラ401により各参加者の顔が大きく撮影されるので、上述の実施の形態6に比較して、より安定的に参加者の唇の動きを検出することができる。
【0136】
以上で説明した動き検出部40の機能は、カメラ401の内部に実装してもよいし、またサーバ300におけるCPU 301により実現させても構わない。後者の場合、前記HDD 303には該機能を実現するための所定のプログラムを予め格納しておく。
【0137】
7.2.2 映像選択部
本実施の形態における前記映像選択部39は、前記動き検出部40により検出された、部分映像における被写体の動きに基づき、クライアントに配信する部分映像を自動的に選択するものである。具体的には、各々の部分映像における被写体の動きの特徴量から、最も大きな動きが検出された部分映像を特定し、これをクライアントに配信する部分映像として自動的に選択する。ここで、本実施の形態は、特定部36を必ずしも必要としないので、上述の実施の形態6に比較して、より簡単な構成・処理で適切な部分映像を選択することができる。
【0138】
以上で説明した映像選択部39の機能は、サーバ300におけるCPU 301により実行される。このとき、前記HDD 303には該機能を実現するための所定のプログラムを予め格納しておく。
【0139】
7.3 その他
なお、上述の実施の形態6又は本実施の形態においては、カメラアレイ400を構成する各々のカメラ401が、他のカメラと一部共通する撮影領域を含むと好適である。 図37(a)は、各々のカメラが互いに共通する撮影領域を含まない場合における映像表示端末の画面を示す図である。図37に示すように、参加者Aが席を立って移動している時、前記映像選択部39は、該参加者Aに最も近い撮影領域を含む部分映像(図中、黒色のバー605で示されたもの)を自動的に選択する。しかし、該参加者Aがいずれのカメラ401においても撮影されない場所に移動した場合には、重要な被写体が何も写されていない部分映像が選択されてしまう。このように、移動中の被写体を連続的に追跡して映した部分映像を配信できないという問題が生ずる。
【0140】
そこで、 図37(b)に示すように、各々のカメラが互いに共通する撮影領域を含むよう配置すれば、この問題を解決することができる。図中、斜線で示されたバーは、2つ以上のカメラ401で重複して撮影されている範囲を示す。図8のように、カメラアレイ400を、各々のカメラ401を筐体402に固定して構成する場合には、互いの撮影範囲が一部重複するように各々のカメラ401を固定するとよい。
【0141】
8. 実施の形態8
なお、本発明に係る映像配信システム100は、PCによりその機能を実現させることができる。この場合は上記各部を実現するソフトウェアをハードディスクに格納し、適宜処理プログラムを実行させることによりその機能を実現させることができる。
【0142】
9. 実施の形態9
また、上記プログラムを、CD-ROMのような記録媒体に格納することができる。図38に示されるように、該プログラムを格納したCD-ROM 308をPCに装着し、適宜該プログラムを実行させることによりその機能を実現させることができる。なお、該プログラムを格納する記録媒体としては、上記CD-ROM 308に限られず、例えばDVD-ROM等の別の媒体であってもよいことはいうまでもない。
【0143】
以上の各実施の形態は、本発明のほんの一例を説明したにすぎず、本発明の権利範囲を上記実施の形態の通りに限定・縮小すべきではない。例えば、各実施の形態において、インターネットを通じて映像データを配信すると説明したが、衛星通信や地上波通信などの別の通信回線を使用しても構わない。
【0144】
また、広角カメラ200、カメラアレイ400、及びマイクアレイ500が、USBハブに接続されるという構成例を用いて説明したが、これらの接続形態は上記説明に限定されるものではない。例えば、PCIバス、IEEE 1394、Bluetoothなどの別のインターフェースを使用しても構わない。
【0145】
また、広角カメラ200に使用されるミラー211として、双曲面ミラー及び一方向に曲率をもった曲面ミラーを実施の形態に挙げたが、放物面ミラーや円錐ミラーなど、上記以外の形態であっても構わない。
【0146】
また、第1撮像部31の説明において、広角カメラ200においてデジタル化された映像データを出力すると説明したが、広角カメラ200がアナログの映像信号を出力するものであっても構わない。この場合、該広角カメラ200と、アナログ映像信号に対してデジタル化処理を施すビデオキャプチャボードとを組み合わせることにより、デジタル形式の映像データを出力することができる。すなわち、上記実施の形態で説明した第1撮像部31と同様の動作を実現することができる。
【0147】
また、第2撮像部32の説明において、カメラアレイ400を構成する各々のカメラ401においてデジタル化された部分映像データを出力すると説明したが、これらのカメラ401がそれぞれアナログの映像信号を出力するものであっても構わない。この場合、これらのカメラ401と、多チャンネルのアナログ映像信号に対してデジタル化処理を施すビデオキャプチャボードとを組み合わせることにより、デジタル形式の部分映像データを出力することができる。すなわち、上記実施の形態で説明した第2撮像部32と同様の動作を実現することができる。
【0148】
また、音声取得部37の説明において、マイクアレイ500を構成する各々のマイクロフォン501においてデジタル化された音声データを出力すると説明したが、これらのマイクロフォン501がそれぞれアナログの音声信号を出力するものであっても構わない。この場合、これらのマイクロフォン501と、多チャンネルのアナログ音声信号に対してデジタル化処理を施すオーディオキャプチャボードとを組み合わせることにより、デジタル形式の音声データを出力することができる。すなわち、上記実施の形態で説明した音声取得部37と同様の動作を実現することができる。
【0149】
また、エンコード部34及び配信部35が同一のサーバ300に実装されると説明したが、サーバ300とは別個にエンコード用PCを設置しても構わない。この場合、エンコードされたデータは、電気通信回線を経由して、該エンコード用PCからサーバ300に転送される。
【0150】
また、エンコード部34においては、RealNetworks社により提供されているRealProducerを用いて、映像データをRealVideo形式に変換すると説明したが、エンコード部の構成はこれに限定されない。例えば、Microsoft社により提供されているWindows(登録商標)Media エンコーダというプログラムを用いて、映像データをWindows(登録商標)Media Video形式に変換しても構わない。配信部35に関しても同様であり、RealServerの代わりにWindows(登録商標)Media Serviceなどの別のプログラムを使用しても構わない。
【0151】
また、配信部35の映像配信対象として、クライアントPCを例に挙げて説明したが、PDA (Personal Digital Assistant)や携帯電話などの端末であっても構わない。このとき、Microsoft社より提供されているPDA用のWindows(登録商標)Media Playerを使用すれば、該PDAにおいて、前述のWindows(登録商標)Media Video形式の映像データを再生することができる。
【0152】
また、動き検出部40の動作の説明において、「動きの特徴量」は被写体の動きの大小を指すと述べたが、例えば被写体の移動軌跡の形状など、別のものであっても構わない。
【0153】
【発明の効果】
本発明によれば、第1撮像部31により取得された広角の映像と、第2撮像部32により取得された各々の部分映像との対応関係を特定する特定部36を備えることにより、閲覧者に対して、高い解像度を持つ所望のシーンの映像を一層容易に選択することが可能となる。
【0155】
更に本発明によれば、音源検出部38により出力された音源の位置若しくは方向により、所定の映像を選択する映像選択部39を備えることにより、ユーザに面倒な操作を強いることなく、所望のシーンの映像を高い解像度で取得・配信することが可能となる。
【0156】
更に、広角の映像を変形する変形部33を備えることにより、取得された広範囲の映像を、更に閲覧者に観察しやすい形で表示することが可能となる。
【0157】
更に、第2撮像部32により取得される各々の映像が、少なくとも一の他の映像と一部の共通する領域を含むことにより、更に所望のシーンの映像を高い解像度で漏れなく取得・表示することが可能となる。
【図面の簡単な説明】
【図1】本発明に係る映像配信システムの使用例を示す図である。
【図2】本発明に係る映像表示端末の表示画面の一例を示す図である。
【図3】本発明に係る映像配信システムの別の使用例を示す図である。
【図4】実施の形態1に係る映像配信システムの構成を示す図である。
【図5】実施の形態1に係る広角カメラ200の構成を示す図である。
【図6】実施の形態1に係る広角カメラ200の構造を示す図である。
【図7】図6に示された広角カメラ200により撮影される映像を示す図である。
【図8】実施の形態1に係るカメラアレイ400の一例を示す図である。
【図9】実施の形態1に係るサーバ300の構成を示す図である。
【図10】実施の形態1に係る動作を示すブロック図である。
【図11】実施の形態1における変形部33の動作を説明する図である。
【図12】変形部33における原理を説明する図である。
【図13】変形部33で使用される座標変換テーブルを説明する図である。
【図14】実施の形態2に係る広角カメラ200の構成を示す図である。
【図15】図14に示された広角カメラ200により撮影される映像を示す図である。
【図16】実施の形態2における変形部33の動作を映像表示と同時に実現する例を示す図である。
【図17】実施の形態3に係る映像配信システムを使用した場合の映像表示端末の表示画面の一例を示す図である。
【図18】実施の形態3に係る動作を示すブロック図である。
【図19】実施の形態3に係る特定部36の動作の一例を示す図である。
【図20】実施の形態3に係る特定部36の動作の一例を示す図である。
【図21】実施の形態3に係るサーバ300の表示画面の一例を示す図である。
【図22】実施の形態4に係る映像配信システムを使用した場合の映像表示端末の表示画面の一例を示す図である。
【図23】実施の形態4に係る映像配信システムの構成を示す図である。
【図24】実施の形態4における広角カメラ200及びマイクアレイ500の構成を説明する図である。
【図25】実施の形態4に係る動作を示すブロック図である。
【図26】実施の形態4における音源検出部38の動作原理を説明する図である。
【図27】実施の形態4における音源検出部38の問題を説明する図である。
【図28】実施の形態4におけるマイクロフォン501の配置例を説明する図である。
【図29】実施の形態4におけるマイクロフォン501の別の配置例を説明する図である。
【図30】実施の形態4における音源検出部38の動作を説明する図である。
【図31】実施の形態4における音源検出部38の動作を説明する図である。
【図32】実施の形態4における映像選択部39の動作を説明する図である。
【図33】実施の形態5におけるカメラ401の構成を示す図である。
【図34】実施の形態5に係る動作を示すブロック図である。
【図35】実施の形態6に係る動作を示すブロック図である。
【図36】実施の形態7に係る動作を示すブロック図である。
【図37】実施の形態6及び7に係る映像配信システムを使用した場合の問題を示す図である。
【図38】実施の形態9に係る構成例を示す図である。
【符号の説明】
1 テーブル
2 参加者
3 キャビネット
31 第1撮像部
32 第2撮像部
33 変形部
34 エンコード部
35 配信部
36 特定部
37 音声取得部
38 音源検出部
39 映像選択部
40 動き検出部
200 広角カメラ
211 ミラー
212 レンズ
213 絞り
214 撮像素子
215 駆動部
216 前処理回路
217 モータ駆動部
300 サーバ
310 バス
320 USBハブ
330 インターネット
350 クライアントPC
400 カメラアレイ
401−1から401−4 カメラ
500 マイクアレイ
501 マイクロフォン
600 表示用ウィンドウ

Claims (6)

  1. 広角の映像を取得する第一の撮像手段と、
    互いに異なる所定の領域が複数撮影された映像を同期的に取得する第二の撮像手段と、
    前記広角の映像と前記第二の撮像手段により取得された各々の映像との対応関係を特定する特定手段と、
    前記第二の撮像手段により取得された映像の少なくとも一つ、前記広角の映像、及び前記特定手段により特定された対応関係を配信する配信手段とを有し、
    前記第二の撮像手段は複数のカメラにより構成され、前記複数のカメラは各々識別子が付されており、
    前記第一の撮像手段は、前記複数のカメラに付された識別子を撮影範囲に含み、
    前記特定手段は、前記広角の映像において含まれる識別子の撮影位置に基づき、前記対応関係を特定するものであることを特徴とする映像配信システム。
  2. 前記特定手段は、
    前記広角の映像と前記第二の撮像手段により取得された各々の映像との類似度に基づき、前記対応関係を特定するものであることを特徴とする請求項1に記載の映像配信システム。
  3. 広角の映像を取得する第一の撮像手段と、
    互いに異なる所定の領域が複数撮影された映像を同期的に取得する第二の撮像手段と、
    前記第二の撮像手段により取得された複数の映像より所定の映像を選択する映像選択手段と、
    前記映像選択手段により選択された所定の映像及び前記広角の映像を配信する配信手段と、
    音声強度を取得する複数の音声取得手段と、
    前記複数の音声取得手段により取得された複数の音声強度のうち、音声強度が最大の音声取得手段と、残りの音声取得手段の相対的な強度差とに基づいて音源の位置又は方向を検出する音源検出手段とを有し、
    前記映像選択手段は、前記音源検出手段により出力された音源の位置若しくは方向に基づいて、前記所定の映像を選択するものであることを特徴とする映像配信システム。
  4. 更に、前記広角の映像又は前記第二の撮像手段により取得された複数の映像における被写体の動きを検出する動き検出手段を有し、
    前記映像選択手段は、前記動き検出手段により出力された被写体の動きに基づいて、前記所定の映像を選択するものであることを特徴とする請求項3に記載の映像配信システム。
  5. コンピュータに、請求項1乃至の何れか一に記載の映像配信システムの各手段に係る処理を実行させることを特徴とするプログラム。
  6. 請求項1乃至の何れか一に記載の映像配信システムの各手段に係る処理を実行するための、コンピュータ読み取り可能なプログラムソフトウェアを記録することを特徴とする記録媒体。
JP2002160646A 2002-05-31 2002-05-31 映像配信システム、プログラム及び記録媒体 Expired - Fee Related JP4373645B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002160646A JP4373645B2 (ja) 2002-05-31 2002-05-31 映像配信システム、プログラム及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002160646A JP4373645B2 (ja) 2002-05-31 2002-05-31 映像配信システム、プログラム及び記録媒体

Publications (3)

Publication Number Publication Date
JP2004007283A JP2004007283A (ja) 2004-01-08
JP2004007283A5 JP2004007283A5 (ja) 2006-03-16
JP4373645B2 true JP4373645B2 (ja) 2009-11-25

Family

ID=30429987

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002160646A Expired - Fee Related JP4373645B2 (ja) 2002-05-31 2002-05-31 映像配信システム、プログラム及び記録媒体

Country Status (1)

Country Link
JP (1) JP4373645B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006148787A (ja) * 2004-11-24 2006-06-08 Opt Kk 全方位撮影装置
JP4953137B2 (ja) * 2008-07-29 2012-06-13 独立行政法人産業技術総合研究所 全周映像のための表示技術
JP2010192971A (ja) * 2009-02-16 2010-09-02 Nippon Telegr & Teleph Corp <Ntt> 選択領域符号化映像データ配信方法、符号化映像データ復号方法、配信サーバ、再生端末、プログラムおよび記録媒体
JP5949501B2 (ja) * 2012-11-29 2016-07-06 ブラザー工業株式会社 作業補助システムおよびプログラム
JP2017028633A (ja) 2015-07-27 2017-02-02 株式会社リコー 映像配信端末、プログラム、及び、映像配信方法
US10721116B2 (en) 2016-09-30 2020-07-21 Ricoh Company, Ltd. Communication terminal, method for controlling display of image, and non-transitory computer-readable storage medium
US10264302B2 (en) 2016-09-30 2019-04-16 Ricoh Company, Ltd. Communication management apparatus, method and computer-readable storage medium for generating image data identification information
JP6756269B2 (ja) 2017-01-05 2020-09-16 株式会社リコー 通信端末、画像通信システム、通信方法、及びプログラム
JP6805861B2 (ja) 2017-02-09 2020-12-23 株式会社リコー 画像処理装置、画像処理システム、画像処理方法及びプログラム

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0560047U (ja) * 1992-01-24 1993-08-06 株式会社ダイワ デュアル型ビデオカメラ監視装置
JPH0624424A (ja) * 1992-07-02 1994-02-01 Kuwabara Yasunaga 容器向き位置合わせ方法
JPH0918849A (ja) * 1995-07-04 1997-01-17 Matsushita Electric Ind Co Ltd 撮影装置
JPH0998406A (ja) * 1995-10-02 1997-04-08 Nippon Telegr & Teleph Corp <Ntt> 画像処理システム
JPH1051755A (ja) * 1996-05-30 1998-02-20 Fujitsu Ltd テレビ会議端末の画面表示制御装置
JPH10136246A (ja) * 1996-10-25 1998-05-22 Canon Inc カメラ制御システム、及び該システムにおけるカメラ管理装置及び方法、及びカメラ操作装置及び方法、及び記憶媒体
JPH10145763A (ja) * 1996-11-15 1998-05-29 Mitsubishi Electric Corp 会議システム
JPH11261884A (ja) * 1998-03-10 1999-09-24 Hitachi Ltd パノラマ映像放送方法および放送受信装置
JPH11331827A (ja) * 1998-05-12 1999-11-30 Fujitsu Ltd テレビカメラ装置
JP3792901B2 (ja) * 1998-07-08 2006-07-05 キヤノン株式会社 カメラ制御システム及びその制御方法
US6992702B1 (en) * 1999-09-07 2006-01-31 Fuji Xerox Co., Ltd System for controlling video and motion picture cameras
JP2001145096A (ja) * 1999-11-15 2001-05-25 Sony Corp 映像表示形態の制御装置及び映像表示形態の制御方法
JP2001251608A (ja) * 2000-03-07 2001-09-14 Nec Eng Ltd 遠隔監視用カメラシステム

Also Published As

Publication number Publication date
JP2004007283A (ja) 2004-01-08

Similar Documents

Publication Publication Date Title
US11736801B2 (en) Merging webcam signals from multiple cameras
JP4153146B2 (ja) カメラアレイの画像制御方法、及びカメラアレイ
US20040008423A1 (en) Visual teleconferencing apparatus
JP4451892B2 (ja) 映像再生装置、映像再生方法、及び映像再生プログラム
US20100118112A1 (en) Group table top videoconferencing device
JP2007531333A (ja) ひずみのない画像をリアルタイムに表示するパノラマ・ビデオ・システム
EP3278163B1 (en) Depth imaging system
US11076127B1 (en) System and method for automatically framing conversations in a meeting or a video conference
JP2003018561A (ja) 広角画像録画再生システム、会議録画再生システム、広角画像送出装置、会議画像送出装置、広角画像再生装置、会議画像再生装置、広角画像録画再生方法、会議録画再生方法、広角画像送出方法、会議画像送出方法、広角画像再生方法、会議画像再生方法およびプログラム
US20170127020A1 (en) Communication system, communication device, and communication method
JP4736381B2 (ja) 撮像装置及び方法、監視システム、プログラム並びに記録媒体
JP4539015B2 (ja) 画像通信装置、および画像通信方法、並びにコンピュータ・プログラム
TW201734948A (zh) 用於在廣角圖像系統中生成相關的音頻和視覺信號的方法、系統及設備
JP4373645B2 (ja) 映像配信システム、プログラム及び記録媒体
US11477393B2 (en) Detecting and tracking a subject of interest in a teleconference
JP2010081644A (ja) 画像出力装置および画像出力方法
JP2003111041A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
EP4075794A1 (en) Region of interest based adjustment of camera parameters in a teleconferencing environment
JP3954439B2 (ja) 映像記録システム、プログラム及び記録媒体
US11856387B2 (en) Video conferencing system and method thereof
JP2009182980A (ja) 会議画像再生装置および会議画像再生方法
JP2009182979A (ja) 会議画像再生装置および会議画像再生方法
JP2001275096A (ja) 撮像および表示装置並びにテレビ会議装置
TWI846399B (zh) 視訊會議系統及會議畫面顯示方法
US11805231B2 (en) Target tracking method applied to video transmission

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090721

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090817

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090901

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090904

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120911

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130911

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees