WO2023166721A1

WO2023166721A1 - 情報処理装置、情報処理システムおよび情報処理方法

Info

Publication number: WO2023166721A1
Application number: PCT/JP2022/009472
Authority: WO
Inventors: 怜広見; 真一塩津; 好州三木; 明男新井; 庸平掛江
Original assignee: 株式会社デンソーテン
Priority date: 2022-03-04
Filing date: 2022-03-04
Publication date: 2023-09-07
Also published as: JPWO2023166721A1; CN117980047A

Abstract

実施形態に係る情報処理装置は、複数の振動子を備え、入力された信号に応じた振動をユーザに印加する振動デバイスを制御する。情報処理装置は、入力されたコンテンツにおける、振動デバイスに対する音源の方向成分を特定し、方向成分に基づき、振動子のそれぞれの振幅および遅延を制御する。

Description

情報処理装置、情報処理システムおよび情報処理方法

　本発明は、情報処理装置、情報処理システムおよび情報処理方法に関する。

　従来、ＨＭＤ（Head　Mounted　Display）等を用いてユーザに対し、ＶＲ（Virtual　Reality）やＡＲ（Augmented　Reality）、ＭＲ（Mixed　Reality）といった仮想空間体験を含むデジタルコンテンツ、いわゆるＸＲ（Cross　Reality）コンテンツを提供する技術が知られている。ＸＲは、ＶＲ、ＡＲ、ＭＲのほか、ＳＲ（Substitutional　Reality）、ＡＶ（Audio/Visual）等を含むすべての仮想空間技術をまとめた表現である。

　また、例えば、ユーザが視聴する映像に応じた振動をユーザへ与えることで、映像に対する臨場感の向上を図る技術が提案されている（例えば、特許文献１参照）。

　さらに、座面に配置された複数のセル毎の振動を制御し、ユーザに信号を提示する技術が提案されている（例えば、特許文献２参照）。

特開２００４－０８１３５７号公報特開２０２１－１５８３９２号公報

　しかしながら、従来技術では、振動の自然な定位感をユーザに提供することが困難であった。

　図３は、従来の振動の提供方法を示す図である。また、図３は、ユーザが着座するシートの座面をユーザの頭上から鉛直下向きに見た図である。

　図３に示すように、座面には、振動子５１ａ＿ＦＬ（左前）、振動子５１ａ＿ＲＬ（左後）、振動子５１ａ＿ＦＲ（右前）、振動子５１ａ＿ＲＲ（右後）が備えられている。各振動子は制御内容に応じて、つまりコンテンツにおける振動源の位置（ユーザ位置を基準とする位置）に、ユーザが振動の定位感を感じるように出力振動が制御される。

　例えば、コンテンツにおける振動源（振動を発する物体）がユーザの右前方にあるものとすると、振動源の定位感を出すために、各位置の振動子５１の振動強度は、例えば図２３に示すようにＦＬ（左前）は１、ＲＬ（左後）は０、ＦＲ（右前）は８、ＲＲ（右後）は１に制御される。

　この場合、ユーザは、座面の右前が強く振動している感覚を覚えるため、振動源が右前方にあることを認識することができる。

　しかし、このような振動提供方法においては、座面位置における振動強度の違いでユーザは振動源の定位感をある程度は感じるものの、振動が伝搬する感覚をユーザに与える要素はあまり無く、ユーザに振動の定位感をより感じさせる臨場感豊かな振動提供方法が望まれている。

　本発明は、上記に鑑みてなされたものであって、コンテンツ等の再生に際して、臨場感豊かな振動をユーザに提供することを目的とする。

　上述した課題を解決し、目的を達成するために、本発明に係る情報処理装置は、入力されたコンテンツにおける、振動デバイスに対する音源の方向成分を特定し、方向成分に基づき、振動子のそれぞれの振幅および遅延を制御する。

　本発明によれば、振動が伝搬する感覚を与える成分を含む振動を生成でき、より臨場感のある振動をユーザに提供することができる。

図１は、情報処理システムの概要を示す図である。図２は、情報処理システムにおけるデータの流れを示す図である。図３は、振動デバイスの構成例を示す図である。図４は、情報処理方法の概要を示す図である。図５は、情報処理装置のブロック図である。図６は、シーン情報ＤＢの一例を示す図である。図７は、シーン情報ＤＢの一例を示す図である。図８は、シーン情報ＤＢの一例を示す図である。図９は、優先順位情報ＤＢの一例を示す図である。図１０は、パラメータ情報ＤＢの一例を示す図である。図１１は、振動子情報ＤＢの一例を示す図である。図１２は、シーン検出部のブロック図である。図１３は、優先順位設定部のブロック図である。図１４は、優先する対象物の決定方法の例を示す図である。図１５は、パラメータ抽出部のブロック図である。図１６は、出力部のブロック図である。図１７は、振動定位処理方法の例を示す図である。図１８は、信号処理方法の例を示す図である。図１９は、情報処理装置が実行する処理手順を示すフローチャートである。図２０は、振動定位処理の手順を示すフローチャートである。図２１は、振動子情報ＤＢの一例を示す図である。図２２は、振動制御方法の例を示す図である。図２３は、従来の振動の提供方法を示す図である。

　以下、添付図面を参照して、本願の開示する情報処理装置、情報処理システムおよび情報処理方法の実施形態を詳細に説明する。なお、以下に示す実施形態により本発明が限定されるものではない。

［第１の実施形態］
　まず、図１、図２、図３および図４を用いて、実施形態に係る情報処理システムおよび情報処理方法の概要について説明する。図１は、情報処理システムの概要を示す図である。図２は、情報処理システムにおけるデータの流れを示す図である。図３は、振動デバイスの構成例を示す図である。図４は、情報処理方法の概要を示す図である。なお、以下では、ＸＲ空間（仮想空間）がＶＲ空間である場合について説明する。

　図１に示すように、情報処理システム１は、表示装置３と、スピーカ４と、振動デバイス５とを含む。

　図２に示すように、情報処理装置１０は、表示装置３に映像データを提供する。また、情報処理装置１０は、スピーカ４に音声データを提供する。また、情報処理装置１０は、振動デバイス５に振動データを提供する。

　図１に示すように、表示装置３は、例えば、ヘッドマウントディスプレイである。表示装置３は、ユーザに対し、情報処理装置１０から提供されるＸＲコンテンツに関する映像データを提示し、ユーザにＶＲ体験を享受させるための情報処理端末である。

　なお、表示装置３は、視界を完全に覆う非透過型であってもよいし、ビデオ透過型や光学透過型であってもよい。また、表示装置３は、センサ部によってユーザの内外の状況の変化を検知するデバイス、例えばカメラやモーションセンサ等を有する。

　スピーカ４は、音声を出力する音声出力デバイスで、例えばヘッドフォン型に設けられ、ユーザの耳に装着される。スピーカ４は、情報処理装置１０から提供される音声データを音声として発生させる。なお、スピーカ４は、ヘッドフォン型に限らず、箱型（床等に設置）のものであってもよい。また、スピーカ４は、ステレオオーディオや、マルチチャンネルオーディオ型であってもよい。

　振動デバイス５は、複数の振動子を含む。各振動子は、電気磁気回路や圧電素子から構成される電気振動変換器から構成され、例えば、ユーザが着座するシートに設けられ、情報処理装置１０から提供される振動データにあわせて振動する。なお、情報処理装置１０は、振動デバイス５の各振動子を個別に制御する。

　図３は、ユーザが着座するシートの座面をユーザの頭上から鉛直下向きに見た図である。図３に示すように、シートの座面における左前、左後、右前、右後の各位置には振動デバイス５の各振動子である、振動子５１＿ＦＬ、振動子５１＿ＲＬ、振動子５１＿ＦＲ、振動子５１＿ＲＲが設置される。

　そして、ユーザがシートに着座した際に、各振動子は、それぞれ異なる身体の部位に接触して、振動を与える。例えば、振動子５１＿ＦＬ、振動子５１＿ＲＬ、振動子５１＿ＦＲ、振動子５１＿ＲＲは、それぞれシートに着座したユーザの左側の大腿部、左側の臀部、右側の大腿部、右側の臀部に振動を与える。

　これらスピーカ４による音声や、振動デバイス５の振動、つまり波動デバイスによる波動を再生映像に適合させてコンテンツユーザに印加することにより、映像再生に関してより臨場感を増すことが可能となる。

　情報処理装置１０は、コンピュータにより構成されており、有線または無線で表示装置３と接続され、表示装置３に対し、ＸＲコンテンツの映像を提供する。また、情報処理装置１０は、例えば、表示装置３に設けられたセンサ部によって検知された状況の変化を随時取得し、かかる状況の変化をＸＲコンテンツに反映させる。

　例えば、情報処理装置１０は、センサ部によって検知されたユーザの頭部や視線の変化に応じて、ＸＲコンテンツの仮想空間における視界の向きを変化させることが可能である。

　ところで、ＸＲコンテンツを提供するにあたり、スピーカ４から発生する音声をシーンにあわせて強調する、あるいは、シーンにあわせて振動デバイス５を振動させることで、ＸＲコンテンツの臨場感の向上を図ることができる。

　しかしながら、これら臨場感の向上を図るための臨場感制御に用いるパラメータ（以下、臨場感パラメータ）は、ＸＲコンテンツの制作後に、人手で設定する必要があり、臨場感パラメータの設定に膨大な作業を必要としていた。

　そこで、情報処理方法では、これら臨場感パラメータの設定の自動化を図ることとした。例えば、図４に示すように、まず、実施形態に係る情報処理方法では、ＸＲコンテンツに関する映像データおよび音声データから所定条件を満たすシーンを検出する（ステップＳ１）。

　ここでの所定条件とは、例えば、対応する映像データまたは音声データが臨場感パラメータの設定を要するシーンであるか否かに関する条件であり、例えば、ＸＲコンテンツ内部の状況に関する条件式によって定義される。

　すなわち、情報処理方法では、ＸＲコンテンツ内部の状況が条件式によって定義される条件を満たした場合に、所定条件を満たすシーンとして検出する。これにより、情報処理方法では、映像データを詳細に解析するなどといった処理を不要とするので、シーン検出の処理負荷の軽減を図ることができる。

　つづいて、情報処理方法では、シーン検出によって検出したシーンに対して優先順位を設定する（ステップＳ２）。ここで、優先順位とは、どのシーンの臨場感パラメータを優先すべきかといった順位を示す。すなわち、情報処理方法では、複数のシーンが時間的に重複する場合に、どのシーンの臨場感パラメータを優先すべきかをシーン毎に予め定義しておく。

　これにより、複数のシーンが重複する場合においても、ユーザに対し適切な臨場感を提供することができる。なお、後述するように、情報処理方法では、音声に関する優先順位と、振動に関する優先順位とをそれぞれ個別に設定する。

　つづいて、情報処理方法では、シーン毎に臨場感パラメータを抽出する（ステップＳ３）。例えば、情報処理方法では、シーンと臨場感パラメータとの関係性が予め定義されたパラメータ情報を用いて、シーン毎に臨場感パラメータを抽出する。

　この際、情報処理方法では、優先順位に応じて、対応する臨場感パラメータを抽出する。具体的には、例えば、情報処理方法では、優先順位が低いシーンと、優先順位が高いシーンとが重複する場合、優先順位が高いシーンの臨場感パラメータを抽出することになる。

　情報処理方法では、抽出した臨場感パラメータのうち、音声強調パラメータを用いて、音声データを強調する音声強調処理を行い（ステップＳ４）、スピーカ４へ出力する。また、情報処理方法では、音声データを振動データへ変換する振動変換処理を行い、抽出した臨場感パラメータのうち、振動パラメータを用いて振動データを強調したうえで（ステップＳ５）、振動デバイス５へ出力する。

　これにより、情報処理方法では、ユーザが視聴するシーンにあわせて強調された音声や、シーンに応じた振動をユーザに対し提供することができる。

　このように、実施形態に係る情報処理方法では、ＸＲコンテンツからシーンを検出し、優先順位を設定したうえで、シーンに対して音声処理と振動処理を含む波動制御に関する臨場感パラメータを抽出する。したがって、実施形態に係る情報処理方法によれば、コンテンツの臨場感の向上に関する臨場感パラメータの設定を自動化することができる。

　さらに、ステップＳ５では、情報処理装置１０は、入力されたコンテンツにおける、振動デバイス５に対する音源の方向成分を特定する。そして、情報処理装置１０は、特定した方向成分に基づき、複数の振動子の出力振動を制御する。これにより、情報処理装置１０は、振動の定位感をユーザに提供することができる。

　次に、図５を用いて、実施形態に係る情報処理装置１０の構成例について説明する。図５は、情報処理装置１０のブロック図である。図５に示すように、情報処理装置１０は、制御部１２０と、記憶部１３０とを備える。

　記憶部１３０は、例えば、ＲＡＭ（Random　Access　Memory）、フラッシュメモリ（Flash　Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図５の例では、記憶部１３０は、ＸＲコンテンツＤＢ（Database）１３１と、シーン情報ＤＢ１３２と、優先順位情報ＤＢ１３３と、パラメータ情報ＤＢ１３４と、振動子情報ＤＢ１３５と、を有する。

　ＸＲコンテンツＤＢ１３１は、表示装置３へ表示されるＸＲコンテンツ群が格納されたデータベースである。シーン情報ＤＢ１３２は、検出するシーンに関する各種情報を記憶するデータベースである。

　図６～図８は、シーン情報ＤＢ１３２の一例を示す図である。図６に示すように、例えば、シーン情報ＤＢ１３２は、「検出シーン」、「条件カテゴリ」、「対象物」、「条件パラメータ」、「閾値」および「条件式」といった項目の情報を互いに対応付けて記憶する。

　「検出シーン」は、検出するシーンの名称を示す。なお、「検出シーン」は識別記号の働きを行うもので、数値等のコードが通常利用されるが、本例では説明を分かりやすくするため名称（重複禁止）を用いている。「条件カテゴリ」は、どのような情報を根拠にシーンを検出するかといったカテゴリを示す。同図に示す例では、ユーザと対象物の位置関係、ユーザの動作、ユーザが存在する空間情報、ユーザが存在する時間情報あるいは対象物から音声が発生などとったカテゴリに大別される。なお、ここでのユーザは、ＸＲ空間内の操作者自身を示す。

　「対象物」は、シーン検出のための対象物を示す。同図に示す例では、物体１、物体２、ユーザ、空間１、空間１＋物体３、コンテンツ１、物体４、物体５、物体６などといった情報が対象物に対応する。ここで、物体１、物体２、物体３、物体４、物体５、物体６は、それぞれＸＲ空間内の異なるオブジェクトを示す。また、空間１は、例えば、ユーザが存在するＸＲ空間内の空間を示し、コンテンツ１は、例えば、ＸＲ空間内における所定のイベントを示す。

　「条件パラメータ」は、シーン検出を行うにあたり、どのパラメータを用いるかといったパラメータに関する条件を示す。同図に示すように、例えば、距離、角度、速度、加速度、回転速度、空間の中、物体の存在、数量、開始時刻～終了時刻、音声パターンなどといった情報が対応付けられる。

　「閾値」は、条件パラメータに対応する閾値を示す。また、「条件式」は、検出シーンを検出するための条件式を示し、例えば、条件パラメータと閾値との関係が条件式として定義される。

　図６では、説明のため、「シーンＷ」、「物体４」、「パターンｗ」のように、各項目値は「Ｗ」、「４」、「ｗ」といった符号を用いて表記されているが、実際には、各項目値は具体的な意味が理解可能な態様のデータが記憶されることになる。

　例えば、「シーンＷ」、「シーンＸ」、「シーンＹ」、「シーンＺ」は、実際には、それぞれ例えば「象の歩行シーン」「馬の歩行シーン」、「車の走行シーン」、「車の急旋回シーン」と言ったデータとなる。

　その場合、「物体４」、「物体５」、「物体６」は、実際には、それぞれ例えばそれぞれ「馬」、「象」、「車」と言ったデータとなる。

　さらに、「パターンｗ」、「パターンｘ」、「パターンｙ」、「パターンｚ」は、実際には、それぞれ例えば「馬の歩行音のパターン」、「象の歩行音のパターン」、「車の走行音のパターン」、「タイヤのスキール音のパターン」と言ったデータとなる。

　なお、音声パターンは、例えば音声の特徴量を要素とする特徴量ベクトル等によって表される。例えば、特徴量は、音声信号に対してスペクトル分解を行うことによって得られるものであってもよい（例えば、メルフィルタバンクまたはケプストラム）。

　そして、２つの音声パターンのそれぞれに対応する特徴量ベクトル間の類似度（例えば、コサイン類似度、ユークリッド距離）が閾値以上である場合に、当該２つの音声パターンは類似しているということができる。

　例えば、「音声パターンがパターンｗに類似」は、シーンにおいて発生している音声から算出された特徴量ベクトルと、パターンｗに相当する音声の特徴量ベクトルとの類似度が閾値以上であることを意味する。

　なお、音声パターンの類似に関する閾値についても、シーン情報ＤＢ１３２の「閾値」に含まれていてよい。

　また、情報処理装置１０では、例えば、図６に示した条件カテゴリあるいは条件パラメータを組み合わせてシーンを検出することにしてもよい。例えば、図７に示すように、複数シーンの条件カテゴリを組み合わせて検出シーンを設定することにしてもよく、また、図８に示すように、複数シーンの条件パラメータを組み合わせて検出シーンを設定することにしてもよい。

　例えば、このように、条件カテゴリや条件パラメータを組み合わせることで、新たな検出シーンの設定を簡略化することができる。

　図５の説明に戻り、優先順位情報ＤＢ１３３について説明する。例えば、実施形態に係る情報処理装置１０では、各シーンに対してルールベースで優先順位を設定する。優先順位情報ＤＢ１３３は、臨場感パラメータの優先順位に関する各種情報を記憶する。図９は、優先順位情報ＤＢ１３３の一例を示す図である。

　図９に示すように、例えば、優先順位情報ＤＢ１３３は、「ルール番号」および「優先順位ルール」といった項目の情報を互いに対応付けて記憶する。「ルール番号」は、優先順位ルールを識別するための番号を示し、「優先順位ルール」は、優先順位に関するルールを示す。

　同図に示す「先に検出したシーンを優先」および「後に検出したシーンを優先（後のシーンになったら切替）」は、それぞれ時間的に先あるいは後にくるシーンの臨場感パラメータを優先することを示す。これにより、例えば、シーンの優先度の設定に際し、ルールを容易化することができる。

　また、「特定のパラメータの重みが大きい方を優先」は、臨場感パラメータのうち、音声強調パラメータあるいは振動パラメータのいずれかが大きい方のシーンの臨場感パラメータを優先することを示す。

　すなわち、この場合においては、音声強調パラメータあるいは振動パラメータが大きい方のシーンに対して抽出された臨場感パラメータが設定されるので、大きく強調すべき音声データあるいは大きい振動データに連動した臨場感パラメータを提供することができる。

　また、「パラメータそれぞれの重みが大きい方を優先」は、臨場感パラメータのうち、音声強調パラメータ同士あるいは振動パラメータ同士で大きい方のシーンの臨場感パラメータそれぞれを優先することを示す。このルールの場合、音声強調パラメータと、振動パラメータでそれぞれ異なるシーンのパラメータが用いられる場合もある。

　すなわち、この場合においては、振動データおよび音声データそれぞれについて、値の大きい臨場感パラメータで強調することができるので、振動データおよび音声データそれぞれの臨場感を向上させることができる。なお、ここでの重みの大小は、例えば、パラメータの値の大小を示す。

　また、「シーンが短い方のパラメータを優先」は、時間長が短いシーンの臨場感パラメータを優先することを示す。時間が長いシーンの再生時において、時間が短いシーンが割り込みしてきた場合、時間が短いシーンの間は、当該シーンの臨場感パラメータが優先的に設定されることになる。

　これにより、例えば、時間が短いシーンを適切に強調することができる。なお、シーンが長い方のパラメータを優先するようなルールを設定することにしてもよい。

　また、「低域の振幅が大きい方を優先」は、対象物が音声を発生させているシーンが同時発生した場合に、低域（例えば、５００Ｈｚ未満）の振幅が大きい音声を発生させている対象物に対応するシーンを優先することを示す。

　一般的に、生物が大型であるほど、当該生物の歩行音の低域の振幅が大きくなることが考えられる。このため、例えば、象の歩行シーンと馬の歩行シーンが検出された場合、「低域の振幅が大きい方を優先」というルールに従って、象の歩行シーンが優先されることになる。

　また、「音や映像の時間変動が大きいシーンを優先」は、対象物が発生させている音声の音量、または映像中における対象物の位置の、単位時間における変動が大きいシーンを優先することを示す。

　また、「視野の中心に近い対象物のシーンを優先」は、コンテンツの映像において、画面の中心に近い位置に位置する対象物に対応するシーンを優先することを示す。このルールについては、後に図１４を用いて説明する。

　また、「シーンＷよりもシーンＸを優先」は、シーンＷとシーンＸが検出された場合に、シーンＸを優先することを示す。このように、特定の２つ以上のシーンについて、人（デザイナー、開発者）が事前に手動で優先ルールを定めておいてもよい。

　図５の説明に戻り、パラメータ情報ＤＢ１３４について説明する。パラメータ情報ＤＢ１３４は、シーン毎の臨場感パラメータに関する情報を記憶するデータベースである。図１０は、パラメータ情報ＤＢ１３４の一例を示す図である。

　図１０に示すように、パラメータ情報ＤＢ１３４は、例えば、「シーン名」、「音声強調パラメータ」および「振動パラメータ」といった項目の情報を互いに対応付けて記憶する。

　「シーン名」は、上述した検出シーンの名称を示し、例えば、図６等に示した「検出シーン」に対応する。なお、ここでは、説明を分かりやすくする観点から「シーン名」を爆発シーン、コンサートホールシーン、象の歩行シーン、馬の歩行シーン、車の走行シーン、車の急旋回シーンとして示している。

　「音声強調パラメータ」は、対応するシーンにおいて設定する音声強調パラメータを示す。例えば、図１０に示すように、音声強調パラメータは、「スピーカ１用」、「スピーカ２用」などのように、スピーカ４の個数に応じて、それぞれ各スピーカ４に対して個別のパラメータを記憶する。

　また、各スピーカ４に対しては、例えば、「ディレイ」、「帯域強調・減衰」といった音声処理に関する項目のパラメータの値を記憶する。例えば、「ディレイ」は、遅延させる時間に関するパラメータを示し、「帯域強調・減衰」は、どの帯域の音をどの程度、強調あるいは減衰させるかといったパラメータを示す。

　「振動パラメータ」は、対応するシーンにおいて設定する振動に関するパラメータを示す。「振動パラメータ」として、例えば、「ＬＰＦ（Low　Pass　Filter）」、「振幅用強調係数（ω）」および「遅延用強調係数（γ）」といった項目のパラメータが記憶される。

　「ＬＰＦ」は、振動生成に用いられるローパスフィルタに関するパラメータ（図１０の示す例ではカットオフ周波数）を示す。「振幅用強調係数（ω）」は、振動生成に用いられる振動の振幅の増幅および減衰に関するパラメータを示す。「遅延用強調係数（ω）」は、振動生成に用いられる振動の発生時間の遅延（ディレイ）に関するパラメータを示す。

　図５の説明に戻り、振動子情報ＤＢ１３５について説明する。振動子情報ＤＢ１３５は、振動デバイス５に含まれる振動子に関する情報を記憶するデータベースである。図１１は、振動子情報ＤＢの一例を示す図である。

　図１１に示すように、振動子情報ＤＢ１３５は、例えば、「振動子」および「位置座標」といった項目の情報を互いに対応付けて記憶する。

　「振動子」は、振動デバイス５に含まれる振動子を識別するための情報を示す。また、「位置座標」は、振動子の位置を座標により示す。

　ここで、「振動子」に示される「ＦＬ」、「ＲＬ」、「ＦＲ」、「ＲＲ」は、それぞれ図３の振動子５１＿ＦＬ、振動子５１＿ＲＬ、振動子５１＿ＦＲ、振動子５１＿ＲＲに対応している。また、「位置座標」は、振動デバイス５に各振動子が設置される際に、設置者によって設定されてもよい。

　例えば、振動子情報ＤＢ１３５を参照することで、振動子間の位置関係を把握することができる。

　図５の説明に戻り、制御部１２０について説明する。制御部１２０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central　Processing　Unit）やＭＰＵ（Micro　Processing　Unit）等によって、記憶部１１に記憶されている図示略の各種プログラムがＲＡＭを作業領域として実行されることにより実現される。また、制御部１２０は、例えば、ＡＳＩＣ（Application　Specific　Integrated　Circuit）やＦＰＧＡ（Field　Programmable　Gate　Array）等の集積回路により実現することもできる。

　制御部１２０は、コンテンツ生成部１２１と、レンダリング処理部１２２と、シーン検出部１２３と、優先順位設定部１２４と、パラメータ抽出部１２５と、出力部１２６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。

　コンテンツ生成部１２１は、ＸＲコンテンツ内の空間に関する３Ｄモデルを生成する。例えば、コンテンツ生成部１２１は、ＸＲコンテンツＤＢ１３１を参照し、ユーザの現在のＸＲコンテンツ内の視野にあわせて、ＸＲコンテンツ内の空間の３Ｄモデルを生成する。コンテンツ生成部１２１は、生成した３Ｄモデルをレンダリング処理部１２２へ渡す。

　レンダリング処理部１２２は、コンテンツ生成部１２１から受け取った３Ｄモデルから映像データや音声データへ変換するレンダリング処理を行う。例えば、レンダリング処理部１２２は、変換した映像データを表示装置３（図２参照）へ出力するとともに、シーン検出部１２３へ渡す。また、レンダリング処理部１２２は、変換した音声データを出力部１２６およびシーン検出部１２３へ渡す。なお、コンテンツ生成部１２１およびレンダリング処理部１２２は、コンテンツから条件式の項目に対する条件データを算出する算出部としての機能を担う。

　シーン検出部１２３は、入力されたコンテンツから所定条件を満たすシーンを検出する。例えば、シーン検出部１２３は、レンダリング処理部１２２から入力される映像データおよびシーン情報ＤＢ１３２に記憶される条件式を用いて、臨場感パラメータを設定すべきシーンを検出する。

　この際、例えば、シーン検出部１２３は、例えば、レンダリング処理部１２２からＸＲ空間内のオブジェクトの座標情報およびオブジェクト種別に関する情報を受け取り、条件式を用いて、臨場感パラメータを設定すべきシーンを検出する。

　なお、シーン検出部１２３は、例えば、ＸＲコンテンツがＭＲコンテンツである場合には、例えば、ＭＲ空間内を撮影した画像に対する画像解析を行うことで、ＭＲ空間内のオブジェクトの認識あるいはオブジェクトの座標の算出を行うようにしてもよい。

　図１２は、シーン検出部１２３のブロック図である。図１２に示すように、例えば、シーン検出部１２３は、シーン判定部１２３ａおよび条件設定部１２３ｂを備える。シーン判定部１２３ａは、シーン情報ＤＢ１３２に記憶されるシーン判定のための各条件データ（条件式）を用いて、映像データ内の状況が各シーンの検出条件を満たすか否かを判定する。

　より具体的には、例えば、図６に示したように、シーン判定部１２３ａは、ユーザと対象物（ＸＲ空間内のオブジェクト）との位置関係、ユーザの動作、ユーザが存在する空間情報等の条件式の項目に対するデータ（コンテンツからコンテンツ生成部１２１あるいはレンダリング処理部１２２によって算出）に基づき、現在のＸＲ空間の状況が予め定義された各検出シーンに対応するか否かを判定する。

　ここで、シーン判定部１２３ａは、ＸＲ空間内のユーザの動き、オブジェクトの座標情報およびオブジェクト種別に関する情報、空間情報などといったコンテンツ生成部１２１あるいはレンダリング処理部１２２によって既に算出されたテキスト情報的なデータを用いて、シーン検出処理を行う。

　これにより、例えば、ＣＰＵの性能が比較的低い場合であっても、レンダリング処理部１２２によるレンダリング処理等の比較的処理負荷が重い処理と並列してシーン検出～臨場感パラメータの抽出処理等の処理を行うことが可能となる。

　また、この際、例えば、シーン判定部１２３ａは、例えば、図７に示したように、条件カテゴリの組みあわせ、あるいは、図８に示したように、条件パラメータの組み合わせをも含むシーン判定用情報に基づいて、現在のＸＲ空間の状況が各検出シーンに対応するか否かを判定することにしてもよい。

　そして、シーン判定部１２３ａは、検出シーンに対応すると判定した場合、当該映像データに対する検出シーン情報を、優先順位設定部１２４（図５参照）へ渡す。なお、シーン判定部１２３ａによっていずれの検出シーンにも対応しないと判定された場合には、該当の検出シーンで無いとして臨場感パラメータは初期状態（該当の検出シーンで無い場合の臨場感パラメータ）に戻されることになる。また、シーン判定部１２３ａは、現在のＸＲ空間の状況が複数の検出シーンに対応すると判定した場合、判定された複数の検出シーンを優先順位設定部１２４へ渡す。

　また、ここでは、シーン判定部１２３ａが映像データに基づいて、検出シーンか否かを判定する場合について説明したが、シーン判定部１２３ａは、音声データに基づいて検出シーンか否かを判定することにしてもよい。

　シーン判定部１２３ａは、入力されたコンテンツから、対象物から音声が発生しているシーンを検出する。この場合の検出されるシーンは、図６のシーンＷ、シーンＸ、シーンＹ、シーンＺ（象の歩行シーン、馬の歩行シーン、車の走行シーン、車の急旋回シーン）に相当する。

　例えば、シーン判定部１２３ａは、コンテンツの音声信号から得られた特徴量ベクトルと、予め定められた特徴量ベクトル（例えば、パターンｗ等）との類似度を算出し、当該類似度が閾値以上であるか否かを判定する。

　条件設定部１２３ｂは、シーン検出のための各種条件式を設定する。条件設定部１２３ｂは、例えば、ＸＲコンテンツの制作者や、ユーザにから入力される情報に基づいて、条件式を設定する。

　例えば、条件設定部１２３ｂは、制作者あるいはユーザからどのようなシーンに対してどのような臨場感パラメータを設定したいといった情報の入力を受け付け、かかるシーンの状況を条件式に落とし込む。そして、条件設定部１２３ｂは、条件式の設定毎に、条件式に関する情報をシーン情報ＤＢ１３２に書き込むとともに、対応する臨場感パラメータをパラメータ情報ＤＢ１３４へ書き込む。

　また、条件設定部１２３ｂは、ユーザが視聴するコンテンツを基に、事前にシーン情報ＤＢ１３２およびパラメータ情報ＤＢ１３４を設定してもよい。

　条件設定部１２３ｂは、対象物が指定された低周波領域の音声を発生させるシーンを検出するための条件を設定することができる。例えば、条件設定部１２３ｂは、低周波領域の音声を含む象の歩行音が含まれるシーンを検出シーンとするレコードを、シーン情報ＤＢ１３２に追加する（図６のシーンＷのレコードに相当）。

　なお、条件設定部１２３ｂは、コンテンツに含まれる画像および音声を認識することにより、シーンに対象物（例えば象）が写っていること、および低周波領域の音声が発生していることを特定することができる。

　また、条件設定部１２３ｂは、対象物の大きさ、低周波領域の周波数帯毎の振幅に応じて、パラメータ情報ＤＢ１３４の「振動パラメータ」の値を決定する。

　これにより、シーン情報ＤＢ１３２およびパラメータ情報ＤＢ１３４の設定を自動化することができる。

　また、条件設定部１２３ｂは、コンテンツのシーンのうち、対象物から発生する低周波領域の音声の振幅が閾値を超えているシーンを基に、条件を設定する。

　例えば、ここでの閾値は、ノイズキャンセルにおいて低周波領域をカットする際に用いられる閾値と同じであってもよい。

　また、閾値は、コンテンツの種類（内容）によって定められてもよい。コンテンツの種類には、ユーザに主として音楽を聴かせるためのミュージックビデオ、動物の生体を解説するための動物ドキュメンタリー等がある。

　ミュージックビデオにおける象の歩行シーンでは、音楽の妨げにならないようにするため、過度に振動を発生させない方がよい場合がある。一方で、動物ドキュメンタリーにおける象の歩行シーンでは、臨場感を出すために振動を発生させた方がよい場合がある。

　ミュージックビデオにおける閾値を、動物ドキュメンタリーにおける閾値よりも低く設定しておくことで、条件設定部１２３ｂは、ミュージックビデオにおける象の歩行シーンを、振動を発生させる対象のシーンとみなしにくくなる。

　これにより、コンテンツに適した振動を発生させることが可能になる。

　なお、上記のシーン情報ＤＢ１３２およびパラメータ情報ＤＢ１３４の設定処理は、条件設定部１２３ｂの代わりに、人が実際にコンテンツを視聴し、入力装置を操作することにより行われてもよい。

　これにより、情報処理装置１０では、制作者あるいはユーザが要望したシーンを検出することが可能となり、検出したシーンに対して制作者あるいはユーザが要望した臨場感パラメータを設定することが可能となる。

　図５の説明に戻り、優先順位設定部１２４について説明する。優先順位設定部１２４は、シーン検出部１２３によって検出されたシーンに対して優先順位を設定する。

　例えば、優先順位設定部１２４は、優先順位情報ＤＢ１３３を参照し、シーン検出部１２３にて同時に複数種のシーンが検出判定された場合にどのシーンに対する処理を優先するかを選択する。なお、シーン検出部１２３が１つのシーンしか検出判定されなかった場合は、そのシーンが優先順位最上位となる。

　図１３は、優先順位設定部１２４のブロック図である。例えば、図１３に示すように、優先順位設定部１２４は、タイミング検出部１２４ａと、ルール設定部１２４ｂとを有する。

　タイミング検出部１２４ａは、シーン検出部１２３にて検出したシーンの発生するタイミングとその終了するタイミングを検出する。例えば、タイミング検出部１２４ａは、シーン検出部１２３からの各時点のシーン情報に基づき、各時点で存在する各シーン（重複状態も把握）、存在するシーンの発生タイミング、存在したシーンが消去したタイミング等を検出する。つまり、タイミング検出部１２４ａは、各時点で存在している全シーンの状態をその発生順位も含めて把握することになる。

　ルール設定部１２４ｂは、シーン検出部１２３にて検出されたシーンに対して、臨場感パラメータの決定に使用するシーンの優先順位を設定する。つまり、タイミング検出部１２４ａで把握された存在する全シーンの状態に基づき、その時点で用いる臨場感パラメータについてどのシーンに紐づけられたパラメータを優先的に用いるか決定するため、検出シーンについて優先順位を設定する。これにより、情報処理装置１０では、当該優先順位に応じた臨場感パラメータを設定することができる。

　すなわち、情報処理装置１０では、予め各シーンに対して優先順位条件を設定しておくことで、シーンＡとシーンＢとが時間的に重複する場合において、どちらのシーンの臨場感パラメータを優先して使用すべきかを適切に決定することができる。

　例えば、ルール設定部１２４ｂは、優先順位情報ＤＢ１３３を参照し、音声強調パラメータおよび振動パラメータのそれぞれに対し、使用するパラメータを決めるシーンの優先順位を設定する。この際、ルール設定部１２４ｂは、例えば、スピーカ４毎にそれぞれ独立した優先順位ルールに基づきパラメータ選択に使用するシーンを設定することにしてもよい。

　これにより、それぞれのスピーカ４では、独自のルールにしたがって臨場感パラメータが設定されるので、一律に臨場感パラメータを設定する場合に比べて、さらなる臨場感の向上を図ることができる。

　また、ルール設定部１２４ｂは、設定したルールに関する情報を映像データおよび音声データに対応付けてパラメータ抽出部１２５（図５参照）へ渡す。

　図５の説明に戻り、パラメータ抽出部１２５について説明する。パラメータ抽出部１２５は、シーン検出部１２３によって検出されたシーンに対して臨場感パラメータを抽出する。

　図１５は、パラメータ抽出部１２５のブロック図である。図１５に示すように、パラメータ抽出部１２５は、振動パラメータ抽出部１２５ａと、音声強調パラメータ抽出部１２５ｂと、学習部１２５ｃとを有する。

　振動パラメータ抽出部１２５ａは、パラメータ情報ＤＢ１３４を参照し、優先順位設定部１２４により優先順位最上位とされたシーンに対応する振動パラメータを抽出する。例えば、振動パラメータ抽出部１２５ａは、優先順位設定部１２４から受け取った優先順位最上位の「検出シーン」に対応する振動パラメータをパラメータ情報ＤＢ１３４から抽出することで、シーンに対応する振動パラメータを抽出する。

　つまり、シーン検出部１２３が音声を発生させる対象物が互いに異なる時間的に重複する複数のシーンを検出した場合に、パラメータ抽出部１２５は、優先度の高い、すなわち振動によりユーザがより臨場感を感じると推定されるシーンを選択し、当該シーンに対応する振動生成のパラメータを抽出することが可能となる。その結果、複数のシーンが重複するコンテンツ再生期間においても、適切なパラメータによる臨場感豊かな振動を生成することができる。

　具体的には、図９に示した優先順位情報ＤＢの優先順位ルール、各シーンに対する優先順位条件（図４に示したシーン情報ＤＢに設定記憶しておく）の設定内容により、シーン検出部１２３がこのようなシーン選択処理を行なうことを実現できる。

　例えば、シーン検出部１２３は、象が歩行音を発生させるシーン（象の歩行シーン）と、馬が歩行音を発生させるシーン（馬の歩行シーン）とが検出された場合、パラメータ抽出部１２５は、「低域の振幅が大きい方を優先」というルールに従い、象の歩行シーンを優先する。これにより、現実世界でも主に感じる振動である象の歩行による振動を再現する振動がコンテンツ再生（例えば仮想空間）でもユーザに印加され、ユーザは臨場感豊かな、つまり現実に近い振動感を得ることができる。

　また、シーン検出部１２３が、音声を発生させる対象物が存在し、互いに異なる時間的に重複する複数のシーンを検出した場合に、パラメータ抽出部１２５は、コンテンツに含まれる画像における、複数のシーンのそれぞれに対応する対象物の種別、および位置に基づいて複数のシーンの中から選択したシーンに対応するパラメータを抽出する方法を適用することもできる。

　具体的には、図９に示した優先順位情報ＤＢの優先順位ルール、各シーンに対する優先順位条件（図４に示したシーン情報ＤＢに設定記憶しておく）の設定内容（本例の場合は、優先順位条件に対象物の種別（ｍ）と対象物までの距離（ｄ）の関数値Ｆ(Ｍ、ｄ)を加え、優先順位ルールに関数値Ｆ(Ｍ、ｄ)による条件（例えば、関数値「Ｆ(Ｍ、ｄ)」が大きい方を優先とする））を設定することにより、シーン検出部１２３がこのようなシーン選択処理を行なうことを実現できる。

　図１４に示す具体例を用いて、対象物の位置に基づいて優先するシーンを決定する方法を説明する。図１４は、優先する対象物の決定方法の例を示す図である。

　図１４に示すように、表示装置３には、再生中のコンテンツの画像３１が表示されているものとする。画像３１には、オブジェクト３１１（馬）およびオブジェクト３１２（象）が映っている。このとき、シーン検出部１２３は、振動制御の対象シーンとして条件を満たす馬の歩行シーンと象の歩行シーンの両方を検出したものとする。

　また、基準位置（コンテンツ画像に対するユーザ位置、例えばＸＲコンテンツにおけるユーザに対応するアバターの位置）からオブジェクト３１１までの距離はＬ１であったとする。一方、基準位置からオブジェクト３１２までの距離はＬ２であったとする。また、オブジェクト３１１およびオブジェクト３１２の基準振動強度（コンテンツにおける物体の音声信号の低周波数成分強度）が、それぞれＶ１、Ｖ２とする。さらに、優先条件が「関数Ｆ（Ｌｎ，Ｖｎ）＝Ｖｎ／（Ｌｎ・Ｌｎ）の値が大きい方を優先」と設定されていた場合を例とする。

　なお、基準位置からオブジェクトまでの距離は、コンテンツに付加された情報等により算出される（例えば、ＸＲコンテンツにおける映像生成に用いられる各オブジェクトの位置情報により算出される）。また、オブジェクトの基準振動強度は、オブジェクト種別毎に予め設定された基準振動強度が記憶されたデータテーブルから対象オブジェクトの種別に応じて読み取ることにより決定する方法、コンテンツ情報としてコンテンツに付加しておく方法等により実現できる。また、コンテンツには音声再生のために音声データが付加されている場合が多いので、当該音声データにおける低域特性（音声強度レベル、低域信号レベル等）に基づき基準振動強度を算出すること（振動態様は音声の低域成分と相関が高かく、また音声の低域成分に基づき振動を生成する場合が多い）が可能である。

　このように、情報処理装置１０は、コンテンツにおける振動発生対象物が発生する音声の低域特性を推定することができる。その場合、情報処理装置１０は、推定した低域特性に基づき振動発生対象物を選定する。これにより、より適切な振動発生対象物の選定が可能になる。

　例えば、音声の低域特性は、低域信号レベルである。その場合、情報処理装置１０は、推定した低域信号レベルが閾値を越える振動発生対象物を選定する。情報処理装置１０は、音声データから低域信号レベルを抽出することができる。これにより、音声データに含まれる低域信号レベルを用いて、振動発生対象物を容易に選定することが可能になる。

　また、低域信号レベルの閾値は、コンテンツ種別に応じて設定される。前述の通り、ミュージックビデオは、動物ドキュメンタリーと比べて、同じ対象物であっても振動を発生させた方がよい場合が多い。このように、コンテンツ種別（ミュージックビデオ、動物ドキュメンタリー等）に適した振動対象物の選定が可能になる。

　この場合、オブジェクト３１１（馬）とオブジェクト３１２（象）の関数値の関係が関数Ｆ（Ｌ１，Ｖ１）＞関数Ｆ（Ｌ２，Ｖ２）であれば、オブジェクト３１１が音声（振動）を発生させているシーン、すなわち馬の歩行シーンが優先的に選択され、パラメータ抽出部１２５は馬の歩行シーンに対応する振動パラメータを抽出する。そして、馬の歩行シーンに対応する振動がユーザに印加されることになる。その後、例えばオブジェクト３１２（象）が基準位置に接近し、関数Ｆ（Ｌ１，Ｖ１）＜関数Ｆ（Ｌ２，Ｖ２）の関係に変化すれば、オブジェクト３１１が音声（振動）を発生させているシーン、すなわち象の歩行シーンが優先的に選択され、パラメータ抽出部１２５は、象の歩行シーンに対応する振動パラメータを抽出する。そして、象の歩行シーンに対応する振動がユーザに印加されることになる。

　なお、関数Ｆ（Ｌｎ，Ｖｎ）が予め定められた所定閾値より小さい場合、つまりコンテツンツ（ゲームの仮想空間等）におけるユーザ位置における対象物による振動が小さい（ユーザがあまり感じない、すなわち振動を印加する必要があまり無い）場合には、振動を発生する対象物として選択しない方法も有効である。換言すれば、コンテツンツ（ゲームの仮想空間等）におけるユーザ位置における対象物による振動がある程度大きい（振動を再現すれば臨場感の向上が感じられる程度）コンテンツの物体だけを振動を発生する対象物として選択する方法も有効である。つまり、振動発生対象物の候補となる対象物候補から発生する振動信号への影響が大きい対象物（ユーザがその振動を強く感じる振動対象物）を選択する。

　これにより、情報処理装置１０は、振動発生対象物の候補となる対象物候補から発生する振動信号への影響が大きい対象物候補を推定し、振動発生対象物として選定することができる。その結果、ユーザの実空間での感覚に合致した振動をユーザに印加することとなり、臨場感豊かなコンテンツに再生が可能になる。

　この場合、振動を発生する対象物として選択する場合の閾値については、コンテンツ種別に基づき変更するのが好ましい。つまり、コンテンツの内容によっては、コンテンツに登場する物体による振動の再現を控えたり、あるいは強調したりするのが好ましいものがあり、振動を発生する対象物の決定内容（判断レベル）を調整するのが好ましいためである。

　つまり、振動の生成原理としては次のようになる。コンテンツの内容に基づきコンテンツ（の各場面）において振動を発生する対象物を決定する。そして、決定した対象物に対応する音響信号（コンテンツに含まれる対象物の音声データ、あるいは当該シーンにおける音声データから生成した対象物の音声データ（例えば、低周波領域をフィルタリングして取り出す））に基づき振動信号（振動データ）を生成する（対象物の音声信号の低周波数成分を取り出し、適当に増幅するなどして生成する）。

　また、振動を発生する対象物を決定する方法としては、コンテンツにおける音声発生物体における発声音の低域特性（例えば、音量レベル）を推定し（上述の例の場合は、物体（オブジェクト）の種別に基づく基準振動強度と、基準位置（コンテンツの仮想空間におけるユーザ存在位置等）と物体（オブジェクト）との距離とに基づき推定）、対象物を決定する（音声発生物体における発声音の低域音量レベルが大きい方を、振動を発生する対象物として決定）。

　このように、対象物の位置に基づいて優先するシーンを決定することで、ユーザの視覚的な直感により適合した振動、つまりユーザの実空間での感覚に合致した振動をユーザに印加することとなり、臨場感豊かなコンテンツに再生が可能になる。

　この際、振動パラメータ抽出部１２５ａは、各振動デバイス５それぞれに対して、それぞれ対応する振動パラメータを抽出する。これにより、一律に振動パラメータを抽出する場合に比べて、臨場感のさらなる向上を図ることができる。

　音声強調パラメータ抽出部１２５ｂは、パラメータ情報ＤＢ１３４を参照し、優先順位設定部１２４により優先順位最上位とされたシーンに対応する音声強調パラメータを抽出する。音声強調パラメータ抽出部１２５ｂは、各スピーカ４に対して個別に音声強調パラメータを抽出するとともに、振動パラメータ抽出部１２５ａと同様に優先順位設定部１２４にて設定された優先順位に基づいて（優先順位最上位のシーンに基づき）抽出する音声強調パラメータを決定する。

　学習部１２５ｃは、パラメータ情報ＤＢ１３４に記憶されたシーンと臨場感パラメータとの関係性を学習する。例えば、学習部１２５ｃは、パラメータ情報ＤＢ１３４に記憶された各シーンと、対応する各臨場感パラメータとを、当該パラメータによる臨場感制御に対するユーザの反応等を学習データとして機械学習を行うことで、シーンと臨場感パラメータとの関係性を学習する。

　この際、例えば、学習部１２５ｃは、臨場感パラメータに対するユーザ評価（臨場感制御後のユーザの調整操作や、アンケート等のユーザ入力）を学習データとして用いることにしてもよい。すなわち、学習部１２５ｃは、どのようなシーンに対してどのような臨場感パラメータを設定すると、高いユーザ評価（すなわち、高い臨場感が得られたか）が得られるかといった視点でシーンと臨場感パラメータとの関係性を学習することにしてもよい。

　さらに、学習部１２５ｃは、新たなシーンが入力された場合に、どのような臨場感パラメータを設定すべきかを学習結果から決定することもできる。具体的な例として、例えば、爆発シーン等の類似状況の臨場感制御の学習結果を用いて、花火シーンの臨場感パラメータを決定することができる。また、臨場感制御後のユーザの調整操作や、アンケート等のユーザ入力に、優先順位を変更するような要素の有無・程度（ユーザの調整操作が同時に存在する他のシーンに対応するパラメータに近づくものであった場合や、アンケートで他シーンを優先すべき回答があった場合等）に基づき、優先順位に関するルールを学習することも可能である。

　これにより、情報処理装置１０では、例えば、優先順位に関するルールや、臨場感パラメータの最適化を自動的に行うことが可能となる。

　図５の説明に戻り、出力部１２６について説明する。出力部１２６は、パラメータ抽出部１２５によって抽出された臨場感パラメータをスピーカ４および振動デバイス５に対し出力する。

　図１６は、出力部１２６のブロック図である。図１６に示すように、出力部１２６は、音声強調処理部１２６ａと、音声振動変換処理部１２６ｂと、振動定位処理部１２６ｃと、を有する。

　音声強調処理部１２６ａは、レンダリング処理部１２２から受け取った音声データをパラメータ抽出部１２５によって抽出された音声強調パラメータを用いた強調処理を行う。例えば、音声強調処理部１２６ａは、音声強調パラメータに基づいて、ディレイあるいは帯域強調・減衰処理を行うことで、音声データに対する強調処理を行う。

　この際、音声強調処理部１２６ａは、スピーカ４毎に音声強調処理を行い、音声強調処理を施した音声データを対応する各スピーカ４に対して出力する。

　音声振動変換処理部１２６ｂは、レンダリング処理部１２２から受け取った音声データをＬＰＦ等の振動に適した帯域制限処理等を行って振動データへ変換する。

　振動定位処理部１２６ｃは、音声振動変換処理部１２６ｂによる変換によって得られた振動データに対して、振動の定位感に関する処理を行う。そして振動定位処理部１２６ｃは、この処理により振幅および遅延の処理が施された振動子ごとの振動データを出力する。振動デバイス５は、振動定位処理部１２６ｃによって出力された振動データに従って各振動子を振動させる。

　図１７を用いて、振動定位処理部１２６ｃによる振動定位処理方法を説明する。図１７は、振動定位処理方法の例を示す図である。

　図１７に示すように、まず、振動定位処理部１２６ｃは、ユーザ（コンテンツ視聴者）に提供する振動の方向成分を特定する（ステップＳ１１）。具体的には、振動の定位感は振動源である物体の存在位置に基づくものであるため、同じ物体に基づく音声の方向成分から物体（振動源）の存在位置（存在方向）を推定し、その推定位置とユーザ位置（コンテンツ空間におけるユーザ位置）から振動の方向成分を推定（特定）する。

　なお、コンテンツにおけるユーザに提供する振動の振動源（物体）は複数あることがあるが、説明を分かりやすくするため、前述の方法により主な振動源（臨場感向上効果が最も大きいと予想される物体）が１つ選択される場合の処理を説明する。また、複数の振動源について、同様の処理を並行して行うことにより、複数の振動源に基づく振動をユーザに効果的に提供し、臨場感豊かにコンテンツを再生することも可能である。

　従って、ユーザを基準とする仮想振動源（この仮想振動源から振動を発生させた状態を再現する）の方向５２は、ＸＲ空間（仮想空間）におけるユーザから音源となっている対象物の方向を示す方向、つまり音声の方向成分となる。

　なお、振動定位処理部１２６ｃは、音声の定位感処理の場合と同様の方法、例えばレンダリング処理部１２２から受け取った音源の位置データ（対象物体の位置）に基づき音声（振動）の方向成分を特定することができる。

　また、例えば、振動定位処理部１２６ｃは、音声データに含まれる複数のチャンネルのそれぞれの音声信号のスペクトルを基に、対象物（音源）の位置を特定し、当該特定した位置に基づき音声（振動）の方向成分を特定することもできる。

　また、振動定位処理部１２６ｃは、コンテンツのメタデータ（対象物体の位置を示すデータを含むメタデータ）を基に音声（振動）の方向成分を特定することができる。

　つまり、３Ｄエンジンを使用して開発されたコンテンツには、各時刻におけるオブジェクトが発生する音声のデータとともに、オブジェクトの仮想空間における位置を示す情報が含まれている。

　例えば、馬の歩行シーンであれば、コンテンツの当該シーンのデータとしては、馬の足音のデータと馬の位置データ（メタデータとして）が含まれているため、振動定位処理部１２６ｃは、この馬の位置データを用いて馬の足音の音源位置（音源である馬の位置）を特定する。

　そして、振動定位処理部１２６ｃは、仮想空間のユーザ位置から馬の足音の音源位置（馬の位置）を結んだ方向を音声の方向成分と特定し、振動の方向成分（定位感方向）として決定する。

　他、コンテンツの画像を画像認識処理することにより、音源対象物体とその位置を認識して音声の方向成分を特定し、振動の方向成分（定位感方向）として決定することも可能である。

　次に、振動定位処理部１２６ｃは、振動デバイス５の各振動子５１の振動制御（振動データ（信号）生成処理）に用いる係数値、補正値等の各種処理用データを決定する。

　例えば、各振動子５１は、特性（入力信号と振動出力の関係、例えば、入力信号レベルと振動出力レベルの比）に個体差があるので、その特性差を補正するための補正データを決定する。具体的には、本実施形態では出力振動レベルの影響が大きいので、入力信号レベルと振動出力レベル（振幅）の比（以降、振動子感度と称する）に基づく振動子特性データを決定する。

　なお、振動子感度のデータは、テスト振動信号を振動子に印加した時の振動振幅を計測し、当該テスト振動信号振幅と振動振幅により算出することができ、その算出データを記憶部１３０（振動子情報ＤＢ１３５）に記憶して利用する。

　また、振動定位処理部１２６ｃは、ユーザの振動に対して受ける感覚の特性である感度特性の差を補正するための感度特性補正データ、ユーザと各振動子の接触状態によるユーザへの振動伝達特性の差を補正するための感度特性補正データを決定する。

　感度特性補正データの１つは、ユーザの個人差による、または体の部位の違いによる振動の感じ方の違いを補正するためのデータで、振動定位処理部１２６ｃは振動感の強度特性である感度特性を感度特性補正データとして決定する。

　なお、感度特性はコンテンツ視聴前にユーザが入力操作すること等により決定することができる。具体的には、所定強度の振動を各振動子からユーザに提供して、当該振動に対する感覚をユーザが入力する等の方法により、感度特性を測定できる。

　また、別の感度特性補正データは、ユーザと各振動子５１の接触状態による振動の感じ方の違いを補正するためのデータで、本実施形態では振動感の強度特性に影響の大きい、ユーザが着座した場合に各振動子が受ける圧力、つまりユーザ着座時における着座面の圧力分布データであり、振動定位処理部１２６ｃは、着座面における各振動子５１設置部分の圧力値を感度特性補正データとして決定する。

　なお、圧力値はユーザがコンテンツ視聴時に着座するシートの座面に圧力センサを設置して測定する方法で決定できる。

　また、ユーザが所定強度の振動を各振動子からユーザに提供して、当該振動に対する感覚をユーザが入力する等の方法により、感度特性と圧力値を合わせた形で感度特性補正データを決定する方法も可能である。

　なお、感度特性補正データはユーザの特性・状態（ユーザの着座状態）に応じた補正データであるので、振動レベル（振動信号を標準特性と定めた振動子に入力した場合の震度のレベル）とユーザ感覚（振動レベル）の比を、以降、ユーザ感度と称する。そして、このユーザ感度は記憶部１３０（振動子情報ＤＢ１３５）に記憶され、コンテンツ再生時に利用される。

　そして、振動定位処理部１２６ｃは、上述の振動子感度とユーザ感度を用いて各振動子の出力レベル補正値を算出して、記憶部１３０（振動子情報ＤＢ１３５）に記憶する。具体的には、振動定位処理部１２６ｃは、振動子感度とユーザ感度とを積算した値の逆数値を出力レベル補正値として、記憶部１３０（振動子情報ＤＢ１３５）に記憶する。つまり、各振動子は振動データに基づき振動するが、その振動をユーザはどのように（どのような振動レベルを）感じるかと言う振動感受特性（振動データとユーザの振動強度感の関係で、この場合振動子の特性要素（特性）も考慮されている）が、出力レベル補正値として、記憶部１３０に記憶されることになる。振動子感度は振動信号レベルと振動レベル（振幅）の比で、ユーザ感度は振動レベル（振幅）とユーザ感覚の比であるので、同じ振動信号レベルの振動信号を各振動子に対応する出力レベル補正値で補正処理（除算）を行って各振動子に入力した場合、ユーザは各振動子から同じレベルの振動を感じることになる。図１７のＳ１２で示した例では、各振動子における出力レベル補正値６１Ａは、振動子５１ＦＬが２、振動子５１ＦＲが４、振動子５１ＲＬが１、振動子５１ＲＲが３、と算出された場合を示している。

　そして、振動定位処理部１２６ｃは、信号処理を行う（ステップＳ１３）。図１８を用いて、信号処理について説明する。図１８は、本実施形態における信号処理方法の原理思想を示す図であり、当該原理に沿った演算式、処理プログラムを制御部１２０（ＣＰＵ）が実行することにより当該処理方法が実現される。また、説明を分かりやすくするため、コンテンツ再生空間における水平面２次元空間での処理（高さ方向を無視して処理）例とする。尚、コンテンツの多くは、振動対象物の平面（地面）上に広く分布し、移動方向も平面（地面）上が多いため、水平面２次元空間での処理で十分に近似処理が可能である。

　図１８に示すように、まず、振動定位処理部１２６ｃは、各振動子の位置を計算処理用の座標空間にプロットする（ステップＳ２１）。つまり、振動定位処理部１２６ｃは、振動子情報ＤＢ１３５から取得した各振動子の位置座標データ（点５３＿ＦＬ、点５３＿ＲＬ、点５３＿ＦＲ、点５３＿ＲＲ）に従って点をプロットする。

　次に、振動定位処理部１２６ｃは、プロットした複数の各振動子の位置座標点の重心を算出する（各点のＸ,Ｙ座標値の平均値座標）。また、振動定位処理部１２６ｃは、複数の各振動子の位置座標点を繋ぐ直線で、多角形（四角形）の外周をなす直線５３５ａ、５３５ｂ、５３５ｃ、５３５ｄ（対角線以外の線）を引く。さらに、振動定位処理部１２６ｃは、当該重心を通り、図１７のステップＳ１１で求めた方向５２に延びる直線５２５を引く。

　そして、振動定位処理部１２６ｃは、直線５２５と、直線５３５ａ、５３５ｃとの交点（点５３１および点５３２）をプロットする（ステップＳ２２）。

　ステップＳ２２で交点がプロットされた線分のうち、方向５２側にある点５３１を通る線分（直線５３５ａ）を無遅延側の線分（５３５ａ）と呼ぶ。また、無遅延側の線分５３５ａの端点（点５３＿ＦＬおよび点５３＿ＦＲ）を、無遅延側の点（５３＿ＦＬ、点５３＿ＦＲ）と呼ぶ。

　また、ステップＳ２２で交点がプロットされた線分のうち、方向５２の逆方向側にある点５３２を通る線分（直線５３５ｃ）を有遅延側の線分（５３５ｃ）と呼ぶ。また、有遅延側の線分５３５ｃの端点（点５３＿ＲＬおよび点５３＿ＲＲ）を、有遅延側の点（５３＿ＲＬ、点５３＿ＲＲ）と呼ぶ。

　なお、各振動子の位置座標点を繋ぐ直線（外周をなす直線）で構成される図形は、四角形でなくてもよく、四角形以外の多角形または多面体であってもよい。つまり、制御対象の振動子に数に応じた多角形（例えば、制御対象振動子が５個の場合は５角形）となる。そして、当該多角形の重心を通り、図１７のステップＳ１１で求めた方向５２に延びる直線５２５と交わる多角形の辺の内、方向５２側が無遅延側の線分、方向５２の逆方向側が有遅延側の線分となる。また、無遅延側の線分の端点が無遅延側の点、有遅延側の線分の端点が有遅延側の点となる。

　また、多角形の重心を通り、図１７のステップＳ１１で求めた方向５２に延びる直線５２５と交わる多角形の辺から、無遅延側の線分、有遅延側の線分を選択するようにした場合、選択される線分は隣り合わない線分となる。このため、後述で記載するが、１つの振動子が、無遅延側振動子に対する振動制御と有遅延側振動子に対する振動制御の両制御を受けることが無くなるので、制御のための演算処理が簡単になる。また、１つの振動子が２つの振動子の動作を兼用することが無くなるので、制御精度も高くなる。また、重心は多角形の各辺に対して同等の関係にあるので、どの方向の振動源に対しても同様の処理内容になることから、処理プログラムの作成が容易になる効果も期待できる。

　続いて、振動定位処理部１２６ｃは、ファントムセンセーション（Ｐｈｓ：Phantom　sensation）の技術思想に基づく振動知覚位置の制御に関する処理を行う。ファントムセンセーションは、「２点を同時に同じ刺激（例えば、振動）を与えると当該２点の中心に刺激を受けているように感じる。また、各々の刺激の大きさ（例えば、振動の場合は振幅）が異なると、刺激を受けているように感じる点（以降、刺激感受点と称する）は大きな刺激の方に移動する。」、と言うものである。そして、刺激感受点の位置は、各刺激点との距離比が、各刺激点における刺激強度比（振動の場合、振幅）と逆比例の関係にあると、近似的には推測される。本実施形態においては、この考えに基づきユーザに与える振動刺激を制御する。

　更に、振動定位処理部１２６ｃは、触仮現運動の技術思想に基づく振動方向感の制御に関する処理を行う。触仮現運動は、「２点の振動に時間差を設けることで振動に移動感覚を出す」と言うものである。

　つまり、振動定位処理部１２６ｃは、ファントムセンセーションおよび触仮現運動の思想に基づきユーザに臨場感豊かな定位感を与える振動を生成する処理を行う。

　具体的には、図１８のステップＳ２２に示す点５３１および点５３２を振動知覚位置とし、点５３１および点５３２における振動時間に時間差を設けることにより、ユーザが振動に対して点５３１および点５３２間の移動感を持つようにする。つまり、ユーザは、点５３１と点５３２を結ぶ直線の方向、すなわち振動源（コンテンツにおける振動発生物体）位置に移動する定位感のある振動を感じることになる。

　まず、ファントムセンセーションの技術思想に基づく処理について、具体例を用いて、詳細に説明する。

　振動定位処理部１２６ｃは、刺激感受点を点５３１および点５３２とする処理を行う。ファントムセンセーションの技術思想に基づくと、点５３１と振動子位置５３＿ＦＬの距離（Ｌ１）と、点５３１と振動子位置５３＿ＦＲの距離（Ｌ２）との比と、振動子５１＿ＦＬが発生する振幅と振動子５１＿ＦＲが発生する振幅との比が、逆数の関係になると、刺激感受点が点５３１となる。従って、振動定位処理部１２６ｃは、振動子５１＿ＦＬに対する補正値６０ＡＦＬ（振動信号に積算する補正値）として、　Ｌ２/（Ｌ１＋Ｌ２）　を算出する。また、振動定位処理部１２６ｃは、振動子５１＿ＦＲに対する補正値６０ＡＦＲとして、　Ｌ１/（Ｌ１＋Ｌ２）　を算出する。

　そして、振動定位処理部１２６ｃは、刺激感受点を点５３２とする処理に関しても同様の処理を行い、振動子５１＿ＲＬに対する補正値６０ＡＲＬとして、　Ｌ４/（Ｌ３＋Ｌ４）　を算出する。また、振動定位処理部１２６ｃは、刺激感受点５３２についても同様の処理を行い、振動子５１＿ＲＲに対する補正値６０ＡＲＲとして、　Ｌ３/（Ｌ３＋Ｌ４）　を算出する。なお、Ｌ３は点５３２と振動子位置５３＿ＲＬの距離、Ｌ４は点５３２と振動子位置５３＿ＲＲの距離である。

　従って、上述の方法で生成された振動データＶＤに補正値６０ＡＦＬを積算して生成した振動信号を振動子５１＿ＦＬに出力し、また振動データＢＤに補正値６０ＡＦＲを積算して生成した振動信号を振動子５１＿ＦＲに出力することにより、ユーザの刺激感受点は点５３１の位置となる。また、同様に、振動データＶＤに補正値６０ＡＲＬを積算して生成した振動信号を振動子５１＿ＲＬに出力し、また振動データＢＤに補正値６０ＡＲＲを積算して生成した振動信号を振動子５１＿ＲＲに出力することにより、ユーザの刺激感受点は点５３２の位置となる。

　例えば、上述の距離Ｌ１、Ｌ２、Ｌ３、Ｌ４が、各々３ｋ、２ｋ、２ｋ、３ｋであった場合、振動子５１＿ＦＬに対する補正値６０ＡＦＬは　３ｋ／（３ｋ＋２ｋ）＝０．６となり、振動子５１＿ＦＲに対する補正値６０ＡＦＲは　２ｋ／（３ｋ＋２ｋ）＝０．４となる。

　また、振動子５１＿ＲＬに対する補正値６０ＡＦＬは　２ｋ／（３ｋ＋２ｋ）＝０．４となり、振動子５１＿ＲＲに対する補正値６０ＡＦＲは　３ｋ／（３ｋ＋２ｋ）＝０．６となる。

　しかし、実際には振動子の個体差、ユーザの感度や振動シートへの着座状態により、ユーザの感じる振動の強度に誤差が生じ、ユーザの刺激感受点は点５４１、５４２の位置になってしまう。

　そこで、振動定位処理部１２６ｃは、図１７で説明した処理により事前に算出した各振動子（５１＿ＦＬ、５１＿ＦＲ、５１＿ＲＬ、５１＿ＲＲ）の出力レベル補正値（６１ＡＦＬ、６１ＡＦＲ、６１ＡＲＬ、６１ＡＲＲ）を用いて、各振動子への振動信号を補正する。

　具体的には、振動定位処理部１２６ｃは、振動子５１＿ＦＬに対する振動データを振動データＶＤと補正値６０ＡＲＬと補正値６１ＡＦＬとの積算値とし、振動子５１＿ＦＬに振動信号を出力するようにする。同様に、振動定位処理部１２６ｃは、振動子５１＿ＦＲに対する振動データを振動データＶＤと補正値６０ＡＦＲと補正値６１ＡＦＲとの積算値とし、振動子５１＿ＦＲに振動信号を出力するようにする。振動定位処理部１２６ｃは、振動子５１＿ＲＬに対する振動データを振動データＶＤと補正値６０ＡＲＬと補正値６１ＡＲＬとの積算値とし、振動子５１＿ＲＬに振動信号を出力するようにする。振動定位処理部１２６ｃは、振動子５１＿ＲＲに対する振動データを振動データＶＤと補正値６０ＡＲＲと補正値６１ＡＲＲとの積算値とし、振動子５１＿ＲＲに振動信号を出力するようにする。

　例えば、上述の各補正値６１ＡＦＲ、６１ＡＦＬ、６１ＡＲＬ、６１ＡＲＲ、を図１７のステップＳ１２に示すように２、４、１、３とし、上述の距離Ｌ１、Ｌ２、Ｌ３、Ｌ４が、各々３ｋ、２ｋ、２ｋ、３ｋであった場合、各振動子５１＿ＦＬ、５１＿ＦＲ、５１＿ＲＬ、５１＿ＲＲに対して出力される振動信号の振動データ５３ＤＦＬ、５３ＤＦＲ、５３ＤＲＬ、５３ＤＲＲは、元となる振動データをＶＤとすると、それぞれ次のようになり、これら振動データ５３Ｄに基づく振動信号が各振動子５１に出力される。
　５３ＤＦＬ＝ＶＤ・３ｋ／（３ｋ＋２ｋ）／２＝０．３・ＶＤ
　５３ＤＦＲ＝ＶＤ・２ｋ／（３ｋ＋２ｋ）／４＝０．１・ＶＤ
　５３ＤＲＬ＝ＶＤ・２ｋ／（２ｋ＋３ｋ）／１＝０．４・ＶＤ
　５３ＤＲＲ＝ＶＤ・３ｋ／（２ｋ＋３ｋ）／３＝０．２・ＶＤ

　これにより、振動子の個体差、ユーザの感度による誤差が補正され、図１８のステップＳ２４に示すように、ユーザの刺激感受点は、点５４１、５４２の位置から、目的とする位置である点５３１、５３２の位置に移動することになる。

　このように、振動定位処理部１２６ｃは、各振動子の配置に基づき、各振動子の出力振動の振幅および遅延を制御する。

　これにより、実際の振動子の配置に合った振幅の制御が可能になり、ユーザはより自然な振動の定位感を感じることができる。

　振動定位処理部１２６ｃは、各振動子の出力振動に対するユーザの振動感受特性に基づき、各振動子の出力振動の振幅および遅延を制御する。

　例えば、情報処理装置１０は、ユーザの身体の部位毎の感度特性を予め記憶しておく。そして、各振動子が密着する部位が、ユーザの身体の左側であるか右側であるか、または大腿部であるか臀部であるかに応じて、振動定位処理部１２６ｃは異なる感度特性を用いる。

　このように、実際のユーザの振動感受特性に合った振幅の制御、つまり振動信号とユーザが感じる振動感覚との関係を考慮して振幅を制御することが可能となり、ユーザの振動の感じ方を設計における狙い通りのものに近付けることができる。

　また、振動感受特性は、振動子ごとの個体差とユーザごとの個人差とを考慮した特性としている。

　例えば、各振動子の入力信号と出力振動レベルの関係や、ユーザの体重や体調、あるいは姿勢等に応じて、振動感受特性を推定し、振動定位処理部１２６ｃは、この振動感受特性を用いて各振動子の振幅を制御する。

　これにより、振動子ごとの個体差と、ユーザごとに個人差が考慮された振動を提供することが可能になる。

　なお、ユーザのコンテンツ視聴時の姿勢状態については、ユーザ入力等による設定が難しい面がある。そこで、振動定位処理部１２６ｃは、ユーザがコンテンツ視聴時の姿勢状態において、前記振動子をキャリブレーション用に振動させて、ユーザの振動感受特性を測定する。

　例えば、情報処理装置１０は、ユーザに視聴姿勢を取るように指示した後、サンプル（ユーザの姿勢に対する振動感受特性のキャリブレーション用）のコンテンツを実際にユーザに視聴させ、振動子にキャリブレーション用振動を発生させる。そして、ユーザの感想または生体情報を基に、ユーザに視聴姿勢に関する振動感受特性補正値を推定する。そして、情報処理装置１０は、得られた振動感受特性補正値を記憶し、後の振動感受特性の算出処理に用いる。

　これにより、各ユーザのコンテンツ視聴時の姿勢状態にきめ細かく適合させた振動を提供することが可能になる。

　さらに、振動定位処理部１２６ｃは、パラメータ情報ＤＢ１３４から取得した振幅用強調係数を基に、シーンに合わせて全ての振動子の振幅を補正する。

　次に、触仮現運動の技術思想に基づく処理について、具体例を用いて、詳細に説明する。

　振動定位処理部１２６ｃは、有遅延側の点に対応する振動子、本例の場合、振動子５１＿ＲＬおよび振動子５１＿ＲＲの遅延時間（Δｔ：無遅延側の点に対応する振動子５１＿ＦＬおよび振動子５１＿ＦＲの振動タイミングからの遅延時間）を計算する（ステップＳ２５）。なお、無遅延側の点に対応する振動子５１＿ＦＬおよび振動子５１＿ＦＲのコンテンツにおける振動発生（同じ対象物体の音声発生）タイミングからの遅延時間は０とするが、コンテンツのシーンによっては無遅延側の点に対応する振動子５１＿ＦＬおよび振動子５１＿ＦＲの振動発生タイミングに遅延する、あるいは早くすることを行っても効果的である。

　遅延時間は所定の固定時間でも臨場感向上の効果はあるが、より効果的にするには、例えば次の式を用いて算出すればよい。
　遅延時間Δｔｉ　＝　ａｉ　・　ｙｉ　・　Ｙ　（ｉは各タイミングを示す）

　ここで、ａｉは遅延要否を示す値で遅延処理必要な場合は１、不要な場合は０となる。また、ｙｉは振動の強調係数でコンテンツの対象シーンにおける振動発生対象物体が発生する振動を適度に強調するための値である。例えば、振動を強く強調したい場面では強調係数ａｉは大きな値となり、遅延時間もその強調度に応じて長くし、その差異を感じやすくする。また、Ｙは振動が刺激感受点の点５３１と点５３２の間の距離を伝わるのに必要な時間の値が原理的な値となるが、適当な定数を用いるのが処理負荷を低減するには有利ある。なお、Ｙの定数としては、点５３１と点５３２の間の距離の中間値（振動子位置５３＿ＦＬと振動子位置５３＿ＲＬの距離と、振動子位置５３＿ＦＲと振動子位置５３＿ＲＬの距離との平均）や、感応試験等により適切と決定した値を用いれば良い。

　これら遅延要否値ａｉおよび強調係数ｙｉは、コンテンツの対象シーンにおける振動発生対象物体の状態に応じて決まる値で、例えば、コンテンツ画像の画像解析結果、コンテンツ音声（特に振動発生対象物の発生音声）解析結果、あるいはコンテンツの付加情報（予めコンテンツに制御用データとして付加しておく）等に基づき決定される。

　振動定位処理部１２６ｃは、この計算式を用いて各シーンでの遅延時間Δｔｉを算出し、各振動子５１に算出した遅延時間Δｔｉに基づいた各タイミングで対応する振動信号を出力して、各振動子５１を振動させる（ステップＳ２５）。

　例えば、上述の振動データ例において、算出した遅延時間Δｔｉが１秒であった場合は、以下のように各振動子が振動することになる。
　振動子５１＿ＦＬ：振動データ　０．３・ＶＤ、振動タイミング　０秒（コンテンツにおける対象シーンの再生タイミングからの遅延時間、以下の振動子も同様）
　振動子５１＿ＦＲ：振動データ　０．１・ＶＤ、振動タイミング　０秒
　振動子５１＿ＲＬ：振動データ　０．４・ＶＤ、振動タイミング　１秒
　振動子５１＿ＲＲ：振動データ　０．２・ＶＤ、振動タイミング　１秒

　これにより、ユーザは、コンテンツにおける対象シーンの再生タイミングで点５３１での振動を感じ、その１秒後に点５３２で振動を感じるので、振動源からの方向に沿った振動を感じることになる。従って、ユーザは振動源（振動発生物体）の定位感を適切に感じることができ、臨場感豊かなコンテンツ再生を楽しむことになる。

　次に振動子５１の上述の遅延駆動に関する変形例について説明する。上述の処理例では、振動定位処理部１２６ｃ（出力部１２６）は、無遅延側の点に対応する振動子から有遅延側の点に対応する振動子に、不連続に振動を移動するような処理を行ったが、本例では振動位置が徐々に移動する感覚をユーザに感じさせるようにする。なお、この処理もファントムセンセーションの技術思想に基づくものである。

　具体的には、振動定位処理部１２６ｃは、遅延時間Δｔの時間をかけて、無遅延側の点に対応する振動子５１＿ＦＬおよび振動子５１＿ＦＲの振幅を減衰させる。また、振動定位処理部１２６ｃは、遅延時間Δｔの時間をかけて、有遅延側の点に対応する振動子５１＿ＲＬおよび振動子５１＿ＲＲの振幅を増強させる。

　例えば、上述の振動データ例において、遅延時間Δｔｉが１秒であった場合、コンテンツにおける対象シーンの再生タイミングからのＴ秒（Ｔは遅延時間Δｔｉ（１秒）以下）後には以下のような振動データに基づき各振動子が振動することになる。
　振動子５１＿ＦＬ：振動データ　０．３・ＶＤ・（（１－Ｔ）／１）
　振動子５１＿ＦＲ：振動データ　０．１・ＶＤ・（（１－Ｔ）／１）
　振動子５１＿ＲＬ：振動データ　０．４・ＶＤ・（Ｔ／１）
　振動子５１＿ＲＲ：振動データ　０．２・ＶＤ・（Ｔ／１）

　なお、無遅延側の点に対応する振動子５１＿ＦＬおよび振動子５１＿ＦＲに対する減衰最終値を無音レベルではなく適度な弱音レベルとすることや、コンテンツにおける対象シーンの再生タイミングから遅延時間Δｔ経過前に減衰最終値とする制御も有効である。また、有遅延側の点に対応する振動子５１＿ＲＬおよび振動子５１＿ＲＲに対する振幅増強開始を無音レベルではなく適度な弱音レベルから行うことや、コンテンツにおける対象シーンの再生タイミングから所定時間（遅延時間Δｔ以下）経過後に減衰開始値とする制御も有効である。

　このように本実施形態によれば、ファントムセンセーションおよび触仮現運動の技術思想に基づき、振動源の位置感および振動の移動感をコンテンツの内容に応じてコンテンツ視聴ユーザに適切に感じさせることができるので、当該ユーザはコンテンツの臨場感豊かな再生を楽しむことができる。

　なお、これらの動作を概念化すると、「複数の振動子（振動子５１＿ＦＬおよび振動子５１＿ＦＲ）からなる第１振動子群における各振動子の振動レベルに基づき決まる第１合成振動位置（点５５１）と、複数の振動子（振動子５１＿ＲＬおよび振動子５１＿ＲＲ）からなる第２振動子群における各振動子の振動レベルに基づき決まる第１合成振動位置（点５５２）との位置関係(点５５１と点５５２とを結ぶ線)が、特定した前記振動源の方向成分（方向５２）と一致するように、前記各振動子の出力振動の振幅を制御し、
　前記振動源の方向成分に応じて前記各振動子の出力振動の遅延（振動子５１＿ＦＬおよび振動子５１＿ＦＲの振動タイミング（例えば、コンテンツでの振動発生から遅延０）と、振動子５１＿ＲＬおよび振動子５１＿ＲＲの振動タイミング（例えば、コンテンツでの振動発生から遅延Δｔ））を制御する。」、と言うことになる。

　次に、図１９を用いて、実施形態に係る情報処理装置１０が実行する処理手順について説明する。図１９は、情報処理装置１０が実行する処理手順を示すフローチャートである。なお、以下に示す処理手順は、制御部１２０によって繰り返し実行される。

　図１９に示すフローチャートの処理は、情報処理システム１の電源オン状態で繰り返し実行される。処理が開始されると、ＸＲコンテンツ再生開始操作があるかどうか判断され、開始操作が検出されると（ステップＳ１０１、Ｙｅｓ）ステップＳ１０２の処理に移り、無ければ処理を終える（ステップＳ１０１、Ｎｏ）。

　そして、先ずＸＲコンテンツ設定処理を実行する（ステップＳ１０２）。なお、ここでのＸＲコンテンツ設定処理とは、例えば、ＸＲコンテンツ再生のための装置の各初期設定、ユーザによるＸＲコンテンツの選択等に関する各種処理が含まれる。

　つづいて、情報処理装置１０は、ＸＲコンテンツの再生を開始し（ステップＳ１０３）、再生中のＸＲコンテンツに対しシーン検出処理を行う（ステップＳ１０４）。つづいて、情報処理装置１０は、シーン検出処理の結果に対して優先順位設定処理を行い（ステップＳ１０５）、臨場感パラメータ抽出処理を実行する（ステップＳ１０６）。

　そして、情報処理装置１０は、臨場感パラメータ抽出処理の処理結果を反映させた各種振動データあるいは音声データの出力処理を実行する（ステップＳ１０７）。そして、情報処理装置１０は、ＸＲコンテンツが終了したか否かを判定し（ステップＳ１０８）、ＸＲコンテンツが終了したと判定した場合（ステップＳ１０８；Ｙｅｓ）、処理を終了する。

　また、情報処理装置１０は、ステップＳ１０８の判定において、ＸＲコンテンツが終了していないと判定した場合には（ステップＳ１０８；Ｎｏ）、再び、ステップＳ１０４の処理へ移行する。

　図２０を用いて、振動定位処理の手順を説明する。図２０は、振動定位処理の手順を示すフローチャートである。振動定位処理は、振動定位処理部１２６ｃ（制御部１２０）によって実行される処理に相当する。また、この処理は図１９で示した処理におけるステップＳ１０６、ステップＳ１０７の処理の一部として行われる。なお、各ステップの具体的詳細処理内容について前述した処理内容となる。

　まず、図２０に示すように、振動定位処理部１２６ｃは、音声（振動）の方向成分を特定する（ステップＳ２０１）。

　次に、振動定位処理部１２６ｃは、各振動子の個体差、ユーザの個人差、ユーザのコンテンツ視聴状態等によるユーザが感じる振動レベル差を補正するための補正値ＣＩを決定する（ステップＳ２０２）。なお、この補正値ＣＩは当該コンテンツ再生前（ユーザ着座時等）に予め求められ記憶されており、このステップＳ２０２では記憶された補正値ＣＩを読み出すことになる。

　続いて、振動定位処理部１２６ｃは、ファントムセンセーション技術思想に基づき、ステップＳ２０１で決定した音声の方向成分と各振動子の設置位置情報を用いて、各振動子の振動レベルを補正する補正値ＦＳを算出する（ステップＳ２０３）。

　そして、振動定位処理部１２６ｃは、ステップＳ２０２で決定した振動子の個体差等の影響を補正する補正値ＣＩと、ステップＳ２０３で算出したファントムセンセーション技術思想に基づく補正値ＦＳから（積算して）、各振動子に対する振動データを補正する補正値ＣＶを決定する。そして、コンテンツに基づき別途決定された振動データに対して、決定した各振動子の振動に対する補正値ＣＶで補正を施し（積算）、各振動子への出力データを決定する（ステップＳ２０４）。

　次に振動定位処理部１２６ｃは、触仮現運動の技術思想に基づき、各振動子の振動タイミング（各振動子への振動信号出力タイミング）を算出する。つまり、コンテンツのシーンにおける振動発生物体の振動発生タイミング（本実施形態では音声信号に基づき振動信号が生成されるので、音声発生タイミングとなる）からの遅延時間を算出する（ステップＳ２０５）。

　そして、振動定位処理部１２６ｃは、各振動子に対する振動データ、および振動タイミングのデータを出力用のデータとして提供し、出力部１２６は各振動子に出力信号を出力する（図１９のステップＳ１０７）。

　上述したように、実施形態に係る情報処理装置１０の振動定位処理部１２６ｃは、複数の振動子を備え、入力されたコンテンツにおける、振動源の方向成分を特定し、方向成分に基づき、各振動子の出力振動の振幅および遅延を制御する。

　このような制御により、情報処理装置１０は、複数の振動子の出力振動の振幅および遅延を調整することで、音源の定位感（位置感）および振動の伝達する感覚（振動の移動感）をユーザに与えることができる。つまり、情報処理装置１０は、各振動子における出力振動の振幅の関係で音源の定位感をユーザに与え、各振動子における出力振動のタイミングの違いで振動の移動感をユーザに与える。その結果、情報処理装置１０によれば、コンテンツにおける振動の感覚を臨場感豊かにユーザに提供することができる。

［第２の実施形態］
　第２の実施形態は、ファントムセンセーション技術思想に基づく補正値の算出処理を簡単にし、例えば比較的低速の演算処理装置（ＣＰＵ等）でも対応できるようにしたものである。

　概略的には、音声（振動）の方向成分を適当な数の領域単位で特定し（本実施例では８つの角度領域、つまり８段階に特定）、その後の補正値の算出を、各角度領域のモデル処理で求める、例えば各角度領域の制御値が記憶されたデータテーブルを用いる、あるいは各角度領域に対して設計された演算処理ルーチンを用いる等して処理を簡単にし、演算処理装置の処理負荷を低減したものである。

　図２２を用いて、事前に振幅および遅延時間を設定する方法を説明する。図２２は、振動の方向成分を決定する方法を示す図である。

　振動定位処理部１２６ｃ（制御部１２０）は、コンテンツにおける振動（本実施形態ではコンテンツにおける音声から推定）の方向成分が、ユーザ周囲を８分割した角度領域ｒ１～ｒ８のどの領域に属するか判定する（ステップＳ３１）。尚、角度領域を定めるデータは記憶部１３０に予め（設計時等）記憶されており、当該記憶されたデータを用いて振動の方向成分の角度領域が判定される。また、本実施形態では、ステップＳ３１に示すように正面の４５度の角度領域ｒ１を基準とする４５度毎の角度領域ｒ１～ｒ８が設定されている。

　そして、振動定位処理部１２６ｃは、振動の方向成分が属すると判定された角度領域の中心となる方向（ｄ１～ｄ８：代表方向と称する）を、ファントムセンセーション技術思想に基づく補正値の算出に用いる振動の方向データとして決定する。なお、この処理は、角度領域ｒ１～ｒ８と代表方向ｄ１～ｄ８の関係を示すデータテーブルを予め記憶部１３０に記憶しておき、当該データテーブルのデータを用いて照合する等の方法により実現できる。

　例えば、コンテンツ視聴ユーザの正面を０°として時計回りを正の角度で表記すると、領域ｒ１は－３０°から３０°の領域であり、その代表方向ｄ１は０°の方向である。また、領域ｒ２は３０°から６０°の領域であり、方向ｄ１は４５°の方向である。そして、例えば、振動の方向成分が４５°であったとすると、振動定位処理部１２６ｃは、その代表方向はｄ２と判定し、その後の処理に代表方向はｄ２が使用されることになる。

　そして、情報処理装置１０は、上記方法により決定された、振動の方向成分の代表方向データを用いて、図１７で示した方法と同等の信号処理を行う。この際、代表方向ｄは８種類しかないので、本実施形態ではこの８種類の各代表方向ｄ１～ｄ８について、予めファントムセンセーション技術思想に基づく補正値の算出しておき、記憶部１３０にデータテーブルとして記憶している。

　また、さらに触仮現運動の技術思想に基づく補正値も事前に算出しておき、その算出した補正値と、上述のようにして求めたファントムセンセーション技術思想に基づく補正値とに基づき算出される（例えば、振動レベルに対する補正値の積算）、統合した補正値を記憶部１３０にデータテーブルとして記憶している。この場合、ファントムセンセーション技術思想に基づく補正値のデータテーブルは省略できる。

　なお、統合した補正値は算出せず、ファントムセンセーション技術思想に基づく補正値はデータテーブルを用いて算出し、触仮現運動の技術思想に基づく補正値はデータテーブルを用いずに補正値を算出する方法で、それぞれの補正値で振動データを補正する方法も実施可能である。

　図２１は、ファントムセンセーション技術思想、および触仮現運動の技術思想に基づく補正値のデータテーブルの一例を示すデータテーブル構成図である。

　データテーブルは、振動子毎（５１ＦＬ、５１ＦＲ、５１ＲＬ、５１ＲＲ）、また代表方向毎（ｄ１～ｄ８）に、予め（設計時等）に算出された振動振幅に対する補正値と振動タイミング（遅延）に対する補正値が記憶されている。

　そして、振動定位処理部１２６ｃは、決定された代表方向ｄに対応する振幅及び遅延の補正値を各振動子５１に毎にデータテーブルから抽出し、振動データを補正する。

　例えば、代表方向が方向ｄ２の場合は、振動子５１ＦＬに対する振幅補正値は－２ｄｂ、遅延時間は０ｍｓ、また振動子５１ＦＲに対する振幅補正値は＋４ｄｂ、遅延時間は０ｍｓ、振動子５１ＲＬに対する振幅補正値は＋４ｄｂ、遅延時間は５０ｍｓ、振動子５１ＲＲに対する振幅補正値は－４ｄｂ、遅延時間は５０ｍｓとなる。そして、これら補正値により振動データが補正され、対応する振動信号が各振動子５１に出力される。

　なお、図２１に示したデータテーブルは、コンテンツ視聴状況により異なる要素、例えばユーザの感度やシートへの着座状態（座面の圧力分布）を補正の要素として除いたもの、またシート種別（振動子自体、あるいはその配置が異なる等）等を補正の要素として除いたものであるが、これらの変動要素をパラメータとして加えたデータテーブルとすることにより、これらの変動要素に対応した制御を行うことも可能となる。

　このように、第２の実施形態では、情報処理装置１０は、振動の方向成分が、予め定められた複数の角度領域のどの角度領域に属するか判定し、前記角度領域毎に予め設定されたモデル（図２１データテーブル）から、前記判定された方向成分の角度領域に対応するモデル（図２１データテーブルの該当する方向のデータ群）を選択し、前記選択されたモデルに基づき前記各振動子の出力振動の振幅および遅延を制御する。

　具体的には、モデルは、複数の角度領域毎に、振幅に対する振幅補正値と、遅延に対する遅延補正値が記憶されたデータテーブル（図２１データテーブル）を有する。情報処理装置１０は、方向成分の角度領域に対応するデータテーブルに記憶された各振動子ごとの振幅補正値と遅延補正値に基づき、各振動子の出力振動の振幅および遅延を制御する。

　従って、第２の実施形態では、振動の方向成分を用いた複雑な処理を行うことなく、振動の方向成分が属する角度領域に対応して予め生成されたモデル（データテーブル）を用いた処理で制御を行えるので、計算量を少なくする等、処理負荷を低減できる。

　ところで、上述した実施形態では、コンテンツがＸＲコンテンツである場合について説明したが、これに限定されるものではない。すなわち、コンテンツは、２Ｄの映像および音声、あるいは、映像のみ、または、音声のみであってもよい。

　さらなる効果や変形例は、当業者によって容易に導き出すことができる。このため、本発明のより広範な態様は、以上のように表しかつ記述した特定の詳細および代表的な実施形態に限定されるものではない。したがって、添付の特許請求の範囲およびその均等物によって定義される総括的な発明の概念の精神または範囲から逸脱することなく、様々な変更が可能である。

１　情報処理システム
３　表示装置
４　スピーカ
５　振動デバイス
１０　情報処理装置
３１　画像
１２１　コンテンツ生成部
１２２　レンダリング処理部
１２３　シーン検出部
１２３ａ　シーン判定部
１２３ｂ　条件設定部
１２４　優先順位設定部
１２４ａ　タイミング検出部
１２４ｂ　ルール設定部
１２５　パラメータ抽出部
１２５ａ　振動パラメータ抽出部
１２５ｂ　音声強調パラメータ抽出部
１２５ｃ　学習部
１２６　出力部
１２６ａ　音声強調処理部
１２６ｂ　音声振動変換処理部
１２６ｃ　振動定位処理部
１３１　ＸＲコンテンツＤＢ
１３２　シーン情報ＤＢ
１３３　優先順位情報ＤＢ
１３４　パラメータ情報ＤＢ
３１１、３１２　オブジェクト

Claims

　ユーザにコンテンツに応じた振動を印加し、複数の振動子を備えた振動デバイスを制御する情報処理装置であって、
　制御部を備え、
　前記制御部は、
　入力されたコンテンツにおける振動源の方向成分を特定し、
　前記方向成分に基づき、前記各振動子の出力振動の振幅および遅延を制御する
　情報処理装置。
　前記制御部は、
　前記方向成分が、予め定められた複数の角度領域のどの角度領域に属するか判定し、
　前記角度領域毎に予め設定されたモデルから、前記判定された方向成分の角度領域に対応するモデルを選択し、
　前記選択されたモデルに基づき前記各振動子の出力振動の振幅および遅延を制御する
　請求項１に記載の情報処理装置。
　前記モデルは、前記複数の角度領域毎に、振幅に対する振幅補正値と、遅延に対する遅延補正値と、が記憶されたデータテーブルを有し、
　前記制御部は、
　前記方向成分の角度領域に対応する前記データテーブルに記憶された振幅補正値と遅延補正値に基づき、前記各振動子の出力振動の振幅および遅延を制御する
　請求項２に記載の情報処理装置。
　前記制御部は、
　前記各振動子の配置に基づき、前記各振動子の出力振動の振幅および遅延を制御する
　請求項１に記載の情報処理装置。
　前記制御部は、
　前記各振動子の出力振動に対するユーザの振動感受特性に基づき、前記各振動子の出力振動の振幅および遅延を制御する
　請求項１から４のいずれか１項に記載の情報処理装置。
　前記制御部は、
　前記ユーザの振動感受特性を、前記振動子の特性とユーザの状態に基づき算出する
　請求項５に記載の情報処理装置。
　前記制御部は、
　ユーザがコンテンツ視聴時の姿勢状態において、前記振動子をキャリブレーション用に振動させて、ユーザの振動感受特性を測定する
　請求項５に記載の情報処理装置。
　前記制御部は、
　　複数の振動子からなる第１振動子群における各振動子の振動レベルに基づき決まる第１合成振動位置と、複数の振動子からなる第２振動子群における各振動子の振動レベルに基づき決まる第１合成振動位置との関係が、特定した前記振動源の方向成分と一致するように、前記各振動子の出力振動の振幅を制御し、
　　前記振動源の方向成分に応じて前記各振動子の出力振動の遅延を制御する
　請求項１に記載の情報処理装置。
　ＸＲコンテンツを再生する情報処理装置と、
　前記情報処理装置から出力される映像信号に応じて映像を表示する表示装置と、
　前記情報処理装置から出力される音声信号に応じて音声を発生させる音声出力デバイスと、
　複数の振動子を備え、前記情報処理装置から出力される振動信号に応じた振動をユーザに印加する振動デバイスと
　を備え、
　前記情報処理装置の制御部は、
　前記ＸＲコンテンツから、対象物から音声が発生しているシーンを検出し、
　前記シーンに対応する振動パラメータであって、前記振動デバイスを制御する振動パラメータを抽出し、
　前記対象物から発生する音声の信号を加工して得られた信号を、前記振動パラメータを用いて強調処理した信号と、前記ＸＲコンテンツにおける、前記振動デバイスに対する前記対象物の方向成分を特定し、前記方向成分に基づき、前記振動子のそれぞれの振幅および遅延を制御する信号と、を前記振動信号として前記振動デバイスへ出力し、
　前記シーンに対応する音声処理に関する音声パラメータを抽出し、
　前記音声パラメータを用いて強調処理した前記音声信号を、前記音声出力デバイスへ出力する
　情報処理システム。
　複数の振動子を備え、ユーザにコンテンツに応じた振動を印加する振動デバイスを制御する情報処理方法であって、
　入力されたコンテンツにおける振動源の方向成分を特定し、
　前記方向成分に基づき、前記各振動子の出力振動の振幅および遅延を制御する信号を、前記振動デバイスへ出力する
　処理をコンピュータが実行する情報処理方法。