JP4826034B2 - Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus - Google Patents
Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus Download PDFInfo
- Publication number
- JP4826034B2 JP4826034B2 JP2001190663A JP2001190663A JP4826034B2 JP 4826034 B2 JP4826034 B2 JP 4826034B2 JP 2001190663 A JP2001190663 A JP 2001190663A JP 2001190663 A JP2001190663 A JP 2001190663A JP 4826034 B2 JP4826034 B2 JP 4826034B2
- Authority
- JP
- Japan
- Prior art keywords
- content
- speech
- input
- level
- multiplexed signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Television Receiver Circuits (AREA)
- Television Systems (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、放送やネットワークによって配信された、少なくとも音声情報を含む一連の情報であるコンテンツを、受信する方法および装置、および、光ディスクなどの記録媒体から、少なくとも音声情報を含む一連の情報であるコンテンツを、再生する方法および装置に関する。
【0002】
なお、この発明では、映像情報(画像情報)と音声情報(音響情報)、または音声情報のみなど、少なくとも音声情報を含む一連の情報をコンテンツと定義する。音声情報は、人の話声(発話音声)、音楽の音響、自然音や物音の音響など、人が聴覚上認識できる全ての音声(音響)を含むものである。
【0003】
【従来の技術】
コンテンツ、例えば映像情報と音声情報を含むコンテンツを、受信または再生する装置は、テレビ受信装置やDVD(Digital Versatile Disc)再生装置などに見られるように、音量調整機能や、音量が所定レベルを超えた場合に対する保護機能を備え、適度な音量に調整でき、大音量から機器や聴覚を保護するように構成されている。
【0004】
【発明が解決しようとする課題】
コンテンツ中の音声情報には、人の話声、音楽の音響、自然音や物音の音響など、様々な音声(音響)が含まれ、また、話声にも、遠くからの小さな声や、近くからの大きな声など、様々な声がある。
【0005】
しかしながら、このように様々な種類やレベルの音声情報を含むコンテンツを受信または再生する場合であっても、従来の受信装置または再生装置は、音量レベルを適当なレベルに固定してコンテンツを最初から最後まで出力するのが、ほとんどであり、視聴者(ユーザ)が、音量が小さすぎると、または大きすぎると、感じたときにのみ、音量設定を変えることができるように構成されている。
【0006】
そのため、十分に静寂な視聴環境でないと、または若年で広いダイナミックレンジに対応できる聴覚をもつ視聴者でないと、コンテンツ中の音声情報を十分に楽しむことができない。
【0007】
すなわち、騒音のある視聴環境であると、騒音によって小さな音が妨害されてしまい、特に、小さな声では、何を言っているのかが分からなくなる。それに対処しようとして、音量を大きくすると、声は大きく、聞きやすくなるが、音楽が流れている期間など、その他の時には、うるさくなる。
【0008】
また、視聴者が高齢者で、小さい音が聞こえにくく、さらに、大きい音が聴覚的に歪んでしまうような老人性難聴である場合には、音声レベルに応じて常に音量調整をしないと、話声が聞こえにくいという不便さがある。
【0009】
音声の種類に応じて音声を選択的に増幅することも考えられているが、話声とその他の音声とを、正確に区別することが難しく、誤って認識することがあるとともに、老人性難聴のような聴覚の視聴者にとっては、話声を単純に増幅するだけでは聞き取りやすさが改善されないため、十分な対応を期待することができない。
【0010】
そこで、この発明は、少なくとも音声情報を含む一連の情報であるコンテンツを受信または再生する場合に、コンテンツ中の音声情報自体から話声とその他の音声を区別しなくても、話声を聞き取りやすくすることができるようにしたものである。
【0011】
【課題を解決するための手段】
この発明のコンテンツ受信方法では、少なくとも音声情報を含む一連の情報であるコンテンツに、このコンテンツ中の音声情報の話声が主体または話声のみの期間である話声期間を示す話声期間識別情報が多重化された多重化信号を受信し、当該受信した多重化信号から、コンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると共に、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換し、操作入力部を介して音量調整の指示が行われると、当該指示に従ってレベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更して、操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの境界点の入出力レベルと、そのときのコンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録しておき、多重化信号を再び受信してコンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると、当該再生しているコンテンツ及びシーンと対応付けられている境界点の入出力レベルを記憶手段から読み出し、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、読み出した境界点の入出力レベルによって定められるレベル変換特性によってレベル変換するようにした。
【0012】
この発明のコンテンツ再生方法では、少なくとも音声情報を含む一連の情報であるコンテンツに、このコンテンツ中の音声情報の話声が主体または話声のみの期間である話声期間を示す話声期間識別情報が多重化された多重化信号を記録媒体から読み取り、当該読み取った多重化信号から、コンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると共に、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換し、操作入力部を介して音量調整の指示が行われると、当該指示に従って、レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更して、操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの境界点の入出力レベルと、そのときのコンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録しておき、多重化信号を記録媒体から再び読み取ってコンテンツおよび話声期間識別情報を分離しし、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると、当該再生しているコンテンツ及びシーンと対応付けられている境界点の入出力レベルを記憶手段から読み出し、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、読み出した境界点の入出力レベルによって定められるレベル変換特性によってレベル変換するようにした。
【0013】
【発明の実施の形態】
〔受信装置および再生装置のシステム構成…図1および図2〕
(受信装置のシステム構成…図1)
図1は、この発明のコンテンツ受信装置の一実施形態を示し、デジタルテレビ放送を受信する放送受信装置の場合である。
【0014】
この場合の放送は、コンテンツが番組の映像情報および音声情報を含むものであり、そのコンテンツに付加情報が多重化されたものである。付加情報は、コンテンツ(番組)を識別する情報であるコンテンツ識別コード、番組の各シーンまたは特定のシーンを識別する情報であるシーン識別コード、および番組の音声情報の話声が主体または話声のみの期間である話声期間を示す話声期間識別情報などである。
【0015】
具体的に、映像データおよび音声データが、MPEG(Moving Picture Experts Group)方式などによって圧縮符号化され、多重化されるとともに、付加情報データが、符号化され、映像音声データストリームとは別に多重化されて、全体が変調されて放送される。
【0016】
付加情報データは、付加情報がコンテンツ識別コードであるか、シーン識別コードであるか、話声期間識別情報であるかなど、付加情報の種別を示すコードを有するヘッダ部と、これに続く、コンテンツ識別コード、シーン識別コード、話声期間識別情報などのデータ部とからなるものとされる。
【0017】
また、放送信号には、デコード・タイムスタンプなどのデコード時刻情報、およびプレゼンテーション・タイムスタンプなどのコンテンツ呈示時刻情報が多重化される。
【0018】
選局受信部19では、操作入力部16での視聴者の選局操作に基づくシステムコントローラ17の選局制御によって、放送信号が選局受信される。その選局受信された信号は、復調エラー訂正部21で復調され、エラー訂正された後、バッファ22に書き込まれ、バッファ22から読み出される。
【0019】
バッファ22から読み出された信号は、デマルチプレクサ23に供給され、デマルチプレクサ23から、それぞれ符号化された映像データ、字幕データ、音声データおよび付加情報データが、分離されて得られる。
【0020】
その映像データ、字幕データおよび音声データは、それぞれ、ビデオコードバッファ31、字幕コードバッファ41およびオーディオコードバッファ51に書き込まれ、ビデオコードバッファ31、字幕コードバッファ41およびオーディオコードバッファ51から読み出された後、それぞれ、ビデオデコーダ32、字幕デコーダ42およびオーディオデコーダ52でデコードされる。
【0021】
システムコントローラ17は、上記のデコード・タイムスタンプのようなタイミング情報に基づいて、各デコーダ32,42,52におけるデコードタイミングを制御し、上記のプレゼンテーション・タイムスタンプのようなタイミング情報に基づいて、各デコーダ32,42,52からのデータの時系列を整合させるように、各デコーダ32,42,52における出力タイミングを制御する。
【0022】
ビデオデコーダ32からの映像データ、および字幕デコーダ42からの字幕データは、映像処理部33で処理され、映像処理部33において、映像信号中に字幕信号がスーパーインポーズされる。
【0023】
映像処理部33の出力の映像信号は、映像出力端子34に導出され、映像出力端子34から、CRTディスプレイや液晶ビデオプロジェクタなどの映像表示装置35に送出される。
【0024】
映像信号は、映像処理部33でアナログ映像信号に変換されることなくデジタル映像データのまま、D/A(Digital to Analog)変換部を備える映像表示装置35に送出され、または映像処理部33でアナログ映像信号に変換されて、映像表示装置35に送出される。
【0025】
オーディオデコーダ52からの音声データは、音声処理部53で処理され、音声処理部53の出力の音声信号は、音声出力端子54に導出され、音声出力端子54から、スピーカやヘッドホンなどの音声出力装置55に送出される。
【0026】
音声信号も、音声処理部53でアナログ音声信号に変換されることなくデジタル音声データのまま、D/A変換部を備える音声出力装置55に送出され、または音声処理部53でアナログ音声信号に変換されて、音声出力装置55に送出される。
【0027】
デマルチプレクサ23で分離された付加情報データは、付加情報コードバッファ61に書き込まれ、付加情報コードバッファ61から読み出された後、話声期間識別情報検出部62および識別コード検出部63に送出される。
【0028】
話声期間識別情報検出部62では、付加情報データ中のヘッダ部の種別コードによって、話声期間識別情報が検出され、その検出された話声期間識別情報は、システムコントローラ17に取り込まれて、デコードされる。
【0029】
識別コード検出部63では、付加情報データ中のヘッダ部の種別コードによって、コンテンツ識別コードおよびシーン識別コードが検出され、その検出されたコンテンツ識別コードおよびシーン識別コードは、システムコントローラ17に取り込まれて、デコードされる。
【0030】
システムコントローラ17は、話声期間識別情報が検出されたとき、映像処理部33を制御して、そのシーンが話声期間であることを、映像表示装置35の表示画面上に呈示する。例えば、そのシーンの映像中に、話声期間であることを示すマークまたは文字をスーパーインポーズする。
【0031】
視聴者は、その表示を見て、音声を聞き取りやすくしたいときには、操作入力部16での操作によって、後述のように音声を聞き取りやすくするような音量調整をする。これによって、システムコントローラ17は、音声処理部53を制御して、後述のように音声が聞き取りやすくなるような音声処理を行わせる。
【0032】
話声期間であることの呈示は、視聴者が操作入力部16での設定操作によってオン・オフを切り替えられるように、受信装置を構成してもよい。さらに、話声期間であることが呈示されないように、受信装置を構成してもよい。
【0033】
呈示オフに切り替えられている状態でも、または話声期間であることが呈示されない構成とされた場合でも、視聴者が、音声出力装置55から出力される音声を聞いて、音声を聞き取りやすくするような音量調整をしたときには、システムコントローラ17は、音声処理部53を制御して、音声が聞き取りやすくなるような音声処理を行わせる。
【0034】
話声期間において、視聴者が特に音量調整をしない場合には、システムコントローラ17は、後述のように、あらかじめ設定された音声処理パラメータによって音声処理を行うように音声処理部53を制御する。
【0035】
システムコントローラ17には、後述のように視聴者の音量調整による音声処理パラメータが書き込まれる記憶装置18が接続される。記憶装置18は、受信装置に内蔵されたフラッシュメモリやEEPROMなどの不揮発性メモリ、またはメモリカード、磁気ディスク、光ディスク、光磁気ディスクなどの外部記憶媒体とされる。
【0036】
なお、図1では、話声期間識別情報検出部62、識別コード検出部63およびシステムコントローラ17を、機能的に分離して示しているが、話声期間識別情報検出部62および識別コード検出部63の機能は、システムコントローラ17の一部の機能として構成することもできる。
【0037】
(再生装置のシステム構成…図2)
図2は、この発明のコンテンツ再生装置の一実施形態を示し、光ディスク再生装置の場合である。
【0038】
光ディスク11には、コンテンツに多重化されて、付加情報が記録されている。この場合のコンテンツは、映像情報および音声情報を含むものであり、付加情報は、上述したコンテンツ識別コード、シーン識別コードおよび話声期間識別情報などである。
【0039】
具体的に、映像データおよび音声データが、MPEG方式などによって圧縮符号化され、多重化されるとともに、付加情報データが、符号化され、映像音声データストリームとは別に多重化されて、全体が変調されて、光ディスク11に記録されている。
【0040】
付加情報データは、上述したように、付加情報の種別を示すコードを有するヘッダ部と、これに続く、コンテンツ識別コード、シーン識別コード、話声期間識別情報などのデータ部とからなるものとされる。
【0041】
また、光ディスク11には、デコード・タイムスタンプなどのデコード時刻情報、およびプレゼンテーション・タイムスタンプなどのコンテンツ呈示時刻情報が記録されている。
【0042】
光ディスク11は、ディスクモータ13によって駆動される。光ヘッド(ピックアップ)14は、送りモータとトラッキング用およびフォーカシング用の2軸アクチュエータを含むドライブユニット15によって駆動される。
【0043】
操作入力部16での視聴者の再生操作によって、システムコントローラ17は、ドライブユニット15に光ディスク11の再生を指示し、光ヘッド14によって、光ディスク11から信号が読み出される。その読み出された信号は、復調エラー訂正部21で復調され、エラー訂正された後、バッファ22に書き込まれ、バッファ22から読み出される。
【0044】
バッファ22から読み出された信号は、デマルチプレクサ23に供給され、デマルチプレクサ23から、それぞれ符号化された映像データ、字幕データ、音声データおよび付加情報データが、分離されて得られる。その他は、図1の放送受信装置と同じである。
【0045】
〔音声処理および音量調整…図3〜図9〕
上述したように、図1の放送受信装置または図2の光ディスク再生装置では、視聴者が特に音量調整をしない場合、話声期間識別情報によって特定される話声期間では、あらかじめ設定された音声処理パラメータによって音声処理が行われる。
【0046】
図3に、この場合の音声処理特性、すなわち音声処理部53の入出力特性を示す。この入出力特性は、点A0(Ax0,Ay0)および点B0(Bx0,By0)で屈折(屈曲)する非線形のレベル変換特性とし、Ax0からBx0の間の入力レベルをAy0からBy0の間の出力レベルに変換するとともに、入力音声信号がBx0以上のレベルになるときには、出力音声信号をBy0のレベルにクリップするものである。
【0047】
以下では、点A0のような低レベル側の屈折点Aをニーポイント、点B0のような高レベル側の屈折点Bを上限ポイントとする。
【0048】
このようなレベル変換特性によれば、後述のように、視聴者が音量調整をしたとき、それに応じてシステムコントローラ17がニーポイントAを、すなわちニーポイントAの入出力レベルを変更することによって、視聴者は単に音量の大小を指示するだけで、音声を聞き取りやすくすることができる。
【0049】
例えば、ニーポイントAを点A0から低入力レベル方向の点A1に移動させれば、低入力レベル領域での増幅率を、より大きくすることができる。
【0050】
逆に、ニーポイントAを点A0から高入力レベル方向の点A2に移動させると、低入力レベル領域での増幅率が小さくなり、出力レベルがAy0に達しない入力レベル領域が広がることになる。
【0051】
また、ニーポイントAを点A0から高出力レベル方向の点A3に移動させれば、低入力レベル領域での増幅率を、より大きくすることができる。
【0052】
他方で、図4に示すように、上限ポイントBを点B0から高出力レベル方向の点B1に移動させれば、高入力レベル領域での増幅率を、大きくすることができる。また、上限ポイントBを点B0から高入力レベル方向の点B2に移動させれば、高入力レベル領域での増幅率を、より小さくすることができ、より大きい入力レベルの音声信号でも、クリップされないようにすることができる。
【0053】
以上のように、ニーポイントAと上限ポイントBの間で出力レベルが好ましい範囲(Ay0からBy0の間)に変換されるので、通常、音声信号レベルは、ニーポイントAと上限ポイントBの間になるようにする。
【0054】
音声信号レベルを信号の実効値とすると、音声信号のピーク値と音声信号レベルとの差は、音声信号のピークファクタと呼ばれ、通常、15デシベル程度ある。音声を明瞭に聞き取るためには、30〜40デシベル程度のダイナミックレンジが必要であるので、このピークファクタを考慮して、ニーポイントAの入力レベルは、入力音声信号レベルより少なくても15〜25デシベル程度小さいレベルであることが望ましい。以下の例は、ニーポイントAの入力レベルを、入力音声信号レベルより20デシベル小さいレベルに設定する場合である。
【0055】
操作入力部16で音量を大きくする操作がなされたとき、システムコントローラ17は、音声処理部53での入力音声信号レベルを算出する。この場合の音声信号レベルは、瞬時レベルではなく、コンマ数秒から数秒程度というような短い時間の平均レベルである。
【0056】
そして、入力音声信号レベルが、図5のレベルVL1で示すように、点A0より20デシベル以上大きいときには、システムコントローラ17は、ニーポイントAを、点A0から、音量を大きくする指示がなくなるまで、点A3で示すように高出力レベル方向に移動させ、あるいは、点A0から、そのときの特性曲線上の、算出された入力音声信号レベルVL1より20デシベル小さい点A4に移動させた上で、音量を大きくする指示がなくなるまで、点A5で示すように高出力レベル方向に移動させる。
【0057】
入力音声信号レベルが、図6のレベルVL2で示すように、点A0より20デシベル以上大きくないときには、システムコントローラ17は、ニーポイントAを、点A0から、低入力レベル方向に、算出された入力音声信号レベルVL2より20デシベル小さい点A6に移動させた上で、音量を大きくする指示がなくなるまで、点A7で示すように高出力レベル方向に移動させる。
【0058】
操作入力部16で音量を小さくする操作がなされたときも、システムコントローラ17は、音声処理部53での入力音声信号レベルを算出する。
【0059】
そして、入力音声信号レベルが、図7のレベルVL1で示すように、点A0より20デシベル以上大きいときには、システムコントローラ17は、ニーポイントAを、点A0から、そのときの特性曲線上の、算出された入力音声信号レベルVL1より20デシベル小さい点A4に移動させた上で、音量を小さくする指示がなくなるまで、点A8で示すように低出力レベル方向に移動させ、あるいは、点A0から、音量を小さくする指示がなくなるまで、点A9で示すように低出力レベル方向に移動させる。
【0060】
入力音声信号レベルが、図8のレベルVL2で示すように、点A0より20デシベル以上大きくないときには、システムコントローラ17は、ニーポイントAを、点A0から、そのときの特性曲線上の、算出された入力音声信号レベルVL2より20デシベル小さい点A10に移動させた上で、音量を小さくする指示がなくなるまで、点A11で示すように低出力レベル方向に移動させ、あるいは、点A0から、音量を小さくする指示がなくなるまで、点A12で示すように低出力レベル方向に移動させる。
【0061】
音声信号は、放送前または記録時、あらかじめ音量調整されているので、音声レベルが大きすぎることや、小さすぎることは少ない。したがって、ニーポイントAの移動は、限られた範囲にすることができ、あらかじめ、その範囲を設定しておくことができる。
【0062】
また、このニーポイントAの移動範囲が、受信または再生された音声信号の基準信号レベルに応じて変更されるように、受信装置または再生装置を構成することもできる。音声信号の基準信号レベルは、付加情報として放送信号または記録信号に多重化されてもよく、あるいは受信装置または再生装置で10秒程度というような長時間の平均レベルとして検出してもよい。
【0063】
また、視聴者が自分の聴力に応じてニーポイントAの移動範囲を変更できるように、受信装置または再生装置を構成することもできる。
【0064】
同様に、上限ポイントBも、受信または再生された音声信号の基準信号レベルや視聴者の聴力に応じて変更できるように、受信装置または再生装置を構成することができる。
【0065】
視聴者は、音量調整をしたとき、操作入力部16での操作によって、その調整状態を保存すべきことを、システムコントローラ17に指示することができる。システムコントローラ17は、保存を指示されたとき、そのときのニーポイントA(Ax,Ay)および上限ポイントB(Bx,By)を、音声処理パラメータとして記憶装置18に記録する。
【0066】
これによれば、別の放送番組を受信し、別のディスクを再生するなど、別のコンテンツを受信または再生するとき、システムコントローラ17が、記憶装置18から、その音声処理パラメータを読み出して、音声処理部53での音声処理を制御することによって、視聴者は、別のコンテンツを視聴する際、改めて音量調整をしなくても、聞き取りやすい音量で音声を聞き取ることができる。
【0067】
また、記憶装置18としてメモリカードを用い、その音声処理パラメータが記録されたメモリカードを、別の受信装置または再生装置に装着して、別の受信装置または再生装置のシステムコントローラに、その音声処理パラメータを読み込ませることによって、別の受信装置または再生装置でも、視聴者は、音量調整をすることなく、聞き取りやすい音量で音声を聞き取ることができる。
【0068】
さらに、図9に示すように、音声処理パラメータとしてのニーポイントA(Ax,Ay)および上限ポイントB(Bx,By)が、コンテンツ識別コードと対応づけられて、さらに同一コンテンツ内でシーンや期間によって異なる音量調整がなされたときには、そのシーンや期間を特定するシーン識別コードやプレゼンテーションタイムスタンプと対応づけられて、記憶装置18に記録されるように構成することもできる。
【0069】
これによれば、同じコンテンツやシーンを受信または再生するとき、システムコントローラ17が、記憶装置18から、そのコンテンツやシーンに対応する音声処理パラメータを読み出して、音声処理部53での音声処理を制御することによって、視聴者は、同じコンテンツやシーンを視聴する際、改めて音量調整をしなくても、そのコンテンツやシーンに最適な音量で音声を聞き取ることができる。
【0070】
上述した例は、特に話声期間で、音声処理を制御し、音量を調整する場合であるが、話声期間以外の期間、例えば、音楽が主体または音楽のみの期間についても、例えば、話声期間で得られた音声処理パラメータによって、話声期間と同様に、音声処理が制御され、音量が調整されるようにすることができる。この場合には、話声期間以外の期間、例えば、音楽が主体または音楽のみの期間についても、視聴者は聞きやすい音量で音声を聞くことができる。
【0071】
〔他の実施形態〕
放送側で、または光ディスクなどの記録媒体への記録時、音声情報については、例えば、話声が主体または話声のみの期間である話声期間、音楽が主体または音楽のみの期間である音楽期間、および話声に対してBGM(Background Music)が合成された期間であるBGM期間を区別し、それぞれの期間を示す識別情報を多重化して、コンテンツを放送または記録し、受信装置または再生装置では、視聴者によって音量調整がなされない状態では、話声期間、音楽期間およびBGM期間で、あらかじめ設定された、それぞれの期間に適する音声処理パラメータによって音声処理が制御されるように、システムを構成することもできる。
【0072】
また、上述した実施形態は、コンテンツが映像情報と音声情報を含む場合であるが、この発明は、コンテンツが映像情報を含まない場合にも適用することができる。
【0073】
【発明の効果】
上述したように、この発明によれば、コンテンツ受信方法において、少なくとも音声情報を含む一連の情報であるコンテンツに、このコンテンツ中の音声情報の話声が主体または話声のみの期間である話声期間を示す話声期間識別情報が多重化された多重化信号を受信し、当該受信した多重化信号から、コンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると共に、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換し、操作入力部を介して音量調整の指示が行われると、当該指示に従ってレベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更して、操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの境界点の入出力レベルと、そのときのコンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録しておき、多重化信号を再び受信してコンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると、当該再生しているコンテンツ及びシーンと対応付けられている境界点の入出力レベルを記憶手段から読み出し、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、読み出した境界点の入出力レベルによって定められるレベル変換特性によってレベル変換するようにしたことにより、コンテンツ中の音声情報自体から話声とその他の音声を区別しなくても、話声を聞き取りやすくすることができると共に、視聴者が音量調整をしたときの調整結果を音声処理パラメータとして保存しておくことで、同じコンテンツを再び視聴するときの音声処理パラメータとして使用することができ、視聴者は一回の音量調整によって、常に聞き取りやすい音量で音声を聞き取ることができる。
【0074】
また、この発明によれば、コンテンツ再生方法において、少なくとも音声情報を含む一連の情報であるコンテンツに、このコンテンツ中の音声情報の話声が主体または話声のみの期間である話声期間を示す話声期間識別情報が多重化された多重化信号を記録媒体から読み取り、当該読み取った多重化信号から、コンテンツおよび話声期間識別情報を分離し、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると共に、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換し、操作入力部を介して音量調整の指示が行われると、当該指示に従って、レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更して、操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの境界点の入出力レベルと、そのときのコンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録しておき、多重化信号を記録媒体から再び読み取ってコンテンツおよび話声期間識別情報を分離しし、当該多重化信号から分離したコンテンツを再生して、音声信号を再生すると、当該再生しているコンテンツ及びシーンと対応付けられている境界点の入出力レベルを記憶手段から読み出し、多重化信号から分離した話声期間識別情報によって特定される話声期間において、再生した音声信号を、読み出した境界点の入出力レベルによって定められるレベル変換特性によってレベル変換するようにしたことにより、コンテンツ中の音声情報自体から話声とその他の音声を区別しなくても、話声を聞き取りやすくすることができると共に、視聴者が音量調整をしたときの調整結果を音声処理パラメータとして保存しておくことで、同じコンテンツを再び視聴するときの音声処理パラメータとして使用することができ、視聴者は一回の音量調整によって、常に聞き取りやすい音量で音声を聞き取ることができる。
【0075】
さらに、視聴者が音量調整をしたときには、音声信号レベルを算出し、その算出結果に応じて音声処理パラメータを変更することによって、聞き取りやすい音量で音声を聞き取ることができる。
【0076】
さらに、調整結果の音声処理パラメータを、外部記憶媒体に保存して、別の受信装置または再生装置に読み込ませることによって、別の受信装置または再生装置でも、同じ特性で音声信号を処理して、音声を聞き取りやすくすることができる。
【図面の簡単な説明】
【図1】この発明のコンテンツ受信装置の一実施形態を示す図である。
【図2】この発明のコンテンツ再生装置の一実施形態を示す図である。
【図3】音声処理部の入出力特性の一例を示す図である。
【図4】音声処理部の入出力特性の一例を示す図である。
【図5】音量を大きくする場合の音声処理部の入出力特性の一例を示す図である。
【図6】音量を大きくする場合の音声処理部の入出力特性の一例を示す図である。
【図7】音量を小さくする場合の音声処理部の入出力特性の一例を示す図である。
【図8】音量を小さくする場合の音声処理部の入出力特性の一例を示す図である。
【図9】音声処理パラメータを保存する場合の説明に供する図である。
【符号の説明】
主要部については図中に全て記述したので、ここでは省略する。[0001]
BACKGROUND OF THE INVENTION
The present invention is a method and apparatus for receiving content that is a series of information including at least audio information distributed by broadcasting or a network, and a series of information including at least audio information from a recording medium such as an optical disk. The present invention relates to a method and an apparatus for reproducing content.
[0002]
In the present invention, a series of information including at least audio information such as video information (image information) and audio information (acoustic information), or only audio information is defined as content. The voice information includes all voices (acoustics) that can be recognized by humans, such as human voices (uttered voices), music sounds, and sounds of natural sounds and physical sounds.
[0003]
[Prior art]
A device that receives or reproduces content, for example, content including video information and audio information, such as a television receiver or a DVD (Digital Versatile Disc) player, has a volume adjustment function or a volume that exceeds a predetermined level. It is equipped with a protection function for the case where it is detected, can be adjusted to an appropriate volume, and is configured to protect equipment and hearing from a high volume.
[0004]
[Problems to be solved by the invention]
The audio information in the content includes various voices (sounds) such as human voices, music sounds, and natural sounds and sounds of sounds. There are various voices such as loud voices from.
[0005]
However, even when content including various types and levels of audio information is received or played back as described above, the conventional receiving device or playback device fixes the volume level to an appropriate level from the beginning. Most of the information is output to the end, and the viewer (user) can change the sound volume setting only when the user feels that the sound volume is too low or too high.
[0006]
For this reason, the audio information in the content cannot be fully enjoyed unless the viewing environment is sufficiently quiet, or the viewers are young and have a hearing ability that can handle a wide dynamic range.
[0007]
That is, in a noisy viewing environment, a small sound is disturbed by the noise, and it is difficult to understand what is being said, especially with a small voice. If you try to deal with it, increasing the volume will make your voice louder and easier to hear, but will be noisy at other times, such as during periods of music.
[0008]
In addition, if the viewer is an elderly person, and it is difficult to hear small sounds, and it is a senile deafness that causes loud sounds to be audibly distorted, the volume must always be adjusted according to the sound level. There is inconvenience that it is hard to hear voice.
[0009]
It is also considered to selectively amplify the sound according to the type of sound, but it is difficult to accurately distinguish between spoken voice and other sounds, which may be mistakenly recognized, and senile deafness For an auditory audience such as the above, it is not possible to expect a sufficient response since the ease of hearing is not improved by simply amplifying the speech.
[0010]
Therefore, in the present invention, when content that is a series of information including at least audio information is received or reproduced, it is easy to hear the speech without distinguishing the speech from other audio from the audio information itself in the content. It is something that can be done.
[0011]
[Means for Solving the Problems]
In the content receiving method of the present invention, the speech period identification information indicating the speech period in which the speech of the speech information in the content is the main subject or only the speech is included in the content which is a series of information including at least the speech information. Was multiplexed Multiplexing Receive the signal, Concerned Separate the content and speech period identification information from the received multiplexed signal, and From multiplexed signal Play separated content and play audio signal As well as , From multiplexed signal Playback during the speech period specified by the separated speech period identification information Shi The audio input signal is level-converted by a level conversion characteristic set by a setting value that determines input / output level conversion in the low input level region and a setting value that determines input / output level conversion in the high input level region, and an operation input unit When volume adjustment is instructed via Concerned Follow the instructions Te Changed the input / output level at the boundary between the low and high input level regions in the bell conversion characteristics When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene indicating the scene at that time The identification code is associated and recorded in the storage means, the multiplexed signal is received again, the content and the speech period identification information are separated, the content separated from the multiplexed signal is reproduced, and the audio signal is When playback is performed, the input / output level of the boundary point associated with the content and scene being played back is read from the storage means, and playback is performed in the speech period specified by the speech period identification information separated from the multiplexed signal. Level conversion is performed by level conversion characteristics determined by the input / output level of the read boundary point. Do I did .
[0012]
In the content reproduction method of the present invention, the speech period identification information indicating the speech period in which the speech of the audio information in the content is the main subject or the speech only period is included in the content which is a series of information including at least the audio information. Was multiplexed Multiplexing Read the signal from the recording medium, separate the content and speech period identification information from the read multiplexed signal, From multiplexed signal Play separated content and play audio signal As well as , From multiplexed signal Playback during the speech period specified by the separated speech period identification information Shi The audio input signal is level-converted by a level conversion characteristic set by a setting value that determines input / output level conversion in the low input level region and a setting value that determines input / output level conversion in the high input level region, and an operation input unit When volume adjustment is instructed via Concerned According to instructions , Les Changed the input / output level at the boundary between the low and high input level regions in the bell conversion characteristics When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene indicating the scene at that time The identification code is associated and recorded in the storage means, the multiplexed signal is read again from the recording medium, the content and the speech period identification information are separated, the content separated from the multiplexed signal is reproduced, When an audio signal is reproduced, the input / output level of the boundary point associated with the content and scene being reproduced is read from the storage means, and the voice period specified by the voice period identification information separated from the multiplexed signal , The level of the reproduced audio signal is converted by the level conversion characteristic determined by the input / output level of the read boundary point. Do I did .
[0013]
DETAILED DESCRIPTION OF THE INVENTION
[System Configuration of Receiving Device and Reproducing Device ... FIGS. 1 and 2]
(System configuration of receiving apparatus: Fig. 1)
FIG. 1 shows an embodiment of a content receiving apparatus according to the present invention, which is a case of a broadcast receiving apparatus that receives a digital television broadcast.
[0014]
The broadcast in this case is such that the content includes video information and audio information of the program, and additional information is multiplexed on the content. The additional information includes a content identification code that is information for identifying content (program), a scene identification code that is information for identifying each scene of a program or a specific scene, and speech of the audio information of the program, or only speech Speech period identification information indicating a speech period that is a period of.
[0015]
Specifically, video data and audio data are compressed and encoded by the MPEG (Moving Picture Experts Group) method and the like, and the additional information data is encoded and multiplexed separately from the video and audio data stream. Then, the whole is modulated and broadcast.
[0016]
The additional information data includes a header portion having a code indicating the type of additional information, such as whether the additional information is a content identification code, a scene identification code, or a speech period identification information, followed by a content. It consists of data parts such as an identification code, a scene identification code, and speech period identification information.
[0017]
The broadcast signal is multiplexed with decoding time information such as a decoding time stamp and content presentation time information such as a presentation time stamp.
[0018]
In the channel selection receiving unit 19, a broadcast signal is selected and received by channel selection control of the
[0019]
The signal read from the
[0020]
The video data, subtitle data, and audio data are written to the
[0021]
The
[0022]
The video data from the
[0023]
The video signal output from the
[0024]
The video signal is sent to a
[0025]
Audio data from the
[0026]
The audio signal is also sent to the
[0027]
The additional information data separated by the
[0028]
In the voice period identification
[0029]
In the identification code detection unit 63, the content identification code and the scene identification code are detected based on the type code of the header part in the additional information data, and the detected content identification code and scene identification code are taken into the
[0030]
When the speech period identification information is detected, the
[0031]
When the viewer looks at the display and wants to make it easier to hear the sound, the viewer adjusts the volume so as to make the sound easier to hear, as will be described later, by operating the
[0032]
The receiving device may be configured such that the presentation of the speech period is switched on / off by the viewer through a setting operation on the
[0033]
Even when the presentation is switched off or the configuration is such that the speech period is not presented, the viewer can listen to the voice output from the
[0034]
When the viewer does not particularly adjust the volume during the speech period, the
[0035]
As will be described later, the
[0036]
In FIG. 1, the speech period identification
[0037]
(System configuration of the playback device ... Fig. 2)
FIG. 2 shows an embodiment of the content reproduction apparatus of the present invention, which is an optical disk reproduction apparatus.
[0038]
On the optical disc 11, additional information is recorded by being multiplexed with the content. The content in this case includes video information and audio information, and the additional information is the above-described content identification code, scene identification code, speech period identification information, and the like.
[0039]
Specifically, video data and audio data are compression-encoded and multiplexed by the MPEG method or the like, and additional information data is encoded and multiplexed separately from the video / audio data stream to be modulated as a whole. And recorded on the optical disc 11.
[0040]
As described above, the additional information data is composed of a header portion having a code indicating the type of additional information, followed by a data portion such as a content identification code, a scene identification code, and a speech period identification information. The
[0041]
The optical disc 11 is recorded with decoding time information such as a decoding time stamp and content presentation time information such as a presentation time stamp.
[0042]
The optical disk 11 is driven by a
[0043]
The
[0044]
The signal read from the
[0045]
[Speech processing and volume adjustment ... FIGS. 3 to 9]
As described above, in the broadcast receiving device of FIG. 1 or the optical disc playback device of FIG. 2, when the viewer does not particularly adjust the volume, the voice processing set in advance in the speech period specified by the speech period identification information Audio processing is performed according to the parameters.
[0046]
FIG. 3 shows the sound processing characteristics in this case, that is, the input / output characteristics of the
[0047]
In the following, the low-level refraction point A such as the point A0 is the knee point, and the high-level refraction point B such as the point B0 is the upper limit point.
[0048]
According to such level conversion characteristics, as described later, when the viewer adjusts the volume, the
[0049]
For example, if the knee point A is moved from the point A0 to the point A1 in the low input level direction, the amplification factor in the low input level region can be further increased.
[0050]
Conversely, when the knee point A is moved from the point A0 to the point A2 in the high input level direction, the amplification factor in the low input level region decreases, and the input level region in which the output level does not reach Ay0 is expanded.
[0051]
If the knee point A is moved from the point A0 to the point A3 in the high output level direction, the amplification factor in the low input level region can be further increased.
[0052]
On the other hand, as shown in FIG. 4, if the upper limit point B is moved from the point B0 to the point B1 in the high output level direction, the amplification factor in the high input level region can be increased. Further, if the upper limit point B is moved from the point B0 to the point B2 in the high input level direction, the amplification factor in the high input level region can be reduced, and even an audio signal with a higher input level is not clipped. Can be.
[0053]
As described above, since the output level is converted into a preferable range (between Ay0 and By0) between the knee point A and the upper limit point B, the audio signal level is usually between the knee point A and the upper limit point B. To be.
[0054]
When the audio signal level is the effective value of the signal, the difference between the peak value of the audio signal and the audio signal level is called the peak factor of the audio signal, and is usually about 15 decibels. In order to hear the voice clearly, a dynamic range of about 30 to 40 decibels is necessary. Therefore, considering the peak factor, the input level of the knee point A is 15 to 25 at least less than the input voice signal level. It is desirable that the level be as small as decibels. In the following example, the input level of knee point A is set to a
[0055]
When the
[0056]
When the input audio signal level is 20 dB or more higher than the point A0 as indicated by the level VL1 in FIG. 5, the
[0057]
As shown by the level VL2 in FIG. 6, when the input audio signal level is not greater than 20 decibels than the point A0, the
[0058]
Even when the
[0059]
When the input audio signal level is 20 dB or more higher than the point A0 as indicated by the level VL1 in FIG. 7, the
[0060]
As shown by the level VL2 in FIG. 8, when the input audio signal level is not greater than 20 decibels than the point A0, the
[0061]
Since the volume of the audio signal is adjusted in advance before broadcasting or at the time of recording, it is rare that the audio level is too high or too low. Therefore, the movement of the knee point A can be within a limited range, and the range can be set in advance.
[0062]
Further, the receiving apparatus or the reproducing apparatus can be configured such that the moving range of the knee point A is changed according to the reference signal level of the received or reproduced audio signal. The reference signal level of the audio signal may be multiplexed with the broadcast signal or the recording signal as additional information, or may be detected as a long-term average level such as about 10 seconds by the receiving device or the reproducing device.
[0063]
In addition, the receiving device or the reproducing device can be configured so that the viewer can change the moving range of the knee point A according to his / her hearing ability.
[0064]
Similarly, the receiving device or the reproducing device can be configured so that the upper limit point B can be changed according to the reference signal level of the received or reproduced audio signal or the hearing ability of the viewer.
[0065]
When the viewer adjusts the volume, the viewer can instruct the
[0066]
According to this, when receiving or playing back another content such as receiving another broadcast program and playing back another disc, the
[0067]
In addition, a memory card is used as the
[0068]
Furthermore, as shown in FIG. 9, knee points A (Ax, Ay) and upper limit points B (Bx, By) as audio processing parameters are associated with content identification codes, and scenes and periods within the same content. When the volume is adjusted differently depending on the situation, it can be configured to be recorded in the
[0069]
According to this, when receiving or playing back the same content or scene, the
[0070]
The above-described example is a case where the sound processing is controlled and the volume is adjusted particularly in the speech period. However, in the period other than the speech period, for example, the period in which music is mainly or only music, According to the voice processing parameters obtained during the period, the voice processing can be controlled and the volume can be adjusted in the same manner as in the voice period. In this case, even during a period other than the speech period, for example, a period in which music is mainly or only music, the viewer can listen to the sound with a volume that is easy to hear.
[0071]
[Other Embodiments]
When recording on a recording medium such as an optical disc on the broadcast side, for audio information, for example, a speech period in which the voice is mainly or only the voice, a music period in which music is the main or only the music And a BGM period, which is a period in which BGM (Background Music) is synthesized with speech, and identification information indicating each period is multiplexed to broadcast or record content. In a state where the volume is not adjusted by the viewer, the system is configured such that the voice processing is controlled by the voice processing parameters set in advance in the speech period, the music period, and the BGM period. You can also.
[0072]
Moreover, although embodiment mentioned above is a case where a content contains video information and audio | voice information, this invention is applicable also when a content does not contain video information.
[0073]
【The invention's effect】
As described above, according to the present invention, In the content receiving method, voice period identification information indicating a voice period in which the voice information of the voice information in the content is a main subject or a voice-only period is multiplexed with content that is a series of information including at least voice information. The multiplexed signal is received, the content and the speech period identification information are separated from the received multiplexed signal, the content separated from the multiplexed signal is reproduced, the audio signal is reproduced, and the multiplexing is performed In the speech period specified by the speech period identification information separated from the signal, the reproduced speech signal is subjected to input / output level conversion in the high input level area and a set value that determines input / output level conversion in the low input level area. When level conversion is performed according to the level conversion characteristic set with the set value to be set, and volume adjustment is instructed via the operation input unit, the level is adjusted according to the instruction. When an instruction is given to change the input / output level of the boundary point between the low input level area and the high input level area in the conversion characteristics and the volume adjustment state is saved via the operation input unit, the boundary point input at that time The output level, the content identification code indicating the content at that time and the scene identification code indicating the scene at that time are associated and recorded in the storage means, and the multiplexed signal is received again to identify the content and speech period When information is separated and the content separated from the multiplexed signal is reproduced and the audio signal is reproduced, the input / output level of the boundary point associated with the content and scene being reproduced is read from the storage means, The input / output level of the boundary point at which the reproduced speech signal is read during the speech period specified by the speech period identification information separated from the multiplexed signal By which is adapted to level conversion by the level conversion characteristic Accordingly defined, Even without distinguishing speech from other speech from the audio information itself in the content, it is possible to make speech easier to hear. At the same time, by saving the adjustment result when the viewer adjusts the volume as an audio processing parameter, it can be used as an audio processing parameter when viewing the same content again. By adjusting, you can always hear the sound at a level that is easy to hear. .
[0074]
Also, According to the present invention, in the content reproduction method, the content that is a series of information including at least audio information, the speech that indicates the speech period in which the speech of the audio information in the content is the main or only speech A multiplexed signal in which the period identification information is multiplexed is read from the recording medium, the content and the voice period identification information are separated from the read multiplexed signal, and the content separated from the multiplexed signal is reproduced to generate audio. In the speech period specified by the speech period identification information separated from the multiplexed signal while reproducing the signal, the reproduced audio signal is set to a set value and a high input level that determine input / output level conversion in the low input level region. Level conversion is performed according to the level conversion characteristics set by the setting value that determines the input / output level conversion in the area, and the volume adjustment instruction is given via the operation input unit When performed, an instruction to change the input / output level at the boundary point between the low input level region and the high input level region in the level conversion characteristic and to save the volume adjustment state via the operation input unit is performed according to the instruction. And the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene identification code indicating the scene at that time are recorded in association with each other, and the multiplexed signal is recorded. When the content and the speech period identification information are read again from the medium, the content separated from the multiplexed signal is reproduced, and the audio signal is reproduced, it is associated with the content and scene being reproduced. In the speech period specified by the speech period identification information separated from the multiplexed signal by reading the input / output level of the boundary point from the storage means By converting the level of the reproduced audio signal according to the level conversion characteristics determined by the input / output level of the read boundary point, it is possible to distinguish speech from other audio from the audio information itself in the content. The voice can be easily heard, and the adjustment result when the viewer adjusts the volume can be saved as an audio processing parameter so that it can be used as an audio processing parameter when viewing the same content again. The viewer can listen to the sound at a volume that is always easy to hear by adjusting the volume once. .
[0075]
Furthermore, when the viewer adjusts the volume, the sound can be heard at a volume that is easy to hear by calculating the sound signal level and changing the sound processing parameter according to the calculation result. .
[0076]
Furthermore, the audio processing parameters of the adjustment result are stored in an external storage medium and read by another receiving device or reproducing device, so that the other receiving device or reproducing device processes the audio signal with the same characteristics, The voice can be easily heard.
[Brief description of the drawings]
FIG. 1 is a diagram showing an embodiment of a content receiving apparatus according to the present invention.
FIG. 2 is a diagram showing an embodiment of a content reproduction apparatus according to the present invention.
FIG. 3 is a diagram illustrating an example of input / output characteristics of an audio processing unit.
FIG. 4 is a diagram illustrating an example of input / output characteristics of an audio processing unit.
FIG. 5 is a diagram illustrating an example of input / output characteristics of an audio processing unit when the volume is increased.
FIG. 6 is a diagram illustrating an example of input / output characteristics of an audio processing unit when the volume is increased.
FIG. 7 is a diagram illustrating an example of input / output characteristics of an audio processing unit when the volume is reduced.
FIG. 8 is a diagram illustrating an example of input / output characteristics of an audio processing unit when the volume is decreased.
FIG. 9 is a diagram for explaining the case of storing audio processing parameters.
[Explanation of symbols]
Since all the main parts are described in the figure, they are omitted here.
Claims (8)
前記受信した前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する第1分離工程と、
前記多重化信号から分離した前記コンテンツを再生して、音声信号を再生する第1再生工程と、
前記多重化信号から分離した前記話声期間識別情報によって特定される前記話声期間において、再生した前記音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換する第1レベル変換工程と、
操作入力部を介して音量調整の指示が行われると、前記指示に従って前記レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更する境界点変更工程と、
操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの前記境界点の入出力レベルと、そのときの前記コンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録する記録工程と、
前記多重化信号を再び受信する第2受信工程と、
前記再び受信した前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する第2分離工程と、
前記多重化信号から分離した前記コンテンツを再生して、前記音声信号を再生する第2再生工程と、
前記再生している前記コンテンツ及び前記シーンと対応付けられている前記境界点の入出力レベルを前記記憶手段から読み出し、前記多重化信号から分離した前記話声期間識別情報によって特定される前記話声期間において、再生した前記音声信号を、前記読み出した前記境界点の入出力レベルによって定められるレベル変換特性によってレベル変換する第2レベル変換工程と
を有するコンテンツ受信方法。A multiplexed signal in which speech period identification information indicating a speech period in which the speech information of the speech information in the content is a main subject or a speech-only period is multiplexed with content that is a series of information including at least speech information Receiving a first receiving step;
From the multiplexed signal thus received, a first separation step of separating the content and the speech period identifying information,
By reproducing the content separated from the multiplexed signal, a first reproducing step for reproducing audio signals,
In the speech period specified by the speech period identification information separated from the multiplexed signal, the audio signal reproduced, set values and the high input level region defining the input and output level conversion at low input level range A first level conversion step of performing level conversion according to a level conversion characteristic set by a set value that determines input / output level conversion at
When an instruction for volume adjustment is made via the operation input unit, a boundary point changing step of changing the input / output level of the boundary point between the low input level region and the high input level region in the level conversion characteristic according to the instruction ;
When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene identification indicating the scene at that time A recording step of associating a code with the storage means and recording the code;
A second receiving step of receiving the multiplexed signal again;
A second separation step of separating the content and the speech period identification information from the multiplexed signal received again;
A second reproduction step of reproducing the audio signal by reproducing the content separated from the multiplexed signal;
The speech specified by the speech period identification information separated from the multiplexed signal by reading out the input / output levels of the boundary points associated with the content and the scene being reproduced from the storage means A content receiving method comprising: a second level conversion step of converting a level of the reproduced audio signal in a period according to a level conversion characteristic determined by an input / output level of the read boundary point .
前記操作入力部を介して前記音量調整の指示が行われると、再生した前記音声信号のレベルを算出し、その算出結果と前記指示とに応じて、前記境界点の入出力レベルを変更する
請求項1に記載のコンテンツ受信方法。In the boundary point changing step,
When the instruction of the volume adjustment via the operation input unit is performed to calculate the level of the audio signal reproduced in accordance with said instructions and the calculation result, changes the output level of the boundary point The content receiving method according to claim 1.
を有する請求項1に記載のコンテンツ受信方法。In the speech period specified by the speech period identification information separated from the multiplexed signal, the display control step of displaying the information indicating that the a speech period to a display means
Content receiving method according to claim 1 which have a.
前記読み取った前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する第1分離工程と、
前記多重化信号から分離した前記コンテンツを再生して、音声信号を再生する第1再生工程と、
前記多重化信号から分離した前記話声期間識別情報によって特定される前記話声期間において、再生した前記音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換する第1レベル変換工程と、
操作入力部を介して音量調整の指示が行われると、前記指示に従って、前記レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更する境界点変更工程と、
操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの前記境界点の入出力レベルと、そのときの前記コンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録する記録工程と、
前記多重化信号を前記記録媒体から再び読み取る第2読取工程と、
前記再び読み取った前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する第2分離工程と、
前記多重化信号から分離した前記コンテンツを再生して、音声信号を再生する第2再生工程と、
前記再生している前記コンテンツ及び前記シーンと対応付けられている前記境界点の入出力レベルを前記記憶手段から読み出し、前記多重化信号から分離した前記話声期間識別情報によって特定される前記話声期間において、再生した前記音声信号を、前記読み出した前記境界点の入出力レベルによって定められるレベル変換特性によってレベル変換する第2レベル変換工程と
を有するコンテンツ再生方法。A multiplexed signal in which speech period identification information indicating a speech period in which the speech information of the speech information in the content is a main subject or a speech-only period is multiplexed with content that is a series of information including at least speech information A first reading step of reading from the recording medium;
From said multiplexed signal read, a first separation step of separating the content and the speech period identifying information,
By reproducing the content separated from the multiplexed signal, a first reproducing step for reproducing audio signals,
In the speech period specified by the speech period identification information separated from the multiplexed signal, the audio signal reproduced, set values and the high input level region defining the input and output level conversion at low input level range A first level conversion step of performing level conversion according to a level conversion characteristic set by a set value that determines input / output level conversion at
When an instruction for volume adjustment is made via the operation input unit, a boundary point changing step of changing the input / output level of the boundary point between the low input level region and the high input level region in the level conversion characteristic according to the instruction ,
When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene identification indicating the scene at that time A recording step of associating a code with the storage means and recording the code;
A second reading step of reading the multiplexed signal from the recording medium again;
A second separation step of separating the content and the speech period identification information from the multiplexed signal read again;
A second reproduction step of reproducing the content separated from the multiplexed signal and reproducing an audio signal;
The speech specified by the speech period identification information separated from the multiplexed signal by reading out the input / output levels of the boundary points associated with the content and the scene being reproduced from the storage means A content reproduction method comprising: a second level conversion step of converting a level of the reproduced audio signal in a period according to a level conversion characteristic determined by an input / output level of the read boundary point .
操作入力部を介して音量調整の指示が行われると、再生した前記音声信号のレベルを算出し、その算出結果と前記指示とに応じて、前記境界点の入出力レベルを変更する
請求項4に記載のコンテンツ再生方法。In the boundary point changing step,
When the operation input unit instruction volume control via is performed, the claims calculating the level of the audio signal reproduced in accordance with said instructions and the calculation result, changes the output level of the boundary point 4. The content reproduction method according to 4 .
を有する請求項4に記載のコンテンツ再生方法。In the speech period specified by the speech period identification information separated from the multiplexed signal, the display control step of displaying the information indicating that the a speech period to a display means
Content playback method according to claim 4 which have a.
前記受信手段によって受信された前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する分離手段と、
前記分離手段によって前記多重化信号から分離された前記コンテンツを再生して、音声信号を再生する再生手段と、
前記分離手段によって前記多重化信号から分離された前記話声期間識別情報によって特定される前記話声期間において、前記再生手段によって再生された前記音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換する音声処理手段と、
操作入力部を介して音量調整の指示が行われると、前記指示に従って、前記レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更する制御手段と、
操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの前記境界点の入出力レベルと、そのときの前記コンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録する記録手段と
を備え、
前記音声処理手段は、
前記受信手段により前記多重化信号が再び受信されて、前記分離手段により前記多重化信号から前記コンテンツおよび前記話声期間識別情報が分離され、前記再生手段により前記コンテンツが再生されて前記音声信号が再生されると、前記再生手段により再生されている前記コンテンツ及び前記シーンと対応付けられている前記境界点の入出力レベルを前記記憶手段から読み出し、前記多重化信号から分離された前記話声期間識別情報によって特定される前記話声期間において、再生された前記音声信号を、前記読み出した前記境界点の入出力レベルによって定められるレベル変換特性によってレベル変換する
コンテンツ受信装置。A multiplexed signal in which speech period identification information indicating a speech period in which the speech information of the speech information in the content is a main subject or a speech-only period is multiplexed with content that is a series of information including at least speech information Receiving means for receiving
From the multiplexed signal received by said receiving means, separating means for separating the contents and the speech period identifying information,
By reproducing the content separated from the multiplexed signal by said separating means, a reproduction means for reproducing the audio signal,
In the speech period specified by the speech period discerning information separated from the multiplexed signal by said separating means, the audio signal reproduced by said reproducing means, input and output level conversion at low input level range Voice processing means for level conversion by a level conversion characteristic set by a setting value for determining the input / output level conversion in the high input level region
When a sound volume adjustment instruction is given via the operation input unit, a control means for changing the input / output level of the boundary point between the low input level region and the high input level region in the level conversion characteristic according to the instruction,
When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene identification indicating the scene at that time Recording means for associating and recording the code in the storage means ,
The voice processing means is
The multiplexed signal is received again by the receiving means, the content and the speech period identification information are separated from the multiplexed signal by the separating means, the content is reproduced by the reproducing means, and the audio signal is When reproduced, the speech period separated from the multiplexed signal is read out from the storage means and the input / output levels of the boundary points associated with the content and the scene being reproduced by the reproduction means In the speech period specified by the identification information, the reproduced voice signal is level-converted by a level conversion characteristic determined by the input / output level of the read boundary point.
Content receiving device.
前記読み取り手段によって前記記録媒体から読み取られた前記多重化信号から、前記コンテンツおよび前記話声期間識別情報を分離する分離手段と、
前記分離手段によって前記多重化信号から分離された前記コンテンツを再生して、音声信号を再生する再生手段と、
前記分離手段によって前記多重化信号から分離された前記話声期間識別情報によって特定される前記話声期間において、前記再生手段によって再生された前記音声信号を、低入力レベル領域での入出力レベル変換を定める設定値と高入力レベル領域での入出力レベル変換を定める設定値とで設定されるレベル変換特性によってレベル変換する音声処理手段と、
操作入力部を介して音量調整の指示が行われると、前記指示に従って、前記レベル変換特性における低入力レベル領域と高入力レベル領域の境界点の入出力レベルを変更する制御手段と、
操作入力部を介して音量の調整状態を保存する指示が行われると、そのときの前記境界点の入出力レベルと、そのときの前記コンテンツを示すコンテンツ識別コード及びそのときのシーンを示すシーン識別コードとを対応付けて記憶手段に記録する記録手段と
を備え、
前記音声処理手段は、
前記読み取り手段により前記記録媒体から前記多重化信号が再び読み取られて、前記分離手段により前記多重化信号から前記コンテンツおよび前記話声期間識別情報が分離され、前記再生手段により前記コンテンツが再生されて前記音声信号が再生されると、前記再生手段により再生されている前記コンテンツ及び前記シーンと対応付けられている前記境界点の入出力レベルを前記記憶手段から読み出し、前記多重化信号から分離された前記話声期間識別情報によって特定される前記話声期間において、再生された前記音声信号を、前記読み出した前記境界点の入出力レベルによって定められるレベル変換特性によってレベル変換する
コンテンツ再生装置。A multiplexed signal in which speech period identification information indicating a speech period in which the speech information of the speech information in the content is a main subject or a speech-only period is multiplexed with content that is a series of information including at least speech information Reading means for reading from the recording medium;
From the multiplexed signal read from said recording medium by said reading means, separating means for separating the contents and the speech period identifying information,
By reproducing the content separated from the multiplexed signal by said separating means, a reproduction means for reproducing the audio signal,
In the speech period specified by the speech period discerning information separated from the multiplexed signal by said separating means, the audio signal reproduced by said reproducing means, input and output level conversion at low input level range Voice processing means for level conversion by a level conversion characteristic set by a setting value for determining the input / output level conversion in the high input level region
When a sound volume adjustment instruction is given via the operation input unit, a control means for changing the input / output level of the boundary point between the low input level region and the high input level region in the level conversion characteristic according to the instruction,
When an instruction to save the volume adjustment state is given via the operation input unit, the input / output level of the boundary point at that time, the content identification code indicating the content at that time, and the scene identification indicating the scene at that time Recording means for associating and recording the code in the storage means ,
The voice processing means is
The multiplexed signal is read again from the recording medium by the reading means, the content and the speech period identification information are separated from the multiplexed signal by the separating means, and the content is reproduced by the reproducing means. When the audio signal is reproduced, the input / output level of the boundary point associated with the content and the scene being reproduced by the reproduction means is read from the storage means and separated from the multiplexed signal. In the speech period specified by the speech period identification information, the reproduced speech signal is level-converted by a level conversion characteristic determined by the input / output level of the read boundary point.
Content playback device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001190663A JP4826034B2 (en) | 2001-06-25 | 2001-06-25 | Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001190663A JP4826034B2 (en) | 2001-06-25 | 2001-06-25 | Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003009099A JP2003009099A (en) | 2003-01-10 |
JP4826034B2 true JP4826034B2 (en) | 2011-11-30 |
Family
ID=19029401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001190663A Expired - Fee Related JP4826034B2 (en) | 2001-06-25 | 2001-06-25 | Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4826034B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7539614B2 (en) * | 2003-11-14 | 2009-05-26 | Nxp B.V. | System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes |
JP2014072873A (en) * | 2012-10-02 | 2014-04-21 | Panasonic Corp | Audio output apparatus and audio signal processing method for the same |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000152394A (en) * | 1998-11-13 | 2000-05-30 | Matsushita Electric Ind Co Ltd | Hearing aid for moderately hard of hearing, transmission system having provision for the moderately hard of hearing, recording and reproducing device for the moderately hard of hearing and reproducing device having provision for the moderately hard of hearing |
-
2001
- 2001-06-25 JP JP2001190663A patent/JP4826034B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003009099A (en) | 2003-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4847825A (en) | Method and apparatus for signaling the volume level of reproducing apparatus for digitally recorded sound | |
JP2003524906A (en) | Method and apparatus for providing a user-adjustable ability to the taste of hearing-impaired and non-hearing-impaired listeners | |
KR100943597B1 (en) | Gated silence removal during video trick modes | |
JP4029487B2 (en) | Recording apparatus and recording method, reproducing apparatus and reproducing method, and recording medium | |
TW200305856A (en) | Audio data deletion and silencing during trick mode replay | |
US20100310229A1 (en) | Video processing apparatus and vide processing method | |
JP4826034B2 (en) | Content receiving method, content reproducing method, content receiving apparatus and content reproducing apparatus | |
JP2005086483A (en) | Optical disk reproducing device | |
JP2007183410A (en) | Information reproduction apparatus and method | |
JP2002016858A (en) | Digital broadcast receiver | |
JP3888307B2 (en) | Optical disk playback device | |
JP2003046951A5 (en) | ||
JP3499280B2 (en) | Recording medium and reproducing apparatus therefor | |
JPH0879674A (en) | Moving picture retrieval system | |
US20040013402A1 (en) | Video recording and reproducing apparatus | |
JP3848144B2 (en) | Video shortening / reproducing apparatus, video shortening / reproducing method, program for the method, and recording medium recording the program | |
JP3793152B2 (en) | Information recording method, information reproducing method, information reproducing apparatus, and information recording medium | |
JP2007042195A (en) | Video recording device | |
JP3596000B2 (en) | Television equipment | |
JP4240805B2 (en) | Video camera | |
JP2001057027A (en) | Picture disk player | |
JP3928807B2 (en) | Optical disk playback device | |
JP4529859B2 (en) | Audio playback device | |
JP2007129663A (en) | Reproducing apparatus | |
KR100223627B1 (en) | Device and method for test mode in a digital audio/video reproducer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080204 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20090825 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20091001 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100930 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110607 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110816 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110829 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |