JPWO2008142874A1 - 音声符号化及び再生装置 - Google Patents
音声符号化及び再生装置 Download PDFInfo
- Publication number
- JPWO2008142874A1 JPWO2008142874A1 JP2009515099A JP2009515099A JPWO2008142874A1 JP WO2008142874 A1 JPWO2008142874 A1 JP WO2008142874A1 JP 2009515099 A JP2009515099 A JP 2009515099A JP 2009515099 A JP2009515099 A JP 2009515099A JP WO2008142874 A1 JPWO2008142874 A1 JP WO2008142874A1
- Authority
- JP
- Japan
- Prior art keywords
- data storage
- encoded data
- encoding
- audio
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
- 238000013500 data storage Methods 0.000 claims abstract description 293
- 238000000034 method Methods 0.000 claims abstract description 128
- 238000006243 chemical reaction Methods 0.000 claims description 34
- 238000005070 sampling Methods 0.000 claims description 32
- 230000007704 transition Effects 0.000 abstract description 13
- 230000003111 delayed effect Effects 0.000 description 32
- 230000005236 sound signal Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 16
- 230000000694 effects Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
音声再生処理への移行が遅れることにより音声出力データがオーバーフローしてしまい、音が途切れてしまうといった問題を軽減する音声符号化及び再生装置を提供するために、音声符号化及び再生装置(100)は、PCM音響信号を格納する入力データ格納部(101)と、出力データを格納する出力データ格納部(102)と、音声データを出力する音声出力部(103)と、音声符号化を行う音声符号化部(104)と、音声符号化部(104)によって符号化された後の符号化データを格納する符号化データ格納部(105)と、出力データ格納部(102)の残量より出力する符号化データのビットレートを制御するビットレート制御部(106)と、符号化データを記憶するデータ記憶部(107)とを備える。
Description
本発明は、デジタル音響データの符号化及び再生を同時に行う音声符号化及び再生装置に関するものである。
近年、手軽に音楽を聴きたいというユーザーの要望に応えるため、音声や楽音などのオーディオデータ信号を低ビットレートで圧縮符号化し、再生時に伸張復号化するための様々な技術が開発されており、その代表的な方式として、MPEG−1 Audio LayerIII(以下、MP3と略称する)が知られている。
このMP3の使われ方として、例えばCDなどに格納している音声信号を再生しながらMP3データに圧縮符号化する方法がある。なお、MP3データを記憶するものとしては、フラッシュメモリやハードディスクなどが挙げられる。
そして、音声の再生と圧縮符号化を同時に行う際、音声の符号化を行う装置と、音声の出力や付加的な音声処理を行う装置は別々に分けられて処理を行う方法と、再生と符号化の処理を交互に行いながら同時に行う方法の2つがある。
この音声の再生と符号化の処理を交互に行いながら同時に行う方法の場合、1チップのシステムLSIで実行可能であり、システムコストを削減できるといった利点がある。
そして、例えば、従来のエンコーダ、デコーダのバッファのオーバーフロー及びアンダーフローを防ぐ符号化装置が開示されている(例えば、特許文献1参照)。
特開2000−307661号公報
しかしながら、上述したMP3データを記憶するフラッシュメモリには、書き込み不能なブロックを回避してサーチする機能があり、また、ハードディスクでは、データの読み書きを何度も繰り返すことにより、データが断片化し読み書き速度が低減する。この結果、符号化データ格納部からハードディスクやフラッシュメモリ等の記憶部への転送が遅延すると、音声再生処理への移行が遅延する。そして、出力データ格納部から音声データが出力されるタイミングが遅延すると、音声再生処理への移行が遅れ、音声出力データがオーバーフローしてしまい、音が途切れてしまうといった問題が生じる。
本発明は、このような点に鑑みてなされたものであり、音声再生処理への移行が遅れることにより音声出力データがオーバーフローしてしまい、音が途切れてしまうといった問題を軽減する音声符号化及び再生装置を提供することを目的としている。
以上の課題を解決するための、本発明に係る音声符号化及び再生装置は、入力されるPCM音響信号を用いて音声の符号化と再生とを1つの装置内で行う音声符号化及び再生装置であって、入力される音声データを格納する入力データ格納手段と、前記入力データ格納手段から音声データを格納する出力データ格納手段と、前記出力データ格納手段に格納されている音声データを出力する音声出力手段と、前記入力データ格納手段に格納されている音声データを符号化する音声符号化手段と、前記音声符号化手段における符号化後のデータを格納する符号化データ格納手段と、前記符号化データ格納手段のデータ残量に基づいて、前記符号化データ格納手段に格納する符号化データのデータ量を低減させる制御手段と、前記符号化データ格納手段から送信される符号化データを記憶するデータ記憶手段とを備えることを特徴とする。
また、前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記音声符号化手段における符号化ビットレートを下げるビットレート制御手段であることを特徴とする。
さらに、前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記符号化データ格納手段に格納する符号化データのデータ量を低減させるために、前記音声出力手段における音声再生速度を低減させる速度調整手段であることを特徴とする。
これらの構成により、制御手段において、符号化後のデータを一時的に格納するための符号化データ格納手段に格納されるデータ量が閾値を超えた場合に、前記ビットレート制御手段として音声符号化のビットレートを下げたり、前記速度調整手段として音声出力手段における再生速度を低減して、前記符号化データ格納手段に格納されるデータ量を削減し、ハードディスク等のデータ記憶手段への転送の遅延を軽減でき、前記データ記憶手段への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
また、前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータのサンプリング周波数を変換するサンプリング周波数変換手段であり、前記音声符号化及び再生装置は、さらに、前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、前記サンプリング周波数変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納するデータのサンプリング周波数を低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させることを特徴とする。
さらに、前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータの出力チャンネルを変換する出力チャンネル変換手段であり、前記音声符号化及び再生装置は、さらに、前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、前記出力チャンネル変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納する音声データの出力チャンネルを低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させることを特徴とする。
これらの構成により、符号化後のデータを一時的に格納するための符号化データ格納手段に格納されるデータ量が閾値を超えた場合に、前記サンプリング周波数変換手段においてサンプリング周波数を低減したり、前記出力チャンネル変換手段において出力チャンネル数を低減すると共に、前記共有バッファの内の符号化データ格納手段のデータ領域を増加させるために、符号化データ格納手段に格納されるデータ量を削減し、ハードディスク等のデータ記憶手段への転送の遅延を軽減でき、前記データ記憶手段への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
なお、本発明は、このような音声符号化及び再生装置として実現することができるだけでなく、このような音声符号化及び再生装置が備える特徴的な手段をステップとする音声符号化及び再生方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したり、集積回路として実現することができる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
本発明に係る音声符号化及び再生装置では、符号化後のデータを一時的に格納するためのバッファの容量が閾値を超えた場合に音声符号化のビットレートを下げる等により符号化データのデータ量を削減しデータ記憶部への転送の遅延を軽減でき、データ記憶部への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
100,300,500,700 音声符号化及び再生装置
101 入力データ格納部
102 出力データ格納部
103 音声出力部
104 音声符号化部
105 符号化データ格納部
106 ビットレート制御部
107 データ記憶部
108,301,501,701 LSI
302 速度調整部
502,702 共有バッファ
503 サンプリング周波数変換部
703 出力チャンネル変換部
101 入力データ格納部
102 出力データ格納部
103 音声出力部
104 音声符号化部
105 符号化データ格納部
106 ビットレート制御部
107 データ記憶部
108,301,501,701 LSI
302 速度調整部
502,702 共有バッファ
503 サンプリング周波数変換部
703 出力チャンネル変換部
以下、図面を参照しながら本発明に係る音声符号化及び再生装置の実施の形態を説明する。
(実施の形態1)
以下、本発明に係る音声符号化及び再生装置の実施の形態1について図面を参照しながら説明する。尚、本実施の形態1に係る音声符号化及び再生装置は、符号化データ格納部の音声データの格納量が閾値を超えた場合に、ビットレート制御部において音声符号化のビットレートを低くすることを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態1について図面を参照しながら説明する。尚、本実施の形態1に係る音声符号化及び再生装置は、符号化データ格納部の音声データの格納量が閾値を超えた場合に、ビットレート制御部において音声符号化のビットレートを低くすることを特徴としている。
図1は、本発明の実施の形態1におけるPCM音響信号の再生と符号化を行う装置の構成を示すブロック図である。図1は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。
また、図1の点線の範囲に本実施の形態1の音声符号化及び再生装置が1チップのシステムLSI108で実行可能に収納されている。
図1において、音声符号化及び再生装置100は、音響信号の再生と音響信号の符号化を同時に行う装置である。入力データ格納部101は、入力されたPCM音響信号を一時的に格納する。入力データ格納部101から出力する音声データを読み出し、一時的に出力データ格納部102に格納する。ただし、入力データ格納部101と出力データ格納部102との間には、例えば出力音量制御処理装置などの付加的な装置が設けられ得るが必ずしも必要でないので、図1においては、省略する。
音声出力部103は出力データ格納部102にある音声データを出力する。音声符号化部104は、入力データ格納部101にあるPCM音響信号を符号化して、符号化データ格納部105に符号化データを一時的に格納する。ビットレート制御部106は、符号化データ格納部105に格納できるデータ残量をもとにして音声符号化部104で符号化するビットレートを制御する。符号化データ格納部105から符号化データを、データ記憶部107に移動させてデータを記憶させる。
音声符号化及び再生装置100は、音声再生と音声符号化が入力データのバッファが同じであるため、音声再生の処理と音声符号化の処理を終了させてから、次に処理を行う入力データを入力データ格納部101に入れるようにしなければならない。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図2は、本実施の形態1に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声符号化及び再生装置は、PCM音響信号を読み出して音声信号再生処理を行う(S201)。
次に、音声再生処理の後、符号化データ格納部105の残量があるかを検知する(S202)。符号化データ格納部105の残量が閾値以上の場合であり格納可能な場合には(S203でYes)、ビットレートを変えずに符号化処理を行う(S204)。
一方、符号化データ格納部105からデータ記憶部107への転送が遅れるなどにより、符号化データ格納部105の残量が閾値以下の場合であり格納可能でない場合には(S203でNo)、ビットレートを小さくして(S207)、符号化処理を行う(S204)。
その後、符号化データを符号化データ格納部105からデータ記憶部107に移動する処理を行い(S205)、入力信号が終了するまで(S206でYes)、以上の処理を繰り返して行う。
その後、符号化データを符号化データ格納部105からデータ記憶部107に移動する処理を行い(S205)、入力信号が終了するまで(S206でYes)、以上の処理を繰り返して行う。
以上のように、本実施の形態1に係る音声符号化及び再生装置においては、符号化処理のビットレートを削減して符号化データを減らすことにより、符号化データ格納部105に入るデータの量を小さくし、符号化データ格納部105の残量がなくなってしまって次の音声再生処理への移行が遅れてオーバーフローが発生することを抑えることができる。この結果、従来では、音声符号化と音声再生を同時に行う場合に、記憶装置で書き込み不能なブロックの回避やデータの断片化などにより、音声符号化したデータを記憶装置への転送が遅れてしまうことにより音声出力が途切れるといった問題があったが、符号化処理のビットレートを削減して符号化データを減らすことにより、音声出力が途切れることが少なくなるといった効果がある。
(実施の形態2)
以下、本発明に係る音声符号化及び再生装置の実施の形態2について図面を参照しながら説明する。尚、本実施の形態2に係る音声符号化及び再生装置は、符号化データ格納部の符号化後データの格納量が閾値を超えた場合に、速度調整部において出力される音声データの速度を遅くすることを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態2について図面を参照しながら説明する。尚、本実施の形態2に係る音声符号化及び再生装置は、符号化データ格納部の符号化後データの格納量が閾値を超えた場合に、速度調整部において出力される音声データの速度を遅くすることを特徴としている。
図3は、本実施の形態2におけるPCM音響信号の再生と符号化を行う装置の機能ブロック図である。なお、図3は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。
また、図3の点線の範囲に本実施の形態2の音声符号化及び再生装置が1チップのシステムLSI301で実行可能に収納されている。
図3において、音声符号化及び再生装置300は、音響信号の再生と音響信号の符号化を同時に行う装置である。速度調整部302は符号化データ格納部105のデータ残量をみて、音声出力速度を減少させるかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図4は、本実施の形態2に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声符号化及び再生装置は、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S401)。
次に、符号化データ格納部105の残量が閾値以上の場合には(S402でYes)、音声出力速度を変換せずに音声出力部103は音声再生処理を行う(S403)。
そして、音声再生処理を行った後(S403)、音声符号化部104において符号化処理を行い(S404)、符号化後のデータを符号化データ格納部105に格納して、その後、データ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S405)。
一方、符号化データ格納部105の残量が閾値以下の場合には(S402でNo)、前に符号化されたデータの、データ記憶部107への移動が遅れている可能性があるので、速度調整部302は、音声再生速度を遅くする処理を行い(S407)、以下入力信号が終了するまで(S406でYes)、S401以下の処理を繰り返す。
以上のように、本実施の形態2に係る音声符号化及び再生装置においては、データ格納部に格納される符号化データ量が閾値を超えると判断された場合には、速度調整部302において音声再生速度を遅くすることにより、データ記憶部107へのデータ転送をする時間を確保する。この結果、音声再生速度を遅くすることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
(実施の形態3)
以下、本発明に係る音声符号化及び再生装置の実施の形態3について図面を参照しながら説明する。尚、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部のデータ量が閾値を越えた場合には、サンプリング周波数を低減すると共に、共有バッファの符号化データ格納部への割当量を増加させることを特徴とするものである。
以下、本発明に係る音声符号化及び再生装置の実施の形態3について図面を参照しながら説明する。尚、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部のデータ量が閾値を越えた場合には、サンプリング周波数を低減すると共に、共有バッファの符号化データ格納部への割当量を増加させることを特徴とするものである。
図5は、本発明の実施の形態2におけるPCM音響信号の再生と符号化を行う装置の構成ブロック図である。図5は、上述した実施の形態と同様にPCM音響信号の再生と符号化を一つの装置で実行することを目的としている。また、再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの共有バッファ502で実行する場合の方法である。
図5に示すように、共有バッファ502に含まれる出力データ格納部102と符号化データ格納部105とは共有のデータ領域を使用しており、処理の状況に応じて図5の共有バッファ502のポインタに示すように割り当て領域を変更することが出来る。なお、図5の点線の範囲に本実施の形態3の音声符号化及び再生装置が1チップのシステムLSI501で実行可能に収納されている。
図5において、音声符号化及び再生装置500は、音響信号の再生と音響信号の符号化を同時に行う装置である。サンプリング周波数変換部503は符号化データ格納部105のデータ残量をみて、サンプリング周波数を変換するかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図6は、本実施の形態3に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S601)。
次に、符号化データ格納部105への符号化データの格納量を確認し、残量が閾値以上の場合には(S602でYes)、サンプリング周波数の変換は行わずに音声再生処理を行う。
一方、符号化データ格納部105の残量が閾値以下となる場合には(S602でNo)、前に符号化されたデータのデータ記憶部107への移動が遅れている可能性があるので、サンプリング周波数変換部503は、サンプリング周波数を変換して出力データのデータ量を少なくする処理を行う(S607)。
そして、データ量を少なくすることにより出力データ格納部102に割り当てられている領域を符号化データ格納部105に割り当てる処理を行うことにより(S608)、符号化データ格納部105に空きがない場合に待つ時間を出さないようにして、音声出力部103からの出力が途切れないようにすることができる。
そして、音声再生処理を行った後(S603)、音声符号化部104において符号化処理を行い(S604)、符号化後のデータを符号化データ格納部105に格納して、その後、ハードディスクやフラッシュメモリ等のデータ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S605)。
以上のように、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部105に格納される符号化データ量が閾値を超えた場合には、サンプリング周波数を変換して出力データのデータ量を少なくする処理を行うと共に、共有バッファ内の符号化データ格納部105に割り当てる領域を増加させることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
(実施の形態4)
以下、本発明に係る音声符号化及び再生装置の実施の形態4について図面を参照しながら説明する。尚、本実施の形態4に係る音声符号化及び再生装置は、出力チャンネル変換部で出力を変更すると共に、共有バッファの符号化データ格納部105のバッファ領域を拡張することを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態4について図面を参照しながら説明する。尚、本実施の形態4に係る音声符号化及び再生装置は、出力チャンネル変換部で出力を変更すると共に、共有バッファの符号化データ格納部105のバッファ領域を拡張することを特徴としている。
図7は、本実施の形態4におけるPCM音響信号の再生と符号化を行う装置の構成を示すブロック図である。
図7は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。なお、出力データ格納部102と符号化データ格納部105は共有のデータ領域を使用する共有バッファ702であり、処理の状況に応じて図7の共有バッファ702のポインタに示すように割り当てを変更することが出来る。
また、図7の点線の範囲に本実施の形態4の音声符号化及び再生装置が1チップのシステムLSI701で実行可能に収納されている。
図7において、音声符号化及び再生装置700は、音響信号の再生と音響信号の符号化を同時に行う装置である。出力チャンネル変換部703は符号化データ格納部105のデータ残量をみて、出力チャンネル数を変換するかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図8は、本実施の形態4に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S801)。
次に、符号化データ格納部105の残量が閾値以上の場合には(S802でYes)、出力チャンネル数の変換は行わずに音声再生処理を行う(S803)。
そして、符号化データ格納部105の残量が閾値以下の場合には(S802でNo)、前に符号化されたデータのデータ記憶部107への移動が遅れている可能性があるので、出力チャンネル変換部703は、出力チャンネル数を変換して出力データのデータ量を少なくする処理を行う(S807)。
また、データ量を少なくすることにより出力データ格納部に割り当てられている領域を符号化データ格納部に割り当てることにより、符号化データ格納部に空きがない場合に待つ時間を出さないようにして、音声出力部からの出力が途切れないようにすることが可能となる。
そして、音声再生処理を行った後(S803)、音声符号化部104において符号化処理を行い(S804)、符号化後のデータを符号化データ格納部105に格納して、その後、ハードディスクやフラッシュメモリ等のデータ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S805)。
以上の説明のように、本実施の形態4に係る音声符号化及び再生装置は、符号化データ格納部105に格納される符号化データ量が閾値を超えた場合には、出力チャンネルを変換して出力データ格納部に割り当てる出力データのデータ量を少なくする処理を行うと共に、共有バッファ702内の符号化データ格納部105に割り当てる領域を増加させることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
本発明に係る音声符号化及び再生装置は、CD等の再生及び録音を同時に行う装置、例えば、カーナビゲーション装置、DVDプレーヤ等に適用できる。
本発明は、デジタル音響データの符号化及び再生を同時に行う音声符号化及び再生装置に関するものである。
近年、手軽に音楽を聴きたいというユーザーの要望に応えるため、音声や楽音などのオーディオデータ信号を低ビットレートで圧縮符号化し、再生時に伸張復号化するための様々な技術が開発されており、その代表的な方式として、MPEG−1 Audio LayerIII(以下、MP3と略称する)が知られている。
このMP3の使われ方として、例えばCDなどに格納している音声信号を再生しながらMP3データに圧縮符号化する方法がある。なお、MP3データを記憶するものとしては、フラッシュメモリやハードディスクなどが挙げられる。
そして、音声の再生と圧縮符号化を同時に行う際、音声の符号化を行う装置と、音声の出力や付加的な音声処理を行う装置は別々に分けられて処理を行う方法と、再生と符号化の処理を交互に行いながら同時に行う方法の2つがある。
この音声の再生と符号化の処理を交互に行いながら同時に行う方法の場合、1チップのシステムLSIで実行可能であり、システムコストを削減できるといった利点がある。
そして、例えば、従来のエンコーダ、デコーダのバッファのオーバーフロー及びアンダーフローを防ぐ符号化装置が開示されている(例えば、特許文献1参照)。
しかしながら、上述したMP3データを記憶するフラッシュメモリには、書き込み不能なブロックを回避してサーチする機能があり、また、ハードディスクでは、データの読み書きを何度も繰り返すことにより、データが断片化し読み書き速度が低減する。この結果、符号化データ格納部からハードディスクやフラッシュメモリ等の記憶部への転送が遅延すると、音声再生処理への移行が遅延する。そして、出力データ格納部から音声データが出力されるタイミングが遅延すると、音声再生処理への移行が遅れ、音声出力データがオーバーフローしてしまい、音が途切れてしまうといった問題が生じる。
本発明は、このような点に鑑みてなされたものであり、音声再生処理への移行が遅れることにより音声出力データがオーバーフローしてしまい、音が途切れてしまうといった問題を軽減する音声符号化及び再生装置を提供することを目的としている。
以上の課題を解決するための、本発明に係る音声符号化及び再生装置は、入力されるPCM音響信号を用いて音声の符号化と再生とを1つの装置内で行う音声符号化及び再生装置であって、入力される音声データを格納する入力データ格納手段と、前記入力データ格納手段から音声データを格納する出力データ格納手段と、前記出力データ格納手段に格納されている音声データを出力する音声出力手段と、前記入力データ格納手段に格納されている音声データを符号化する音声符号化手段と、前記音声符号化手段における符号化後のデータを格納する符号化データ格納手段と、前記符号化データ格納手段のデータ残量に基づいて、前記符号化データ格納手段に格納する符号化データのデータ量を低減させる制御手段と、前記符号化データ格納手段から送信される符号化データを記憶するデータ記憶手段とを備えることを特徴とする。
また、前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記音声符号化手段における符号化ビットレートを下げるビットレート制御手段であることを特徴とする。
さらに、前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記符号化データ格納手段に格納する符号化データのデータ量を低減させるために、前記音声出力手段における音声再生速度を低減させる速度調整手段であることを特徴とする。
これらの構成により、制御手段において、符号化後のデータを一時的に格納するための符号化データ格納手段に格納されるデータ量が閾値を超えた場合に、前記ビットレート制御手段として音声符号化のビットレートを下げたり、前記速度調整手段として音声出力手段における再生速度を低減して、前記符号化データ格納手段に格納されるデータ量を削減し、ハードディスク等のデータ記憶手段への転送の遅延を軽減でき、前記データ記憶手段への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
また、前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータのサンプリング周波数を変換するサンプリング周波数変換手段であり、前記音声符号化及び再生装置は、さらに、前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、前記サンプリング周波数変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納するデータのサンプリング周波数を低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させることを特徴とする。
さらに、前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータの出力チャンネルを変換する出力チャンネル変換手段であり、前記音声符号化及び再生装置は、さらに、前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、前記出力チャンネル変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納する音声データの出力チャンネルを低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させることを特徴とする。
これらの構成により、符号化後のデータを一時的に格納するための符号化データ格納手段に格納されるデータ量が閾値を超えた場合に、前記サンプリング周波数変換手段においてサンプリング周波数を低減したり、前記出力チャンネル変換手段において出力チャンネル数を低減すると共に、前記共有バッファの内の符号化データ格納手段のデータ領域を増加させるために、符号化データ格納手段に格納されるデータ量を削減し、ハードディスク等のデータ記憶手段への転送の遅延を軽減でき、前記データ記憶手段への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
なお、本発明は、このような音声符号化及び再生装置として実現することができるだけでなく、このような音声符号化及び再生装置が備える特徴的な手段をステップとする音声符号化及び再生方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したり、集積回路として実現することができる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
本発明に係る音声符号化及び再生装置では、符号化後のデータを一時的に格納するためのバッファの容量が閾値を超えた場合に音声符号化のビットレートを下げる等により符号化データのデータ量を削減しデータ記憶部への転送の遅延を軽減でき、データ記憶部への転送の遅延がもとで音声出力が途切れることを適切に防止できる。
以下、図面を参照しながら本発明に係る音声符号化及び再生装置の実施の形態を説明する。
(実施の形態1)
以下、本発明に係る音声符号化及び再生装置の実施の形態1について図面を参照しながら説明する。尚、本実施の形態1に係る音声符号化及び再生装置は、符号化データ格納部の音声データの格納量が閾値を超えた場合に、ビットレート制御部において音声符号化のビットレートを低くすることを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態1について図面を参照しながら説明する。尚、本実施の形態1に係る音声符号化及び再生装置は、符号化データ格納部の音声データの格納量が閾値を超えた場合に、ビットレート制御部において音声符号化のビットレートを低くすることを特徴としている。
図1は、本発明の実施の形態1におけるPCM音響信号の再生と符号化を行う装置の構成を示すブロック図である。図1は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。
また、図1の点線の範囲に本実施の形態1の音声符号化及び再生装置が1チップのシステムLSI108で実行可能に収納されている。
図1において、音声符号化及び再生装置100は、音響信号の再生と音響信号の符号化を同時に行う装置である。入力データ格納部101は、入力されたPCM音響信号を一時的に格納する。入力データ格納部101から出力する音声データを読み出し、一時的に出力データ格納部102に格納する。ただし、入力データ格納部101と出力データ格納部102との間には、例えば出力音量制御処理装置などの付加的な装置が設けられ得るが必ずしも必要でないので、図1においては、省略する。
音声出力部103は出力データ格納部102にある音声データを出力する。音声符号化部104は、入力データ格納部101にあるPCM音響信号を符号化して、符号化データ格納部105に符号化データを一時的に格納する。ビットレート制御部106は、符号化データ格納部105に格納できるデータ残量をもとにして音声符号化部104で符号化するビットレートを制御する。符号化データ格納部105から符号化データを、データ記憶部107に移動させてデータを記憶させる。
音声符号化及び再生装置100は、音声再生と音声符号化が入力データのバッファが同じであるため、音声再生の処理と音声符号化の処理を終了させてから、次に処理を行う入力データを入力データ格納部101に入れるようにしなければならない。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図2は、本実施の形態1に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声符号化及び再生装置は、PCM音響信号を読み出して音声信号再生処理を行う(S201)。
次に、音声再生処理の後、符号化データ格納部105の残量があるかを検知する(S202)。符号化データ格納部105の残量が閾値以上の場合であり格納可能な場合には(S203でYes)、ビットレートを変えずに符号化処理を行う(S204)。
一方、符号化データ格納部105からデータ記憶部107への転送が遅れるなどにより、符号化データ格納部105の残量が閾値以下の場合であり格納可能でない場合には(S203でNo)、ビットレートを小さくして(S207)、符号化処理を行う(S204)。
その後、符号化データを符号化データ格納部105からデータ記憶部107に移動する処理を行い(S205)、入力信号が終了するまで(S206でYes)、以上の処理を繰り返して行う。
その後、符号化データを符号化データ格納部105からデータ記憶部107に移動する処理を行い(S205)、入力信号が終了するまで(S206でYes)、以上の処理を繰り返して行う。
以上のように、本実施の形態1に係る音声符号化及び再生装置においては、符号化処理のビットレートを削減して符号化データを減らすことにより、符号化データ格納部105に入るデータの量を小さくし、符号化データ格納部105の残量がなくなってしまって次の音声再生処理への移行が遅れてオーバーフローが発生することを抑えることができる。この結果、従来では、音声符号化と音声再生を同時に行う場合に、記憶装置で書き込み不能なブロックの回避やデータの断片化などにより、音声符号化したデータを記憶装置への転送が遅れてしまうことにより音声出力が途切れるといった問題があったが、符号化処理のビットレートを削減して符号化データを減らすことにより、音声出力が途切れることが少なくなるといった効果がある。
(実施の形態2)
以下、本発明に係る音声符号化及び再生装置の実施の形態2について図面を参照しながら説明する。尚、本実施の形態2に係る音声符号化及び再生装置は、符号化データ格納部の符号化後データの格納量が閾値を超えた場合に、速度調整部において出力される音声データの速度を遅くすることを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態2について図面を参照しながら説明する。尚、本実施の形態2に係る音声符号化及び再生装置は、符号化データ格納部の符号化後データの格納量が閾値を超えた場合に、速度調整部において出力される音声データの速度を遅くすることを特徴としている。
図3は、本実施の形態2におけるPCM音響信号の再生と符号化を行う装置の機能ブロック図である。なお、図3は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。
また、図3の点線の範囲に本実施の形態2の音声符号化及び再生装置が1チップのシステムLSI301で実行可能に収納されている。
図3において、音声符号化及び再生装置300は、音響信号の再生と音響信号の符号化を同時に行う装置である。速度調整部302は符号化データ格納部105のデータ残量をみて、音声出力速度を減少させるかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図4は、本実施の形態2に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声符号化及び再生装置は、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S401)。
次に、符号化データ格納部105の残量が閾値以上の場合には(S402でYes)、音声出力速度を変換せずに音声出力部103は音声再生処理を行う(S403)。
そして、音声再生処理を行った後(S403)、音声符号化部104において符号化処理を行い(S404)、符号化後のデータを符号化データ格納部105に格納して、その後、データ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S405)。
一方、符号化データ格納部105の残量が閾値以下の場合には(S402でNo)、前に符号化されたデータの、データ記憶部107への移動が遅れている可能性があるので、速度調整部302は、音声再生速度を遅くする処理を行い(S407)、以下入力信号が終了するまで(S406でYes)、S401以下の処理を繰り返す。
以上のように、本実施の形態2に係る音声符号化及び再生装置においては、データ格納部に格納される符号化データ量が閾値を超えると判断された場合には、速度調整部302において音声再生速度を遅くすることにより、データ記憶部107へのデータ転送をする時間を確保する。この結果、音声再生速度を遅くすることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
(実施の形態3)
以下、本発明に係る音声符号化及び再生装置の実施の形態3について図面を参照しながら説明する。尚、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部のデータ量が閾値を越えた場合には、サンプリング周波数を低減すると共に、共有バッファの符号化データ格納部への割当量を増加させることを特徴とするものである。
以下、本発明に係る音声符号化及び再生装置の実施の形態3について図面を参照しながら説明する。尚、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部のデータ量が閾値を越えた場合には、サンプリング周波数を低減すると共に、共有バッファの符号化データ格納部への割当量を増加させることを特徴とするものである。
図5は、本発明の実施の形態2におけるPCM音響信号の再生と符号化を行う装置の構成ブロック図である。図5は、上述した実施の形態と同様にPCM音響信号の再生と符号化を一つの装置で実行することを目的としている。また、再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの共有バッファ502で実行する場合の方法である。
図5に示すように、共有バッファ502に含まれる出力データ格納部102と符号化データ格納部105とは共有のデータ領域を使用しており、処理の状況に応じて図5の共有バッファ502のポインタに示すように割り当て領域を変更することが出来る。なお、図5の点線の範囲に本実施の形態3の音声符号化及び再生装置が1チップのシステムLSI501で実行可能に収納されている。
図5において、音声符号化及び再生装置500は、音響信号の再生と音響信号の符号化を同時に行う装置である。サンプリング周波数変換部503は符号化データ格納部105のデータ残量をみて、サンプリング周波数を変換するかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図6は、本実施の形態3に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S601)。
次に、符号化データ格納部105への符号化データの格納量を確認し、残量が閾値以上の場合には(S602でYes)、サンプリング周波数の変換は行わずに音声再生処理を行う。
一方、符号化データ格納部105の残量が閾値以下となる場合には(S602でNo)、前に符号化されたデータのデータ記憶部107への移動が遅れている可能性があるので、サンプリング周波数変換部503は、サンプリング周波数を変換して出力データのデータ量を少なくする処理を行う(S607)。
そして、データ量を少なくすることにより出力データ格納部102に割り当てられている領域を符号化データ格納部105に割り当てる処理を行うことにより(S608)、符号化データ格納部105に空きがない場合に待つ時間を出さないようにして、音声出力部103からの出力が途切れないようにすることができる。
そして、音声再生処理を行った後(S603)、音声符号化部104において符号化処理を行い(S604)、符号化後のデータを符号化データ格納部105に格納して、その後、ハードディスクやフラッシュメモリ等のデータ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S605)。
以上のように、本実施の形態3に係る音声符号化及び再生装置は、符号化データ格納部105に格納される符号化データ量が閾値を超えた場合には、サンプリング周波数を変換して出力データのデータ量を少なくする処理を行うと共に、共有バッファ内の符号化データ格納部105に割り当てる領域を増加させることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
(実施の形態4)
以下、本発明に係る音声符号化及び再生装置の実施の形態4について図面を参照しながら説明する。尚、本実施の形態4に係る音声符号化及び再生装置は、出力チャンネル変換部で出力を変更すると共に、共有バッファの符号化データ格納部105のバッファ領域を拡張することを特徴としている。
以下、本発明に係る音声符号化及び再生装置の実施の形態4について図面を参照しながら説明する。尚、本実施の形態4に係る音声符号化及び再生装置は、出力チャンネル変換部で出力を変更すると共に、共有バッファの符号化データ格納部105のバッファ領域を拡張することを特徴としている。
図7は、本実施の形態4におけるPCM音響信号の再生と符号化を行う装置の構成を示すブロック図である。
図7は、PCM音響信号の再生と符号化を一つの装置で実行することを目的としている。再生とは別に、符号化のみのために入力データを他のバッファに入れて符号化処理を別の装置で行うといった方法もあるが、その場合システムのコストが高くなるので、一つの装置で実行する場合の方法である。なお、出力データ格納部102と符号化データ格納部105は共有のデータ領域を使用する共有バッファ702であり、処理の状況に応じて図7の共有バッファ702のポインタに示すように割り当てを変更することが出来る。
また、図7の点線の範囲に本実施の形態4の音声符号化及び再生装置が1チップのシステムLSI701で実行可能に収納されている。
図7において、音声符号化及び再生装置700は、音響信号の再生と音響信号の符号化を同時に行う装置である。出力チャンネル変換部703は符号化データ格納部105のデータ残量をみて、出力チャンネル数を変換するかどうかを決定する。データ記憶部107への転送が遅れてしまうと、符号化したデータを符号化データ格納部105に置いておく事が出来なくなってしまうため、次の音声再生処理に移行することが出来なくなり、音声出力においてオーバーフローが発生するといった問題がある。
図8は、本実施の形態4に係る音声符号化及び再生装置の動作手順を示すフローチャートである。
最初に、音声再生処理を行う前に、符号化データ格納部105の残量があるかを検知する(S801)。
次に、符号化データ格納部105の残量が閾値以上の場合には(S802でYes)、出力チャンネル数の変換は行わずに音声再生処理を行う(S803)。
そして、符号化データ格納部105の残量が閾値以下の場合には(S802でNo)、前に符号化されたデータのデータ記憶部107への移動が遅れている可能性があるので、出力チャンネル変換部703は、出力チャンネル数を変換して出力データのデータ量を少なくする処理を行う(S807)。
また、データ量を少なくすることにより出力データ格納部に割り当てられている領域を符号化データ格納部に割り当てることにより、符号化データ格納部に空きがない場合に待つ時間を出さないようにして、音声出力部からの出力が途切れないようにすることが可能となる。
そして、音声再生処理を行った後(S803)、音声符号化部104において符号化処理を行い(S804)、符号化後のデータを符号化データ格納部105に格納して、その後、ハードディスクやフラッシュメモリ等のデータ記憶部107へ符号化データを移動する符号化データ移動処理を行う(S805)。
以上の説明のように、本実施の形態4に係る音声符号化及び再生装置は、符号化データ格納部105に格納される符号化データ量が閾値を超えた場合には、出力チャンネルを変換して出力データ格納部に割り当てる出力データのデータ量を少なくする処理を行うと共に、共有バッファ702内の符号化データ格納部105に割り当てる領域を増加させることにより、符号化データ格納部105の残量がなくなってしまって、次の音声再生処理への移行が遅れてしまっても、オーバーフローして音が途切れることを抑える効果がある。
本発明に係る音声符号化及び再生装置は、CD等の再生及び録音を同時に行う装置、例えば、カーナビゲーション装置、DVDプレーヤ等に適用できる。
100,300,500,700 音声符号化及び再生装置
101 入力データ格納部
102 出力データ格納部
103 音声出力部
104 音声符号化部
105 符号化データ格納部
106 ビットレート制御部
107 データ記憶部
108,301,501,701 LSI
302 速度調整部
502,702 共有バッファ
503 サンプリング周波数変換部
703 出力チャンネル変換部
101 入力データ格納部
102 出力データ格納部
103 音声出力部
104 音声符号化部
105 符号化データ格納部
106 ビットレート制御部
107 データ記憶部
108,301,501,701 LSI
302 速度調整部
502,702 共有バッファ
503 サンプリング周波数変換部
703 出力チャンネル変換部
Claims (8)
- 入力されるPCM音響信号である音声データを用いて音声の符号化と再生とを1つの装置内で行う音声符号化及び再生装置であって、
入力される音声データを格納する入力データ格納手段と、
前記入力データ格納手段から音声データを格納する出力データ格納手段と、
前記出力データ格納手段に格納されている音声データを出力する音声出力手段と、
前記入力データ格納手段に格納されている音声データを符号化する音声符号化手段と、
前記音声符号化手段における符号化後のデータを格納する符号化データ格納手段と、
前記符号化データ格納手段のデータ残量に基づいて、前記符号化データ格納手段に格納する符号化データのデータ量を低減させる制御手段と、
前記符号化データ格納手段から送信される符号化データを記憶するデータ記憶手段とを備える
ことを特徴とする音声符号化及び再生装置。 - 前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記音声符号化手段における符号化ビットレートを下げるビットレート制御手段である
ことを特徴とする請求項1記載の音声符号化及び再生装置。 - 前記制御手段は、前記符号化データ格納手段に格納されている符号化データ量が閾値以上となる場合には、前記符号化データ格納手段に格納する符号化データの短時間当たりのデータ量を低減させるために、前記音声出力手段における音声再生速度を低減させる速度調整手段である
ことを特徴とする請求項1記載の音声符号化及び再生装置。 - 前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータのサンプリング周波数を変換するサンプリング周波数変換手段であり、
前記音声符号化及び再生装置は、さらに、
前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、
前記サンプリング周波数変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納するデータのサンプリング周波数を低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させる
ことを特徴とする請求項1記載の音声符号化及び再生装置。 - 前記制御手段は、前記入力データ格納手段から前記出力データ格納手段に移動されるデータの出力チャンネルを変換する出力チャンネル変換手段であり、
前記音声符号化及び再生装置は、さらに、
前記入力データ格納手段と前記符号化データ格納手段とが共有される共有バッファを備え、
前記出力チャンネル変換手段は、前記符号化データ格納手段に格納される符号化データ量が閾値以上となる場合には、前記出力データ格納手段に格納する音声データの出力チャンネルを低減すると共に、前記共有バッファ内の前記符号化データ格納手段への割り当て量を増加させる
ことを特徴とする請求項1記載の音声符号化及び再生装置。 - 入力されるPCM音響信号を用いて音声の符号化と再生とを1つの装置内で行う音声符号化及び再生方法であって、
入力される音声データを格納する入力データ格納ステップと、
前記入力データ格納ステップから音声データを格納する出力データ格納ステップと、
前記出力データ格納ステップにおいて格納されている音声データを出力する音声出力ステップと、
前記入力データ格納ステップにおいて格納されている音声データを符号化する音声符号化ステップと、
前記音声符号化ステップにおける符号化後のデータを格納する符号化データ格納ステップと、
前記符号化データ格納ステップにおけるデータ残量に基づいて、前記符号化データ格納ステップにおいて格納する符号化データのデータ量を低減させる制御ステップと、
前記符号化データ格納ステップから送信される符号化データを記憶するデータ記憶ステップとを含む
ことを特徴とする音声符号化及び再生方法。 - 入力されるPCM音響信号を用いて音声の符号化と再生とを1つの装置内で行う音声符号化及び再生装置に用いるプログラムであって、
入力される音声データを格納する入力データ格納ステップと、
前記入力データ格納ステップから音声データを格納する出力データ格納ステップと、
前記出力データ格納ステップにおいて格納されている音声データを出力する音声出力ステップと、
前記入力データ格納ステップにおいて格納されている音声データを符号化する音声符号化ステップと、
前記音声符号化ステップにおける符号化後のデータを格納する符号化データ格納ステップと、
前記符号化データ格納ステップにおけるデータ残量に基づいて、前記符号化データ格納ステップにおいて格納する符号化データのデータ量を低減させる制御ステップと、
前記符号化データ格納ステップから送信される符号化データを記憶するデータ記憶ステップとをコンピュータに実行させる
ことを特徴とするプログラム。 - 入力される音声データを格納する入力データ格納回路と、
前記入力データ格納回路から音声データを格納する出力データ格納回路と、
前記入力データ格納回路において格納されている音声データを符号化する音声符号化回路と、
前記音声符号化回路における符号化後のデータを格納する符号化データ格納回路と、
前記符号化データ格納回路のデータ残量に基づいて、前記符号化データ格納回路に格納する符号化データのデータ量を低減させる制御回路とを備える
ことを特徴とする集積回路。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007134228 | 2007-05-21 | ||
JP2007134228 | 2007-05-21 | ||
PCT/JP2008/051005 WO2008142874A1 (ja) | 2007-05-21 | 2008-01-24 | 音声符号化及び再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2008142874A1 true JPWO2008142874A1 (ja) | 2010-08-05 |
Family
ID=40031593
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009515099A Ceased JPWO2008142874A1 (ja) | 2007-05-21 | 2008-01-24 | 音声符号化及び再生装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20100088102A1 (ja) |
EP (1) | EP2141693A4 (ja) |
JP (1) | JPWO2008142874A1 (ja) |
CN (1) | CN101681624A (ja) |
WO (1) | WO2008142874A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010197957A (ja) * | 2009-02-27 | 2010-09-09 | Seiko Epson Corp | 画像音声供給装置、画像音声出力装置、画像供給方法、画像音声出力方法、及びプログラム |
CN102779518B (zh) * | 2012-07-27 | 2014-08-06 | 深圳广晟信源技术有限公司 | 用于双核编码模式的编码方法和系统 |
US9437205B2 (en) * | 2013-05-10 | 2016-09-06 | Tencent Technology (Shenzhen) Company Limited | Method, application, and device for audio signal transmission |
US11094346B2 (en) | 2018-11-12 | 2021-08-17 | Netflix, Inc. | Systems and methods for adaptive streaming of multimedia content |
CN112771828B (zh) * | 2018-12-25 | 2022-10-18 | 华为技术有限公司 | 一种音频数据的通信方法及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261613A (ja) * | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | データ受信再生装置 |
JP2004354677A (ja) * | 2003-05-29 | 2004-12-16 | Pioneer Electronic Corp | 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、再生装置 |
JP2005080063A (ja) * | 2003-09-02 | 2005-03-24 | Nippon Telegr & Teleph Corp <Ntt> | 多段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0875856B1 (en) * | 1996-09-27 | 2003-05-02 | Matsushita Electric Industrial Co., Ltd. | Multimedia stream editing and authoring system involving verification of editing instructions |
US7110662B1 (en) * | 1997-03-25 | 2006-09-19 | Samsung Electronics Co., Ltd. | Apparatus and method for recording data on a DVD-audio disk |
US6061655A (en) * | 1998-06-26 | 2000-05-09 | Lsi Logic Corporation | Method and apparatus for dual output interface control of audio decoder |
JP2001195825A (ja) * | 1999-10-29 | 2001-07-19 | Sony Corp | 記録再生装置および方法 |
EP1124381A1 (en) * | 2000-02-08 | 2001-08-16 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for bitrate control in a video or audio encoder |
US6643744B1 (en) * | 2000-08-23 | 2003-11-04 | Nintendo Co., Ltd. | Method and apparatus for pre-fetching audio data |
US6606689B1 (en) * | 2000-08-23 | 2003-08-12 | Nintendo Co., Ltd. | Method and apparatus for pre-caching data in audio memory |
JP2002184108A (ja) * | 2000-12-13 | 2002-06-28 | Matsushita Electric Ind Co Ltd | 音声再生装置および音声再生方法 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
KR100644978B1 (ko) * | 2002-09-30 | 2006-11-14 | 산요덴키가부시키가이샤 | 네트워크 전화기 및 음성 복호화 장치 |
US7650285B2 (en) * | 2004-06-25 | 2010-01-19 | Numerex Corporation | Method and system for adjusting digital audio playback sampling rate |
-
2008
- 2008-01-24 CN CN200880016744A patent/CN101681624A/zh active Pending
- 2008-01-24 EP EP08703832A patent/EP2141693A4/en not_active Withdrawn
- 2008-01-24 JP JP2009515099A patent/JPWO2008142874A1/ja not_active Ceased
- 2008-01-24 WO PCT/JP2008/051005 patent/WO2008142874A1/ja active Application Filing
- 2008-01-24 US US12/597,776 patent/US20100088102A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261613A (ja) * | 1996-03-26 | 1997-10-03 | Mitsubishi Electric Corp | データ受信再生装置 |
JP2004354677A (ja) * | 2003-05-29 | 2004-12-16 | Pioneer Electronic Corp | 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、再生装置 |
JP2005080063A (ja) * | 2003-09-02 | 2005-03-24 | Nippon Telegr & Teleph Corp <Ntt> | 多段音声画像符号化方法、その装置及びプログラム及びこのプログラムを記録した記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2008142874A1 (ja) | 2008-11-27 |
EP2141693A1 (en) | 2010-01-06 |
US20100088102A1 (en) | 2010-04-08 |
EP2141693A4 (en) | 2011-11-02 |
CN101681624A (zh) | 2010-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5247148B2 (ja) | 残響サウンド信号のコーディング | |
JP2005157390A (ja) | 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置 | |
JPWO2008142874A1 (ja) | 音声符号化及び再生装置 | |
JP5629429B2 (ja) | オーディオ再生装置及びオーディオ再生方法 | |
JP2006195471A (ja) | 多チャンネル信号符号化/復号化方法及びその装置 | |
JP4990375B2 (ja) | 記録再生装置 | |
JP2001255894A (ja) | 再生速度変換装置及び方法 | |
JP2008152840A (ja) | 記録再生装置 | |
US20150104158A1 (en) | Digital signal reproduction device | |
JP2007183410A (ja) | 情報再生装置および方法 | |
JP4639966B2 (ja) | オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路 | |
KR101016486B1 (ko) | 디지털 데이터 재생 장치 및 컴퓨터 판독 가능 기록 매체 | |
JPS6122370B2 (ja) | ||
JP7476516B2 (ja) | 信号処理装置、信号処理システム、プログラム、信号処理方法 | |
JP2002304197A (ja) | オーディオ復号方法および装置 | |
JP4290306B2 (ja) | 記録再生装置、方法および媒体 | |
JP2008047223A (ja) | オーディオ再生回路 | |
JP2006079742A (ja) | 情報処理装置および方法、並びにプログラム | |
JP4319895B2 (ja) | 時系列信号の符号化装置 | |
JP4665027B2 (ja) | 記録再生装置、方法および媒体 | |
JP2006522949A (ja) | 埋め込みデータ・チャンネルの更新 | |
JP2005228421A (ja) | ディジタル情報記録再生装置 | |
WO2005104125A1 (ja) | 記録再生装置、同時記録再生制御方法、および同時記録再生制御プログラム | |
JP2002175098A (ja) | 符号化装置、符号化方法、プログラムおよびプログラム記録媒体 | |
JP2006277792A (ja) | 情報記録再生装置および情報記録再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120201 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20130129 |