JPH0973299A - Mpeg audio reproducing device and mpeg reproducing device - Google Patents
Mpeg audio reproducing device and mpeg reproducing deviceInfo
- Publication number
- JPH0973299A JPH0973299A JP16945496A JP16945496A JPH0973299A JP H0973299 A JPH0973299 A JP H0973299A JP 16945496 A JP16945496 A JP 16945496A JP 16945496 A JP16945496 A JP 16945496A JP H0973299 A JPH0973299 A JP H0973299A
- Authority
- JP
- Japan
- Prior art keywords
- mpeg
- audio
- signal
- voice
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/005—Reproducing at a different information rate from the information rate of recording
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明はMPEG(Moving P
icture Expert Group )オーディオ再生装置およびMP
EG再生装置に係り、詳しくは、話速変換機能を備えた
MPEGオーディオ再生装置およびMPEG再生装置に
関するものである。BACKGROUND OF THE INVENTION The present invention relates to MPEG (Moving P
icture Expert Group) Audio player and MP
The present invention relates to an EG reproducing device, and more particularly to an MPEG audio reproducing device and an MPEG reproducing device having a speech rate conversion function.
【0002】[0002]
【従来の技術】マルチメディアで扱われる情報は、膨大
な量で且つ多種多様であり、これらの情報を高速に処理
することがマルチメディアの実用化を図る上で必要とな
ってくる。情報を高速に処理するためには、データの圧
縮・伸長技術が不可欠となる。そのようなデータの圧縮
・伸長技術として「MPEG」方式が挙げられる。この
MPEG方式は、ISO(International Organization
for Standardization)/IEC(Intarnational Elec
trotechnical Commission )傘下のMPEG委員会(IS
O/IEC JTC1/SC29/WG11)によって標準化されつつある。2. Description of the Related Art The information handled by multimedia is enormous and diverse, and it is necessary to process such information at high speed in order to put multimedia into practical use. In order to process information at high speed, data compression / decompression technology is indispensable. As such data compression / decompression technology, the “MPEG” method is exemplified. This MPEG system is based on the ISO (International Organization).
for Standardization) / IEC (Intarnational Elec)
trotechnical Commission)
It is being standardized by O / IEC JTC1 / SC29 / WG11).
【0003】MPEGは3つのパートから構成されてい
る。パート1の「MPEGシステムパート」(ISO/IEC
IS 11172 Part1:Systems)では、ビデオデータとオーデ
ィオデータの多重化構造(マルチプレクス・ストラクチ
ャ)および同期方式が規定される。パート2の「MPE
Gビデオパート」(ISO/IEC IS 11172 Part2:Video)で
は、ビデオデータの高能率符号化方式およびビデオデー
タのフォーマットが規定される。パート3の「MPEG
オーディオパート」(ISO/IEC IS 11172 Part3:Audio)
では、オーディオデータの高能率符号化方式およびオー
ディオデータのフォーマットが規定される。[0003] MPEG is composed of three parts. Part 1 “MPEG System Part” (ISO / IEC
IS 11172 Part1: Systems) defines a multiplex structure (multiplex structure) of video data and audio data and a synchronization method. Part 2 "MPE
In the "G video part" (ISO / IEC IS 11172 Part2: Video), a high-efficiency encoding method of video data and a format of the video data are specified. Part 3, "MPEG
Audio Part ”(ISO / IEC IS 11172 Part3: Audio)
Defines a high-efficiency encoding method of audio data and a format of audio data.
【0004】MPEGビデオパートで取り扱われるビデ
オデータは動画に関するものであり、その動画は1秒間
に数十個(例えば、30個)のフレーム(静止画、コ
マ)によって構成されている。ビデオデータは、シーケ
ンス(Sequence)、GOP(Group Of Pictures )、ピ
クチャ、スライス(Slice )、マクロブロック(Macrob
lock)、ブロックの順に6層の階層構造から成る。[0004] The video data handled by the MPEG video part relates to a moving image, and the moving image is composed of several tens (eg, 30) frames (still images, frames) per second. Video data includes a sequence (Sequence), a GOP (Group Of Pictures), a picture, a slice (Slice), and a macro block (Macrob).
lock), and a block in order of 6 layers.
【0005】また、MPEGには主にエンコードレート
の違いにより、現在のところ、MPEG−1,MPEG
−2の2つの方式がある。MPEG−1においてフレー
ムはピクチャに対応している。MPEG−2において
は、フレームまたはフィールドをピクチャに対応させる
こともできる。フィールドは、2個で1つのフレームを
構成している。ピクチャにフレームが対応している構造
はフレーム構造と呼ばれ、ピクチャにフィールドが対応
している構造はフィールド構造と呼ばれる。[0005] At present, MPEG-1 and MPEG-1 are mainly used due to differences in encoding rates.
-2. In MPEG-1, a frame corresponds to a picture. In MPEG-2, a frame or a field can correspond to a picture. Two fields constitute one frame. A structure in which a frame corresponds to a picture is called a frame structure, and a structure in which a field corresponds to a picture is called a field structure.
【0006】MPEGでは、フレーム間予測と呼ばれる
圧縮技術を用いる。フレーム間予測は、フレーム間のデ
ータを時間的な相関に基づいて圧縮する。フレーム間予
測では双方向予測が行われる。双方向予測とは、過去の
再生画像(または、ピクチャ)から現在の再生画像を予
測する順方向予測と、未来の再生画像から現在の再生画
像を予測する逆方向予測とを併用することである。[0006] MPEG uses a compression technique called inter-frame prediction. Inter-frame prediction compresses data between frames based on temporal correlation. In the inter-frame prediction, bidirectional prediction is performed. The bidirectional prediction is to use both forward prediction for predicting a current reproduced image from a past reproduced image (or picture) and backward prediction for predicting a current reproduced image from a future reproduced image. .
【0007】この双方向予測は、Iピクチャ(Intra-Pi
cture ),Pピクチャ(Predictive-Picture),Bピク
チャ(Bidirectionally predictive-Picture)と呼ばれ
る3つのタイプのピクチャを規定している。Iピクチャ
は、過去や未来の再生画像とは無関係に、独立して生成
される。Pピクチャは順方向予測(過去のIピクチャま
たはPピクチャからの予測)により生成される。Bピク
チャは双方向予測により生成される。双方向予測におい
てBピクチャは、以下に示す3つの予測のうちいずれか
1つにより生成される。順方向予測;過去のIピクチ
ャまたはPピクチャからの予測、逆方向予測;未来の
IピクチャまたはPピクチャからの予測、双方向予
測;過去および未来のIピクチャまたはPピクチャから
の予測。そして、これらI,P,Bピクチャがそれぞれ
エンコードされる。つまり、Iピクチャは過去や未来の
ピクチャが無くても生成される。これに対し、Pピクチ
ャは過去のピクチャが無いと生成されず、Bピクチャは
過去または未来のピクチャが無いと生成されない。[0007] This bidirectional prediction is based on an I-picture (Intra-Pi
), a P picture (Predictive-Picture), and a B picture (Bidirectionally predictive-Picture). The I picture is generated independently of a past or future reproduced image. The P picture is generated by forward prediction (prediction from a past I picture or P picture). B pictures are generated by bidirectional prediction. In bidirectional prediction, a B picture is generated by any one of the following three predictions. Forward prediction; prediction from past I or P pictures; backward prediction; prediction from future I or P pictures, bidirectional prediction; prediction from past and future I or P pictures. Then, these I, P, and B pictures are respectively encoded. That is, an I picture is generated even if there is no past or future picture. In contrast, a P picture is not generated without a past picture, and a B picture is not generated without a past or future picture.
【0008】フレーム間予測では、まず、Iピクチャが
周期的に生成される。次に、Iピクチャよりも数フレー
ム先のフレームがPピクチャとして生成される。このP
ピクチャは、過去から現在への一方向(順方向)の予測
により生成される。続いて、Iピクチャの前、Pピクチ
ャの後に位置するフレームがBピクチャとして生成され
る。このBピクチャを生成するとき、順方向予測,逆方
向予測,双方向予測の3つの中から最適な予測方法が選
択される。一般的に連続した動画では、現在の画像とそ
の前後の画像とは良く似ており、異なっているのはその
一部分に過ぎない。そこで、前のフレーム(例えば、I
ピクチャ)と次のフレーム(例えば、Pピクチャ)とは
同じであると仮定し、両フレーム間に変化があればその
差分(Bピクチャ)のみを抽出して圧縮する。これによ
り、フレーム間のデータを時間的な相関に基づいて圧縮
することができる。In the inter-frame prediction, first, an I picture is periodically generated. Next, a frame several frames ahead of the I picture is generated as a P picture. This P
The picture is generated by one-way (forward) prediction from the past to the present. Subsequently, a frame located before the I picture and after the P picture is generated as a B picture. When generating this B picture, an optimal prediction method is selected from three of forward prediction, backward prediction, and bidirectional prediction. In general, in a continuous moving image, a current image and images before and after the current image are very similar, and only a part thereof is different. Then, the previous frame (for example, I
It is assumed that the picture and the next frame (for example, P picture) are the same, and if there is a change between both frames, only the difference (B picture) is extracted and compressed. Thus, data between frames can be compressed based on temporal correlation.
【0009】MPEGビデオパートに準拠してエンコー
ドされたビデオデータのデータ列(ビットストリーム)
は、MPEGビデオストリーム(以下、ビデオストリー
ムと略す)と呼ばれる。また、MPEGオーディオパー
トに準拠してエンコードされたオーディオデータのデー
タ列は、MPEGオーディオストリーム(以下、オーデ
ィオストリームと略す)と呼ばれる。そして、ビデオス
トリームとオーディオストリームは、MPEGシステム
パートに準拠して時分割多重化され、1本のデータ列と
してのMPEGシステムストリーム(以下、システムス
トリームと略す)となる。システムストリームはマルチ
プレックスストリームとも呼ばれる。A data string (bit stream) of video data encoded according to the MPEG video part
Is called an MPEG video stream (hereinafter abbreviated as video stream). A data string of audio data encoded according to the MPEG audio part is called an MPEG audio stream (hereinafter, abbreviated as audio stream). Then, the video stream and the audio stream are time-division multiplexed according to the MPEG system part and become an MPEG system stream (hereinafter, abbreviated as system stream) as one data string. System streams are also called multiplex streams.
【0010】MPEGパートにおけるエンコードからデ
コードまでの流れは、以下のようになっている。MPE
Gシステムエンコーダ(以下、システムエンコーダと略
す)は、ビデオデータとオーディオデータのそれぞれを
連係を保ちながら別個にエンコードを行い、ビデオスト
リームとオーディオストリームを生成する。次に、MP
EGシステムエンコーダに装備されたマルチプレクサ
(MUX;Multiplexer)は、伝送媒体または記録媒体
のフォーマットに適合するように、ビデオストリームと
オーディオストリームの多重化を行い、システムストリ
ームを生成する。そのシステムストリームは、伝送媒体
を介してMUXから伝送されるか、または記録媒体に記
録される。The flow from encoding to decoding in the MPEG part is as follows. MPE
The G system encoder (hereinafter abbreviated as system encoder) separately encodes the video data and the audio data while maintaining the association with each other to generate a video stream and an audio stream. Next, MP
A multiplexer (MUX; Multiplexer) provided in the EG system encoder multiplexes a video stream and an audio stream so as to match a format of a transmission medium or a recording medium, and generates a system stream. The system stream is transmitted from the MUX via a transmission medium or recorded on a recording medium.
【0011】MPEGシステムデコーダ(以下、システ
ムデコーダと略す)に装備されたデマルチプレクサ(D
MUX;DeMUltipleXer )は、システムストリームをビ
デオストリームとオーディオストリームに分離する。次
に、システムデコーダは各ストリームを個別にデコード
して、ビデオのデコード出力(以下、ビデオ出力とい
う)とオーディオのデコード出力(以下、オーディオ出
力という)を生成する。ビデオ出力はディスプレイへ出
力され、ディスプレイで動画が再生される。オーディオ
出力はD/A(Digital/Analog)コンバータおよびオー
ディオアンプを介してスピーカへ出力され、スピーカか
ら音声が再生される。A demultiplexer (D) provided in an MPEG system decoder (hereinafter abbreviated as system decoder)
MUX; DeMUltipleXer) separates the system stream into a video stream and an audio stream. Next, the system decoder individually decodes each stream to generate a video decoded output (hereinafter referred to as video output) and an audio decoded output (hereinafter referred to as audio output). The video output is output to the display, and the moving image is played on the display. The audio output is output to the speaker via the D / A (Digital / Analog) converter and the audio amplifier, and the sound is reproduced from the speaker.
【0012】ところで、MPEG−1は主にビデオCD
(Compact Disc),CD−ROM(CD-Read Only Memor
y ),DVD(Digital Video Disc)などの記録媒体を
用いた蓄積メディアに対応しており、MPEG−2はM
PEG−1をも含む幅広い範囲のアプリケーションに対
応している。By the way, MPEG-1 is mainly a video CD.
(Compact Disc), CD-ROM (CD-Read Only Memor
y), DVD (Digital Video Disc) and other recording media are used, and MPEG-2 is M
It supports a wide range of applications including PEG-1.
【0013】蓄積メディアにおいては、以下に示す2つ
の可変速再生が要求される。動画を通常(標準)の再
生速度より高速で再生(以下、高速再生という)する機
能。動画を通常の再生速度より低速で再生(以下、低
速再生という)する機能。高速再生機能は、例えば、ユ
ーザが短時間に動画を見るために早送り再生を行う際
や、見たい動画を探索するために早送り再生または早送
り逆転再生を行う際に用いられる。また、低速再生機能
は、例えば、ユーザが動画を注意深く見る際などに用い
られる。In the storage medium, the following two variable speed reproductions are required. A function to play a video at a higher speed than the normal (standard) playback speed (hereinafter referred to as high-speed playback). A function to play a movie at a slower speed than the normal playback speed (hereinafter referred to as slow playback). The high-speed playback function is used, for example, when a user performs fast-forward playback to view a moving image in a short time, or when performing fast-forward playback or fast-forward reverse playback to search for a desired moving image. Further, the slow-speed playback function is used, for example, when the user carefully watches a moving image.
【0014】記録媒体から読み出されたシステムストリ
ームのビットレートは、読み出し速度に対応したものに
なる。従って、高速再生を行うには記録媒体からシステ
ムストリームを高速で読み出し、低速再生を行うには記
録媒体からシステムストリームを低速で読み出す。例え
ば、記録媒体としてビデオCDやDVDを用いた場合に
は、ビデオCDやDVDの回転速度を通常の再生時(標
準再生時)よりも速くしたり遅くしたりすることで、シ
ステムストリームを所望の速度で読み出すようにする。The bit rate of the system stream read from the recording medium corresponds to the read speed. Therefore, the system stream is read from the recording medium at high speed for high-speed reproduction, and the system stream is read at low speed from the recording medium for low-speed reproduction. For example, when a video CD or DVD is used as a recording medium, the system stream is set to a desired level by making the rotation speed of the video CD or DVD faster or slower than that during normal reproduction (standard reproduction). Read at speed.
【0015】[0015]
【発明が解決しようとする課題】従来、MPEGにおい
ては、前記したような動画の可変速再生については検討
されていたものの、音声の可変速再生については何らの
検討もなされていなかった。Conventionally, in MPEG, although the variable speed reproduction of moving images as described above has been studied, no consideration has been given to the variable speed reproduction of audio.
【0016】オーディオストリームのビットレートはシ
ステムストリームのそれと同一である。そのため、動画
の高速再生時には、オーディオストリームのビットレー
トも大きくなり、再生される音声の音程(ピッチ)が上
がるのに加えて、発声速度(話速)が速くなる。また、
動画の低速再生時には、オーディオストリームのビット
レートも小さくなり、再生される音声のピッチは変化し
ないものの、音声が途切れ途切れになる。このように、
動画の可変速再生時には、音声が聞き苦しいものになる
という問題があった。The bit rate of the audio stream is the same as that of the system stream. Therefore, at the time of high-speed reproduction of a moving image, the bit rate of the audio stream also increases, and the pitch (pitch) of the reproduced audio increases, and the utterance speed (speech speed) also increases. Also,
During low-speed playback of a moving image, the bit rate of the audio stream also decreases, and the pitch of the played audio does not change, but the audio is interrupted. in this way,
There was a problem that the audio becomes uncomfortable when playing a variable speed video.
【0017】ところで、近年、ピッチを変化させること
なく話速を任意に制御する話速変換技術の開発が進めら
れており、本出願人もVTRやテープレコーダに利用可
能な話速変換処理LSIを既に開発している(特開平7
−192392号公報(G11B20/02)、日経エレクトロ
ニクス 1994 年11月21日号(No.622) P.93 〜98. 参
照)。しかし、話速変換技術をMPEGに利用する試み
はなされていない。By the way, in recent years, the development of a voice speed conversion technique for arbitrarily controlling the voice speed without changing the pitch has been promoted, and the applicant of the present invention has developed a voice speed conversion processing LSI which can be used for a VTR or a tape recorder. Already developed
-192392 (G11B20 / 02), Nikkei Electronics November 21, 1994 issue (No. 622) P.93-98.). However, no attempt has been made to utilize the speech speed conversion technology for MPEG.
【0018】また、音声と動画(映像)の同期生成にお
いては、「リップシンク」を考慮する必要がある。リッ
プシンクとは、ディスプレイに映し出される人物の口の
動きと、スピーカから発声される音声との同期がとれて
いることをいう。口の動きより音声の方が早くなった
り、逆に遅くなったりする状態をリップシンクにずれが
あるという。リップシンクのずれが人間の聴覚の許容範
囲を外れると、視聴者は違和感を覚える。一般に、音声
が動画より遅れることによって生じるリップシンクのず
れとして許容できる時間は、約50〜250msであると
いわれている。Further, in the synchronous generation of the audio and the moving image (video), it is necessary to consider "lip sync". Lip sync means that the movement of the person's mouth displayed on the display and the voice uttered from the speaker are synchronized. It is said that there is a gap in the lip sync when the sound is faster than the mouth movement, and vice versa. If the deviation of the lip sync is outside the permissible range of human hearing, the viewer feels uncomfortable. Generally, it is said that the time allowed as the lip sync shift caused by the delay of the audio from the moving image is about 50 to 250 ms.
【0019】本発明は上記要求を満足するためになされ
たものであって、以下の目的を有するものである。 〔1〕可変速再生時においても自然で聞き易い音声を再
生することが可能なMPEGオーディオ再生装置を提供
する。The present invention has been made to satisfy the above requirements, and has the following objects. [1] To provide an MPEG audio reproducing apparatus capable of reproducing a natural and easy-to-listen sound even during variable speed reproduction.
【0020】〔2〕上記〔1〕のMPEGオーディオ再
生装置とMPEGビデオデコーダとを備えたMPEG再
生装置を提供する。 〔3〕上記〔1〕のMPEGオーディオ再生装置とMP
EGビデオデコーダとを備え、音声と動画との時間ずれ
を低減することが可能なMPEG再生装置を提供する。[2] An MPEG reproducing apparatus provided with the MPEG audio reproducing apparatus and the MPEG video decoder of the above [1] is provided. [3] MPEG audio reproducing apparatus and MP of [1] above
Provided is an MPEG playback device including an EG video decoder and capable of reducing time lag between audio and moving images.
【0021】[0021]
【課題を解決するための手段】請求項1に記載の発明
は、MPEGオーディオデコーダ(3)と、その出力に
対して話速変換処理を行う話速変換処理手段(2,4)
とを備えたことをその要旨とする。According to a first aspect of the present invention, an MPEG audio decoder (3) and a voice speed conversion processing means (2, 4) for performing a voice speed conversion process on its output.
The point is to have and.
【0022】請求項2に記載の発明は、MPEGオーデ
ィオデコーダ(3)と、その出力に対して話速変換処理
を行う話速変換処理手段(2,4)と、MPEGビデオ
デコーダ(3)とを備えたことをその要旨とする。According to the second aspect of the present invention, an MPEG audio decoder (3), a voice speed conversion processing means (2, 4) for performing a voice speed conversion process on the output, and an MPEG video decoder (3). The point is to have
【0023】請求項3に記載の発明は、記録媒体(2
1)から読み出されたMPEGオーディオストリームを
MPEGオーディオパートに準拠してデコードし、オー
ディオ信号を生成するMPEGオーディオデコーダ
(3)と、オーディオ信号に対して話速変換処理を行う
話速変換処理手段(2,4)とを備え、話速変換処理手
段は、オーディオストリームのビットレートが通常時よ
りも大きい場合には、再生される音声のピッチを通常の
再生時とほぼ同一にし、且つ、再生される話速を通常の
再生時に近づけるように話速変換処理を行い、オーディ
オストリームのビットレートが通常時よりも小さい場合
には、音声区間の途切れが目立たなくなるように話速変
換処理を行うことをその要旨とする。According to a third aspect of the present invention, there is provided a recording medium (2
An MPEG audio decoder (3) that decodes the MPEG audio stream read from 1) according to the MPEG audio part to generate an audio signal, and a speech speed conversion processing unit that performs a speech speed conversion process on the audio signal. (2, 4), the speech speed conversion processing unit makes the pitch of the reproduced sound substantially the same as that during normal reproduction when the bit rate of the audio stream is higher than during normal reproduction, and The voice speed conversion process should be performed so that the voice speed becomes closer to that during normal playback, and if the bit rate of the audio stream is lower than the normal time, the voice speed conversion process should be performed so that the breaks in the voice section become less noticeable. Is the gist.
【0024】請求項4に記載の発明は、記録媒体(2
1)から読み出されたMPEGオーディオストリームを
MPEGオーディオパートに準拠してデコードし、オー
ディオ信号を生成するMPEGオーディオデコーダ
(3)と、オーディオ信号に対して話速変換処理を行う
話速変換処理手段(2,4)とを備え、話速変換処理手
段は、オーディオストリームのビットレートが通常時よ
りも大きい場合には、再生される音声区間の時間長さを
伸長すると共に各無音区間の時間長さを短くするように
して話速変換処理を行い、オーディオストリームのビッ
トレートが通常時よりも小さい場合には、再生される各
音声区間の時間長さを伸長すると共に各無音区間の時間
長さを短くするか、または、各無音区間を削除して各音
声区間をつなぎ合わせた後に無音区間を挿入するように
して話速変換処理を行うことをその要旨とする。According to a fourth aspect of the present invention, there is provided a recording medium (2
An MPEG audio decoder (3) that decodes the MPEG audio stream read from 1) according to the MPEG audio part to generate an audio signal, and a speech speed conversion processing unit that performs a speech speed conversion process on the audio signal. (2, 4), the voice speed conversion processing means, when the bit rate of the audio stream is higher than the normal time, extends the time length of the reproduced voice section and the time length of each silent section. If the bit rate of the audio stream is lower than normal, the time length of each voice section to be played back is extended and the time length of each silent section is shortened. Or shorten the speech rate, or delete the silent sections and connect the speech sections, and then insert the silent sections to perform the speech speed conversion process. It and its gist.
【0025】請求項5に記載の発明は、請求項3または
請求項4に記載のMPEGオーディオ再生装置におい
て、話速変換処理手段(2,4)は、オーディオ信号を
蓄積するリングメモリ(32)と、リングメモリの蓄積
量を検出する検出手段(33)とを備え、リングメモリ
の蓄積量に応じて音声区間の時間長さの圧縮伸長率を調
整することをその要旨とする。According to a fifth aspect of the present invention, in the MPEG audio reproducing apparatus according to the third or fourth aspect, the speech speed conversion processing means (2, 4) has a ring memory (32) for accumulating an audio signal. And a detection means (33) for detecting the accumulated amount of the ring memory, and the gist is to adjust the compression / expansion rate of the time length of the voice section according to the accumulated amount of the ring memory.
【0026】請求項6に記載の発明は、請求項5に記載
のMPEGオーディオ再生装置において、話速変換処理
手段(2,4)は、オーディオ信号の音声区間と無音区
間とを判別する音声判別部(41)と、無音区間の削除
処理または挿入処理を行う無音削除挿入部(42)と、
リングメモリ(32)の蓄積量に基づいて音声区間の圧
縮伸長処理を行うことで圧縮伸長率を調整する時間軸圧
縮伸長部(43)とを備えたことをその要旨とする。According to a sixth aspect of the present invention, in the MPEG audio reproducing apparatus according to the fifth aspect, the voice speed conversion processing means (2, 4) discriminates the voice section of the audio signal from the voice section. A part (41), a silence deletion insertion part (42) for performing a deletion process or insertion process of a silence section,
The gist of the present invention is to include a time axis compression / expansion unit (43) that adjusts the compression / expansion rate by performing compression / expansion processing of a voice section based on the amount of storage in the ring memory (32).
【0027】請求項7に記載の発明は、請求項3〜6の
いずれか1項に記載のMPEGオーディオ再生装置
(1)と、記録媒体(21)から読み出されたMPEG
ビデオストリームをMPEGビデオパートに準拠してデ
コードし、ビデオ信号を生成するMPEGビデオデコー
ダ(12)とを備えたことをその要旨とする。The invention described in claim 7 is the MPEG audio reproducing apparatus (1) according to any one of claims 3 to 6 and the MPEG read from the recording medium (21).
The gist of the present invention is to include an MPEG video decoder (12) for decoding a video stream in accordance with the MPEG video part and generating a video signal.
【0028】請求項8に記載の発明は、請求項5または
請求項6に記載のMPEGオーディオ再生装置(1)
と、記録媒体(21)から読み出されたMPEGビデオ
ストリームをMPEGビデオパートに準拠してデコード
し、ビデオ信号を生成するMPEGビデオデコーダ(1
2)と、リングメモリ(32)に書き込まれる以前のオ
ーディオ信号に、時刻に関する情報としてのインデック
ス信号を付加するインデックス付加回路(51)と、リ
ングメモリ(32)から読み出されたオーディオ信号に
付加されているインデックス信号を検出し、そのインデ
ックス信号から得られる時刻情報と現在の時刻情報とか
ら、話速変換処理手段(2,4)における信号遅延時間
を検出し、その検出された遅延時間を示す信号をMPE
Gビデオデコーダ(12)へ供給するインデックス検出
回路(52)とを備え、MPEGビデオデコーダ(1
2)は、前記遅延時間を示す信号に基づいて自己の動作
のタイミングを制御することをその要旨とする。The invention described in claim 8 is the MPEG audio reproducing apparatus (1) according to claim 5 or claim 6.
And an MPEG video decoder (1) for decoding the MPEG video stream read from the recording medium (21) in accordance with the MPEG video part to generate a video signal.
2), an index adding circuit (51) for adding an index signal as information about time to the audio signal before being written in the ring memory (32), and an audio signal read from the ring memory (32) Detected index signal, the signal delay time in the speech speed conversion processing means (2, 4) is detected from the time information obtained from the index signal and the current time information, and the detected delay time is calculated. Show the signal MPE
The MPEG video decoder (1) is provided with an index detection circuit (52) which supplies the G video decoder (12).
The gist of 2) is to control the timing of its own operation based on the signal indicating the delay time.
【0029】請求項9に記載の発明は、請求項6に記載
のMPEGオーディオ再生装置(1)と、記録媒体(2
1)から読み出されたMPEGビデオストリームをMP
EGビデオパートに準拠してデコードし、ビデオ信号を
生成するMPEGビデオデコーダ(12)と、音声判別
部(41)の処理結果と、オーディオストリームのビッ
トレートとに基づいて、話速変換処理手段(2,4)に
おける信号遅延時間を検出し、その検出された遅延時間
を示す信号をMPEGビデオデコーダ(12)へ供給す
る遅延時間検出回路(53)とを備え、MPEGビデオ
デコーダ(12)は、前記遅延時間を示す信号に基づい
て自己の動作のタイミングを制御することをその要旨と
する。According to a ninth aspect of the present invention, there is provided an MPEG audio reproducing apparatus (1) according to the sixth aspect and a recording medium (2).
MP the MPEG video stream read from 1)
Based on the processing result of the MPEG video decoder (12) that decodes in accordance with the EG video part and generates a video signal, the processing result of the audio discriminating unit (41), and the bit rate of the audio stream ( 2 and 4), a delay time detection circuit (53) for detecting a signal delay time and supplying a signal indicating the detected delay time to the MPEG video decoder (12), the MPEG video decoder (12) The gist of the invention is to control the timing of its own operation based on the signal indicating the delay time.
【0030】請求項10に記載の発明は、請求項6に記
載のMPEGオーディオ再生装置(1)と、記録媒体
(21)から読み出されたMPEGビデオストリームを
MPEGビデオパートに準拠してデコードし、ビデオ信
号を生成するMPEGビデオデコーダ(12)と、リン
グメモリ(32)の蓄積量に基づいて、話速変換処理済
みのオーディオ信号とビデオ信号との同期を得るための
制御信号を生成し、その制御信号をMPEGビデオデコ
ーダ(12)へ供給する制御回路(54)とを備え、M
PEGビデオデコーダ(12)は、前記制御信号に基づ
いて自己の動作のタイミングを制御することをその要旨
とする。The invention described in claim 10 is to decode the MPEG video stream read from the MPEG audio reproducing apparatus (1) according to claim 6 and the recording medium (21) according to the MPEG video part. , A control signal for generating synchronization between the audio signal and the video signal, which have been subjected to the speech speed conversion processing, based on the storage amount of the MPEG video decoder (12) for generating a video signal and the ring memory (32), A control circuit (54) for supplying the control signal to the MPEG video decoder (12),
The gist of the PEG video decoder (12) is to control the timing of its own operation based on the control signal.
【0031】請求項11に記載の発明は、請求項6に記
載のMPEGオーディオ再生装置(1)と、記録媒体
(21)から読み出されたMPEGビデオストリームを
MPEGビデオパートに準拠してデコードし、ビデオ信
号を生成するMPEGビデオデコーダ(12)と、音声
判別部(41)および時間軸圧縮伸長部(43)の処理
結果に基づいて、話速変換処理手段(2,4)における
信号遅延時間を検出し、その検出された遅延時間を示す
信号をMPEGビデオデコーダ(12)へ供給する遅延
時間検出回路(55)とを備え、MPEGビデオデコー
ダ(12)は、前記遅延時間を示す信号に基づいて自己
の動作のタイミングを制御することをその要旨とする。According to the invention described in claim 11, the MPEG audio reproducing apparatus (1) according to claim 6 and the MPEG video stream read from the recording medium (21) are decoded in accordance with the MPEG video part. , The signal delay time in the speech speed conversion processing means (2, 4) based on the processing results of the MPEG video decoder (12) for generating a video signal, the audio discrimination section (41) and the time axis compression / expansion section (43). And a delay time detection circuit (55) for supplying a signal indicating the detected delay time to the MPEG video decoder (12), the MPEG video decoder (12) based on the signal indicating the delay time. The point is to control the timing of one's own motion.
【0032】[0032]
(第1実施形態)以下、本発明を具体化した第1実施形
態を図面に従って説明する。(First Embodiment) A first embodiment of the present invention will be described below with reference to the drawings.
【0033】図1に、本実施形態のブロック回路図を示
す。本実施形態のMPEGオーディオ再生装置1は、再
生速度検出回路2、MPEGオーディオデコーダ3、話
速変換処理回路4、D/Aコンバータ5、オーディオア
ンプ6から構成されている。尚、各回路2〜6は1チッ
プのLSIに搭載することもできる。FIG. 1 shows a block circuit diagram of this embodiment. The MPEG audio reproducing apparatus 1 of this embodiment includes a reproducing speed detecting circuit 2, an MPEG audio decoder 3, a speech speed conversion processing circuit 4, a D / A converter 5 and an audio amplifier 6. The circuits 2 to 6 may be mounted on a 1-chip LSI.
【0034】また、本実施形態のMPEG再生装置23
は、MPEGオーディオ再生装置1に加え、オーディオ
ビデオパーサ(AVパーサ)11、MPEGビデオデコ
ーダ12を備えている。Further, the MPEG reproducing apparatus 23 of the present embodiment
In addition to the MPEG audio reproducing apparatus 1, the audio video parser (AV parser) 11 and the MPEG video decoder 12 are provided.
【0035】話速変換処理回路4は、例えば、DSP
(Digital Signal Processor)31、リングメモリ3
2、アップダウンカウンタ33、読み出しクロック生成
回路36を備えている。尚、話速変換処理回路4の動作
については、前記文献(日経エレクトロニクス 1994 年
11月21日号(No.622) P.93 〜98. )に詳述されている。The speech speed conversion processing circuit 4 is, for example, a DSP.
(Digital Signal Processor) 31, ring memory 3
2, an up / down counter 33, and a read clock generation circuit 36. The operation of the speech speed conversion processing circuit 4 is described in the above-mentioned document (Nikkei Electronics 1994.
November 21st issue (No.622) P.93-98.).
【0036】再生速度検出回路2は、ビデオCDやDV
Dなどの記録媒体21から読み出されたMPEGシステ
ムストリームのビットレートに対応したデコードクロッ
クを生成する。そのデコードクロックは各回路12,
3,4へ出力される。The reproduction speed detection circuit 2 is for a video CD or a DV.
A decode clock corresponding to the bit rate of the MPEG system stream read from the recording medium 21 such as D is generated. The decode clock is for each circuit 12,
Output to 3 and 4.
【0037】AVパーサ11は、デマルチプレクサ(D
MUX)13を備えており、記録媒体21から読み出さ
れたMPEGシステムストリームを入力する。DMUX
13は、システムストリームをMPEGビデオストリー
ムとMPEGオーディオストリームに分離する。ビデオ
ストリームはビデオデコーダ12へ出力され、オーディ
オストリームはオーディオデコーダ3へ出力される。The AV parser 11 is a demultiplexer (D
The MUX) 13 is provided, and the MPEG system stream read from the recording medium 21 is input. DMUX
Reference numeral 13 separates the system stream into an MPEG video stream and an MPEG audio stream. The video stream is output to the video decoder 12, and the audio stream is output to the audio decoder 3.
【0038】ビデオデコーダ12は、MPEGビデオパ
ートに準拠してビデオストリームをデコードし、ビデオ
出力(以下、ビデオ信号という)を生成する。そのビデ
オ信号はディスプレイ22へ出力され、ディスプレイ2
2で動画が再生される。The video decoder 12 decodes the video stream in accordance with the MPEG video part and produces a video output (hereinafter referred to as a video signal). The video signal is output to the display 22 and the display 2
The video is played back in 2.
【0039】オーディオデコーダ3は、MPEGオーデ
ィオパートに準拠してオーディオストリームをデコード
し、ディジタル信号のオーディオ出力(以下、オーディ
オ信号という)を生成する。そのオーディオ信号は話速
変換処理回路4へ出力される。話速変換処理回路4にお
いて信号処理されたオーディオ信号はD/Aコンバータ
5によってD/A変換された後、オーディオアンプ6で
増幅されてスピーカ23へ送られる。そして、スピーカ
23から音声が再生される。The audio decoder 3 decodes the audio stream in accordance with the MPEG audio part and generates an audio output of a digital signal (hereinafter referred to as an audio signal). The audio signal is output to the speech speed conversion processing circuit 4. The audio signal processed by the speech speed conversion processing circuit 4 is D / A converted by the D / A converter 5, amplified by the audio amplifier 6, and sent to the speaker 23. Then, the sound is reproduced from the speaker 23.
【0040】記録媒体21から読み出されたシステムス
トリームのビットレートは、読み出し速度に対応したも
のになる。また、各回路3,4,12の動作はデコード
クロックによって規定される。The bit rate of the system stream read from the recording medium 21 corresponds to the reading speed. The operation of each circuit 3, 4, 12 is specified by the decode clock.
【0041】従って、ビデオデコーダ12は、システム
ストリームのビットレートに対応したビデオ信号を生成
する。すなわち、システムストリームのビットレート
が、通常の再生時(標準再生時)よりも大きければディ
スプレイ22では動画が高速再生され、通常の再生時よ
りも小さければディスプレイ22では動画が低速再生さ
れる。Therefore, the video decoder 12 produces a video signal corresponding to the bit rate of the system stream. That is, if the bit rate of the system stream is higher than that during normal reproduction (during standard reproduction), the moving image is reproduced at high speed on the display 22, and if smaller than during normal reproduction, the moving image is reproduced at low speed on the display 22.
【0042】また、オーディオデコーダ3は、システム
ストリームのビットレートに対応したオーディオ信号を
生成する。すなわち、システムストリームのビットレー
トが、通常の再生時よりも大きければオーディオ信号の
ビットレートも大きくなり、通常の再生時より小さけれ
ばオーディオ信号のビットレートも小さくなる。The audio decoder 3 also produces an audio signal corresponding to the bit rate of the system stream. That is, if the bit rate of the system stream is higher than that during normal reproduction, the bit rate of the audio signal will be higher, and if it is lower than during normal reproduction, the bit rate of the audio signal will also be lower.
【0043】ところで、ビデオ信号とオーディオ信号と
は、通常の再生時において同期生成されるようになって
いる。DSP31は、フレームメモリ34および話速変
換部35から構成されている。フレームメモリ34は、
適宜なフレーム数分(例えば、2フレーム分)のオーデ
ィオ信号を記憶する。話速変換部35は、フレームメモ
リ34に記憶されたオーディオ信号に対してフレーム単
位で話速変換処理を行い、話速変換処理済みのオーディ
オ信号(以下、データという)を生成する。尚、1フレ
ームは、適宜な数(例えば、200個)のサンプリング
データから構成される。By the way, the video signal and the audio signal are synchronously generated during normal reproduction. The DSP 31 includes a frame memory 34 and a voice speed conversion unit 35. The frame memory 34 is
Audio signals for an appropriate number of frames (for example, two frames) are stored. The voice speed conversion unit 35 performs a voice speed conversion process on the audio signal stored in the frame memory 34 on a frame-by-frame basis, and generates a voice speed converted audio signal (hereinafter referred to as data). It should be noted that one frame is composed of an appropriate number (eg, 200) of sampling data.
【0044】フレームメモリ34の内部は、2つの領域
(以下、A領域、B領域と記載して区別する)に分けら
れている。オーディオデコーダ3から出力されたオーデ
ィオ信号がB領域に書き込まれるのと同時に、A領域に
蓄積されている1フレーム分のオーディオ信号が読み出
されて話速変換部35へ転送される。そして、B領域に
1フレーム分のオーディオ信号が蓄積されると、今度
は、B領域に蓄積された1フレーム分のオーディオ信号
が読み出されて話速変換部35へ転送され、それと同時
に、オーディオデコーダ3から出力されたオーディオ信
号がA領域に書き込まれる。The inside of the frame memory 34 is divided into two areas (hereinafter referred to as area A and area B for distinction). At the same time that the audio signal output from the audio decoder 3 is written in the B area, the audio signal for one frame accumulated in the A area is read and transferred to the speech speed conversion unit 35. Then, when one frame of audio signal is accumulated in the B area, this time, one frame of audio signal accumulated in the B area is read out and transferred to the speech speed conversion unit 35. At the same time, the audio signal is read. The audio signal output from the decoder 3 is written in the area A.
【0045】話速変換部35の生成したデータは、話速
変換部35が生成した書き込みクロックに従ってリング
メモリ32に書き込まれる。リングメモリ32は、例え
ば、FIFO(First-In-First-Out)構成のRAM(Ra
ndom Access Memory)から成る。The data generated by the voice speed converter 35 is written in the ring memory 32 in accordance with the write clock generated by the voice speed converter 35. The ring memory 32 is, for example, a RAM (Ra) having a FIFO (First-In-First-Out) configuration.
ndom Access Memory).
【0046】読み出しクロック生成回路36は、デコー
ドクロックに従って読み出しクロックを生成する。リン
グメモリ32に蓄積されたデータは、読み出しクロック
に従って読み出され、その読み出されたデータはD/A
コンバータ5へ出力される。D/Aコンバータ5は、読
み出しクロックをサンプリング周波数として用いる。The read clock generation circuit 36 generates a read clock according to the decode clock. The data stored in the ring memory 32 is read according to the read clock, and the read data is D / A.
It is output to the converter 5. The D / A converter 5 uses the read clock as the sampling frequency.
【0047】書き込みクロックはアップダウンカウンタ
33のアップカウント入力端子UPに入力され、読み出し
クロックはアップダウンカウンタ33のダウンカウント
入力端子DOWNに入力される。アップダウンカウンタ33
は、書き込みクロックの総数と読み出しクロックの総数
との差をカウントする。そのカウント値は、リングメモ
リ32の蓄積量に対応する。つまり、アップダウンカウ
ンタ33は、書き込みクロックと読み出しクロックとに
基づいて、リングメモリ32の蓄積量を検出する。その
リングメモリ32の蓄積量は話速変換部35へ出力され
る。The write clock is input to the up-count input terminal UP of the up-down counter 33, and the read clock is input to the down-count input terminal DOWN of the up-down counter 33. Up-down counter 33
Counts the difference between the total number of write clocks and the total number of read clocks. The count value corresponds to the amount stored in the ring memory 32. That is, the up / down counter 33 detects the storage amount of the ring memory 32 based on the write clock and the read clock. The accumulated amount of the ring memory 32 is output to the speech speed conversion unit 35.
【0048】図2に、話速変換部35に内部構成を示
す。話速変換部35は、音声判別部41、無音削除挿入
部42、時間軸圧縮伸長部43から構成されている。FIG. 2 shows the internal structure of the speech speed conversion unit 35. The speech speed conversion unit 35 includes a voice discrimination unit 41, a silence deletion insertion unit 42, and a time axis compression / decompression unit 43.
【0049】音声判別部41は、フレームメモリ34か
ら読み出されたオーディオ信号が、音声区間(音声が存
在している区間)か、または、無音区間(音声が存在し
ていない区間)かを判別する。尚、人間が発声する音声
以外の背景雑音は無音区間として取り扱う。The voice discriminating section 41 discriminates whether the audio signal read from the frame memory 34 is in a voice section (section in which voice exists) or in a silent section (section in which no voice exists). To do. The background noise other than the voice uttered by a human is treated as a silent section.
【0050】無音削除挿入部42は、音声判別部41の
判別した無音区間に対して、その無音区間の削除処理、
または、新たな無音区間の挿入処理を行う。時間軸圧縮
伸長部43は、音声判別部41の判別した音声区間に対
して、リングメモリ32の蓄積量に基づいて圧縮処理ま
たは伸長処理を行う。The silent deletion inserting section 42 deletes the silent section from the silent section discriminated by the voice discriminating section 41.
Alternatively, a process for inserting a new silent section is performed. The time axis compression / decompression unit 43 performs compression processing or decompression processing on the voice section discriminated by the voice discrimination unit 41 based on the accumulated amount in the ring memory 32.
【0051】また、各部42,43は、その処理内容に
対応した書き込みクロックを生成する。次に、高速再生
時における話速変換部35の動作について説明する。Further, the respective units 42 and 43 generate a write clock corresponding to the processing content. Next, the operation of the speech speed conversion unit 35 during high speed reproduction will be described.
【0052】オーディオデコーダ3から出力されるオー
ディオ信号のビットレートは、オーディオストリームの
それと同一になる。従って、高速再生時には、通常の再
生時に比べて、オーディオ信号のビットレートが大きく
なる。通常の再生時よりもビットレートの大きなオーデ
ィオ信号をそのままD/Aコンバータ5へ送った場合、
通常の再生時に比べて、スピーカ23から再生される音
声のピッチは上がり話速は速くなる。The bit rate of the audio signal output from the audio decoder 3 is the same as that of the audio stream. Therefore, the bit rate of the audio signal becomes higher during high-speed reproduction than during normal reproduction. When an audio signal having a bit rate larger than that during normal reproduction is sent as it is to the D / A converter 5,
The pitch of the sound reproduced from the speaker 23 is higher and the speech speed is higher than that during normal reproduction.
【0053】そこで、話速変換部35において、スピー
カ23から再生される音声のピッチを通常の再生時とほ
ぼ同一にし、且つ、スピーカ23から再生される話速を
通常の再生時に近づけるように話速変換処理を行う。Therefore, in the speech speed conversion unit 35, the pitch of the voice reproduced from the speaker 23 is made almost the same as that in the normal reproduction, and the speech speed reproduced from the speaker 23 is made to approach the normal reproduction. Perform speed conversion processing.
【0054】すなわち、無音削除挿入部42は、音声判
別部41の判別した無音区間の継続長を算出し、その継
続長が所定長以上の場合は無音区間を削除する。また、
時間軸圧縮伸長部43は、音声判別部41の判別した音
声区間に対して、例えば、自己相関法を用いてピッチ抽
出を行い、抽出したピッチ波形に対して圧縮処理を行
う。その結果、高速再生時において、オーディオ信号の
ビットレートが大きくなった場合に、スピーカ23から
再生される音声区間の時間長さは伸長される。That is, the silent deletion inserting section 42 calculates the duration of the silent section discriminated by the voice discriminating section 41, and deletes the silent section when the duration is equal to or longer than a predetermined length. Also,
The time axis compression / expansion unit 43 performs pitch extraction on the voice section discriminated by the voice discrimination unit 41, for example, using the autocorrelation method, and performs compression processing on the extracted pitch waveform. As a result, during high-speed reproduction, when the bit rate of the audio signal increases, the time length of the voice section reproduced from the speaker 23 is extended.
【0055】尚、時間軸圧縮伸長部43における圧縮処
理に際しては、無音区間の状態とリングメモリ32の蓄
積量とに応じて動的に圧縮率を変化させる。例えば、同
一のピッチ周期をもつ3周期波形を2周期波形に圧縮す
ることで、2/3倍の圧縮(圧縮率;2/3)を得る。
具体的には、3周期波形から、時間軸方向で前にある2
周期波形と、後ろにある2周期波形とをそれぞれ切り出
す。そして、前の2周期波形に単調減少する三角窓関数
を、後ろの2周期波形に単調増加する三角窓関数をそれ
ぞれ乗じる。この二つの波形を加算することで出力波形
を得る。In the compression processing in the time axis compression / expansion unit 43, the compression rate is dynamically changed according to the state of the silent section and the amount of storage in the ring memory 32. For example, by compressing a three-period waveform having the same pitch period into a two-period waveform, 2/3 times compression (compression rate: 2/3) is obtained.
Specifically, from the three-cycle waveform, the two preceding in the time axis direction
The periodic waveform and the two subsequent periodic waveforms are cut out. Then, the preceding two-period waveform is multiplied by the monotonically decreasing triangular window function, and the latter two-period waveform is multiplied by the monotonically increasing triangular window function, respectively. An output waveform is obtained by adding these two waveforms.
【0056】また、0.9倍の圧縮(圧縮率;0.9)
を得るには、例えば、10周期波形から9周期波形に圧
縮する。この場合は、先頭の3周期波形に対して同様の
処理を施す。つまり、入力の10周期波形のうち、先頭
の3周期波形を除いた7周期波形は処理に使わない。0.9 times compression (compression rate: 0.9)
To obtain, for example, a 10-cycle waveform is compressed into a 9-cycle waveform. In this case, the same processing is performed on the leading three-cycle waveform. That is, among the input 10-cycle waveforms, the 7-cycle waveforms except the leading 3-cycle waveforms are not used for processing.
【0057】このM周期波形からN周期波形に圧縮する
組み合わせを色々と用意しておくことで、多種類の圧縮
率を得る。ところで、無音区間が短い場合、圧縮率が低
い(圧縮の度合いが大きい)とリングメモリ32がオー
バーフローする恐れがある。これを防ぐためには、リン
グメモリ32の蓄積量に応じて、時間軸圧縮伸長部43
における圧縮率を動的に変化させればよい。また、背景
雑音が存在する場合、音声区間やピッチの抽出誤りが生
じる。これを防ぐためには、音声判別部41における音
声区間の検出レベルを雑音信号に応じて変化させればよ
い。By preparing various combinations for compressing the M-period waveform into the N-period waveform, various types of compression rates can be obtained. By the way, when the silent section is short, the ring memory 32 may overflow if the compression rate is low (the degree of compression is high). In order to prevent this, the time-base compression / decompression unit 43 depends on the storage amount of the ring memory 32.
It suffices to dynamically change the compression rate at. Also, when background noise is present, a voice segment or pitch extraction error occurs. In order to prevent this, the detection level of the voice section in the voice discriminating unit 41 may be changed according to the noise signal.
【0058】次に、低速再生時における話速変換部35
の動作について、図3および図4に従って説明する。図
3に、通常の再生時および0.5倍速再生時において再
生される音声の例を示す。Next, the speech speed conversion unit 35 at the time of low speed reproduction
The operation will be described with reference to FIGS. 3 and 4. FIG. 3 shows an example of audio reproduced during normal reproduction and 0.5 × speed reproduction.
【0059】低速再生時には、通常の再生時に比べて、
オーディオ信号のビットレートが小さくなる。そのた
め、方法1に示すように、通常の再生時よりもビットレ
ートの小さなオーディオ信号をそのままD/Aコンバー
タ5へ送った場合、通常の再生時に比べて、スピーカ2
3から再生される音声のピッチは変化しないものの、音
声が途切れ途切れになる。つまり、各音声区間(「あ」
「い」「う」「え」)の時間長さは通常の再生時のそれ
と変わらず、全く音の存在していない無音区間が各音声
区間の間に挿入されるため、音声が途切れ途切れにな
り、ユーザは聴感上違和感を覚える。Compared to normal reproduction, low-speed reproduction
The bit rate of the audio signal decreases. Therefore, as shown in the method 1, when an audio signal having a bit rate smaller than that in the normal reproduction is sent to the D / A converter 5 as it is, the speaker 2 is compared with that in the normal reproduction.
Although the pitch of the sound reproduced from No. 3 does not change, the sound is interrupted. In other words, each voice section ("A")
The time length of "i", "u", and "e") is the same as that during normal playback, and a silent section with no sound is inserted between each voice section, so the voice is interrupted. As a result, the user feels uncomfortable in hearing.
【0060】そこで、話速変換部35において、方法2
または方法3に示すように話速変換処理を行う。尚、M
PEGオーディオでは、低速再生時に音声のピッチが変
化しないため、高速再生時のように時間軸圧縮伸長部4
3においてピッチを変える処理を行う必要はない。Therefore, in the speech speed conversion unit 35, method 2 is used.
Alternatively, the speech speed conversion process is performed as shown in Method 3. Incidentally, M
With PEG audio, the pitch of the audio does not change during low-speed playback, so the time-axis compression / decompression unit 4 does not change as in high-speed playback.
It is not necessary to perform the process of changing the pitch in 3.
【0061】(方法2)方法2では、時間軸圧縮伸長部
43において各音声区間の長さを伸長させ、それと共
に、無音削除挿入部42において各無音区間の長さを短
くすることで、音声の途切れを目立たなくする。(Method 2) In method 2, the time-base compression / decompression unit 43 extends the length of each voice section, and at the same time, the silence deletion / insertion unit 42 shortens the length of each voice section. Make the breaks inconspicuous.
【0062】尚、時間軸圧縮伸長部43において音声区
間の長さを伸長させるには、音声判別部41の判別した
音声区間に対して、例えば、自己相関法を用いてピッチ
抽出を行い、抽出したピッチ波形に対して伸長処理を行
う。例えば、同一のピッチ周期をもつ2周期波形を3周
期波形に伸長することで、3/2倍の伸長(伸長率;3
/2)を得る。また、同一のピッチ周期をもつ3周期波
形を4周期波形に伸長することで、4/3倍の伸長(伸
長率;4/3)を得る。その結果、低速再生時におい
て、オーディオ信号のビットレートが小さくなった場合
に、スピーカ23から再生される音声区間の時間長さは
伸長される。In order to extend the length of the voice section in the time axis compression / expansion unit 43, pitch extraction is performed on the voice section discriminated by the voice discriminating unit 41 by using, for example, the autocorrelation method. The expansion process is performed on the pitch waveform. For example, by expanding a 2-cycle waveform having the same pitch cycle into a 3-cycle waveform, a 3 / 2-fold expansion (expansion rate: 3
/ 2) is obtained. Further, by expanding a 3-cycle waveform having the same pitch cycle into a 4-cycle waveform, a 4 / 3-fold expansion (expansion rate; 4/3) is obtained. As a result, the time length of the voice section reproduced from the speaker 23 is extended when the bit rate of the audio signal becomes low during low-speed reproduction.
【0063】このとき、音声区間を伸長し過ぎると、音
声区間が間延びして聞こえるため、音声の途切れは目立
たなくなるものの、やはり不自然になる。これを防止す
るには、通常の再生時における音声区間の長さL1に対
して、低速再生時における音声区間の長さL2を、例え
ば、以下の式に示すように設定する。At this time, if the voice section is excessively extended, the voice section is extended and heard, so that the interruption of the voice is not noticeable, but it is also unnatural. In order to prevent this, the length L2 of the voice section at the time of low-speed reproduction is set as shown in the following formula, for example, with respect to the length L1 of the voice section at the time of normal reproduction.
【0064】L2/L1≦1.4 尚、上記式は0.5倍速再生時だけでなく、あらゆる倍
率の低速再生時に適用できる。ここで、時間軸圧縮伸長
部43における音声区間の伸長率は一定値にしてもよ
く、以下のに示すように可変にしてもよい。L2 / L1.ltoreq.1.4 The above equation can be applied not only to the 0.5 × speed reproduction but also to the low speed reproduction of any magnification. Here, the expansion rate of the voice section in the time axis compression / expansion unit 43 may be a constant value or may be variable as shown below.
【0065】リングメモリ32の蓄積量に対応して音
声区間の伸長率を動的に変化させる。無音区間が短い場
合、音声区間の伸長率が大きい(伸長の度合いが大き
い)とリングメモリ32がオーバーフローする恐れがあ
る。これを防ぐためには、音声区間の伸長率を小さくす
ればよい。The expansion rate of the voice section is dynamically changed according to the storage amount of the ring memory 32. When the silent section is short, the ring memory 32 may overflow if the expansion rate of the speech section is large (the degree of expansion is large). In order to prevent this, the expansion rate of the voice section may be reduced.
【0066】音声のピッチ変化に対応して音声区間の
伸長率を動的に変化させる。つまり、図4に示すよう
に、音声のピッチ変化に対応して音声区間の伸長率を変
化させることで、話速を変化させる。この場合、音声の
聞き易さをさらに向上させることができる。尚、音声の
ピッチ変化に対応して音声区間の伸長率を変化させるこ
とで話速を変化させる技術は公知である(信学技報 SP9
2-56,HC92-33(1992-09),P.49〜56. 参照)。The expansion rate of the voice section is dynamically changed according to the change of the voice pitch. That is, as shown in FIG. 4, the speech rate is changed by changing the expansion rate of the voice section in response to the change in the pitch of the voice. In this case, it is possible to further improve the audibility of the voice. Note that a technique for changing the speech rate by changing the extension rate of the voice section in response to the change in the pitch of the voice is publicly known (Science Technical Report SP9
2-56, HC92-33 (1992-09), P.49-56.).
【0067】(方法3)方法3では、無音削除挿入部4
2において、各無音区間を削除して各音声区間をつなぎ
合わせた後で、音声区間に続いて新たに無音区間を挿入
することで、音声の途切れを目立たなくする。尚、挿入
する無音区間は、以下の〜のいずれであってもよ
い。(Method 3) In method 3, the silent deletion insertion unit 4
In 2, the silent sections are deleted and the speech sections are connected to each other, and then a new silent section is inserted after the speech section to make the interruption of the speech inconspicuous. The silent section to be inserted may be any of the following items.
【0068】全く音の存在しない無音区間。 視聴者が違和感を覚えないような白色雑音を含む無音
区間。尚、そのような白色雑音は、予め作成して別メモ
リ(図示略)に記憶しておく。A silent section in which no sound exists. A silent section that contains white noise so that the viewer does not feel uncomfortable. Note that such white noise is created in advance and stored in another memory (not shown).
【0069】音声判別部41において無音区間と判別
したオーディオ信号を別メモリ(図示略)に保持してお
き、それを無音区間として挿入する。 このように、本実施形態によれば、以下の作用および効
果を得ることができる。The audio signal discriminated as a silent section in the voice discriminating section 41 is held in another memory (not shown) and is inserted as a silent section. As described above, according to this embodiment, the following actions and effects can be obtained.
【0070】(1)話速変換処理回路4を設けること
で、高速再生時において、スピーカ23から再生される
音声のピッチを通常の再生時とほぼ同一にし、且つ、ス
ピーカ23から再生される話速を通常の再生時に近づけ
ることが可能になり、自然で聞き易い音声を再生するこ
とができる。(1) By providing the speech speed conversion processing circuit 4, during high speed reproduction, the pitch of the sound reproduced from the speaker 23 is made substantially the same as that during normal reproduction, and the sound reproduced from the speaker 23 is reproduced. The speed can be brought closer to the speed during normal reproduction, and natural and easy-to-listen sound can be reproduced.
【0071】ところで、m倍速再生時(m>1)には、
オーディオストリームおよびデコードクロックのビット
レートは通常の再生時のm倍になる。このとき、話速変
換部35から出力されるデータのビットレートを通常の
再生時とほぼ同一になるようにすれば、再生される音声
のピッチを通常の再生時とほぼ同一にすることができ
る。すなわち、話速変換部35においてビットレートを
m→1に変換すれば、再生される音声のピッチは通常の
再生時とほぼ同一になる。By the way, during m-times speed reproduction (m> 1),
The bit rates of the audio stream and the decode clock are m times those in normal reproduction. At this time, if the bit rate of the data output from the speech speed conversion unit 35 is set to be substantially the same as that in the normal reproduction, the pitch of the reproduced sound can be made substantially the same as that in the normal reproduction. . That is, if the bit rate is converted from m → 1 in the speech speed conversion unit 35, the pitch of the reproduced sound becomes almost the same as that in the normal reproduction.
【0072】(2)話速変換処理回路4を設けること
で、低速再生時において再生される音声の途切れを目立
たなくすることが可能になり、自然で聞き易い音声を再
生することができる。(2) By providing the speech speed conversion processing circuit 4, it is possible to make the interruption of the sound reproduced at the low speed reproduction inconspicuous, and to reproduce the natural and easily heard sound.
【0073】ところで、上記方法2と方法3とを、以下
の(1)(2)に示すように併用してもよい。 (1) MPEGオーディオ再生装置1のユーザが、方法2
と方法3とを任意に切り換え選択できるようにする。こ
のようにすれば、個々のユーザの聴覚特性に合わせるこ
とが可能になり、ユーザにとって聞き易い音声を再生す
ることができる。 (2) 低速再生の倍率に対応して方法2と方法3とが自動
的に切り換え選択されるようにする。例えば、1〜0.
5倍速再生時には方法3が選択され、0.5倍速以下の
再生時には方法2が選択されるようにする。このように
すれば、再生速度に応じて、自然な音声を再生すること
ができる。By the way, the method 2 and the method 3 may be used together as shown in the following (1) and (2). (1) The user of the MPEG audio playback device 1 uses the method 2
And method 3 can be arbitrarily switched and selected. By doing so, it is possible to match the hearing characteristics of each user, and it is possible to reproduce a voice that is easy for the user to hear. (2) Method 2 and method 3 are automatically switched and selected according to the low speed reproduction magnification. For example, 1 to 0.
Method 3 is selected at the time of 5 × speed reproduction, and method 2 is selected at the time of 0.5 × speed reproduction or less. In this way, natural sound can be reproduced according to the reproduction speed.
【0074】(3)各回路2〜6を1チップのLSIに
搭載した場合には、MPEGオーディオ再生装置1を小
型化することができる。 (第2実施形態)以下、本発明を具体化した第2実施形
態を図面に従って説明する。尚、本実施形態において、
第1実施形態と同じ構成部材については符号を等しくし
てその詳細な説明を省略する。(3) When the circuits 2 to 6 are mounted on a one-chip LSI, the MPEG audio reproducing apparatus 1 can be downsized. (Second Embodiment) Hereinafter, a second embodiment of the present invention will be described with reference to the drawings. In this embodiment,
The same components as those in the first embodiment have the same reference numerals, and a detailed description thereof will be omitted.
【0075】図5に、本実施形態の要部ブロック回路図
を示す。本実施形態において、第1実施形態と異なるの
は、インデックス付加回路51およびインデックス検出
回路52が設けられている点だけである。FIG. 5 shows a block circuit diagram of a main part of this embodiment. The present embodiment is different from the first embodiment only in that an index addition circuit 51 and an index detection circuit 52 are provided.
【0076】インデックス付加回路51は、フレームメ
モリ34の前段(すなわち、MPEGオーディオデコー
ダ3と話速変換処理回路4の間)に設けられている。イ
ンデックス付加回路51は、デコードクロックに従っ
て、オーディオデコーダ3の生成したオーディオ信号に
一定周期でインデックス信号を付加する。そのインデッ
クス信号が付加されたオーディオ信号は、フレームメモ
リ34へ出力される。The index adding circuit 51 is provided in the preceding stage of the frame memory 34 (that is, between the MPEG audio decoder 3 and the speech speed conversion processing circuit 4). The index adding circuit 51 adds an index signal to the audio signal generated by the audio decoder 3 at a constant cycle according to the decode clock. The audio signal added with the index signal is output to the frame memory 34.
【0077】インデックス検出回路52は、リングメモ
リ32から読み出されたデータに付加されているインデ
ックス信号を検出し、そのインデックス信号から得られ
る時刻情報と現在時刻とから、話速変換処理回路4が信
号処理に要する時間Δtを算出し、その時間Δtに関す
る検出信号をビデオデコーダ12へ供給する。ビデオデ
コーダ12は、その時間Δtに関する検出信号に従っ
て、自己の動作のタイミングを制御する。The index detection circuit 52 detects the index signal added to the data read from the ring memory 32, and the speech speed conversion processing circuit 4 detects the index signal from the time information and the current time obtained from the index signal. The time Δt required for signal processing is calculated, and a detection signal regarding the time Δt is supplied to the video decoder 12. The video decoder 12 controls the timing of its own operation according to the detection signal regarding the time Δt.
【0078】このように、本実施形態によれば、第1実
施形態の作用および効果に加えて、以下の作用および効
果を得ることができる。 (1)前記したように、ビデオデコーダ12の生成する
ビデオ信号と、オーディオデコーダ3の生成するオーデ
ィオ信号とは、通常の再生時において同期生成されるよ
うになっている。そのため、オーディオデコーダ3とD
/Aコンバータ5の間に話速変換処理回路4を設ける
と、話速変換処理回路4における信号処理に要する時間
分(すなわち、話速変換処理回路4における遅延時間
分)だけ、オーディオ信号が遅延することになる。As described above, according to this embodiment, the following operation and effect can be obtained in addition to the operation and effect of the first embodiment. (1) As described above, the video signal generated by the video decoder 12 and the audio signal generated by the audio decoder 3 are synchronously generated during normal reproduction. Therefore, the audio decoder 3 and D
If the speech speed conversion processing circuit 4 is provided between the A / A converter 5, the audio signal is delayed by the time required for signal processing in the speech speed conversion processing circuit 4 (that is, the delay time in the speech speed conversion processing circuit 4). Will be done.
【0079】そこで、インデックス付加回路51を用い
て、フレームメモリ34へ入力されるオーディオ信号に
予め一定周期でインデックス信号を付加する。インデッ
クス検出回路52は、リングメモリ32から読み出され
たデータに付加されているインデックス信号を検出し、
話速変換処理回路4が信号処理に要する時間Δtを算出
し、その時間Δtに関する検出信号をビデオデコーダ1
2へ供給する。ビデオデコーダ12は、その時間Δtに
関する検出信号に従って、自己の動作のタイミングを制
御する。また、インデックス検出回路52が次にインデ
ックス信号を検出したとき、ビデオデコーダ12は、そ
のときに算出された時間と前回算出された時間との差だ
け、自己の動作のタイミングを遅らせたり早めたりす
る。Therefore, the index adding circuit 51 is used to add an index signal to the audio signal input to the frame memory 34 in advance at a constant cycle. The index detection circuit 52 detects the index signal added to the data read from the ring memory 32,
The speech speed conversion processing circuit 4 calculates the time Δt required for the signal processing, and the detection signal relating to the time Δt is detected by the video decoder 1.
Supply to 2. The video decoder 12 controls the timing of its own operation according to the detection signal regarding the time Δt. When the index detection circuit 52 detects the next index signal, the video decoder 12 delays or advances the timing of its own operation by the difference between the time calculated at that time and the time calculated last time. .
【0080】その結果、話速変換処理回路4における遅
延時間に関係なく、リングメモリ32から読み出された
データ(すなわち、話速変換処理済みのオーディオ信
号)とビデオ信号との同期をとることができる。As a result, the data read from the ring memory 32 (that is, the audio signal subjected to the speech speed conversion processing) and the video signal can be synchronized regardless of the delay time in the speech speed conversion processing circuit 4. it can.
【0081】(2)上記(1)より、スピーカ23で再
生される音声と、ディスプレイ22で再生される動画と
の時間ずれを低減することが可能になり、リップシンク
のずれを人間の聴覚の許容範囲内にすることができる。(2) From the above (1), it becomes possible to reduce the time lag between the sound reproduced by the speaker 23 and the moving image reproduced by the display 22, and the deviation of the lip sync can be detected by the human auditory sense. It can be within the allowable range.
【0082】(3)オーディオ信号に付加されたインデ
ックス信号は、無音削除挿入部42によって削除される
ことがある。しかし、インデックス信号を付加する周期
を短くして、オーディオ信号に十分な数のインデックス
信号を付加しておけば、そのインデックス信号の内のい
くつかが無音削除挿入部42によって削除されたとして
も、リングメモリ32から読み出されたデータには一定
数以上のインデックス信号が残ることになる。その残っ
たインデックス信号により、上記(1)の作用および効
果を得ることができる。(3) The index signal added to the audio signal may be deleted by the silent deletion inserting section 42. However, if the period for adding the index signal is shortened and a sufficient number of index signals are added to the audio signal, even if some of the index signals are deleted by the silence deletion insertion unit 42, A certain number or more of index signals remain in the data read from the ring memory 32. With the remaining index signal, the action and effect of the above (1) can be obtained.
【0083】(第3実施形態)以下、本発明を具体化し
た第3実施形態を図面に従って説明する。尚、本実施形
態において、第2実施形態と同じ構成部材については符
号を等しくしてその詳細な説明を省略する。(Third Embodiment) A third embodiment of the present invention will be described below with reference to the drawings. In the present embodiment, the same components as those in the second embodiment are designated by the same reference numerals, and detailed description thereof will be omitted.
【0084】図6に、本実施形態の要部ブロック回路図
を示す。本実施形態において、第2実施形態と異なるの
は、インデックス付加回路51が、フレームメモリ34
と音声判別部41の間に設けられている点だけである。
インデックス付加回路51は、デコードクロックに従っ
て、フレームメモリ34から読み出されたオーディオ信
号に一定周期でインデックス信号を付加する。そのイン
デックス信号が付加されたオーディオ信号は、音声判別
部41へ出力される。FIG. 6 shows a block circuit diagram of a main part of this embodiment. The present embodiment is different from the second embodiment in that the index adding circuit 51 uses the frame memory 34.
It is only the point provided between the voice discrimination unit 41 and the voice discrimination unit 41.
The index adding circuit 51 adds an index signal to the audio signal read from the frame memory 34 at a constant cycle according to the decode clock. The audio signal to which the index signal is added is output to the voice discriminating unit 41.
【0085】前記したように、フレームメモリ34が2
フレーム分のオーディオ信号を蓄積する場合、フレーム
メモリ34の記憶容量は、例えば、0.8Kバイト程度
あれば十分である。このように、フレームメモリ34の
記憶容量が小さい場合には、話速変換処理回路4におけ
る遅延時間に比べて、フレームメモリ34における書き
込み動作および読み出し動作に要する時間(すなわち、
フレームメモリ34における遅延時間)は僅かであり、
無視しても差し支えない。As described above, the frame memory 34 has two
When storing audio signals for frames, it is sufficient that the storage capacity of the frame memory 34 is, for example, about 0.8 Kbytes. In this way, when the storage capacity of the frame memory 34 is small, the time required for the write operation and the read operation in the frame memory 34 (that is, the delay time in the speech speed conversion processing circuit 4) (that is,
The delay time in the frame memory 34) is small,
You can ignore it.
【0086】従って、本実施形態によれば、第2実施形
態と同様の作用および効果を得ることができる。 (第4実施形態)以下、本発明を具体化した第4実施形
態を図面に従って説明する。尚、本実施形態において、
第2実施形態と同じ構成部材については符号を等しくし
てその詳細な説明を省略する。Therefore, according to this embodiment, the same operation and effect as those of the second embodiment can be obtained. (Fourth Embodiment) A fourth embodiment of the present invention will be described below with reference to the drawings. In this embodiment,
The same components as those in the second embodiment are designated by the same reference numerals, and detailed description thereof will be omitted.
【0087】図7に、本実施形態の要部ブロック回路図
を示す。本実施形態において、第2実施形態と異なるの
は、インデックス付加回路51が、音声判別部41と無
音削除挿入部42および時間軸圧縮伸長部43との間に
それぞれ設けられている点だけである。インデックス付
加回路51は、デコードクロックに従って、音声判別部
41における信号処理が済んだオーディオ信号に一定周
期でインデックス信号を付加する。そのインデックス信
号が付加されたオーディオ信号は、無音削除挿入部42
および時間軸圧縮伸長部43へ出力される。FIG. 7 shows a block circuit diagram of a main part of this embodiment. The present embodiment differs from the second embodiment only in that the index adding circuit 51 is provided between the voice discrimination unit 41, the silence deletion insertion unit 42, and the time axis compression / decompression unit 43, respectively. . The index adding circuit 51 adds an index signal to the audio signal, which has been subjected to the signal processing in the audio discriminating unit 41, at a constant cycle according to the decode clock. The audio signal to which the index signal is added is the silence deletion insertion unit 42.
And output to the time axis compression / decompression unit 43.
【0088】前記したように、フレームメモリ34の記
憶容量が小さい場合には、話速変換処理回路4における
遅延時間に比べて、フレームメモリ34における遅延時
間は僅かであり、無視しても差し支えない。As described above, when the storage capacity of the frame memory 34 is small, the delay time in the frame memory 34 is small as compared with the delay time in the speech speed conversion processing circuit 4, and can be ignored. .
【0089】また、音声判別部41における信号処理に
要する時間(すなわち、音声判別部41における遅延時
間)は、話速変換処理回路4における遅延時間に比べて
僅かであり、無視しても差し支えない。The time required for the signal processing in the voice discriminating unit 41 (that is, the delay time in the voice discriminating unit 41) is shorter than the delay time in the voice speed conversion processing circuit 4 and can be ignored. .
【0090】従って、本実施形態によれば、第2実施形
態と同様の作用および効果を得ることができる。 (第5実施形態)以下、本発明を具体化した第5実施形
態を図面に従って説明する。尚、本実施形態において、
第2実施形態と同じ構成部材については符号を等しくし
てその詳細な説明を省略する。Therefore, according to this embodiment, the same operation and effect as those of the second embodiment can be obtained. (Fifth Embodiment) A fifth embodiment of the present invention will be described below with reference to the drawings. In this embodiment,
The same components as those in the second embodiment are designated by the same reference numerals, and detailed description thereof will be omitted.
【0091】図8に、本実施形態の要部ブロック回路図
を示す。本実施形態において、第2実施形態と異なるの
は、インデックス付加回路51が、無音削除挿入部42
および時間軸圧縮伸長部43とリングメモリ32との間
に設けられている点だけである。インデックス付加回路
51は、デコードクロックに従って、各部42,43に
おける信号処理が済んだオーディオ信号に一定周期でイ
ンデックス信号を付加する。そのインデックス信号が付
加されたオーディオ信号は、リングメモリ32へ出力さ
れる。FIG. 8 shows a block circuit diagram of a main part of this embodiment. The present embodiment differs from the second embodiment in that the index addition circuit 51 includes a silence deletion insertion unit 42.
And the point provided between the time axis compression / expansion unit 43 and the ring memory 32. The index adding circuit 51 adds an index signal to the audio signal, which has been subjected to the signal processing in the respective units 42 and 43, at a constant cycle according to the decode clock. The audio signal added with the index signal is output to the ring memory 32.
【0092】前記したように、フレームメモリ34の記
憶容量が小さい場合には、話速変換処理回路4における
遅延時間に比べて、フレームメモリ34における遅延時
間は僅かであり、無視しても差し支えない。As described above, when the storage capacity of the frame memory 34 is small, the delay time in the frame memory 34 is small as compared with the delay time in the speech speed conversion processing circuit 4, and can be ignored. .
【0093】また、各部41〜43における信号処理に
要する時間(すなわち、各部41〜43における遅延時
間)は、話速変換処理回路4における遅延時間に比べて
僅かであり、無視しても差し支えない。The time required for signal processing in each of the units 41 to 43 (that is, the delay time in each of the units 41 to 43) is shorter than the delay time in the speech speed conversion processing circuit 4 and can be ignored. .
【0094】つまり、話速変換処理回路4における遅延
時間は、主に、リングメモリ32における書き込み動作
および読み出し動作に要する時間(すなわち、リングメ
モリ32における遅延時間)によって決定される。That is, the delay time in the speech speed conversion processing circuit 4 is mainly determined by the time required for the write operation and the read operation in the ring memory 32 (that is, the delay time in the ring memory 32).
【0095】従って、本実施形態によれば、第2実施形
態と同様の作用および効果を得ることができる。また、
本実施形態によれば、第2実施形態のようにオーディオ
信号に付加されたインデックス信号が無音削除挿入部4
2によって削除されることがない。そのため、付加した
インデックス信号が全て活用され、インデックス信号の
数を減らすことが可能になることから、インデックス付
加回路51の回路規模を小さくすることができる。Therefore, according to this embodiment, the same operation and effect as those of the second embodiment can be obtained. Also,
According to the present embodiment, the index signal added to the audio signal as in the second embodiment is the silent deletion insertion unit 4.
Not deleted by 2. Therefore, all the added index signals are utilized and the number of index signals can be reduced, so that the circuit scale of the index adding circuit 51 can be reduced.
【0096】(第6実施形態)以下、本発明を具体化し
た第6実施形態を図面に従って説明する。尚、本実施形
態において、第1実施形態と同じ構成部材については符
号を等しくしてその詳細な説明を省略する。(Sixth Embodiment) A sixth embodiment of the present invention will be described below with reference to the drawings. In this embodiment, the same components as those in the first embodiment have the same reference numerals, and a detailed description thereof will be omitted.
【0097】図9に、本実施形態の要部ブロック回路図
を示す。本実施形態において、第1実施形態と異なるの
は、遅延時間検出回路53が設けられている点だけであ
る。前記したように、音声判別部41は、フレームメモ
リ34から読み出されたオーディオ信号が、音声区間か
又は無音区間かを判別する。つまり、音声判別部41の
処理結果には、オーディオ信号に音声が含まれているか
否かという情報が含まれている。FIG. 9 shows a block circuit diagram of a main part of this embodiment. The present embodiment differs from the first embodiment only in that a delay time detection circuit 53 is provided. As described above, the voice discriminating unit 41 discriminates whether the audio signal read from the frame memory 34 is a voice section or a silent section. That is, the processing result of the voice discriminating unit 41 includes information indicating whether or not the audio signal includes voice.
【0098】また、デコードクロックは、システムスト
リームのビットレートに対応している。つまり、デコー
ドクロックには、予めオーディオ信号の圧縮伸長率の情
報が含まれている。The decode clock corresponds to the bit rate of the system stream. That is, the decode clock includes information on the compression / decompression rate of the audio signal in advance.
【0099】そこで、遅延時間検出回路53は、オーデ
ィオ信号に音声が含まれているか否かという情報と圧縮
伸長率の情報とに基づいて、話速変換処理回路4におけ
る遅延時間を検出し、その検出信号をビデオデコーダ1
2へ供給する。ビデオデコーダ12は、遅延時間検出回
路53の検出信号に基づいて、自己の動作のタイミング
を制御する。その結果、話速変換処理回路4における遅
延時間に関係なく、リングメモリ32から読み出された
データ(すなわち、話速変換処理済みのオーディオ信
号)とビデオ信号との同期をとることができる。Therefore, the delay time detection circuit 53 detects the delay time in the speech speed conversion processing circuit 4 based on the information indicating whether or not the audio signal contains voice and the information on the compression / expansion rate, and Video decoder 1 for detection signal
Supply to 2. The video decoder 12 controls the timing of its own operation based on the detection signal of the delay time detection circuit 53. As a result, the data read from the ring memory 32 (that is, the audio signal that has been subjected to the voice speed conversion processing) and the video signal can be synchronized regardless of the delay time in the voice speed conversion processing circuit 4.
【0100】このように、本実施形態によれば、第2実
施形態と同様の効果を得ることができる。 (第7実施形態)以下、本発明を具体化した第7実施形
態を図面に従って説明する。尚、本実施形態において、
第1実施形態と同じ構成部材については符号を等しくし
てその詳細な説明を省略する。As described above, according to this embodiment, the same effect as that of the second embodiment can be obtained. (Seventh Embodiment) A seventh embodiment of the present invention will be described below with reference to the drawings. In this embodiment,
The same components as those in the first embodiment have the same reference numerals, and a detailed description thereof will be omitted.
【0101】図10に、本実施形態の要部ブロック回路
図を示す。本実施形態において、第1実施形態と異なる
のは、制御回路54が設けられている点だけである。制
御回路54は、アップダウンカウンタ33の検出したリ
ングメモリ32の蓄積量に基づいて、ビデオデコーダ1
2の動作速度を制御するための制御信号を生成し、その
制御信号をビデオデコーダ12へ供給する。ビデオデコ
ーダ12は、制御回路54の制御信号に基づいて、自己
の動作のタイミングを制御する。その結果、リングメモ
リ32から読み出されたデータと、ビデオデコーダ12
の生成するビデオ信号との同期をとることができる。FIG. 10 shows a block circuit diagram of a main part of this embodiment. The present embodiment differs from the first embodiment only in that a control circuit 54 is provided. The control circuit 54 uses the video decoder 1 based on the accumulated amount of the ring memory 32 detected by the up / down counter 33.
2 generates a control signal for controlling the operating speed of the control signal 2 and supplies the control signal to the video decoder 12. The video decoder 12 controls the timing of its own operation based on the control signal of the control circuit 54. As a result, the data read from the ring memory 32 and the video decoder 12
It is possible to synchronize with the video signal generated by.
【0102】前記したように、話速変換処理回路4にお
ける遅延時間は、主にリングメモリ32における遅延時
間によって決定される。リングメモリ32における遅延
時間は、その蓄積量と相関関係があり、蓄積量が大きく
なるほど遅延時間も大きくなる。従って、リングメモリ
32の蓄積量に基づいてビデオデコーダ12の動作速度
を制御すれば、リングメモリ32から読み出されたデー
タ(すなわち、話速変換処理済みのオーディオ信号)と
ビデオ信号との同期をとることができる。As described above, the delay time in the voice speed conversion processing circuit 4 is mainly determined by the delay time in the ring memory 32. The delay time in the ring memory 32 has a correlation with the accumulated amount, and the larger the accumulated amount, the longer the delay time. Therefore, if the operation speed of the video decoder 12 is controlled based on the storage amount of the ring memory 32, the data read from the ring memory 32 (that is, the audio signal that has undergone the speech speed conversion processing) and the video signal are synchronized. Can be taken.
【0103】このように、本実施形態によれば、第2実
施形態と同様の効果を得ることができる。 (第8実施形態)以下、本発明を具体化した第8実施形
態を図面に従って説明する。尚、本実施形態において、
第1実施形態と同じ構成部材については符号を等しくし
てその詳細な説明を省略する。As described above, according to this embodiment, the same effect as that of the second embodiment can be obtained. (Eighth Embodiment) An eighth embodiment of the present invention will be described below with reference to the drawings. In this embodiment,
The same components as those in the first embodiment have the same reference numerals, and a detailed description thereof will be omitted.
【0104】図11に、本実施形態の要部ブロック回路
図を示す。本実施形態において、第1実施形態と異なる
のは、遅延時間検出回路55が設けられている点だけで
ある。FIG. 11 shows a block circuit diagram of a main part of this embodiment. The present embodiment differs from the first embodiment only in that a delay time detection circuit 55 is provided.
【0105】前記したように、音声判別部41の処理結
果には、オーディオ信号に音声が含まれているか否かと
いう情報が含まれている。また、時間軸圧縮伸長部43
の処理結果には、オーディオ信号の圧縮伸長率の情報が
含まれている。As described above, the processing result of the voice discriminating section 41 includes information as to whether or not the audio signal contains voice. Also, the time axis compression / decompression unit 43
The processing result of (1) includes information on the compression / decompression rate of the audio signal.
【0106】そこで、遅延時間検出回路55は、オーデ
ィオ信号に音声が含まれているか否かという情報と圧縮
伸長率の情報とに基づいて、話速変換処理回路4におけ
る遅延時間を検出し、その検出信号をビデオデコーダ1
2へ供給する。ビデオデコーダ12は、遅延時間検出回
路55の検出信号に基づいて、自己の動作のタイミング
を制御する。その結果、話速変換処理回路4における遅
延時間に関係なく、リングメモリ32から読み出された
データ(すなわち、話速変換処理済みのオーディオ信
号)とビデオ信号との同期をとることができる。Therefore, the delay time detection circuit 55 detects the delay time in the speech speed conversion processing circuit 4 based on the information indicating whether the audio signal contains voice and the information about the compression / expansion rate, and Video decoder 1 for detection signal
Supply to 2. The video decoder 12 controls the timing of its own operation based on the detection signal of the delay time detection circuit 55. As a result, the data read from the ring memory 32 (that is, the audio signal that has been subjected to the voice speed conversion processing) and the video signal can be synchronized regardless of the delay time in the voice speed conversion processing circuit 4.
【0107】このように、本実施形態によれば、第2実
施形態と同様の効果を得ることができる。図12に、可
変速再生機能を備えたMPEGビデオデコーダ12の要
部ブロック回路を示す。As described above, according to this embodiment, the same effect as that of the second embodiment can be obtained. FIG. 12 shows a block circuit of a main part of the MPEG video decoder 12 having a variable speed reproduction function.
【0108】MPEGビデオデコーダ12は、ビットバ
ッファ202、ピクチャヘッダ検出回路203、MPE
Gビデオデコードコア回路(以下、デコードコア回路と
略す)204、可変閾値オーバーフロー判定回路(以
下、判定回路と略す)205、ピクチャスキップ回路2
06、制御コア回路207から構成されている。尚、各
回路203〜207は1チップのLSIに搭載すること
もできる。The MPEG video decoder 12 includes a bit buffer 202, a picture header detection circuit 203 and an MPE.
G video decode core circuit (hereinafter, abbreviated as decode core circuit) 204, variable threshold overflow determination circuit (hereinafter, abbreviated as determination circuit) 205, picture skip circuit 2
06, and a control core circuit 207. The circuits 203 to 207 can also be mounted on a one-chip LSI.
【0109】制御コア回路207は各回路2〜6を制御
する。AVパーサ11から転送されてきたMPEGビデ
オストリームはビットバッファ202へ入力される。The control core circuit 207 controls the circuits 2 to 6. The MPEG video stream transferred from the AV parser 11 is input to the bit buffer 202.
【0110】ビットバッファ202はFIFO構成のR
AMから成るリングメモリによって構成され、転送され
てくるビデオストリームをそのまま順次蓄積する。ピク
チャヘッダ検出回路203は、ビットバッファ202に
蓄積されたビデオストリームの各ピクチャの先頭に付く
ピクチャヘッダを検出し、その各ピクチャヘッダに規定
されているピクチャのタイプ(I,P,B)を検出す
る。The bit buffer 202 is an R of FIFO structure.
It is composed of a ring memory composed of AM and sequentially stores the transferred video stream as it is. The picture header detection circuit 203 detects the picture header at the beginning of each picture of the video stream stored in the bit buffer 202, and detects the picture type (I, P, B) specified in each picture header. To do.
【0111】制御コア回路207は、ピクチャヘッダ検
出回路203の検出結果と後記する判定回路205の判
定結果とに基づいて、ビットバッファ202から1フレ
ーム期間毎に適宜なピクチャ分のビデオストリームを読
み出す。尚、ビットバッファ202から読み出されたビ
デオストリームは、読み出された後もビットバッファ2
02にそのまま残される。The control core circuit 207 reads a video stream of an appropriate picture for each frame period from the bit buffer 202 based on the detection result of the picture header detection circuit 203 and the determination result of the determination circuit 205 described later. The video stream read from the bit buffer 202 is stored in the bit buffer 2 even after the video stream is read.
02 as it is.
【0112】ビットバッファ202から読み出された各
ピクチャは、ピクチャスキップ回路206を介してデコ
ードコア回路204へ転送される。デコードコア回路2
04は、各ピクチャをMPEGビデオパートに準拠して
デコードし、各ピクチャ毎のビデオ信号を生成する。Each picture read from the bit buffer 202 is transferred to the decode core circuit 204 via the picture skip circuit 206. Decode core circuit 2
The decoder 04 decodes each picture in accordance with the MPEG video part and generates a video signal for each picture.
【0113】ピクチャスキップ回路206は、制御コア
回路207の制御に従って各ノード206a,206b
側への接続が切り換えられる。そして、ピクチャスキッ
プ回路206がノード206a側に接続されると、ビッ
トバッファ202から読み出されたピクチャはそのまま
デコードコア回路204へ転送される。また、ノード2
06b側に接続されると、ビットバッファ202から読
み出されたピクチャはビットバッファ202へ転送され
ずにスキップされる。その結果、デコードコア回路20
4へ転送されるピクチャは、ピクチャスキップ回路20
6によってスキップされた分だけピクチャ単位で間引か
れる。The picture skip circuit 206 controls the nodes 206a and 206b under the control of the control core circuit 207.
The connection to the side is switched. When the picture skip circuit 206 is connected to the node 206a, the picture read from the bit buffer 202 is transferred to the decode core circuit 204 as it is. Node 2
When connected to the 06b side, the picture read from the bit buffer 202 is skipped without being transferred to the bit buffer 202. As a result, the decode core circuit 20
4 are transferred to the picture skip circuit 20.
6 is skipped in picture units by the amount skipped.
【0114】判定回路205は、再生速度検出回路2の
生成したデコードクロックに基づいてビットバッファ2
02の占有量Bm の閾値Bthn を設定し、ビットバッフ
ァ202の占有量Bm と閾値Bthn とを比較する。尚、
判定回路205では、再生速度検出回路2の生成した実
際のデコードクロックの周波数と、通常の再生時のデコ
ードクロックの周波数との比を求め、その比を再生速度
の倍率nとする。従って、2倍速再生時には倍率n=2
となり、閾値Bthn =Bth2 となる。また、通常の再生
時には倍率n=1となり、閾値Bthn =Bth1 となる。The decision circuit 205 determines the bit buffer 2 based on the decode clock generated by the reproduction speed detection circuit 2.
The threshold Bthn of the occupancy Bm of 02 is set, and the occupancy Bm of the bit buffer 202 is compared with the threshold Bthn. still,
The determination circuit 205 obtains a ratio between the frequency of the actual decode clock generated by the reproduction speed detection circuit 2 and the frequency of the decode clock at the time of normal reproduction, and sets the ratio as the reproduction speed multiplying factor n. Therefore, the magnification n = 2 during 2 × speed reproduction.
And the threshold Bthn = Bth2. During normal reproduction, the magnification n = 1, and the threshold value Bthn = Bth1.
【0115】そして、判定回路205は、ビットバッフ
ァ202の占有量Bm が閾値Bthnを越えない場合に
は、ビットバッファ202がオーバーフローする恐れが
なく正常であると判定する。この場合、制御コア回路2
07は、ビットバッファ202から1ピクチャ分のビデ
オストリームを読み出す。そして、制御コア回路207
は、ピクチャスキップ回路206をノード206a側に
接続し、そのビットバッファ202から読み出されたピ
クチャをデコードコア回路204へ転送させる。Then, when the occupied amount Bm of the bit buffer 202 does not exceed the threshold value Bthn, the decision circuit 205 decides that the bit buffer 202 is normal without fear of overflow. In this case, the control core circuit 2
07 reads a video stream for one picture from the bit buffer 202. Then, the control core circuit 207
Connects the picture skip circuit 206 to the node 206a, and causes the picture read from the bit buffer 202 to be transferred to the decode core circuit 204.
【0116】また、判定回路205は、ビットバッファ
202の占有量Bm が閾値Bthn を越えた場合には、ビ
ットバッファ202がオーバーフローする恐れがあると
判定する。この場合、制御コア回路207は、ビットバ
ッファ202の占有量Bm が閾値Bthn を下回るまで、
ビットバッファ202から適宜なピクチャ分のビデオス
トリームを読み出す。そして、制御コア回路207は、
ピクチャスキップ回路206をノード206b側に接続
し、そのビットバッファ202から読み出された適宜な
ピクチャ分のビデオストリームを全てスキップさせる。Further, the judging circuit 205 judges that the bit buffer 202 may overflow when the occupied amount Bm of the bit buffer 202 exceeds the threshold value Bthn. In this case, the control core circuit 207 operates until the occupation amount Bm of the bit buffer 202 falls below the threshold value Bthn.
A video stream for an appropriate picture is read from the bit buffer 202. Then, the control core circuit 207
The picture skip circuit 206 is connected to the node 206b, and skips all video streams for appropriate pictures read from the bit buffer 202.
【0117】図13に、ビットバッファ202の占有量
Bm の変化を示す。ビットバッファ202の占有量Bm
はビットレートRB をグラフの傾きとして上昇する。ビ
ットレートRB は、シーケンスの先頭に付くシーケンス
ヘッダのBR(Bit Rate)に従って式(1)に示すよう
に規定される。また、AVパーサ11から転送されてく
るビデオストリームのピクチャレートRP はシーケンス
ヘッダのPR(Picture Rate)によって規定される。そ
して、ビットバッファ202の容量Bは、シーケンスヘ
ッダのVBV(Vbv[Video Bufferring Verifier] Buffe
r Size)に従って式(2)に示すように規定される。そ
して、1フレーム期間毎に、デコードコア回路204が
そのときデコードしようとする1ピクチャ分のビデオス
トリームが、ビットバッファ202から一気に読み出さ
れる。ここで、1フレーム期間にビットバッファ202
に入力されるビデオストリームのデータ量Xは、ビット
レートRB およびピクチャレートRP に従って式(3)
に示すように規定される。従って、ビットバッファ20
2から1ピクチャ分のビデオストリームが一気に読み出
された直後のビットバッファ202の占有量Bm (=B
0〜B6 )は、データ量Xとビットバッファ202の容
量Bとに基づいて、式(4)に示す条件を満たすように
規定される。FIG. 13 shows changes in the occupied amount Bm of the bit buffer 202. Occupancy Bm of bit buffer 202
Increases with the bit rate RB as the slope of the graph. The bit rate RB is defined as shown in equation (1) according to the BR (Bit Rate) of the sequence header at the beginning of the sequence. Also, the picture rate RP of the video stream transferred from the AV parser 11 is defined by the PR (Picture Rate) of the sequence header. The capacity B of the bit buffer 202 is the VBV (Vbv [Video Buffering Verifier] Buffe) of the sequence header.
r Size), and is defined as shown in Expression (2). Then, for each frame period, a video stream for one picture which the decode core circuit 204 is to decode at that time is read from the bit buffer 202 at a stretch. Here, the bit buffer 202 in one frame period
The data amount X of the video stream input to is calculated according to equation (3) according to the bit rate RB and the picture rate RP.
It is specified as shown in. Therefore, the bit buffer 20
Occupancy Bm (= B) of the bit buffer 202 immediately after the video stream for 2 to 1 pictures is read at once
0 to B6) is defined so as to satisfy the condition shown in Expression (4) based on the data amount X and the capacity B of the bit buffer 202.
【0118】 RB =400×BR ………(1) B=16×1024×VBV ………(2) X=RB /RP ………(3) 0<Bm <B−X=B−(RB /RP ) ………(4) 式(4)に示す条件を満たすようにビットバッファ20
2の占有量Bm が規定されていれば、ビットバッファ2
02がオーバーフローしたりアンダーフローしたりする
ことはない。逆に言えば、ビットバッファ202の占有
量Bm が閾値(B−X)を越えると、次の1フレーム期
間にビットバッファ202に入力されるビデオストリー
ムによってビットバッファ202がオーバーフローする
可能性が極めて高くなる。RB = 400 × BR (1) B = 16 × 1024 × VBV (2) X = RB / RP (3) 0 <Bm <BX−B− (RB / RP) ... (4) The bit buffer 20 is set so as to satisfy the condition shown in Expression (4).
If the occupation amount Bm of the bit buffer 2 is specified, the bit buffer 2
02 does not overflow or underflow. Conversely, if the occupation amount Bm of the bit buffer 202 exceeds the threshold value (BX), there is a very high possibility that the bit buffer 202 will overflow due to the video stream input to the bit buffer 202 in the next one frame period. Become.
【0119】ビデオデコーダ12では、通常の再生時に
おいて、式(4)が満たされるように、ビットレートR
B 、ピクチャレートRP 、容量Bの各値が規定されてい
る。つまり、式(2)に示すようにビットバッファ20
2の容量Bを設定しておけば、ピクチャスキップ回路2
06の接続をノード206a側に固定しておいたとして
も、理想的な状態ではビットバッファ202がオーバー
フローしたりアンダーフローしたりすることはない。In the video decoder 12, the bit rate R is set so that the expression (4) is satisfied during normal reproduction.
The values of B, picture rate RP, and capacity B are specified. That is, as shown in equation (2), the bit buffer 20
If the capacity B of 2 is set, the picture skip circuit 2
Even if the connection of 06 is fixed to the node 206a side, the bit buffer 202 does not overflow or underflow in an ideal state.
【0120】従って、通常の再生時において、ビットバ
ッファ202から1ピクチャ分のデータが一気に読み出
された直後の占有量Bm (=B0 〜B4 )は、閾値Bth
1 に基づいて、式(5)に示す条件を満たすように規定
される。尚、閾値Bth1 は、式(4)に基づいて、式
(6)に示すように設定される。Therefore, during normal reproduction, the occupied amount Bm (= B0 to B4) immediately after the data for one picture is read out from the bit buffer 202 at once is determined by the threshold value Bth.
Based on 1, it is defined to satisfy the condition shown in Expression (5). The threshold value Bth1 is set based on the equation (4) as shown in the equation (6).
【0121】 0<Bm <Bth1 <B ………(5) Bth1 =B−X=B−(RB /RP ) ………(6) ところで、実際の状態では、式(2)に示すようにビッ
トバッファ202の容量Bを設定しておいても、ピクチ
ャスキップ回路206の接続をノード206a側に固定
しておくと、ビットバッファ202がオーバーフローす
る恐れがある。0 <Bm <Bth1 <B (5) Bth1 = B−X = B− (RB / RP) (6) By the way, in an actual state, as shown in the formula (2), Even if the capacity B of the bit buffer 202 is set, if the connection of the picture skip circuit 206 is fixed to the node 206a side, the bit buffer 202 may overflow.
【0122】しかし、ビデオデコーダ12では、通常の
再生時において、ビットバッファ202の占有量Bm が
閾値Bth1 を越えた場合、ビットバッファ202がオー
バーフローする恐れがあると判定される。すると、ビッ
トバッファ202の占有量Bm が閾値Bth1 を下回るま
で、ビットバッファ202から適宜なピクチャ分のビデ
オストリームが読み出される。そして、ピクチャスキッ
プ回路206はノード206b側に接続され、そのビッ
トバッファ202から読み出された適宜なピクチャ分の
ビデオストリームは全てスキップされる。従って、ビデ
オデコーダ12によれば、通常の再生時において、ビッ
トバッファ202がオーバーフローすることはない。However, the video decoder 12 determines that the bit buffer 202 may overflow if the occupied amount Bm of the bit buffer 202 exceeds the threshold value Bth1 during normal reproduction. Then, a video stream for an appropriate picture is read from the bit buffer 202 until the occupation amount Bm of the bit buffer 202 falls below the threshold value Bth1. Then, the picture skip circuit 206 is connected to the node 206b side, and all video streams for appropriate pictures read from the bit buffer 202 are skipped. Therefore, according to the video decoder 12, the bit buffer 202 does not overflow during normal reproduction.
【0123】高速再生時におけるビットバッファ202
の占有量Bm はビットレートn×RB をグラフの傾きと
して上昇する。例えば、2倍速再生時におけるビットバ
ッファ202の占有量Bm はビットレート2×RB をグ
ラフの傾きとして上昇する。Bit buffer 202 during high speed reproduction
Occupancy Bm of the graph rises with the bit rate n × RB as the slope of the graph. For example, the occupation amount Bm of the bit buffer 202 at the time of double speed reproduction increases with the bit rate 2 × RB as the slope of the graph.
【0124】従って、高速再生時において、ビットバッ
ファ202から1ピクチャ分のデータが一気に読み出さ
れた直後の占有量Bm (=B0 〜B4 )は、閾値Bthn
に基づいて、式(7)に示す条件を満たすように規定さ
れる。尚、閾値Bthn は式(8)に示すように設定され
る。Therefore, at the time of high speed reproduction, the occupied amount Bm (= B0 to B4) immediately after the data of one picture is read from the bit buffer 202 at once is the threshold value Bthn.
Is defined to satisfy the condition shown in Expression (7). Note that the threshold value Bthn is set as shown in Expression (8).
【0125】 0<Bm <Bthn ………(7) Bthn =B−n×X=B−(n×RB /RP ) ………(8) 高速再生時においては、ビットバッファ202の占有量
Bm が閾値Bthn を越えた場合、ビットバッファ202
がオーバーフローする恐れがあると判定される。例え
ば、2倍速再生時には占有量Bm が閾値Bth2 (=B−
(2×RB /RP))を越えた場合、3倍速再生時には
占有量Bm が閾値Bth3 (=B−(3×RB /RP ))
を越えた場合に、ビットバッファ202がオーバーフロ
ーする恐れがあると判定される。すると、ビットバッフ
ァ202の占有量Bm が閾値Bthnを下回るまでビット
バッファ202から適宜なピクチャ分のビデオストリー
ムが読み出され、そのビデオストリームは全てスキップ
される。従って、ビデオデコーダ12によれば、高速再
生時において、ビットバッファ202がオーバーフロー
することはない。0 <Bm <Bthn (7) Bthn = B−n × X = B− (n × RB / RP) (8) The occupied amount Bm of the bit buffer 202 during high speed reproduction Exceeds the threshold value Bthn, the bit buffer 202
Is determined to be likely to overflow. For example, at the time of 2 × speed reproduction, the occupation amount Bm is equal to the threshold Bth2 (= B−2).
(2 × RB / RP)), the occupation amount Bm becomes the threshold value Bth3 (= B− (3 × RB / RP)) at 3 × speed reproduction.
Is exceeded, it is determined that the bit buffer 202 may overflow. Then, a video stream of an appropriate picture is read from the bit buffer 202 until the occupation amount Bm of the bit buffer 202 falls below the threshold value Bthn, and all the video streams are skipped. Therefore, according to the video decoder 12, the bit buffer 202 does not overflow during high speed reproduction.
【0126】デコードコア回路204において任意のピ
クチャをデコードしている途中でビットバッファ202
がオーバーフローすると、デコード処理中のピクチャの
ビットバッファ202に残っている部分に対して、新た
に入力されたビデオストリームが上書きされる。その結
果、デコード処理中のピクチャのビットバッファ202
に残っている部分が破壊されて失われる。すると、デコ
ードコア回路204では、そのピクチャのデコードを完
了することが不可能になり、そのピクチャのビデオ信号
を生成することができなくなる。従って、デコードコア
回路204において任意のピクチャをデコードしている
途中でビットバッファ202がオーバーフローすること
は絶対に避けなければならない。During decoding of an arbitrary picture in the decoding core circuit 204, the bit buffer 202
Overflows, the newly input video stream is overwritten on the remaining portion of the bit buffer 202 of the picture being decoded. As a result, the bit buffer 202 of the picture being decoded is
The remaining parts are destroyed and lost. Then, the decoding core circuit 204 cannot complete the decoding of the picture, and cannot generate a video signal of the picture. Therefore, it is absolutely necessary to prevent the bit buffer 202 from overflowing while the decoding core circuit 204 is decoding an arbitrary picture.
【0127】そのため、ビットバッファ202がオーバ
ーフローする恐れがあるかどうかの判定は、デコードコ
ア回路204において任意のピクチャのデコードを開始
する前に行う必要がある。より正確には、ピクチャヘッ
ダ検出回路203がピクチャヘッダを検出した時点で、
ビットバッファ202がオーバーフローする恐れがある
かどうかを判定し、そのピクチャをピクチャスキップ回
路206を介してスキップするかどうかを決定する必要
がある。Therefore, it is necessary to determine whether or not the bit buffer 202 may overflow before the decoding core circuit 204 starts decoding any picture. More precisely, when the picture header detection circuit 203 detects the picture header,
It is necessary to determine whether the bit buffer 202 may overflow and determine whether to skip the picture via the picture skip circuit 206.
【0128】ところで、1つのピクチャのデータ量は0
〜40バイトであるが、そのデータ量はデコードコア回
路204においてデコードが終了した時点でないとわか
らない。また、1つのピクチャのデコード処理時間は、
そのピクチャのデータ量やデコードコア回路204の動
作速度によって異なるが、通常、1フレーム期間の1/
3〜3/4程度である。The data amount of one picture is 0.
Although the data amount is 4040 bytes, the data amount cannot be known until the decoding at the decoding core circuit 204 is completed. The decoding processing time for one picture is
Although it depends on the data amount of the picture and the operation speed of the decode core circuit 204, it is usually 1/1 of one frame period.
It is about 3 to 3/4.
【0129】ビットバッファ202から読み出されたピ
クチャのデータ量が0バイトの場合、そのピクチャの読
み出し前後でビットバッファ202の占有量Bm は変化
しないため、そのピクチャをスキップしたとしてもオー
バーフローを回避することはできない。逆に言えば、ビ
ットバッファ202から読み出されたピクチャのデータ
量が0バイトの場合でも、ビットバッファ202に十分
な空き容量があればオーバーフローすることはない。When the data amount of the picture read from the bit buffer 202 is 0 byte, the occupied amount Bm of the bit buffer 202 does not change before and after the reading of the picture, and therefore overflow is avoided even if the picture is skipped. It is not possible. Conversely, even when the data amount of the picture read from the bit buffer 202 is 0 bytes, there is no overflow if the bit buffer 202 has a sufficient free space.
【0130】そこで、1フレーム期間にビットバッファ
202に入力されるビデオストリームのデータ量分の空
き容量を、ビットバッファ202に確保しておく。そう
すれば、ビットバッファ202から読み出されたピクチ
ャのデータ量が0バイトの場合でもオーバーフローする
ことはない。Therefore, a free space corresponding to the data amount of the video stream input to the bit buffer 202 in one frame period is secured in the bit buffer 202. Then, even if the data amount of the picture read from the bit buffer 202 is 0 bytes, no overflow occurs.
【0131】1フレーム期間にビットバッファ202に
入力されるビデオストリームのデータ量は、(n×X=
n×RB /RP )になる。ビットバッファ202の空き
容量がこのデータ量以上であればオーバーフローするこ
とはない。従って、式(8)に示すように閾値Bthn を
設定しておけば、ビットバッファ202のオーバーフロ
ーを確実に回避することができる。The data amount of the video stream input to the bit buffer 202 in one frame period is (n × X =
nxRB / RP). If the free space of the bit buffer 202 is equal to or more than this data amount, no overflow occurs. Therefore, if the threshold value Bthn is set as shown in Expression (8), the overflow of the bit buffer 202 can be reliably avoided.
【0132】すなわち、判定回路205は、ピクチャヘ
ッダ検出回路203がピクチャヘッダを検出した時点で
ビットバッファ202の空き容量をチェックし、十分な
空き容量(n×X=n×RB /RP )が確保されている
かどうかを判定する。十分な空き容量が確保されていな
ければ、そのピクチャヘッダに基づいて制御コア回路2
07がビットバッファ202から読み出したピクチャ
を、ピクチャスキップ回路206を介してスキップす
る。続いて、判定回路205は、ピクチャヘッダ検出回
路203が次のピクチャヘッダを検出した時点で、再び
ビットバッファ202の空き容量をチェックする。これ
らの処理に要する時間は、デコードコア回路204のデ
コード処理時間に比べてはるかに短いため、ビットバッ
ファ202に十分な空き容量が確保できてからデコード
コア回路204のデコード処理を開始しても十分に間に
合う。That is, the determination circuit 205 checks the free space of the bit buffer 202 at the time when the picture header detection circuit 203 detects the picture header, and secures a sufficient free space (n × X = n × RB / RP). It is determined whether it has been done. If sufficient free space is not secured, the control core circuit 2
07 skips the picture read from the bit buffer 202 via the picture skip circuit 206. Subsequently, when the picture header detection circuit 203 detects the next picture header, the determination circuit 205 checks the free space of the bit buffer 202 again. Since the time required for these processes is much shorter than the decoding process time of the decode core circuit 204, it is sufficient to start the decoding process of the decode core circuit 204 after securing sufficient free space in the bit buffer 202. In time.
【0133】ところで、ピクチャヘッダ検出回路203
がピクチャヘッダを検出した時点や、デコードコア回路
204がデコードを開始した後に、ビットバッファ20
2がアンダーフローすることがある。この場合は、ビデ
オストリームがビットバッファ202に入力され次第、
ビットバッファ202から1ピクチャ分のビデオストリ
ームを逐次読み出せばよいため、特に問題とはならな
い。By the way, the picture header detection circuit 203
At the time when the bit buffer 20 detects the picture header or after the decode core circuit 204 starts decoding.
2 may underflow. In this case, as soon as the video stream is input to the bit buffer 202,
There is no particular problem since a video stream for one picture may be sequentially read from the bit buffer 202.
【0134】以上詳述したように、ビデオデコーダ12
によれば、以下に示す効果を得ることができる。 通常の再生時において、ビットバッファ202のオー
バーフローを回避することができる。As described in detail above, the video decoder 12
According to this, the following effects can be obtained. During normal reproduction, overflow of the bit buffer 202 can be avoided.
【0135】高速再生時において、ビットバッファ2
02のオーバーフローを回避することができる。 判定回路205およびピクチャスキップ回路206を
設けることにより、ビットバッファ202のオーバーフ
ローを回避することができる。上記したように判定回路
205およびピクチャスキップ回路206の制御は簡単
であるため、制御コア回路207はマイクロコンピュー
タを用いて構成する必要がない。そして、各回路203
〜207を1チップのLSIに搭載した場合には、ビデ
オデコーダ12を小型化することができる。Bit buffer 2 during high-speed reproduction
02 overflow can be avoided. By providing the determination circuit 205 and the picture skip circuit 206, overflow of the bit buffer 202 can be avoided. As described above, since the control of the determination circuit 205 and the picture skip circuit 206 is simple, there is no need to configure the control core circuit 207 using a microcomputer. And each circuit 203
When ˜207 are mounted on a one-chip LSI, the video decoder 12 can be downsized.
【0136】ピクチャスキップ回路206のノード2
06b側からスキップされるビデオストリームは、ピク
チャ単位となる。そのため、デコードコア回路204へ
転送されるピクチャの途中でデータが途切れることはな
い。従って、デコードコア回路204では、Iピクチャ
だけでなくPピクチャやBピクチャについてもデコード
可能になる。その結果、ディスプレイ22で再生される
動画に生じるコマ落ちが少なくなる。そのため、2〜4
倍という比較的遅い高速再生時において、数コマ/秒の
表示が可能になる。従って、高速再生時における動画の
動きを滑らかにして画質を大幅に向上させることができ
る。Node 2 of the picture skip circuit 206
The video stream skipped from the 06b side is a picture unit. Therefore, data is not interrupted in the middle of the picture transferred to the decode core circuit 204. Therefore, the decoding core circuit 204 can decode not only an I picture but also a P picture and a B picture. As a result, dropped frames in the moving image reproduced on the display 22 are reduced. Therefore, 2-4
It is possible to display several frames per second during high-speed playback, which is a relatively slow double speed. Therefore, the motion of a moving image during high-speed playback can be smoothed, and the image quality can be greatly improved.
【0137】ところで、上記したビデオデコーダ12に
おいて、式(9)に示す規定を満たすように、2つの閾
値B2thn,B3thnを設定してもよい。尚、各閾値B2th
n,B3thnの値は、上記のように再生速度に応じて設定
されると共に、ディスプレイ22で再生される動画の画
質を実際に検討して適宜に設定すればよい。By the way, in the above video decoder 12, two threshold values B2thn and B3thn may be set so as to satisfy the formula (9). Each threshold B2th
The values of n and B3thn are set according to the reproduction speed as described above, and may be set appropriately by actually examining the image quality of the moving image reproduced on the display 22.
【0138】0<B3thn<B2thn<B ………(9) 判定回路205は、ビットバッファ202の占有量Bm
と各閾値Bthn ,B2thnとを比較し、占有量Bm が式
(10)〜(12)に示すどの領域に含まれるかを判定
する。0 <B3thn <B2thn <B (9) The decision circuit 205 determines that the bit buffer 202 occupies Bm.
Is compared with the thresholds Bthn and B2thn to determine in which area the occupancy Bm is included in the equations (10) to (12).
【0139】Bm <B3thn ………(10) B3thn<Bm <B2thn ………(11) B2thn<Bm ………(12) 判定回路205は、式(10)に示すように、ビットバ
ッファ202の占有量Bm が閾値B3thnを越えない場合
には、ビットバッファ202がオーバーフローする恐れ
がなく正常であると判定する。この場合、制御コア回路
207は、ビットバッファ202から1ピクチャ分のビ
デオストリームを読み出す。そして、制御コア回路20
7は、ピクチャスキップ回路206をノード206a側
に接続し、そのビットバッファ202から読み出された
ピクチャをデコードコア回路204へ転送させる。Bm <B3thn (10) B3thn <Bm <B2thn (11) B2thn <Bm (12) The decision circuit 205 determines the bit buffer 202 of the bit buffer 202 as shown in equation (10). If the occupied amount Bm does not exceed the threshold value B3thn, it is determined that the bit buffer 202 is normal without fear of overflow. In this case, the control core circuit 207 reads a video stream for one picture from the bit buffer 202. Then, the control core circuit 20
7, the picture skip circuit 206 is connected to the node 206a, and the picture read from the bit buffer 202 is transferred to the decode core circuit 204.
【0140】判定回路205は、式(12)に示すよう
に、ビットバッファ202の占有量Bm が閾値B2thnを
越え且つ閾値Bthn を越えない場合に、ビットバッファ
202から読み出されたピクチャがIピクチャまたはP
ピクチャならば、第1のフラグを立てる。また、式(1
1)に示すように、ビットバッファ202の占有量Bm
が閾値B3thnを越え且つ閾値B2thnを越えない場合に、
ビットバッファ202から読み出されたピクチャがPピ
クチャならば、第2のフラグを立てる。第1または第2
のフラグが立っている場合、式(10)に示す場合で
も、制御コア回路207は、ビットバッファ202から
読み出されたピクチャがBピクチャならば、ピクチャス
キップ回路206をノード206b側に接続し、そのピ
クチャをスキップさせる。The determination circuit 205 determines that the picture read from the bit buffer 202 is an I picture when the occupied amount Bm of the bit buffer 202 exceeds the threshold value B2thn and does not exceed the threshold value Bthn, as shown in the equation (12). Or P
If it is a picture, the first flag is set. Also, the formula (1
As shown in 1), the occupation amount Bm of the bit buffer 202
Exceeds threshold B3thn and does not exceed threshold B2thn,
If the picture read from the bit buffer 202 is a P picture, a second flag is set. 1st or 2nd
Is set, the control core circuit 207 connects the picture skip circuit 206 to the node 206b if the picture read from the bit buffer 202 is a B picture, even in the case of the equation (10). Skip the picture.
【0141】図13に、2つの閾値B2thn,B3thnを設
定した場合におけるビットバッファ202の占有量Bm
の変化を示す。占有量Bm が閾値B3thnを越えた場合、
ビットバッファ202から読み出されたピクチャがBピ
クチャであればデコードせずにスキップする(図示※
1)。ここで、Bピクチャのスキップ後に占有量Bm が
まだ閾値B3thnを越えていても、ビットバッファ202
から次に読み出されたピクチャがIピクチャまたはPピ
クチャであればデコードする(図示※2)。In FIG. 13, the occupied amount Bm of the bit buffer 202 when two thresholds B2thn and B3thn are set.
Shows the change in If the occupancy Bm exceeds the threshold B3thn,
If the picture read from the bit buffer 202 is a B picture, it is skipped without decoding (illustration *
1). Here, even if the occupation amount Bm still exceeds the threshold value B3thn after skipping the B picture, the bit buffer 202
If the picture read next from is an I picture or a P picture, it is decoded (illustrated * 2).
【0142】占有量Bm が閾値B3thnを越えた場合で
も、ビットバッファ202から読み出されたピクチャが
IピクチャまたはPピクチャであればデコードする(図
示※3)。ここで、IピクチャまたはPピクチャのデコ
ード後に占有量Bm がまだ閾値B3thnを越えている場
合、ビットバッファ202から次に読み出されたピクチ
ャがBピクチャであればデコードせずにスキップする
(図示※4)。このBピクチャのスキップは、占有量B
m が閾値B3thnを下回るまで繰り返し行う(図示※
5)。Even if the occupied amount Bm exceeds the threshold value B3thn, if the picture read from the bit buffer 202 is an I picture or a P picture, it is decoded (* 3 in the figure). Here, if the occupation amount Bm still exceeds the threshold value B3thn after the decoding of the I picture or the P picture, if the next picture read from the bit buffer 202 is a B picture, the picture is skipped without decoding (illustration *). 4). This skipping of the B picture is performed with the occupation amount B
Repeat until m falls below the threshold B3thn (*
5).
【0143】占有量Bm が閾値B2thnを越えた場合、ビ
ットバッファ202から読み出されたピクチャがIピク
チャまたはPピクチャであれば、判定回路205は第1
のフラグを立てる(図示※6)。第1のフラグが立って
いる場合、ビットバッファ202から次に読み出された
ピクチャがBピクチャであれば、占有量Bm が閾値B3t
hnを下回っていても、そのBピクチャをスキップする
(図示※7)。If the occupied amount Bm exceeds the threshold value B2thn, and if the picture read from the bit buffer 202 is an I picture or a P picture, the decision circuit 205 makes the first decision.
Is set (illustration * 6). When the first flag is set, if the next picture read from the bit buffer 202 is a B picture, the occupation amount Bm is set to the threshold B3t.
Even if it is less than hn, the B picture is skipped (illustrated * 7).
【0144】占有量Bm が閾値B3thnを越え且つ閾値B
2thnを越えない場合、ビットバッファ202から読み出
されたピクチャがPピクチャであれば、判定回路205
は第2のフラグを立てる(図示※8)。第2のフラグが
立っている場合、ビットバッファ202から次に読み出
されたピクチャがBピクチャであれば、占有量Bm が閾
値B3thnを下回っていても、そのBピクチャをスキップ
する(図示※9)。The occupied amount Bm exceeds the threshold value B3thn and the threshold value B3
If it does not exceed 2thn, if the picture read from the bit buffer 202 is a P picture, the decision circuit 205
Sets the second flag (illustrated * 8). When the second flag is set, if the next picture read from the bit buffer 202 is a B picture, the B picture is skipped even if the occupation amount Bm is below the threshold value B3thn (illustrated * 9). ).
【0145】占有量Bm が閾値B3thnを越え且つ閾値B
2thnを越えない場合、ビットバッファ202から読み出
されたピクチャがIピクチャのときには、判定回路20
5は第2のフラグを立てない(図示※10)。第2のフ
ラグが立っていない場合、占有量Bm が閾値B3thnを下
回っていれば、ビットバッファ202から次に読み出さ
れたピクチャがBピクチャであってもデコードする。The occupied amount Bm exceeds the threshold value B3thn and the threshold value B3
If it does not exceed 2thn, and the picture read from the bit buffer 202 is an I picture, the decision circuit 20
5 does not set the second flag (* 10 in the figure). When the second flag is not set, if the occupation amount Bm is smaller than the threshold value B3thn, decoding is performed even if the next picture read from the bit buffer 202 is a B picture.
【0146】以上のように、2つの閾値B2thn,B3thn
を設定した場合には、上記したビデオデコーダ12の効
果〜に加えて、以下の効果を得ることができる。 ビットバッファ202の占有量Bm が閾値B3thnを越
え且つ閾値Bthn を越えない場合、IピクチャおよびP
ピクチャを可能な限りデコードすると共に、Bピクチャ
を優先してスキップする。As described above, the two threshold values B2thn and B3thn
When setting, the following effects can be obtained in addition to the effects of the video decoder 12 described above. If the occupation amount Bm of the bit buffer 202 exceeds the threshold value B3thn and does not exceed the threshold value Bthn, the I picture and P
The picture is decoded as much as possible and the B picture is skipped with priority.
【0147】Bピクチャは双方向予測によって生成され
るため、その重要度はIピクチャやPピクチャに比べて
低い。従って、重要度の低いBピクチャを優先してスキ
ップすることにより、ディスプレイ22で再生される動
画に生じるコマ落ちをさらに少なくすることができる。
その結果、高速再生時における動画の動きをさらに滑ら
かにして画質をより向上させることができる。Since the B picture is generated by bidirectional prediction, its importance is lower than that of the I picture and P picture. Therefore, by skipping B-pictures of low importance with priority, it is possible to further reduce dropped frames occurring in the moving image reproduced on the display 22.
As a result, the motion of the moving image during high-speed playback can be further smoothed, and the image quality can be further improved.
【0148】第1のフラグを設定することで、Iピク
チャまたはPピクチャのデコード後にビットバッファ2
02の占有量Bm が閾値B3thnを下回っても、余裕をみ
て次にビットバッファ202から読み出されるBピクチ
ャを予めスキップすることができる。また、第2のフラ
グを設定することで、Pピクチャのデコード後にビット
バッファ202の占有量Bm が閾値B3thnを下回って
も、余裕をみて次にビットバッファ202から読み出さ
れるBピクチャを予めスキップすることができる。By setting the first flag, the bit buffer 2 is decoded after the I picture or P picture is decoded.
Even if the occupation amount Bm of 02 is below the threshold value B3thn, it is possible to skip the B picture to be read from the bit buffer 202 in advance with a margin. Also, by setting the second flag, even if the occupation amount Bm of the bit buffer 202 falls below the threshold value B3thn after decoding the P picture, the B picture to be read from the bit buffer 202 next is skipped in advance with a margin. Can be.
【0149】このように、Bピクチャを予めスキップす
ることは、ビットバッファ202の次回のオーバーフロ
ーに対して予防措置を講ずることに他ならない。従っ
て、ビットバッファ202のオーバーフローをより確実
に回避することができる。As described above, skipping a B picture in advance is nothing but taking precautions against the next overflow of the bit buffer 202. Therefore, the overflow of the bit buffer 202 can be avoided more reliably.
【0150】Iピクチャのデータ量はPピクチャのそ
れの2〜3倍と多い。そのため、Pピクチャが読み出さ
れた場合に比べて、Iピクチャが読み出された場合の方
がビットバッファ202の占有量Bm の減少の度合いが
大きい。従って、Pピクチャが読み出された後よりも、
Iピクチャが読み出された後の方がビットバッファ20
2がオーバーフローする可能性が小さくなる。そこで、
第1および第2のフラグを設定することにより、Iピク
チャとPピクチャとで前記予防措置に差をつける。すな
わち、Iピクチャに対する予防措置の閾値B2thnを、P
ピクチャに対する予防措置の閾値B3thnよりも高い値に
設定することで、Iピクチャに対する予防措置をPピク
チャのそれに比べて緩くすることが可能になる。その結
果、Bピクチャの無駄なスキップを少なくすることがで
きる。The data amount of the I picture is as large as 2-3 times that of the P picture. Therefore, the degree of decrease in the occupation amount Bm of the bit buffer 202 is greater when the I picture is read than when the P picture is read. Therefore, than after the P picture is read out,
After the I picture is read, the bit buffer 20
2 is less likely to overflow. Therefore,
Setting the first and second flags differentiates the precautionary measures between I and P pictures. That is, the threshold value B2thn of the precautionary measure for the I picture is set to P
By setting the precautionary measure for a picture to a value higher than the threshold value B3thn, the preventive measure for an I picture can be less strict than that for a P picture. As a result, unnecessary skips of B pictures can be reduced.
【0151】以下のa)b)に示すGOP構成(ピク
チャのタイプの並び)のビデオストリームがAVパーサ
11から転送されてきた場合についてシミュレーション
したところ、以下に示す結果が得られた。When the video stream having the GOP structure (arrangement of picture types) shown in a) and b) below was transferred from the AV parser 11, simulation was performed, and the following results were obtained.
【0152】a)IBPBPBPBP・・・ b)IBBPBBPBBPBBPBBIBP・・・ [1] 2倍速再生時;a)の場合、IピクチャおよびPピ
クチャの全てがデコード可能であり、その結果、30コ
マ/秒のフルレートで表示できる。b)の場合、Iピク
チャおよびPピクチャの全てとBピクチャの一部がデコ
ード可能であり、その結果、25コマ/秒以上で表示で
きる。A) IBPBPBPBP ... b) IBBPBBPBBPBBPBBIBP ... [1] During double speed reproduction; In the case of a), all I pictures and P pictures can be decoded, and as a result, 30 frames / second full rate Can be displayed with. In the case of b), all of the I and P pictures and a part of the B picture can be decoded, and as a result, they can be displayed at 25 frames / second or more.
【0153】[2] 4倍速再生時;a)b)共に、Iピク
チャおよびそれに続く3〜4枚のPピクチャがデコード
可能であり、その結果、15コマ/秒以上で表示でき
る。ところで、第2〜第3実施形態において、ビデオデ
コーダ12の動作速度を制御するには、デコードコア回
路204におけるデコード処理の速度を制御すればよ
い。[2] At 4 × speed reproduction; a) and b), I picture and 3 to 4 P pictures following it can be decoded, and as a result, display at 15 frames / second or more is possible. By the way, in the second to third embodiments, in order to control the operation speed of the video decoder 12, the speed of the decoding process in the decode core circuit 204 may be controlled.
【0154】尚、上記各実施形態は以下のように変更し
てもよく、その場合でも同様の作用および効果を得るこ
とができる。 (1)リングメモリ32を、DSP31の後段ではな
く、DSP31の前段(すなわち、MPEGオーディオ
デコーダ3とDSP31の間)に設ける。The above embodiments may be modified as follows, and in that case, the same operation and effect can be obtained. (1) The ring memory 32 is provided in the front stage of the DSP 31 (that is, between the MPEG audio decoder 3 and the DSP 31), not in the rear stage of the DSP 31.
【0155】(2)MPEG再生装置23を構成する各
回路1,11,12を1チップのLSIに搭載する。こ
のようにすれば、MPEG再生装置23を小型化するこ
とができる。(2) Each of the circuits 1, 11, and 12 which compose the MPEG playback device 23 is mounted on a one-chip LSI. By doing so, the MPEG playback device 23 can be downsized.
【0156】(3)第2〜第8実施形態において、ビデ
オデコーダ12の動作速度を制御するのではなく、ビデ
オデコーダ12とディスプレイ22の間に遅延回路を挿
入し、その遅延回路の遅延時間を制御する。(3) In the second to eighth embodiments, instead of controlling the operation speed of the video decoder 12, a delay circuit is inserted between the video decoder 12 and the display 22 and the delay time of the delay circuit is adjusted. Control.
【0157】(4)第2〜第8実施形態の内いずれか2
つ以上の実施形態を適宜に組み合わせて実施する。この
ようにすれば、組み合わせた各実施形態の相乗作用によ
りさらに優れた効果を得ることができる。(4) Any two of the second to eighth embodiments
One or more embodiments are appropriately combined and implemented. In this case, a more excellent effect can be obtained by the synergistic action of the combined embodiments.
【0158】(5)第1〜第8実施形態をCPUを用い
たソフトウェア的な処理に置き代える。すなわち、各回
路(1〜55)における信号処理をCPUを用いたソフ
トウェア的な信号処理に置き代える。(5) The first to eighth embodiments are replaced by software processing using a CPU. That is, the signal processing in each circuit (1 to 55) is replaced with software-like signal processing using a CPU.
【0159】(6)図12に示したMPEGビデオデコ
ーダ12においては、説明を分かり易くするため、ピク
チャスキップ回路206が各ノード206a,206b
を有し、制御コア回路207の制御に従って各ノード2
06a,206bの接続が切り換えられる構成とした
が、この構成に代えて、ピクチャスキップ回路206
を、制御コア回路207の制御に従って、デコードコア
回路204でデコードされるべきピクチャだけを通過さ
せる論理回路によって構成してもよい。(6) In the MPEG video decoder 12 shown in FIG. 12, the picture skip circuit 206 includes nodes 206a and 206b for the sake of clarity.
Each node 2 under control of the control core circuit 207.
Although the connection between 06a and 206b is switched, the picture skip circuit 206 is used instead of this structure.
May be configured by a logic circuit that allows only the picture to be decoded by the decode core circuit 204 to pass under the control of the control core circuit 207.
【0160】以上、本発明を具体化した各実施形態につ
いて説明したが、上記実施形態から把握できる請求項以
外の技術的思想について、以下にそれらの効果と共に記
載する。 (イ)請求項3〜6のいずれか1項に記載のMPEGオ
ーディオ再生装置において、オーディオ信号をD/A変
換するD/Aコンバータ(5)と、D/Aコンバータの
出力を増幅するオーディオアンプ(6)とを備えたMP
EGオーディオ再生装置。Although the respective embodiments of the present invention have been described above, technical ideas other than the claims which can be understood from the above embodiments will be described below along with their effects. (A) In the MPEG audio reproducing apparatus according to any one of claims 3 to 6, a D / A converter (5) for D / A converting an audio signal and an audio amplifier for amplifying an output of the D / A converter. MP with (6)
EG audio playback device.
【0161】このようにすれば、ディジタルのオーディ
オ信号からスピーカを駆動するためのアナログ信号を生
成することができる。 (ロ)請求項2,7〜11のいずれか1項に記載のMP
EG再生装置において、記録媒体(21)から読み出さ
れたMPEGシステムストリームを、MPEGオーディ
オストリームとMPEGビデオストリームとに分離する
デマルチプレクサ(13)を備えたMPEG再生装置。By doing so, an analog signal for driving the speaker can be generated from the digital audio signal. (B) The MP according to any one of claims 2 and 7 to 11.
An EG reproducing apparatus, which is provided with a demultiplexer (13) for separating an MPEG system stream read from a recording medium (21) into an MPEG audio stream and an MPEG video stream.
【0162】このようにすれば、オーディオデコーダへ
オーディオストリームを、ビデオデコーダへビデオスト
リームをそれぞれ転送することができる。By doing so, it is possible to transfer the audio stream to the audio decoder and the video stream to the video decoder, respectively.
【0163】[0163]
【発明の効果】請求項1,3〜6のいずれか1項に記載
の発明によれば、可変速再生時においても自然で聞き易
い音声を再生することが可能なMPEGオーディオ再生
装置を提供することができる。According to the invention described in any one of claims 1 to 3, there is provided an MPEG audio reproducing apparatus capable of reproducing a natural and easy-to-listen sound even during variable speed reproduction. be able to.
【0164】請求項2または請求項7に記載の発明によ
れば、可変速再生時においても自然で聞き易い音声を再
生することが可能なMPEGオーディオ再生装置とMP
EGビデオデコーダとを備えたMPEG再生装置を提供
することができる。According to the second or seventh aspect of the invention, an MPEG audio reproducing apparatus and an MP capable of reproducing a natural and easy-to-listen sound even during variable speed reproduction.
It is possible to provide an MPEG playback device including an EG video decoder.
【0165】請求項8〜11のいずれか1項に記載の発
明によれば、可変速再生時においても自然で聞き易い音
声を再生することが可能なMPEGオーディオ再生装置
とMPEGビデオデコーダとを備え、音声と動画との時
間ずれを低減することが可能なMPEG再生装置を提供
することができる。According to the invention described in any one of claims 8 to 11, it is provided with an MPEG audio reproducing device and an MPEG video decoder capable of reproducing a natural and easily audible sound even during variable speed reproduction. Thus, it is possible to provide an MPEG playback device capable of reducing the time lag between audio and moving images.
【図1】第1実施形態のブロック回路図。FIG. 1 is a block circuit diagram of a first embodiment.
【図2】第1実施形態の要部ブロック回路図。FIG. 2 is a block circuit diagram of a main part of the first embodiment.
【図3】第1実施形態の作用を説明するための模式図。FIG. 3 is a schematic diagram for explaining the operation of the first embodiment.
【図4】第1実施形態の作用を説明するための模式図。FIG. 4 is a schematic diagram for explaining the operation of the first embodiment.
【図5】第2実施形態の要部ブロック回路図。FIG. 5 is a block circuit diagram of a main part of the second embodiment.
【図6】第3実施形態の要部ブロック回路図。FIG. 6 is a block circuit diagram of an essential part of a third embodiment.
【図7】第4実施形態の要部ブロック回路図。FIG. 7 is a block circuit diagram of an essential part of a fourth embodiment.
【図8】第5実施形態の要部ブロック回路図。FIG. 8 is a block circuit diagram of an essential part of a fifth embodiment.
【図9】第6実施形態の要部ブロック回路図。FIG. 9 is a block circuit diagram of an essential part of a sixth embodiment.
【図10】第7実施形態の要部ブロック回路図。FIG. 10 is a block circuit diagram of an essential part of a seventh embodiment.
【図11】第8実施形態の要部ブロック回路図。FIG. 11 is a block circuit diagram of an essential part of an eighth embodiment.
【図12】MPEGビデオデコーダの要部ブロック回路
図。FIG. 12 is a block circuit diagram of a main part of an MPEG video decoder.
【図13】MPEGビデオデコーダの動作を説明するた
めのグラフ。FIG. 13 is a graph for explaining the operation of the MPEG video decoder.
【図14】MPEGビデオデコーダの動作を説明するた
めのグラフ。FIG. 14 is a graph for explaining the operation of the MPEG video decoder.
1…MPEGオーディオ再生装置 2…話速変換手段としての再生速度検出回路 3…MPEGオーディオデコーダ 4…話速変換手段としての話速変換処理回路 12…MPEGビデオデコーダ 21…記録媒体 32…リングメモリ 33…検出手段としてのアップダウンカウンタ 41…音声判別部 42…無音削除挿入部 43…時間軸圧縮伸長部 51…インデックス付加回路 52…インデックス検出回路 53,55…遅延時間検出回路 54…制御回路 DESCRIPTION OF SYMBOLS 1 ... MPEG audio reproducing apparatus 2 ... Reproduction speed detecting circuit as speech speed converting means 3 ... MPEG audio decoder 4 ... Speech speed conversion processing circuit as speech speed converting means 12 ... MPEG video decoder 21 ... Recording medium 32 ... Ring memory 33 ... up-down counter 41 as detection means 41 ... voice discrimination section 42 ... silence deletion insertion section 43 ... time axis compression / expansion section 51 ... index addition circuit 52 ... index detection circuit 53, 55 ... delay time detection circuit 54 ... control circuit
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 H04N 7/24 H04N 7/13 Z (72)発明者 田中 浩司 大阪府守口市京阪本通2丁目5番5号 三 洋電機株式会社内─────────────────────────────────────────────────── ─── Continuation of front page (51) Int.Cl. 6 Identification number Internal reference number FI Technical display location H04N 7/24 H04N 7/13 Z (72) Inventor Koji Tanaka 2-chome, Keihanhondori, Moriguchi-shi, Osaka No. 5-5 Sanyo Electric Co., Ltd.
Claims (11)
その出力に対して話速変換処理を行う話速変換処理手段
(2,4)とを備えたMPEGオーディオ再生装置。1. An MPEG audio decoder (3),
An MPEG audio reproducing apparatus provided with a voice speed conversion processing means (2, 4) for performing a voice speed conversion process on the output.
その出力に対して話速変換処理を行う話速変換処理手段
(2,4)と、MPEGビデオデコーダ(3)とを備え
たMPEG再生装置。2. An MPEG audio decoder (3),
An MPEG playback device comprising a speech speed conversion processing means (2, 4) for performing a speech speed conversion processing on the output, and an MPEG video decoder (3).
EGオーディオストリームをMPEGオーディオパート
に準拠してデコードし、オーディオ信号を生成するMP
EGオーディオデコーダ(3)と、 オーディオ信号に対して話速変換処理を行う話速変換処
理手段(2,4)とを備え、 話速変換処理手段は、オーディオストリームのビットレ
ートが通常時よりも大きい場合には、再生される音声の
ピッチを通常の再生時とほぼ同一にし、且つ、再生され
る話速を通常の再生時に近づけるように話速変換処理を
行い、オーディオストリームのビットレートが通常時よ
りも小さい場合には、音声区間の途切れが目立たなくな
るように話速変換処理を行うMPEGオーディオ再生装
置。3. An MP read from a recording medium (21)
MP that decodes the EG audio stream according to the MPEG audio part and generates an audio signal
An EG audio decoder (3) and a voice speed conversion processing unit (2, 4) for performing a voice speed conversion process on the audio signal are provided, and the voice speed conversion processing unit has a bit rate of the audio stream higher than that of a normal time. If it is large, the pitch of the reproduced voice is set to be almost the same as that during normal reproduction, and the voice speed is converted so that the reproduced voice speed is close to that during normal reproduction. An MPEG audio reproducing apparatus that performs a voice speed conversion process so that a break in a voice section becomes inconspicuous when it is smaller than time.
EGオーディオストリームをMPEGオーディオパート
に準拠してデコードし、オーディオ信号を生成するMP
EGオーディオデコーダ(3)と、 オーディオ信号に対して話速変換処理を行う話速変換処
理手段(2,4)とを備え、 話速変換処理手段は、オーディオストリームのビットレ
ートが通常時よりも大きい場合には、再生される音声区
間の時間長さを伸長すると共に各無音区間の時間長さを
短くするようにして話速変換処理を行い、オーディオス
トリームのビットレートが通常時よりも小さい場合に
は、再生される各音声区間の時間長さを伸長すると共に
各無音区間の時間長さを短くするか、または、各無音区
間を削除して各音声区間をつなぎ合わせた後に無音区間
を挿入するようにして話速変換処理を行うMPEGオー
ディオ再生装置。4. An MP read from a recording medium (21)
MP that decodes the EG audio stream according to the MPEG audio part and generates an audio signal
An EG audio decoder (3) and a voice speed conversion processing unit (2, 4) for performing a voice speed conversion process on the audio signal are provided, and the voice speed conversion processing unit has a bit rate of the audio stream higher than that of a normal time. If it is large, the speech speed conversion process is performed by extending the time length of the reproduced voice section and shortening the time length of each silent section, and the bit rate of the audio stream is smaller than normal. , The time length of each voice section to be played back is extended and the time length of each silence section is shortened, or each silence section is deleted and the silence section is inserted and then the silence section is inserted. An MPEG audio reproducing apparatus for performing speech rate conversion processing as described above.
Gオーディオ再生装置において、 話速変換処理手段(2,4)は、 オーディオ信号を蓄積するリングメモリ(32)と、 リングメモリの蓄積量を検出する検出手段(33)とを
備え、 リングメモリの蓄積量に応じて音声区間の時間長さの圧
縮伸長率を調整するMPEGオーディオ再生装置。5. The MPE according to claim 3 or 4.
In the G audio reproducing apparatus, the speech speed conversion processing means (2, 4) comprises a ring memory (32) for accumulating an audio signal and a detecting means (33) for detecting an accumulation amount of the ring memory. An MPEG audio reproducing apparatus that adjusts a compression / expansion rate of a time length of a voice section according to a storage amount.
生装置において、 話速変換処理手段(2,4)は、 オーディオ信号の音声区間と無音区間とを判別する音声
判別部(41)と、 無音区間の削除処理または挿入処理を行う無音削除挿入
部(42)と、 リングメモリ(32)の蓄積量に基づいて音声区間の圧
縮伸長処理を行うことで圧縮伸長率を調整する時間軸圧
縮伸長部(43)とを備えたMPEGオーディオ再生装
置。6. The MPEG audio reproducing apparatus according to claim 5, wherein the voice speed conversion processing means (2, 4) includes a voice discriminating section (41) for discriminating a voice section and a silence section of the audio signal, and a silence. A silence deletion insertion unit (42) that performs a deletion process or an insertion process of a section, and a time axis compression / expansion unit that adjusts the compression / expansion rate by performing a compression / expansion process of a voice section based on the accumulated amount of the ring memory (32). (43) An MPEG audio reproducing apparatus comprising:
PEGオーディオ再生装置(1)と、 記録媒体(21)から読み出されたMPEGビデオスト
リームをMPEGビデオパートに準拠してデコードし、
ビデオ信号を生成するMPEGビデオデコーダ(12)
とを備えたMPEG再生装置。7. M according to any one of claims 3 to 6.
The MPEG video stream read from the PEG audio reproducing device (1) and the recording medium (21) is decoded in accordance with the MPEG video part,
MPEG video decoder for generating video signal (12)
An MPEG playback device comprising:
Gオーディオ再生装置(1)と、 記録媒体(21)から読み出されたMPEGビデオスト
リームをMPEGビデオパートに準拠してデコードし、
ビデオ信号を生成するMPEGビデオデコーダ(12)
と、 リングメモリ(32)に書き込まれる以前のオーディオ
信号に、時刻に関する情報としてのインデックス信号を
付加するインデックス付加回路(51)と、 リングメモリ(32)から読み出されたオーディオ信号
に付加されているインデックス信号を検出し、そのイン
デックス信号から得られる時刻情報と現在の時刻情報と
から、話速変換処理手段(2,4)における信号遅延時
間を検出し、その検出された遅延時間を示す信号をMP
EGビデオデコーダ(12)へ供給するインデックス検
出回路(52)とを備え、 MPEGビデオデコーダ(12)は、前記遅延時間を示
す信号に基づいて自己の動作のタイミングを制御するM
PEG再生装置。8. The MPE according to claim 5 or claim 6.
The G audio playback device (1) and the MPEG video stream read from the recording medium (21) are decoded in accordance with the MPEG video part,
MPEG video decoder for generating video signal (12)
And an index adding circuit (51) for adding an index signal as time-related information to the audio signal before being written in the ring memory (32) and an audio signal read from the ring memory (32). The index delay signal is detected, the signal delay time in the speech speed conversion processing means (2, 4) is detected from the time information obtained from the index signal and the current time information, and the signal indicating the detected delay time is detected. To MP
An MPEG video decoder (12) is provided with an index detection circuit (52) that supplies the EG video decoder (12), and the MPEG video decoder (12) controls the timing of its own operation based on the signal indicating the delay time.
PEG playback device.
生装置(1)と、 記録媒体(21)から読み出されたMPEGビデオスト
リームをMPEGビデオパートに準拠してデコードし、
ビデオ信号を生成するMPEGビデオデコーダ(12)
と、 音声判別部(41)の処理結果と、オーディオストリー
ムのビットレートとに基づいて、話速変換処理手段
(2,4)における信号遅延時間を検出し、その検出さ
れた遅延時間を示す信号をMPEGビデオデコーダ(1
2)へ供給する遅延時間検出回路(53)とを備え、 MPEGビデオデコーダ(12)は、前記遅延時間を示
す信号に基づいて自己の動作のタイミングを制御するM
PEG再生装置。9. The MPEG audio reproducing apparatus (1) according to claim 6 and an MPEG video stream read from a recording medium (21) are decoded in accordance with an MPEG video part,
MPEG video decoder for generating video signal (12)
A signal delay time in the speech speed conversion processing means (2, 4) is detected based on the processing result of the audio discriminating unit (41) and the bit rate of the audio stream, and a signal indicating the detected delay time. MPEG video decoder (1
2) and a delay time detection circuit (53) for supplying the M video signal to the MPEG video decoder (12), which controls the timing of its own operation based on the signal indicating the delay time.
PEG playback device.
再生装置(1)と、 記録媒体(21)から読み出されたMPEGビデオスト
リームをMPEGビデオパートに準拠してデコードし、
ビデオ信号を生成するMPEGビデオデコーダ(12)
と、 リングメモリ(32)の蓄積量に基づいて、話速変換処
理済みのオーディオ信号とビデオ信号との同期を得るた
めの制御信号を生成し、その制御信号をMPEGビデオ
デコーダ(12)へ供給する制御回路(54)とを備
え、 MPEGビデオデコーダ(12)は、前記制御信号に基
づいて自己の動作のタイミングを制御するMPEG再生
装置。10. The MPEG audio reproducing apparatus (1) according to claim 6 and an MPEG video stream read from a recording medium (21) are decoded in accordance with an MPEG video part,
MPEG video decoder for generating video signal (12)
And a control signal for obtaining synchronization between the audio signal and the video signal, which have been subjected to the speech speed conversion processing, is generated based on the storage amount of the ring memory (32), and the control signal is supplied to the MPEG video decoder (12). And a control circuit (54) for controlling the operation, wherein the MPEG video decoder (12) controls the timing of its own operation based on the control signal.
再生装置(1)と、 記録媒体(21)から読み出されたMPEGビデオスト
リームをMPEGビデオパートに準拠してデコードし、
ビデオ信号を生成するMPEGビデオデコーダ(12)
と、 音声判別部(41)および時間軸圧縮伸長部(43)の
処理結果に基づいて、話速変換処理手段(2,4)にお
ける信号遅延時間を検出し、その検出された遅延時間を
示す信号をMPEGビデオデコーダ(12)へ供給する
遅延時間検出回路(55)とを備え、 MPEGビデオデコーダ(12)は、前記遅延時間を示
す信号に基づいて自己の動作のタイミングを制御するM
PEG再生装置。11. An MPEG audio reproducing apparatus (1) according to claim 6 and an MPEG video stream read from a recording medium (21) are decoded in accordance with an MPEG video part,
MPEG video decoder for generating video signal (12)
Then, the signal delay time in the speech speed conversion processing means (2, 4) is detected based on the processing results of the voice discrimination unit (41) and the time axis compression / decompression unit (43), and the detected delay time is shown. A delay time detection circuit (55) for supplying a signal to the MPEG video decoder (12), wherein the MPEG video decoder (12) controls the timing of its own operation based on the signal indicating the delay time.
PEG playback device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16945496A JP3594409B2 (en) | 1995-06-30 | 1996-06-28 | MPEG audio playback device and MPEG playback device |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16638595 | 1995-06-30 | ||
JP7-166385 | 1995-06-30 | ||
JP16945496A JP3594409B2 (en) | 1995-06-30 | 1996-06-28 | MPEG audio playback device and MPEG playback device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0973299A true JPH0973299A (en) | 1997-03-18 |
JP3594409B2 JP3594409B2 (en) | 2004-12-02 |
Family
ID=26490781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16945496A Expired - Lifetime JP3594409B2 (en) | 1995-06-30 | 1996-06-28 | MPEG audio playback device and MPEG playback device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3594409B2 (en) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10336591A (en) * | 1997-06-05 | 1998-12-18 | Nec Corp | Image sound decoder with control function for sound reproduction time |
NL1012767C2 (en) * | 1998-08-03 | 2000-02-04 | Japan Adv Inst Science & Tech | A method for processing an audio signal into a composite audio-video signal. |
WO2000021091A1 (en) * | 1998-10-08 | 2000-04-13 | Sony Electronics Inc. | Apparatus and method for variable-speed audio data playback |
JP2001222300A (en) * | 2000-02-08 | 2001-08-17 | Nippon Hoso Kyokai <Nhk> | Voice reproducing device and recording medium |
WO2002073602A1 (en) * | 2001-03-14 | 2002-09-19 | Sanyo Electric Co., Ltd. | Data reproducer |
US6484137B1 (en) | 1997-10-31 | 2002-11-19 | Matsushita Electric Industrial Co., Ltd. | Audio reproducing apparatus |
WO2003001510A1 (en) * | 2001-06-21 | 2003-01-03 | Sony Corporation | Digital signal processing apparatus and processing method, and digital signal reproduction/reception system |
US6629000B1 (en) | 1997-11-24 | 2003-09-30 | Mpman.Com Inc. | MPEG portable sound reproducing system and a reproducing method thereof |
US6904406B2 (en) | 1999-12-22 | 2005-06-07 | Nec Corporation | Audio playback/recording apparatus having multiple decoders in ROM |
JP2005519417A (en) * | 2002-03-01 | 2005-06-30 | トムソン ライセンシング ソシエテ アノニム | Trick mode audio playback |
WO2006008810A1 (en) * | 2004-07-21 | 2006-01-26 | Fujitsu Limited | Speed converter, speed converting method and program |
WO2006137425A1 (en) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
JP2008079073A (en) * | 2006-09-22 | 2008-04-03 | Casio Comput Co Ltd | Moving image playback unit, and program therefor |
JP2008118508A (en) * | 2006-11-07 | 2008-05-22 | Casio Comput Co Ltd | Recording device and recording program |
US7418393B2 (en) | 2000-05-26 | 2008-08-26 | Fujitsu Limited | Data reproduction device, method thereof and storage medium |
US7515814B2 (en) | 2004-02-24 | 2009-04-07 | Sony Corporation | Reproducing apparatus and reproducing method for video and audio data paired as growth rings |
JP2011055386A (en) * | 2009-09-04 | 2011-03-17 | Sanyo Electric Co Ltd | Audio signal processor, and electronic apparatus |
JP2013528824A (en) * | 2010-04-13 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio or video encoder, audio or video decoder, and multi-channel audio or video signal processing method using prediction direction variable prediction |
JP2014102379A (en) * | 2012-11-20 | 2014-06-05 | Nippon Hoso Kyokai <Nhk> | Voice reproduction device and voice synthesis reproduction device and program thereof |
JP2016218347A (en) * | 2015-05-25 | 2016-12-22 | ヤマハ株式会社 | Sound material processor and sound material processing program |
-
1996
- 1996-06-28 JP JP16945496A patent/JP3594409B2/en not_active Expired - Lifetime
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10336591A (en) * | 1997-06-05 | 1998-12-18 | Nec Corp | Image sound decoder with control function for sound reproduction time |
US6484137B1 (en) | 1997-10-31 | 2002-11-19 | Matsushita Electric Industrial Co., Ltd. | Audio reproducing apparatus |
US7065417B2 (en) | 1997-11-24 | 2006-06-20 | Sigmatel, Inc. | MPEG portable sound reproducing system and a reproducing method thereof |
US8843225B2 (en) | 1997-11-24 | 2014-09-23 | Mpman.Com, Inc. | Portable sound reproducing system and method |
US6629000B1 (en) | 1997-11-24 | 2003-09-30 | Mpman.Com Inc. | MPEG portable sound reproducing system and a reproducing method thereof |
NL1012767C2 (en) * | 1998-08-03 | 2000-02-04 | Japan Adv Inst Science & Tech | A method for processing an audio signal into a composite audio-video signal. |
WO2000021091A1 (en) * | 1998-10-08 | 2000-04-13 | Sony Electronics Inc. | Apparatus and method for variable-speed audio data playback |
US6292454B1 (en) * | 1998-10-08 | 2001-09-18 | Sony Corporation | Apparatus and method for implementing a variable-speed audio data playback system |
US6904406B2 (en) | 1999-12-22 | 2005-06-07 | Nec Corporation | Audio playback/recording apparatus having multiple decoders in ROM |
JP2001222300A (en) * | 2000-02-08 | 2001-08-17 | Nippon Hoso Kyokai <Nhk> | Voice reproducing device and recording medium |
US7418393B2 (en) | 2000-05-26 | 2008-08-26 | Fujitsu Limited | Data reproduction device, method thereof and storage medium |
WO2002073602A1 (en) * | 2001-03-14 | 2002-09-19 | Sanyo Electric Co., Ltd. | Data reproducer |
WO2003001510A1 (en) * | 2001-06-21 | 2003-01-03 | Sony Corporation | Digital signal processing apparatus and processing method, and digital signal reproduction/reception system |
JP2005519417A (en) * | 2002-03-01 | 2005-06-30 | トムソン ライセンシング ソシエテ アノニム | Trick mode audio playback |
US7515814B2 (en) | 2004-02-24 | 2009-04-07 | Sony Corporation | Reproducing apparatus and reproducing method for video and audio data paired as growth rings |
WO2006008810A1 (en) * | 2004-07-21 | 2006-01-26 | Fujitsu Limited | Speed converter, speed converting method and program |
US7672840B2 (en) | 2004-07-21 | 2010-03-02 | Fujitsu Limited | Voice speed control apparatus |
US7974837B2 (en) | 2005-06-23 | 2011-07-05 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmitting apparatus |
JP5032314B2 (en) * | 2005-06-23 | 2012-09-26 | パナソニック株式会社 | Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmission apparatus |
WO2006137425A1 (en) * | 2005-06-23 | 2006-12-28 | Matsushita Electric Industrial Co., Ltd. | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
JP2008079073A (en) * | 2006-09-22 | 2008-04-03 | Casio Comput Co Ltd | Moving image playback unit, and program therefor |
JP2008118508A (en) * | 2006-11-07 | 2008-05-22 | Casio Comput Co Ltd | Recording device and recording program |
JP4743084B2 (en) * | 2006-11-07 | 2011-08-10 | カシオ計算機株式会社 | Recording apparatus and recording program |
JP2011055386A (en) * | 2009-09-04 | 2011-03-17 | Sanyo Electric Co Ltd | Audio signal processor, and electronic apparatus |
JP2013528824A (en) * | 2010-04-13 | 2013-07-11 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Audio or video encoder, audio or video decoder, and multi-channel audio or video signal processing method using prediction direction variable prediction |
US9398294B2 (en) | 2010-04-13 | 2016-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49453E1 (en) | 2010-04-13 | 2023-03-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49464E1 (en) | 2010-04-13 | 2023-03-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49469E1 (en) | 2010-04-13 | 2023-03-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multichannel audio or video signals using a variable prediction direction |
USRE49492E1 (en) | 2010-04-13 | 2023-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49511E1 (en) | 2010-04-13 | 2023-04-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49549E1 (en) | 2010-04-13 | 2023-06-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
USRE49717E1 (en) | 2010-04-13 | 2023-10-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
JP2014102379A (en) * | 2012-11-20 | 2014-06-05 | Nippon Hoso Kyokai <Nhk> | Voice reproduction device and voice synthesis reproduction device and program thereof |
JP2016218347A (en) * | 2015-05-25 | 2016-12-22 | ヤマハ株式会社 | Sound material processor and sound material processing program |
Also Published As
Publication number | Publication date |
---|---|
JP3594409B2 (en) | 2004-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5809454A (en) | Audio reproducing apparatus having voice speed converting function | |
JP3594409B2 (en) | MPEG audio playback device and MPEG playback device | |
JP3053541B2 (en) | Synchronous variable speed playback of digitally recorded audio and video | |
US7400685B2 (en) | Decoding method and apparatus and recording method and apparatus for moving picture data | |
JP4717060B2 (en) | Recording / reproducing apparatus, recording / reproducing method, recording medium storing recording / reproducing program, and integrated circuit used in recording / reproducing apparatus | |
JP3063838B2 (en) | Audio / video synchronous playback apparatus and method | |
US6339760B1 (en) | Method and system for synchronization of decoded audio and video by adding dummy data to compressed audio data | |
JP4319548B2 (en) | Audio program playback method and apparatus during video trick mode playback | |
WO2004047441A1 (en) | Transmission device, transmission method, reproduction device, reproduction method, program, and recording medium | |
US5896099A (en) | Audio decoder with buffer fullness control | |
JP3416403B2 (en) | MPEG audio decoder | |
JP3300561B2 (en) | Variable rate compression device and variable rate decompression device | |
JP2002094384A (en) | Device and method for compressing image and audio over long time period | |
US20150104158A1 (en) | Digital signal reproduction device | |
US20070248170A1 (en) | Transmitting Apparatus, Receiving Apparatus, and Reproducing Apparatus | |
JPH10271482A (en) | Synchronous reproduction control method and system for coded video | |
JP3986147B2 (en) | Acoustic signal processing apparatus and audio high-speed playback method | |
US7382972B2 (en) | Recording apparatus and method | |
JP2003216195A (en) | Mpeg (motion picture experts group) audio decoder | |
JP4055089B2 (en) | Signal recording / reproducing apparatus and signal recording / reproducing method | |
JPH1093921A (en) | Sound signal reproducing device and sound signal reproducing method | |
JPH08237135A (en) | Coding data decodr and video audio multiplex data decoder using the decoder | |
JP2003259287A (en) | Multimedia communication equipment | |
JP2004153631A (en) | Digital image and sound recorder | |
JPH09182024A (en) | Video data expanding device and data expanding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040721 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040831 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070910 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080910 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090910 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100910 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110910 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120910 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130910 Year of fee payment: 9 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |