[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2004077406A1 - 再生装置および再生方法 - Google Patents

再生装置および再生方法 Download PDF

Info

Publication number
WO2004077406A1
WO2004077406A1 PCT/JP2004/002261 JP2004002261W WO2004077406A1 WO 2004077406 A1 WO2004077406 A1 WO 2004077406A1 JP 2004002261 W JP2004002261 W JP 2004002261W WO 2004077406 A1 WO2004077406 A1 WO 2004077406A1
Authority
WO
WIPO (PCT)
Prior art keywords
header
data
stream
audio
frame
Prior art date
Application number
PCT/JP2004/002261
Other languages
English (en)
French (fr)
Inventor
Taro Katayama
Toshiya Noritake
Kazuo Fujimoto
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to JP2005502921A priority Critical patent/JP4354455B2/ja
Priority to US10/544,335 priority patent/US7653538B2/en
Publication of WO2004077406A1 publication Critical patent/WO2004077406A1/ja
Priority to US12/633,047 priority patent/US20100088103A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Definitions

  • the present invention relates to an audio reproducing apparatus that decodes and reproduces a framed audio signal, and in particular, when there is a discontinuity in the audio signal due to editing or communication error, or the attribute changes.
  • the present invention relates to a reproducing apparatus and a reproducing method characterized in that abnormal noise is not generated in such a case.
  • audio signals are framed as audio coded signals, as represented by the MPEG standard (ISO 1 1 1 7 2—3 or ISO 1 3 1 8 3). .
  • Each frame is provided with a private header containing signal attribute information.
  • a CRC bit for error checking is added to the audio coded signal, and data loss or error in the transmission path can be detected during decoding.
  • This conventional device detects a legitimate header, analyzes the sampling frequency written in the previous legitimate header analyzed by the header analyzing means, Compare the sampling frequency written in the current regular header to be decoded and if the sampling frequency written in the current header changes, change the frame after the change. Mute for a certain period of time to prevent the generation of abnormal noise. For example, when the sampling frequency written in the current header is changed, it is necessary to change the setting of the DA converter arranged after the decoding means. While the setting of the DA converter is being changed, no sound signal is generated, so that the sound signal contains noise. Therefore, the output audio is muted for a certain period when the setting of the DA converter is changed. Thus, the frames after the current header where the change was written are muted.
  • the header is detected by detecting a synchronization word provided in synchronization with the header.
  • Patent Document 2 Japanese Patent Application Laid-Open No. 2000-31942.
  • Patent Document 3 Japanese Patent Application Laid-Open No. 10-1990766 discloses a technique in which a portion having missing data is detected by comparing data amounts and mute processing is performed.
  • the conventional bit stream playback device described in Patent Document 3 decodes an audio stream encoded according to the MPEG 1 or MPEG 2 audio standard, and a part of the stream is lost for some reason.
  • the underflow of the frame buffer of the decoder is detected and the mute is performed.
  • the synchronization word is detected, a regular header is found, and the data amount between the regular header and the regular header is measured by a counter. If the measured data amount F is smaller than the predetermined data amount, it is determined that data has been lost and mute processing is performed. Disclosure of the invention
  • Patent Documents 1 and 2 first detect a legitimate header and analyze the information of the legitimate header, so that a discontinuous portion generated between the headers cannot be found.
  • Patent Document 3 also detects a regular header first, and detects the data amount between the regular header and the next regular header.
  • a regular header can be found by using a synchronization word.
  • two consecutive regular headers cannot be found.
  • the mute timing is a frame after a change is detected. Therefore, it is not possible to mute discontinuous points that occurred before the change.
  • Patent Document 3 does not show the timing of muting.
  • the playback device includes an audio encoded signal and a private header composed of attribute information of the audio encoded signal in one frame, but includes a second layer of a lower layer that does not include a synchronization word.
  • a playback device wherein the stream receives data contained in a first stream of an upper layer including a detectable header signal, decodes the audio encoded signal and outputs audio, and analyzes the first stream.
  • a stream analysis for detecting the header signal, analyzing the second stream based on the detected header signal, and outputting the audio coded signal and the positional information of the private header.
  • Means, and a buffer memory before decoding for temporarily storing the audio coded signal and the private header output from the stream analyzing means.
  • Decoding means for decoding the audio coded signal input from the buffer memory before decoding and outputting audio, analyzing attribute information included in the private header of the first frame, and after the private header, First header analysis means for detecting data length information representing the data length of the audio coded signal, and obtaining the position information of the private header of the first frame by adding the detected data length. A predetermined amount of target data after the position is analyzed, and the analyzed target data is Second header angle analysis means for judging whether or not the power is attribute information included in the private header of the two frames, and the target data force analyzed is judged to be not attribute information included in the private header of the second frame
  • the reproducing apparatus is provided with control means for stopping audio output from the decoding means for at least the audio encoded signal of the first frame.
  • the second header analysis unit may determine whether at least one part of the target data matches at least one part of the attribute information analyzed by the first header analysis unit. It is also possible to adopt a configuration characterized by judging whether or not.
  • the second header analysis means determines whether or not at least a part of the target data matches at least a part of any one of the attribute information groups held in advance.
  • a configuration characterized by making a determination may be used.
  • the attribute information is at least one of a sampling frequency, channel information, a sample bit length, and a data length of the audio encoded signal of the audio encoded signal. May be.
  • the stream analysis unit detects frame length data indicating the length of the frame included in the header signal, and detects one frame of data following the header signal. If the frame length data is not equal to the detected frame length data, the frame may be discarded and the next frame may be analyzed.
  • the first stream is composed of a plurality of buckets
  • the stream analysis unit detects and detects packet length data indicating the length of the packet included in the header signal. If the length of one packet is not equal to the detected packet length data, the packet may be discarded and the next packet may be analyzed.
  • a discontinuous point specifying packet is inserted at a position where the first stream has a discontinuity, and the stream analyzing unit detects the discontinuous point specifying packet,
  • the stream analyzing unit detects the discontinuous point specifying packet
  • a discontinuous point specifying packet is inserted at a location where the first stream has a discontinuity, and the stream analyzing means is configured to perform a discontinuous operation based on the detected header signal.
  • a counter for counting up to the explicit packet is provided, and address storage means for calculating and holding an address at the counted point is provided.
  • the control means reads a pointer so that the next private header is located at the calculated address. May be moved.
  • a delay means may be provided between the buffer memory before decoding and the decoding means.
  • the playback method provides a second stream of a lower layer that includes an audio encoded signal and a private header composed of the attribute information of the audio encoded signal in one frame, but does not include a synchronization word.
  • the decoding step is performed at least for the audio encoded signal of the first frame.
  • the second header analysis step includes determining whether at least one part of the target data matches at least one part of the attribute information analyzed by the first header analysis means. It is characterized by making a judgment.
  • the second header analysis step determines whether or not at least a part of the target data matches a power of at least a part of any one of attribute information groups stored in advance. It is characterized by doing.
  • the attribute information is at least one of a sampling frequency of the audio encoded signal, channel information, a sample length, and a data length of the audio encoded signal. .
  • the stream analysis step detects frame length data representing the length of the frame included in the header signal, and one frame of data following the header signal is If the detected frame length data is not equal, the frame is discarded and the next frame is analyzed.
  • the first stream is composed of a plurality of buckets
  • the stream analyzing step detects packet length data indicating a length of the packet included in the header signal, If the length of one detected packet is not equal to the detected packet length data, the packet is discarded and the next packet is analyzed.
  • a discontinuous point specifying packet is inserted at a position where the first stream has a discontinuity, and the stream analyzing step detects the discontinuous point specifying packet. If the amount of data held before the discontinuity point specifying packet is less than a predetermined data amount defined in advance or an integral multiple of the predetermined amount, supplemental data is output for the buffer before decoding. It is characterized by
  • a discontinuous point specifying packet is inserted at a position where the first stream has a discontinuity
  • the stream analyzing step includes a discontinuous specifying packet based on the detected header signal.
  • an address storage step for calculating and holding the address at the counted point is provided.
  • the control step is characterized in that the read pointer is moved so that the next private header is located at the calculated address.
  • a delay step of delaying the audio coded signal is provided between the holding step and the decoding step.
  • the present invention is a program for causing a computer to execute the above-mentioned reproducing method.
  • the present invention is a computer-readable recording medium recording a program for causing a computer to execute the above-mentioned reproducing method.
  • the decoding device is capable of decoding an audio stream in which a synchronization word or CRC bit 1 does not exist in an elementary stream, even if there is a discontinuity due to editing or data loss due to a transmission path error. It is possible to output audio without generating sound.
  • FIG. 1 is a block diagram showing a configuration of an audio playback device according to the first embodiment of the present invention.
  • FIG. 2A is a flowchart showing an audio reproducing method according to the first embodiment of the present invention.
  • FIG. 2B is a flowchart showing an audio reproducing method according to the first embodiment of the present invention.
  • FIG. 3 is a diagram illustrating a stream structure based on the MPEG standard.
  • FIG. 4 is a diagram showing the structure of a stream edited on a transport stream bucket basis.
  • FIG. 5A is a block diagram showing a configuration of an audio playback device according to the first embodiment of the present invention.
  • FIG. 5B is a block diagram showing the configuration of the audio playback device according to the first embodiment of the present invention.
  • FIG. 6 is a block diagram showing a configuration of an audio reproducing device according to the second embodiment of the present invention.
  • FIG. 7A is a flowchart showing an audio reproducing method according to the second embodiment of the present invention.
  • FIG. 7B is a flowchart showing an audio reproducing method according to the second embodiment of the present invention.
  • FIG. 8 is a block diagram showing a configuration of an audio playback device according to the third embodiment of the present invention.
  • FIG. 9A is a flowchart showing an audio reproducing method according to the third embodiment of the present invention.
  • FIG. 9B is a flowchart showing an audio reproducing method according to the third embodiment of the present invention.
  • FIGS. 1, 2A, 2B, 3, 4, and 5 show the first embodiment of the present invention.
  • FIG. 1 A, FIG. 1
  • FIG. 1 is a block diagram showing the playback device 101 of the present embodiment.
  • 2A and 2B are flowcharts showing each step of the reproducing method according to the present embodiment.
  • FIG. 3 is a diagram showing the structure of an input stream. The structure of a transport stream and PES packets according to the MPEG standard and an elementary stream that is expected to have an effect of preventing generation of abnormal noise according to the present invention are shown in FIG. Show.
  • FIG. 4 is a diagram showing a case where the transport stream described in FIG. 3 is edited in units of a transport bucket and includes an incomplete PES bucket.
  • the audio signal is converted into an audio coded signal 308 by a predetermined coding technique, and is cut every predetermined number of bytes (every 960 bytes or every 1440 bytes). Header 307 is added.
  • the audio coded signal shall be uncompressed PCM data.
  • Each of the truncated audio coded signals 3 08 is approximately 5 Includes audio signal of length msec.
  • the private header 307 contains the attribute information of the audio coded signal 308 and has no synchronization word.
  • the private header 307 and the following audio coded signal 308 are combined into one audio frame, and a stream in which such frames are continuously transmitted is called an elementary stream 306.
  • the attribute information includes, for example, information on a sampling frequency, a channel assignment, a bit length of a sample, and a data length of the audio coded signal 308. These attributes do not change unless the attributes (sampling frequency, channel assignment information, sample bit length, data length of audio coded signal 308) change. Therefore, as long as the attribute information does not change, the private header 307 of the nth (n is a positive integer) frame and the private header 307 of the (n + 1) th frame are the same. . Normally, the attribute information hardly changes. It may change when the broadcasting system changes, or when the audio track recorded on the optical disc changes. Some types of attribute information change less frequently (including zero), while others change more frequently. Even if it changes, it will turn into one of several predefined options. For example, the data length of the audio coded signal 308 changes to one of the predetermined options, 960 notes or 144 bytes.
  • the elementary stream 306 created in this way is divided for each frame, and is treated as a PES payload 305 having a length of 964 bytes or 1444 bytes.
  • a PES header 304 is added to each PES payload 305 to create one PES packet 303.
  • the PES bucket 303 is cut every predetermined length (for example, every 188 bytes or every 184 bytes), and the cut piece is treated as one audio transport bucket 302.
  • the audio transport packet 302 is mixed with other transport packets such as a video transport packet and is concatenated, and a transport stream 301 is generated.
  • Transport stream 301 is broadcast from the transmitting station.
  • the receiver receives the transport stream 301 and plays back the audio on the audio playback device 101.
  • the received transport stream 301 may be sent directly to the audio playback device 101, or may be temporarily recorded somewhere, and the recorded transport stream 301
  • the system 301 may be sent to the audio playback device 101.
  • audio recorded by the recording / reproducing device in the form of a transport stream is sent to the reproducing device 101 for playback, or recorded on a disc (eg, DVD) in the form of a transport stream.
  • the reproduced commercial content may be sent to the playback device 101 for playback.
  • one frame includes the audio coded signal and the private header composed of the attribute information of the audio coded signal, but includes the second layer of the lower layer that does not include the synchronization word.
  • Stream (elementary stream) 1 Processes data with a structure included in the first stream (stream composed of PES packets) of the upper layer, including a detectable header signal (PES header).
  • PES header detectable header signal
  • the discontinuity detection unit 100 detects whether there is a discontinuity in a part of the packet or bucket 1 in the stream, that is, whether or not a part of the data is missing. If a discontinuity is detected, a discontinuity explicit packet 401 is inserted if.
  • the audio playback device 101 receives a transport stream 301 including an audio transport packet 302, decodes the transport stream 301, and outputs an audio signal.
  • the transport stream 301 that has entered the playback device 101 is input to the stream analysis means 102 (S201).
  • the stream analyzing means 102 analyzes the transport stream 301, extracts an audio transport packet 302, forms an audio PES packet 303, and further analyzes the audio PES packet 303 (S202).
  • the stream analysis means 102 extracts only the audio transport packet 302 from the transport packets and creates a stream of PES packets 303.
  • the PES header 304 contains the data length of the PES payload 305.
  • the stream analysis means 102 starts the response immediately after the PES header, that is, from the beginning of the PES payload, and starts the next packet (the PES packet or a discontinuity indication described later).
  • the event value is equal to the data length of the PES payload 305.
  • the count value is compared with the data length included in the PES header, and it is determined whether or not the count value matches a predetermined regular value (S203).
  • the data length of the PES payload is one of several lengths defined in advance in the standard, for example, one of 964 bytes and 1444 bytes.
  • the private header 307 and the audio coded signal 308 are extracted from the PES payload 300 and stored in the buffer memory 103 before decoding (S204). .
  • the PES pay port 305 is also referred to as an elementary stream 306 of audio.
  • the private header 307 includes attribute information of the audio encoded signal 308 and has no synchronization word.
  • the private header 307 is detected, for example, with a delay of a predetermined time after the detection of the PES header 304. In the example shown in FIG. 3, the private header 307 is located immediately after the PES header 304, but the private header 307 is located a predetermined amount after the end of the PES header 304. It is also possible to arrange such that In this case, the EPS header may have a predetermined amount of information.
  • the stream analysis means 102 analyzes the stream including the PES packet which is the first stream, detects the header signal, that is, the PES header, and uses the detected header signal as a reference.
  • Another object of the present invention is to analyze an elementary stream as a second stream and output the audio encoded signal and position information of the private header.
  • the transport stream 301 is input to the audio reproducing apparatus 101, but the present invention is not limited to this, and an audio PES packet 303 may be input.
  • the stream angle analyzing means 102 stores the private header 307 and the audio encoded signal 308, which are the elementary stream 306, in the buffer memory 103 before decoding.
  • the transport stream 301 The analysis and analysis of the PES bucket 303 are represented by one step S202.
  • the audio coded signal 308 output from the buffer memory 103 before decoding is input to the first header analysis means 105, the second header analysis means, and the frame delay means 111.
  • the frame delay unit 111 delays the transmitted audio coded signal 308 by at least one frame, and sends it to the decoding unit 104.
  • the first header analysis means 105 detects the private header 307 of the first frame stored in the pre-decode buffer memory 103, reads the information, and reads the information contained in the private header 307. Is analyzed and output to the control means 107 (S205).
  • the detection of the private header 307 is performed at a timing that is a predetermined time after the timing of the PES header 304 detected by the stream analysis means 102, for example.
  • the first header analysis means 105 detects the n-th private header 300 (4 bytes) and sends the detected n-th private header 300 to the control means 107.
  • the control means 107 can send all or part of the information of the n-th private header 307 (sampling frequency, channel assignment information, sample bit length, data length of audio coded signal 308). 1 header memory.
  • the first header analysis means 105 counts the time Tf corresponding to one frame from the head of the detected n-th private header 3007, and sends the trigger signal to the second header analysis means 106. send. Note that instead of one frame, m (m is a positive integer greater than 1) frames may be counted and the trigger signal may be output.
  • the time T f can be obtained by adding the private header length (4 bytes) to the data length of the audio coded signal 308 which is one of the attribute information.
  • the data length of the audio coded signal 308 may be counted from the end of the private header 307.
  • the first header corner analyzing means 105 analyzes the attribute information included in the private header of the first frame, and analyzes the attribute information following the private header.
  • the purpose is to detect data length information indicating the data length of a one-dio coded signal.
  • the second header analysis means 106 reads a part of data (4 bytes) of the elementary stream output from the buffer memory before decoding 103, that is, target data, in response to the trigger signal. If there is no discontinuity in the audio encoded signal, the read target data corresponds to the (n + 1) th private header. If there is a discontinuity in the nth frame data, the target data read is not the (n + 1) th private header, so the (n + 1) th private header cannot be read correctly.
  • the second header analysis means 106 reads the 4-byte target data read and the private data.
  • control means 107 decodes the audio.
  • the second heg analysis means 106 will determine that the (n + 1) th private header is correct. It is determined that it does not exist at the position. In this case, it is determined that there is a discontinuity in the audio coded signal and audio data is missing. In this case, the control means 107 outputs a mute signal to the decoding means 104 in order to mute the audio coded signal following the n-th private header. Since the frame delay unit 111 is provided, the time when the mute signal is output is immediately before the audio output is performed by the decoding unit 104 for the audio coded signal following the n-th private header.
  • the decoding means 104 instructs to mute the audio encoded signal following the n-th private header and stop the audio output.
  • the mute signal is a signal for muting one frame period. Therefore, audio is reproduced and output from the audio encoded signal following the (n + 1) th private header.
  • the second header analysis means 106 adds the detected data length to the position information of the private header of the first frame
  • An object of the present invention is to analyze a predetermined amount of target data and determine whether the analyzed target data is attribute information included in a private header of the second frame. It should be noted that whether the target data is attribute information included in the private header of the second frame is determined by determining whether at least a part of the target data is at least part of the attribute information analyzed by the first header analysis means 105. It may be determined whether or not the force matches one copy.
  • the mute signal may be a signal that mutes a plurality of frame periods, for example, two frame periods. If the signal mutes two frame periods, the audio encoded signal following the (n + 1) th private header is also muted, and the audio output is instructed to be stopped, and the (n + 2) th private header is stopped. After that, the audio is reproduced and output from the audio coded signal.
  • the private header memory 110 may be provided in the first header analysis means 105. Needless to say, the control means 107 may calculate the address instead of the first header analysis means 105.
  • the second header analyzing means 106 analyzes the private header 307 in the same manner as the first header analyzing means 105, and outputs information contained therein to the control means 107. It is (S207).
  • the second header analyzing means 106 differs from the first header analyzing means 105 in that data is read by a trigger signal from the first header angle analyzing means 105. And a point at which a frame at a time later than the private header analyzed by the first header analyzing means 105, for example, a private header of the next frame is analyzed. That is, the private header of the frame next to the current frame to be decoded by the decoding means 104 described later is analyzed.
  • the decoding means 104 reads out the audio coded signal 308 output from the pre-decoding buffer memory 103 and delayed for a predetermined time, and outputs a voice (S209).
  • the decoding means 104 is controlled by the control means 107 in relation to the start and stop of decoding or the output of sound, such as a mute process.
  • the control means 107 receives the information contained in the private headers of the current frame and the next frame from the first header analysis means 105 and the second header analysis means 106, respectively, and The information is compared with each other (S208) and different If there is, the decoding means 104 is instructed to mute (S210).
  • the reproducing apparatus and the reproducing method according to the present embodiment are arranged so that after outputting the audio signal of the first frame, one frame of the audio coded signal is stored in the buffer memory before decoding in order to decode the next frame. It is determined whether or not a predetermined amount of data that is sufficiently larger than the predetermined amount is accumulated (S211). If the data is accumulated, the first header analysis means 105 analyzes the attribute information of the first frame (S211). Return to the processing of 205) and continue decoding. If a predetermined amount of data is not stored in the buffer memory before decoding, a stream is input from outside (S201), and the stream is analyzed by the stream analyzing means 102 described above (S202). Perform processing.
  • the discontinuity detection unit 100 indicates the discontinuity point at the point where the discontinuity point is detected. 0 1 is inserted.
  • the stream analyzing means 102 analyzes the input stream as described above (S202), and stores the audio elementary stream in the pre-decode buffer memory 103 (S204).
  • the audio coded signal extracted from the stream becomes an incomplete audio coded signal 403 in which the latter half of the data is missing.
  • the first header analysis means 105 adds the data length of the original audio coded signal included in the first header analysis means 105 to the address of the end position of the current private header, and generates an address B (407) is calculated (S206). Due to the presence of the imperfect audio coded signal 403, this address B is a point ahead of the actual next private header's address A (406). The first header analysis means 105 generates a trigger signal at the timing of address B. The second header analyzing means 106 reads a predetermined amount (4 bytes) of data from the address B in response to the trigger signal, predicts the next private header, and executes the private header analysis processing. Perform ( S207 ).
  • the information of the analysis result of the second header analysis means 106 does not match the attribute information acquired by the first header analysis means 105 and held in the private header memory 110, Mismatch information is generated. If the audio coded signal is PCM data, the chances of accidentally matching the private header of the first frame are very unlikely.
  • the current frame associated with the current private header 404 is muted before sound is output from the decoding means 104 (S210).
  • the incomplete audio encoded signal 403 and, if necessary, the next frame of the audio encoded signal are not decoded and output, thereby preventing the generation of abnormal noise. It is possible.
  • the private header memory 110 holds attribute information (sampling frequency, channel assignment information, sample bit length, data length of audio coded signal 308) included in the detected private header. Instead, all of the selectable attribute information groups including deformation are stored in advance. That is, the header header memory # 10 records, for example, the information shown in Table 1 below.
  • the information contained in the private header is one from column a, one from column, one from column c and one from column d.
  • (a 2, bl, cl, d 2) information is included.
  • the control means 107 compares the attribute information detected in the current private header with the attribute information group (data in Table 1) held in advance in the private header memory 110 and stores the information in the memory 110. Whether information that matches the detected attribute information is included (S507). That is, if all of the detected attribute information (a 2, bl, c 1, d 2) is included in the attribute information group held in the memory 110, it is determined that all the information is legitimate information. On the other hand, one of the detected attribute information (xx, b1, c1, d2> (where XX indicates information that cannot be analyzed) is included in the attribute information group held in the memory 110 If there is no such information, the private header is judged to be invalid information.
  • the target data of 4 bytes after the data length of the audio code signal 308 from the end of the current private header, that is, the attribute information detected from where the next private header should be, and the attribute information stored in advance are compared, and the same determination as above is made (S508). If both of the two pieces of detected attribute information include information that matches the previously held attribute information, the audio is played back (S509). On the other hand, the two pieces of detected attribute information are used. If any of them contains information that does not match the attribute information stored in advance, muting is instructed to the decoding means 104 (S510).
  • FIG. 5A omits the step (S203) for determining whether the PES payload length is normal described with reference to FIG.
  • the determination step S507 is omitted, and only the next private header has attribute information. May be detected to determine whether or not information that matches the attribute information stored in advance is included (S508).
  • the current private header is detected and analyzed to obtain a starting point for counting to the next private header and an interval to the next private header.
  • the analysis of the next private header is to determine whether the data detected as the next private header is a legitimate private header.
  • the second header analysis means determines whether or not the target data is attribute information included in the private header of the second frame. It is also possible to determine whether at least a part of the attribute information matches at least a part of any one of the attribute information groups held in advance. Good.
  • the private header 307 of a framed audio stream contains attribute information of the following audio encoded signal 308, so that the second header is used in the last frame of the stream. Data to be analyzed by the analysis means may not exist.
  • the stream analysis means 102 is configured to combine specific dummy data defined at the end of the stream, for example, representative attribute information shown in Table 1 (al, b1, cl , d 1).
  • the control unit 107 does not instruct the decoding unit 104 to mute if all the attribute information of the next frame acquired by the second header analysis unit 106 matches the previously defined bit sequence. It should be said that. This is because at the end of the input stream, when there is no data in the address to be analyzed by the second header analysis means 106 and the decoding means reads data from the buffer memory 103 before decoding. This control is effective to prevent the second header analysis means 106 from being unable to acquire any information when an underflow occurs.
  • the stream analysis means 102 avoids underflow by adding a private header composed of predetermined regular attribute information, and decodes and outputs the final frame. It becomes possible.
  • the predefined attribute information is, for example, a sampling frequency of only 48 kHz, a sample bit length of 16 bits, 20 bits or 24 bits, and a channel assignment.
  • the information may be monaural, dual monaural or stereo, and the data length of the audio encoded signal may be either 960 bytes or 144 bytes.
  • the specific bit string to be added may be different from the bit string representing the attribute information described above. Further, the specific bit string added to the terminal may be constituted by the previously defined regular attribute information.
  • the audio of the first frame which is the data between the private header of the first frame and the private header of the second frame, Even if part of the encoded signal is lost due to a stream transfer error, etc., it is possible to prevent the occurrence of abnormal noise by muting the audio encoded signal of the first frame. Become.
  • the second embodiment is different from the first embodiment in that a bucket length counting means 608 is provided.
  • the bucket length counting means 608 sequentially counts the amount of data stored in the buffer memory 103 before decoding (S705), and if the counted amount of data of the PES payload is less than the first predetermined length (S706) In N), the process returns to the step of stream input (S701).
  • S703 After analyzing the transport stream TS and the PES header (S702), it is determined whether or not there is a packet indicating a discontinuity point (S703).
  • the storage amount of the elementary stream in the buffer 103 before decoding is an integral multiple of the second predetermined length (S707). . If it is not an integer multiple, the complementary data of a specific length is stored in the buffer before decoding so as to be an integer multiple (S708), the packet length counting means is reset (S716), and the stream input step (701) is performed. Return. If there is no discontinuous point explicit packet (N in S703), the elementary stream is stored in the buffer 103 before decoding (S704), and the packet length counting means 608 determines the amount of stored data. Is counted (S705).
  • the bucket length counting means 608 detects the header of the audio PES packet (hereinafter, PES header) by the stream analysis means 102 (S702), and stores it in the buffer memory 103 before decoding until the next PES header is detected.
  • the amount of data to be stored, that is, the PES payload length is counted (S705).
  • the stream analysis means 102 detects a discontinuous point explicit packet during the analysis of the transport stream TS or PES header (at 3703), and at that time the amount of data stored in the pre-decode buffer 103 becomes the second. It is determined whether or not the length is an integral multiple of the predetermined length (S707). If the determination (S707) is false, the amount of data stored in the pre-decoding buffer 103 is set to be an integral multiple of the second predetermined length. Then, the complementary data is stored in the buffer before decoding (S708). Next, the counter of the packet length counting means 608 is reset (S716), and the stream input
  • the process returns to (S701).
  • the read address of the first header analysis means 105 in the buffer memory before decoding # 03 is replaced with the address next to the address where the captured data is stored. That is, it moves to the address where the head of the data after the discontinuous point explicit bucket is stored.
  • the predefined first predetermined length is, for example, a 4-byte first private header, a 960-bit or 1440-byte audio coded signal, and a 4-byte second private header. This is the amount of data constituted by a single header, ie, 968 bytes or 1448 bytes.
  • the second predetermined length is data that can be accessed when the first header analysis means 105, the second header analysis means 106, and the composite means 104 read data stored in the buffer memory 103 before decoding. Is the smallest unit (commonly known as a word), for example, 4 bytes.
  • the elementary stream output from the pre-decoding buffer memory 103 is analyzed by the first header analysis means 105 in the same manner as described above (S709), and the position of the second header is calculated (S710).
  • the target data at the position of the header (data predicted to be the second header) is analyzed (S711).
  • the contents of the analyzed target data are compared with the contents of the first header, and a determination is made as to whether they match (S712). If they are the same, the content of the target data is determined to be the legitimate second header, and audio playback is performed (S713). If the content of the second header is different from the content of the first header even in one place, the content of the target data is not a legitimate second header, that is, the position of the second header is calculated.
  • the determination in step S712 is based on the contents of the analyzed target data and the analyzed first data.
  • the contents of the header are compared to determine whether they match, but the contents of the analyzed target data may be compared with the contents of Table 1 that were previously held.
  • the PES payload in which the latter half of the data is missing that is, the incomplete audio private header and audio coded signal are not decoded, so that It is possible to prevent the incomplete audio encoded signal before the edit point and the data following it from being input to the decoding means 104 to prevent generation of abnormal noise.
  • the header analysis of the next frame by the second header analysis means 106 (S711) and the control means 107 Confirmation of the attribute information of the next frame (S 712) is not originally necessary, but in reality, data loss in data transfer between the stream analysis means 102 and the buffer memory before decoding 103 is detected.
  • the second header analysis means 106 is implemented to prevent the generation of abnormal noise even when an originally illegitimate audio encoded signal is input with the correct bucket length and converted to PES due to other factors. I do.
  • the stream analyzing means 102 is configured such that the packet length counted by the packet length counting means 608 is an integer of a specific data length. If it does not increase (N in S707), word alignment is performed by adding insufficient data (S708) so that it becomes an integral multiple of the specific data length, and the word alignment is performed before decoding. Buffer memory
  • the decoding means 104 and the first header analyzing means 105 and the second header analyzing means 106 read data from the pre-decoding buffer memory 103, they are determined in advance. Reading is performed in word units. For example, read data with 4 bytes as 1 word.
  • the address of the edit point is not in units of 4 bytes, and the frame after the edit point is stored in the buffer memory before decoding without word alignment.
  • the data near the private header after the edit point read by the first header analysis means 105 and the second header analysis means 106 is shifted by 1 to 3 bytes. 1 0 7 shows correct attribute information You will not be able to get it. This is because there is no synchronizing word in the elementary data targeted in the present embodiment, so that the shift in the data of 1 to 3 bytes is determined by the first header analysis means 105 or the second header. This is because it is impossible for the data analysis means 106 to detect and correct the read position. Therefore, when the stream analysis means 102 stores the captured data when storing the data in the buffer memory 103 before decoding (S708), the decoding and sound output after the editing point can be performed. It is possible.
  • Fig. 7A and Fig. 7B The above processing is summarized in Fig. 7A and Fig. 7B.
  • the processing is performed in the PES packet analysis step (S700).
  • the data amount of the PES packet stored in the buffer memory before decoding does not match the first predetermined length, that is, an integer multiple of one frame length of the elementary stream 306 (1 of 360) )
  • the stream input step S701
  • the amount of data stored in the buffer before decoding does not match the integral multiple of the second predetermined length ( ⁇ 0 of 37007
  • the complementary data is stored in the buffer before decoding (S7 0 8)
  • the word pointer aligns the pointer for accessing the data stored in the buffer before decoding.
  • the stream analysis means it is possible to detect the discontinuity of the stream by the stream analysis means and prevent the generation of abnormal noise.
  • decoding after the discontinuous point and reproduction of audio can be performed.
  • the difference between the third embodiment and the first or second embodiment is that the stream analysis means 102 stores the address of the private header stored in the buffer memory 103 before decoding ( S 9 0 4) Address storage means 8 0 8 ( Figure 8).
  • the stream is input (S901), and the transport stream TS and PES header are analyzed (S902).
  • the PES header is analyzed, and during the detection of the next PES header, it is determined whether or not the packet is a discontinuous point specification packet 401 (S903). If the discontinuous point explicit bucket 401 is found, the process proceeds to step S904, while if the next PES header is found without finding the discontinuous point explicit packet 401 (or a predetermined amount of counts from the previous PES header). If is terminated, the process proceeds to step S905. In step S905, the elementary stream is stored in the buffer memory 103 before decoding.
  • step S903 the stream analysis means 102 detects and analyzes the PES header.
  • the counter provided in the stream analysis means 102 starts counting from the end of the PES header, and the next packet (if data has discontinuity, the packet indicates the discontinuity point, and the data has no discontinuity. Count until the next PES packet) is found.
  • the data length of the PES payload following the PES header may be detected, and the data length may be counted.
  • the address A at the point where the counting is completed is calculated.
  • This address A is stored in the address storage means 808 (S904). That is, the address storage means 808 stores the head address of the head private header after the editing point.
  • the elementary stream output from the buffer memory 103 before decoding is analyzed by the first header analysis means 105 in the same manner as described above (S906), and the position of the second header is calculated (S907).
  • the target data at the position of the header (the data expected to be the second header) is analyzed (S908) 0
  • the content of the analyzed target data is compared with the content of the first header and matches. A determination is made (S909). If they are the same, the content of the target data is determined to be the legitimate second header, and audio playback is performed (S910).
  • the content of the target data is not a regular second header, that is, the position of the second header is shifted from the calculated position.
  • the mute processing is performed on the Zo-coded signal (S911). Further, the data read pointer is moved to the address A stored in the address storage means 808 so that the head of the next private header 405 is located (S912), and the decoding process is performed. to continue.
  • the address A is read from the address storage means 808, and the read pointers of the first header analysis means 105 and the decoding means 104 are moved to the next header and the head address of the frame, respectively (S91) 2>
  • the next private header 405 becomes the above-mentioned current private header 404, and the next private header is processed as the next private header. I do.
  • step S909 the content of the analyzed target data was compared with the content of the analyzed first header, and it was determined whether or not they matched.
  • the contents may be compared with the contents of Table 1 stored in advance.
  • the stream analyzing means 102 has a counter for counting from the detected header signal to the discontinuous explicit bucket, and furthermore, the address storage means 80 for calculating and holding the address A at the counted point.
  • the control means 107 moves the read pointer so that the next private header is located at the calculated address A.
  • the present invention realized by a computer program is stored on a magnetic disk.
  • a computer program is stored on a magnetic disk.
  • a recording medium such as a CD-ROM
  • the present invention is applicable to a reproducing apparatus and a reproducing method.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

エレメンタリストリームにおいて同期語やCRCが存在しないオーディオストリームを復号する際に、異音の発生を防ぐ。現フレームを復号する際に、次フレームのプライベートヘッダを解析し、次フレームのプライベートヘッダが不正であれば現フレームをミュートする。また、編集によって生じた不連続点においては、ストリーム解析手段によって通知される次フレームの先頭アドレスから復号を再開する。

Description

明 細 書 再生装置および再生方法 技術分野
本発明は、 フレーム化されたオーディオ信号を復号し、 再生するオーディオ再 生装置であって、 特に、 編集や通信エラーによってオーディオ信号の途中に不連 続点が存在する場合や、 属性が変化する場合に異音を発生しないことを特徴とす る再生装置および再生方法に関する。 背景技術
近年、 デジタル符号列として符号化されたオーディオ符号化信号を復号する再 生装置やコンピュータプログラムとして具現化される再生方法が普及している。 その多くの場合、 MP E G規格 (I S O 1 1 1 7 2— 3、 あるいは、 I S O 1 3 8 1 8 - 3 ) に代表されるように、 音声信号はオーディォ符号化信号としてフレ ーム化される。 各フレームには信号の属性情報を含むプライべ一トヘッダが付カロ される。 また、 オーディオ符号化信号にはエラーチェックのための C R Cのビッ トが付加され、 伝送路におけるデータの欠落や誤りが復号時に検出できる。
伝送路におけるデータの欠落が大きく、 データストリームが不連続になった場 合、 エラー訂正で回復することができない。 かかる不連続箇所をそのまま音声出 力すれば雑音が混じる。 この雑音を消すため、 ミュートを掛けることが望まれる。 従来の再生装置の一例が、 例えば、 特許文献 1 (特開 2 0 0 0— 2 5 9 1 9 5 号公報) に記載されている。 この従来の再生装置は、 不連続箇所を見つけるので はなく、 送信側からの設定変更、 例えばサンプリング周波数変更がストリームの 途中にあった場合、 かかる変更を検出し、 変更後一定期間、 音声出力にミュート をかけるものである。 これは、 変更があれば受信装置は、 変更後の設定に自動調 整する必要があり、 自動調整する期間は雑音が出ない様、 音声出力にミュートを かけるものである。 この従来の装置は、 正規のヘッダを検出し、 ヘッダ解析手段 によつて解析された 1つ前の正規のへッダに書かれたサンプリング周波数と、 現 在復号処理をしようとしている現在の正規のヘッダに書かれたサンプリング周波 数とを比較し、 現在のへッダに書力れたサンプリング周波数が変化した場合には、 変ィ匕した後のフレームについて一定時間のミュートを施し異音の発生を防ぐもの である。 例えば、 現在のヘッダに書かれたサンプリング周波数が変ィ匕した場合に は、 復号手段の後段に配置される D Aコンバータの設定の変更が必要となる。 D Aコンバータの設定の変更がなされている間は、 正し 、音声信号が生成されない ので、 雑音を含む音声信号となる。 そこで DAコンバータの設定の変更がなされる 一定期間、 出力音声をミュートする。 従って、 変更が書かれた現在のヘッダ以降 のフレームについてミュートがなされる。
また、 ヘッダの検出は、 へッダと同期して設けられた同期語を検出することに より、 行われる。
また、 同期語については特許文献 2 (特開 2 0 0 0— 3 1 9 4 2号公報) に記 載されている。
また、 特許文献 3 (特開平 1 0— 2 0 9 8 7 6号公報) は、 データ量の比較に より、 欠落データがある箇所を検出し、 ミュート処理を行うものが開示されてい る。 この特許文献 3に記載されている従来のビットストリーム再生装置は、 M P E G 1あるいは MP E G 2オーディォ規格で符号化されたオーディォストリーム を復号するものであって、 ストリームの一部が何らかの原因で欠損した場合に、 復号器のフレームバッファのアンダーフローを検出し、 ミユートを行うものであ る。 すなわち、 同期語を検出して、 正規のヘッダを見つけ、 正規のヘッダと正規 のヘッダの間のデータ量をカウンタで計測する。 計測したデータ量 Fが、 あらか じめ決められたデータ量よりも小さい場合は、 データの欠落があったものと判断 してミュート処理を行うものである。 発明の開示
(発明が解決しようとする技術的課題)
本願発明で扱うエレメンタリストリームには、 同期語が存在せず、 かつ、 C R Cのようなエラーチェックのためのビットが存在しない。 このようなエレメンタ リストリームを扱う場合、 どの様にして不連続個所をデコード前に見つけ、 また、 どのタイミングでミュートをかけるのかが、 角?決すべき課題となる。
上で説明した特許文献では、 以下の問題がある。
特許文献 1、 2は、 まず、 正規のヘッダを検出し、 正規のヘッダの情報を角军析 しているので、 ヘッダとヘッダとの間に生じる不連続箇所を見つけることができ ない。
特許文献 3も、 まず、 正規のヘッダを検出し、 正規のヘッダと次の正規のへッ ダとの間のデータ量を検出している。 正規のヘッダは、 同期語で見つけることが できるが、 同期語を有しないストリームを扱う本願発明では、 連続した 2つの正 規のへッダを見つけることができない。
また、 特許文献 1では、 ミュートをかけるタイミングは、 変更が検出されてか ら後のフレームである。 従って、 変更前に生じた不連続箇所のミュートを行うこ とはできない。
また、 特許文献 3では、 ミュートをかけるタイミングが示されていない。
(その解決方法)
本発明に係る再生装置は、 1つのフレームにオーディオ符号化信号と前記ォー ディォ符号化信号の属性情報で構成されるプライべ一トヘッダとを含むが、 同期 語を含まない下位レイヤーの第 2ストリームが、 検出可能なヘッダ信号を含む上 位レイヤーの第 1ストリームに包含されるデータを受け、 前記オーディオ符号化 信号を復号して音声を出力する再生装置であって、 前記第 1ストリームを解析し、 前記ヘッダ信号を検出すると共に、 検出したヘッダ信号を基準に、 前記第 2スト リームを解析して前記オーディォ符号化信号と前記ブラィべ一トへッダの位置情 報を出力するストリーム解析手段と、 前記ストリーム解析手段から出力される前 記オーディオ符号化信号と前記プライべ一トヘッダとを一時保存するデコード前 バッファメモリと、 前記デコード前バッファメモリから入力される前記オーディ ォ符号化信号を復号し音声を出力する復号手段と、 第 1フレームのプライベート ヘッダに含まれる属性情報を解析し、 プライべ一トヘッダの後に続く前記オーデ ィォ符号化信号のデータ長を表すデータ長情報を検出する第 1へッダ解析手段と、 第 1フレームのプライべ一トヘッダの位置情報に、 検出されたデータ長を加えて 得た位置から後にある所定量の標的データを解析し、 解析した標的データが、 第 2フレームのプライベートヘッダに含まれる属性情報である力否かを判断する第 2ヘッダ角军析手段と、 角军析した標的データ力 第 2フレームのプライベートへッ ダに含まれる属性情報でないと判断した場合は、 少なくとも第 1フレームのォー ディォ符号化信号について前記復号手段からの音声出力を停止する制御手段を具 備することを特徴とする再生装置で構成される。
また、 本発明に係る再生装置において、 前記第 2ヘッダ解析手段は、 前記標的 データの少なくとも 1部が、 前記第 1ヘッダ解析手段で解析された属性情報の少 なくとも 1部と一致するか否かを判断することを特徴とする構成でもよい。
また、 本発明に係る再生装置において、 前記第 2ヘッダ解析手段は、 前記標的 データの少なくとも 1部が、 あらかじめ保持された属性情報群のいずれかのもの の少なくとも一部と一致する力否かを判断することを特徴とする構成でもよい。 また、 本発明に係る再生装置において、 前記属性情報は、 前記オーディオ符号 化信号のサンプリング周波数、 チャンネル情報、 サンプルビット長、 オーディオ 符号化信号のデータ長の少なくとも一つであることを特徴とする構成でもよい。 また、 本発明に係る再生装置において、 前記ストリーム解析手段は、 前記へッ ダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、 前記へ ッダ信号に続く 1フレームのデータが、 検出したフレーム長データと等しくない 場合は、 前記フレームを破棄し、 次のフレームの解析を行うことを特徴とする構 成でもよい。
また、 本発明に係る再生装置は、 前記第 1ストリームは複数のバケツトで構成 され、 前記ストリーム解析手段は、 前記ヘッダ信号に含まれる前記パケットの長 さを表すパケット長データを検出し、 検出した 1パケットの長さが、 検出したパ ケット長データと等しくない場合は、 前記パケットを破棄し、 次のパケットの解 析を行うことを特徴とする構成でもよレ、。
また、 本発明に係る再生装置において、 前記第 1ストリームに不連続が生じた 箇所で、 不連続点明示パケットが揷入されると共に、 前記ストリーム解析手段は、 不連続点明示パケットを検出し、 前記デコード前バッファに出力した、 不連続点 明示パケット前のデータ量があらかじめ定義された所定のデータ量あるいはその 整数倍に満たない場合には、 前記デコード前バッファに対して不足分の補完デー タを出力することを特徴とする構成でもよい。
また、 本発明に係る再生装置において、 前記第 1ストリームに不連続が生じた 箇所で、 不連続点明示パケットが揷入されると共に、 前記ストリーム解析手段は、 検出したへッダ信号から不連続明示パケットまでをカウントするカウンタを備え、 更にカウントした点におけるァドレスを計算して保持するァドレス記憶手段を設 け、 前記制御手段は、 計算したアドレスに、 次のプライベートヘッダが位置する ように読み出しポインタを移動することを特徴とする構成でもよい。
また、 本発明に係る再生装置において、 前記デコード前バッファメモリと復号 手段の間に、 遅延手段を設けたことを特徴とする構成でもよい。
また、 本発明に係る再生方法は、 1つのフレームにオーディオ符号化信号と前 記オーディォ符号化信号の属性情報で構成されるプライベートヘッダとを含むが、 同期語を含まない下位レイヤーの第 2ストリームが、 検出可能なヘッダ信号を含 む上位レイヤーの第 1ストリームに包含されるデータを受け、 前記オーディォ符 号ィ匕信号を復号して音声を出力する再生方法であって、 前記第 1ストリ一ムを解 祈し、 前記ヘッダ信号を検出すると共に、 検出したヘッダ信号を基準に、 前記第 2ストリームを解析して前記オーディォ符号化信号と前記プライべ一トヘッダの 位置情報を出力するストリーム解析ステップと、 前記ストリーム解析ステップか ら出力される前記オーディォ符号化信号と前記プライベートヘッダとを一時保存 するステップと、 前記保持されたオーディォ符号化信号を復号し音声を出力する 復号ステップと、 第 1フレームのプライベートヘッダに含まれる属性情報を解析 し、 プライべ一トヘッダの後に続く前記オーディオ符号化信号のデータ長を表す データ長情報を検出する第 1ヘッダ解析ステップと、 第 1フレームのプライべ一 トへッダの位置情報に、 検出されたデータ長を加えて得た位置から後にある所定 量の標的データを解析し、 解析した標的データが、 第 2フレームのプライベート へッダに含まれる属性情報であるか否かを判断する第 2へッダ解析ステツプと、 解析した標的データが、 第 2フレームのプライベートへッダに含まれる属性情報 でないと判断した場合は、 少なくとも第 1フレームのオーディオ符号化信号につ 、て前記復号ステツプからの音声出力を停止する制御ステップを具備することを 特徴とする。 また、 本発明に係る再生方法において、 前記第 2ヘッダ解析ステップは、 前記 標的データの少なくとも 1部が、 前記第 1ヘッダ解析手段で解析された属性情報 の少なくとも 1部と一致するか否かを判断することを特徴とする。
また、 本発明に係る再生方法において、 前記第 2ヘッダ解析ステップは、 前記 標的データの少なくとも 1部が、 あらかじめ保持された属性情報群のいずれかの ものの少なくとも一部と一致する力否かを判断することを特徴とする。
また、 本発明に係る再生方法において、 前記属性情報は、 前記オーディオ符号 化信号のサンプリング周波数、 チャンネル情報、 サンプノレビット長、 オーディオ 符号化信号のデータ長の少なくとも一つであることを特徴とする。
また、 本発明に係る再生方法において、 前記ストリーム解析ステップは、 前記 へッダ信号に含まれる前記フレームの長さを表すフレーム長データを検出し、 前 記ヘッダ信号に続く 1フレームのデータが、 検出したフレーム長データと等しく ない場合は、 前記フレームを破棄し、 次のフレームの解析を行うことを特徴とす る。
また、 本発明に係る再生方法において、 前記第 1ストリームは、 複数のバケツ トで構成され、 前記ストリーム解析ステップは、 前記ヘッダ信号に含まれる前記 パケットの長さを表すパケット長データを検出し、 検出した 1パケットの長さが、 検出したパケット長データと等しくない場合は、 前記パケットを破棄し、 次のパ ケットの解析を行うことを特徴とする。
また、 本発明に係る再生方法において、 前記第 1ストリームに不連続が生じた 箇所で、 不連続点明示パケットが挿入されると共に、 前記ス トリーム解析ステツ プは、 不連続点明示パケットを検出し、 前記保持した不連続点明示パケット前の データ量が、 あらかじめ定義された所定のデータ量あるいはその整数倍に満たな い場合には、 前記デコード前バッフ了に対して不足分の補完データを出力するこ とを特徴とする。
また、 本発明に係る再生方法において、 前記第 1ストリームに不連続が生じた 箇所で、 不連続点明示パケットが挿入されると共に、 前記ストリーム解析ステツ プは、 検出したヘッダ信号から不連続明示パケットまでをカウントし、 更にカウ ントした点におけるァドレスを計算して保持するァドレス記憶ステップを設け、 前記制御ステップは、 計算したアドレスに、 次のプライベートヘッダが位置する ように読み出しボインタを移動することを特徴とする。
また、 本発明に係る再生方法において、 前記保持するステップと復号ステップ との間に、 オーディォ符号化信号を遅延する遅延ステップを設けたことを特徴と する。
また、 本発明は、 上記再生方法を、 コンピュータで実行させるためのプログラ ムである。
また、 本発明は、 上記再生方法を、 コンピュータで実行させるためのプロダラ ムを記録した、 コンピュータ読み取り可能な記録媒体である。
(従来技術より有効な効果)
本発明にかかる再生装置は、 エレメンタリストリームに同期語や C R Cのビッ 1、が存在しないオーディオストリームの復号時に、 編集による不連続点や伝送路 のエラーによるデータの欠落があつたとしても、 異音を発生することなく音声の 出力をすることが可能となる。 図面の簡単な説明
図 1は、 本発明の第 1の実施の形態におけるオーディォの再生装置の構成を示 すプロック図である。
図 2 Aは、 本発明の第 1の実施の形態におけるオーディォの再生方法を示すフ ローチャートである。
図 2Bは、 本発明の第 1の実施の形態におけるオーディォの再生方法を示すフ ローチャートである。
図 3は、 M P E G規格に基づいたストリームの構造を表わす図である。
図 4は、 トランスポートストリームバケツト単位で編集されたストリームの構 造を表わす図である。
図 5 Aは、 本発明の第 1の実施の形態におけるオーディォの再生装置の構成を 示すプロック図である。
図 5 Bは、 本発明の第 1の実施の形態におけるオーディオの再生装置の構成を 示すプロック図である。 図 6は、 本発明の第 2の実施の形態におけるオーディォの再生装置の構成を示 すプロック図である。
図 7 Aは、 本発明の第 2の実施の形態におけるオーディォの再生方法を示すフ ローチャートである。
図 7 Bは、 本発明の第 2の実施の形態におけるオーディオの再生方法を示すフ ローチャートである。
図 8は、 本発明の第 3の実施の形態におけるオーディォの再生装置の構成を示 すブロック図である。
図 9 Aは、 本発明の第 3の実施の形態におけるオーディォの再生方法を示すフ ローチャートである。
図 9 Bは、 本発明の第 3の実施の形態におけるオーディォの再生方法を示すフ ローチャートである。 発明を実施するための最良の形態
本発明の第 1の実施の形態について、 図 1、 図 2A、 図 2B、 図 3、 図 4、 図 5
A、 図 5 Bを用いて説明する。
図 1は、 本実施の形態の再生装置 1 0 1を表わすプロック図である。 また、 図 2 A、 図 2 Bは、 本実施の形態の再生方法の各ステップを表わすフローチャートで ある。 また、 図 3は入力されるストリームの構造を示す図であり、 M P E G規格 におけるトランスポートストリームと P E Sパケットと、 本発明によって異音発 生防止の効果が期待されるエレメンタリストリ一ムの構成を示す。 図 4は、 図 3 で説明しているトランスポートストリームがトランスポートバケツト単位で編集 され、 不完全な P E Sバケツトを含む場合を示す図である。
まず、 送信側において、 トランスポートストリーム 3 0 1が生成される過程を 簡単に説明する。 オーディオ信号は、 所定の符号化技術により、 オーディオ符号 化信号 3 0 8に変換され、 所定のバイト数毎 (960バイト毎、 または 1440バイト 毎) に切断され、 切断片の先頭に 4バイトのプライベートヘッダ 3 0 7が付与さ れる。 そのオーディオ符号化信号は、 圧縮処理されていない P CMデータである ものとする。 切断されたオーディオ符号化信号 3 0 8のそれぞれは、 およそ 5 msecの長さのオーディオ信号が含まれる。 プライベートヘッダ 3 0 7は、 オーデ ィォ符号化信号 3 0 8の属性情報を含み、 かつ、 同期語を持たない。 プライべ一 トヘッダ 3 0 7とそれに続くオーディオ符号化信号 3 0 8を合わせてオーディオ の 1フレームとし、 このようなフレームが連続して送られてくるストリームをェ レメンタリストリーム 3 0 6と言う。 属性情報には、 例えば、 サンプリング周波 数、 チャンネルアサイン、 サンプルのビット長、 オーディォ符号化信号 3 0 8の データ長の情報が含まれる。 これらの属性情報は、 属性 (サンプリング周波数、 チヤンネルアサイン情報、 サンプルのビット長、 オーディォ符号化信号 3 0 8の データ長) が変わらない限り、 変わらない。 従って、 属性情報が変わらない限り、 n番目 (nは、 正の整数) のフレームのプライベートヘッダ 3 0 7と、 (n+1)番目 のフレームのプライべ一トヘッダ 3 0 7は、 同じである。 通常は、 属性情報はほ とんど変わることがない。 放送システムが変わる場合、 または、 光ディスクに記 録された音声トラックが変わる場合、 変わることがある。 また、 属性情報の中に は、 変わる頻度が少ない (ゼロを含む) ものと、 多いものがある。 たとえ変わる 場合であっても、 予め決められた複数の選択肢のひとつに変わる。 例えば、 ォー ディォ符号化信号 3 0 8のデータ長は、 予め決められた選択肢である、 9 6 0ノ イ トや 1 4 4 0バイトのひとつに変わる。
この様にして作られたエレメンタリストリーム 3 0 6は、 1フレーム毎に分け られ、 9 6 4バイトまたは 1 4 4 4バイト長の PESペイロード 3 0 5として扱わ れる。 各 PESペイロード 3 0 5には PESヘッダ 3 0 4が加えられ、 一つの PESパケ ット 3 0 3が作られる。 PESバケツト 3 0 3は、 所定長毎 (例えば 1 8 8バイト 長毎または 1 8 4バイト長毎) に切断され、 切断片は、 一つのオーディオトラン スポートバケツト 3 0 2として扱われる。 オーディオトランスポートパケット 3 0 2は、 ビデオトランスポートパケットなどのその他のトランスポートパケット と混在して連結され、 トランスポートストリーム 3 0 1が生成される。 トランス ポートストリーム 3 0 1は、 送信局から放送される。 受信器は、 トランスポート ストリーム 3 0 1を受信し、 オーディォ再生装置 1 0 1で音声の再生を行う。 受 信したトランスポートストリーム 3 0 1は、 直接オーディォ再生装置 1 0 1に送 られても良いし、 一時的にどこかに記録し、 記録されたトランスポートストリー ム 301をオーディオ再生装置 101に送る様にしても良い。 後者の場合として、 トランスポートストリームの形式で記録再生装置により記録された音声が、 再生 のために再生装置 101に送られてくる場合や、 トランスポートストリームの形 式でディスク (例えば DVD) に記録された商用コンテンツが、 再生のために再生 装置 101に送られてくる場合がある。
以上より明らかなように、 本発明においては、 1つのフレームにオーディオ符 号化信号とオーディォ符号化信号の属性情報で構成されるプライベートヘッダと を含むが、 同期語を含まない下位レイヤーの第 2ストリーム (エレメンタリスト リーム) 1 検出可能なヘッダ信号 (PESヘッダ) を含む上位レイヤーの第 1 ストリーム (PESパケットで構成されるストリーム) に包含される構造のデー タを処理する。
受信したストリームは、 不連続検出部 100において、 ストリームの中のパケ ットまたはバケツ 1、の一部に不連続がないかどうか、 すなわちデータの一部が欠 落していないかどうかの検出がなされ、 不連続が検出されれば、 不連続明示パケ ット 401が if 入される。
オーディォ再生装置 101は、 オーディォのトランスポートパケット 302を 含むトランスポートストリーム 301が入力され、 復号され、 音声信号を出力す るものである。 再生装置 101に入ったトランスポートストリーム 301は、 ス トリーム解析手段 102に入力される (S 201) 。 ストリーム解析手段 102 はトランスポートストリーム 301を解析し、 オーディオのトランスポートパケ ット 302を抜き出してオーディォ P E Sパケット 303を構成し、 さらにォ一 ディォ PESパケット 303を解析する (S 202) 。
図 3に示すように、 ストリーム解析手段 102は、 トランスポートパケットの 内、 オーディオトランスポートパケット 302のみを抽出し、 PESパケット 3 03のストリームを作る。 PESヘッダ 304には PESペイロード 305のデ ータ長が含まれている。 ストリーム解析手段 102は、 PESヘッダ 304が検 出されれば、 PESヘッダ直後から、 すなわち、 PESペイロードの先頭から力 ゥントを開始し、 次のパケット ( P E Sパケットまたは後で説明する不連続点明 示パケット〉 が見つかればカウントを終了する。 データに不連続がなければ、 力 ゥント値は、 PESペイロード 305のデータ長に等しい。 カウント値を、 PE Sヘッダに含まれていたデータ長と比較し、 カウント値があらかじめ定義された 正規の値と一致するかを判断する (S 203) 。 一致しない場合、 すなわち前記 値が不正である場合 (S 203の不正) には現在解析している PESパケットを 破棄し、 次の PESパケットの解析に移る。 前記 PESペイロードのデータ長と は、 あらかじめ規格で定義された数種類の長さのいずれかであり、 例えば、 96 4バイト、 1444バイトのいずれかである。
一方、 前記値が正規である場合 (S 203の正規) には、 PESペイロード 3 05からプライべ一トヘッダ 307およびオーディオ符号化信号 308を抽出し、 デコード前バッファメモリ 103に格納する (S 204) 。 ここで PESペイ口 ード 305はオーディオのエレメンタリストリーム 306とも呼ぶ。 また、 プラ ィペートヘッダ 307はオーディオ符号化信号 308の属性情報を含み、 かつ、 同期語を持たないものである。 プライべ一トヘッダ 307の検出は、 たとえば P ESヘッダ 304の検出から、 所定時間の遅延により検出する。 図 3に示す例に あっては、 プライべ一トヘッダ 307は、 PE Sヘッダ 304の直後に位置して いる場合を示しているが、 プライベートヘッダ 307は、 PESヘッダ 304の 終端から所定量後に位置するように配置することも可能である。 この場合は、 E P Sヘッダに、 所定量の情報を持たすようにすればよい。
以上より明らかなように、 ストリ—ム解析手段 102は、 第 1ストリームであ る PESパケットを含むストリ一ムを解析し、 へッダ信号すなわち P E Sヘッダ を検出すると共に、 検出したヘッダ信号を基準に、 第 2ストリームであるエレメ ンタリストリームを解析して前記オーディオ符号化信号と前記プライべ一トへッ ダの位置情報を出力することを目的とするものである。
ここで、 オーディオ再生装置 101に入力されるのはトランスポートストリー ム 301であるとしたが、 これに限るものではなく、 オーディオ PESパケット 303が入力されてもよい。 その場合も、 ストリーム角罕析手段 102はエレメン タリストリーム 306であるところのプライべ一トヘッダ 307とオーディオ符 号化信号 308をデコード前バッファメモリ 103に格納する。 なお、 図 2 Aに おいては、 フローを見やすくするために、 トランスポートストリーム 301の解 析と P E Sバケツト 3 0 3の解析を 1つのステップ S 2 0 2で表わしている。 デコード前バッファメモリ 1 0 3から出力されるオーディォ符号化信号 3 0 8 は、 第 1ヘッダ解析手段 1 0 5、 第 2ヘッダ解析手段、 フレーム遅延手段 1 1 1 に入力される。 フレーム遅延手段 1 1 1は、 送られてきたオーディオ符号化信号 3 0 8を少なくとも 1フレーム遅延させ、 復号手段 1 0 4に送る。
第 1のへッダ解析手段 1 0 5はデコード前パッファメモリ 1 0 3に格納された 第 1のフレームのプライベートヘッダ 3 0 7を検出し、 読込み、 プライベートへ ッダ 3 0 7に含まれる情報を解析して制御手段 1 0 7に出力する (S 2 0 5 )。 プライベートヘッダ 3 0 7の検出は、 たとえばストリーム解析手段 1 0 2で検出 した P E Sヘッダ 3 0 4のタイミングから、 所定時間後のタィミングで行う。 プ ライべ一トヘッダ 3 0 7に含まれる情報とは、 オーディォ符号化信号の属性情報 であり、 例えば、 サンプリング周波数とチャンネルアサイン情報とサンプルのビ ット長とオーディォ符号化信号 3 0 8のデータ長である。 属性情報の一部あるい は全部が、 制御手段 1 0 7に出力される。
第 1ヘッダ解析手段 1 0 5は、 n番目のプライべ一トヘッダ 3 0 7 ( 4バイ ト) を検出し、 検出した n番目のプライベートヘッダ 3 0 7を制御手段 1 0 7に 送る。 制御手段 1 0 7は、 n番目のプライベートヘッダ 3 0 7の情報 (サンプリ ング周波数、 チャンネルアサイン情報、 サンプルのビット長、 オーディオ符号化 信号 3 0 8のデータ長) の全てまたは一部をプライべ一トヘッダメモリ 1 1 0に 保持する。 更に、 第 1ヘッダ解析手段 1 0 5は、 検出した n番目のプライベート ヘッダ 3 0 7の先頭から 1フレームに相当する時間 T f をカウントし、 トリガ信 号を第 2ヘッダ解析手段 1 0 6に送る。 なお、 1個のフレームの代わりに、 m個 (mは 1より大きい正の整数) のフレームをカウントしてトリガ信号を出力する ようにしてもよい。 時間 T f は、 属性情報のひとつであるオーディオ符号化信号 3 0 8のデータ長にプライベートヘッダ長 (4バイト) を加算すれば求まる。 こ こでのカウントは、 プライベートへッダ 3 0 7の終端からオーディォ符号化信号 3 0 8のデータ長をカウントしてもよい。
以上より明らかなように、 第 1ヘッダ角军析手段 1 0 5は、 第 1フレームのブラ ィベートヘッダに含まれる属性情報を解析し、 プライべ一トヘッダの後に続くォ 一ディォ符号化信号のデータ長を表すデータ長情報を検出することを目的とする ものである。
第 2ヘッダ解析手段 1 0 6は、 トリガ信号に応答して、 デコード前バッファメ モリ 1 0 3から出力されるエレメンタリストリームの一部のデータ(4バイト)、 すなわち標的データを読み取る。 オーディオ符号化信号に不連続がなければ、 読 み取った標的データは、 (n + 1 ) 番目のプライベートヘッダに相当する。 n番 目のフレームデータに不連続があれば、 読み取つた標的データは、 ( n + 1 ) 番 目のプライベートヘッダではないので、 (n + 1 ) 番目のプライベートヘッダを 正しく読み取れない。
第 2へッダ解析手段 1 0 6は、 読み取った 4バイトの標的データと、 プライべ
―トヘッダメモリ 1 1 0に保持したプライベートへッダを比較し、 同じであれば、
( n + 1 ) 番目のプライベートヘッダが正しい位置に存在していると判断し、 す なわち n番目のフレームが過不足なく存在すると判断する。 この判断に基づき、 制御手段 1 0 7は、 音声のデコードを行う。
ところが、 第 2ヘッグ解析手段 1 0 6は、 標的データが、 プライべ一トヘッダ メモリ 1 1 0に保持したプライベートヘッダと一致しなければ、 (n+ 1 ) 番目 のプライべ一トへッダが正しい位置に存在していなレ、と判断し、 この場合はォ一 ディォ符号化信号に不連続があり、 音声データが欠落していると判断される。 こ の場合、 制御手段 1 0 7は、 n番目のプライべ一トヘッダに続くオーディォ符号 化信号をミュートするため、 復号手段 1 0 4に対し、 ミュート信号を出力する。 フレーム遅延手段 1 1 1を設けたので、 ミュート信号が出力される時点は、 復号 手段 1 0 4により、 n番目のプライベートヘッダに続くオーディォ符号化信号に ついて、 音声出力がなされる直前となる。 したがって、 復号手段 1 0 4は、 n番 目のプライべ一トヘッダに続くオーディオ符号化信号をミュートし、 音声出力を 停止するように指示する。 ミュート信号は、 1フレーム期間をミュートする信号 となっている。 従って、 (n + 1 ) 番目のプライベートヘッダに続くオーディオ 符号化信号から音声の再生出力を行う。
以上より明らかなように、 第 2ヘッダ解析手段 1 0 6は、 第 1フレームのブラ ィベートヘッダの位置情報に、 検出されたデータ長を加えて得た位置から後にあ る所定量の標的データを解析し、 解析した標的データが、 第 2フレームのプライ ペートヘッダに含まれる属性情報である力否かを判断することを目的とする。 なお、 標的データが、 第 2フレームのプライベートヘッダに含まれる属性情報 であるか否かの判断は、 標的データの少なくとも 1部が、 第 1ヘッダ解析手段 1 0 5で解析された属性情報の少なくとも 1部と一致する力否かを判断するように してもよい。
ここで、 ミュート信号は、 複数フレーム期間、 例えば 2フレーム期間をミュー トする信号であっても良い。 2フレーム期間をミュートする信号であれば、 (n + 1 ) 番目のプライベートヘッダに続くオーディオ符号化信号もミュートし、 音 声出力を停止するように指示し、 ( n + 2 ) 番目のプライベートヘッダに続くォ 一ディォ符号化信号から音声の再生出力を行うこととなる。 また、 プライベート ヘッダメモリ 1 1 0は、 第 1ヘッダ解析手段 1 0 5に設けるようにしてもよい。 言うまでもなく、 第 1へッダ解析手段 1 0 5の代わりに、 制御手段 1 0 7がァ ドレスの算出を行ってもよい。
第 2のへッダ解析手段 1 0 6は第 1のへッダ解析手段 1 0 5と同様にプライべ ートヘッダ 3 0 7を解析してそこに含まれる情報を制御手段 1 0 7に出力するも のである ( S 2 0 7 )。 第 2のヘッダ解析手段 1 0 6が第 1のヘッダ解析手段 1 0 5と異なるのは、 第 1へッダ角军析手段 1 0 5力 らのトリガ信号によって、 デー タの読み取りがなされる点と、 第 1のへッダ解析手段 1 0 5が解析したプラィベ 一トヘッダよりも後の時刻のフレーム、 例えば、 次のフレームのプライべ一トへ ッダを解析する点である。 つまり、 後述する復号手段 1 0 4で復号する現フレー ムの次のフレームのプライべ一トヘッダを解析する。
復号手段 1 0 4は、 デコード前バッファメモリ 1 0 3から出力され、 一定時間 遅延されたオーディオ符号化信号 3 0 8を読み出し、 音声を出力するものである ( S 2 0 9 ) 。 復号手段 1 0 4は制御手段 1 0 7によって、 復号の開始や停止、 あるいは、 ミユート処理など音声の出力に関わる制御を受ける。
制御手段 1 0 7は、 第 1のへッダ解析手段 1 0 5および第 2のへッダ解析手段 1 0 6より、 現フレームおよび次フレームのプライベートヘッダに含まれる情報 をそれぞれ受け取り、 それらの情報を互いに比較し (S 2 0 8 ) 、 異なるものが あれば復号手段 1 0 4にミュートを指示する (S 2 1 0 ) 。
なお、 本実施の形態における再生装置および再生方法は、 第 1のフレームのォ 一ディォ信号を出力した後、 次のフレームの復号を行うために、 デコード前バッ ファメモリにオーディォ符号化信号の 1フレームよりも充分に多い所定量のデー タがたまっているかを判定し (S 2 1 1 ) 、 たまっていれば第 1のヘッダ解析手 段 1 0 5による第 1のフレームの属性情報の解析 ( S 2 0 5 ) の処理へ戻り、 復 号を続ける。 デコード前バッファメモリに所定量のデータがたまっていない場合 には、 外部からストリームを入力し (S 2 0 1 ) 、 上述したストリーム解析手段 1 0 2によるストリームの解析 ( S 2 0 2 ) 以後の処理を行う。
さて、 トランスポートストリーム 3 0 1がトランスポートパケット単位で編集 された場合について、 図 4を参照しながら説明する。 オーディオ再生装置 1 0 1 に入力されるトランスポートストリームの編集などによって不連続が生じた場合 には、 不連続検出部 1 0 0において、 不連続点が検出された箇所に不連続点明示 バケツト 4 0 1が挿入される。 ストリーム解析手段 1 0 2は前述したように入力 されたストリームを解析し ( S 2 0 2 ) 、 オーディオのエレメンタリス トリーム をデコード前バッファメモリ 1 0 3に格納する (S 2 0 4 ) 。 ここで、 不連続点 明示バケツト 4 0 1があれば、 ストリームから抽出されたオーディオ符号化信号 は、 データの後半部分が欠落した不完全なオーディオ符号化信号 4 0 3となる。 第 1へッダ解析手段 1 0 5は、 現プライベートへッダの終端位置のァドレスに、 第 1ヘッダ解析手段 1 0 5に含まれる本来のオーディオ符号化信号のデータ長を 加算してアドレス B ( 4 0 7 ) を算出する ( S 2 0 6 ) 。 不完全なオーディオ符 号化信号 4 0 3が存在するため、 このァドレス Bは、 実際の次プライベートへッ ダのァドレスであるァドレス A ( 4 0 6 ) よりも先に進んだ点になる。 第 1へッ ダ解析手段 1 0 5は、 アドレス Bのタイミングでトリガ信号を生成する。 第 2へ ッダ解析手段 1 0 6は、 トリガ信号に応答してァドレス Bの時点から所定量 ( 4 バイト) のデータを読み取り、 次プライベートヘッダであると予測して、 プライ ペートヘッダ解析の処理を行う (S 2 0 7 ) 。 アドレス Bから所定量に格納され ているのはオーディオ符号化信号の一部あるいはプライべ一トヘッダの一部とォ 一ディォ符号化信号の一部のデータであるので、 正しい解析を行うことができな い。 したがって、 第 2ヘッダ解析手段 1 0 6の解析結果の情報は、 第 1ヘッダ解 析手段 1 0 5で取得し、 プライべ一トヘッダメモリ 1 1 0で保持された属性情報 と一致せず、 不一致情報が生成される。 オーディオ符号化信号が P CMデータで あれば、 偶然に第 1のフレームのプライべ一トヘッダに一致する可能性がある力 その可能性は極めて低い。
生成された不一致情報に基づき、 現プライべ一トヘッダ 4 0 4に関連する現フ レームを復号手段 1 0 4から出音する前にミュートする (S 2 1 0 ) 。 これによ り、 不完全なオーディオ符号化信号 4 0 3と、 必要であればそれに続く次のフレ ームのオーディォ符号化信号を復号おょぴ出力せず、 異音の発生を防ぐことが可 能となる。
なお、 制御手段 1 0 7による別の判定方法について、 図 5 A、 図 5 Bを用いて説 明する。 プライベートヘッダメモリ 1 1 0は、 検出したプライべ一トヘッダに含 まれる属性情報 (サンプリング周波数、 チャンネルアサイン情報、 サンプルのビ ット長、 オーディオ符号化信号 3 0 8のデータ長) を保持するのではなく、 変形 も含めた選択可能な属性情報群のすべてをあらかじめ保持する。 すなわち、 ブラ ィペートヘッダメモリ丄 1 0は、 たとえば次の表 1の情報を記録する。
Figure imgf000018_0001
実際に、 プライベートヘッダに含まれている情報は、 aの列からひとつ、 の 列からひとつ、 cの列からひとつ、 dの列からひとつの情報であり、 たとえば、 ( a 2 , b l , c l , d 2 ) の情報を含んでいる。
制御手段 1 0 7は、 現プライベートヘッダで検出した属性情報と、 プライべ一 トヘッダメモリ 1 1 0にあらかじめ保持された属性情報群 (表 1のデータ) とを 比較し、 メモリ 1 1 0に、 検出した属性情報と一致する情報が含まれているかど うかを判定する (S 5 0 7 ) 。 すなわち、 検出した属性情報 ( a 2 , b l, c 1 , d 2 ) の全てがメモリ 1 1 0に保持された属性情報群の中に含まれていれば、 全 て正規の情報であると判断する一方、 検出した属性情報 (x x, b 1 , c 1 , d 2 > (ここで X Xは分析不能な情報を示す) のいずれかひとつに、 メモリ 1 1 0 に保持された属性情報群に含まれていないものがあれば、 プライべ一トヘッダは 不正な情報であると判断する。
次に、 現プライベートヘッダの終端からオーディオ符号ィヒ信号 3 0 8のデータ 長後にある 4バイトの標的データ、 すなわち次プライベートヘッダがあるべき箇 所から検出した属性情報と、 あらかじめ保持された属性情報とを比較し、 上述と 同様の判定をする (S 5 0 8 ) 。 2つの検出した属性情報のいずれも、 あらかじ め保持された属性情報と一致する情報が含まれている場合はオーディオを再生す る (S 5 0 9 ) —方、 2つの検出された属性情報のいずれかに、 あらかじめ保持 された属性情報と一致しない情報が含まれている場合には復号手段 1 0 4にミュ 一トを指示する ( S 5 1 0 ) 。 なお、 図 5 Aではフ口一を見やすくするために、 図 2 Aを用いて説明した P E Sペイロード長が正規であるか否かの判定ステップ (S 2 0 3 ) を省略しているが、 ストリーム解析 ( S 5 0 2 ) の後で同様の判定 を行っても良いのは言うまでも無い。 また、 ミュートを行うべきかどうかは、 次 プライべ一トヘッダが正しい位置にあるかどうかを判断すればよいので、 判定ス テツプ S 5 0 7を省略し、 次プライべ一トヘッダについてのみ、 属性情報を検出 し、 あらかじめ保持された属性情報と一致する情報が含まれているかどう力を判 定する (S 5 0 8 ) ようにしてもよい。 現プライベートヘッダを検出し、 角军析す るのは、 次プライべ一トヘッダまでカウントするための起算点と、 次プライべ一 トへッダまでの間隔とを得るためである。 また、 次プライベートヘッダを解析す るのは、 次プライベートヘッダであるとして検出したデータが、 正規のプライべ 一トヘッダであるかどうかの判断をするためである。
以上より明らかなように、 第 2ヘッダ解析手段は、 標的データが、 第 2フレー ムのプライべ一トヘッダに含まれる属性情報であるか否かの判断を行うが、 この 判断は、 前記標的データの少なくとも 1部が、 あらかじめ保持された属性情報群 のいずれかのものの少なくとも一部と一致するか否かの判断を行うようにしても よい。
表 1に示す属性情報群をあらかじめ保持しておけば、 属性情報が許容された範 囲内で変更された場合、 誤った属性情報であるとの判断を避けることができる。 なお、 一般にフレーム化されたオーディオストリームのプライべ一トヘッダ 3 0 7はその後に続くオーディオ符号化信号 3 0 8の属性情報を含むものであるの で、 ストリームの最終フレームにおいては、 第 2のへッダ解析手段で解析すべき データが存在しない場合がある。
このような場合には、 ストリーム解析手段 1 0 2がストリームの終端にあらか じめ定義された特定のダミーデータ、 たとえば表 1の代表的な属性情報の組み合 わせ (a l , b 1 , c l , d 1 ) を付加する。 制御手段 1 0 7は、 第 2のヘッダ 解析手段 1 0 6によって取得した次フレームの属性情報が全て前記あらかじめ定 義されたビット列に一致すれば復号手段 1 0 4に対してミュートの指示をしない ということにすればよい。 これは、 入力されるストリームの終端において、 第 2 のヘッダ解析手段 1 0 6が解析すべきァドレスにデ一タが存在せず、 復号手段が デコード前バッファメモリ 1 0 3からデータを読み出す際にアンダーフロ一が発 生した場合、 第 2のヘッダ解析手段 1 0 6が何ら情報を取得できなくなるのを回 避するために有効な制御である。 つまり、 ストリーム解析手段 1 0 2が、 あらか じめ定義された正規の属性情報で構成されるプライべ一トヘッダを付加すること により、 アンダーフローを回避し、 最終フレームを復号処理して出力することが 可能となる。 あらかじめ定義された属性情報とは、 例えば、 サンプリング周波数 は 4 8 k H zのみ、 また、 サンプルのビッ ト長は 1 6ビット、 2 0ビットあるい は 2 4ビットのいずれか、 また、 チャンネルアサイン情報とはモノラル、 デュア ルモノラルあるいはステレオのいずれか、 また、 オーディォ符号化信号のデータ 長は 9 6 0バイトあるいは 1 4 4 0バイトのいずれかであるというような.もので あり、 また、 終端に付加される特定のビット列とは、 以上の属性情報を表わすビ ット列と異なるものを定義すればよい。 また、 終端に付加する特定のビット列は、 前記あらかじめ定義された正規の属性情報で構成されていても良い。
以上により、 本実施の形態では、 第 1のフレームのプライベートヘッダと第 2 のフレームのプライべ一トヘッダの間のデータである第 1のフレームのオーディ ォ符号化信号の一部がストリームの転送エラーなどにより欠損している場合にお いても、 第 1のフレームのオーディオ符号化信号をミュートすることにより、 異 音の発生を防止することが可能となる。
次に、 本発明の第 2の実施の形態について、 図 6および図 7 A、 図 7Bを用いて 説明する。
第 2の実施の形態が第 1の実施の形態と異なるのは、 バケツト長カウント手段 608を備えている点である。 バケツト長カウント手段 608は、 デコード前バ ッファメモリ 103に格納するデータ量を逐次カウントし (S 705) 、 カウン トした PESペイロードのデータ量が第 1の所定の長さに満たない場合 (S 70 6の N) にはストリーム入力 (S 701) のステップへ戻る。 第 2の実施の形態 では、 トランスポートストリーム TSおよび PE Sヘッダの解析 (S 702) 後 に不連続点明示パケットがあるかどうかを判定する (S 703) 。 不連続点明示 パケットがあった場合 (S 703の Y) 、 デコード前バッファ 103へのエレメ ンタリストリームの格納量が第 2の所定の長さの整数倍であるかを判定する (S 707) 。 整数倍でない場合には整数倍になるように特定の長さの補完データを デコード前バッファに格納し(S 708) 、 パケット長カウント手段をリセット し (S 716) 、 ストリーム入力ステップ (701) へ戻る。 不連続点明示パケ ットがなかった場合 (S 703の N) 、 デコ一ド前バッファ 103へのエレメン タリストリームの格納が行われ (S 704) 、 パケット長カウント手段 608は、 格納したデータ量をカウントする (S 705) 。
バケツト長カウント手段 608は、 ストリーム解析手段 102がオーディオの PE Sパケットのヘッダ(以下、 PESヘッダ)を検出し (S 702) 、 次の PE Sヘッダを検出するまでデコ一ド前バッファメモリ 103に格納するデータ量、 すなわち PE Sペイロード長をカウントする (S 705)。
ストリーム解析手段 102は、 トランスポートストリーム TSまたは PESへ ッダの解析中に不連続点明示パケットを検出し (3703の ) 、 その時点でデ コ一ド前バッファ 103へのデータ格納量が第 2の所定の長さの整数倍になって いるかどうかを判定する (S 707) 。 前記判定 (S 707) が偽の場合、 デコ ード前バッファ 103へのデータ 納量が第 2の所定の長さの整数倍となるよう に補完データをデコード前バッファに格納する (S 708) 。 次に、 パケット長 カウント手段 608のカウンタはリセットされ (S 716) 、 ストリーム入力
(S 701) へと処理が戻る。 また、 ストリーム入力 (S 701) へ処理が戻る 際に、 デコード前バッファメモリ丄 03における、 第 1のヘッダ解析手段 105 の読出しアドレスを、 前記捕完データを格納したアドレスの次のアドレス、 すな わち、 不連続点明示バケツト後のデータの先頭が格納されるアドレスへ移動する。 ここで、 あらかじめ定義された第 1の所定の長さとは、 たとえば、 4バイトの 第 1のプライべ一トヘッダと、 960パイトまたは 1440バイトのオーディオ 符号化信号と、 4バイトの第 2のプライべ一トヘッダによって構成されるデータ 量であり、 すなわち、 968バイトまたは 1448バイトである。
また、 第 2の所定の長さとは、 第 1のヘッダ解析手段 105、 第 2のヘッダ解 析手段 106および複合手段 104がデコード前バッファメモリ 103に格納され ているデータを読み出す際にアクセスできるデータの最小単位 (通称:ワード)の ことであり、 たとえば 4バイトである。
デコード前バッファメモリ 103から出力されるエレメンタリストリームは、 上述と同様にして第 1ヘッダ解析手段 105で解析され (S 709) 、 第 2へッ ダの位置が算出される (S 710) 、 第 2ヘッダの位置にある標的データ (第 2 へッダであると予測されるデータ) が解析される ( S 711 ) 。 解析された標的 データの内容が、 第 1へッダの内容と比較され、 一致するかどうかの判断がなさ れる (S 712) 。 同一であれば、 標的データの内容が、 正規の第 2ヘッダであ ると判断され、 オーディオ再生がなされる (S 713) 。 第 2ヘッダの内容が 1 箇所でも、 第 1へッダの内容と異なつていれば、 標的データの内容は、 正規の第 2ヘッダではない、 すなわち、 第 2へッダの位置が算出した位置とズレた位置に あると判断され、 第 1の実施の形態と同様にして、 第 1ヘッダの後の続くオーデ ィォ符号化信号についてミュート処理を行う (S 714) 。 その後、 デコード前 バッファメモリ 103に所定量 (第 1の所定の長さ以上) のデータが格納されて いるかどうかが判断され (S 715) 、 格納されていればステップ S 709に戻 り、 格納されていなければステップ S 701に戻る。
ステップ S 712での判断は、 解析した標的データの内容と、 解析された第 1 ヘッダの内容とが比較され、 一致するかどう力の判断がなされたが、 解析した標 的データの内容と、 あら力 じめ保持された表 1の内容と比較する様にしても良い。 これにより、 トランスポートバケツト単位でストリームが編集された場合にお いても、 後半のデータが欠落した P E Sペイロードすなわち不完全なオーディオ のプライベートヘッダおよびオーディォ符号化信号がデコードされることが無い ので、 編集点前の不完全なオーディオ符号化信号およびそれに続くデータが復号 手段 1 0 4に入力されて異音を発生することを防ぐことが可能となる。
なお、 不完全なオーディオ符号化信号が復号手段 1 0 4によって復号されない のであれば、 第 2のヘッダ解析手段 1 0 6による次フレームのヘッダ解析 ( S 7 1 1 ) および制御手段 1 0 7における次フレームの属性情報の確認 ( S 7 1 2 ) は本来必要無いが、 現実においては、 ストリーム解析手段 1 0 2とデコード前バ ッファメモリ 1 0 3の間のデータ転送におけるデータの欠落を検出したり、 その 他の要因で元々不正なオーディオ符号化信号が正しいバケツト長で P E S化され て入力されるような場合にも異音発生を防止するために、 第 2のヘッダ解析手段 1 0 6を実装する。
また、 第 2の実施の形態におけるストリーム解析手段 1 0 2の別の制御として、 ストリーム解析手段 1 0 2は、 パケット長カウント手段 6 0 8によってカウント されたパケット長が、 特定のデータ長の整数倍にならない場合 (S 7 0 7の N) には、 特定のデータ長の整数倍になるよう不足分のデータを付加する ( S 7 0 8 ) ことによってワードァライメントを行い、 それをデコード前バッファメモリ
1 0 3に格納する。 一般に、 復号手段 1 0 4および第 1のヘッダ解析手段 1 0 5 および第 2のへッダ解析手段 1 0 6がデコード前バッファメモリ 1 0 3からデー タを読み出す際には、 あらかじめ決められたワード単位で読み出すこととなる。 例えば、 4バイトを 1ワードとしてデータを読み出す。
トランスポートパケット単位の編集が行われた場合、 一般に、 編集点のァドレ スは 4バイト単位ではなく、 編集点後のフレームはその後ワードァラインされな いままデコード前バッファメモリに格納される。 この場合、 第 1のヘッダ解析手 段 1 0 5およぴ第 2のヘッダ解析手段 1 0 6が読み出す編集点後のプライべ一ト へッダ近傍のデータは 1乃至 3バイトずれ、 制御手段 1 0 7は正しい属性情報を 取得できなくなってしまう。 なぜなら、 本実施の形態において対象としているェ レメンタリデータには同期語が存在しないため、 この 1乃至 3パイトのデータの ずれを第 1のへッダ解析手段 1 0 5あるいは第 2のへッダ解析手段 1 0 6が検出 して読み出し位置を修正することは不可能だからである。 よって、 ストリーム解 析手段 1 0 2がデコード前バッファメモリ 1 0 3にデータを格納する際に捕完デ —タを格納する (S 7 0 8 ) ことにより、 編集点後の復号および出音が可能とな る。
以上の処理をまとめたのが図 7 A、 図 7 Bであり、 まず、 P E Sパケット解析中 に不連続点明示バケツト 4 0 1を検出した場合には、 処理は P E Sパケット解析 ステップ ( S 7 0 2 ) に戻る。 また、 デコード前バッファメモリへ格納した P E Sパケットのデータ量が第 1の所定の長さ、 すなわち、 エレメンタリストリーム 3 0 6の 1フレーム長の整数倍に一致しない場合 (3 7 0 6の1^) は、 ストリー ム入力ステップ ( S 7 0 1 ) に戻る。 また、 デコード前バッファに格納したデー タ量が第 2の所定の長さの整数倍に一致しない場合 (3 7 0 7の^0 には、 補完 データをデコード前バッファに格納して (S 7 0 8 ) 、 デコード前バッファに格 納されたデータへアクセスするためのポインタをワードァラインする。
以上にように、 本発明によって、 ストリームの不連続点をストリーム解析手段 で検出し、 異音の発生を防止することが可能となる。 また、 不連続点においてヮ 一ドアラインを行うことにより、 不連続点後の復号およびオ^ "ディォの再生が可 肯 gとなる。
なお、 図 7 Aではフローを見やすくするために、 図 2Aを用いて説明した P E S ペイロード長が正規である力 >否かの判定 (S 2 0 3〉 を省略しているが、 ストリ ーム解析 ( S 7 0 2 ) の後で同様の判定を行っても良いのは言うまでも無い。 次に、 本 明の第 3の実施の形態について、 図 8、 図 9 A、 図 9 Bおよび図 4を 用いて説明する。 第 3の実施の形態においては、 編集点後の出音の再開を実現す る例について説明する。
第 3の実施の形態が第 1の実施の形態あるいは第 2の実施の形態と異なるのは、 ストリーム解析手段 1 0 2がデコード前バッファメモリ 1 0 3に格納するプラィ ベートヘッダのァドレスを記憶する (S 9 0 4 ) ァドレス記憶手段 8 0 8 (図 8) を備えた点である。
ストリームが入力され (S 901) 、 トランスポートストリーム TSおよび P ESヘッダの解析がなされる (S 902)。 PESヘッダの解析し、 次の PES へッダの検出中に、 不連続点明示パケット 401であるかどうかの判断がなされ る (S 903 ) 。 不連続点明示バケツト 401が見つかった場合はステップ S 9 04に進む一方、 不連続点明示パケット 401を見つけることなく次の P E Sへ ッダが見つかった場合 (または前の P E Sヘッダから所定量のカウントが終わつ た場合) は、 ステップ S 905に進む。 ステップ S 905ではエレメンタリスト リームをデコード前バッファメモリ 103に格納する。
ここでステップ S 903、 S 904について、 図 4を用いて説明する。 ステツ プ S 903で、 ストリーム解析手段 102は、 P E Sへッダを検出し、 解析する。 ストリーム解析手段 102に設けたカウンタは、 PESヘッダの終端からカウン トを開始し、 次のパケット (データに不連続が生じている場合は、 不連続点明示 パケット、 データに不連続が生じていない場合は次の PESパケット) が見つか るまでカウントする。 P E Sへッダを解析したときに、 PESヘッダに続く PE Sペイロードのデータ長を検出し、 そのデータ長をカウントする様にしても良い。 そして、 カウントが終了した点でのアドレス Aを算出する。 このアドレス Aをァ ドレス記憶手段 808に記憶する (S 904) 。 即ち、 アドレス記億手段 808 には編集点後の先頭のプライべ一トヘッダの先頭ァドレスが格納される。
デコード前バッファメモリ 103から出力されるエレメンタリストリームは、 上述と同様にして第 1ヘッダ解析手段 105で解析され (S 906) 、 第 2へッ ダの位置が算出される (S 907) 、 第 2ヘッダの位置にある標的データ (第 2 ヘッダであると予測されるデータ ) が解析される (S 908) 0 解析された標的 データの内容が、 第 1ヘッダの内容と比較され、 一致するかどうかの判断がなさ れる (S 909) 。 同一であれば、 標的データの内容が、 正規の第 2ヘッダであ ると判断され、 オーディオ再生がなされる (S 910) 。 第 2ヘッダの内容が 1 箇所でも、 第 1ヘッダの内容と異なっていれば、 標的データの内容は、 正規の第 2ヘッダではない、 すなわち、 第 2ヘッダの位置が算出した位置とズレた位置に あると判断され、 第 1の実施の形態と同様にして、 第 1ヘッダの後の続くオーデ ィォ符号化信号についてミュート処理を行う (S 9 1 1 ) 。 更に、 前記アドレス 記憶手段 8 0 8に格納されているアドレス Aに、 次のプライベートヘッダ 4 0 5 の先頭が位置するように、 データ読出しポインタを移動し (S 9 1 2 ) 、 デコー ド処理を続ける。 すなわち、 ァドレス Aをァドレス記憶手段 8 0 8から読みだし、 次のヘッダおよびフレーム先頭ァドレスへ第 1のヘッダ解析手段 1 0 5および復 号手段 1 0 4の読出しポインタをそれぞれ移動する (S 9 1 2〉 。 このデータ読 出しポインタの移動により、 次のプライベートヘッダ 4 0 5を、 上述した現プラ ィベートヘッダ 4 0 4とし、 その次のプライべ一トヘッダを次プライべ一トへッ ダとして処理する。
その後、 デコード前バッファメモリ 1 0 3に所定量 (第 1の所定の長さ以上) のデ一タが格納されているかどうかが判断され ( S 9 1 3 ) 、 格納されていれば ステップ S 9 0 6に戻り、 格納されていなければステップ S 9 0 1に戻る。
ステップ S 9 0 9での判断は、 解析した標的データの内容と、 解析された第 1 へッダの内容とが比較され、 一致するかどうかの判断がなされたが、 解析した標 的データの内容と、 あらかじめ保持された表 1の内容と比較する様にしても良い。 以上より明らかなように、 ストリーム解析手段 1 0 2は、 検出したヘッダ信号 から不連続明示バケツトまでをカウントするカウンタを備え、 更にカウントした 点におけるァドレス Aを計算して保持するァドレス記憶手段 8 0 8を設け、 前記 制御手段 1 0 7は、 計算したァドレス Aに、 次のプライべ一トヘッダが位置する ように読み出しボインタを移動する。
なお、 図 9 Aではフローを見やすくするために、 図 2Aを用いて説明した P E S ペイロード長が正規であるか否かの判定 ( S 2 0 3 ) を省略しているが、 ストリ ーム解析 ( S 9 0 2 ) の後で同様の判定を行っても良いのは言うまでも無い。 以上により、 本実施の形態では、 編集などによって生じた不連続点後の音声の 復号および出力が可能となる。
なお、 以上の実施の形態は、 オーディオの再生装置およびその処理を説明する ステップとして説明したが、 これらはコンピュータのプログラムの一部あるいは 他の装置の一部の機能であっても良いことは説明するまでもない。
また、 コンピュータのプログラムによつて実現された本宪明を磁気ディスクゃ CD— ROM等の記録媒体に格納することで、 コンピュータシステムで容易に実施す ることが可能となる。 産業上の利用の可能性
本発明は、 再生装置、 再生方法に利用可能である。

Claims

請 求 の 範 囲
1 . 1つのフレームにオーディォ符号化信号と前記オーディォ符号化信号の属 性情報で構成されるプライべ一トヘッダとを含むが、 同期語を含まない下位レイ ヤーの第 2ストリームが、 検出可能なヘッダ信号を含む上位レイヤーの第 1スト リームに包含されるデータを受け、 前記オーディォ符号化信号を復号して音声を 出力する再生装置であって、
前記第 1ストリームを解析し、 前記ヘッダ信号を検出すると共に、 検出したへ ッダ信号を基準に、 前記第 2ストリームを解析して前記オーディオ符号化信号と 前記プライべ一トへッダの位置情報を出力するストリーム解析手段と、
前記ス 1、リーム解析手段から出力される前記オーディォ符号化信号と前記ブラ ィベートヘッダとを一時保存するデコード前バッファメモリと、
前記デコ一ド前バッファメモリから入力される前記オーディォ符号化信号を復 号し音声を出力する復号手段と、
第 1フレームのプライべ一トヘッダに含まれる属性情報を解析し、 プライべ一 トヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を 検出する第 1へッダ解析手段と、
第 1フレームのプライべ一トヘッダの位置情報に、 検出されたデータ長を加え て得た位置から後にある所定量の標的データを解析し、 解析した標的データが、 第 2フレームのプライべ一トヘッダに含まれる属性情報である力否かを判断する 第 2ヘッダ解析手段と、
解析した標的データが、 第 2フレームのプライベートヘッダに含まれる属性情 報でないと判断した場合は、 少なくとも第 1フレームのオーディオ符号化信号に ついて前記復号手段からの音声出力を停止する制御手段を具備することを特徴と する再生装置。
2 . 前記第 2ヘッダ解析手段は、 前記標的データの少なくとも 1部が、 前記第 1ヘッダ解析手段で解析された属性情報の少なくとも 1部と一致するか否かを判 断することを特徴とする請求項 1記載の再生装置。
3 . 前記第 2ヘッダ解析手段は、 前記標的データの少なくとも 1部が、 あらか じめ保持された属性情報群のいずれかのものの少なくとも一部と一致するカゝ否か を判断することを特徴とする請求項 1記載の再生装置。
4 . 前記属性情報は、 前記オーディオ符号化信号のサンプリング周波数、 チヤ ンネル情報、 サンプルビット長、 オーディオ符号化信号のデータ長の少なくとも 一つであることを特徴とする請求項 1記載の再生装置。
5 . 前記ストリーム解析手段は、 前記ヘッダ信号に含まれる前記フレームの長 さを表すフレーム長データを検出し、 前記ヘッダ信号に続く 1フレームのデータ 1 検出したフレーム長データと等しくない場合は、 前記フレームを破棄し、 次 のフレームの解析を行うことを特徴とする請求項 1記載の再生装置。
6 . 前記第 1ストリームは複数のバケツトで構成され、 前記ストリーム解析手 段は、 前記へッダ信号に含まれる前記パケッ 1、の長さを表すバケツト長データを 検出し、 検出した 1パケットの長さが、 検出したパケット長データと等しくない 場合は、 前記パケットを破棄し、 次のバケツトの解析を行うことを特徴とする請 求項 1記載の再生装置。
7. 前記第 1ストリームに不連続が生じた箇所で、 不連続点明示パケットが揷 入されると共に、 前記ストリーム解析手段は、 不連続点明示パケットを検出し、 前記デコード前バッファに出力した不連続点明示パケット前のデータ量が、 あら かじめ定義された所定のデータ量あるいはその整数倍に満たない場合には、 前記 デコード前バッファに対-して不足分の補完データを出力することを特徴とする請 求項 6記載のオーディォ再生装置。
8 . 前記第 1ストリームに不連続が生じた箇所で、 不連続点明示パケットが揷 入されると共に、 前記ストリーム解析手段は、 検出したへッダ信号から不連続明 示バケツトまでをカウントするカウンタを備え、 更にカウントした点におけるァ ドレスを計算して保持するアドレス記憶手段を設け、 前記制御手段は、 計算した アドレスに、 次のプライベートヘッダが位置するように読み出しポインタを移動 することを特徴とする請求項 1記載の再生装置。
9 . 前記デコード前バッファメモリと復号手段の間に、 遅延手段を設けたことを 特徴とする請求項 1記載の再生装置。
1 0 . 1つのフレームにオーディォ符号化信号と前記オーディォ符号化信号の 属性情報で構成されるプライべ一トヘッダとを含むが、 同期語を含まない下位レ ィヤーの第 2ストリームが、 検出可能なヘッダ信号を含む上位レイヤーの第 1ス トリームに包含されるデータを受け、 前記オーディオ符号化信号を復号して音声 を出力する再生方法であって、
前記第 1ストリームを解析し、 前記ヘッダ信号を検出すると共に、 検出したへ ッダ信号を基準に、 前記第 2ストリームを解析して前記オーディオ符号化信号と 前記プライべ一トヘッダの位置情報を出力するストリーム解析ステップと、 前記ストリーム解析ステップから出力される前記オーディオ符号化信号と前記 プライべ一トヘッダとを一時保存するステップと、
前記保持されたオーディオ符号化信号を復号し音声を出力する復号ステップと、 第 1フレームのプライべ一トへッダに含まれる属性情報を解析し、 プライべ一 トヘッダの後に続く前記オーディオ符号化信号のデータ長を表すデータ長情報を 検出する第 1へッダ解析ステツプと、
第 1フレームのプライベートヘッダの位置情報に、 検出されたデータ長を加え て得た位置から後にある所定量の標的データを解析し、 解析した標的データが、 第 2フレームのプライべ一トヘッダに含まれる属性情報である力否かを判断する 第 2へッダ解析ステツプと、
解析した標的データが、 第 2フレームのプライべ一トヘッダに含まれる属性情 報でないと判断した場合は、 少なくとも第 1フレームのオーディオ符号化信号に ついて前記復号ステップからの音声出力を停止する制御ステップを具備すること を特徴とする再生方法。
1 1 . 前記第 2へッダ解析ステップは、 前記標的データの少なくとも 1部が、 前記第 1へッダ解析手段で解析された属性情報の少なくとも 1部と一致するか否 かを判断することを特徴とする請求項 1 0記載の再生方法。
1 2 . 前記第 2ヘッダ解析ステップは、 前記標的データの少なくとも 1部が、 あらかじめ保持された属性情報群のいずれかのものの少なくとも一部と一致する か否かを判断することを特徴とする請求項 1 0記載の再生方法。
1 3 . 前記属性情報は、 前記オーディオ符号化信号のサンプリング周波数、 チ ヤンネル情報、 サンプルビット長、 オーディオ符号化信号のデータ長の少なくと も一つであることを特徴とする請求項 1 0記載の再生方法。
1 4 . 前記ストリーム解析ステップは、 前記ヘッダ信号に含まれる前記フレー ムの長さを表すフレーム長データを検出し、 前記ヘッダ信号に続く 1フレームの データが、 検出したフレーム長データと等しくない場合は、 前記フレームを破棄 し、 次のフレームの解析を行うことを特徴とする請求項 1 0記載の再生方法。
1 5 . 前記第 1ストリームは、 複数のバケツトで構成され、 前記ストリーム解 析ステップは、 前記ヘッダ信号に含まれる前記バケツトの長さを表すバケツト長 データを検出し、 検出した 1パケットの長さが、 検出したパケット長データと等 しくない場合は、 前記パケットを破棄し、 次のパケットの解析を行うことを特徴 とする請求項 1 0記載の再生方法。
1 6 . 前記第 1ストリームに不連続が生じた箇所で、 不連続点明示バケツトが 挿入されると共に、 前記ストリーム解析ステップは、 不連続点明示パケットを検 出し、 前記保持した不連続点明示パケット前のデータ量が、 あらかじめ定義され た所定のデータ量あるいはその整数倍に満たない場合には、 前記デコード前バッ ファに対して不足分の補完データを出力することを特徴とする請求項 1 5記載の オーディオ再生方法。
1 7 . 前記第 1ストリームに不連続が生じた箇所で、 不連続点明示バケツトが 挿入されると共に、 前記ストリーム解析ステップは、 検出したヘッダ信号から不 連続明示バケツトまでをカウントし、 更にカウントした点におけるァドレスを計 算して保持するアドレス記憶ステップを設け、 前記制御ステップは、 計算したァ ドレスに、 次のプライべ一トヘッダが位置するように読み出しポインタを移動す ることを特徴とする請求項 1 0記載の再生方法。
1 8 . 前記保持するステップと復号ステップとの間に、 オーディオ符号化信号を 遅延する遅延ステップを設けたことを特徴とする請求項 1 0記載の再生方法。
PCT/JP2004/002261 2003-02-28 2004-02-26 再生装置および再生方法 WO2004077406A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005502921A JP4354455B2 (ja) 2003-02-28 2004-02-26 再生装置および再生方法
US10/544,335 US7653538B2 (en) 2003-02-28 2004-02-26 Playback apparatus and playback method
US12/633,047 US20100088103A1 (en) 2003-02-28 2009-12-08 Playback apparatus and playback method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003052837 2003-02-28
JP2003-052837 2003-02-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/633,047 Division US20100088103A1 (en) 2003-02-28 2009-12-08 Playback apparatus and playback method

Publications (1)

Publication Number Publication Date
WO2004077406A1 true WO2004077406A1 (ja) 2004-09-10

Family

ID=32923416

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2004/002261 WO2004077406A1 (ja) 2003-02-28 2004-02-26 再生装置および再生方法

Country Status (5)

Country Link
US (2) US7653538B2 (ja)
JP (1) JP4354455B2 (ja)
KR (1) KR20060022637A (ja)
CN (1) CN100583239C (ja)
WO (1) WO2004077406A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1705842A2 (en) * 2005-03-24 2006-09-27 Kabushiki Kaisha Toshiba Apparatus for receiving packet stream
JP2007088963A (ja) * 2005-09-26 2007-04-05 Nec Corp 情報処理装置及び情報処理方法
JP2009005150A (ja) * 2007-06-22 2009-01-08 Panasonic Corp Avビットストリーム再生装置
JP2009047914A (ja) * 2007-08-20 2009-03-05 Nec Corp 音声復号化装置、音声復号化方法、音声復号化プログラムおよびプログラム記録媒体
WO2016052191A1 (ja) * 2014-09-30 2016-04-07 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
JP2016191941A (ja) * 2013-01-21 2016-11-10 ドルビー ラボラトリーズ ライセンシング コーポレイション プログラム・ラウドネスおよび境界メタデータをもつオーディオ・エンコーダおよびデコーダ
WO2016194563A1 (ja) * 2015-06-02 2016-12-08 ソニー株式会社 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084459A (ja) * 2003-09-10 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ装置における再生方法
TWI275273B (en) * 2004-03-03 2007-03-01 Mediatek Inc Method and apparatus for extracting payload from a packetized elementary stream packet
US7818442B2 (en) * 2005-09-06 2010-10-19 Viewcast.Com, Inc. Streaming media encoder with front panel control interface
US7747798B2 (en) * 2006-01-31 2010-06-29 Viewcast.Com, Inc. Portable media encoder
US20070189411A1 (en) * 2006-02-14 2007-08-16 Viewcast.Com, Inc. Audio encoding and transmission method
US8085718B2 (en) * 2006-06-29 2011-12-27 St-Ericsson Sa Partial radio block detection
TW200820780A (en) * 2006-10-18 2008-05-01 Realtek Semiconductor Corp Method of embedding voice data into the transmission data
WO2008117524A1 (ja) * 2007-03-26 2008-10-02 Panasonic Corporation デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
US7778839B2 (en) * 2007-04-27 2010-08-17 Sony Ericsson Mobile Communications Ab Method and apparatus for processing encoded audio data
KR20100083766A (ko) * 2007-09-18 2010-07-22 코와 가부시키가이샤 시리얼데이터통신시스템 및 시리얼데이터통신방법
JP2009157272A (ja) * 2007-12-27 2009-07-16 Roland Corp 音声再生装置
JP2009277277A (ja) * 2008-05-13 2009-11-26 Funai Electric Co Ltd 音声処理装置
CN101964188B (zh) * 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
CN102244825A (zh) * 2011-06-10 2011-11-16 中兴通讯股份有限公司 一种多媒体流的播放方法及装置
US9351157B2 (en) * 2013-10-17 2016-05-24 Motorola Solutions, Inc. Methods, systems, and devices to reduce audio truncation during transcoding
JP2015119275A (ja) * 2013-12-17 2015-06-25 ソニー株式会社 通信装置、パケット監視方法及びコンピュータプログラム
US10176815B1 (en) * 2014-11-14 2019-01-08 Amazon Technologies, Inc. System for acoustic communication
US10332388B1 (en) * 2014-11-14 2019-06-25 Amazon Technologies, Inc. System for providing acoustic signals

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000201126A (ja) * 1998-11-04 2000-07-18 Hitachi Ltd 多重化オ―ディオデ―タ復号装置及び受信装置
JP2000259195A (ja) * 1999-01-08 2000-09-22 Matsushita Electric Ind Co Ltd デコード回路及びそれを用いた再生装置

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5726989A (en) * 1995-11-06 1998-03-10 Stellar One Corporation Method for ensuring synchronization of MPEG-1 data carried in an MPEG-2 transport stream
US5627936A (en) * 1995-12-21 1997-05-06 Intel Corporation Apparatus and method for temporal indexing of multiple audio, video and data streams
EP0806873A3 (en) * 1996-05-08 1998-11-18 Matsushita Electric Industrial Co., Ltd. Multiplex transmission method and system, and audio jitter absorbing method used therein
JP3484908B2 (ja) 1997-01-27 2004-01-06 三菱電機株式会社 ビットストリーム再生装置
US6026506A (en) * 1997-09-26 2000-02-15 International Business Machines Corporation Concealing errors in transport stream data
US6788710B1 (en) * 1998-03-19 2004-09-07 Thomson Licensing S.A. Auxiliary data insertion in a transport datastream
JP2000031942A (ja) 1998-07-14 2000-01-28 Mitsubishi Electric Corp 音響再生装置及び音響再生方法
US6816491B1 (en) 1998-11-04 2004-11-09 Hitachi, Ltd. Multiplexed audio data decoding apparatus and receiver apparatus
JP3318535B2 (ja) * 1998-11-26 2002-08-26 パイオニア株式会社 情報記録媒体、情報記録装置及び情報再生装置
US6631352B1 (en) 1999-01-08 2003-10-07 Matushita Electric Industrial Co. Ltd. Decoding circuit and reproduction apparatus which mutes audio after header parameter changes
JP4136151B2 (ja) * 1999-01-22 2008-08-20 キヤノン株式会社 符号化装置、方法及びコンピュータ読み取り可能な記憶媒体
JP4269409B2 (ja) * 1999-05-19 2009-05-27 ソニー株式会社 受信装置および方法
EP1087557A3 (en) * 1999-09-22 2005-01-19 Matsushita Electric Industrial Co., Ltd. Apparatus for transmitting digital audio data and receiving apparatus for receiving the digital audio data
US7236836B1 (en) * 1999-09-29 2007-06-26 Victor Company Of Japan, Ltd. System for signal processing and signal transmission
US6804257B1 (en) * 1999-11-25 2004-10-12 International Business Machines Corporation System and method for framing and protecting variable-lenght packet streams
GB9930787D0 (en) * 1999-12-30 2000-02-16 Koninkl Philips Electronics Nv Method and apparatus for convrerting data streams
US6804266B1 (en) * 2000-01-24 2004-10-12 Ati Technologies, Inc. Method and apparatus for handling private data from transport stream packets
JP3957251B2 (ja) * 2000-03-02 2007-08-15 パイオニア株式会社 オーディオ情報再生システム、オーディオ情報再生装置及びオーディオ情報再生方法
JP2001344905A (ja) * 2000-05-26 2001-12-14 Fujitsu Ltd データ再生装置、その方法及び記録媒体
US6931371B2 (en) * 2000-08-25 2005-08-16 Matsushita Electric Industrial Co., Ltd. Digital interface device
US6804655B2 (en) * 2001-02-06 2004-10-12 Cirrus Logic, Inc. Systems and methods for transmitting bursty-asnychronous data over a synchronous link
US7161939B2 (en) * 2001-06-29 2007-01-09 Ip Unity Method and system for switching among independent packetized audio streams
EP1320224B1 (en) * 2001-12-12 2007-11-21 Alcatel Lucent Telecommunications network and a packet header therefor
US7191375B2 (en) * 2001-12-28 2007-03-13 Intel Corporation Method and apparatus for signaling an error condition to an agent not expecting a completion
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000201126A (ja) * 1998-11-04 2000-07-18 Hitachi Ltd 多重化オ―ディオデ―タ復号装置及び受信装置
JP2000259195A (ja) * 1999-01-08 2000-09-22 Matsushita Electric Ind Co Ltd デコード回路及びそれを用いた再生装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1705842A2 (en) * 2005-03-24 2006-09-27 Kabushiki Kaisha Toshiba Apparatus for receiving packet stream
EP1705842A3 (en) * 2005-03-24 2008-09-17 Kabushiki Kaisha Toshiba Apparatus for receiving packet stream
US7839925B2 (en) 2005-03-24 2010-11-23 Kabushiki Kaisha Toshiba Apparatus for receiving packet stream
JP2007088963A (ja) * 2005-09-26 2007-04-05 Nec Corp 情報処理装置及び情報処理方法
JP4635801B2 (ja) * 2005-09-26 2011-02-23 日本電気株式会社 情報処理装置及び情報処理方法
JP2009005150A (ja) * 2007-06-22 2009-01-08 Panasonic Corp Avビットストリーム再生装置
JP2009047914A (ja) * 2007-08-20 2009-03-05 Nec Corp 音声復号化装置、音声復号化方法、音声復号化プログラムおよびプログラム記録媒体
US10672413B2 (en) 2013-01-21 2020-06-02 Dolby Laboratories Licensing Corporation Decoding of encoded audio bitstream with metadata container located in reserved data space
JP2018022180A (ja) * 2013-01-21 2018-02-08 ドルビー ラボラトリーズ ライセンシング コーポレイション プログラム・ラウドネスおよび境界メタデータをもつオーディオ・エンコーダおよびデコーダ
JP2016197250A (ja) * 2013-01-21 2016-11-24 ドルビー ラボラトリーズ ライセンシング コーポレイション プログラム・ラウドネスおよび境界メタデータをもつオーディオ・エンコーダおよびデコーダ
JP2016191941A (ja) * 2013-01-21 2016-11-10 ドルビー ラボラトリーズ ライセンシング コーポレイション プログラム・ラウドネスおよび境界メタデータをもつオーディオ・エンコーダおよびデコーダ
RU2701060C2 (ru) * 2014-09-30 2019-09-24 Сони Корпорейшн Передающее устройство, способ передачи, приемное устройство и способ приема
JPWO2016052191A1 (ja) * 2014-09-30 2017-07-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
WO2016052191A1 (ja) * 2014-09-30 2016-04-07 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10856042B2 (en) 2014-09-30 2020-12-01 Sony Corporation Transmission apparatus, transmission method, reception apparatus and reception method for transmitting a plurality of types of audio data items
JP2021105735A (ja) * 2014-09-30 2021-07-26 ソニーグループ株式会社 受信装置および受信方法
JP7310849B2 (ja) 2014-09-30 2023-07-19 ソニーグループ株式会社 受信装置および受信方法
US11871078B2 (en) 2014-09-30 2024-01-09 Sony Corporation Transmission method, reception apparatus and reception method for transmitting a plurality of types of audio data items
JPWO2016194563A1 (ja) * 2015-06-02 2018-03-22 ソニー株式会社 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置
WO2016194563A1 (ja) * 2015-06-02 2016-12-08 ソニー株式会社 送信装置、送信方法、メディア処理装置、メディア処理方法および受信装置
US11223857B2 (en) 2015-06-02 2022-01-11 Sony Corporation Transmission device, transmission method, media processing device, media processing method, and reception device
US11956485B2 (en) 2015-06-02 2024-04-09 Sony Group Corporation Transmission device, transmission method, media processing device, media processing method, and reception device

Also Published As

Publication number Publication date
CN100583239C (zh) 2010-01-20
JP4354455B2 (ja) 2009-10-28
KR20060022637A (ko) 2006-03-10
US20100088103A1 (en) 2010-04-08
US20060080094A1 (en) 2006-04-13
JPWO2004077406A1 (ja) 2006-06-08
CN1757059A (zh) 2006-04-05
US7653538B2 (en) 2010-01-26

Similar Documents

Publication Publication Date Title
JP4354455B2 (ja) 再生装置および再生方法
KR100695657B1 (ko) 기록 장치, 기록 방법, 재생 장치, 재생 방법 및 기록 매체
JP5273858B2 (ja) データストリームおよびマルチチャネル表現を生成するための装置および方法
US20090216543A1 (en) Method and apparatus for encoding and decoding an audio signal
JP3052824B2 (ja) オーディオ再生時刻調整回路
JP2003244589A (ja) 時系列データ記録装置及び時系列データ記録方法
WO2002047087A1 (fr) Systeme et procede de reproduction, dispositif et procede de transmission de donnees
JP3558983B2 (ja) デジタル放送の記録再生装置
US8369456B2 (en) Data processing apparatus and method and encoding device
US20100286989A1 (en) Recording/reproduction device
JP2005217486A (ja) ストリーム復号装置
KR100609173B1 (ko) Aac복호화 방법
KR0177314B1 (ko) 엠펙시스템에서의 전송패킷 보호장치
CN117012207B (zh) 一种音频文件检测方法、装置与计算设备
JP2008226365A (ja) 音声再生装置及び音声再生方法
JP2003162299A (ja) 音声再生回路、デコード回路、音声再生装置及び音声再生方法
KR100752874B1 (ko) 오디오 프레임의 복호 제어 방법
EP1594131A2 (en) Reproduction apparatus and reproduction method
JPH09294077A (ja) 圧縮音声データ処理方法及びデータストリーム再生方法とそれらの装置
WO2005093750A1 (ja) ディジタルダビング装置
US8050155B2 (en) Disc playback apparatus
JP2009134115A (ja) デコーダ
JP2000059391A (ja) 音声パケット送受信方法、並びに音声パケット送信端末および音声パケット受信端末
KR20110032617A (ko) 음원게인 자동제어 재생기 및 음원게인 자동제어 재생방법
JP2002262226A (ja) 記録再生編集装置および方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
ENP Entry into the national phase

Ref document number: 2006080094

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10544335

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1020057014726

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 20048055193

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2005502921

Country of ref document: JP

WWP Wipo information: published in national office

Ref document number: 1020057014726

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 10544335

Country of ref document: US

122 Ep: pct application non-entry in european phase