[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN103620678B - 比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流 - Google Patents

比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流 Download PDF

Info

Publication number
CN103620678B
CN103620678B CN201280023907.9A CN201280023907A CN103620678B CN 103620678 B CN103620678 B CN 103620678B CN 201280023907 A CN201280023907 A CN 201280023907A CN 103620678 B CN103620678 B CN 103620678B
Authority
CN
China
Prior art keywords
targeting signal
information
audio stream
coding form
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280023907.9A
Other languages
English (en)
Other versions
CN103620678A (zh
Inventor
西尾孝祐
宫阪修二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Publication of CN103620678A publication Critical patent/CN103620678A/zh
Application granted granted Critical
Publication of CN103620678B publication Critical patent/CN103620678B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及的比特流发送装置(200)具备:输入部(100),获得对音频信号进行编码而得到的基本音频流;分析部(101),分析基本音频流(300)的抽样频率和编码形式;前导信号生成部(102),在分析的抽样频率和编码形式不符合标准的情况下,生成将符合标准的编码形式作为示出基本音频流(300)的编码形式的信息来记载的前导信号;以及形成部(103),将生成的前导信号附加给基本音频流(300),从而形成标准的音频比特流(301)。

Description

比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流
技术领域
本发明涉及,具备向其他的装置发送被压缩编码的音频信号的比特流发送装置、以及接收从该比特流发送装置发送的音频信号来输出音频的接收装置的比特流收发系统。
背景技术
以往,一种数据再生装置被周知,该数据再生装置,将被压缩编码并记录的视频信号以及音频信号从CD-ROM、DVD-ROM、半导体存储器、以及硬盘等的记录介质中读出,将读出的视频信号以及音频信号解码(扩展)并输出。而且,数据再生装置,将被扩展的数据发送给与该数据再生装置连接的影像监视器、以及音响扬声器等。据此,实现视频以及音频的再生。并且,在再生数字广播的情况下,数据再生装置,接收被压缩编码的视频信号以及音频信号,与从记录介质的再生同样,将被压缩编码的视频信号以及音频信号解码并输出。据此,实现视频以及音频的再生。
关于视频信号以及音频信号的压缩编码,规定许多标准。
例如,对于图像数据编码标准的主要例子,可以举出MPEG-2以及MPEG-4等。
并且,对于音频数据编码标准的主要例子,可以举出Dolby Digital、DTS(Digital Theater System)、MPEG Audio、以及MPEG-4AAC(Adavanced Audio Coding)等。并且,对于音频数据编码标准,可以举出不削减信息量的PCM(Pulse Code Modulation)方式等。
Dolby Digital是美国Dolby公司的注册商标。
DTS是美国Digltal Theater System公司的注册商标。
以后,将以这样的音频数据编码方式而被编码的信号称为“基本音频流”。
并且,能够在由数据再生装置对基本音频流进行解码的同时,向外部设备输出该基本音频流。
例如,利用S/PDIF(Sony Philips Digital InterFace)或HDMI(High-Definition Multimedia Interface),将数字电视机和AV接收器连接。据此,能够根据IEC60958/IEC61937,从数字电视机向AV接收器传输基本音频流。
AV接收器,将接收的基本音频流解码并输出,从而实现音频信号的再生。
图7是示出IEC60958/IEC61937的输出比特流的数据结构的一个例子的图。图7(a)示出,IEC60958/IEC61937所规定的基本音频流的数据结构的一个例子。图7(b)示出,用于传输基本音频流的音频比特流的数据结构的一个例子。
如图7(a)所示,基本音频流300,将作为包含规定数的样本(例如,1024样本)的单位的帧包含多个。各个帧,包含头部(Header)、以及编码数据部(EncodedData)。在编码数据部记录有,实际的声音的编码信号,在头部记录有,编码数据部所记录的编码信号的属性,例如,记录有抽样率及通道数等。
向头部记录编码信号的属性的形式有,所谓ADTS(Audio DataTransport Stream)形式、以及所谓LOAS(Low Overhead Audio Stream)形式。图8A以及图8B是示出IEC60958/IEC61937的比特流的头部的数据形式的一个例子的图。图8A示出ADTS形式的固定头部的描述的一个例子。在图8A的表的从上第8行,示出用于以ADTS描述编码信号的抽样频率的格式。在此,规定从0x3至0x8中选择编码信号的抽样频率。图8B示出LOAS形式的头部的描述的一个例子。如图8B所示,在LOAS形式中,也规定在头部描述编码信号的抽样频率的形式。
对于图7(a)的基本音频流300的编码数据部所记录的编码信号的编码方式,周知的是国际规格标准的MPEG音频AAC方式、以及HEAAC(High-Efficiency Advanced Audio Coding)方式等。HEAAC方式是指,对AAC方式适用所谓SBR(Spectral Band Replication:频带复制)的频带扩展技术的方式。并且,HEAAC方式,若敢于不对SBR信息进行处理,或者,原来是不能对SBR信息进行处理的解码器,则能够进行具有与AAC的兼容性的再生处理。
通过分析编码数据部内的信息,从而能够判断所述编码数据部中描述的编码信号是否为适用SBR技术而被编码的信号。也就是说,通过检查图7(a)的基本音频流300内的虚线框的比特构造,从而能够进行所述分析。虚线框是AAC标准的所谓Extension_payload的信息存储构造。按照该Extension_payload内是否存放有SBR信息,从而能够判断对编码信号是否适用了SBR技术。在基本音频流300中,Extension_payload被配置在各个帧的最后,但是,并不一定需要在各个帧存在Extension_payload。
如图7(b)所示,音频比特流301是,IEC61937形式音频比特流。IEC61937形式音频比特流是,在基本音频流的前面添加了所谓Pa、Pb、Pc以及Pd的前导信号而成的。进而,在基本音频流的后面,会有插入所谓Stuffing的、用于调节信号长度的无效信号的情况。
图9是示出图7(b)所示的前导信号Pc的数据形式的图。图9示出的以虚线围绕的部分是,用于在前导信号Pc内,以LOAS形式,记载SBR信息的有无(示出是AAC还是HEAAC的信号)的数据的一个例子的部分。例如,在前导信号Pc的第0位至第4位的5个位示出的值为23的情况下,该基本音频流300是LOAS形式。进而,在前导信号Pc的第5位至第6位的两个位示出的值为1的情况下,示出该基本音频流中不包含SBR信息。也就是说,示出编码数据部所记录的编码信号,以AACLC方式或AAC方式而被编码。并且,在前导信号Pc的第0位至第4位的5个位示出的值为23、且前导信号Pc的第5位至第6位的两个位示出的值为2的情况下,示出基本音频流300中包含SBR信息。也就是说,示出编码数据部所记录的编码信号,以HEAAC方式而被编码。
而且,利用了所述技术的比特流发送装置,在接收了像基本音频流300那样的基本音频流的情况下,根据该基本音频流的Extension_payload检测SBR信息的有无。而且,比特流发送装置,在没有SBR信息的情况下,在前导信号Pc中,根据图9示出的位构造,指定AAC。另一方面,在Extension_payload中存在SBR信息的情况下,比特流发送装置指定HEAAC。对于其他的前导信号Pa、Pb以及Pd各自,根据其位构造和信号的含义的规定进行设定。而且,根据需要插入Stuffing,从而生成IEC61937形式的音频比特流。
(现有技术文献)
(非专利文献)
非专利文献1:IEC61937-11Digital audio-Interface for non-linear PCM encoded audio bitstreams applying IEC60958-Part11:MPEG-4AAC and its extensions in LATM/LOAS
非专利文献2:ISO/IEC14496-3Information technology-Coding of audio-visual objects-Part3:Audio
非专利文献3:ETSI TS101154Technical Specification DigitalVideo Broadcasting(DVB);Specification for the use of Video andAudio Coding in Broadcasting Applications based on the MPEG-2Transport Stream
发明概要
发明要解决的问题
然而,在所述以往技术中存在两个问题。
第一问题是,以MEPG-4AAC所定义的参数中有,没有定义比特流标准的参数。图10是示出,基本音频流的抽样率与对该抽样率能够选择的音频数据的音频编码数据形式的关系的图。
如图10示出,在AAC抽样率为16kHz、22.05kHz、24kHz、且音频编码数据形式为AAC的情况下,没有定义比特流标准(图10的从上第1至3行)。并且,在AAC抽样率为32kHz、44.1kHz、且音频编码数据形式为HEAAC(AAC编码信号中附加了SBR信息)的情况下,没有定义比特流标准(图10的第4至5行)。特别是,在后者、即AAC抽样率为32kHz、44.1kHz、且音频编码数据形式为HEAAC的情况下,虽然规定数字广播等的运用,却没有定义比特流标准。其结果为,存在的问题是,即使接收了利用HEAAC而编码的高音质的基本音频流,也不能将该基本音频流由外部的多通道扬声器系统等再生来享受。
第二问题是,例如,在同一内容中包含音频编码数据形式不同的编码数据的情况下,输出比特流中的输出抽样频率的切换增加。
例如,在数字广播中,在对于节目内容部分,以音频编码数据形式为HEAAC且AAC抽样率为48KHz来播放,另一方面,对于广告部分,以音频编码数据形式为AACLC且AAC抽样率为48KHz来播放的情况下,在节目内容部分和广告部分的切替部分,发生输出抽样频率的切换。
图11A以及图11B是示出,HEAAC解码器解码并再生的频带、和AAC解码器解码并再生的频带的不同的图。图11A示出,HEAAC且AAC抽样率为48KHz的编码数据的可再生的频带。HEAAC,对AAC再生的频带的信号,利用SBR技术(Spectral Band Replication),从而再生AAC的两倍的频带的信号。也就是说,图11A的实线部分示出,由48kHz的AAC再生的0至24kHz的信号,虚线部分的24至48kHz的频带示出,由SBR技术扩展的频带。据此,再生96kHz的信号。另一方面,图11B示出,AAC且AAC抽样率为48KHz的编码数据再生的频带。如图11B示出,生成与在HEAAC中AAC部再生的频带相同的频带的信号。
根据图11A以及图11B得知,在节目内容部分,输出IEC60958的帧率为96KHz的信号,在广告部分,输出IEC60958的帧率为48KHz的信号。在接收这样的比特流的情况下,需要响应AV接收器接收的比特流的IEC60958的帧率的变化来再次得到同步的处理。而且,该处理需要花费时间,因此,存在的问题是,在节目部分和广告部分的切换中产生声音间断。
发明内容
于是,本发明的目的在于提供一种比特流发送装置,即使在与抽样频率对应的实际的编码形式不符合规定的形式的情况下,也能够作为适合的音频比特流来发送。
解决问题的手段
为了解决所述的问题,本发明的实施方案之一涉及的比特流发送装置,发送规定的形式的音频比特流,所述比特流发送装置具备:输入部,获得对音频信号进行编码而得到的基本音频流;分析部,分析所述基本音频流的抽样频率和编码形式;前导信号生成部,按照所述分析部的分析结果,生成包含示出所述基本音频流的编码形式的信息的前导信号;形成部,将所述前导信号生成部生成的所述前导信号附加给所述基本音频流,从而形成所述规定的形式的音频比特流;以及输出部,输出由所述形成部形成的所述音频比特流,所述前导信号生成部,按照根据所述分析部的分析结果而得到的所述抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载。
如此,前导信号生成部,按照根据所述分析部的分析结果而得到的所述抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载。据此,本发明的实施方案之一涉及的比特流发送装置,即使在与抽样频率对应的实际的编码形式不符合规定的形式的情况下,也能够作为适合的音频比特流来发送。
并且,也可以是,所述前导信号生成部,以从所述输出部输出的数据的输出传输速度在预先规定的范围内的方式,记载所述前导信号内的示出所述编码形式的信息。
在此,“预先规定的范围”是指,例如,1536kbps和1411.2kbps和1024kbps,是标准上能够传输的比特率。据此,本发明的实施方案之一涉及的比特流发送装置,能够使按照基本音频流的抽样频率和编码形式而决定的音频比特流的输出传输速度,成为能够传输的传输速度。
并且,也可以是,所述规定的形式的音频比特流是IEC61937标准所规定的音频比特流,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第一频率的情况下,在与所述第一频率对应的所述编码形式在所述IEC61937标准的对应范围外时,所述前导信号生成部,将在所述基本音频流中的频带复制信息的有无这一点与被分析的所述编码形式不同的编码形式,作为示出所述编码形式的信息来记载,从而生成所述音频比特流成为IEC61937标准的对应范围内的前导信号。
据此,本发明的实施方案之一涉及的比特流发送装置,在根据所述分析部的分析结果而得到的所述抽样频率和所述编码形式不符合所述音频比特流的所述规定的形式的情况下,仅变更前导信号的SBR信息的有无,就能够形成符合规定的形式的音频比特流。因此,该比特流发送装置,能够以少的处理负荷,来生成并发送符合规定的形式的音频比特流。
并且,也可以是,所述前导信号生成部,进一步,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第二频率的情况下,将所述基本音频流以不包含所述频带复制信息的编码形式而被编码的状况,作为所述前导信号内的示出所述编码形式的信息来记载。
据此,本发明的实施方案之一涉及的比特流发送装置,在根据基本音频流的抽样频率为第二频率的情况下,能够将所述基本音频流以不包含所述频带复制信息的编码形式而被编码的状况,作为所述前导信号内的示出所述编码形式的信息来记载。因此,在基本音频流的抽样频率为第二频率时,总是能够以没有SBR信息的编码形式将该基本音频流解码,因此能够防止抽样频率的变动。
并且,也可以是,所述前导信号生成部,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第三频率的情况下,即使所述基本音频流没有以包含所述频带复制信息的所述编码形式而被编码,也生成示出以包含所述频带复制信息的编码形式而被编码的前导信号。
据此,本发明的实施方案之一涉及的比特流发送装置,在基本音频流的抽样频率为第三频率时,能够控制成强制地进行SBR处理。据此,该比特流发送装置,在第三频率为低频带的情况下,能够使音频比特流符合规定的形式。
并且,也可以是,所述前导信号生成部,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第四频率的情况下,即使所述基本音频流以包含所述频带复制信息的所述编码形式而被编码,也生成示出以不包含所述频带复制信息的编码形式而被编码的前导信号。
据此,本发明的实施方案之一涉及的比特流发送装置,在基本音频流的抽样频率为第四频率时,能够控制成以没有SBR的AAC进行解码。据此,该比特流发送装置,在第四频率为高频带的情况下,能够使音频比特流符合规定的形式。
并且,也可以是,本发明的实施方案之一涉及的比特流收发系统,是具备所述比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,所述比特流接收装置,具备:前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
并且,也可以是,本发明的实施方案之一涉及的比特流收发系统,是具备所述比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,所述比特流接收装置,具备:前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,进行使将要扩展为高频带的信号成为0的、利用了所述频带复制信息的解码处理。
并且,也可以是,本发明的实施方案之一涉及的比特流收发系统,是具备所述比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,所述比特流接收装置,具备:前导信号消除部,通过从接收的所述音频比特流中消除所述前导信号,从而提取所述基本音频流;以及基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,生成利用所述频带复制信息来进行解码处理时的抽样频率的1/2的抽样频率的信号。
并且,也可以是,所述比特流接收装置具有能力通知部,该能力通知部,将示出该比特流接收装置的能力的信息通知给所述比特流发送装置,所述分析部,分析示出所述基本音频流的抽样率的FS信息,所述前导信号生成部,在该FS信息为预先规定的值的情况下,与来自所述能力通知部的信息对应,对是否生成示出包含频带复制信息的前导信号进行切换。
并且,也可以是,本发明的实施方案之一涉及的比特流接收装置,接收部,从比特流发送装置接收如下音频比特流,所述音频比特流是指,向对音频信号进行编码而得到的基本音频流,附加包含示出所述基本音频流的编码形式的信息的前导信号而形成的所述规定的形式的音频比特流,并且,在所述音频比特流中,在所述基本音频流的抽样频率和所述编码形式不符合所述音频比特流的所述规定的形式的情况下,将符合所述音频比特流的所述规定的形式的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载;前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
据此,本比特流收发系统的比特流接收装置,在所述前导信号中记载的示出编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,能够以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。因此,该比特流接收装置,即使在基本音频流内的示出编码形式的信息、与前导信号内的示出编码形式的信息不匹配的情况下,也能够对音频比特流没有矛盾地进行解码。
并且,也可以是,所述比特流接收装置接收如下音频比特流,在所述音频比特流中,在所述基本音频流的所述抽样频率为预先规定的第三频率的情况下,即使所述基本音频流没有以包含所述频带复制信息的所述编码形式而被编码,也包含示出以包含所述频带复制信息的编码形式而被编码的前导信号,所述基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,进行使将要扩展为高频带的信号成为0的、利用了所述频带复制信息的解码处理。
并且,也可以是,所述比特流接收装置接收如下音频比特流,在所述音频比特流中,在所述基本音频流的所述抽样频率为预先规定的第四频率的情况下,即使所述基本音频流以包含所述频带复制信息的所述编码形式而被编码,也包含示出以不包含所述频带复制信息的编码形式而被编码的前导信号,所述基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,生成利用所述频带复制信息来进行解码处理时的抽样频率的1/2的抽样频率的信号。
而且,这样的全面或具体的形态,可以由系统、方法、集成电路、计算机程序或记录介质实现,也可以由系统、方法、集成电路、计算机程序以及记录介质的任意的组合实现。并且,本发明,也可以作为所述比特流发送装置生成的音频比特流实现。
发明效果
如上所述,根据本发明,能够提供一种比特流发送装置,即使在与抽样频率对应的实际的编码形式不符合规定的形式的情况下,也能够作为适合的音频比特流来发送。
并且,根据本发明的实施方案之一,能够解决在将被输入的基本音频流的抽样率以及与该抽样率对应的编码形式以IEC61937标准发送时的不良状况。
并且,根据本发明的其他的实施方案,即使被输入的基本音频流在IEC61937标准范围外,也能够成为IEC61937标准范围内来发送比特流。
进而,根据本发明的还其他的实施方案能够,在对连续输入的基本音频流进行解码的情况下,不产生解码信号的抽样率的变化。
并且,进一步,根据本发明的其他的实施方案,即使在接收的比特流中附加的前导信号中记载的参数P、和构成该比特流的基本音频流中包含的与所述参数P对应的参数E不匹配的情况下,也能够正常生成解码信号。
并且,根据本发明的还其他的实施方案,在低FS的AAC的情况下,能够成为IEC61937标准范围内来发送比特流。
根据本发明的还其他的实施方案,在低FS的AAC的情况下,能够生成预先规定的中FS的抽样率的再生音。
根据本发明的还其他的实施方案,在高FS的HEAAC的情况下,能够成为IEC61937标准范围内来发送比特流。
根据本发明的还其他的实施方案,在高FS的AAC的情况下,能够生成预先规定的中FS的抽样率的再生音。
附图说明
图1是示出本发明的实施例1的比特流发送装置的结构的一个例子的图。
图2是示出本发明的实施例1的比特流接收装置的结构的一个例子的图。
图3是示出本发明的实施例1的比特流收发系统的向音频系统的适用例的图。
图4A是用于说明本发明的实施例1涉及的AAC方式和HEAAC方式的再生频带的不同的图。
图4B是用于说明本发明的实施例1涉及的AAC方式和HEAAC方式的再生频带的不同的图。
图5A是用于说明本发明的实施例1涉及的图10示出的流输出规定的含义的图。
图5B是用于说明本发明的实施例1涉及的图10示出的流输出规定的含义的图。
图5C是用于说明本发明的实施例1涉及的图10示出的流输出规定的含义的图。
图6是示出本发明的实施例2的比特流收发系统的结构的一个例子的图。
图7是用于说明IEC60958/IEC61937的输出比特流的数据结构的一个例子的图。
图8A是示出ADTS形式的固定头部的描述的一个例子的图。
图8B是示出LOAS形式的头部的描述的一个例子的图。
图9是示出图7(b)示出的表示前导信号Pc的数据形式的图。
图10是示出,针对基本音频流的抽样率和音频编码数据形式的组合的IEC61937标准的流输出规定的有无的图。
图11A是示出,HEAAC且AAC抽样率为48KHz的编码数据的可再生的频带的图。
图11B示出,AAC且AAC抽样率为48KHz的编码数据的可再生的频带的图。
具体实施方式
以下,利用附图详细说明本发明的实施例。而且,以下说明的实施例,都示出本发明的一个具体例子。以下的实施例所示的数值、形状、材料、构成要素、构成要素的配置位置以及连接形态、步骤、步骤的顺序等,是一个例子,而不是限定本发明的宗旨。本发明,由权利要求书确定。因此,对于以下的实施例的构成要素中的、示出本发明的最上位概念的独立请求要求中没有记载的构成要素,为了实现本发明的问题而并不一定需要,但是,被说明为构成更优选的形态的要素。
(实施例1)
以下,对于本发明的实施例1的比特流发送装置,参照附图进行说明。
图1是示出本实施例1的比特流发送装置200的结构的图。如图1示出,比特流发送装置200具备,输入部100、分析部101、前导信号生成部102、形成部103以及输出部104。
输入部100,获得对音频信号进行编码而得到的基本音频流300。
分析部101,分析获得的基本音频流300的抽样率和音频编码数据形式。
前导信号生成部102,按照分析部101的分析结果,生成构成IEC61937所规定的形式的音频比特流的前导信号。在此,前导信号生成部102,在根据分析部101的分析结果得到的抽样频率为预先规定的值的情况下,将示出基本音频流300的音频编码数据形式的参数,变更为基于IEC61937的规定的值,从而生成前导信号。
形成部103,将前导信号生成部102生成的前导信号附加给基本音频流300,从而形成IEC61937形式的音频比特流。
输出部104,输出由形成部103形成的音频比特流301。
图2是示出实施例1的比特流接收装置的结构的一个例子的图。如图2示出,比特流接收装置201,接收从图1示出的比特流发送装置200发送的音频比特流301,对接收的音频比特流301进行解码。该比特流接收装置201具备,前导信号消除部202以及基本音频流解码部203。
前导信号消除部202,被包藏在比特流接收装置201,从比特流发送装置200所发送的IEC61937形式音频比特流301中消除前导信号Pa、Pb、Pc以及Pd,从而提取基本音频流300。
基本音频流解码部203,被包藏在比特流接收装置201,对前导信号消除部202所提取的基本音频流300进行解码,生成音频信号(多通道解码信号),输出生成后的音频信号。基本音频流解码部203,在对基本音频流300进行解码时,在前导信号Pc所示的音频编码数据形式、和Extension_payload所示的音频编码数据形式有矛盾的情况下,以前导信号Pc所示的音频编码数据形式,对基本音频流300进行解码。
图3是示出,将具备图1所示的比特流发送装置200和图2所示的比特流接收装置201的收发系统安装在音频设备的例子的图。
如图3示出,具备比特流发送装置200和比特流接收装置201的比特流收发系统210,经由传输IEC61937形式的音频比特流301的连接线连接。该连接线是,例如HDMI等。比特流发送装置200,例如,被包藏在电视机220,经由电视机220内部的解码器以及2通道下混部,例如,与2通道的立体声扬声器连接。电视机220,经由不图示的天线、调谐器、或CD驱动器等,从广播波或CD等获得基本音频流300,将获得的基本音频流300,输入到比特流发送装置200的输入部100。解码器221,获得从输入部100输入到形成部103的基本音频流300,一旦,解码为多通道音频信号。2通道下混部222(2ch下混部),将由解码器对基本音频流300进行解码而得到的多通道音频信号,下混为2通道的立体声音频信号,将该立体声音频信号输出到立体声扬声器223。
比特流接收装置201,例如,被包藏在具备5.1通道等的多通道扬声器231的影院系统230。该比特流接收装置201,对经由HDMI等从比特流发送装置200输入的、基于IEC61937的规定的音频比特流301进行解码,将解码而得到的多通道音频信号,输出到多通道扬声器231。
以下,说明如上构成的比特流发送装置200的更详细的工作。
首先,输入部100,获得基本音频流300。基本音频流300是,图7所示的数据形式的流,在本实施例1中设想,头部形式是LOAS形式,编码数据是,不包含SBR信息的AAC方式的编码数据。在基本音频流300内的编码数据部不包含Extension_payload310,头部内所记载的抽样率(抽样频率)为24kHz。
接着,在分析部101,分析基本音频流300。在本实施例1中,被输入的基本音频流300是,如上所述抽样率为24kHz、且不包含SBR信息的流,因此,由分析部101分析此状况。根据图8B所示的LOAS头部形式的规定分析比特流,从而得到抽样率。并且,根据图7所示的Extension_payload的规定分析比特流,从而得到SBR信息的有无。
接着,在前导信号生成部102,按照分析部101的分析结果,生成IEC61937形式的前导信号。在基本音频流300的抽样率为24kHz、且不包含SBR信息的情况下,如图10示出,没有定义IEC61937形式的音频比特流。因此,前导信号生成部102,生成示出基本音频流300包含SBR信息的前导信号。具体而言,前导信号生成部102,将前导信号Pc的第0至4位的5个位示出的值设定为23。据此,前导信号Pc示出,头部形式为LOAS形式。进而,前导信号生成部102,将前导信号Pc的第5至6位的两个位示出的值设定为2。据此,前导信号Pc示出,基本音频流300中包含SBR信息。在此,包含SBR信息是指,即,前导信号Pc示出,基本音频流300以HEAAC方式而被编码。在本实施例1中,抽样率为24kHz,但是,当然,即使是22.05kHz以及16kHz也是同样的。
接着,形成部103,将从前导信号生成部102输出的前导信号附加给基本音频流300。也就是说,形成部103,形成图7的音频比特流301所示的IEC61937形式的音频比特流。
最后,输出部104,将作为来自形成部103的信号的音频比特流301输出到外部设备。
并且,对于如图2构成的比特流接收装置201的工作,以下进行说明。
首先,比特流发送装置200,将输入的基本音频流300形成为IEC61937形式的音频比特流301,输出该音频比特流301。
例如,在输入的基本音频流300的抽样率(抽样频率)为24kHz,进行没有SBR信息(AAC方式)的编码的情况下,在前导信号中的Pc中,记载有示出存在SBR信息(HEAAC方式)的代码。并且,例如,在输入的基本音频流300的抽样率(抽样频率)为48kHz、且存在SBR信息(HEAAC方式)的情况下,在前导信号中的Pc中,记载有示出没有SBR信息(AAC方式)的代码。
前导信号消除部202,从比特流发送装置1000所发送的IEC61937形式的音频比特流301中消除前导信号Pa、Pb、Pc以及Pd,从而提取基本音频流300。如果,在IEC61937形式的音频比特流301中包含Stuffing信号的情况下,前导信号消除部202,也除去该Stuffing信号,生成基本音频流300。如此生成的基本音频流300是,AAC方式、或HEAAC方式的基本音频流,根据MPEG标准所规定的解码顺序能够解码的。并且,在该前导信号消除部202,将示出SBR信息的有无的SBR有无信息从前导信号Pc中检测,将该SBR有无信息发送到后续的基本音频流解码部203。
基本音频流解码部203,对提取的基本音频流300进行解码,从而生成音频信号。并且,基本音频流解码部203,参照从前导信号消除部202发送的SBR有无信息,判定基本音频流300中包含的示出SBR信息的有无的信息、和来自前导信号消除部202的SBR有无信息是否有矛盾,在有矛盾的情况下,根据来自前导信号消除部202的SBR有无信息示出的内容。
例如,即使基本音频流300的抽样率为24kHz、且“没有SBR”,也在SBR有无信息示出“存在SBR信息”的情况下,基本音频流解码部203,执行频带扩展处理。当然,实际上在基本音频流300的Extension_payload内没有SBR信息,因此,基本音频流解码部203,不能执行完整的频带扩展处理,但是,例如,进行执行将解码信号的抽样率上抽样为两倍的处理等的处理。也就是说,基本音频流解码部203,进行与执行使以SBR来将要复制为高频带的成分为0的频带扩展处理等效的处理。
并且,例如,即使基本音频流300的抽样率为48kHz、且“存在SBR信息”,也在SBR有无信息示出“没有SBR”的情况下,基本音频流解码部203,不执行频带扩展处理。例如,基本音频流解码部203,跳读并忽视实际存在的SBR信息。或者,基本音频流解码部203,虽然适用实际存在的SBR信息,但是,进行将输出的抽样率下抽样为1/2,来生成作为其结果的48kHz的信号等的处理。
而且,基本音频流解码部203,在基本音频流300中包含的示出SBR信息的有无的信息、和来自前导信号消除部202的SBR有无信息有矛盾的情况下,可以根据基本音频流300中包含的示出SBR信息的有无的信息。
如此生成的解码信号,从基本音频流解码部203发送到外部,转换为由扬声器或头戴耳机等可听的信号。
如上所述,本实施例1涉及的比特流发送装置200,具备:输入部100,获得对音频信号进行编码而得到的基本音频流;分析部101,分析基本音频流的抽样频率和编码形式;前导信号生成部102,按照分析部101的分析结果,生成构成IEC61937形式的音频比特流的前导信号;形成部103,将前导信号生成部102生成的前导信号附加给基本音频流,从而形成IEC61937形式的音频比特流;以及输出部104,输出由形成部103形成的音频比特流,前导信号生成部102,在根据分析部101的分析结果而得到的抽样频率为预先规定的值的情况下,将示出基本音频流的音频编码数据形式的参数,变更为符合音频比特流的IEC61937的形式来生成前导信号。
据此,该比特流发送装置200,能够没有问题地发送因不符合IEC61937而没能发送到比特流接收装置201的音频比特流301。其结果为,该比特流发送装置200,即使基本音频流300的抽样率和音频编码数据形式的组合,在IEC61937标准的范围外,也能够作为IEC61937标准的范围内的音频比特流301来输出。特别是,根据本实施例1,仅变更前导信号中描述的SBR信息的有无,就能够执行它,因此,处理非常简单。
而且,在本实施例1中,说明了头部中记载的抽样率为24kHz(或22.05kHz、16kHz)且“没有SBR信息”的例子,但是,在头部中记载的抽样率为44.1kHz(或32kHz)且“存在SBR信息”的情况下,也能够同样处理。在此情况下,进行如下工作。
分析部101,分析基本音频流300的抽样率和音频编码数据形式。对于输入的基本音频流300,由分析部101分析如上所述、抽样率为44.1kHz、且包含SBR信息的状况。
接着,前导信号生成部102,按照分析部101的分析结果,生成IEC61937形式的音频比特流301中包含的前导信号。此时,在基本音频流300的抽样率为44.1kHz、且包含SBR信息的情况下,如图10示出,没有定义IEC61937形式的音频比特流,因此,前导信号生成部102,生成示出不包含SBR信息的前导信号。具体而言,前导信号生成部102,将前导信号Pc的第0至4位的5个位示出的值设定为23。据此,前导信号Pc示出,头部形式为LOAS形式。进而,前导信号生成部102,将前导信号Pc的第5至6位的两个位示出的值设定为1。据此,前导信号Pc示出,不包含SBR信息。也就是说,前导信号Pc示出,基本音频流300的音频编码数据形式为AAC方式。
接着,形成部103,将前导信号生成部102的输出的前导信号附加给基本音频流300。也就是说,形成部103,形成图7所示的IEC61937形式的音频比特流301。
最后,输出部104,将由形成部103形成的音频比特流301输出到外部设备。
据此,比特流发送装置200,即使输入的基本音频流300,在IEC61937标准的范围外,也能够作为IEC61937标准的范围内的音频比特流301来输出。
而且,若如上强制变更SBR信息,前导信号中包含的示出SBR的有无的信息、和编码数据中包含的示出SBR的有无的信息不匹配,但是,也可以预先固定为,在不匹配的情况下,根据前导信号中包含的示出SBR的有无的信息进行处理。如上所述,AAC的基本音频流和HEAAC的基本音频流具有再生兼容性,因此,即使是该不匹配的IEC61937形式的音频比特流,外部接收机也能够再生该流。
图4A以及图4B示出其想法。在图4A(a)至(b2)以及图4B(a)至(b2)中,横轴表示频率。
图4A(a)是,以频谱示出以HEAAC而被编码的基本音频流300中包含的频率成分的模式图。在图4A中,比抽样频率的1/4低频带的以实线示出的信号,以AAC方式而被编码,比抽样频率的1/4高频带的以虚线示出的信号,以SBR方式而被编码。
图4A(b1)示出,由HEAAC解码器对图4A(a)示出的HEAAC的信号进行处理时的频率成分。在此情况下,再生包含低频带以及高频带的双方的全频带的信号。
图4A(b2)示出,由AAC解码器对图4A(a)示出的HEAAC的信号进行处理时的频率成分。在此情况下,以SBR方式而被编码的高频带不被解码,仅以AAC方式而被编码的低频带的信号,由AAC解码器解码并再生。
图4B(a)是,以频谱示出以AAC而被编码的基本音频流300中包含的频率成分的模式图。在此情况下,全频带以AAC方式而被编码。
图4B(b1)示出,由HEAAC解码器对图4B(a)示出的AAC的信号进行处理时的频率成分。在此情况下,全频带的信号由HEAAC解码器解码并再生。
图4B(b2)示出,由AAC解码器对图4B(a)示出的AAC的信号进行处理时的频率成分。在此情况下,也与图4B示出的情况同样,全频带的信号由AAC解码器解码并再生。
也就是说,在实际上信号为HEAAC的情况下,即,在基本音频流300是以HEAAC音频编码数据形式而被编码的基本音频流的情况下,在由前导信号示出,基本音频流300以AAC而被编码的情况下,基本音频流300由AAC解码器处理。在此情况下,即使不能得到与本来的通过HEAAC而被解码时同样的音质,也再生通过AAC而被解码的可听音频(图4A(b2))。并且,即使假设前导信号示出AAC、实际上信号也为AAC,也可以通过HEAAC解码对该AAC的信号进行处理。也就是说,若通过HEAAC解码对该AAC的信号进行处理,则能够得到与本来的通过AAC而被解码时同样的音质(图4B(b2))。
(实施例1的应用例)
而且,在本实施例1中,利用“头部中记载的抽样率为24kHz(或22.05kHz、16kHz)且没有SBR信息”以及“头部中记载的抽样率为44.1kHz(或32kHz)且存在SBR信息”的例子,说明了解决第一问题的结构,但是,在“头部中记载的抽样率为48kHz且存在SBR信息”的情况下,也通过进行与所述同样的处理,从而能够解决第二问题。以下,对于“头部中记载的抽样率为48kHz且存在SBR信息”的情况的处理,进行详细说明。
首先,分析部101,分析基本音频流300的抽样率和音频编码数据形式。在此,对于输入的基本音频流300,如上所述,由分析部101分析抽样率为48kHz、且包含SBR信息的状况。
接着,前导信号生成部102,按照分析部101的分析结果生成IEC61937形式的前导信号。在抽样率为48kHz的情况下,如图10示出,在包含SBR信息的情况下,也在不包含的情况下,在任何情况下,都定义有IEC61937形式的音频比特流。但是,本实施例的前导信号生成部102,即使在包含SBR信息的情况下,总是,也生成示出不包含SBR信息的前导信号。具体而言,前导信号生成部102,将前导信号Pc的第0至4位的5个位示出的值设定为23。据此,前导信号Pc示出,头部形式为LOAS形式。进而,前导信号生成部102,将前导信号Pc的第5至6位的两个位示出的值设定为1。据此,前导信号Pc示出,基本音频流300中不包含SBR信息。也就是说,前导信号Pc,在抽样率为48kHz时,总是,生成示出基本音频流300以AAC方式而被编码的前导信号。
接着,形成部103,将前导信号生成部102生成的前导信号附加给基本音频流300。也就是说,形成部103,形成图7所示的IEC61937形式的音频比特流301。
最后,输出部104,将由形成部103形成的音频比特流301输出到外部设备。
据此,能够抑制实际的DTV广播等中的、输出抽样频率的切换的增加。例如,在数字广播中,在对于节目内容部分,以音频编码数据形式为HEAAC且AAC抽样率为48KHz来播放,另一方面,对于广告部分,以音频编码数据形式为AACLC且AAC抽样率为48KHz来播放的情况下,比特流发送装置,对于节目内容部分,以IEC60958帧率96KHz输出信号,对于广告部分以IEC60958的帧率48KHz输出信号。然而,如上由前导信号生成部102变更SBR信息的有无,从而能够防止在节目内容部分和广告部分的切换中发生再生帧率的变化。其结果为,不能期望基于频带扩展的节目内容部分的音质高的音频再生,但是,能够避免在比特流接收装置201中为了跟随IEC60958帧率的变化而需要花费时间所引起的跳音等的不良状况。
图5A至图5C是用于说明基于图10示出的流输出规定的流的传输例的图。在图5A至图5C中,记载有a、b、c以及d的文字的○示出前导信号Pa、Pb、Pc以及Pd,有阴影的○示出基本音频流,○示出作为用于调节数据长的无效的数据的填充数据。并且,在此,将传输的流的头部形式设为LOAS形式。
图5A是示出,例如,能够传输抽样率为48kHz且被AAC编码(没有SBR信息)的流的理由的图。在此,以32位表示1样本。比特流发送装置,由于是抽样频率为48kHz的基本音频流,因此,以48kHz×32bits=1536kbps的传输速度来传输数据。具体而言,规定为,按每21.333msec(48kHz且1024样本的时间),附加前导信号Pa、Pb、Pc以及Pd,依次传输32768位的1帧的信号。
对此,解码器,在48kHz的AAC的情况下,按每21.333msec生成PCM数据。据此,信号的提供率和解码器的处理率一致,因此,解码器能够对信号没有矛盾地进行处理。
图5B是示出,例如,不能传输抽样率为24kHz且被AAC编码(没有SBR信息)的流的理由的图。在抽样率为24kHz的信号的情况下,比特流发送装置,以24kHz×32bits=768kbps的传输速度来传输数据为好,但是,没有768kbps的模式。如果,比特流发送装置利用1536kbps的传输速度,则如图5B示出传输数据。在此情况下,解码器,针对按每21.333msec提供的信号,生成42.6667msec的PCM数据(因为24kHz且1024样本为42.6667msec),因此,相对于解码器的处理速度,来自比特流发送装置的信号的提供过剩。据此,流产生上溢。
图5C是示出,例如,能够传输抽样率为24kHz且被HEAAC编码(存在SBR信息)的流的理由的图。在以HEAAC而被编码的情况下,如图11A示出,即使AAC部的抽样率为24kHz,比特流发送装置,也将流整体视为抽样率为48kHz的信号,因此,以48kHz×32bits=1536kbps的传输速度来传输数据。具体而言,规定为,按每42.6667msec(48kHz且2048样本的时间),附加前导信号Pa、Pb、Pc以及Pd,按每1帧传输信号。
对此,解码器,在24kHz的HEAAC的情况下,按每42.6667msec,生成PCM数据,因此,信号的提供率和解码器的处理率一致。因此,解码器能够对信号没有矛盾地进行处理。
与所述同样,能够说明,能够传输抽样率为44.1kHz且被AAC编码的流、和抽样率为22.05kHz且被HEAAC编码的流,对此,不能传输抽样率为22.05kHz且被AAC编码的流的理由。并且,能够说明,能够传输抽样率为32kHz且被AAC编码的流、和抽样率为16kHz且被HEAAC编码的流,对此,不能传输抽样率为16kHz且被AAC编码的流的理由。
这是因为,输出的传输率1411.2kbps(=44.1kHz×32bits)、和1024kbps(=32kHz×32bits),分别由IEC60958标准化,因此,比特流发送装置能够利用它,但是,705.6kbps(=22.05kHz×32bits)、和512kbps(=16kHz×32bits),没有被标准化。
与所述例子不同,在抽样率48kHz中,能够将被AAC编码的流、和被HEAAC编码的流,都没有问题地传输。
其理由为,对于抽样率为48kHz且被AAC编码的流,由于抽样率为48kHz,因此,比特流发送装置,以48kHz×32bits=1536kbps的传输速度来传输数据。并且,规定为,按每21.333msec(48kHz且1024样本的时间),附加前导信号Pa、Pb、Pc以及Pd,按每1帧(32768位)传输信号。
对此,解码器,在48kHz的AAC的情况下,按每21.333msec生成PCM数据,因此,信号的提供率和解码器的处理率一致。因此,解码器能够对信号没有矛盾地进行处理。
并且,对于抽样率为48kHz且被HEAAC编码的流,比特流发送装置,将抽样率视为96kHz,因此,以96kHz×32bits=3072kbps的传输速度来传输数据。并且,规定为,按每21.333msec(96kHz且2048样本的时间)附加前导信号Pa、Pb、Pc以及Pd,按每1帧(32768位)传输信号。
对此,解码器,在48kHz的HEAAC的情况下,按每21.333msec生成PCM数据,因此,信号的提供率和解码器的处理率一致。因此,解码器能够对信号没有矛盾地进行处理。
如上所述,在基本音频流的抽样率48kHz且被编码的情况下,不管是AAC还是HEAAC,都能够没有问题地传输。另一方面,在抽样率48kHz且被AAC编码的的流、和以抽样率48kHz且被HEAAC编码的流切换的情况下,传输率为1536kbps的流、和传输率为3072kbps的流切换。此时,在比特流收发系统整体中需要,例如,像切换A/D转换器的工作频率那样的、重新得到同步的处理。这样的重新得到比特流收发系统整体的同步的处理需要花费时间,因此,在抽样率的切换时产生时滞。例如,会有产生像在节目正编和CM的连接部分声音间断那样的不良状况的情况。
对此,将抽样率为48kHz且被HEAAC编码(存在SBR)的流,作为没有SBR来传输,从而能够将传输率设为一定的抽样率。据此,能够防止跳音等的不良状况。
而且,在所述实施例中,比特流收发系统,在抽样率的切换时产生时滞,因此,在基本音频流的抽样率为48kHz的情况下,不管是在基本音频流以HEAAC而被编码的情况下,还是在以AAC而被编码的情况下,总是,都视为以AAC而被编码来进行处理,但是,本发明不仅限于此。例如,若不介意抽样率的切换时产生的时滞,比特流收发系统也可以,视为基本音频流总是HEAAC的信号来进行处理。
(实施例2)
以下,对于本发明的实施例2的比特流收发系统210,参照附图进行说明。
图6是示出本实施例2的比特流收发系统的结构的图。在图6中,实施例2的比特流收发系统210具备,比特流发送装置1000和比特流接收装置1001。
比特流发送装置1000具备,输入部100、分析部101、形成部103、输出部104以及前导信号生成部1010。在比特流发送装置1000中,对于附加了与比特流发送装置200的各个处理部相同的参照符号的处理部,由于与实施例1的图1所记载的处理部相同,因此省略说明。以下,主要说明前导信号生成部1010。
前导信号生成部1010,从比特流接收装置1001,接收该比特流接收装置1001的能力信息,根据接收的能力信息,变更前导信号Pc中包含的、示出基本音频流的音频编码数据形式的信息。具体而言,前导信号生成部1010,根据从比特流接收装置1001接收的能力信息,判断比特流接收装置1001是否具有将抽样率为48kHz且通过HEAAC而被编码的基本音频流300解码的能力。在判断为比特流接收装置1001具有将抽样率为48kHz且通过HEAAC而被编码的基本音频流300解码的能力的情况下,前导信号生成部1010,与所述实施例1不同,在实际的基本音频流300的抽样率为48kHz且通过HEAAC而被编码的情况下,生成示出通过HEAAC而被编码的前导信号Pc。具体而言,前导信号生成部1010,将前导信号Pc的第0至4位的5个位示出的值设定为23。据此,前导信号Pc示出,头部形式为LOAS形式。进而,前导信号生成部1010,将前导信号Pc的第5至6位的两个位示出的值设定为2。据此,前导信号Pc示出,基本音频流300中包含SBR信息。也就是说,前导信号Pc示出,基本音频流300以HEAAC方式而被编码。
针对所述的比特流发送装置1000,实施例2的比特流接收装置1001,接收从比特流发送装置1000发送的音频比特流301,对接收的音频比特流301进行解码。比特流接收装置1001具备,前导信号消除部202、基本音频流解码部203以及能力信息通知部1011。在图6中,对于附加了与比特流接收装置201的各个处理部相同的参照符号的处理部,由于与实施例1的图2所记载的处理部相同,且已经进行说明,因此省略说明。以下,主要说明能力信息通知部1011。
能力信息通知部1011,在内部的存储器存储有能力信息,该能力信息示出,比特流接收装置1001内的基本音频流解码部203,是否能够对抽样率为48kHz且被HEAAC编码的基本音频流300进行解码。能力信息通知部1011,在有来自比特流发送装置1000的能力信息的发送请求时,将存储器所存储的能力信息,通知给比特流发送装置1000的前导信号生成部1010。
根据这样的结构,比特流发送装置1000,在比特流接收装置1001内的基本音频流解码部203具备对抽样率为48kHz且被HEAAC编码的基本音频流进行解码的能力时,即使在基本音频流300的抽样率为48kHz的情况下,也在以HEAAC而被编码时,能够在前导信号Pc中描述示出存在SBR信息的参数。因此,在以AAC而被编码的内容和以HEAAC而被编码的内容的连接部分声音间断的不良状况不成问题的情况下,比特流接收装置1001能够,根据从比特流发送装置1000传输的音频比特流301中包含的前导信号,对基本音频流300进行解码。据此,得到的效果是,用户,能够以频带扩展到高频带的高音质来享受以HEAAC而被编码的内容。
并且,即使在比特流接收装置1001的基本音频流解码部203,具备对抽样率为48kHz且以HEAAC而被编码的流进行解码的能力的情况下,比特流接收装置1001,也可以敢于不对比特流发送装置1000通知能力信息。在此情况下,比特流接收装置1001也可以,例如,解释从实施例1的比特流发送装置200接收的音频比特流301中提取的基本音频流300的头部以及Extension_payload,在基本音频流300中包含SBR信息的情况下,根据该SBR信息对基本音频流300进行解码。进而,并且,即使在从音频比特流301中提取的基本音频流300中不包含SBR信息的情况下,比特流接收装置1001也可以,进行频带扩展到高频带的HEAAC解码。
前导信号生成部1010,在根据分析部101的分析结果得到的抽样频率为预先规定的第二频率的情况下,记载所述基本音频流中不包含SBR信息的编码形式,以作为前导信号内存在的示出所述编码形式的信息。据此,例如,即使在实际的DTV广播等中,对于节目内容部分,以音频编码数据形式为HEAAC且AAC抽样率为48KHz来播放,另一方面,对于广告部分,以音频编码数据形式为AACLC且AAC抽样率为48KHz来播放的情况下,最终的解码信号的抽样率也不会变动。因此,节目内容和CM部分的切换部分会顺利转移。据此,在基本音频流300的抽样频率为48kHz且通过HEAAC而被编码、比特流接收装置1001具备对它进行解码的能力的情况下,该比特流接收装置1001,能够再生通过HEAAC而被解码的音质高的音频信号。
并且,对于实际的DTV广播,在以抽样率为24kHz、且“存在SBR信息”来播放的情况下,即使在因广播波的接收状态不良等而产生信号的不良状况且欠缺了SBR信息的情况下,也能够将最终的输出信号的抽样率保持为一定。如此,该比特流收发系统,能够减少接收状态不良的影响。
而且,在本实施例中,前导信号消除部202提取SBR有无信息,将该信息发送给基本音频流解码部203,但是,不像所述那样,在基本音频流300示出的抽样率为16kHz至24kHz的情况下,比特流接收装置也可以,总是在“存在SBR信息”的前提下,对基本音频流300进行解码。并且,反而,在基本音频流300示出的抽样率为32kHz至48kHz的情况下,比特流接收装置也可以,总是在“没有SBR信息”的前提下,对基本音频流300进行解码。
以上,说明了本发明的实施例涉及的比特流发送装置以及比特流收发系统,但是,本发明不仅限于该实施例。
并且,所述实施例涉及的比特流发送装置或比特流收发系统包括的各个处理部,以作为典型的集成电路的LSI来实现。可以将它们分别单芯片化,也可以将它们单芯片化,使得包含一部分或全部。
并且,也可以是,通过CPU等的处理器执行程序,从而实现比特流发送装置或比特流收发系统的功能的一部分或全部。
并且,本发明可以是所述程序,也可以是记录有所述程序的非暂时的计算机可读取的记录介质。并且,当然,能够通过互联网等的传输介质来分发所述程序。
并且,也可以组合所述实施例1至2涉及的比特流发送装置及比特流收发系统以及其变形例的功能中的至少一部分。
并且,方框图的功能框的划分是一个例子,也可以将多个功能框作为一个功能框来实现、将一个功能框划分为多个、或者将一部分的功能转移到其他的功能框。并且,对具有类似的功能的多个功能框的功能,由单一的硬件或软件,进行并行或时分的处理。
进而,在不脱离本发明的要旨的范围内所进行的本领域的技术人员能够想到的各种变形也包含在本发明的范围内。
工业实用性
本发明涉及的比特流发送装置,具备变更关于SBR信息的有无的信息的手段,因此,即使在输入了由IEC61937标准没有义的比特流的情况下,也能够利用IEC61937标准来发送比特流。因此,本发明,能够广泛地适用于DTV广播的接收机、以及从音频编码信号被存放的记录介质中读出信号来再生的再生设备。并且,本发明,能够抑制音频编码数据形式不同的内容的切换时的抽样率的变化,因此,能够享受没有间断且良好的再生音。
符号说明
100输入部
101分析部
102、1010前导信号生成部
103形成部
104输出部
200、1000比特流发送装置
201、1001比特流接收装置
202前导信号消除部
203基本音频流解码部
210比特流收发系统
220电视机
221解码器
2222通道下混部
223扬声器
230影院系统
231多通道扬声器
300基本音频流
301音频比特流
1011能力信息通知部

Claims (17)

1.一种比特流发送装置,发送规定的形式的音频比特流,所述比特流发送装置具备:
输入部,获得对音频信号进行编码而得到的基本音频流;
分析部,分析所述基本音频流的抽样频率和编码形式;
前导信号生成部,按照所述分析部的分析结果,生成包含示出所述基本音频流的编码形式的信息的前导信号;
形成部,将所述前导信号生成部生成的所述前导信号附加给所述基本音频流,从而形成所述规定的形式的音频比特流;以及
输出部,输出由所述形成部形成的所述音频比特流,
所述前导信号生成部,按照根据所述分析部的分析结果而得到的所述抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载。
2.如权利要求1所述的比特流发送装置,
所述前导信号生成部,以从所述输出部输出的数据的输出传输速度在预先规定的范围内的方式,记载所述前导信号内的示出所述编码形式的信息。
3.如权利要求1所述的比特流发送装置,
所述规定的形式的音频比特流是IEC61937标准所规定的音频比特流,
在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第一频率的情况下,在与所述第一频率对应的所述编码形式在所述IEC61937标准的对应范围外时,所述前导信号生成部,将在所述基本音频流中的频带复制信息的有无这一点与被分析的所述编码形式不同的编码形式,作为示出所述编码形式的信息来记载,从而生成所述音频比特流成为IEC61937标准的对应范围内的前导信号。
4.如权利要求3所述的比特流发送装置,
所述前导信号生成部,进一步,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第二频率的情况下,将所述基本音频流以不包含所述频带复制信息的编码形式而被编码的状况,作为所述前导信号内的示出所述编码形式的信息来记载。
5.如权利要求3所述的比特流发送装置,
所述前导信号生成部,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第三频率的情况下,即使所述基本音频流没有以包含所述频带复制信息的所述编码形式而被编码,也生成示出以包含所述频带复制信息的编码形式而被编码的前导信号。
6.如权利要求3所述的比特流发送装置,
所述前导信号生成部,在根据所述分析部的分析结果而得到的所述抽样频率为预先规定的第四频率的情况下,即使所述基本音频流以包含所述频带复制信息的所述编码形式而被编码,也生成示出以不包含所述频带复制信息的编码形式而被编码的前导信号。
7.一种比特流收发系统,是具备权利要求1所述的比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,
所述比特流接收装置,具备:
前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及
基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
8.一种比特流收发系统,是具备权利要求5所述的比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,
所述比特流接收装置,具备:
前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及
基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,进行使将要扩展为高频带的信号成为0的、利用了所述频带复制信息的解码处理。
9.一种比特流收发系统,是具备权利要求6所述的比特流发送装置、以及比特流接收装置的比特流收发系统,所述比特流接收装置,接收从该比特流发送装置发送的音频比特流,并对接收的所述音频比特流进行解码,
所述比特流接收装置,具备:
前导信号消除部,通过从接收的所述音频比特流中消除所述前导信号,从而提取所述基本音频流;以及
基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,生成利用所述频带复制信息来进行解码处理时的抽样频率的1/2的抽样频率的信号。
10.如权利要求7至9的任一项所述的比特流收发系统,
所述比特流接收装置具有能力通知部,该能力通知部,将示出该比特流接收装置的能力的信息通知给所述比特流发送装置,
所述分析部,分析示出所述基本音频流的抽样率的FS信息,
所述前导信号生成部,在该FS信息为预先规定的值的情况下,与来自所述能力通知部的信息对应,对是否生成示出包含频带复制信息的前导信号进行切换。
11.一种比特流接收装置,具备:
接收部,从比特流发送装置接收如下音频比特流,所述音频比特流是指,向对音频信号进行编码而得到的基本音频流,附加包含示出所述基本音频流的编码形式的信息的前导信号而形成的规定的形式的音频比特流,并且,在所述音频比特流中,在所述基本音频流的抽样频率和所述编码形式不符合所述音频比特流的所述规定的形式的情况下,将符合所述音频比特流的所述规定的形式的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载;
前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及
基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
12.如权利要求11所述的比特流接收装置,
所述比特流接收装置接收如下音频比特流,在所述音频比特流中,在所述基本音频流的所述抽样频率为预先规定的第三频率的情况下,即使所述基本音频流没有以包含频带复制信息的所述编码形式而被编码,也包含示出以包含所述频带复制信息的编码形式而被编码的前导信号,
所述基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,进行使将要扩展为高频带的信号成为0的、利用了所述频带复制信息的解码处理。
13.如权利要求11所述的比特流接收装置,
所述比特流接收装置接收如下音频比特流,在所述音频比特流中,在所述基本音频流的所述抽样频率为预先规定的第四频率的情况下,即使所述基本音频流以包含频带复制信息的所述编码形式而被编码,也包含示出以不包含所述频带复制信息的编码形式而被编码的前导信号,
所述基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,根据所述前导信号中记载的示出所述编码形式的信息,生成利用所述频带复制信息来进行解码处理时的抽样频率的1/2的抽样频率的信号。
14.一种比特流发送方法,是发送规定的形式的音频比特流的比特流发送方法:
获得对音频信号进行编码而得到的基本音频流;
分析所述基本音频流的抽样频率和编码形式;
按照所述分析结果,生成包含示出所述基本音频流的编码形式的信息的前导信号;
将生成的所述前导信号附加给所述基本音频流,从而形成所述规定的形式的音频比特流;
输出被形成的所述音频比特流;
在所述前导信号的生成中,按照根据所述分析结果而得到的所述抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载。
15.一种比特流接收方法,
从比特流发送装置接收如下音频比特流,所述音频比特流是指,向对音频信号进行编码而得到的基本音频流,附加包含示出所述基本音频流的编码形式的信息的前导信号而形成的规定的形式的音频比特流,并且,在所述音频比特流中,按照所述基本音频流的抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载;
通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;
在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
16.一种集成电路,具备:
输入部,获得对音频信号进行编码而得到的基本音频流;
分析部,分析所述基本音频流的抽样频率和编码形式;
前导信号生成部,按照所述分析部的分析结果,生成包含示出所述基本音频流的编码形式的信息的前导信号;
形成部,将所述前导信号生成部生成的所述前导信号附加给所述基本音频流,从而形成规定的形式的音频比特流;以及
输出部,输出由所述形成部形成的所述音频比特流,
所述前导信号生成部,按照根据所述分析部的分析结果而得到的所述抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载。
17.一种集成电路,具备:
接收部,从比特流发送装置接收如下音频比特流,所述音频比特流是指,向对音频信号进行编码而得到的基本音频流,附加包含示出所述基本音频流的编码形式的信息的前导信号而形成的规定的形式的音频比特流,并且,在所述音频比特流中,按照所述基本音频流的抽样频率和所述编码形式,将符合所述音频比特流的所述规定的形式的编码形式、且与根据所述基本音频流的分析结果而得到的编码形式不同的编码形式,作为所述前导信号内的示出所述编码形式的信息来记载;
前导信号消除部,通过消除接收的所述音频比特流中包含的所述前导信号,从而提取所述基本音频流;以及
基本音频流解码部,在所述前导信号中记载的示出所述基本音频流的编码形式的信息、与所述基本音频流中包含的示出所述基本音频流的编码形式的信息不匹配的情况下,以所述前导信号中记载的示出编码形式的信息所示的编码形式,对所述基本音频流进行解码。
CN201280023907.9A 2011-05-20 2012-05-16 比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流 Active CN103620678B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011114178 2011-05-20
JP2011-114178 2011-05-20
PCT/JP2012/003205 WO2012160782A1 (ja) 2011-05-20 2012-05-16 ビットストリーム送信装置、ビットストリーム送受信システム、ビットストリーム受信装置、ビットストリーム送信方法、ビットストリーム受信方法及びビットストリーム

Publications (2)

Publication Number Publication Date
CN103620678A CN103620678A (zh) 2014-03-05
CN103620678B true CN103620678B (zh) 2015-08-19

Family

ID=47216875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280023907.9A Active CN103620678B (zh) 2011-05-20 2012-05-16 比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流

Country Status (4)

Country Link
EP (1) EP2711924B1 (zh)
JP (1) JP5843856B2 (zh)
CN (1) CN103620678B (zh)
WO (1) WO2012160782A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101427756B1 (ko) * 2013-04-26 2014-08-08 주식회사 코아로직 멀티 채널의 오디오 신호 전송 방법 및 장치
WO2016039287A1 (ja) * 2014-09-12 2016-03-17 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
CN104392724A (zh) * 2014-12-11 2015-03-04 福建联迪商用设备有限公司 一种音频通讯的方法及装置
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US11283561B2 (en) * 2017-09-11 2022-03-22 Cohere Technologies, Inc. Wireless local area networks using orthogonal time frequency space modulation

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100265112B1 (ko) * 1997-03-31 2000-10-02 윤종용 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법
JP2004007359A (ja) * 2002-04-08 2004-01-08 Matsushita Electric Ind Co Ltd マルチメディアデータ復号装置
WO2004112021A2 (en) * 2003-06-17 2004-12-23 Matsushita Electric Industrial Co., Ltd. Receiving apparatus, sending apparatus and transmission system
JP2006050387A (ja) * 2004-08-06 2006-02-16 Matsushita Electric Ind Co Ltd データ再生方法、およびデータ再生装置
US8068722B2 (en) * 2004-10-07 2011-11-29 Panasonic Corporation Information storage medium, TS packet judgement apparatus, and data reproduction apparatus
JP2006202353A (ja) * 2005-01-18 2006-08-03 Matsushita Electric Ind Co Ltd Mpeg2トランスポート・ストリームの管理情報の補正機能を有する再生装置
KR101194902B1 (ko) * 2005-02-24 2012-10-25 파나소닉 주식회사 데이터 재생장치
JP4613674B2 (ja) * 2005-04-11 2011-01-19 パナソニック株式会社 音声再生装置
JP2006317575A (ja) * 2005-05-11 2006-11-24 Matsushita Electric Ind Co Ltd オーディオ復号装置
JP2007017628A (ja) * 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
CN101740032A (zh) * 2008-11-19 2010-06-16 北京中星微电子有限公司 音频编、解码方法和音频编、解码装置
CN101409093B (zh) * 2008-11-28 2011-06-15 炬力集成电路设计有限公司 一种确定音频数据采样点位置的方法及装置

Also Published As

Publication number Publication date
EP2711924A4 (en) 2015-04-01
CN103620678A (zh) 2014-03-05
JPWO2012160782A1 (ja) 2014-07-31
EP2711924A1 (en) 2014-03-26
WO2012160782A1 (ja) 2012-11-29
EP2711924B1 (en) 2018-11-14
JP5843856B2 (ja) 2016-01-13

Similar Documents

Publication Publication Date Title
US7970602B2 (en) Data reproduction device
US20040252036A1 (en) Bit stream conversion system
KR101063562B1 (ko) 수신 장치, 전송 장치 및 송신 시스템
CN103620678B (zh) 比特流发送装置及方法、比特流收发系统、比特流接收装置及方法、以及比特流
US20060069550A1 (en) Continuous backup audio
EP1472889B1 (en) Audio coding
EP3210206B1 (en) Encoding and decoding of audio signals
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
US11025406B2 (en) Audio return channel clock switching
US11514921B2 (en) Audio return channel data loopback
KR101038442B1 (ko) 매립된 데이터의 시그널링
CN102075817A (zh) 音视频数据的转发方法和系统
JP4613674B2 (ja) 音声再生装置
KR100917844B1 (ko) 멀티채널 오디오 신호를 전송 또는 재생하는 장치 및 방법
KR100609173B1 (ko) Aac복호화 방법
JP5957050B2 (ja) 放送信号受信装置、テレビジョン受像機、制御プログラム、および記録媒体
JP2006050387A (ja) データ再生方法、およびデータ再生装置
EP1909266B1 (en) Signal processing apparatus, signal processing method, and computer program thereof
KR980013417A (ko) 오디오 데이터 전송 방법 및 그 장치
US8515239B2 (en) Method and device for encoding vibro-kinetic data onto an LPCM audio stream over an HDMI link
KR100516733B1 (ko) 돌비 프로로직 오디오 장치
KR20070003574A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR100191314B1 (ko) 멀티채널 오디오신호의 재생장치
KR100767669B1 (ko) 디지털 멀티미디어 방송 수신장치의 오디오 스트림 저장장치 및 방법
KR20010045955A (ko) 디지탈 오디오 복호화장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SUOSI FUTURE CO., LTD.

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20150727

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150727

Address after: Kanagawa

Applicant after: Co., Ltd. Suo Si future

Address before: Osaka Japan

Applicant before: Matsushita Electric Industrial Co., Ltd.

C14 Grant of patent or utility model
GR01 Patent grant