[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

RU2718418C2 - Устройство декодирования, способ декодирования и программа - Google Patents

Устройство декодирования, способ декодирования и программа Download PDF

Info

Publication number
RU2718418C2
RU2718418C2 RU2018115550A RU2018115550A RU2718418C2 RU 2718418 C2 RU2718418 C2 RU 2718418C2 RU 2018115550 A RU2018115550 A RU 2018115550A RU 2018115550 A RU2018115550 A RU 2018115550A RU 2718418 C2 RU2718418 C2 RU 2718418C2
Authority
RU
Russia
Prior art keywords
decoding
frame
unit
boundary position
encoded
Prior art date
Application number
RU2018115550A
Other languages
English (en)
Other versions
RU2018115550A (ru
RU2018115550A3 (ru
Inventor
Мицуюки ХАТАНАКА
Тору ТИНЕН
Минору ЦУДЗИ
Хироюки ХОНМА
Original Assignee
Сони Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Сони Корпорейшн filed Critical Сони Корпорейшн
Publication of RU2018115550A publication Critical patent/RU2018115550A/ru
Publication of RU2018115550A3 publication Critical patent/RU2018115550A3/ru
Application granted granted Critical
Publication of RU2718418C2 publication Critical patent/RU2718418C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

Изобретение относится к средствам кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования. Каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодирован на основе кадров после процесса MDCT. Определяют положение границы для переключения вывода множества кодированных битовых аудиопотоков. Выборочно подают один из множества полученных кодированных битовых аудиопотоков на этап обработки декодирования в соответствии с положением границы. Применяют процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, поданных выборочно. При этом на этапе обработки декодирования пропускают наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы. 3 н. и 7 з.п. ф-лы, 13 ил.

Description

Область техники, к которой относится изобретение
Представленное раскрытие относится к устройству декодирования, способу декодирования и к программе и, в частности, к устройству декодирования, способу декодирования и к программе, пригодным для использования при переключении выхода между кодированными битовыми аудиопотоками, у которых моменты воспроизведения синхронизированы.
Уровень техники
Например, звуки на множестве языков (например, на японском и английском) подготавливаются в некоторых видео для контента кинофильмов, новостей, прямых спортивных передач и т.п. и в этом случае моменты воспроизведения множества звуков синхронизируются.
Здесь далее предполагается, что все звуки с синхронизированными моментами воспроизведения подготавливаются как кодированные битовые аудиопотоки и процесс кодирования, такой как AAC (Advanced Audio Coding, перспективное звуковое кодирование), в том числе, по меньшей мере, процесс MDCT (Modified Discrete Cosine Transform, модифицированное дискретное косинусное преобразование), выполняется для применения кодирования с переменной длиной к кодированным битовым аудиопотокам. Заметим, что система кодирования звуков AAC MPEG-2, содержащая процесс MDCT, адаптируется в цифровое наземное телевизионное вещание (например, смотрите NPL 1).
На фиг. 1 упрощенно показан пример традиционной конфигурации устройства кодирования, которое применяет процесс кодирования к звуковым исходным данным, и устройства декодирования, которое применяет процесс декодирования к кодированному битовому аудиопотоку, выводимому из устройства кодирования.
Устройство 10 кодирования содержит блок 11 MDCT, блок 12 квантования и блок 13 кодирования с переменной длиной.
Блок 11 MDCT делит исходные звуковые данные, введенные на более раннем этапе, на кадры заданной длительности и выполняет процесс MDCT, так чтобы предыдущий и последующий кадры накладывались друг на друга. Таким образом, блок 11 MDCT преобразует исходные данные со значениями во временной области в значения в частотной области и выводит значения на блок 12 квантования. Блок 12 квантования квантует входной сигнал, поступающий от блока 11 MDCT, и выводит значения на блок 13 кодирования с переменной длиной. Блок 13 кодирования с переменной длиной применяет кодирование с переменной длиной к квантованным значениям, чтобы сформировать и вывести кодированный битовый аудиопоток.
Устройство 20 декодирования монтируется, например, на приемном устройстве, принимающем широковещательный или распределенный контент, или на устройстве воспроизведения, воспроизводящем контент, записанный на носителе для записи, и устройство 20 декодирования содержит блок 21 декодирования, блок 22 инверсного квантования и блок 23 IMDCT (Inverse MDCT, инверсного MDCT).
Блок 21 декодирования, соответствующий блоку 13 кодирования с переменной длиной, применяет процесс декодирования к кодированному битовому аудиопотоку на основе кадров, и выводит декодированный результат на блок 22 инверсного квантования. Блок 22 инверсного квантования, соответствующий блоку 12 квантования, применяет инверсное квантование к результату декодирования и выводит результат процесса на блок 23 IMDCT. Блок 23 IMDCT, соответствующий блоку 11 MDCT, применяет процесс IMDCT к результату инверсного квантования, чтобы реконструировать данные PCM, соответствующие исходным данным перед кодированием. Процесс IMDCT, выполняемый блоком 23 IMDCT, будет описан подробно.
На фиг. 2 показан процесс IMDCT, выполняемый блоком 23 IMDCT.
Как показано на фиг. 2, блок 23 IMDCT применяет процесс IMDCT к кодированным битовым аудиопотокам (результатам инверсного квантования кодированных битовых аудиопотоков) BS1-1 и BS1-2 двух, предыдущего и последующего, кадров (Frame#1, кадр 1, и Frame#2, кадр 2), чтобы получить IMDCT-OUT#1-1 в качестве результата инверсного преобразования. Блок 23 IMDCT также применяет процесс IMDCT к кодированным битовым аудиопотокам (результатам инверсного квантования кодированных битовых аудиопотоков) BS1-2 и BS1-3 двух кадров (Frame#2, кадр 2, и Frame#3, кадр 3), накладывающимся на кодированные битовые аудиопотоки, описанные выше, чтобы получить IMDCT-OUT#1-2 в качестве результата инверсного преобразования. Блок 23 IMDCT дополнительно применяет наложение и добавление для IMDCT-OUT#1-1 и IMDCT-OUT#1-2, чтобы полностью реконструировать данные PCM1-2, которые являются данными PCM, соответствующими кадру 2 (Frame#2).
Данные 1-3 PCM, … соответствующие кадру 3 (Frame#3) и последующим кадрам также полностью реконструируются подобным способом.
Однако, термин "полностью", используемый здесь, означает, что данные PCM реконструируются, используя процесс вплоть до наложения и добавления, и этот термин не означает, что исходные данные воспроизводятся на 100%.
Перечень литературы
Непатентная литература
NPL 1
ARIB STD-B32, версия 2.2, 29 июля 2015 г.
Раскрытие сущности изобретения
Технические проблемы
Здесь будет рассмотрено переключение множества кодированных битовых аудиопотоков с синхронизированными моментами воспроизведения настолько быстро, насколько возможно, чтобы таким образом декодировать и вывести множество кодированных битовых аудиопотоков.
На фиг. 3 показан традиционный способ переключения первого кодированного битового аудиопотока на второй кодированный битовый аудиопоток, в котором момент воспроизведения синхронизирован.
Как показано на фиг. 3, когда положение границы переключения устанавливается между кадром 2 (Frame#2) и кадром 3 (Frame#3) и первый кодированный битовый аудиопоток должен переключиться на второй кодированный битовый аудиопоток, данные вплоть до PCM1-2, соответствующие кадру 2 (Frame#2), декодируются и выводятся для первого кодированного битового аудиопотока. Данные из PCM2-3, соответствующие кадру 3 (Frame#3), декодируются и выводятся для второго кодированного битового аудиопотока после переключения.
В данном случае, результаты обратного преобразования IMDCT-OUT#1-1 и IMDCT-OUT#1-2 необходимы для получения PCM1-2, как описано со ссылкой на фиг. 2. Аналогично, результаты обратного преобразования IMDCT-OUT#2-2 и IMDCT-OUT#2-3 необходимы для получения PCM2-3. Следовательно, чтобы выполнить переключение, показанное на фиг. 3, процесс декодирования, содержащий процесс IMDCT, необходимо применять к первому и второму кодированным битовым аудиопотокам параллельно и в одно и то же время в течение периода между кадром 2 (Frame#2) и кадром 3 (Frame#3).
Однако, чтобы выполнить процесс декодирования, содержащий процесс IMDCT, параллельно и в одно и то же время, необходимо множество фрагментов аппаратных средств со схожей конфигурацией, чтобы реализовать процесс декодирования, содержащий процесс IMDCT, посредством аппаратных средств, и это увеличивает размеры схем и повышает стоимость.
Дополнительно, чтобы реализовать процесс декодирования, содержащий процесс IMDCT, посредством программного обеспечения, в зависимости от производительности CPU могут возникнуть проблемы, такие как прерывание звука и ненормальный звук. Следовательно, для предотвращения проблем необходим высокопроизводительный CPU и это также увеличивает затраты.
Представленное раскрытие было сделано с точки зрения обстоятельств и представленное раскрытие предназначено для переключения, как можно быстрее, множества кодированных битовых аудиопотоков с синхронизированным моментом переключения, чтобы таким образом декодировать и вывести множество кодированных битовых аудиопотоков без увеличения размеров схем или увеличения затрат.
Решение проблем
Вариант представленного раскрытия обеспечивает устройство декодирования, содержащее: блок сбора данных, получающий множество кодированных битовых аудиопотоков, в которых каждый из множествп фрагментов исходных данных с синхронизированным моментом воспроизведения кодируется на основе кадров после процесса MDCT; блок выбора, определяющий положение границы для переключения выхода множества кодированных битовых аудиопотоков и выборочно подающий один из множества кодированных битовых аудиопотоков на блок процесса декодирования, соответствующий положению границы; и блок процесса декодирования, применяющий процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, введенному через блок выбора, в котором блок процесса декодирования пропускает наложение и добавление в процессе IMDCT, соответствующем каждому из кадров перед и после положения границы.
Устройство декодирования, соответствующее варианту представленного раскрытия, может дополнительно содержать блок процесса плавного регулирования громкости, применяющий процесс плавного регулирования громкости к результатам процесса декодирования кадров перед и после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
Блок процесса плавного регулирования громкости может применять процесс плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применять процесс медленного увеличения громкости к результату процесса декодирования кадра после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
Блок процесса плавного регулирования громкости может применять процесс плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применять процесс глушения к результату процесса декодирования кадра после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
Блок процесса плавного регулирования громкости может применять процесс глушения к результату процесса декодирования кадра перед положением границы и применять процесс плавного увеличения громкости к результату процесса декодирования после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
Блок выбора может определять положение границы на основе флага оптимального положения переключения, который добавляется к каждому кадру и который устанавливается поставщиком множества кодированных битовых аудиопотоков.
Флаг оптимального положения переключения может быть установлен поставщиком кодированных битовых аудиопотоков на основе энергии или контекста исходных данных.
Блок выбора может определять положение границы на основе информации, связанной с коэффициентом усиления множества кодированных битовых аудиопотоков.
Вариант представленного раскрытия обеспечивает способ декодирования, выполняемый устройством декодирования, причем упомянутый способ декодирования содержит: этап сбора данных, на котором получают множество кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодируется на основе кадров после процесса MDCT; этап определения, на котором определяют положение границы для переключения выхода множества кодированных битовых аудиопотоков; этап выбора, на котором выборочно подают один из множества полученных кодированных битовых аудиопотоков на этап процесса декодирования в соответствии с положением границы; и этап процесса декодирования, на котором применяют процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, подаваемому выборочно, в котором в блоке процесса декодирования пропускаются наложение и добавление в процессе IMDCT, соответствующем каждому из кадров перед и после положения границы.
Вариант представленного раскрытия обеспечивает программу для функционирования в качестве: блока сбора данных, получающего множество кодированных битовых аудиопотоков, в которых множество фрагментов исходных данных с синхронизированным моментом воспроизведения кодируются на основе кадров после процесса MDCT; блока выбора, определяющего положение границы для переключения выхода множества кодированных битовых аудиопотоков и выборочной подачи одного из множества кодированных битовых аудиопотоков на блок процесса декодирования, соответствующий положению границы; и блока процесса декодирования, применяющего процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, введенному через блок выбора, в котором блок процесса декодирования пропускает наложение и добавление в процессе IMDCT, соответствующем каждому из кадров перед и после положения границы.
В соответствии с вариантом представленного раскрытия, получают множество кодированных битовых аудиопотоков и определяют положение границы для переключения выхода множества кодированных битовых аудиопотоков. Процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, применяется к одному из множества кодированных битовых потоков, выборочно подаваемых в соответствии с положением границы. В процессе декодирования пропускаются наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после границы кадра.
Полезный результат изобретения
В соответствии с вариантом представленного раскрытия, множество кодированных битовых аудиопотоков с синхронизированным моментом воспроизведения могут переключаться настолько быстро, насколько возможно, чтобы таким образом декодировать и выводить множество кодированных битовых аудиопотоков.
Краткое описание чертежей
Фиг. 1 - блок-схема примера конфигурации устройства кодирования и устройства декодирования.
Фиг. 2 - процесс IMDCT.
Фиг. 3 - переключение кодированного битового аудиопотока.
Фиг. 4 - блок-схема примера конфигурации устройства декодирования, соответствующего представленному раскрытию.
Фиг. 5 - первый способ переключения кодированного битового аудиопотока устройством декодирования, показанным на фиг. 4.
Фиг. 6 - блок-схема последовательности выполнения операций процесса переключения звука.
Фиг. 7 - блок-схема последовательности выполнения операций процесса установки флага оптимального положения переключения.
Фиг. 8 - состояние процесса установки флага оптимального положения переключения.
Фиг. 9 - блок-схема последовательности выполнения операций процесса определения положения границы переключения.
Фиг. 10 - состояние процесса определения положения границы переключения.
Фиг. 11 - второй способ переключения кодированного битового аудиопотока устройством декодирования, показанным на фиг. 4.
Фиг. 12 - третий способ переключения кодированного битового аудиопотока устройством декодирования, показаннм на фиг. 4.
Фиг. 13 - блок-схема примера конфигурации универсального компьютера.
Осуществление изобретения
Здесь далее предпочтительный способ осуществления представленного раскрытия (здесь далее упоминаемый как вариант осуществления) будет описан подробно со ссылкой на чертежи.
Пример конфигурации устройства декодирования как вариант осуществления представленного раскрытия
На фиг. 4 показан пример конфигурации устройства декодирования в качестве варианта осуществления представленного раскрытия.
Устройство 30 декодирования монтируется, например, на приемном устройстве, принимающем широковещательный или распределенный контент, или на устройстве воспроизведения, воспроизводящем контент, записанный на носителе записи. Дополнительно, устройство 30 декодирования может быстро переключать первый и второй кодированные битовые аудиопотоки с синхронизированным моментом воспроизведения, чтобы декодировать и вывести битовые потоки.
Предполагается, что процесс кодирования, содержащий, по меньшей мере процесс MDCT, выполняется для применения кодирования с переменной длиной к исходным данным звука в первом и втором кодированных битовых аудиопотоках. Здесь далее первый и второй кодированные битовые аудиопотоки будут также упоминаться просто как первый и второй кодированные битовые потоки.
Устройство 30 декодирования содержит блок 31 демультиплексирования, блоки 32-1 и 32-2 декодироания, блок 33 выбора, блок 34 процесса декодирования и блок 37 плавного регулирования громкости.
Блок 11 демультиплексирования отделяет первый кодированный битовый поток и второй кодированный битовый поток с синхронизированным моментом воспроизведения от мультиплексированного потока, введенного на более раннем этапе. Блок 11 демультиплексирования дополнительно выводит первый кодированный битовый поток на блок 32-1 декодирования и выводит второй кодированный поток на блок декодирования 32-2.
Блок 32-1 декодирования применяет процесс декодирования к первому кодированному битовому потоку, чтобы декодировать код с переменной длиной первого кодированного битового потока, и выводит результат процесса (здесь далее упоминается как данные квантования) на блок 33 выбора. Блок 32-2 декодирования применяет процесс декодирования ко второму кодированному битовому потоку, чтобы декодировать код с переменной длиной второго кодированного битового потока, и выводит данные квантования, полученные в результате процесса, на блок 33 выбора.
Блок 33 выбора определяет положение границы переключения на основе команды переключения звука, полученной от пользователя, и выводит данные квантования от блока 32-1 декодирования или от блока 32-2 декодирования на блок 34 процесса декодирования в соответствии с определенным положением границы переключения.
Блок 33 выбора может также определить положение границы переключения на основе флага оптимального положения переключения, добавляемого к каждому кадру первого и второго кодированных битовых потоков. Этот процесс будет описан со ссылкой на фиг. 7-10.
Блок 34 процесса декодирования содержит блок 35 инверсного квантования и блок 36 IMDCT. Блок 35 инверсного квантования применяет инверсное квантование к данным квантования, полученным через блок 33 выбора, и выводит результат инверсного квантования (здесь далее упоминаемый как данные MDCT) на блок 36 IMDCT. Блок 36 IMDCT применяет процесс IMDCT к данным MDCT, чтобы реконструировать данные PCM, соответствующие исходным данным перед кодированием.
Однако, блок 36 IMDCT не полностью реконструирует данные PCM, соответствующие всем соответствующим кадрам, и блок 36 IMDCT также выводит данные PCM, реконструированные в неполном состоянии, из кадров вблизи положения границы переключения.
Блок 37 процесса плавного регулирования громкости применяет процесс плавного уменьшения громкости, процесс плавного увеличения громкости или процесс глушения к данным PCM вблизи положения границы переключения, введенным от блока 34 процесса декодирования, и выводит данные PCM на последующий этап.
Заметим, что хотя в случае, показанном в примере конфигурации, представленном на фиг. 4, в устройство 30 декодирования вводится мультиплексированный поток с мультиплексированными первым и вторым кодированными битовыми потоками, в мультиплексированном потоке может быть мультиплексировано больше кодированных битовых потоков. В этом случае количество блоков 32 декодирования может быть увеличено в соответствии с количеством мультиплексированных кодированных битовых потоков.
Дополнительно, вместо ввода мультиплексированного потока в устройство 30 декодирования может раздельно вводиться множество кодированных битовых потоков. В этом случае блок 31 демультиплексирования может быть исключен.
Первый способ переключения кодированного битового потока устройством 30 декодирования
Далее на фиг. 5 показан первый способ переключения кодированного битового потока устройством 30 декодирования.
Как показано на фиг. 5, когда положение границы переключения устанавливается между кадром 2 (Frame#2) и кадром 3 (Frame#3) и первый кодированный битовый поток должен переключиться на второй кодированный битовый поток, процесс IMDCT применяется к данным вплоть до кадра 2 (Frame#2) непосредственно перед положением границы переключения для первого кодированного битового потока. В этом случа, хотя данные вплоть до данных PCM1-1, соответствующих кадру 1 (Frame#1), могут быть полностью реконструированы, реконструкция данных PCM1-2, соответствующих кадру 2 (Frame#2), является неполной.
Между тем, для второго кодированного битового потока процесс IMDCT применяется к данным из кадра 3 (Frame#3) непосредственно после положения границы переключения. В этом случае реконструкция данных PCM2-3, соответствующих кадру 3 (Frame#3), является неполной и данные полностью реконструируются из данных PCM2-4, соответствующих кадру 4 (Frame #4).
Здесь "неполная реконструкция" означает, что первая половина или вторая половина IMDCT-OUT используется в качестве данных PCM без выполнения наложения и добавления.
В этом случае, вторая половина MDCT-OUT#1-1 может использоваться для данных PCM1-2, соответствующих кадру 2 (Frame#2) первого кодированного битового потока. Аналогично, первая половина MDCT-OUT#2-3 может использоваться для данных PCM2-3, соответствующих кадру 3 (Frame#3) второго кодированного битового потока. Заметим, что, очевидно, качество звука для неполностью реконструированных данных PCM1-2 и PCM2-3 ниже, чем качество звука для полностью реконструированных данных PCM1-2 и PCM2-3.
Когда данные PCM выведены, данные вплоть до полностью реконструированных данных PCM1-1, соответствующих кадру 1 (Frame#1), выводятся с обычной громкостью. Громкость при неполных данных PCM1-2, соответствующих кадру 2 (Frame#2), непосредственно перед положением границы переключения плавно снижается посредством процесса плавного снижения громкости и громкость для неполных данных PCM2-3, соответствующих кадру 3 (Frame#3), непосредственно после положения границы переключения плавно увеличивается посредством процесса плавного увеличения громкости. Начиная с кадра 4 (Frame#4) полностью реконструированные данные PCM2-4, … выводятся с обычной громкостью.
Таким образом, неполностью реконструированные данные PCM выводятся сразу после положения границы изменения и нет необходимости выполнять два процесса декодирования параллельно. Дополнительно, процесс постепенного уменьшения громкости и процесс постепенного увеличения громкости соединяют неполные данные PCM и это может уменьшать громкость шума резкого скачка, возникающего из-за отсутствия непрерывности кадров, вызванного переключением звука.
Заметим, что способ переключения кодированного битового потока устройством 30 декодирования не ограничивается первым способом переключения и могут также применяться описанные далее второй или третий способы переключения.
Процесс переключения звука устройством 30 декодирования
Далее на фиг. 6 показана блок-схема последовательности осуществления операций, описывающая процесс переключения звука, соответствующий первому способу переключения, показанному на фиг. 5.
Предполагается, что перед процессом переключения звука блок 11 демультиплексирования отделил первый и второй кодированные битовые потоки от мультиплексированного потока и блоки 32-1 или 31-2 декодирования декодировали первый и второй кодированные битовые потоки, соответственно, в устройстве 30 декодирования. Также предполагается, что блок 33 выбора выбрал данные квантования, поступающие от одного из блоков декодирования 32-1 или 32-2, и ввел данные квантования в блок 34 процесса декодирования.
В случае, описанном ниже, блок 33 выбора выбирает данные квантования, поступающие от блока декодирования 32-1, и вводит данные квантования в блок 34 процесса декодирования. В результате, устройство 30 декодирования в настоящее время выводит данные PCM, основываясь на первом кодированном битовом потоке, при обычной громкости.
На этапе S1 блок 33 выбора определяет, существует ли от пользователя команда переключения звука, и ожидает до тех пор, пока не появится команда переключения звука. В то время, пока блок 33 выбора ждет, блок 33 выбора удерживает выбранный выходной сигнал. В результате, устройство 30 декодирования непрерывно выводит данные PCM, основываясь на первом кодированном битовом потоке, при обычной громкости.
Когда команда переключения звука от пользователя появляется, процесс переходит к этапу S2. На этапе S2 блок 33 выбора определяет положение границы переключения звука. Например, блок 33 выбора определяет положение границы переключения звука в месте, находящемся после заданного количества кадров, начиная с момента приема команды переключения звука. Однако, блок 33 выбора может определить положение границы переключения на основе флага оптимального положения переключения, добавляемого в кодированный битовый поток (далее описано с подробностями).
В этом случае предполагается, что положение границы переключения устанавливается между кадром 2 (Frame#2) и кадром 3 (Frame#3), как показано на фиг. 5.
Далее, на этапе S3 блок 33 выбора сохраняет текущий выбор, пока блок 33 выбора не выведет данные квантования, соответствующие кадру непосредственно перед определенным положением границы переключения, на блок 34 процесса декодирования. Поэтому блок 33 выбора выводит данные квантования из блока 32-1 декодирования на более поздний этап.
На этапе S4 блок 35 инверсного квантования блока 34 процесса декодирования выполняет инверсное квантование данных квантования, основываясь на первом кодированном битовом потоке, и выводит данные MDCT, полученные в результате инверсного квантования, на блок 36 IMDCT. Блок 36 IMDCT применяет процесс IMDCT к данным вплоть до данных MDCT, соответствующих кадру, следующему непосредственно перед положением границы переключения, чтобы таким образом реконструировать данные PCM, соответствующие исходным данным перед кодированием, и выводит данные PCM на блок 37 процесса постепенного регулирования громкости.
В этом случае, хотя данные вплоть до PCM1-1, соответствующих кадру 1 (Frame#1), могут быть полностью реконструированы, реконструкция PCM1-2, соответствующих кадру 2 (Frame#2), является неполной.
На этапе S5 блок 37 процесса плавного изменения громкости применяет процесс медленного снижения громкости к неполным данным PCM, соответствующим кадру (в этом случае, данным PCM1-2, соответствующим кадру 2 (Frame#2)) непосредственно прелдшествующему положению границы переключения, введенному от блока 34 процесса декодирования, и выводит данные PCM на последующий этап.
Далее, на этапе S6 блок 33 выбора переключает выходной сигнал для блока 34 процесса декодирования. Поэтому блок 33 выбора выводит данные квантования от блока 32-2 на последующий этап.
На этапе S7 блок 35 инверсного квантования блока 34 процесса декодирования выполняет инверсное квантование данных квантования, основываясь на втором кодированном битовом потоке, и выводит данные MDCT, полученные в результате инверсного квантования, на блок 36 IMDCT. Блок 36 IMDCT применяет процесс IMDCT к данным из данных MDCT, соответствующих кадру, следующему непосредственно после положения границы переключения, чтобы таким образом реконструировать данные PCM, соответствующие исходным данным перед кодированием, и выводит данные PCM на блок 37 процесса постепенного регулирования громкости.
В этом случае реконструкция данных PCM2-3, соответствующих кадру 3 (Frame#3), является неполной и данные полностью реконструируются из данных PCM2-4, соответствующих кадру 4 (Frame #4).
На этапе S8 блок 37 процесса плавного изменения громкости применяет процесс плавного увеличения громкости к неполным данным PCM, соответствующим кадру (в этом случае, к данным PCM2-3, соответствующим кадру 3 (Frame#3)) непосредственно после положения границы переключения, введенного от блока 34 процесса декодирования, и выводит данные PCM на последующий этап. Процесс затем возвращается к этапу S1 и дальнейший процесс повторяется.
Этим завершается описание процесса переключения звука устройством 30 декодирования. В соответствии с процессом переключения звука, кодированный битовый звуковой поток может переключаться без параллельного выполнения двух процессов декодирования. Процесс переключения звука может также снижать громкость шума резкого скачка, возникающего из-за отсутствия непрерывности кадров, вызванного переключением звука.
Процесс установки флага оптимального положения переключения
В процессе переключения звука положение границы переключения звука определяется в месте, находящемся после заданного количества кадров, с момента приема от пользователя команды переключения звука. Однако, учитывая выполнение процесса постепенного уменьшения громкости и процесса постепенного увеличения громкости вблизи положения границы переключения, желательно, чтобы положение границы переключения было местом, в котором звук был как можно ближе к молчанию, местом, в котором последовательность слов или разговоры закончены, даже если громкость в соответствии с контекстом временно уменьшается.
Следовательно, в процессе (здесь далее, процесс установки флага оптимального положения переключения), описанном далее, поставщик контента обнаруживает состояние звука, как можно более близкое к молчанию (то есть, к состоянию с малым коэффициентом усиления или энергией исходных данных), и здесь устанавливает флаг оптимального положения переключения.
На фиг. 7 представлена блок-схема последовательности выполнения операций процесса установки флага оптимального положения переключения, выполняемого поставщиком контента. На фиг. 8 показано состояние процесса установки флага оптимального положения переключения.
На этапе S21 первые и вторые исходные данные, введенные с более раннего этапа (источники первого и второго кодированных битовых потоков с синхронизированным моментом воспроизведения) делятся на кадры и на этапе S22 измеряется энергия в каждом из поделенных кадров.
На этапе S23 для каждого кадра определяется, равна ли или меньше заданного порога энергия первого и второго источников данных. Если энергия первого и второго источников данных одновременно равна или меньше заданного порога, процесс переходит к этапу S24 и флаг оптимального положения переключения для кадра устанавливается равным "1", указывая, что положение является оптимальным положением переключения.
С другой стороны, если энергия по меньшей мере первого или второго источника данных больше заданного порога, процесс переходит к этапу S25 и флаг оптимального положения переключения для кадра устанавливается равным "0", указывая, что положение не является оптимальным положением переключения.
На этапе S26 определяется, закончен ли ввод первых и вторых исходных данных, и если ввод первых и вторых исходных данных продолжается, процесс возвращается к этапу S21, чтобы повторить последующий процесс. Если ввод первых и вторых исходных данных закончен, процесс установки флага оптимального положения переключения заканчивается.
Далее, на фиг. 9 представлена блок-схема последовательности выполнения операций процесса определения положения границы переключения звука в устройстве 30 декодирования, соответствующая случаю, в котором флаг оптимального положения переключения устанавливается для каждого кадра первого и второго кодированных битовых потоков в процессе установления флага оптимального положения переключения. На фиг. 10 представлено состояние процесса определения положения границы переключения.
Процесс определения положения границы переключения выполняется вместо этапов S1 и S2 процесса переключения звука, описанного со ссылкой на фиг. 6.
На этапе S31 блок 33 выбора устройства 30 декодирования определяет, существует ли поданная пользователем команда переключения звука, и ожидает до тех пор, пока не появится команда переключения звука. В то время, пока блок 33 выбора ждет, блок 33 выбора удерживает выбранный выходной сигнал. В результате, устройство 30 декодирования непрерывно выводит данные PCM, основываясь на первом кодированном битовом потоке, при обычной громкости.
Когда команда переключения звука от пользователя появляется, процесс переходит к этапу S32. На этапе S32 блок 33 выбора ждет до тех пор, пока флаг оптимального положения переключения не станет равным "1", причем флаг оптимального положения переключения, добавляемый к каждому кадру первого и второго кодированных битовых потоков (данные квантования как результат декодирования первого и второго кодированных битовых потоков) последовательно вводится с предыдущего этапа. В то время, пока блок 33 выбора ждет, блок 33 выбора также удерживает выбранный выходной сигнал. Когда флаг оптимального положения переключения становится равным "1", процесс переходит к этапу S33 и блок 33 выбора устанавливает положение границы переключения звука между кадром с флагом оптимального положения переключения, равным "1" и следующим кадром. Тем самым завершается процесс определения положения границы переключения.
В соответствии с процессом установки флага оптимального положения переключения и процессом определения положения границы переключения, описанными выше, положение, в котором звук как можно ближе к молчанию, может быть установлено в качестве положения границы переключения. Поэтому влияние, оказываемое выполнением процесса плавного уменьшения громкости и процесса плавного увеличения громкости, может быть уменьшено.
Дополнительно, даже когда флаг оптимального положения переключения не добавлен, блок 33 выбора и т.п. в устройстве 30 декодирования может обращаться к информации, связанной с коэффициентом усиления кодированных битовых потоков и обнаруживать положение громкости, равной или меньшей назначенного порога, чтобы определить положение границы переключения. Например, такая информация, как коэффициент масштабирования, может использоваться для информации, связанной с коэффициентом усиления в системе кодирования, такой как AAC и MP3.
Второй способ переключения кодированного битового потока устройством 30 декодирования
Далее на фиг. 11 показан второй способ переключения кодированного битового потока устройством 30 декодирования.
Как показано на фиг. 11, когда положение границы переключения устанавливается между кадром 2 (Frame#2) и кадром 3 (Frame#3) и первый кодированный битовый поток должен переключиться на второй кодированный битовый поток, процесс IMDCT применяется к данным вплоть до кадра 2 (Frame#2) непосредственно перед положением границы переключения для первого кодированного битового потока. В этом случае, хотя данные вплоть до данных PCM1-1, соответствующих кадру 1 (Frame#1), могут быть полностью реконструированы, реконструкция данных PCM1-2, соответствующих кадру 2 (Frame#2), является неполной.
Между тем, для второго кодированного битового потока процесс IMDCT применяется к данным из кадра 3 (Frame#3), следующего непосредственно после положения границы переключения. В этом случае реконструкция данных PCM2-3, соответствующих кадру 3 (Frame#3), является неполной и данные полностью реконструируются из данных PCM2-4, соответствующих кадру 4 (Frame #4).
При этом, когда данные PCM выведены, данные вплоть до полностью реконструированных данных PCM1-1, соответствующих кадру 1 (Frame#1) выводятся с нормальной громкостью. Громкость для неполных данных PCM1-2, соответствующих кадру 2 (Frame#2), следующему непосредственно перед положением границы переключения, плавно уменьшается посредством процесса плавного уменьшения громкости и выполняется процесс приглушения, чтобы установить участок для неполных данных PCM2-3, соответствующих кадру 3 (Frame#3), следующему непосредственно после положения границы переключения. Дополнительно, громкость полностью реконструированных данных PCM2-4 постепенно увеличивается посредством процесса постепенного увеличения громкости и данные выводятся с обычной громкостью из данных PCM2-5, соответствующих кадру 5 (Frame#5).
Таким образом, неполностью реконструированные данные PCM выводятся сразу после положения границы изменения и нет необходимости параллельно выполнять два процесса декодирования. Дополнительно, процесс постепенного уменьшения громкости, процесс глушения и процесс постепенного увеличения громкости соединяют неполные данные PCM и это может уменьшать громкость шума неприятного скачка, из-за отсутствия непрерывности кадров при переключении звука.
Третий способ переключения кодированного битового потока устройством 30 декодирования
Далее на фиг. 12 показан третий способ переключения кодированного битового потока устройством 30 декодирования.
Как показано на фиг. 12, когда положение границы переключения устанавливается между кадром 2 (Frame#2) и кадром 3 (Frame#3) и первый кодированный битовый поток должен переключиться на второй кодированный битовый поток, процесс IMDCT применяется к данным вплоть до кадра 2 (Frame#2) непосредственно перед положением границы переключения для первого кодированного битового потока. В этом случае, хотя данные вплоть до данных PCM1-1, соответствующих кадру 1 (Frame#1), могут быть полностью реконструированы, реконструкция данных PCM1-2, соответствующих кадру 2 (Frame#2), является неполной.
Между тем, для второго кодированного битового потока процесс IMDCT применяется к данным из кадра 3 (Frame#3), следующего непосредственно после положения границы переключения. В этом случае реконструкция данных PCM2-3, соответствующих кадру 3 (Frame#3), является неполной и данные полностью реконструируются из данных PCM2-4, соответствующих кадру 4 (Frame #4).
При этом, при выводе данных PCM, данные перед данными PCM1-1, соответствующими кадру 1 (Frame#1) выводятся с обычной громкостью и громкость PCM1-1 плавно уменьшается посредством процесса плавного уменьшения громкости. Процесс глушения выполняется на участке установки молчания для неполных данных PCM1-2, соответствующих кадру 2 (Frame#2), следующему непосредственно перед положением границы переключения. Дополнительно, громкость неполностью реконструированных данных PCM2-3, соответствующих кадру 3 (Frame#3) непосредственно после положения границы переключения, плавно увеличивается посредством процесса плавного увеличения громкости и данные выводятся с обычной громкостью из данных PCM2-4, соответствующих кадру 4 (Frame#4).
Таким образом, неполностью реконструированные данные PCM выводятся сразу после положения границы изменения и нет необходимости параллельно выполнять два процесса декодирования. Дополнительно, процесс плавного уменьшения громкости, процесс глушения и процесс плавного увеличения громкости соединяют неполные данные PCM и это может уменьшать громкость шума неприятного скачка из-за отсутствия непрерывности кадров при переключении звука.
Пример применения представленного раскрытия
В отличие от применения для переключения первого и второго кодированных битовых потоков с синхронизированным моментом переключения, представленное раскрытие может также применяться, например, для переключения объектов при трехмерном аудиокодировании 3D Audio. Более конкретно, когда данные сгруппированного объекта должны все вместе быть переключены на другую группу (Switch Group), представленное раскрытие может применяться для переключения множества объектов всех сразу, чтобы переключить проекцию в сцене воспроизведения или видео с произвольной проекцией.
Представленное раскрытие может также применяться для переключения канальной среды с двухканальной схемы стереозвука 2ch на окружающий звук по схеме 5.1ch и т.п., чтобы переключать потоки окружающего звука в соответствии с изменениями соответствующих мест в видео с произвольной проекцией.
В этой связи, последовательность процессов устройства 30 декодирования может выполняться с помощью аппаратных средств или программного обеспечения. Когда последовательность процессов выполняется с помощью программного обеспечения, на компьютер устанавливается программа, составляющая программное обеспечение. Здесь, примерами компьютера являются компьютер, встроенный в специализированные аппаратные средства, и универсальный персональный компьютер, которые, например, могут осуществлять различные функции при установке на них различных программ.
На фиг. 13 представлена блок-схема, показывающая пример конфигурации аппаратных средств компьютера, использующего программу для выполнения ряда процессов.
В компьютере 100 центральный процессор 101 (Central Processing Unit, CPU), постоянное запоминающее устройство 102 (Read Only Memory, ROM), и оперативное запоминающее устройство 103 (Random Access Memory, RAM) соединяются друг с другом через шину 104.
С шиной 104 дополнительно соединяется интерфейс 105 ввода-вывода. С интерфейсом 105 ввода-вывода соединяются устройство 106 ввода, устройство 107 вывода, блок 108 запоминающего устройства, блок 109 связи и дисковод 110.
Устройство 106 ввода содержит клавиатуру, мышь, микрофон и т.п. Устройство 107 вывода содержит дисплей, громкоговоритель и т.п. Блок 108 запоминающего устройства содержит жесткий диск, энергонезависимую память и т.п. Блок 109 связи содержит сетевой интерфейс и т.п. Дисковод 110 приводит в действие съемный носитель 111, такой как магнитный диск, оптический диск, магнито-оптический диск и полупроводниковая память.
В компьютере 100, конфигурированном таким образом, CPU 101 загружает в RAM 103 программу, хранящуюся в блоке 108 запоминающего устройства, через интерфейс 105 ввода-вывода и шину 104 и выполняет программу, чтобы, например, выполнить ряд процессов.
Заметим, что программа, выполняемая компьютером 100, может быть программой выполнения процессов в хронологическом порядке, описанном в представленном описании, или может быть программой выполнения процессов параллельно или в необходимые моменты времени при вызове программы.
Вариант осуществления представленной технологии не ограничивается описанным выше вариантом осуществления и в нем могут быть произведены различные изменения, не отступая от объема защиты настоящего раскрытия.
Представленное раскрытие может также быть выполнено нижеследующим образом.
(1) Устройство декодирования, содержащее:
блок сбора данных, получающий множество кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодируется на основе кадров после процесса MDCT;
блок выбора, определяющий положение границы для переключения выходного сигнала множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочно подающий один из множества полученных кодированных битовых аудиопотоков на блок процесса декодирования; и
блок процесса декодирования, применяющий процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, в котором
блок процесса декодирования пропускает наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
(2) Устройство декодирования по п. (1), дополнительно содержащее:
блок плавного регулирования громкости, применяющий процесс плавного регулирования громкости к результатам процесса декодирования кадров перед и после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
(3) Устройство декодирования по п. (2), в котором блок процесса плавного регулирования громкости применяет процесс плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применяет процесс медленного увеличения громкости к результату процесса декодирования после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
(4) Устройство декодирования по п. (2), в котором блок процесса плавного регулирования громкости применяет процесс плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применяет процесс приглушения к результату процесса декодирования кадра после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
(5) Устройство декодирования по п. (2), в котором блок процесса плавного регулирования громкости применяет процесс глушения к результату процесса декодирования кадра перед положением границы и применяет процесс плавного увеличения громкости к результату процесса декодирования после положения границы, в котором наложение и добавление блоком процесса декодирования пропускаются.
(6) Устройство декодирования по любому из пп. (1)-(5), в котором блок выбора определяет положение границы на основе флага оптимального положения переключения, который добавляется к каждому кадру и который устанавливается поставщиком множества кодированных битовых аудиопотоков.
(7) Устройство декодирования по п. (6), в котором флаг оптимального положения переключения может быть установлен поставщиком кодированных битовых аудиопотоков на основе энергии или контекста исходных данных.
(8) Устройство декодирования по любому из пп. (1)-(5), в котором блок выбора определяет положение границы на основе информации, связанной с коэффициентом усиления множества кодированных битовых аудиопотоков.
(9) Способ декодирования, выполняемый устройством декодирования, причем упомянутый способ декодирования содержит:
этап сбора данных, на котором получают множество кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодируется на основе кадров после процесса MDCT;
этап определения, на котором определяют положение границы для переключения вывода множества кодированных битовых аудиопотоков;
этап выбора, на котором выборочно подают один из множества полученных кодированных битовых аудиопотоков на этап процесса декодирования, соответствующий положению границы; и
этап процесса декодирования, на котором применяют процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, полученному выборочно, в котором
на этапе процесса декодирования наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы, пропускаются.
(10) Программа, заставляющая компьютер функционировать в качестве:
блока сбора данных, получающего множество кодированных битовых аудиопотоков, в которых множество фрагментов исходных данных с синхронизированным моментом воспроизведения кодируются на основе кадров после процесса MDCT;
блока выбора, определяющего положение границы для переключения выходного сигнала множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочно подающего один из множества полученных кодированных битовых аудиопотоков на блок процесса декодирования; и
блока процесса декодирования, применяющего процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, в котором
блок процесса декодирования пропускает наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
Перечень ссылочных позиций
30 Устройство декодирования
31 Блок демультиплексирования
32-1, 32-2 Блоки декодирования
33 Блок выбора
34 Блок процесса декодирования
35 Блок инверсного квантования
36 Блок IMDCT
37 Блок процесса постепенного изменения громкости
100 Компьютер
101 Центральный процессор, CPU

Claims (30)

1. Устройство декодирования, содержащее:
блок сбора данных, выполненный с возможностью получения множества кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодирован на основе кадров после процесса модифицированного дискретного косинусного преобразования (MDCT);
блок выбора, выполненный с возможностью определения положения границы для переключения вывода множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочной подачи одного из множества полученных кодированных битовых аудиопотоков на блок обработки декодирования; и
блок обработки декодирования, выполненный с возможностью применения процесса декодирования, содержащего процесс инверсного модифицированного косинусного преобразования (IMDCT), соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, при этом
блок обработки декодирования выполнен с возможностью пропускать наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
2. Устройство декодирования по п. 1, дополнительно содержащее
блок плавного регулирования громкости, выполненный с возможностью применения процесса плавного регулирования громкости к результатам процесса декодирования кадров перед и после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
3. Устройство декодирования по п. 2, в котором
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применения процесса медленного увеличения громкости к результату процесса декодирования после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
4. Устройство декодирования по п. 2, в котором
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса плавного уменьшения громкости к результату процесса декодирования кадра перед положением границы и применения процесса глушения к результату процесса декодирования кадра после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
5. Устройство декодирования по п. 2, в котором
блок процесса плавного регулирования громкости выполнен с возможностью применения процесса глушения к результату процесса декодирования кадра перед положением границы и применения процесса плавного увеличения громкости к результату процесса декодирования после положения границы, при котором наложение и добавление блоком процесса декодирования пропускаются.
6. Устройство декодирования по п. 2, в котором
блок выбора выполнен с возможностью определения положения границы на основе флага оптимального положения переключения, добавляемого к каждому кадру и устанавливаемого поставщиком указанного множества кодированных битовых аудиопотоков.
7. Устройство декодирования по п. 6, в котором
флаг оптимального положения переключения установлен поставщиком кодированных битовых аудиопотоков на основе энергии или контекста исходных данных.
8. Устройство декодирования по п. 2, в котором
блок выбора выполнен с возможностью определения положения границы на основе информации, связанной с коэффициентом усиления множества кодированных битовых аудиопотоков.
9. Способ декодирования, выполняемый устройством декодирования, причем способ декодирования содержит:
этап сбора данных, на котором получают множество кодированных битовых аудиопотоков, в которых каждый из множества фрагментов исходных данных с синхронизированным моментом воспроизведения кодирован на основе кадров после процесса MDCT;
этап определения, на котором определяют положение границы для переключения вывода множества кодированных битовых аудиопотоков;
этап выбора, на котором выборочно подают один из множества полученных кодированных битовых аудиопотоков на этап обработки декодирования в соответствии с положением границы; и
этап обработки декодирования, на котором применяют процесс декодирования, содержащий процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков, поданных выборочно, при этом
на этапе обработки декодирования пропускают наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
10. Носитель данных, содержащий программу, вызывающую функционирование компьютера в качестве:
блока сбора данных, выполненного с возможностью получения множества кодированных битовых аудиопотоков, в которых множество фрагментов исходных данных с синхронизированным моментом воспроизведения кодированы на основе кадров после процесса MDCT;
блока выбора, выполненного с возможностью определения положения границы для переключения вывода множества кодированных битовых аудиопотоков и, в соответствии с положением границы, выборочной подачи одного из множества полученных кодированных битовых аудиопотоков на блок обработки декодирования; и
блока обработки декодирования, выполненного с возможностью применения процесса декодирования, содержащего процесс IMDCT, соответствующий процессу MDCT, к одному из множества кодированных битовых аудиопотоков через посредство блока выбора, при этом
блок обработки декодирования выполнен с возможностью пропускать наложение и добавление в процессе IMDCT, соответствующем каждому кадру перед и после положения границы.
RU2018115550A 2015-11-09 2016-10-26 Устройство декодирования, способ декодирования и программа RU2718418C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015219415 2015-11-09
JP2015-219415 2015-11-09
PCT/JP2016/081699 WO2017082050A1 (ja) 2015-11-09 2016-10-26 デコード装置、デコード方法、およびプログラム

Publications (3)

Publication Number Publication Date
RU2018115550A RU2018115550A (ru) 2019-10-28
RU2018115550A3 RU2018115550A3 (ru) 2020-01-31
RU2718418C2 true RU2718418C2 (ru) 2020-04-02

Family

ID=58695167

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018115550A RU2718418C2 (ru) 2015-11-09 2016-10-26 Устройство декодирования, способ декодирования и программа

Country Status (8)

Country Link
US (1) US10553230B2 (ru)
EP (1) EP3376500B1 (ru)
JP (1) JP6807033B2 (ru)
KR (1) KR20180081504A (ru)
CN (1) CN108352165B (ru)
BR (1) BR112018008874A8 (ru)
RU (1) RU2718418C2 (ru)
WO (1) WO2017082050A1 (ru)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10424311B2 (en) 2017-01-30 2019-09-24 Cirrus Logic, Inc. Auto-mute audio processing
CN110730408A (zh) * 2019-11-11 2020-01-24 北京达佳互联信息技术有限公司 一种音频参数切换方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252254A (ja) * 1995-09-29 1997-09-22 Nippon Steel Corp オーディオ復号装置
JP2002026738A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
US20050149973A1 (en) * 2004-01-06 2005-07-07 Fang Henry Y. Television with application/stream-specifiable language selection
US20080065373A1 (en) * 2004-10-26 2008-03-13 Matsushita Electric Industrial Co., Ltd. Sound Encoding Device And Sound Encoding Method
RU2527760C2 (ru) * 2008-07-11 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1667147B1 (en) * 1993-12-18 2014-03-12 Sony Corporation Data reproduction apparatus and data storage
JPH08287610A (ja) * 1995-04-18 1996-11-01 Sony Corp オーディオデータの再生装置
US5867819A (en) 1995-09-29 1999-02-02 Nippon Steel Corporation Audio decoder
DE19861167A1 (de) * 1998-08-19 2000-06-15 Christoph Buskies Verfahren und Vorrichtung zur koartikulationsgerechten Konkatenation von Audiosegmenten sowie Vorrichtungen zur Bereitstellung koartikulationsgerecht konkatenierter Audiodaten
GB9911737D0 (en) * 1999-05-21 1999-07-21 Philips Electronics Nv Audio signal time scale modification
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
US7113538B1 (en) * 2000-11-01 2006-09-26 Nortel Networks Limited Time diversity searcher and scheduling method
US7069208B2 (en) * 2001-01-24 2006-06-27 Nokia, Corp. System and method for concealment of data loss in digital audio transmission
US7189913B2 (en) * 2003-04-04 2007-03-13 Apple Computer, Inc. Method and apparatus for time compression and expansion of audio data with dynamic tempo change during playback
US7260035B2 (en) * 2003-06-20 2007-08-21 Matsushita Electric Industrial Co., Ltd. Recording/playback device
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
SG124307A1 (en) * 2005-01-20 2006-08-30 St Microelectronics Asia Method and system for lost packet concealment in high quality audio streaming applications
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
WO2006137425A1 (ja) * 2005-06-23 2006-12-28 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
CN101026725B (zh) * 2005-07-15 2010-09-29 索尼株式会社 再现设备及再现方法
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
US8010350B2 (en) * 2006-08-03 2011-08-30 Broadcom Corporation Decimated bisectional pitch refinement
DE102007028175A1 (de) * 2007-06-20 2009-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Automatisiertes Verfahren zur zeitlichen Segmentierung eines Videos in Szenen unter Berücksichtigung verschiedener Typen von Übergängen zwischen Bildfolgen
JP5609111B2 (ja) * 2007-08-22 2014-10-22 日本電気株式会社 話者速度変換システム
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8185384B2 (en) * 2009-04-21 2012-05-22 Cambridge Silicon Radio Limited Signal pitch period estimation
US9992456B2 (en) * 2010-02-24 2018-06-05 Thomson Licensing Dtv Method and apparatus for hypothetical reference decoder conformance error detection
TWI476761B (zh) * 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統
CA2866585C (en) * 2012-03-06 2021-02-23 Sirius Xm Radio Inc. Systems and methods for audio attribute mapping
CN103548080B (zh) * 2012-05-11 2017-03-08 松下电器产业株式会社 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
TWI557727B (zh) * 2013-04-05 2016-11-11 杜比國際公司 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
US20160071524A1 (en) * 2014-09-09 2016-03-10 Nokia Corporation Audio Modification for Multimedia Reversal
US10614609B2 (en) * 2017-07-19 2020-04-07 Mediatek Inc. Method and apparatus for reduction of artifacts at discontinuous boundaries in coded virtual-reality images

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09252254A (ja) * 1995-09-29 1997-09-22 Nippon Steel Corp オーディオ復号装置
JP2002026738A (ja) * 2000-07-11 2002-01-25 Mitsubishi Electric Corp オーディオデータ復号処理装置および方法、ならびにオーディオデータ復号処理プログラムを記録したコンピュータ読取可能な記録媒体
US20050149973A1 (en) * 2004-01-06 2005-07-07 Fang Henry Y. Television with application/stream-specifiable language selection
US20080065373A1 (en) * 2004-10-26 2008-03-13 Matsushita Electric Industrial Co., Ltd. Sound Encoding Device And Sound Encoding Method
RU2527760C2 (ru) * 2008-07-11 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер звукового сигнала, кодер звукового сигнала, представление кодированного многоканального звукового сигнала, способы и програмное обеспечение

Also Published As

Publication number Publication date
KR20180081504A (ko) 2018-07-16
US20180286419A1 (en) 2018-10-04
RU2018115550A (ru) 2019-10-28
RU2018115550A3 (ru) 2020-01-31
EP3376500B1 (en) 2019-08-21
EP3376500A4 (en) 2018-09-19
CN108352165B (zh) 2023-02-03
US10553230B2 (en) 2020-02-04
BR112018008874A2 (pt) 2018-11-06
JP6807033B2 (ja) 2021-01-06
BR112018008874A8 (pt) 2019-02-26
EP3376500A1 (en) 2018-09-19
JPWO2017082050A1 (ja) 2018-08-30
WO2017082050A1 (ja) 2017-05-18
CN108352165A (zh) 2018-07-31

Similar Documents

Publication Publication Date Title
CA2933562C (en) Transitioning of ambient higher-order ambisonic coefficients
TWI618052B (zh) 解碼包括一輸送聲道之一位元串流之方法、音訊解碼器件、非暫時性電腦可讀儲存媒體、編碼高階環境係數以獲得包括一輸送聲道之一位元串流的方法及音訊編碼器件
JP6356832B2 (ja) 高次アンビソニックス信号の圧縮
US9875745B2 (en) Normalization of ambient higher order ambisonic audio data
KR101849612B1 (ko) 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치
US9875746B2 (en) Encoding device and method, decoding device and method, and program
JP5390197B2 (ja) オーディオ信号の処理方法及び装置
CN107403624B (zh) 用于音频信号的动态范围调整及控制的方法和设备
KR102140388B1 (ko) 복호 장치, 복호 방법, 및 기록 매체
RU2718418C2 (ru) Устройство декодирования, способ декодирования и программа
EP3363213B1 (en) Coding higher-order ambisonic coefficients during multiple transitions
JP2006301134A (ja) 音楽検出装置、音楽検出方法及び録音再生装置
JP2009284212A (ja) デジタル音声信号解析方法、その装置、及び映像音声記録装置
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
EP2357645A1 (en) Music detecting apparatus and music detecting method
KR20080037234A (ko) 오디오 파일간 공백 제거 방법 및 장치