RU2827404C1 - Method of transmitting bit stream over network - Google Patents
Method of transmitting bit stream over network Download PDFInfo
- Publication number
- RU2827404C1 RU2827404C1 RU2024105760A RU2024105760A RU2827404C1 RU 2827404 C1 RU2827404 C1 RU 2827404C1 RU 2024105760 A RU2024105760 A RU 2024105760A RU 2024105760 A RU2024105760 A RU 2024105760A RU 2827404 C1 RU2827404 C1 RU 2827404C1
- Authority
- RU
- Russia
- Prior art keywords
- flag
- module
- context
- coefficient
- decoding
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 142
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 abstract description 156
- 230000000694 effects Effects 0.000 abstract description 11
- 239000000126 substance Substances 0.000 abstract 1
- 230000005236 sound signal Effects 0.000 description 26
- 238000010586 diagram Methods 0.000 description 24
- 230000001413 cellular effect Effects 0.000 description 19
- 230000003287 optical effect Effects 0.000 description 18
- 230000006870 function Effects 0.000 description 17
- 239000000872 buffer Substances 0.000 description 12
- 230000008859 change Effects 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000001824 photoionisation detection Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000009434 installation Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 101150114886 NECTIN1 gene Proteins 0.000 description 1
- 102100023064 Nectin-1 Human genes 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Abstract
Description
Область техникиField of technology
[0001] Настоящее изобретение относится к способам кодирования изображения и способам декодирования изображения.[0001] The present invention relates to image encoding methods and image decoding methods.
Предшествующий уровень техникиPrior art
[0002] В последние годы, с быстрым продвижением цифровых технологий видео аппаратуры, появилось больше возможностей для сжатия-кодирования видеосигналов (временных последовательностей движущихся изображений) и записи результирующих видеосигналов на носитель записи, такой как цифровой универсальный диск (DVD) или жесткий диск, или распределения их по сети. Примером стандартов кодирования изображения является H.264/AVC (MPEG-4 AVC). Стандарт высокоэффективного кодирования изображения (HEVC) был недавно исследован в качестве стандарта нового поколения (см., например, непатентный документ 1).[0002] In recent years, with the rapid advancement of digital video equipment technology, more opportunities have emerged for compressing and encoding video signals (time sequences of moving images) and recording the resulting video signals on a recording medium such as a digital versatile disc (DVD) or a hard disk, or distributing them over a network. An example of image coding standards is H.264/AVC (MPEG-4 AVC). The High Efficiency Image Coding (HEVC) standard has recently been researched as a new generation standard (see, for example, Non-Patent Document 1).
Перечень ссылокList of links
Непатентная литератураNon-patent literature
[0003] [Непатентный документ 1] Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 9th Meeting: Geneva, CH, 27 Apr. - 7 May 2012 JCTVC-11003_d4.doc, High efficiency video coding (HEVC) text specification draft 7 http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v5.zip [0003] [Non-Patent Document 1] Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 9th Meeting: Geneva, CH, 27 Apr. - 7 May 2012 JCTVC-11003_d4.doc, High efficiency video coding (HEVC)
Сущность изобретенияThe essence of the invention
Техническая задачаTechnical task
[0004] Для такого способа кодирования изображения и способа декодирования изображения требовалось уменьшить объем обработки при одновременном подавлении ухудшения эффективности кодирования.[0004] For such an image encoding method and an image decoding method, it was necessary to reduce the amount of processing while simultaneously suppressing the deterioration of encoding efficiency.
[0005] Настоящее изобретение обеспечивает способ кодирования изображения и способ декодирования изображения, каждый из которых способен уменьшать объем обработки при одновременном подавлении ухудшения эффективности кодирования.[0005] The present invention provides an image encoding method and an image decoding method, each of which is capable of reducing the amount of processing while suppressing the deterioration of encoding efficiency.
Решение задачиSolution to the problem
[0006] Для решения вышеуказанной задачи, согласно аспекту настоящего изобретения, предложен способ кодирования изображения с использованием арифметического кодирования, причем способ кодирования изображения, включает в себя: выполнение арифметического кодирования над первым флагом, который указывает, является ли абсолютное значение целевого коэффициента в целевом блоке коэффициентов большим, чем 1; и выполнение арифметического кодирования над вторым флагом, который указывает, является ли абсолютное значение большим, чем 2, при этом, при выполнении арифметического кодирования над первым флагом и выполнении арифметического кодирования над вторым флагом, определяется, включает ли в себя непосредственно предшествующий блок коэффициентов, который был кодирован непосредственно перед целевым блоком коэффициентов, коэффициент, имеющий абсолютное значение большее, чем пороговое значение, и контекст, подлежащий использованию в арифметическом кодировании над первым флагом и контекст, подлежащий использованию в арифметическом кодировании над вторым флагом выбираются на основе результата определения.[0006] In order to solve the above problem, according to an aspect of the present invention, a method for encoding an image using arithmetic encoding is provided, wherein the method for encoding an image includes: performing arithmetic encoding on a first flag that indicates whether an absolute value of a target coefficient in a target block of coefficients is greater than 1; and performing arithmetic encoding on a second flag that indicates whether the absolute value is greater than 2, wherein, when performing arithmetic encoding on the first flag and performing arithmetic encoding on the second flag, it is determined whether an immediately preceding block of coefficients that was encoded immediately before the target block of coefficients includes a coefficient having an absolute value greater than a threshold value, and a context to be used in arithmetic encoding on the first flag and a context to be used in arithmetic encoding on the second flag are selected based on the determination result.
[0007] Эти общие и специфические аспекты могут быть реализованы с использованием системы, способа, интегральной схемы, компьютерной программы или считываемого компьютером носителя записи, такого как CD-ROM, или любой комбинации систем, способов, интегральных схем, компьютерных программ или считываемых компьютером носителей записи.[0007] These general and specific aspects may be implemented using a system, method, integrated circuit, computer program, or computer-readable recording medium such as a CD-ROM, or any combination of systems, methods, integrated circuits, computer programs, or computer-readable recording media.
Предпочтительные эффекты изобретенияPreferred effects of the invention
[0008] Настоящее изобретение обеспечивает способ кодирования изображения и способ декодирования изображения, каждый из которых способен уменьшать объем обработки при одновременном подавлении ухудшения эффективности кодирования.[0008] The present invention provides an image encoding method and an image decoding method, each of which is capable of reducing the amount of processing while suppressing the deterioration of encoding efficiency.
Краткое описание чертежейBrief description of the drawings
[0009][0009]
Фиг. 1 - блок-схема устройства кодирования изображения согласно варианту осуществления 1.Fig. 1 is a block diagram of an image encoding device according to
Фиг. 2 - блок-схема последовательности операций кодирования изображения согласно варианту осуществления 1 изображения.Fig. 2 is a flow chart of the sequence of operations of encoding an image according to
Фиг. 3 - блок-схема блока кодирования c переменной длиной слова согласно варианту осуществления 1.Fig. 3 is a block diagram of a variable-length encoding unit according to
Фиг. 4 - блок-схема последовательности операций кодирования c переменной длиной слова согласно варианту осуществления 1.Fig. 4 is a flow chart of the variable length encoding operations according to
Фиг. 5 - блок-схема блока кодирования уровня согласно варианту осуществления 1.Fig. 5 is a block diagram of a level coding unit according to
Фиг. 6 - блок-схема последовательности операций кодирования уровня согласно варианту осуществления 1.Fig. 6 is a flow chart of the sequence of operations of encoding a layer according to
Фиг. 7 - блок-схема последовательности операций кодирования greater1_flag согласно варианту осуществления 1.Fig. 7 is a flow chart of the sequence of operations for encoding greater1_flag according to
Фиг. 8 - блок-схема последовательности операций кодирования greater2_flag согласно варианту осуществления 1.Fig. 8 is a flow chart of the sequence of operations for encoding greater2_flag according to
Фиг. 9 - блок-схема последовательности операций кодирования остатка согласно варианту осуществления 1.Fig. 9 is a flow chart of the sequence of operations for encoding the residual according to
Фиг. 10 - блок-схема последовательности операций выбора набора контекстов согласно варианту осуществления 1.Fig. 10 is a flow chart of the sequence of operations for selecting a set of contexts according to
Фиг. 11 - блок-схема последовательности операций выбора контекста greater1_flag согласно варианту осуществления 1.Fig. 11 is a flow chart of the sequence of operations for selecting the greater1_flag context according to
Фиг. 12 - таблица, показывающая пример количеств контекстов согласно варианту осуществления 1.Fig. 12 is a table showing an example of the numbers of contexts according to Embodiment 1.
Фиг. 13 - блок-схема последовательности операций бинаризации остатка согласно варианту осуществления 1.Fig. 13 is a flow chart of the sequence of operations of binarization of the residual according to
Фиг. 14 - блок-схема последовательности операций определения префикса и суффикса определения согласно варианту осуществления 1.Fig. 14 is a flow chart of the sequence of operations for determining the prefix and suffix of the determination according to
Фиг. 15A - таблица, показывающая пример отношений соответствия между структурным элементом (бином) остатка, префикса и суффикса согласно варианту осуществления 1.Fig. 15A is a table showing an example of the correspondence relationship between a structural element (bin) of a residue, a prefix, and a suffix according to
Фиг. 15B - таблица, показывающая пример отношений соответствия между бином остатка, префикса и суффикса согласно варианту осуществления 1.Fig. 15B is a table showing an example of the correspondence relationship between a residue, prefix, and suffix bin according to
Фиг. 15C - таблица, показывающая пример отношений соответствия между бином остатка, префикса и суффикса согласно варианту осуществления 1.Fig. 15C is a table showing an example of the correspondence relationship between a residue, prefix, and suffix bin according to
Фиг. 16 - блок-схема последовательности операций вывода бина префикса согласно варианту осуществления 1.Fig. 16 is a flow chart of the sequence of operations for outputting a prefix bin according to
Фиг. 17 - блок-схема последовательности операций вывода бина суффикса согласно варианту осуществления 1.Fig. 17 is a flow chart of the suffix bin output operation sequence according to
Фиг. 18 - блок-схема последовательности операций обновления параметров бинаризации согласно варианту осуществления 1.Fig. 18 is a flow chart of the sequence of operations for updating the binarization parameters according to
Фиг. 19 - таблица, показывающая результаты оценки способа кодирования изображения согласно варианту осуществления 1.Fig. 19 is a table showing the evaluation results of the image encoding method according to
Фиг. 20 - блок-схема устройства декодирования изображения согласно варианту осуществления 2.Fig. 20 is a block diagram of an image decoding device according to
Фиг. 21 - блок-схема последовательности операций декодирования изображения согласно варианту осуществления 2.Fig. 21 is a flow chart of the image decoding operation sequence according to
Фиг. 22 - блок-схема блока декодирования c переменной длиной слова согласно варианту осуществления 2.Fig. 22 is a block diagram of a variable-length decoding unit according to
Фиг. 23 - блок-схема последовательности операций декодирования c переменной длиной слова согласно варианту осуществления 2.Fig. 23 is a flow chart of the variable length decoding operations according to
Фиг. 24 - блок-схема блока декодирования уровня согласно варианту осуществления 2.Fig. 24 is a block diagram of a level decoding unit according to
Фиг. 25 - блок-схема последовательности операций декодирования уровня согласно варианту осуществления 2.Fig. 25 is a flow chart of the layer decoding operations according to
Фиг. 26 - блок-схема последовательности операций декодирования greater1_flag согласно варианту осуществления 2.Fig. 26 is a flow chart of the decoding sequence of greater1_flag according to
Фиг. 27 - блок-схема последовательности операций декодирования greater2_flag согласно варианту осуществления 2.Fig. 27 is a flow chart of the decoding sequence of greater2_flag according to
Фиг. 28 - блок-схема последовательности операций декодирования остатка согласно варианту осуществления 2.Fig. 28 is a flow chart of the residual decoding operations according to
Фиг. 29 - блок-схема последовательности операций многозначного преобразования остатка согласно варианту осуществления 2.Fig. 29 is a flow chart of the multi-valued remainder transformation operations according to
Фиг. 30 - блок-схема последовательности операций декодирования префикса согласно варианту осуществления 2.Fig. 30 is a flow chart of a prefix decoding operation sequence according to
Фиг. 31 - блок-схема последовательности операций декодирования суффикса и объединения префикса и суффикса согласно варианту осуществления 2.Fig. 31 is a flow chart of the suffix decoding and prefix/suffix combining operations according to
Фиг. 32A - блок-схема последовательности операций способа кодирования изображения согласно варианту осуществления 1.Fig. 32A is a flow chart of the image encoding method according to
Фиг. 32B - блок-схема последовательности операций кодирования первого флага и кодирования второго флага согласно варианту осуществления 1.Fig. 32B is a flow chart of the first flag encoding and second flag encoding operations according to
Фиг. 33A - блок-схема последовательности операций способа декодирования изображения согласно варианту осуществления 2.Fig. 33A is a flow chart of the image decoding method according to
Фиг. 33B - блок-схема последовательности операций декодирования первого флага и декодирования второго флага согласно варианту осуществления 2.Fig. 33B is a flow chart of the first flag decoding and second flag decoding operations according to
Фиг. 34 - блок-схема блока кодирования уровня согласно варианту осуществления 3.Fig. 34 is a block diagram of a level coding unit according to Embodiment 3.
Фиг. 35 - блок-схема последовательности операций кодирования уровня согласно варианту осуществления 3.Fig. 35 is a flow chart of the layer encoding operations according to
Фиг. 36 - блок-схема последовательности операций выбора набора контекстов согласно варианту осуществления 3.Fig. 36 is a flow chart of the sequence of operations for selecting a set of contexts according to
Фиг. 37 - таблица, показывающая результаты оценки способа кодирования изображения согласно варианту осуществления 3.Fig. 37 is a table showing the evaluation results of the image encoding method according to
Фиг. 38 - блок-схема устройства декодирования уровня согласно варианту осуществления 4.Fig. 38 is a block diagram of a level decoding device according to
Фиг. 39 - блок-схема последовательности операций декодирования уровня согласно варианту осуществления 4.Fig. 39 is a flow chart of the layer decoding operations according to
Фиг. 40 - общая конфигурация системы предоставления контента для реализации услуг распространения контента.Fig. 40 - general configuration of the content provision system for implementing content distribution services.
Фиг. 41 - общая конфигурация цифровой широковещательной системы.Fig. 41 - General configuration of a digital broadcasting system.
Фиг. 42 - блок-схема, иллюстрирующая пример конфигурации телевизора.Fig. 42 is a block diagram illustrating an example configuration of a television set.
Фиг. 43 - блок-схема, иллюстрирующая пример конфигурации блока воспроизведения/записи информации, который считывает и записывает информацию с и на носитель записи, которым является оптический диск.Fig. 43 is a block diagram illustrating an example of a configuration of an information playback/recording unit that reads and writes information from and to a recording medium, which is an optical disc.
Фиг. 44 показывает пример конфигурации носителя записи, которым является оптический диск.Fig. 44 shows an example of the configuration of a recording medium which is an optical disc.
Фиг. 45A показывает пример сотового телефона.Fig. 45A shows an example of a cellular telephone.
Фиг. 45B - блок-схема, показывающая пример конфигурации сотового телефона.Fig. 45B is a block diagram showing an example configuration of a cellular telephone.
Фиг. 46 иллюстрирует структуру мультиплексированных данных.Fig. 46 illustrates the structure of multiplexed data.
Фиг. 47 схематично показывает, каким образом каждый поток мультиплексирован в мультиплексированных данных.Fig. 47 shows schematically how each stream is multiplexed in the multiplexed data.
Фиг. 48 более подробно показывает, как видеопоток сохранен в потоке PES-пакетов.Fig. 48 shows in more detail how the video stream is stored in the PES packet stream.
Фиг. 49 показывает структуру пакетов TS и исходных пакетов в мультиплексированных данных.Fig. 49 shows the structure of TS packets and source packets in multiplexed data.
Фиг. 50 показывает структуру данных РМТ.Fig. 50 shows the data structure of the RMT.
Фиг. 51 показывает внутреннюю структуру информации мультиплексированных данных.Fig. 51 shows the internal structure of multiplexed data information.
Фиг. 52 показывает внутреннюю структуру информации атрибутов потока.Fig. 52 shows the internal structure of the flow attribute information.
Фиг. 53 показывает этапы для идентификации видео данных.Fig. 53 shows the steps for identifying video data.
Фиг. 54 показывает пример конфигурации интегральной схемы для реализации способа кодирования движущегося изображения и способа декодирования движущегося изображения в соответствии с каждым из вариантов осуществления.Fig. 54 shows an example of a configuration of an integrated circuit for implementing a moving image encoding method and a moving image decoding method according to each of the embodiments.
Фиг. 55 показывает конфигурацию для переключения между частотами возбуждения.Fig. 55 shows a configuration for switching between excitation frequencies.
Фиг. 56 показывает этапы для идентификации видео данных и переключения между частотами возбуждения.Fig. 56 shows the steps for identifying video data and switching between excitation frequencies.
Фиг. 57 показывает пример справочной таблицы, в которой стандарты видео данных ассоциированы с частотами возбуждения.Fig. 57 shows an example of a look-up table in which video data standards are associated with excitation frequencies.
Фиг. 58A - диаграмма, показывающая пример конфигурации для совместного использования модуля блока обработки сигналов.Fig. 58A is a diagram showing an example of a configuration for sharing a signal processing unit module.
Фиг. 58B - диаграмма, показывающая другой пример конфигурации для совместного использования модуля блока обработки сигналов.Fig. 58B is a diagram showing another example of a configuration for sharing a signal processing unit module.
Описание вариантов осуществленияDescription of embodiments
[0010] Базовые знания, формирующие основу настоящего изобретения[0010] Basic knowledge forming the basis of the present invention
По отношению к традиционному способу кодирования изображения, изобретатели обнаружили следующую проблему.In relation to the traditional method of image encoding, the inventors discovered the following problem.
[0011] Способ кодирования изображения в соответствии с настоящим стандартом HEVC (см., например, непатентный документ 1) включает в себя этап предсказания кодированного изображения, этап вычисления разности между предсказанным изображением и целевым изображением, этап преобразования результирующего дифференциального изображение в коэффициенты частоты и этап выполнения арифметического кодирования над коэффициентами частоты. В арифметическом кодировании, коэффициенты в блоке коэффициентов, подлежащем кодированию (блоке коэффициентов кодирования), кодируются последовательно в порядке от коэффициента более высокой частоты к компоненту более низкой частоты. Здесь контекст выбирается в соответствии с кодированным коэффициентом, и арифметическое кодирование выполняется над коэффициентом, подлежащем кодированию (коэффициентом кодирования), в соответствии с вероятностью появления символа, определяемой на основе выбранного контекста.[0011] The image encoding method according to the present HEVC standard (see, for example, Non-Patent Document 1) includes a step of predicting an encoded image, a step of calculating a difference between the predicted image and a target image, a step of converting the resulting differential image into frequency coefficients, and a step of performing arithmetic encoding on the frequency coefficients. In the arithmetic encoding, the coefficients in a block of coefficients to be encoded (coding coefficient block) are encoded sequentially in order from a coefficient of a higher frequency to a component of a lower frequency. Here, a context is selected according to a coded coefficient, and arithmetic encoding is performed on the coefficient to be encoded (coding coefficient) according to a probability of occurrence of a symbol determined based on the selected context.
[0012] В обычном изображении коэффициент с более низкочастотным компонентом, вероятно, будет иметь большее значение. Поэтому, возможно, будет вызвана вероятность возникновения символа, имеющего смещение, путем определения контекста со ссылкой на кодированный коэффициент (коэффициент с более высокой частотой, чем частота коэффициента кодирования). Например, если кодированный коэффициент (коэффициент с более высокой частотой, чем частота коэффициента кодирования) имеет большое значение, то существует высокая вероятность того, что коэффициент кодирования также имеет большое значение. Поэтому устройство кодирования изображения может уменьшить результирующую величину кодирования с использованием контекста для большого значения. В настоящем стандарте HEVC, подсчитывается количество кодированных коэффициентов, каждый из которых имеет абсолютное значение 2 или более, и контекст для коэффициента кодирования определяется в соответствии с количеством.[0012] In a normal image, a coefficient with a lower frequency component is likely to have a larger value. Therefore, the probability of occurrence of a symbol having an offset may be caused by determining a context with reference to a coded coefficient (a coefficient with a higher frequency than the frequency of the coding coefficient). For example, if a coded coefficient (a coefficient with a higher frequency than the frequency of the coding coefficient) has a large value, there is a high probability that the coding coefficient also has a large value. Therefore, an image coding device can reduce the resulting coding amount using the context for the large value. In the present HEVC standard, the number of coded coefficients each of which has an absolute value of 2 or more is counted, and the context for the coding coefficient is determined according to the number.
[0013] Однако авторы изобретения обнаружили, что традиционный способ кодирования изображений требует подсчитывать количество кодированных коэффициентов, каждый из которых имеет абсолютное значение 2 или более, и, следовательно, должен иметь обработку для подсчета и резистор, который хранит значение счета.[0013] However, the inventors found that the conventional image coding method requires counting the number of coded coefficients, each of which has an absolute value of 2 or more, and therefore must have processing for counting and a resistor that stores the count value.
[0014] Для того чтобы решить вышеуказанную проблему, в соответствии с аспектом настоящего изобретения предложен способ кодирования изображения с использованием арифметического кодирования, причем способ кодирования изображения включает в себя: выполнение арифметического кодирования над первым флагом, который указывает, является ли абсолютное значение целевого коэффициента в целевом блоке коэффициентов большим, чем 1; и выполнение арифметического кодирования над вторым флагом, указывающим, является ли абсолютное значение большем, чем 2, при этом, при выполнении арифметического кодирования над первым флагом и выполнении арифметического кодирования над вторым флагом, определяется, включает ли в себя непосредственно предшествующий блок коэффициентов, который был кодирован непосредственно перед целевым блоком коэффициентов, коэффициент, имеющий абсолютное значение большее, чем пороговое значение, и контекст, подлежащий использованию в арифметическом кодировании над первым флагом и контекст, подлежащий использованию в арифметическом кодировании над вторым флагом выбираются на основе результата определения.[0014] In order to solve the above problem, according to an aspect of the present invention, a method for encoding an image using arithmetic encoding is provided, wherein the method for encoding an image includes: performing arithmetic encoding on a first flag that indicates whether an absolute value of a target coefficient in a target block of coefficients is greater than 1; and performing arithmetic encoding on a second flag that indicates whether the absolute value is greater than 2, wherein, when performing arithmetic encoding on the first flag and performing arithmetic encoding on the second flag, it is determined whether an immediately preceding block of coefficients that was encoded immediately before the target block of coefficients includes a coefficient having an absolute value greater than a threshold value, and a context to be used in arithmetic encoding on the first flag and a context to be used in arithmetic encoding on the second flag are selected based on the determination result.
[0015] Таким образом, способ кодирования изображения выбирает контекст в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. В результате, способ кодирования изображения может уменьшить объем обработки по сравнению со случаем, когда контекст выбирается в зависимости от количества коэффициентов. Кроме того, способ кодирования изображения может подавлять снижение эффективности кодирования и уменьшать объем обработки.[0015] Thus, the image encoding method selects a context according to whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value. As a result, the image encoding method can reduce the amount of processing compared to the case where the context is selected depending on the number of coefficients. In addition, the image encoding method can suppress the decrease in encoding efficiency and reduce the amount of processing.
[0016] Например, возможно, что при выполнении арифметического кодирования над первым флагом и выполнении арифметического кодирования над вторым флагом, упомянутое определение выполняется на основе переменной, генерируемой в арифметическом кодировании над непосредственно предшествующим блоком коэффициентов.[0016] For example, it is possible that when performing arithmetic coding on the first flag and performing arithmetic coding on the second flag, said determination is performed based on a variable generated in the arithmetic coding on the immediately preceding block of coefficients.
[0017] Таким образом, способ кодирования изображения может уменьшить объем обработки путем выполнения выбора текста на основе переменной, которая была использована в другой обработке.[0017] Thus, the image encoding method can reduce the amount of processing by performing text selection based on a variable that has been used in other processing.
[0018] Например, также возможно, что способ кодирования изображения дополнительно включает в себя преобразование в двоичное представление (бинаризацию) остатка в соответствии с таблицей преобразования, назначенной параметром бинаризации из числа множества таблиц преобразования, когда абсолютное значение целевого коэффициента больше, чем два, причем остаток является значением, полученным путем вычитания 3 из абсолютного значения, при этом параметр бинаризации определяется в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение, и при этом переменная является параметром бинаризации.[0018] For example, it is also possible that the image encoding method further includes converting into a binary representation (binarization) the residual according to a look-up table designated by the binarization parameter from among a plurality of look-up tables, when the absolute value of the target coefficient is greater than two, wherein the residual is a value obtained by subtracting 3 from the absolute value, wherein the binarization parameter is determined according to whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value, and wherein the variable is the binarization parameter.
[0019] Например, дополнительно возможно, что пороговое значение равно 1.[0019] For example, it is further possible that the threshold value is 1.
[0020] В соответствии с другим аспектом настоящего изобретения предложен способ декодирования изображения с использованием арифметического декодирования, причем способ декодирования изображения включает в себя: выполнение арифметического декодирования над первым флагом, который указывает, является ли абсолютное значение целевого коэффициента в целевом блоке коэффициентов большим, чем 1; и выполнение арифметического декодирования над вторым флагом, который указывает, является ли абсолютное значение большим, чем 2, при этом, при выполнении арифметического декодирования над первым флагом и выполнении арифметического декодирования над вторым флагом, определяется, включает ли в себя непосредственно предшествующий блок коэффициентов, который был декодирован непосредственно перед целевым блоком коэффициентов, коэффициент, имеющий абсолютное значение большее, чем пороговое значение, и контекст, подлежащий использованию в арифметическом декодировании над первым флагом и контекст, подлежащий использованию в арифметическом декодировании над вторым флагом выбираются на основе результата определения.[0020] According to another aspect of the present invention, a method for decoding an image using arithmetic decoding is provided, wherein the method for decoding an image includes: performing arithmetic decoding on a first flag that indicates whether an absolute value of a target coefficient in a target block of coefficients is greater than 1; and performing arithmetic decoding on a second flag that indicates whether the absolute value is greater than 2, wherein, when performing arithmetic decoding on the first flag and performing arithmetic decoding on the second flag, it is determined whether an immediately preceding block of coefficients that was decoded immediately before the target block of coefficients includes a coefficient having an absolute value greater than a threshold value, and a context to be used in arithmetic decoding on the first flag and a context to be used in arithmetic decoding on the second flag are selected based on the determination result.
[0021] Таким образом, способ декодирования изображения выбирает контекст в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. В результате, способ декодирования изображения может уменьшить объем обработки по сравнению со случаем, когда контекст выбран в зависимости от количества коэффициентов. Кроме того, способ декодирования изображения может подавлять снижение эффективности кодирования и уменьшать объем обработки.[0021] In this way, the image decoding method selects a context according to whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value. As a result, the image decoding method can reduce the amount of processing compared to the case where the context is selected depending on the number of coefficients. In addition, the image decoding method can suppress the decrease in encoding efficiency and reduce the amount of processing.
[0022] Например, возможно, что при выполнении арифметического декодирования над первым флагом и выполнение арифметического декодирования над вторым флагом, упомянутое определение выполняется на основе переменной, генерируемой в арифметическом декодировании над непосредственно предшествующим блоком коэффициентов.[0022] For example, it is possible that when performing arithmetic decoding on the first flag and performing arithmetic decoding on the second flag, said determination is performed based on a variable generated in the arithmetic decoding on the immediately preceding block of coefficients.
[0023] Таким путем способ декодирования изображения может уменьшить объем обработки, выполняя выбор текста на основе переменной, которая была использована в другой обработке.[0023] In this way, the image decoding method can reduce the amount of processing by performing text selection based on a variable that has been used in other processing.
[0024] Например, также возможно, что способ декодирования изображения дополнительно включает в себя: преобразование остатка в многозначную величину в соответствии с таблицей преобразования, назначенной параметром бинаризации, из числа множества таблиц преобразования, когда абсолютное значение целевого коэффициента больше, чем 2, при этом остаток является значением, полученным путем вычитания 3 из абсолютного значения; и определение параметра бинаризации в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение, при этом переменная является параметром бинаризации.[0024] For example, it is also possible that the image decoding method further includes: converting the residual into a multi-valued value according to a look-up table designated by the binarization parameter, from among a plurality of look-up tables, when the absolute value of the target coefficient is greater than 2, wherein the residual is a value obtained by subtracting 3 from the absolute value; and determining the binarization parameter according to whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value, wherein the variable is the binarization parameter.
[0025] Например, дополнительно возможно, что пороговое значение равно 1.[0025] For example, it is further possible that the threshold value is 1.
[0026] Согласно еще одному аспекту настоящего изобретения, предложено устройство кодирования изображения, которое выполняет арифметическое кодирование, причем устройство кодирования изображения содержит: схему управления и средство хранения, доступное из схемы управления, при этом схема управления исполняет способ кодирования изображения по пункту 1 формулы изобретения.[0026] According to another aspect of the present invention, an image encoding device is provided that performs arithmetic encoding, wherein the image encoding device comprises: a control circuit and a storage means accessible from the control circuit, wherein the control circuit executes the image encoding method according to
[0027] При этом устройство декодирования изображения выбирает контекст в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. В результате, устройство декодирования изображения может уменьшить объем обработки по сравнению со случаем, когда контекст выбирается в соответствии с количеством коэффициентов. Кроме того, устройство кодирования изображения может подавлять снижение эффективности кодирования и уменьшать объем обработки.[0027] In this case, the image decoding device selects a context in accordance with whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value. As a result, the image decoding device can reduce the amount of processing compared with the case where the context is selected in accordance with the number of coefficients. In addition, the image encoding device can suppress the decrease in encoding efficiency and reduce the amount of processing.
[0028] Согласно еще одному аспекту настоящего изобретения, предложено устройство декодирования изображения, которое выполняет арифметическое декодирование, причем устройство декодирования изображения включает в себя: схему управления и средство хранения, доступное из схемы управления, причем схема управления исполняет способ декодирования изображения по пункту 5 формулы изобретения.[0028] According to another aspect of the present invention, an image decoding device is provided that performs arithmetic decoding, wherein the image decoding device includes: a control circuit and a storage means accessible from the control circuit, wherein the control circuit executes the image decoding method according to
[0029] При этом устройство декодирования изображения выбирает контекст в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. В результате, устройство декодирования изображения может уменьшить объем обработки по сравнению со случаем, когда контекст выбирается в соответствии с количеством коэффициентов. Кроме того, устройство декодирования изображения может подавлять снижение эффективности кодирования и уменьшать объем обработки.[0029] In this case, the image decoding device selects a context in accordance with whether the immediately preceding block of coefficients includes a coefficient having an absolute value greater than a threshold value. As a result, the image decoding device can reduce the amount of processing compared to the case where the context is selected in accordance with the number of coefficients. In addition, the image decoding device can suppress the decrease in encoding efficiency and reduce the amount of processing.
[0030] Согласно еще одному аспекту настоящего изобретения, предложено устройство кодирования и декодирования изображения, включающее в себя вышеописанные устройство кодирования изображения и устройство декодирования изображения.[0030] According to another aspect of the present invention, an image encoding and decoding device is provided, including the above-described image encoding device and image decoding device.
[0031] Эти общие и конкретные аспекты могут быть реализованы с использованием системы, способа, интегральной схемы, компьютерной программы или считываемого компьютером носителя записи, такого как CD-ROM, или любой комбинации систем, способов, интегральных схем, компьютерных программ или считываемых компьютером носителей записи.[0031] These general and specific aspects may be implemented using a system, method, integrated circuit, computer program, or computer-readable recording medium such as a CD-ROM, or any combination of systems, methods, integrated circuits, computer programs, or computer-readable recording media.
[0032] Далее, некоторые примерные варианты осуществления устройства кодирования изображения и устройства декодирования изображения описаны со ссылкой на прилагаемые чертежи.[0032] Next, some exemplary embodiments of the image encoding device and the image decoding device are described with reference to the accompanying drawings.
[0033] Каждый из примерных вариантов осуществления, описанных ниже, показывает конкретный пример настоящего изобретения. Численные значения, формы, материалы, структурные элементы, расположение и соединение структурных элементов, этапов, порядок обработки этапов и т.д., представленные в следующих примерных вариантах осуществления, являются лишь примерами и, следовательно, не ограничивают настоящее изобретение. Поэтому среди структурных элементов в следующих примерных вариантах осуществления структурные элементы, не упомянутые в любом из независимых пунктов формулы изобретения, описываются как произвольные структурные элементы.[0033] Each of the exemplary embodiments described below shows a specific example of the present invention. The numerical values, shapes, materials, structural elements, arrangement and connection of the structural elements, steps, processing order of the steps, etc. shown in the following exemplary embodiments are only examples and therefore do not limit the present invention. Therefore, among the structural elements in the following exemplary embodiments, the structural elements not mentioned in any of the independent claims are described as arbitrary structural elements.
[0034] (Вариант осуществления 1)[0034] (Implementation variant 1)
В варианте осуществления 1 описан вариант осуществления устройства кодирования изображения.In
[0035] <Общая структура>[0035] <General Structure>
Фиг. 1 - это блок-схема структуры устройства кодирования изображения в соответствии с вариантом осуществления 1.Fig. 1 is a block diagram of the structure of an image encoding device according to
[0036] Устройство 100 кодирования изображения, показанное на фиг. 1, кодирует входное изображение 121, чтобы генерировать кодированный поток 125 (кодированный битовый поток). Устройство 100 кодирования изображения включает в себя модуль 101 разделения на блоки кодирования, модуль 102 вычитания, модуль 103 преобразования, модуль 104 кодирования c переменной длиной слова, модуль 105 обратного преобразования, модуль 106 суммирования, память 107 кадров и модуль 108 предсказания.[0036] The
[0037] <Обработка (Общие сведения)>[0037] <Processing (General)>
Далее, со ссылкой на фиг. 2 описывается общий поток кодирования.Next, the general coding flow is described with reference to Fig. 2.
[0038] (Этап S101)[0038] (Step S101)
Модуль 101 разделения на блоки кодирования делит входное изображение 121 на блоки, подлежащие кодированию (блоки кодирования), 122, и последовательно подает блоки 122 кодирования как на модуль 102 вычитания, так и на модуль 108 предсказания. Здесь каждый из блоков 122 кодирования имеет переменный размер, и модуль 101 разделения на блоки кодирования, таким образом, обращается к особенностям входного изображения 121, чтобы разделить входное изображение 121 на блоки 122 кодирования. Например, один блок 122 кодирования имеет минимально горизонтальные 4 пикселя х вертикальные 4 пикселя и максимально горизонтальные 32 пикселя х вертикальные 32 пикселя.The coding
[0039] (Этап S102)[0039] (Step S102)
Модуль 108 предсказания генерирует блок 129 предсказания с использованием блока 122 кодирования и декодированного изображения 128, сохраненного в памяти 107 кадров.The
[0040] (Этап S103)[0040] (Step S103)
Модуль 102 вычитания генерирует дифференциальный блок 123, который представляет собой разность между блоком 122 кодирования и блоком 129 предсказания.
[0041] (Этап S104)[0041] (Step S104)
Модуль 103 преобразования преобразует дифференциальный блок 123 в коэффициенты 124 частоты.The
[0042] (Этап S105)[0042] (Step S105)
Модуль 104 кодирования c переменной длиной слова выполняет кодирование переменной длины над коэффициентами 124 частоты для генерации кодированного потока 125.The variable
[0043] (Этап S106)[0043] (Step S106)
Модуль 105 обратного преобразования преобразует коэффициенты 124 частоты в пиксельные данные для восстановления дифференциального блока 126.The
[0044] (Этап S107)[0044] (Step S107)
Модуль 106 суммирования суммирует восстановленный дифференциальный блок 126 и блок 129 предсказания вместе для генерации декодированного блока 127 и сохраняет, в качестве декодированного изображения 128, генерированный декодированный блок 127 в памяти 107 кадров.The adding
[0045] (Этап S108)[0045] (Step S108)
Обработка от этапа S102 до этапа S107 повторяется, пока все блоки кодирования в целевом изображении, подлежащем кодированию, не будут закодированы.The processing from step S102 to step S107 is repeated until all coding blocks in the target image to be encoded are encoded.
[0046] Ниже более подробно описан модуль 104 кодирования c переменной длиной слова.[0046] The variable
[0047] <Структура модуля 104 кодирования c переменной длиной слова>[0047] <Structure of Variable
Фиг. 3 - это блок-схема, показывающая структуру модуля 104 кодирования c переменной длиной слова.Fig. 3 is a block diagram showing the structure of the variable
[0048] В настоящем варианте осуществления модуль 104 кодирования c переменной длиной слова кодирует целевой коэффициент 124 частоты (в дальнейшем упоминается также просто, как "коэффициент") на основе пяти параметров: significant_flag, greater1_flag, greater2_flag, остаток и sign_flag.[0048] In the present embodiment, the variable
[0049] significant_flag - это флаг, указывающий, равен ли 0 соответствующий коэффициент. Если significant_flag имеет значение 0, это означает, что коэффициент равен 0. Если significant_flag имеет значение 1, это означает, что коэффициент не равен 0.[0049] significant_flag is a flag indicating whether the corresponding coefficient is 0. If significant_flag is 0, it means that the coefficient is 0. If significant_flag is 1, it means that the coefficient is not 0.
[0050] greater1_flag существует только тогда, когда significant_flag имеет значение 1 (другими словами, коэффициент не равен 0). greater1_flag указывает, является ли абсолютное значение коэффициента равным 2 или более (другими словами, больше, чем 1). Если greater1_flag имеет значение 0, это означает, что абсолютное значение равно 1. Если greater1_flag имеет значение 1, это означает, что абсолютное значение равно 2 или более.[0050] greater1_flag exists only when significant_flag is 1 (in other words, the coefficient is not 0). greater1_flag indicates whether the absolute value of the coefficient is 2 or greater (in other words, greater than 1). If greater1_flag is 0, it means the absolute value is 1. If greater1_flag is 1, it means the absolute value is 2 or greater.
[0051] greater2_flag существует только тогда, когда greater1_flag имеет значение 1 (другими словами, коэффициент имеет абсолютное значение 2 или больше). greater2_flag указывает, является ли абсолютное значение коэффициента равным 3 или более (другими словами, больше, чем 2). Если greater2_flag имеет значение 0, это означает, что абсолютное значение равно 2. Если greater2_flag имеет значение 1, это означает, что абсолютное значение равно 3 или более.[0051] greater2_flag exists only when greater1_flag is 1 (in other words, the coefficient has an absolute value of 2 or greater). greater2_flag indicates whether the absolute value of the coefficient is 3 or greater (in other words, greater than 2). If greater2_flag is 0, it means the absolute value is 2. If greater2_flag is 1, it means the absolute value is 3 or greater.
[0052] Остаток существует только тогда, когда greater2_flag имеет значение 1 (другими словами, абсолютное значение равно 3 или более). Остаток указывает значение, полученное путем вычитания 3 из абсолютного значения.[0052] The remainder only exists when greater2_flag is 1 (in other words, the absolute value is 3 or greater). The remainder specifies the value obtained by subtracting 3 from the absolute value.
[0053] sign_flag существует только тогда, когда significant_flag имеет значение 1 (другими словами, коэффициент не равен 0). sign_flag указывает, имеет ли коэффициент отрицательное значение (другими словами, является ли значение коэффициента отрицательным или положительным). Если sign_flag имеет значение 0, это означает, что коэффициент имеет положительное значение. Если sign_flag имеет значение 1, это означает, что коэффициент имеет отрицательное значение.[0053] sign_flag exists only when significant_flag is 1 (in other words, the coefficient is not 0). sign_flag indicates whether the coefficient is negative (in other words, whether the coefficient value is negative or positive). If sign_flag is 0, it means the coefficient is positive. If sign_flag is 1, it means the coefficient is negative.
[0054] Как показано на фиг. 3, модуль 104 кодирования c переменной длиной слова включает в себя модуль 131 разделения на блоки коэффициентов, модуль 132 кодирования significant_flag, модуль 133 кодирования уровня и модуль 134 кодирования sign_flag.[0054] As shown in Fig. 3, the variable
[0055] Модуль 132 кодирования significant_flag кодирует significant_flag. Модуль 133 кодирования уровня кодирует greater1_flag, greater2_flag и остаток. Модуль 134 кодирования sign_flag кодирует sign_flag.[0055]
[0056] <Обработка (Кодирование переменной длины)>[0056] <Processing (Variable Length Encoding)>
Далее, со ссылкой на фиг. 4, описывается поток кодирования c переменной длиной слова.Next, with reference to Fig. 4, a variable-length coding stream is described.
[0057] (Этап S121)[0057] (Step S121)
Модуль 131 разделения на блоки коэффициентов делит целевой блок кодирования (коэффициенты 124 частоты) на блоки коэффициентов, каждый из которых имеет 4 пикселя х 4 пикселя (далее также упоминается как "4х4 блоки коэффициентов"). Более конкретно, когда целевой блок кодирования имеет размер 32х32, то модуль 131 разделения на блоки коэффициентов делит его горизонтально на 8 частей и вертикально на 8 частей. Когда целевой блок кодирования имеет размер 4х4, модуль 131 разделения на блоки коэффициентов не делит такой блок. Последующая обработка от этапа S122 до этапа S124 выполняется для каждого из блоков коэффициентов. Блоки коэффициентов обрабатываются последовательно в порядке от блока коэффициентов, имеющего более высокий компонент, к блоку коэффициентов, имеющему более низкий компонент.The coefficient
[0058] (Этап S122)[0058] (Step S122)
Модуль 132 кодирования significant_flag кодирует significant_flag каждого из коэффициентов, включенных в целевой блок коэффициентов.The
[0059] (Этап S123)[0059] (Step S123)
Модуль 133 кодирования уровня кодирует greater1_flag, greater2_flag и остаток каждого из коэффициентов, включенных в целевой блок коэффициентов.The
[0060] (Этап S124)[0060] (Step S124)
Модуль 134 кодирования sign_flag кодирует sign_flag каждого из коэффициентов, включенных в целевой блок коэффициентов.The
[0061] (Этап S125)[0061] (Step S125)
Обработка от этапа S122 до этапа S124 повторяется, пока все блоки коэффициентов в целевом блоке кодирования не будут обработаны.The processing from step S122 to step S124 is repeated until all coefficient blocks in the target encoding block have been processed.
[0062] Ниже приведено более подробное описание модуля 133 кодирования уровня.[0062] A more detailed description of the
[0063] <Структура модуля 133 кодирования уровня>[0063] <Structure of
Фиг. 5 - это блок-схема, показывающая структуру модуля 133 кодирования уровня. Как показано на фиг. 5, модуль 133 кодирования уровня включает в себя модуль 141 установки greater1_flag, модуль 142 установки greater2_flag, модуль 143 установки остатка, модуль 144 обновления параметра бинаризации, модуль 145 выбора наборов контекста, память 146 greater1_flag, модуль 147 выбора контекста greater1_flag, память 148 контекста greater1_flag, модуль 149 выбора контекста greater2_flag, память 150 контекста greater2_flag, модуль 151 арифметического кодирования и модуль 152 бинаризации остатка. Модуль 152 бинаризации остатка включает в себя модуль 153 определения префикса-суффикса, модуль 154 вывода структурного элемента (бина) суффикса 154 и модуль 155 вывода бина префикса.Fig. 5 is a block diagram showing the structure of the
[0064] Модуль 133 кодирования уровня сначала выбирает соответствующие наборы контекста, подлежащие использованию в арифметическом кодировании над greater1_flag и greater2_flag. Затем модуль 133 кодирования уровня кодирует greater1_flag, greater2_flag и остаток последовательно в порядке. Перед арифметическим кодированием модуль 133 кодирования уровня преобразует остаток от многозначного сигнала в бинаризованный сигнал (бин). При этом модуль 133 кодирования уровня адаптивно изменяет длину бинаризованного сигнала (бина) на основе параметра бинаризации (cParam). Модуль 133 кодирования уровня также использует этот параметр бинаризации, чтобы адаптивно выбирать наборы контекста.[0064] The
[0065] <Обработка (Кодирование уровня)>[0065] <Processing (Level Encoding)>
Далее, со ссылкой на фиг. 6-9, поток кодирования, выполняемого модулем 133 кодирования уровня, описывается более подробно. Фиг. 6 - это блок-схема последовательности операций кодирования, выполняемого модулем 133 кодирования уровня.Next, with reference to Fig. 6-9, the flow of encoding performed by the
[0066] (Этап S141)[0066] (Step S141)
Модуль 145 выбора наборов контекста устанавливает соответствующие количества наборов контекста, подлежащие использованию в арифметическом кодировании над greater1_flag и greater2_flag. Этот этап будет описан ниже более подробно.The context set
[0067] (Этап S142)[0067] (Step S142)
Модуль 144 обновления параметра бинаризации инициализирует параметр бинаризации (cParam) в 0. На этом этапе cParam устанавливается в 0 в начале целевого 4х4 блока коэффициентов. Следует отметить, что этапы S141 и S142 выполняются один раз для целевого блока коэффициентов. Однако следующие этапы с этапа S143 выполняются для каждого из коэффициентов.The binarization
[0068] (Этап S143)[0068] (Step S143)
Модуль 133 кодирования уровня кодирует greater1_flag каждого из коэффициентов, включенных в целевой блок коэффициентов. Фиг. 7 - это блок-схема последовательности операций, поясняющая этот этап более подробно.The
[0069] (Этап S151)[0069] (Step S151)
Модуль 141 установки greater1_flag определяет, является ли абсолютное значение целевого коэффициента (коэффициента, подлежащего обработке) равным 1 или более. Если абсолютное значение равно 1 или более, то greater1_flag кодируется на этапах S152 - S154. Если абсолютное значение равно 0, greater1_flag не кодируется.The
[0070] (Этап S152)[0070] (Step S152)
Если абсолютное значение целевого коэффициента равно 2 или более, то модуль 141 установки greater1_flag устанавливает greater1_flag в 1. Если абсолютное значение равно 1, то модуль 141 установки устанавливает greater1_flag в 0.If the absolute value of the target coefficient is 2 or greater, the
[0071] (Этап S153)[0071] (Step S153)
Модуль 147 выбора контекста greater1_flag устанавливает количество контекстов на основе количества наборов контекста, выбранного на этапе S141. Этот этап будет описан ниже более подробно.The greater1_flag
[0072] (Этап S154)[0072] (Step S154)
Модуль 151 арифметического кодирования загружает контекст, подлежащий использованию (контекст использования) из памяти 148 контекста greater1_flag на основе количества контекстов, выбранных на этапе S153, и затем выполняет арифметическое кодирование над greater1_flag с использованием контекста. Кроме того, модуль 151 арифметического кодирования сохраняет контекст, который был обновлен в арифметическом кодировании, обратно в то же место в памяти 148 контекста greater1_flag.The
[0073] (Этап S155)[0073] (Step S155)
Обработка от этапа S151 до этапа S155 повторяется, пока все коэффициенты целевого блока 4х4 коэффициентов не будут обработаны.The processing from step S151 to step S155 is repeated until all coefficients of the target 4x4 coefficient block have been processed.
[0074] В результате, greater1_flag соответствующих коэффициентов закодированы в целевом блоке коэффициентов.[0074] As a result, greater1_flag of the corresponding coefficients are encoded in the target coefficient block.
[0075] (Этап S144)[0075] (Step S144)
Модуль 133 кодирования уровня кодирует greater2_flag каждого из коэффициентов, включенных в целевой блок коэффициентов. Фиг. 8 - это блок-схема последовательности операций, поясняющая этот этап более подробно.The
[0076] (Этап S161)[0076] (Step S161)
Модуль 142 установки greater2_flag определяет, равно ли абсолютное значение целевого коэффициента 2 или более. Если абсолютное значение равно 2 или более, то greater2_flag кодируется на этапах от S162 до S165. Если абсолютное значение равно 1 или меньше, greater2_flag не кодируется.The
[0077] (Этап S162)[0077] (Step S162)
Если абсолютное значение целевого коэффициента равно 3 или более, то модуль 142 установки greater2_flag устанавливает greater2_flag в 1. Если абсолютное значение равно 2, то модуль 142 установки greater2_flag устанавливает greater2_flag в 0.If the absolute value of the target coefficient is 3 or greater, then the
[0078] (Этап S163)[0078] (Step S163)
Модуль 149 выбора контекста greater2_flag устанавливает количество наборов контекста, выбранное на этапе S141, как количество контекстов. В отличие от greater1_flag, количество наборов контекста для greater2_flag непосредственно устанавливается как количество контекстов. Другими словами, одиночный набор контекста для greater2_flag включает в себя только один контекст.The greater2_flag
[0079] (Этап S164)[0079] (Step S164)
Модуль 151 арифметического кодирования загружает контекст, подлежащий использованию (контекст использования), из памяти 150 контекста greater2_flag на основе количества контекстов, выбранного на этапе S150, и затем выполняет арифметическое кодирование над greater2_flag с использованием контекста. Кроме того, модуль 151 арифметического кодирования сохраняет контекст, который был обновлен в арифметическом кодировании, обратно в том же месте в памяти 150 контекста greater2_flag.The
[0080] (Этап S165)[0080] (Step S165)
Обработка от этапа S161 к этапу S164 повторяется, пока все коэффициенты целевого 4х4 блока коэффициентов не будут обработаны.The processing from step S161 to step S164 is repeated until all coefficients of the target 4x4 coefficient block have been processed.
[0081] В результате, greater2_flag соответствующих коэффициентов в целевом блоке коэффициентов закодированы.[0081] As a result, greater2_flag of the corresponding coefficients in the target coefficient block are encoded.
[0082] (Этап S145)[0082] (Step S145)
Модуль 133 кодирования уровня кодирует остаток в каждом из коэффициентов в целевом блоке коэффициентов. Фиг. 9 - это блок-схема последовательности операций, поясняющая этот этап более подробно.The
[0083] (Этап S171)[0083] (Step S171)
Модуль 143 установки остатка определяет, равно ли абсолютное значение целевого коэффициента 3 или больше. Если абсолютное значение равно 3 или больше, то остаток кодируется на этапах от S172 до S175. Если абсолютное значение равно 2 или меньше, остаток не кодируется.The
[0084] (Этап S172)[0084] (Step S172)
Модуль 143 установки остатка вычисляет числовое значение путем вычитания 3 из абсолютного значения целевого коэффициента и устанавливает числовое значение в качестве остатка (многозначный сигнал).The
[0085] (Этап S173)[0085] (Step S173)
Модуль 152 бинаризации остатка преобразует многозначный сигнал остатка в бинаризованный сигнал. Этот этап будет описан ниже более подробно.The
[0086] (Этап S174)[0086] (Step S174)
Модуль 151 арифметического кодирования выполняет арифметическое кодирование над остатком. В отличие от greater1_flag и greater2_flag, остаток применяется с обходным арифметическим кодированием, которое не использует никакого контекста.The
[0087] (Этап S175)[0087] (Step S175)
Модуль 144 обновления параметра бинаризации инициализирует параметр бинаризации (cParam). Этот этап будет описан ниже более подробно.The binarization
[0088] (Этап S176)[0088] (Step S176)
Обработка от этапа S171 до этапа S175 повторяется, пока все коэффициенты в целевом блоке коэффициентов не будут обработаны.The processing from step S171 to step S175 is repeated until all coefficients in the target coefficient block have been processed.
[0089] <Обработка (Выбор наборов контекста)>[0089] <Processing (Selecting Context Sets)>
Далее, со ссылкой на фиг. 10 будет более подробно описан выбор наборов контекста (S141 на фиг. 6).Next, with reference to Fig. 10, the selection of context sets (S141 in Fig. 6) will be described in more detail.
[0090] (Этапы с S181 по S183)[0090] (Steps S181 to S183)
Модуль 145 выбора наборов контекста определяет, имеет ли целевой блок коэффициентов самую низкую частоту в целевом блоке кодирования. Если целевой блок коэффициентов имеет самую низкую частоту, то количество наборов контекста устанавливается на 0. В противном случае, количество наборов контекста устанавливается на 2. Более конкретно, если целевой блок коэффициентов расположен в верхнем левом углу целевого блока кодирования, то модуль 145 выбора наборов контекста устанавливает количество наборов контекста на 0. В противном случае, количество наборов контекста устанавливается на 2.The context set
[0091] (Этапы S184 и S185)[0091] (Steps S184 and S185)
Если обновленный параметр бинаризации (cParam) блока коэффициентов (непосредственно предшествующего блока коэффициентов), который был обработан непосредственно перед целевым блоком коэффициентов, больше, чем 0, то модуль 145 выбора наборов контекста увеличивает количество наборов контекста на 1. Таким образом, если cParam был обновлен по меньшей мере один раз для непосредственно предшествующего блока коэффициентов, набор контекста изменяется.If the updated binarization parameter (cParam) of the coefficient block (the immediately preceding coefficient block) that was processed immediately before the target coefficient block is greater than 0, then the context set
[0092] Как описано выше, на этапах от S181 до S185 количество наборов контекста имеет значение в диапазоне от 0 до 3. Другими словами, существуют четыре вида наборов контекста, из которых модуль 145 выбора наборов контекста выбирает один.[0092] As described above, in steps S181 to S185, the number of context sets has a value in the range of 0 to 3. In other words, there are four kinds of context sets, from which the context set
[0093] <Обработка (Выбор контекста greater1_Flag)>[0093] <Processing (Select context greater1_Flag)>
Далее, со ссылкой на фиг. 11, выбор контекста greater1_flag (S153 на фиг. 7) описан более подробно.Next, with reference to Fig. 11, the selection of the greater1_flag context (S153 in Fig. 7) is described in more detail.
[0094] (Этап S191)[0094] (Step S191)
Из числа коэффициентов, которые были обработаны в целевом блоке коэффициентов, модуль 147 выбора контекста greater1_flag подсчитывает количество (G1NUM) greater1_flag со значением 1. Другими словами, модуль 147 выбора контекста greater1_flag подсчитывает количество коэффициентов, имеющих абсолютное значение 2 или больше. Здесь greater1_flag обработанных коэффициентов хранятся в памяти 146 greater1_flag, так что модуль 147 выбора контекста greater1_flag получает эти greater1_flag из памяти 146 greater1_flag.From the number of coefficients that have been processed in the target coefficient block, the greater1_flag
[0095] (Этапы от S192 до S193)[0095] (Steps S192 to S193)
Если G1NUM, подсчитанное на этапе S191, больше или равно 1, то модуль 147 выбора контекста greater1_flag устанавливает смещение контекста на 3. Если G1NUM равно 0, то обработка переходит к этапу S194. Другими словами, когда есть по меньшей мере один обработанный коэффициент, имеющий абсолютное значение 2 или больше в целевом блоке коэффициентов, смещение контекста устанавливается в 3.If G1NUM calculated in step S191 is greater than or equal to 1, the greater1_flag
[0096] (Этап S194)[0096] (Step S194)
Из обработанных коэффициентов в целевом блоке коэффициентов модуль 147 выбора контекста greater1_flag подсчитывает количество (G1NUM2) коэффициентов, имеющих greater1_flag. Другими словами, модуль 147 выбора контекста greater1_flag подсчитывает число коэффициентов, имеющих абсолютное значение 1 или больше. Здесь модуль 147 выбора контекста greater1_flag получает greater1_flag обработанных коэффициентов из памяти 146 geater1_flag.From the processed coefficients in the target coefficient block, the greater1_flag
[0097] (Этапы от S195 до S197)[0097] (Stages S195 to S197)
Если G1NUM2, подсчитанное на этапе S194, больше, чем 2, то модуль 147 выбора контекста greater1_flag устанавливает смещение контекста на 2. В противном случае, модуль 147 выбора контекста greater1_flag устанавливает смещение контекста на значение G1NUM2.If G1NUM2 calculated in step S194 is greater than 2, the greater1_flag
[0098] Таким образом, на этапах от S191 до S197 смещение контекста устанавливается на значение в диапазоне от 0 до 3.[0098] Thus, in steps S191 to S197, the context offset is set to a value in the range of 0 to 3.
[0099] (Этап S198)[0099] (Step S198)
Модуль 147 выбора контекста greater1_flag устанавливает количество контекстов на "(количество наборов контекста ×4)+смещение контекста" и затем результирующее количество контекстов в память 148 контекста greater1_flag. Поскольку количество наборов контекста имеет значение от 0 до 3, и смещение контекста имеет значение от 0 до 3, как показано на фиг. 12, количество контекстов в конечном итоге имеет значение в диапазоне от 0 до 15. Другими словами, существуют четыре вида наборов контекста, и существуют четыре контекста в каждом из наборов контекста для greater1_flag. Модуль 145 выбора наборов контекста выбирает один вид наборов контекста из четырех видов, и модуль 147 выбора контекста greater1_flag выбирает один из четырех контекстов в выбранном наборе контекста.The greater1_flag
[0100] <Обработка (Бинаризация остатка)>[0100] <Processing (Residual Binarization)>
Далее, со ссылкой на фиг. 13-16, бинаризация остатка (S173 на фиг. 9) описана более подробно. Таким образом, бинаризованный сигнал (бин) включает префикс и суффикс. Способ определения префикса и суффикса изменяется в соответствии с параметром бинаризации (cParam).Next, with reference to Fig. 13-16, the binarization of the remainder (S173 in Fig. 9) is described in more detail. Thus, the binarized signal (bin) includes a prefix and a suffix. The method for determining the prefix and the suffix is changed according to the binarization parameter (cParam).
[0101] (Этап S201)[0101] (Step S201)
Модуль 153 определения префикса-суффикса определяет префикс и суффикс. Фиг. 14 - это блок-схема, поясняющая этот этап более подробно. The prefix-
[0102] (Этапы от S211 до S222)[0102] (Steps S211 to S222)
Модуль 153 определения префикса-суффикса использует cParam в определении префикса и суффикса. Обработка определения классифицируется, главным образом, на следующие два способа. Если остаток мал, префикс и суффикс определяются на этапах S213 и S214. С другой стороны, если остаток велик, префикс и суффикс определяются на этапах от S215 до S222. cParam используется в качестве порогового значения, на основе которого определяется, является ли остаток малым или большим. Как cParam больше, пороговое значение больше. cParam связан с биновой длиной префикса и суффикса.The prefix-
[0103] Фиг. 15А-15С показывают бин префикса и суффикса в ассоциации с cParam и остатком. Как показано на фиг. 15А-15С, если остаток мал, меньший cParam приводит к более короткой биновой длине, а если остаток больше, то больший cParam приводит к более короткой биновой длине. Другими словами, если остаток был бы малым, меньший cParam, более вероятно, повысит эффективность кодирования. С другой стороны, если остаток был бы большим, больший cParam, более вероятно, повысит эффективность кодирования.[0103] Figs. 15A-15C show a prefix and suffix bin in association with a cParam and a residue. As shown in Figs. 15A-15C, if the residue is small, a smaller cParam results in a shorter bin length, and if the residue is larger, a larger cParam results in a shorter bin length. In other words, if the residue were small, a smaller cParam would be more likely to improve coding efficiency. On the other hand, if the residue were large, a larger cParam would be more likely to improve coding efficiency.
[0104] (Этап S202)[0104] (Step S202)
Модуль 155 вывода бина префикса предоставляет бин префикса на модуль 151 арифметического кодирования. Фиг. 16 - это блок-схема последовательности операций, поясняющая этот этап более подробно. The prefix
[0105] (Этапы от S231 до S235)[0105] (Steps S231 to S235)
Модуль 155 вывода бина префикса сначала выводит значения "1" в том же количестве, что и значение префикса, и, наконец, выводит значение "0".The prefix
[0106] (Этап S203)[0106] (Step S203)
Модуль 154 вывода бина суффикса предоставляет бин суффикса на модуль 151 арифметического кодирования. Фиг. 17 это блок-схема последовательности операций, поясняющая этот этап более подробно.The suffix
[0107] (Этапы от S241 до S245)[0107] (Steps S241 to S245)
Модуль 154 вывода бина суффикса преобразует значение суффикса в двоично-кодированную форму и выводит результирующие значения в двоично-кодированной форме последовательно в порядке от бита наивысшего порядка. Модуль 154 вывода бина суффикса выводит бин(ы) в количестве tmpLen. При этом, если количество битов в значении суффикса меньше, чем tmpLen, бит наивысшего порядка выводится как 0.The suffix
[0108] <Обработка (Обновление параметра бинаризации)>[0108] <Processing (Update Binarization Parameter)>
Далее, со ссылкой на фиг. 18, обновление параметра бинаризации (S175 на фиг. 9) описано более подробно. Next, with reference to Fig. 18, the updating of the binarization parameter (S175 in Fig. 9) is described in more detail.
[0109] (Этап S251)[0109] (Step S251)
Если параметр бинаризации (cParam) меньше, чем 4, то модуль 144 обновления параметра бинаризации обновляет cParam на этапах от S252 до S254. Если cParam равен 4 или больше, то модуль 144 обновления параметра бинаризации не обновляет cParam и завершает обработку.If the binarization parameter (cParam) is less than 4, the binarization
[0110] (Этапы от S252 до S254)[0110] (Steps S252 to S254)
Если абсолютное значение целевого коэффициента больше, чем пороговое значение, то модуль 144 обновления параметра бинаризации увеличивает cParam на 1. Пороговое значение определяется с помощью математической формулы "3х(1<< cParam)". "<<" означает сдвиг влево. Когда cParam имеет большее значение, пороговое значение имеет большую величину. Как описано выше, cParam инициализируется в 0 в начале обработки для целевого блока коэффициентов. Каждый раз, когда появляется коэффициент больший, чем пороговое значение, из-за обработки модуля 144 обновления параметра бинаризации, cParam увеличивается на 1, пока cParam не достигнет максимального значения 4.If the absolute value of the target coefficient is greater than the threshold value, the binarization
[0111] <Эффекты>[0111] <Effects>
Как описано выше, в устройстве 100 кодирования изображения в соответствии с настоящим вариантом осуществления, если существует коэффициент, имеющий абсолютное значение большее, чем пороговое значение, в целевом обработанном блоке коэффициентов, контекст для greater1_flag и контекст для greater2_flag изменяются. В результате, можно повысить эффективность кодирования при малом объеме обработки.As described above, in the
[0112] Более конкретно, параметр бинаризации (cParam) увеличивается на 1 каждый раз, когда найдено абсолютное значение коэффициента больше, чем пороговое значение. Если, в начале целевого блока коэффициентов, значение cParam, которое было обновлено в обработке непосредственно предшествующего блока коэффициентов, является большим, чем 0, другими словами, если непосредственно предшествующий блок коэффициентов включает в себя по меньшей мере один коэффициент больший, чем пороговое значение, то количество наборов контекста изменяется. Более конкретно, если существует коэффициент, имеющий большое значение в непосредственно предшествующем блоке коэффициентов (блоке коэффициентов с более высокой частотой, чем частота целевого блока коэффициентов), то устройство 100 кодирования изображения определяет, что существует высокая вероятность того, что целевой блок коэффициентов также включает в себя коэффициент, имеющий большое значение. Поэтому выбирается контекст, подходящий для коэффициента, имеющего большое значение.[0112] More specifically, the binarization parameter (cParam) is increased by 1 each time an absolute value of a coefficient greater than a threshold value is found. If, at the beginning of the target coefficient block, the value of cParam that was updated in the processing of the immediately preceding coefficient block is greater than 0, in other words, if the immediately preceding coefficient block includes at least one coefficient greater than a threshold value, then the number of context sets is changed. More specifically, if there is a coefficient having a large value in the immediately preceding coefficient block (a coefficient block with a higher frequency than the frequency of the target coefficient block), then the
[0113] В настоящем стандарте HVEC (см. непатентный документ 1) подсчитывается количество обработанных коэффициентов, имеющих абсолютную величину 2 или больше, и контекст для целевого коэффициента определяется в соответствии с количеством. Однако обработанные коэффициенты не ограничиваются коэффициентами, включенными в непосредственно предшествующий блок коэффициентов. Они могут быть множеством коэффициентов, включенных в множество блоков коэффициентов, которые расположены ближе к высокочастотной стороне, чем целевой блок коэффициентов.[0113] In the present HVEC standard (see Non-Patent Document 1), the number of processed coefficients having an absolute value of 2 or more is counted, and the context for the target coefficient is determined according to the number. However, the processed coefficients are not limited to the coefficients included in the immediately preceding coefficient block. They may be a plurality of coefficients included in a plurality of coefficient blocks that are located closer to the high-frequency side than the target coefficient block.
[0114] С другой стороны, в методе согласно настоящему варианту осуществления, не определяется, существует или нет коэффициент, превышающий пороговое значение, в непосредственно предшествующем блоке коэффициентов. Таким образом, устройству 100 кодирования изображения в соответствии с настоящим вариантом осуществления не нужно ни подсчитывать количество, ни иметь резистор для хранения значений отсчета.[0114] On the other hand, in the method according to the present embodiment, it is not determined whether or not there is a coefficient exceeding a threshold value in the immediately preceding block of coefficients. Thus, the
[0115] Кроме того, способ кодирования изображения согласно настоящему варианту осуществления был применен для тестирования программного обеспечения настоящего стандарта HEVC для экспериментов. Фиг. 19 показывает результаты эксперимента по сравнению с состоянием до применения. Условия эксперимента базируются на общих условиях эксперимента группы стандарта HEVC. Большее численное значение указывает более низкую эффективность кодирования. Отрицательное значение указывает улучшение эффективности кодирования. Как показано на фиг. 19, каждое из значений находится в пределах от -0,01% до 0,03%. Это означает, что эффективность кодирования практически не испытывает влияния, даже если подсчет коэффициентов устраняется.[0115] Furthermore, the image encoding method according to the present embodiment was applied to test the software of the present HEVC standard for experiments. Fig. 19 shows the experimental results compared with the state before application. The experimental conditions are based on the general experimental conditions of the HEVC standard group. A larger numerical value indicates lower encoding efficiency. A negative value indicates an improvement in encoding efficiency. As shown in Fig. 19, each of the values is in the range of -0.01% to 0.03%. This means that the encoding efficiency is hardly affected even if the coefficient counting is eliminated.
[0116] Кроме того, путем объединения информации, подлежащей использованию при выборе контекстов, и информации, подлежащей использованию при кодировании остатка, размер схемы уменьшается. Более конкретно, cParam, который получает приращение каждый раз, когда найдено абсолютное значение коэффициента, которое больше, чем пороговое значение, используется для изменения параметра бинаризации остатка и для выбора контекста greater1_flag и контекста greater2_flag, так что одна структура может выполнять различные функции. Таким образом, по сравнению с существующим стандартом HEVC, способ кодирования изображения согласно настоящему варианту осуществления может устранить подсчет коэффициентов, при этом ухудшение эффективности кодирования подавляется, без добавления новой структуры.[0116] In addition, by combining information to be used in selecting contexts and information to be used in encoding the residual, the size of the circuit is reduced. More specifically, cParam, which is incremented each time an absolute value of a coefficient that is greater than a threshold value is found, is used to change the binarization parameter of the residual and to select the greater1_flag context and the greater2_flag context, so that one structure can perform various functions. Thus, compared with the existing HEVC standard, the image encoding method according to the present embodiment can eliminate the coefficient counting, while the deterioration in encoding efficiency is suppressed, without adding a new structure.
[0117] Следует отметить, что выше было описано, что набор контекстов изменяется на основе параметра бинаризации (cParam), который был обновлен для непосредственно предшествующего блока коэффициентов. Однако устройство 100 кодирования изображения может выполнять изменения на основе параметра бинаризации, который был обновлен для блока коэффициентов, отличного от непосредственно предшествующего блока коэффициентов. Возможно, например, что устройство 100 кодирования изображения может изменить набор контекстов, когда cParam превышает 0 в обработке для любого обрабатываемого блока коэффициентов. Блоки коэффициентов обрабатываются последовательно в порядке от более высокочастотного блока. Таким образом, если cParam любого одного из блоков коэффициентов превышает 0, другими словами, если появляется коэффициент, имеющий абсолютное значение, которое больше или равно пороговому значению, существует высокая вероятность того, что все последующие блоки коэффициентов имеют большие значения коэффициентов. В таком случае, можно увеличить эффективность кодирования посредством выбора набора контекста, который подлежит использованию для приведенной выше возможности.[0117] It should be noted that it has been described above that the context set is changed based on the binarization parameter (cParam) that has been updated for the immediately preceding coefficient block. However, the
[0118] Кроме того, устройство 100 кодирования изображения инициализирует параметр бинаризации (cParam) в 0 в начале обработки для целевого блока коэффициентов. Однако также можно поддерживать использование cParam, обновленного для непосредственно предшествующего блока коэффициентов, без инициализации cParam в 0. Это дает возможность продолжать использовать состояние высокочастотного блока коэффициентов. В результате, эффективность кодирования иногда увеличивается в зависимости от входного изображения.[0118] In addition, the
[0119] Следует также отметить, что выше было описано, что устройство 100 кодирования изображения изменяет набор контекста, когда cParam больше, чем 0. Однако настоящий вариант осуществления не ограничивается вышеуказанным. Также можно изменять набор контекста, если, например, cParam больше, чем 1, или cParam больше, чем 2. В зависимости от входного изображения, иногда можно повысить эффективность кодирования путем изменения набора контекста, когда cParam больше, чем 1.[0119] It should also be noted that it has been described above that the
[0120] Следует также отметить, что выше было описано, что используются четыре вида наборов контекста, но настоящий вариант осуществления не ограничивается вышеуказанным. Может быть четыре или более видов наборов контекста или четыре или менее видов наборов контекста. Например, хотя выше описано, что устройство 100 кодирования изображения увеличивает количество наборов контекста на 1, когда cParam больше, чем 0, когда количество наборов контекстов равно 0 или 2. Однако также возможно, что количество наборов контекстов увеличивается на 1 только тогда, когда количество наборов контекстов равно 2.[0120] It should also be noted that it has been described above that four kinds of context sets are used, but the present embodiment is not limited to the above. There may be four or more kinds of context sets, or four or less kinds of context sets. For example, although it has been described above that the
[0121] Следует также отметить, что выше было описано, что устройство 100 кодирования изображения изменяет набор контекста, когда целевой блок коэффициентов имеет самую низкую частоту, но изменение может быть ненужным. Также возможно, что устройство 100 кодирования изображения увеличивает количество наборов контекста на 1, когда cParam больше, чем 0, и далее увеличивает результирующее количество наборов контекста на 1, когда cParam больше, чем 1. В зависимости от входного изображения, эффективность кодирования может быть увеличена, когда количество видов наборов контекста увеличивается. С другой стороны, в зависимости от входного изображения, когда количество наборов контекста уменьшается, можно уменьшить виды контекстов, тем самым уменьшая размер схемы для обработки выбора и уменьшая память для хранения контекстов.[0121] It should also be noted that it has been described above that the
[0122] Следует также отметить, что на фиг. 11 было показано, что устройство 100 кодирования изображения устанавливает контекст greater1_flag на основе G1NUM и G1NUM2, но настоящий вариант осуществления не ограничивается вышеуказанным. Например, устройство 100 кодирования изображения может установить контекст на основе позиции целевого коэффициента в целевом блоке коэффициентов или на основе G1NUM или G1NUM2.[0122] It should also be noted that in Fig. 11, it was shown that the
[0123] Следует также отметить, что выше было описано, что при выборе контекста для greater2_flag, устройство 100 кодирования изображения устанавливает количество наборов контекста как собственно количество контекста, но настоящий вариант осуществления не ограничивается вышеуказанным. Устройство 100 кодирования изображения может выбрать контекст для greater2_flag тем же самым методом, как используется для greater1_flag.[0123] It should also be noted that it has been described above that when selecting a context for greater2_flag, the
[0124] Следует также отметить, что выше было описано, что greater1_flag существует, когда абсолютное значение целевого коэффициента равно 1 или больше, и что greater2_flag существует, когда абсолютное значение целевого коэффициента равно 2 или больше. Однако также возможно ограничить соответствующее максимальное число флагов в блоке коэффициентов таким же образом, как в настоящем стандарте HEVC (непатентный документ 1). Возможно, что существует максимально восемь greater1_flag и максимально один greater2_flag.[0124] It should also be noted that it has been described above that greater1_flag exists when the absolute value of the target coefficient is 1 or greater, and that greater2_flag exists when the absolute value of the target coefficient is 2 or greater. However, it is also possible to limit the corresponding maximum number of flags in the coefficient block in the same way as in the present HEVC standard (Non-Patent Document 1). It is possible that there are a maximum of eight greater1_flag and a maximum of one greater2_flag.
[0125] Следует также отметить, что выше было описано, что в бинаризации остатка устройства 100 кодирования изображения префикс и суффикс формируют бин. Однако бинаризованный сигнал остатка может быть любым сигналом, пока биновая длина может быть изменена на основе cParam. Например, бинаризованный сигнал остатка может иметь только префикс или может быть выражен с помощью метода экспоненты Голомба из стандарта кодирования движущегося изображения H.264.[0125] It should also be noted that it has been described above that in the binarization of the residual of the
[0126] Следует также отметить, что выше было описано, что последний бин префикса установлен в 0, но последний 0 может быть удален, когда префикс является максимальным. Если префикс не максимален, необходимо вставить "0", чтобы уточнить бин на границе префикса и суффикса. Однако если устройство декодирования изображения знает максимальное значение коэффициента, то максимальное значение префикса очевидно. Таким образом, если префикс максимален, устройство декодирования изображения может определить границу между префиксом и суффиксом без "0". Устранение вставки "0" в случае максимального префикса может значительно сократить биновую длину, когда имеется большое число коэффициентов с максимальным префиксом (другими словами, когда битовая скорость кодирования является высокой). В результате, эффективность кодирования повышается.[0126] It should also be noted that it was described above that the last bin of the prefix is set to 0, but the last 0 can be removed when the prefix is the maximum. If the prefix is not the maximum, it is necessary to insert "0" to clarify the bin at the boundary of the prefix and the suffix. However, if the image decoding device knows the maximum value of the coefficient, the maximum value of the prefix is obvious. Thus, if the prefix is the maximum, the image decoding device can determine the boundary between the prefix and the suffix without "0". Eliminating the insertion of "0" in the case of the maximum prefix can significantly shorten the bin length when there are a large number of coefficients with the maximum prefix (in other words, when the coding bit rate is high). As a result, the coding efficiency is improved.
[0127] Выше было описано, что пороговое значение, используемое в обновлении параметра бинаризации (cParam) устанавливается в соответствии с математической формулой "3*(1<<cParam)", но настоящий вариант осуществления не ограничен вышеуказанным. Например, устройство кодирования изображения может использовать другое числовое значение, например "4" вместо "3" в математической формуле, или использовать другую математическую формулу.[0127] It has been described above that the threshold value used in updating the binarization parameter (cParam) is set according to the mathematical formula "3*(1<<cParam)", but the present embodiment is not limited to the above. For example, the image encoding device may use another numerical value, such as "4" instead of "3" in the mathematical formula, or use another mathematical formula.
[0128] Следует также отметить, что выше было описано, что устройство кодирования изображения использует контекст в арифметическом кодировании над greater1_flag и greater2_flag для всех коэффициентов, но также возможно, что обходное арифметическое кодирование, которое не использует контекст, может выполняться над greater1_flag или greater2_flag части коэффициентов таким же образом, как выполняется над остатком. Например, если greater1_flag непосредственно предшествующего коэффициента равно 1, устройство кодирования изображения может выполнять обходное арифметическое кодирование над greater1_flag целевого коэффициента. Также возможно, что устройство кодирования изображения выполняет обходное арифметическое кодирование над greater1_flag в начале блока целевых коэффициентов. Использование обходного арифметического кодирования может устранить загрузку и обновление контекста. Кроме того, использование обходного арифметического кодирования может устранить отношение зависимости с другим синтаксисом, использующим тот же контекст. В результате, обработка может быть выполнена с более высокой скоростью.[0128] It should also be noted that it has been described above that the image encoding device uses a context in the arithmetic coding over greater1_flag and greater2_flag for all coefficients, but it is also possible that a bypass arithmetic coding that does not use a context can be performed on the greater1_flag or greater2_flag of a part of the coefficients in the same way as it is performed on the remainder. For example, if greater1_flag of the immediately preceding coefficient is 1, the image encoding device can perform a bypass arithmetic coding on the greater1_flag of the target coefficient. It is also possible that the image encoding device performs a bypass arithmetic coding on greater1_flag at the beginning of a block of target coefficients. Using a bypass arithmetic coding can eliminate loading and updating the context. In addition, using a bypass arithmetic coding can eliminate a dependency relationship with another syntax using the same context. As a result, the processing can be performed at a higher speed.
[0129] Следует также отметить, что выше было описано, что блок кодирования имеет размер максимально 32 х 32 пикселей и минимально 4 х 4 пикселей, но размер блоков кодирования не ограничивается вышеуказанным. Также возможно, что блоки кодирования имеют фиксированный размер.[0129] It should also be noted that it was described above that the coding block has a size of a maximum of 32 x 32 pixels and a minimum of 4 x 4 pixels, but the size of the coding blocks is not limited to the above. It is also possible that the coding blocks have a fixed size.
[0130] Следует также отметить, что выше было описано, что блок кодирования делится на 4×4 блоки коэффициентов, но это не является необходимым для разделения блока кодирования на блоки коэффициентов, каждый из которых имеет 4 пикселя ×4 пикселя. Например, можно также разделить блок кодирования на блоки коэффициентов, каждый из которых имеет 8 пикселей ×8 пикселей. Блок кодирования может быть разделен на прямоугольные блоки коэффициентов, каждый из которых имеет, например, 8 пикселей ×4 пикселя.[0130] It should also be noted that it was described above that the coding block is divided into 4×4 coefficient blocks, but it is not necessary to divide the coding block into coefficient blocks, each of which has 4 pixels×4 pixels. For example, it is also possible to divide the coding block into coefficient blocks, each of which has 8 pixels×8 pixels. The coding block can be divided into rectangular coefficient blocks, each of which has, for example, 8 pixels×4 pixels.
[0131] Кроме того, обработка в соответствии с настоящим вариантом осуществления может быть реализована в программном обеспечении. Это программное обеспечение может распространяться путем загрузки или тому подобного. Или это программное обеспечение, в целях распространения, может записываться на носитель записи, такой как CD-ROM. Вышеуказанное применимо к другим вариантам осуществления в этом описании.[0131] Furthermore, the processing according to the present embodiment may be implemented in software. This software may be distributed by downloading or the like. Or, this software may be recorded on a recording medium such as a CD-ROM for the purpose of distribution. The above applies to other embodiments in this description.
[0132] (Вариант осуществления 2)[0132] (Embodiment 2)
В варианте осуществления 2 приведено описание для устройства декодирования изображения, которое декодирует кодированный битовый поток, генерируемый устройством кодирования изображений согласно варианту осуществления 1.In
[0133] <Общая структура>[0133] <General Structure>
Фиг. 20 - это блок-схема, показывающая структуру устройства 200 декодирования изображения в соответствии с настоящим вариантом осуществления.Fig. 20 is a block diagram showing the structure of an
[0134] Устройство 200 декодирования изображения, показанное на фиг. 20, декодирует кодированный поток 221 для генерации декодированного изображения 225. Здесь кодированный поток 221 соответствует, например, кодированному потоку 125, генерируемому вышеописанным устройством 100 кодирования изображения. Устройство 200 декодирования изображения включает в себя модуль 201 декодирования c переменной длиной слова, модуль 202 обратного преобразования, модуль 203 суммирования, модуль 204 объединения декодированных блоков и память 205 кадров.[0134] The
[0135] <Обработка (Общие сведения)>[0135] <Processing (General)>
Далее, со ссылкой на фиг. 21, описан общий поток декодирования.Next, with reference to Fig. 21, the general decoding flow is described.
[0136] (Этап S301)[0136] (Step S301)
Модуль 201 декодирования c переменной длиной слова выполняет декодирование переменной длины над кодированным потоком 221, чтобы генерировать коэффициенты 222 частоты, и предоставляет коэффициенты 222 частоты на модуль 202 обратного преобразования.The variable
[0137] (Этап S302)[0137] (Step S302)
Модуль 202 обратного преобразования преобразует коэффициенты 222 частоты 222 в пиксельные данные для генерации дифференциального блока 223.The
[0138] (Этап S303)[0138] (Step S303)
Модуль 203 суммирования суммирует декодированное изображение 226, сохраненное в памяти 205 кадров, с дифференциальным блоком 223, таким образом, генерируя декодированный блок 224.The summing
[0139] (Этап S304)[0139] (Step S304)
Обработка от этапа S301 до этапа 303 повторяется, пока все блоки в целевом изображении не будут декодированы.The processing from step S301 to step 303 is repeated until all blocks in the target image have been decoded.
[0140] (Этап S305)[0140] (Step S305)
Модуль 204 объединения декодированных блоков объединяет множество декодированных блоков 224 вместе для генерации декодированного изображения 225 и сохраняет, как декодированное изображение 226, декодированное изображение 225 в памяти 205 кадров.The decoded
[0141] Ниже приведено более подробное описание модуля 201 декодирования c переменной длиной слова.[0141] A more detailed description of the variable
[0142] <Структура модуля 201 декодирования c переменной длиной слова>[0142] <Structure of Variable
Фиг. 22 - это блок-схема, показывающая структуру модуля 201 декодирования c переменной длиной слова. В настоящем варианте осуществления, подобно варианту осуществления 1, коэффициент 222 частоты (в дальнейшем называемый также просто "коэффициентом") выражается на основе пяти параметров: significant_flag, greater1_flag, greater2_flag, остаток и sign_flag. Соответствующие параметры указывают то же самое, что описано в варианте осуществления 1, так что повторное объяснение не приводится.Fig. 22 is a block diagram showing the structure of the variable-
[0143] Как показано на фиг. 22, модуль 201 декодирования c переменной длиной слова включает в себя модуль 231 декодирования significant_flag, модуль 232 декодирования уровня, модуль 233 декодирования sign_flag 233 и модуль 234 декодирования коэффициента.[0143] As shown in Fig. 22, the variable
[0144] <Обработка (Декодирование переменной длины)>[0144] <Processing (Variable Length Decoding)>
Далее, со ссылкой на фиг. 23, описан поток декодирования c переменной длиной слова.Next, with reference to FIG. 23, a variable word length decoding flow is described.
[0145] (Этап S321)[0145] (Step S321)
Модуль 231 декодирования significant_flag декодирует significant_flag каждого из коэффициентов в целевом блоке коэффициентов и предоставляет результирующий significant_flag в модуль 232 декодирования уровня, модуль 234 декодирования sign_flag и модуль 234 декодирования коэффициента.The
[0146] (Этап S322)[0146] (Step S322)
Модуль 232 декодирования уровня декодирует greater1_flag, greater2_flag и остаток каждого из коэффициентов в целевом блоке коэффициентов и предоставляет результирующие greater1_flag, greater2_flag и остаток на модуль 234 декодирования коэффициента. Здесь модуль 232 декодирования уровня декодирует greater1_flag, greater2_flag и остаток только тогда, когда significant_flag равен 1.The
[0147] (Этап S323)[0147] (Step S323)
Модуль 233 декодирования sign_flag декодирует sign_flag каждого из коэффициентов в целевом блоке коэффициентов и предоставляет результирующий sign_flag в модуль 234 декодирования коэффициента. Здесь модуль 233 декодирования sign_flag декодирует sign_flag только тогда, когда significant_flag равен 1.The
[0148] (Этап S324)[0148] (Step S324)
Модуль 234 декодирования коэффициента декодирует целевой коэффициент на основе significant_flag, greater1_flag, greater2_flag, остатка и sign_flag. Соответствующие параметры указывают то же самое, что описано в варианте осуществления 1, так что модуль 234 декодирования коэффициента декодирует целевой коэффициент в соответствии с указанием параметров.The
[0149] Ниже приведено более подробное описание модуля 232 декодирования уровня.[0149] A more detailed description of the
[0150] <Структура модуля 232 декодирования уровня>[0150] <Structure of
Фиг. 24 - это блок-схема, показывающая структуру модуля 232 декодирования уровня. Как показано на фиг. 24, модуль 232 декодирования уровня включает в себя модуль 241 выбора наборов контекста, модуль 242 выбора контекста greater1_flag, память 243 greater1_flag, память 244 контекста greater1_flag, модуль 245 выбора контекста greater2_flag, память 246 контекста greater2_flag, модуль 247 арифметического декодирования, модуль 248 обновления параметра бинаризации и модуль 249 многозначного остатка. Модуль 249 многозначного остатка включает в себя модуль 250 декодирования префикса, модуль 251 декодирования суффикса и модуль 252 объединения префикса-суффикса.Fig. 24 is a block diagram showing the structure of the
[0151] <Обработка (Декодирование уровня)>[0151] <Processing (Level Decoding)>
Далее, со ссылкой на фиг. 25-28, более подробно описывается декодирование уровня. Фиг. 25 - это блок-схема последовательности операций декодирования, выполняемого модулем 232 декодирования уровня.Next, with reference to Fig. 25-28, the level decoding will be described in more detail. Fig. 25 is a flow chart of the decoding sequence performed by the
[0152] (Этап S341)[0152] (Step S341)
Модуль 241 выбора наборов контекста устанавливает соответствующие количества наборов контекста, подлежащие использованию в арифметическом декодировании над greater1_flag и арифметическом декодировании над greater2_flag. Способ установки такой же, как при выборе наборов контекста (фиг. 10) в соответствии с вариантом осуществления 1.The context set
[0153] (Этап S342)[0153] (Step S342)
Модуль 248 обновления параметра бинаризации инициализирует параметр бинаризации (cParam) в 0. На этом этапе cParam устанавливается в 0 в начале целевого блока коэффициентов. Следует отметить, что этапы S341 и S342 выполняются один раз для целевого блока коэффициентов, в то время как следующие этапы с этапа S343 выполняются для каждого из коэффициентов в целевом блоке коэффициентов.The binarization
[0154] (Этап S343)[0154] (Step S343)
Модуль 232 декодирования уровня декодирует greater1_flag каждого из коэффициентов в целевом блоке коэффициентов. Фиг. 26 - это блок-схема, поясняющая этот этап более подробно.The
[0155] (Этап S351)[0155] (Step S351)
Модуль 232 декодирования уровня определяет, является ли significant_flag целевого коэффициента равным 1. Если significant_flag равен 1, то модуль 232 декодирования уровня декодирует greater1_flag на этапах S352 и S353. С другой стороны, если significant_flag равен 0, модуль 232 декодирования уровня не декодирует greater1_flag.The
[0156] (Этап S352)[0156] (Step S352)
Модуль 242 выбора контекста greater1_flag устанавливает количество контекстов на основе количества наборов контекста, выбранного на этапе S341. Способ установки тот же самый, как при выборе контекста greater1_flag (фиг. 11) в соответствии с вариантом осуществления 1.The greater1_flag
[0157] (Этап S353)[0157] (Step S353)
Модуль 247 арифметического декодирования загружает контекст, подлежащий использованию (контекст использования) из памяти 244 контекста greater1_flag в соответствии с количеством контекстов, выбранным на этапе S352, и выполняет арифметическое декодирование над greater1_flag посредством использования контекста. Кроме того, модуль 247 арифметического декодирования сохраняет контекст, который был обновлен в арифметическом декодировании, обратно в том же самом месте в памяти 244 контекста greater1_flag.The
[0158] (Этап S354)[0158] (Step S354)
Обработка от этапа S351 до этапа S353 повторяется, пока все коэффициенты в целевом блоке коэффициентов не будут обработаны.The processing from step S351 to step S353 is repeated until all coefficients in the target coefficient block have been processed.
[0159] В результате, greater1_flag соответствующих коэффициентов в целевом блоке коэффициентов декодируется.[0159] As a result, greater1_flag of the corresponding coefficients in the target coefficient block are decoded.
[0160] (Этап S344)[0160] (Step S344)
Модуль 232 декодирования уровня декодирует greater2_flag каждого из коэффициентов в целевом блоке коэффициентов. Фиг. 27 - это блок-схема, поясняющая этот этап более подробно.The
[0161] (Этап S361)[0161] (Step S361)
Модуль 232 декодирования уровня определяет, является ли greater1_flag целевого коэффициента равным 1. Если greater1_flag равен 1, то модуль 232 декодирования декодирует greater2_flag на этапах S362 и S363. С другой стороны, если greater1_flag равен 0, модуль 232 декодирования уровня не декодирует greater2_flag. Следует отметить, что если significant_flag целевого коэффициента равен 0, модуль 232 декодирования уровня не декодирует ни greater1_flag, ни greater2_flag.The
[0162] (Этап S362)[0162] (Step S362)
Модуль 245 выбора контекста greater2_flag устанавливает количество наборов контекста, выбранное на этапе S341, как количество контекстов. В отличие от greater1_flag, количество наборов контекста для greater2_flag непосредственно устанавливается на количество контекстов. Другими словами, одиночный набор контекста для greater2_flag включает в себя только один контекст.The greater2_flag
[0163] (Этап S363)[0163] (Step S363)
Модуль 247 арифметического декодирования загружает контекст, подлежащий использованию (контекст использования), из памяти 246 контекста greater2_flag в соответствии с количеством контекстов, выбранным на этапе S362, и выполняет арифметическое декодирование greater2_flag посредством использования контекста. Кроме того, модуль 247 арифметического декодирования сохраняет контекст, который был обновлен в арифметическом декодировании, обратно в том же самом месте в памяти 246 контекста greater2_flag.The
[0164] (Этап S364)[0164] (Step S364)
Обработка от этапа S361 до этапа S363 повторяется, пока все коэффициенты в целевом блоке коэффициентов не будут обработаны.The processing from step S361 to step S363 is repeated until all coefficients in the target coefficient block have been processed.
[0165] В результате, greater2_flag соответствующих коэффициентов в целевом блоке коэффициентов декодируются.[0165] As a result, greater2_flag corresponding coefficients in the target coefficient block are decoded.
[0166] (Этап S345)[0166] (Step S345)
Модуль 232 декодирования уровня декодирует остаток каждого из коэффициентов в целевом блоке коэффициентов. Фиг. 28 - это блок-схема последовательности операций, поясняющая этот этап более подробно.The
[0167] (Этап S371)[0167] (Step S371)
Модуль 232 декодирования уровня определяет, является ли greater2_flag целевого коэффициента равным 1. Если greater2_flag равен 1, то модуль 232 декодирования уровня декодирует остаток на этапах S372 и S373. С другой стороны, если greater2_flag равен 0, модуль 232 декодирования уровня не декодирует остаток. Следует отметить, что если significant_flag целевого коэффициента равен 0 или greater1_flag целевого коэффициента равен 0, модуль 232 декодирования уровня не декодирует ни greater2_flag, ни остаток.The
[0168] (Этап S372)[0168] (Step S372)
Модуль 247 арифметического декодирования выполняет арифметические декодирование остатка. В отличие от greater1_flag и greater2_flag, остаток применяется с обходным арифметическим кодированием, которое не использует какой-либо контекст.
[0169] (Этап S373)[0169] (Step S373)
Модуль 249 многозначного остатка преобразует многозначный сигнал остатка в бинаризованный сигнал. Этот этап будет описан ниже более подробно.The
[0170] (Этап S374)[0170] (Step S374)
Модуль 248 обновления параметра бинаризации обновляет параметр бинаризации (cParam). Способ обновления является таким же, как обновление параметра бинаризации (фиг. 18) в соответствии с вариантом осуществления 1.The binarization
[0171] (Этап S375)[0171] (Step S375)
Обработка от этапа S371 до этапа S374 повторяется, пока все коэффициенты в целевом блоке коэффициентов не будут обработаны.The processing from step S371 to step S374 is repeated until all coefficients in the target coefficient block have been processed.
[0172] <Обработка (Преобразование остатка в многозначный сигнал)>[0172] <Processing (Converting Residual to Multi-Valued Signal)>
Далее, со ссылкой на фиг. 29-31, более подробно описывается преобразование остатка в многозначный сигнал (S373 на фиг. 28).Next, with reference to Figs. 29-31, the transformation of the remainder into a multi-valued signal (S373 in Fig. 28) is described in more detail.
[0173] (Этап S401)[0173] (Step S401)
Модуль 250 декодирования префикса декодирует префикс. Фиг. 30 - это блок-схема последовательности операций, поясняющая этот этап более подробно.The
[0174] (Этапы от S411 до S415)[0174] (Steps S411 to S415)
Модуль 250 декодирования префикса определяет префикс. В итоге, модуль 250 декодирования префикса получает коды по 1 биту каждый последовательно от модуля 247 арифметического декодирования, пока не будет найден "0". Число непрерывных "1" устанавливается на значение префикса.The
[0175] (Этап S402)[0175] (Step S402)
Модуль 251 декодирования суффикса декодирует суффикс.The
[0176] (Этап S403)[0176] (Step S403)
Модуль 252 объединения префикса-суффикса объединяет префикс и суффикс, чтобы генерировать многозначный сигнал остатка.The prefix-
[0177] Фиг. 31 - это блок-схема последовательности операций, поясняющая этапы S402 и S403 более подробно.[0177] Fig. 31 is a flow chart explaining steps S402 and S403 in more detail.
[0178] (Этапы от S421 до S433)[0178] (Steps S421 to S433)
Модуль 251 декодирования суффикса определяет суффикс. В итоге, если префикс меньше, чем 8, то модуль 251 декодирования суффикса устанавливает значение cParam как биновую длину и генерирует суффикс путем упорядочения результатов арифметического декодирования биновой длины в порядке от более высокого порядка. С другой стороны, если префикс равен 8 или больше, то модуль 251 декодирования суффикса вычисляет биновую длину из префикса и cParam и генерирует суффикс путем упорядочения результатов арифметического декодирования биновой длины в порядке от более высокого порядка.The
[0179] (Этапы от S441 до S442)[0179] (Steps S441 to S442)
Модуль 252 объединения префикса-суффикса вычисляет остаток на основе префикса, суффикса и cParam.The prefix-
[0180] <Эффекты>[0180] <Effects>
Как описано выше, устройство декодирования изображения согласно варианту осуществления 2 может предоставить те же самые эффекты, как описано в варианте осуществления 1.As described above, the image decoding device according to
[0181] Фиг. 32A является блок-схемой последовательности операций кодирования изображения, выполняемого вышеописанным устройством 100 кодирования изображения.[0181] Fig. 32A is a flow chart of the sequence of image encoding operations performed by the above-described
[0182] Как описано выше, устройство 100 кодирования изображения выполняет арифметическое кодирование над первым флагом (greater1_flag), указывающим, является ли абсолютное значение целевого коэффициента, включенного в целевой блок коэффициентов, большим, чем 1 (S701). Далее, устройство 100 кодирования изображения осуществляет арифметическое кодирование над вторым флагом (greater2_flag), указывающим, является ли абсолютное значение большим, чем 2 (S702).[0182] As described above, the
[0183] Фиг. 32B - это блок-схема последовательности операций этапов S701 и S702.[0183] Fig. 32B is a flow chart of steps S701 and S702.
[0184] На этапах S701 и S702 устройство 100 кодирования изображения определяет, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение (S711), и на основе результата определения выбирает соответствующие контексты, подлежащие использованию в арифметическом кодировании над первым флагом и арифметическом кодировании над вторым флагом (S712). Другими словами, устройство 100 кодирования изображения выполняет вышеуказанное определение со ссылкой только на коэффициенты, включенные в непосредственно предшествующий блок коэффициентов, а не коэффициенты, включенные в блоки коэффициентов иные, чем непосредственно предшествующий блок коэффициентов. Другими словами, устройство 100 кодирования изображения осуществляет арифметическое кодирование над первым флагом и вторым флагом с использованием контекстов, соответствующих результату определения, среди множества контекстов.[0184] In steps S701 and S702, the
[0185] Непосредственно предшествующий блок коэффициентов относится к блоку коэффициентов, которые были обработаны непосредственно перед целевым блоком коэффициентов.[0185] The immediately preceding block of coefficients refers to a block of coefficients that were processed immediately before the target block of coefficients.
[0186] Более конкретно, если абсолютное значение целевого коэффициента больше, чем пороговое значение, то устройство 100 кодирования изображения дает приращение параметру бинаризации (cParam) (S253 и S254 на фиг. 18). Затем, если cParam из непосредственно предшествующего блока коэффициентов больше, чем 0, то устройство 100 кодирования изображения изменяет контекст (другими словами, дает приращение количеству наборов контекста) (S184 и S185 на фиг. 10).[0186] More specifically, if the absolute value of the target coefficient is greater than the threshold value, the
[0187] Другими словами, на основе переменной, генерируемой в арифметическом кодировании над непосредственно предшествующим блоком коэффициентов, устройство 100 кодирования изображения определяет, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение.[0187] In other words, based on a variable generated in arithmetic coding over an immediately preceding block of coefficients, the
[0188] Более конкретно, если абсолютное значение целевого коэффициента больше, чем 2, то устройство 100 кодирования изображения бинаризует остаток, то есть значение, полученное вычитанием 3 из абсолютного значения, в соответствии с таблицей преобразования, назначенной параметром бинаризации (cParam), среди множества таблиц преобразования. Этот параметр бинаризации определяется в зависимости от того, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. Вышеупомянутая переменная является этим параметром бинаризации.[0188] More specifically, if the absolute value of the target coefficient is greater than 2, the
[0189] Выше было описано, что пороговое значение для абсолютных значений коэффициентов, на который ссылаются при изменении контекста, определяется на основе параметра бинаризации (S252 на фиг. 18), но пороговое значение может быть предопределенным значением ("1"), как описано в отношении обычной технологии. Другими словами, устройство 100 кодирования изображения может определить, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем 1 (2 или более), и на основе результата определения, изменить контекст, подлежащий использованию, на другой. Как описано выше, в традиционном методе, подсчитывается число коэффициентов, имеющих абсолютную величину больше, чем пороговое значение. Эта обработка отличается от обработки определения того, имеется ли коэффициент, имеющий абсолютное значение больше, чем пороговое значение, как описано в настоящем варианте осуществления.[0189] It has been described above that the threshold value for the absolute values of the coefficients, which is referred to when changing the context, is determined based on the binarization parameter (S252 in Fig. 18), but the threshold value may be a predetermined value ("1") as described with respect to the conventional technology. In other words, the
[0190] В этом случае, как и в предыдущем случае, устройство 100 кодирования изображения может определить, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение больше, чем 1, на основе переменной, генерируемой в арифметическом кодировании над непосредственно предшествующим блоком коэффициентов. Например, этой переменной является greater1_flag. Другими словами, устройство 100 кодирования изображения может изменить контекст в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, который имеет greater1_flag, имеющий значение, равное 1.[0190] In this case, as in the previous case, the
[0191] Фиг. 33A - это блок-схема последовательности операций декодирования изображения, выполняемого с помощью вышеописанного устройства 200 декодирования изображения.[0191] Fig. 33A is a flow chart of the sequence of image decoding operations performed by the above-described
[0192] Как показано на фиг. 33A, устройство 200 декодирования изображения выполняет арифметическое декодирование над первым флагом (greater1_flag), который указывает, является ли абсолютное значение целевого коэффициента, включенного в целевой блок коэффициентов, большим, чем 1 (S751). Устройство 200 декодирования изображения выполняет арифметическое декодирование над вторым флагом (greater2_flag), указывающим, является ли абсолютное значение большим, чем 2 (S752).[0192] As shown in Fig. 33A, the
[0193] Фиг. 33B - это блок-схема последовательности операций этапов S751 и S752.[0193] Fig. 33B is a flow chart of steps S751 and S752.
[0194] На этапах S751 и S752 устройство 200 декодирования изображения 200 определяет, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение (S761), и на основе результата определения изменяет соответствующий контекст, подлежащий использованию в арифметическом декодирования над первым флагом и вторым флагом (S762). Другими словами, устройство 200 декодирования изображения выполняет арифметическое декодирование над первым флагом и вторым флагом, посредством использования соответствующих контекстов, соответствующих результату определения, среди множества контекстов.[0194] In steps S751 and S752, the
[0195] Более конкретно, если абсолютное значение целевого коэффициента больше, чем пороговое значение, устройство 200 декодирования изображения дает приращение параметру бинаризации (cParam) (S253 и S254 на фиг. 18). Затем, если cParam из непосредственно предшествующего блока коэффициентов больше, чем 0, то устройство 200 декодирования изображения изменяет контекст (другими словами, дает приращение количеству наборов контекста) (S184 и S185 на фиг. 10).[0195] More specifically, if the absolute value of the target coefficient is greater than the threshold value, the
[0196] Другими словами, на основе переменной, генерируемой в арифметическом декодировании над непосредственно предшествующим блоком коэффициентов, устройство 200 декодирования изображения определяет, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение.[0196] In other words, based on a variable generated in arithmetic decoding over the immediately preceding block of coefficients, the
[0197] Более конкретно, если абсолютное значение целевого коэффициента больше, чем 2, устройство 200 декодирования изображения преобразует остаток, который получен путем вычитания 3 из абсолютного значения, в многозначную величину в соответствии с таблицей преобразования, назначенной параметром бинаризации, среди множества таблиц преобразования. Этот параметр бинаризации определяется в зависимости от того, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем пороговое значение. Вышеупомянутой переменной является этот параметр бинаризации.[0197] More specifically, if the absolute value of the target coefficient is greater than 2, the
[0198] Как и выше, пороговое значение может быть предопределенным значением ("1"). В этом случае, как и в предыдущем случае, устройство 200 декодирования изображения может определить, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, имеющий абсолютное значение большее, чем 1, на основе переменной, генерируемой в арифметическом кодировании над непосредственно предшествующим блоком коэффициентов. Например, этой переменной является greater1_flag. Другими словами, устройство 200 декодирования изображения может изменить контекст, в соответствии с тем, включает ли в себя непосредственно предшествующий блок коэффициентов коэффициент, который имеет greater1_flag, имеющий значение 1.[0198] As above, the threshold value may be a predetermined value ("1"). In this case, as in the previous case, the
[0199] (Вариант осуществления 3)[0199] (Implementation variant 3)
В варианте осуществления 3 описана вариация варианта осуществления 1. Устройство кодирования изображения согласно варианту осуществления 3 отличается от устройства кодирования изображения согласно варианту осуществления 1 тем, что модуль 133А кодирования уровня функционирует иначе, чем модуль 133 кодирования уровня. Ниже приведено описание модуля 133А кодирования уровня.In
[0200] <Структура модуля 133А кодирования уровня>[0200] <Structure of Level Coding Module 133A>
Фиг. 34 - это блок-схема, показывающая структуру модуля 133А кодирования уровня. Модуль 133А кодирования уровня включает в себя не только структуру модуля 133 кодирования уровня в соответствии с вариантом осуществления 1, но также модуль 160 переключения greater_flag. Кроме того, функции модуля 143А установки остатка и модуля 145А выбора наборов контекста отличаются от функций модуля 143 установки остатка и модуля 145 выбора наборов контекста.Fig. 34 is a block diagram showing the structure of the layer encoding unit 133A. The layer encoding unit 133A includes not only the structure of the
[0201] <Обработка (Кодирование уровня)>[0201] <Processing (Level Encoding)>
Далее, со ссылкой на фиг. 35 кодирование уровня будет описано более подробно. Кодирование уровня согласно варианту осуществления 1 дополнено новыми этапами от S501 до S503. Кроме того, этапы S141 и S171 отличаются от этапов S141 и S171. Этапы, идентичные этапам в варианте осуществления 1, повторно не поясняются ниже.Next, with reference to Fig. 35, the level encoding will be described in more detail. The level encoding according to
[0202] (Этап S141)[0202] (Step S141)
Модуль 145А выбора наборов контекста устанавливает количество наборов контекста, подлежащее использованию в арифметическом кодировании над greater1_flag и greater2_flag. Этот этап будет описан ниже более подробно.The context set
[0203] (Этап S501)[0203] (Step S501)
Модуль 160 переключения greater_flag определяет, является ли параметр бинаризации (cParam), который был обновлен в обработке над непосредственно предшествующим блоком коэффициентов, большим, чем 0. Таким же способом, как описано в варианте осуществления 1, если параметр бинаризации равен 0, то greater1_flag и greater2_flag кодируются. С другой стороны, если параметр бинаризации больше, чем 0, то greater1_flag и greater2_flag не кодируются.The
[0204] (Этапы S502, S503 и S171)[0204] (Steps S502, S503 and S171)
Если параметр бинаризации (cParam), который был обновлен для непосредственно предшествующего блока коэффициентов, больше, чем 0, то модуль 143А установки остатка устанавливает базовое значение остатка в 1. Если параметр бинаризации (cParam) равен 0, то модуль 143А установки остатка устанавливает базовое значение остатка в 3. Затем, если абсолютное значение целевого коэффициента больше или равно базовому значению остатка, то модуль 133А кодирования уровня кодирует остаток на этапах от S172 до S175. С другой стороны, если абсолютное значение меньше, чем базовое значение остатка, то модуль 133А кодирования уровня не кодирует остаток. Если остаток кодирован, то модуль 133А кодирования уровня вычитает базовое значение остатка из абсолютного значения и устанавливает результирующее значение как остаток и кодированное. Это объясняется тем, что greater1_flag и greater2_flag иногда не кодируются в зависимости от cParam, и значение, которое должно быть установлено как остаток, поэтому изменяется. В варианте осуществления 1, так как greater1_flag и greater2_flag имеются, каким бы ни был cParam, базовое значение остатка фиксируется на "3".If the binarization parameter (cParam) that has been updated for the immediately preceding block of coefficients is greater than 0, the residual setting unit 143A sets the base value of the residual to 1. If the binarization parameter (cParam) is 0, the residual setting unit 143A sets the base value of the residual to 3. Then, if the absolute value of the target coefficient is greater than or equal to the base value of the residual, the layer encoding unit 133A encodes the residual in steps S172 to S175. On the other hand, if the absolute value is less than the base value of the residual, the layer encoding unit 133A does not encode the residual. If the residual is encoded, the layer encoding unit 133A subtracts the base value of the residual from the absolute value and sets the resulting value as the residual and the encoded one. This is because greater1_flag and greater2_flag are sometimes not encoded depending on cParam, and the value to be set as the residual therefore changes. In
[0205] <Обработка (Выбор наборов контекстов)>[0205] <Processing (Selecting Context Sets)>
Далее, со ссылкой на фиг. 35, выбор наборов контекстов (S141 на фиг. 34) описан более подробно.Next, with reference to Fig. 35, the selection of context sets (S141 in Fig. 34) is described in more detail.
[0206] (Этапы от S511 до S513)[0206] (Steps S511 to S513)
Модуль 145А выбора набора контекстов определяет, имеет ли целевой блок коэффициентов самую низкую частоту в целевом блоке кодирования. Если целевой блок коэффициентов имеет самую низкую частоту, то модуль 145А выбора наборов контекста устанавливает количество наборов контекстов в 0. В противном случае, модуль 145А выбора наборов контекста устанавливает количество наборов контекста в 1. Другими словами, если целевой блок коэффициентов расположен в верхнем левом углу целевого блока кодирования, то модуль 145А выбора наборов контекста устанавливает количество наборов контекста в 0. В противном случае, модуль 145А выбора наборов контекста устанавливает количество наборов контекста в 1.The context set
[0207] В отличие от варианта осуществления 1, модуль 145А выбора наборов контекста не изменяет набор контекста, когда cParam больше, чем 0. Это объясняется тем, что greater1_flag и greater2_flag не кодируются и контекст не выбирается, если cParam больше, чем 0, как показано в ранее описанном потоке кодирования уровня.[0207] Unlike
[0208] <Эффекты>[0208] <Effects>
Как описано выше, устройство кодирования изображения в соответствии с настоящим вариантом осуществления определяет на основе параметра бинаризации, который был обновлен для непосредственно предшествующего блока коэффициентов, что greater1_flag и greater2_flag не должны быть кодированы, и поэтому коэффициент кодируется на основе остатка вместо greater1_flag и greater2_flag. Таким образом, если существует по меньшей мере один коэффициент больший, чем пороговое значение, в обработке для непосредственно предшествующего блока коэффициентов, устройство кодирования изображения выполняет обходное арифметическое кодирование, которое не использует какого-либо контекста, вместо арифметического кодирования, которое использует контекст. Обходное арифметическое кодирование не требует загрузки и обновления контекста. Кроме того, обходное арифметическое кодирование позволяет начинать обработку, не дожидаясь, пока контекст будет обновлен на предварительной стадии. Поэтому обходное арифметическое кодирование может увеличить скорость обработки больше, чем арифметическое кодирование, которое использует контекст.As described above, the image encoding device according to the present embodiment determines based on the binarization parameter that has been updated for the immediately preceding block of coefficients that greater1_flag and greater2_flag do not need to be encoded, and therefore the coefficient is encoded based on the residual instead of greater1_flag and greater2_flag. In this way, if there is at least one coefficient greater than the threshold in the processing for the immediately preceding block of coefficients, the image encoding device performs bypass arithmetic encoding that does not use any context, instead of arithmetic encoding that uses context. Bypass arithmetic encoding does not require loading and updating a context. In addition, bypass arithmetic encoding makes it possible to start processing without waiting for the context to be updated in a preliminary stage. Therefore, bypass arithmetic encoding can increase the processing speed more than arithmetic encoding that uses context.
[0209] Кроме того, если существует высокая вероятность того, что абсолютное значение целевого коэффициента мало, greater1_flag и greater2_flag иногда равны 0, так что кодирование остатка не является необходимым. Тем не менее, указанная ситуация возникает редко, когда имеется высокая вероятность того, что абсолютное значение целевого коэффициента является большим. Таким образом, общая биновая величина часто может быть уменьшена, если greater1_flag и greater2_flag не кодируются.[0209] In addition, if there is a high probability that the absolute value of the target coefficient is small, greater1_flag and greater2_flag are sometimes equal to 0, so that encoding the residual is not necessary. However, this situation rarely occurs when there is a high probability that the absolute value of the target coefficient is large. Thus, the total bin value can often be reduced if greater1_flag and greater2_flag are not encoded.
[0210] Если cParam после обработки над непосредственно предшествующим блоком коэффициентов больше, чем 0 (другими словами, если существует по меньшей мере один коэффициент больший, чем пороговое значение), то устройство кодирования изображения в соответствии с настоящим вариантом осуществления ожидает, что существует высокая вероятность получения коэффициентов, имеющих абсолютное значение, в целевом блоке коэффициентов, и поэтому не кодирует greater1_flag и greater2_flag. В результате, обработка может выполняться с более высокой скоростью за счет уменьшения этапов арифметического кодирования с использованием контекстов при подавлении ухудшения эффективности кодирования.[0210] If cParam after processing on the immediately preceding block of coefficients is greater than 0 (in other words, if there is at least one coefficient greater than the threshold value), the image encoding device according to the present embodiment expects that there is a high probability of obtaining coefficients having an absolute value in the target block of coefficients, and therefore does not encode greater1_flag and greater2_flag. As a result, the processing can be performed at a higher speed by reducing the arithmetic encoding steps using contexts while suppressing the deterioration in encoding efficiency.
[0211] Кроме того, greater1_flag и greater2_flag не кодируются, когда cParam больше, чем 0. В результате, набор контекстов, который используется, когда cParam больше, чем 0, другими словами, набор контекстов, который используется, когда имеется высокая вероятность обеспечения коэффициентов, имеющих большое значение, не является необходимым. Более конкретно, если целевой блок коэффициентов расположен в верхнем левом углу целевого блока кодирования, устройство кодирования изображения использует один контекст. Если целевой блок коэффициентов не находится в верхнем левом углу, устройство кодирования изображения использует один общий набор контекста. В результате, можно уменьшить количество используемых контекстов и, тем самым, уменьшить размер памяти для хранения контекстов и размер схемы для выбора контекстов.[0211] In addition, greater1_flag and greater2_flag are not coded when cParam is greater than 0. As a result, a set of contexts that is used when cParam is greater than 0, in other words, a set of contexts that is used when there is a high probability of providing coefficients having a large value, is not necessary. More specifically, if the target coefficient block is located in the upper left corner of the target encoding block, the image encoding device uses one context. If the target coefficient block is not in the upper left corner, the image encoding device uses one common set of contexts. As a result, it is possible to reduce the number of contexts used and thereby reduce the size of the memory for storing contexts and the size of the circuit for selecting contexts.
[0212] Путем объединения информации, подлежащей использованию при определении, следует ли кодировать greater1_flag и greater2_flag, и информации подлежащей использованию в кодировании остатка, размер схемы уменьшается. Более конкретно, cParam, который получает приращение каждый раз, когда абсолютное значение целевого коэффициента превышает пороговое значение, используется для изменения параметра бинаризации остатка и для определения, следует ли кодировать greater1_flag и greater2_flag. В результате, одна структура может выполнять различные функции. По сравнению с существующим стандартом HEVC (непатентный документ 1), устройство кодирования изображения в соответствии с настоящим вариантом осуществления может определять, следует ли кодировать greater1_flag и greater2_flag, без включения дополнительной структуры.[0212] By combining information to be used in determining whether to encode greater1_flag and greater2_flag and information to be used in encoding the residual, the size of the circuit is reduced. More specifically, cParam, which is incremented each time the absolute value of the target coefficient exceeds a threshold, is used to change the binarization parameter of the residual and to determine whether to encode greater1_flag and greater2_flag. As a result, one structure can perform various functions. Compared with the existing HEVC standard (Non-Patent Document 1), the image encoding device according to the present embodiment can determine whether to encode greater1_flag and greater2_flag without including an additional structure.
[0213] Кроме того, способ кодирования изображения согласно настоящему варианту осуществления был применен для тестирования программного обеспечения в соответствии с настоящим стандартом HEVC (непатентный документ 1) для экспериментов. Фиг. 37 показывает результаты экспериментов по сравнению с результатами без применения настоящего варианта осуществления. Условия экспериментов базируются на общих условиях экспериментов группы стандартов HEVC. Численные значения на фиг. 37 являются результатами относительно первых 49 кадров тестового изображения. Большее численное значение показывает более низкую эффективность кодирования. Отрицательное значение указывает улучшение эффективности кодирования. Как показано на фиг. 37, каждое из значений находится в пределах от -0,00% до 0,06%. Это означает, что на эффективность кодирования практически не оказывается влияния, даже если скорость обработки увеличивается, за счет устранения арифметического кодирования, которое использует контексты, или даже если общее количество контекстов уменьшается.[0213] Furthermore, the image encoding method according to the present embodiment was applied to test software according to the present HEVC standard (Non-Patent Document 1) for experiments. FIG. 37 shows the experimental results compared with the results without applying the present embodiment. The experimental conditions are based on the general experimental conditions of the HEVC standard group. The numerical values in FIG. 37 are the results with respect to the first 49 frames of the test image. A larger numerical value indicates lower encoding efficiency. A negative value indicates an improvement in encoding efficiency. As shown in FIG. 37, each of the values is in the range of -0.00% to 0.06%. This means that the encoding efficiency is hardly affected even if the processing speed is increased by eliminating arithmetic encoding that uses contexts, or even if the total number of contexts is reduced.
[0214] Следует отметить, что выше было описано, что устройство кодирования изображения определяет, на основе параметра бинаризации (cParam), который был обновлен для непосредственно предшествующего блока коэффициентов, следует ли кодировать greater1_flag и greater2_flag. Однако определение может быть выполнено на основе параметра бинаризации, который был обновлен для блока коэффициентов, отличного от непосредственно предшествующего блока коэффициентов. Например, устройство кодирования изображения может определить, что greater1_flag и greater2_flag не должны быть кодированы для следующих блоков коэффициентов, если cParam превышает 0 в обработке для любого обработанного блока коэффициентов. Блоки коэффициентов обрабатываются последовательно от блока более высокой частоты. Таким образом, если cParam любого из блоков коэффициентов превышает 0, другими словами, если найден коэффициент, имеющий абсолютное значение, которое больше или равно пороговому значению, то существует высокая вероятность того, что все последующие блоки коэффициентов имеют большие значения коэффициента. В приведенном выше случае, даже если greater1_flag и greater2_flag не закодированы, эффективность кодирования иногда не уменьшается.[0214] It should be noted that it has been described above that the image encoding device determines whether to encode greater1_flag and greater2_flag based on the binarization parameter (cParam) that has been updated for the immediately preceding coefficient block. However, the determination may be made based on the binarization parameter that has been updated for a coefficient block other than the immediately preceding coefficient block. For example, the image encoding device may determine that greater1_flag and greater2_flag should not be encoded for the following coefficient blocks if cParam exceeds 0 in the processing for any processed coefficient block. The coefficient blocks are processed sequentially from the higher frequency block. Thus, if cParam of any of the coefficient blocks exceeds 0, in other words, if a coefficient having an absolute value that is greater than or equal to the threshold value is found, then there is a high probability that all subsequent coefficient blocks have greater coefficient values. In the above case, even if greater1_flag and greater2_flag are not encoded, the encoding efficiency is sometimes not reduced.
[0215] Следует также отметить, что выше было описано, что устройство кодирования изображения не кодирует greater1_flag и greater2_flag, если cParam больше, чем 0, но настоящий вариант осуществления не ограничивается вышеуказанным. Например, можно также не кодировать greater1_flag и greater2_flag, если cParam больше, чем 1, или больше, чем 2. В зависимости от входного изображения, иногда можно повысить эффективность кодирования, если определение, следует ли кодировать greater1_flag и greater2_flag, делается на основе того, является ли cParam большим, чем 1.[0215] It should also be noted that it has been described above that the image encoding device does not encode greater1_flag and greater2_flag if cParam is greater than 0, but the present embodiment is not limited to the above. For example, it is also possible to not encode greater1_flag and greater2_flag if cParam is greater than 1 or greater than 2. Depending on the input image, encoding efficiency can sometimes be improved if the determination of whether to encode greater1_flag and greater2_flag is made based on whether cParam is greater than 1.
[0216] Остальное соответствует описанному в варианте осуществления 1, так что повторное пояснение здесь не приводится.[0216] The rest is the same as described in
[0217] (Вариант осуществления 4)[0217] (Embodiment 4)
В варианте осуществления 4 приведено описание для устройства декодирования изображения, которое декодирует кодированный битовый поток, генерируемый устройством кодирования изображения согласно варианту осуществления 3. Устройство декодирования изображения согласно варианту осуществления 4, отличается от устройства декодирования изображения согласно варианту осуществления 2 тем, что модуль 232 декодирования уровня заменен на модуль 232А декодирования уровня. Ниже приведено описание модуля 232А декодирования уровня.In
[0218] <Структура модуля 232А декодирования уровня>[0218] <Structure of
Фиг. 38 - это блок-схема, показывающая структуру модуля 232А декодирования уровня. Модуль 232А декодирования уровня включает в себя не только структуру модуля 232 декодирования уровня в соответствии с вариантом осуществления 2, но также модуль 260 переключения greater_flag. Кроме того, функции модуля 241А выбора наборов контекста и модуля 247А арифметического декодирования отличаются от соответствующих функций модуля 241 выбора наборов контекста и модуля 247 арифметического декодирования.Fig. 38 is a block diagram showing the structure of the
[0219] <Обработка (Декодирование уровня)>[0219] <Processing (Level Decoding)>
Далее, со ссылкой на фиг. 39, декодирование уровня будет описано более подробно. Декодирование уровня согласно варианту осуществления 2 дополнено новыми этапами от S601 до S603. Кроме того, этапы S341А и S371А отличаются от этапов S341 и S371, соответственно. Следует отметить, что этапы, идентичные этапам в варианте осуществления 2, далее повторно не поясняются.Next, with reference to Fig. 39, the level decoding will be described in more detail. The level decoding according to
[0220] (Этап S341А)[0220] (Step S341A)
Модуль 241А выбора наборов контекста устанавливает (выбирает) соответствующие количества наборов контекста, подлежащие использованию в арифметическом декодировании над greater1_flag и арифметическом декодировании над greater2_flag. Способ выбора такой же, как при выборе наборов контекста (фиг. 36) в соответствии с вариантом осуществления 3. Другими словами, модуль 241А выбора наборов контекста не выбирает контекст на основе cParam.The context set
[0221] (Этап S601)[0221] (Step S601)
Модуль 260 переключения greater_flag 260 определяет, является ли параметр бинаризации (cParam), который был обновлен в обработке над непосредственно предшествующим блоком коэффициентов, большим, чем 0. Таким же образом, как описано в варианте осуществления 2, модуль 260 переключения greater_flag 260 декодирует greater1_flag и greater2_flag, если параметр бинаризации равен 0, но не декодирует greater1_flag и greater2_flag, если параметр бинаризации больше, чем 0.The
[0222] (Этапы S602, S603 и S371А)[0222] (Steps S602, S603 and S371A)
Если параметр бинаризации (cParam), который был обновлен для непосредственно предшествующего блока коэффициентов, больше, чем 0, то модуль 247А арифметического декодирования устанавливает базовое значение остатка в 1. Если параметр бинаризации (cParam) равен 0, а модуль 247А установки остатка устанавливает базовое значение остатка в 3. Если базовое значение остатка равно 3 и greater2_flag целевого коэффициента равен 1, или если базовое значение остатка равно 1 и significant_flag целевого коэффициента равен 1, то модуль 232А декодирования уровня декодирует остаток на этапах S372 и S373. В противном случае, модуль 232А декодирования уровня не декодирует остаток. Если остаток декодируется, численное значение, полученное путем добавления базового значения остатка к декодированному остатку, является абсолютным значением целевого коэффициента.If the binarization parameter (cParam) that has been updated for the immediately preceding block of coefficients is greater than 0, then the
[0223] <Эффекты>[0223] <Effects>
Как описано выше, устройство декодирования изображения согласно настоящему варианту осуществления может предоставить те же самые эффекты, как описано в варианте осуществления 3.As described above, the image decoding device according to the present embodiment can provide the same effects as described in
[0224] В каждом из вышеописанных вариантов осуществления, каждый из функциональных блоков может быть реализован, как правило, как MPU (микропроцессор), память и т.п. Кроме того, обработка, выполняемая каждым из функциональных блоков, может быть реализована, как правило, программным обеспечением (программой), и программное обеспечение записывается на носитель записи, такой как ПЗУ (ROM). Затем такое программное обеспечение может распространяться, например, путем загрузки или может записываться на носитель записи, такой как ПЗУ на компакт-диске (CD-ROM) для последующего распространения. Кроме того, каждый из функциональных блоков может быть, разумеется, реализован в аппаратных средствах (специализированной схеме).[0224] In each of the above-described embodiments, each of the functional blocks may be implemented, as a rule, as an MPU (microprocessor), a memory, and the like. In addition, the processing performed by each of the functional blocks may be implemented, as a rule, by software (program), and the software is recorded on a recording medium, such as a ROM. Then, such software may be distributed, for example, by downloading, or may be recorded on a recording medium, such as a ROM on a compact disc (CD-ROM), for subsequent distribution. In addition, each of the functional blocks may, of course, be implemented in hardware (dedicated circuit).
[0225] Обработка, описанная в каждом из вариантов осуществления, может выполняться как централизованная обработка посредством использования одного устройства (device) (системы) или как децентрализованная обработка с использованием множества устройств. Кроме того, описанная выше программа может исполняться одним компьютером или множеством компьютеров. Другими словами, как централизованная обработка, так и децентрализованная обработка могут выполняться по программе.[0225] The processing described in each of the embodiments may be performed as centralized processing by using one device (system) or as decentralized processing by using a plurality of devices. In addition, the program described above may be executed by one computer or a plurality of computers. In other words, both centralized processing and decentralized processing may be performed by the program.
[0226] Хотя устройство кодирования изображения и устройство декодирования изображения были описаны со ссылкой на множества вариантов, как указано выше, настоящее изобретение не ограничивается этими вариантами осуществления.[0226] Although the image encoding device and the image decoding device have been described with reference to multiple embodiments as described above, the present invention is not limited to these embodiments.
[0227] Следует также отметить, что модули обработки в каждом из устройства кодирования изображения и устройства декодирования изображения в соответствии с вышеописанными вариантами осуществления, как правило, реализуются на интегральной схеме с высокой степенью интеграции (LSI, БИС). Они могут быть интегрированы в отдельности, или часть или все из них могут быть объединены в одной микросхеме.[0227] It should also be noted that the processing modules in each of the image encoding device and the image decoding device according to the above-described embodiments are typically implemented on a highly integrated circuit (LSI). They may be integrated individually, or some or all of them may be combined in a single chip.
[0228] Следует также отметить, что метод интегральной схемы не ограничивается БИС, и она может быть реализована в виде специализированной схемы или процессора общего назначения. Кроме того, можно использовать программируемую пользователем вентильную матрицу (FPGA), которая может программироваться после изготовления БИС, или процессор с изменяемой конфигурацией, в котором соединение и настройка схемных ячеек внутри БИС могут быть реконфигурированы.[0228] It should also be noted that the integrated circuit method is not limited to the LSI, and it can be implemented as a specialized circuit or a general-purpose processor. In addition, it is possible to use a field-programmable gate array (FPGA), which can be programmed after the LSI is manufactured, or a reconfigurable processor in which the connection and configuration of circuit cells within the LSI can be reconfigured.
[0229] Каждый из структурных элементов в каждом из вышеописанных вариантов осуществления может быть сконфигурирован в форме специализированного аппаратного продукта или может быть реализован путем исполнения программного обеспечения, подходящего для структурного элемента. Каждый из структурных элементов может быть реализован посредством исполняющего программу модуля, такого как CPU и процессор, считывающего и исполняющего программу программного обеспечения, записанного на носитель записи, такой как жесткий диск или полупроводниковая память.[0229] Each of the structural elements in each of the above-described embodiments may be configured in the form of a specialized hardware product or may be realized by executing software suitable for the structural element. Each of the structural elements may be realized by a program executing module, such as a CPU and a processor, reading and executing a software program recorded on a recording medium, such as a hard disk or a semiconductor memory.
[0230] Другими словами, каждое из устройства кодирования изображения и устройства декодирования изображения включает в себя: схему управления и средство хранения, электрически соединенное со схемой управления и доступное из схемы управления. Схема управления содержит по меньшей мере одно из специализированных аппаратных средств и исполняющего программу модуля. Средство хранения хранит программу программного обеспечения, исполняемую посредством исполняющего программу модуля, когда схема управления включает в себя исполняющий программу модуль.[0230] In other words, each of the image encoding device and the image decoding device includes: a control circuit and a storage means electrically connected to the control circuit and accessible from the control circuit. The control circuit includes at least one of specialized hardware and a program executing module. The storage means stores a software program executed by the program executing module when the control circuit includes the program executing module.
[0231] Кроме того, настоящее изобретение может быть вышеописанной программой или может быть не временным считываемым компьютером носителем записи, на котором записана программа. Разумеется, программа может распространяться через передающую среду, такую как Интернет.[0231] In addition, the present invention may be the above-described program, or may be a non-transitory computer-readable recording medium on which the program is recorded. Of course, the program may be distributed via a transmission medium such as the Internet.
[0232] Кроме того, все числовые выражения в приведенном выше описании являются примерами для более подробного пояснения настоящего изобретения. Настоящее изобретение не ограничивается такими числовыми примерами.[0232] Furthermore, all numerical expressions in the above description are examples for explaining the present invention in more detail. The present invention is not limited to such numerical examples.
[0233] Кроме того, разделение функциональных блоков в блок-схеме приведено в качестве примеров. Также возможно, что множество функциональных блоков выполнены в виде одного функционального блока, что один функциональный блок разделен на множество частей, или что частичная функция перемещена в другой функциональный блок. Кроме того, функции множества функциональных блоков, имеющих аналогичные функции, могут выполняться параллельно или в режиме временного разделения общим одним аппаратным средством или программным обеспечением.[0233] In addition, the division of functional blocks in the block diagram is given as examples. It is also possible that a plurality of functional blocks are implemented as one functional block, that one functional block is divided into a plurality of parts, or that a partial function is moved to another functional block. In addition, the functions of a plurality of functional blocks having similar functions can be performed in parallel or in a time division mode by a common single hardware or software.
[0234] Следует также отметить, что порядок исполнения этапов, включенных в каждый из вышеописанного способа кодирования изображения и вышеописанного способа декодирования изображения, является примером для пояснения настоящего изобретения более подробно. Таким образом, могут быть использованы различные порядки, кроме вышеописанного порядка. Часть из этапов могут исполняться одновременно (параллельно) с другим этапом.[0234] It should also be noted that the order of execution of the steps included in each of the above-described image encoding method and the above-described image decoding method is an example for explaining the present invention in more detail. Thus, various orders other than the above-described order may be used. Some of the steps may be executed simultaneously (in parallel) with another step.
[0235] Таким образом, хотя только некоторые примерные варианты осуществления устройства кодирования изображения и устройства декодирования изображения в соответствии с настоящим изобретением были подробно описаны выше, настоящее изобретение не ограничено этими вариантами осуществления. Специалистам в данной области техники будет легко понять, что различные модификации примерных вариантов осуществления и комбинаций структурных элементов различных вариантов осуществления возможны без существенного отклонения от решений и преимуществ настоящего изобретения. Соответственно, все такие модификации и комбинации предполагаются включенными в объем настоящего изобретения.[0235] Thus, although only some exemplary embodiments of the image encoding device and the image decoding device according to the present invention have been described in detail above, the present invention is not limited to these embodiments. It will be easily understood by those skilled in the art that various modifications of the exemplary embodiments and combinations of structural elements of the various embodiments are possible without substantially departing from the solutions and advantages of the present invention. Accordingly, all such modifications and combinations are intended to be included within the scope of the present invention.
[0236] (Вариант осуществления 5)[0236] (Embodiment 5)
Обработка, описанная в каждом из вариантов осуществления, может быть просто реализована в независимой компьютерной системе путем записи, на носителе записи, программы для реализации конфигураций способа кодирования движущегося изображения (способа кодирования изображения) и способа декодирования движущегося изображения (способа декодирования изображения), описанных в каждом из вариантов осуществления изобретения. Носителями записи могут быть любые носители записи при условии, что программа может быть записана, например, магнитный диск, оптический диск, магнитно-оптический диск, IC-карта и полупроводниковая память.The processing described in each of the embodiments can be simply implemented in an independent computer system by recording, on a recording medium, a program for implementing the configurations of the moving image encoding method (image encoding method) and the moving image decoding method (image decoding method) described in each of the embodiments of the invention. The recording medium may be any recording medium as long as the program can be recorded, such as a magnetic disk, an optical disk, a magneto-optical disk, an IC card, and a semiconductor memory.
[0237] Далее будут описаны применения способа кодирования движущегося изображения (способа кодирования изображения) и способа декодирования движущегося изображения (способа декодирования изображения), описанными в каждом из вариантов осуществления, и системы с их использованием. Система имеет признак наличия устройства кодирования и декодирования изображения, которое включает в себя устройство кодирования изображения, использующее способ кодирования изображения, и устройство декодирования изображения, использующее способ декодирования изображения. Другие конфигурации в системе могут быть изменены по мере необходимости в зависимости от случаев.[0237] Next, applications of the moving image encoding method (image encoding method) and the moving image decoding method (image decoding method) described in each of the embodiments and a system using them will be described. The system has a feature of having an image encoding and decoding device that includes an image encoding device using the image encoding method and an image decoding device using the image decoding method. Other configurations in the system can be changed as necessary depending on cases.
[0238] Фиг. 40 иллюстрирует общую конфигурацию системы ех100 предоставления контента для реализации услуг распространения контента. Область предоставления услуг связи разделена на соты нужного размера, и базовые станции ех106, ех107, ех108, ех109 и ех110, которые являются фиксированными беспроводными станциями, расположены в каждой из сот.[0238] Fig. 40 illustrates a general configuration of a content providing system ex100 for implementing content distribution services. A communication service providing area is divided into cells of a desired size, and base stations ex106, ex107, ex108, ex109 and ex110, which are fixed wireless stations, are located in each of the cells.
[0239] Система ех100 предоставления контента соединена с устройствами, такими как компьютер ех111, персональный цифровой помощник (PDA) ех112, камера ех113, сотовый телефон ех114 и игровой автомат ех115, через Интернет ех101, поставщика ех102 Интернет-услуг, телефонную сеть ех104, а также базовые станции ех106 - ех110, соответственно.[0239] The content providing system ex100 is connected to devices such as a computer ex111, a personal digital assistant (PDA) ex112, a camera ex113, a cellular telephone ex114, and a gaming machine ex115, via the Internet ex101, an Internet service provider ex102, a telephone network ex104, and base stations ex106 to ex110, respectively.
[0240] Однако конфигурация системы ех100 предоставления контента не ограничивается конфигурацией, показанной на фиг. 40, и комбинация, в которой любые из элементов соединены, является приемлемой. Кроме того, каждое устройство может быть напрямую подключено к телефонной сети ех104, а не через базовые станции ех106 - ех110, которые являются фиксированными беспроводными станциями. Кроме того, эти устройства могут быть соединены друг с другом через беспроводную связь ближнего действия и т.д.[0240] However, the configuration of the content providing system ex100 is not limited to the configuration shown in Fig. 40, and a combination in which any of the elements are connected is acceptable. In addition, each device can be directly connected to the telephone network ex104, and not through the base stations ex106 to ex110, which are fixed wireless stations. In addition, these devices can be connected to each other via short-range wireless communication, etc.
[0241] Камера ех113, например, цифровая видеокамера, способна захватывать видео. Камера ех116, например, цифровая камера, способна захватывать как неподвижные изображения и видео. Кроме того, сотовый телефон ех114 может быть таким, который удовлетворяет любому из стандартов, таких как Глобальная система мобильной связи (GSM) (зарегистрированный товарный знак), множественный доступ с кодовым разделением (CDMA), широкополосный множественный доступ с кодовым разделением (W-CDMA), Долгосрочное развитие (LTE) и Высокоскоростной пакетный доступ (HSPA). Кроме того, сотовый телефон ех114 может быть системой для персональных мобильных телефонов (PHS).[0241] The camera ex113, for example, a digital video camera, is capable of capturing video. The camera ex116, for example, a digital camera, is capable of capturing both still images and video. In addition, the cellular telephone ex114 may be one that satisfies any of the standards such as Global System for Mobile Communications (GSM) (registered trademark), Code Division Multiple Access (CDMA), Wideband Code Division Multiple Access (W-CDMA), Long Term Evolution (LTE), and High Speed Packet Access (HSPA). In addition, the cellular telephone ex114 may be a personal mobile phone system (PHS).
[0242] В системе ех100 предоставления контента потоковый сервер ех103 соединен с камерой ех113 и другими элементами через телефонную сеть ех104 и базовую станцию ех109, что позволяет осуществлять распространение изображений прямого эфира и т.п. При таком распространении, контент (например, видео музыкального шоу в прямом эфире), захваченный пользователем с помощью камеры ех113, кодируется, как описано выше, в каждом из вариантов осуществления (т.е. камера функционирует как устройство кодирования изображения в соответствии с аспектом настоящего изобретения), и кодированный контент передается на потоковый сервер ех103. С другой стороны, потоковый сервер ех103 осуществляет распространения потока передаваемых данных контента к клиентам по их запросам. Клиенты включают в себя компьютер ех111, PDA ех112, камерe ех113, сотовый телефон ех114 и игровой автомат ех115, которые способны декодировать вышеупомянутые кодированные данные. Каждое из устройств, которые приняли распространяемые данные, декодирует данные и воспроизводит кодированные данные (т.е., функционирует в качестве устройства декодирования изображения в соответствии с одним из аспектов настоящего изобретения).[0242] In the content providing system ex100, the streaming server ex103 is connected to the camera ex113 and other elements via the telephone network ex104 and the base station ex109, which enables distribution of live images and the like. In such distribution, the content (for example, a video of a live music show) captured by the user via the camera ex113 is encoded as described above in each of the embodiments (i.e., the camera functions as an image encoding device according to an aspect of the present invention), and the encoded content is transmitted to the streaming server ex103. On the other hand, the streaming server ex103 distributes the stream of transmitted content data to clients upon their requests. The clients include a computer ex111, a PDA ex112, a camera ex113, a cellular phone ex114 and a gaming machine ex115, which are capable of decoding the above-mentioned encoded data. Each of the devices that has received the distributed data decodes the data and reproduces the encoded data (i.e., functions as an image decoding device in accordance with one aspect of the present invention).
[0243] Захваченные данные могут быть закодированы камерой ех113 или потоковым сервером ех103, который передает данные, или процессы кодирования могут быть разделены между камерой ех113 и потоковым сервером ех103. Кроме того, распространяемые данные могут быть декодированы клиентами или потоковым сервером ех103, или процессы декодирования могут быть разделены между клиентами и потоковым сервером ех103. Кроме того, данные неподвижных изображений и видео, захваченные не только камерой ех113, но и камерой ех116, могут быть переданы на потоковый сервер ех103 через компьютер ех111. Процессы кодирования могут выполняться камерой ех116, компьютером ех111 или потоковым сервером ех103 или разделяться между ними.[0243] The captured data may be encoded by the camera ex113 or the streaming server ex103 that transmits the data, or the encoding processes may be divided between the camera ex113 and the streaming server ex103. In addition, the distributed data may be decoded by the clients or the streaming server ex103, or the decoding processes may be divided between the clients and the streaming server ex103. In addition, still image and video data captured not only by the camera ex113 but also by the camera ex116 may be transmitted to the streaming server ex103 via the computer ex111. The encoding processes may be performed by the camera ex116, the computer ex111, or the streaming server ex103 or divided between them.
[0244] Кроме того, процессы кодирования и декодирования могут выполняться с помощью LSI (БИС) ех500, обычно включенной в каждый из компьютера ех111 и устройств. БИС ех500 может быть сконфигурирована из одной микросхемы или множества микросхем. Программное обеспечение для кодирования и декодирования видео может быть интегрировано в некоторый тип носителя записи (например, CD-ROM, гибкий диск и жесткий диск), который может считываться компьютером ех111 и т.п., и процессы кодирования и декодирования могут быть выполнены с использованием программного обеспечения. Кроме того, когда сотовый телефон ех114 оснащен камерой, видеоданные, полученные с помощью камеры, могут быть переданы. Видеоданные являются данными, кодированными с помощью БИС ех500, включенной в сотовой телефон ех114.[0244] In addition, the encoding and decoding processes can be performed by an LSI ex500 typically included in each of the computer ex111 and the devices. The LSI ex500 can be configured from a single chip or a plurality of chips. Software for encoding and decoding a video can be integrated into some type of recording medium (for example, a CD-ROM, a floppy disk, and a hard disk) that can be read by the computer ex111 and the like, and the encoding and decoding processes can be performed using the software. In addition, when the cellular telephone ex114 is equipped with a camera, video data obtained by the camera can be transmitted. The video data is data encoded by the LSI ex500 included in the cellular telephone ex114.
[0245] Кроме того, потоковый сервер ех103 может состоять из серверов и компьютеров и может выполнять децентрализацию данных и обрабатывать децентрализованные данные, записывать или распространять данные.[0245] In addition, the streaming server ex103 may be composed of servers and computers and may perform data decentralization and process decentralized data, record or distribute data.
[0246] Как описано выше, клиенты могут принимать и воспроизводить кодированные данные в системе ех100 предоставления контента. Другими словами, клиенты могут принимать и декодировать информацию, передаваемую пользователем, и воспроизводить декодированные данные в режиме реального времени в системе ех100 предоставления контента, так что пользователь, который не имеет какого-либо конкретного права и оборудования, может реализовать персональное вещание.[0246] As described above, clients can receive and reproduce encoded data in the content providing system ex100. In other words, clients can receive and decode information transmitted by a user and reproduce the decoded data in real time in the content providing system ex100, so that a user who does not have any specific right and equipment can realize personal broadcasting.
[0247] Помимо примера системы ех100 предоставления контента, по меньшей мере одно из устройства кодирования движущегося изображения (устройства кодирования изображения) и устройства декодирования движущегося изображения (устройства декодирования изображения), описанных в каждом из вариантов осуществления, могут быть реализованы в цифровой вещательной системе ех200, показанной на фиг. 41. Более конкретно, вещательная станция ех201 осуществляет связь или передает с помощью радиоволн на вещательный спутник ех202 мультиплексированные данные, полученные с помощью мультиплексирования аудиоданных и т.п. на видеоданные. Видеоданные являются данными, кодированными способом кодирования движущегося изображения, описанным в каждом из вариантов осуществления (т.е. данными, кодированными с помощью устройства кодирования изображения в соответствии с одним из аспектов настоящего изобретения). После приема мультиплексированных данных, вещательный спутник ех202 передает радиоволны для осуществления вещания. Затем, антенна ех204 домашнего использования с функцией приема спутникового вещания принимает радиоволны. Далее, устройство, такое как телевизор (приемник) ех300 и телевизионная приставка (STB) ех217, декодирует принятые мультиплексированные данные и воспроизводит декодированные данные (т.е., функционирует в качестве устройства декодирования изображения в соответствии с одним из аспектов настоящего изобретения).[0247] In addition to the example of the content providing system ex100, at least one of the moving image encoding device (image encoding device) and the moving image decoding device (image decoding device) described in each of the embodiments can be implemented in the digital broadcasting system ex200 shown in Fig. 41. More specifically, the broadcasting station ex201 communicates or transmits, by radio waves, to the broadcasting satellite ex202, multiplexed data obtained by multiplexing audio data and the like onto video data. The video data is data encoded by the moving image encoding method described in each of the embodiments (i.e., data encoded by the image encoding device according to one aspect of the present invention). After receiving the multiplexed data, the broadcasting satellite ex202 transmits radio waves to perform broadcasting. Then, the home-use antenna ex204 with a satellite broadcast reception function receives radio waves. Then, a device such as a television (receiver) ex300 and a set-top box (STB) ex217 decodes the received multiplexed data and reproduces the decoded data (i.e., functions as an image decoding device according to one aspect of the present invention).
[0248] Кроме того, устройство ех218(i) считывания/записи считывает и декодирует мультиплексированные данные, записанные на носителе ех215 записи, таком как DVD и BD, или (i) кодирует видеосигналы на носителе ех215 записи, а в некоторых случаях записывает данные, полученные посредством мультиплексирования аудиосигнала на кодированные данные. Устройство ех218 считывания/записи может включать в себя устройство декодирования движущегося изображения или устройство кодирования движущегося изображения, как показано в каждом из вариантов осуществления изобретения. В этом случае воспроизведенные видеосигналы отображаются на мониторе ех219 и могут быть воспроизведены с помощью другого устройства или системы с использованием носителя ех215 записи, на котором записаны мультиплексированные данные. Кроме того, можно реализовать устройство декодирования движущегося изображения в устройстве ех217 телеприставки, подключенном к кабелю ех203 для кабельного телевидения, или к антенне ех204 для спутникового и/или наземного вещания, чтобы отображать видеосигналы на мониторе ех219 телевизора ех300. Устройство декодирования движущегося изображения может быть реализовано не в телеприставке, а в телевизоре ех300.[0248] In addition, the reading/writing device ex218(i) reads and decodes multiplexed data recorded on the recording medium ex215 such as a DVD and BD, or (i) encodes video signals on the recording medium ex215, and in some cases, records data obtained by multiplexing an audio signal onto the encoded data. The reading/writing device ex218 may include a moving image decoding device or a moving image encoding device, as shown in each of the embodiments of the invention. In this case, the reproduced video signals are displayed on the monitor ex219 and can be reproduced by another device or system using the recording medium ex215 on which the multiplexed data is recorded. In addition, it is possible to implement a moving image decoding device in a set-top box device ex217 connected to a cable ex203 for cable television, or to an antenna ex204 for satellite and/or terrestrial broadcasting, in order to display video signals on a monitor ex219 of a television set ex300. The moving image decoding device may be implemented not in a set-top box, but in a television set ex300.
[0249] Фиг. 42 иллюстрирует телевизор (приемник) ех300, который использует способ кодирования движущегося изображения и способ декодирования движущегося изображения, описанный в каждом из вариантов осуществления. Телевизор ех300 включает в себя: тюнер ех301, который получает и обеспечивает мультиплексированные данные, полученные с помощью мультиплексирования аудиоданных на видеоданных, через антенну ех204 или кабель ех203 и т.д., которые принимают вещание; модуль ех302 модуляции/демодуляции, который демодулирует принимаемые мультиплексированные данные или модулирует данные в мультиплексированные данные, которые должны быть предоставлены вовне; и модуль ех303 мультиплексирования/демультиплексирования, который демультиплексирует модулированные мультиплексированные данные в видеоданные и аудиоданные или мультиплексирует видеоданные и аудиоданные, кодированные с помощью модуля ех306 обработки сигналов, в данные.[0249] Fig. 42 illustrates a television (receiver) ex300 that uses the moving picture encoding method and the moving picture decoding method described in each of the embodiments. The television ex300 includes: a tuner ex301 that receives and provides multiplexed data obtained by multiplexing audio data on video data, via an antenna ex204 or a cable ex203, etc. that receives broadcasting; a modulation/demodulation unit ex302 that demodulates the received multiplexed data or modulates the data into multiplexed data to be provided to the outside; and a multiplexing/demultiplexing unit ex303 that demultiplexes the modulated multiplexed data into video data and audio data or multiplexes the video data and audio data encoded by the signal processing unit ex306 into data.
[0250] Телевизор ех300 дополнительно включает в себя: модуль ех306 обработки сигналов, включающий в себя модуль ех304 обработки аудиосигнала и модуль ех305 обработки видеосигнала, что декодировать аудиоданные и видеоданные и кодировать аудиоданные и видеоданные, соответственно (которые функционируют как устройство кодирования изображения и устройство декодирования изображения в соответствии с аспектами настоящего изобретения); и модуль ех309 вывода, включающий в себя громкоговоритель ех307, который обеспечивает декодированный аудиосигнал, и модуль ех308 отображения, который отображает декодированный видеосигнал, такой как дисплей. Кроме того, телевизор ех300 включает в себя модуль ех317 интерфейса, включающий в себя модуль ех312 операционного ввода, который принимает ввод пользовательской операции. Кроме того, телевизор ех300 включает в себя модуль ех310 управления, который управляет в целом каждым из составных элементов телевизора ех300, и модуль ех311 схемы питания, который подает питание на каждый из элементов. Помимо модуля ех312 операционного ввода, модуль ех317 интерфейса может включать в себя: мост ех313, который соединен с внешним устройством, таким как модуль ех218 считывания/записи; гнездовой модуль ех314 для обеспечения крепления носителя записи, такого как SD-карта; драйвер ех315, подлежащий подключению к внешнему носителю записи, такому как жесткий диск; и модем ех316, подлежащий подключению к телефонной сети. Здесь носитель ех216 записи может электрически записывать информацию с использованием элемента энергонезависимой/энергозависимой памяти для хранения. Составные элементы телевизора ех300 соединены друг с другом через синхронную шину.[0250] The television ex300 further includes: a signal processing unit ex306 including an audio signal processing unit ex304 and a video signal processing unit ex305 that decode audio data and video data and encode the audio data and video data, respectively (which function as an image encoding device and an image decoding device according to aspects of the present invention); and an output unit ex309 including a speaker ex307 that provides a decoded audio signal, and a display unit ex308 that displays the decoded video signal, such as a display. In addition, the television ex300 includes an interface unit ex317 including an operation input unit ex312 that receives an input of a user operation. In addition, the television ex300 includes a control module ex310 that controls each of the constituent elements of the television ex300 as a whole, and a power supply circuit module ex311 that supplies power to each of the elements. In addition to the operation input module ex312, the interface module ex317 may include: a bridge ex313 that is connected to an external device such as a reader/writer module ex218; a socket module ex314 for providing a mounting of a recording medium such as an SD card; a driver ex315 to be connected to an external recording medium such as a hard disk; and a modem ex316 to be connected to a telephone network. Here, the recording medium ex216 can electrically record information using a non-volatile/volatile memory element for storing. The constituent elements of the television ex300 are connected to each other via a synchronous bus.
[0251] Сначала будет описана конфигурация, в которой телевизор ех300 декодирует мультиплексированные данные, полученные извне через антенну ех204 и т.п., и воспроизводит декодированные данные. В телевизоре ех300, при операции пользователя через удаленный контроллер ех220 и т.п., модуль ех303 мультиплексирования/демультиплексирования демультиплексирует мультиплексированные данные, демодулированные модулем ех302 модуляции/демодуляции, под управлением модуля ех310 управления, включающим в себя CPU. Кроме того, модуль ех304 обработки аудиосигналов декодирует демультиплексированные аудиоданные, и модуль ех305 обработки видеосигнала декодирует демультиплексированные видеоданные, используя способ декодирования, описанный в каждом из вариантов осуществления, в телевизоре ех300. Модуль ех309 вывода выдает декодированный видеосигнал и аудиосигнал вовне, соответственно. Когда модуль ех309 вывода выдает видеосигнал и аудиосигнал, сигналы могут временно сохраняться в буферах ех318 и ех319 и других, так что сигналы воспроизводятся синхронно друг с другом. Кроме того, телевизор ех300 может считывать мультиплексированные данные не через вещание и т.п., а с носителя ех215 и ех216 записи, такого как магнитный диск, оптический диск и SD-карта. Далее будет описана конфигурация, в которой телевизор ех300 кодирует аудиосигнал и видеосигнал и передает данные вовне или записывает данные на носитель записи. В телевизоре ех300, при операции пользователя через дистанционный контроллер ех220 и т.п., модуль ех304 обработки аудиосигнала кодирует аудиосигнал, и модуль ех305 обработки видеосигнала кодирует видеосигнал, под управлением модуля ех310 управления с использованием способа кодирования, описанного в каждом из вариантов осуществления. Модуль ех303 мультиплексирования/демультиплексирования мультиплексирует кодированный видеосигнал и аудиосигнал и предоставляет результирующий сигнал вовне. Когда модуль ех303 мультиплексирования/демультиплексирования мультиплексирует видеосигнал и аудиосигнал, сигналы могут временно сохраняться в буферах ех320 и ех321 и других, так что сигналы воспроизводятся синхронно друг с другом. Здесь, буферы ех318, ех319, ех320 и ех321 могут быть во множестве, как показано, или по меньшей мере один буфер может совместно использоваться в телевизоре ех300. Кроме того, данные могут быть сохранены в буфере так, что можно избежать переполнения или недогрузки системы, например, между модулем ех302 модуляции/демодуляции и модулем ех303 мультиплексирования /демультиплексирования.[0251] First, a configuration will be described in which a television ex300 decodes multiplexed data received from the outside via an antenna ex204 or the like and reproduces the decoded data. In the television ex300, upon a user operation via a remote controller ex220 or the like, a multiplexing/demultiplexing unit ex303 demultiplexes the multiplexed data demodulated by a modulation/demodulation unit ex302, under the control of a control unit ex310 including a CPU. Furthermore, an audio signal processing unit ex304 decodes the demultiplexed audio data, and a video signal processing unit ex305 decodes the demultiplexed video data, using the decoding method described in each of the embodiments, in the television ex300. The output module ex309 outputs the decoded video signal and the audio signal to the outside, respectively. When the output module ex309 outputs the video signal and the audio signal, the signals may be temporarily stored in the buffers ex318 and ex319 and others, so that the signals are reproduced synchronously with each other. In addition, the television ex300 can read the multiplexed data not through broadcasting etc., but from the recording medium ex215 and ex216, such as a magnetic disk, an optical disk, and an SD card. Next, a configuration will be described in which the television ex300 encodes the audio signal and the video signal and transmits the data to the outside or records the data on the recording medium. In the television ex300, upon an operation by a user via a remote controller ex220 or the like, the audio signal processing unit ex304 codes an audio signal, and the video signal processing unit ex305 codes a video signal, under the control of the control unit ex310, using the encoding method described in each of the embodiments. The multiplexing/demultiplexing unit ex303 multiplexes the coded video signal and the audio signal and provides the resulting signal to the outside. When the multiplexing/demultiplexing unit ex303 multiplexes the video signal and the audio signal, the signals may be temporarily stored in the buffers ex320 and ex321 and others, so that the signals are reproduced in synchronism with each other. Here, the buffers ex318, ex319, ex320 and ex321 may be in a plurality as shown, or at least one buffer may be shared in the television ex300. In addition, data can be stored in a buffer so that overflow or underflow of the system can be avoided, for example, between the ex302 modulation/demodulation module and the ex303 multiplexing/demultiplexing module.
[0252] Кроме того, телевизор ех300 может включать в себя конфигурацию для приема входа AV с микрофона или камеры, отличную от конфигурации для получения аудио- и видеоданных из вещания или носителя записи, и может кодировать полученные данные. Хотя телевизор ех300 может кодировать, мультиплексировать и предоставлять вовне данные, как описано, он может быть способен только принимать, декодировать и предоставлять вовне данные, но не кодировать, мультиплексировать и предоставлять данные вовне.[0252] In addition, the television ex300 may include a configuration for receiving an AV input from a microphone or a camera, different from a configuration for receiving audio and video data from a broadcast or a recording medium, and may encode the received data. Although the television ex300 may encode, multiplex, and provide external data as described, it may only be capable of receiving, decoding, and providing external data, but not encoding, multiplexing, and providing external data.
[0253] Кроме того, когда модуль ех218 считывания/записи считывает или записывает мультиплексированные данные с или на носитель записи, один из телевизора ех300 и модуля ех218 считывания/записи может декодировать или кодировать мультиплексированные данные, и телевизор ех300 и модуль ех218 считывания/записи может совместно использовать декодирование или кодирование.[0253] In addition, when the reading/writing module ex218 reads or writes multiplexed data from or to the recording medium, one of the television ex300 and the reading/writing module ex218 may decode or encode the multiplexed data, and the television ex300 and the reading/writing module ex218 may share decoding or encoding.
[0254] В качестве примера, фиг. 43 иллюстрирует конфигурацию модуля ех400 воспроизведения /записи информации, когда данные считываются или записываются с или на оптический диск. Модуль ех400 воспроизведения/записи информации включает в себя составные элементы ех401, ех402, ех403, ех404, ех405, ех406 и ех407, которые будут описаны ниже. Оптическая головка ех401 облучает лазерное пятно на поверхности записи носителя ех215 записи, которым является оптический диск для записи информации, и детектирует отраженный свет от поверхности записи носителя ех215 записи, чтобы считать информацию. Модуль ех402 записи модуляции электрически приводит в действие полупроводниковый лазер, включенный в оптическую головку ех401, и модулирует лазерный свет в соответствии с записанными данными. Модуль ех403 демодуляции воспроизведения усиливает сигнал воспроизведения, полученный путем электрического детектирования отраженного света от поверхности записи с использованием фотодетектора, включенного в оптическую головку ех401, и демодулирует сигнал воспроизведения путем отделения компонента сигнала, записанного на носитель ех215 записи, чтобы воспроизводить необходимую информацию. Буфер ех404 временно хранит информацию, подлежащую записи на носителе ех215 записи, и информацию, воспроизводимую с носителя ех215 записи. Двигатель ех405 диска вращает носитель ех215 записи. Модуль ех406 сервоуправления перемещает оптическую головку ех401 до предопределенной информационной дорожки, контролируя при этом привод вращения двигателя ех405 диска таким образом, чтобы следовать за лазерным пятном. Модуль ех407 системного управления осуществляет общее управление модулем ех400 воспроизведения/записи информации. Процессы считывания и записи могут быть реализованы модулем ех407 системного управления, использующим различную информацию, хранящуюся в буфере ех404, и генерирующим и добавляющим новую информацию по мере необходимости, а также модулем ех402 записи модуляции, модулем ех403 демодуляции воспроизведения и модулем ех406 сервоуправления, которые записывают и воспроизводят информацию через оптическую головку ех401 во время работы скоординированным образом. Модуль ех407 системного управления включает в себя, например, микропроцессор, и исполняет обработку, побуждая компьютер исполнять программу для считывания и записи.[0254] As an example, Fig. 43 illustrates a configuration of an information reproducing/recording unit ex400 when data is read from or written to an optical disc. The information reproducing/recording unit ex400 includes constituent elements ex401, ex402, ex403, ex404, ex405, ex406 and ex407, which will be described below. The optical head ex401 irradiates a laser spot on a recording surface of a recording medium ex215, which is an optical disc for recording information, and detects reflected light from the recording surface of the recording medium ex215 to read information. The modulation recording unit ex402 electrically drives a semiconductor laser included in the optical head ex401 and modulates the laser light in accordance with the recorded data. The playback demodulation module ex403 amplifies the playback signal obtained by electrically detecting reflected light from the recording surface using a photodetector included in the optical head ex401, and demodulates the playback signal by separating a component of the signal recorded on the recording medium ex215 to reproduce the necessary information. The buffer ex404 temporarily stores information to be recorded on the recording medium ex215 and information reproduced from the recording medium ex215. The disc motor ex405 rotates the recording medium ex215. The servo control module ex406 moves the optical head ex401 to a predetermined information track, while controlling the rotation drive of the disc motor ex405 so as to follow the laser spot. The system control module ex407 carries out overall control of the information playback/recording module ex400. The reading and writing processes can be realized by a system control module ex407 using various information stored in a buffer ex404 and generating and adding new information as needed, and by a modulation recording module ex402, a playback demodulation module ex403, and a servo control module ex406 that record and reproduce information through an optical head ex401 during operation in a coordinated manner. The system control module ex407 includes, for example, a microprocessor, and executes processing by causing a computer to execute a program for reading and writing.
[0255] Хотя оптическая головка ех401 облучает лазерное пятно согласно описанию, она может выполнять запись высокой плотности с использованием света ближнего поля.[0255] Although the ex401 optical head irradiates a laser spot as described, it can perform high-density recording using near-field light.
[0256] Фиг. 44 иллюстрирует носитель ех215 записи, который является оптическим диском. На поверхности записи носителя ех215 записи спирально сформированы направляющие канавки, и информационная дорожка ех230 записывает заранее адресную информацию, указывающую абсолютное положение на диске в соответствии с изменением в форме направляющих канавок. Адресная информация включает в себя информацию для определения позиций блоков ех231 записи, которые являются единицей для записи данных. Воспроизведение информационной дорожки ех230 и считывание адресной информации в устройстве, которое записывает и воспроизводит данные, может привести к определению позиций блоков записи. Кроме того, носитель ех215 записи включает в себя область ех233 записи данных, внутреннюю периферийную область ех232 и внешнюю периферийную область ех234. Область ех233 записи данных является областью для использования в записи пользовательских данных. Внутренняя периферийная область ех232 и внешняя периферийная область ех234, которые находятся внутри и вне области ех233 записи данных, соответственно, предназначены для специального использования, за исключением записи пользовательских данных. Модуль 400 воспроизведения/записи информации считывает и записывает кодированное аудио, кодированные видеоданные или мультиплексированные данные, полученные посредством мультиплексирования кодированных аудио- и видеоданных из и на области ех233 записи данных носителя ех215 записи.[0256] Fig. 44 illustrates a recording medium ex215 that is an optical disc. On the recording surface of the recording medium ex215, guide grooves are spirally formed, and an information track ex230 records in advance address information indicating an absolute position on the disc according to a change in the shape of the guide grooves. The address information includes information for specifying positions of recording blocks ex231 that are a unit for recording data. Reproducing the information track ex230 and reading the address information in an apparatus that records and reproduces data can result in specifying the positions of the recording blocks. Furthermore, the recording medium ex215 includes a data recording area ex233, an inner peripheral area ex232 and an outer peripheral area ex234. The data recording area ex233 is an area for use in recording user data. An inner peripheral area ex232 and an outer peripheral area ex234, which are located inside and outside the data recording area ex233, respectively, are intended for special use except for recording user data. The information reproducing/recording unit 400 reads and writes coded audio data, coded video data, or multiplexed data obtained by multiplexing coded audio and video data from and to the data recording area ex233 of the recording medium ex215.
[0257] Хотя оптический диск, имеющий слой, такой как DVD и BD, описан в качестве примера в описании, оптический диск не ограничен таковым, и может представлять собой оптический диск, имеющий многослойную структуру и способный быть записанным на часть, а не на всю поверхность. Кроме того, оптический диск, может иметь структуру для многомерной записи/воспроизведения, например, записи информации с помощью света цветов с различными длинами волн в одной и той же части оптического диска, и для записи информации с помощью различных слоев под различными углами.[0257] Although an optical disc having a layer such as a DVD and a BD is described as an example in the description, the optical disc is not limited to this, and may be an optical disc having a multilayer structure and capable of being recorded on a part rather than the entire surface. In addition, the optical disc may have a structure for multidimensional recording/reproduction, such as recording information using light of colors with different wavelengths in the same part of the optical disc, and for recording information using different layers at different angles.
[0258] Кроме того, автомобиль ех+210, имеющий антенну ех205, может принимать данные со спутника ех202 и других, и воспроизводить видео на устройстве отображения, таком как автомобильная навигационная система ех+211, установленная в автомобиле ех210, в цифровой вещательной системе ех200. Здесь конфигурация автомобильной навигационной системы ех211 будет конфигурацией, например, включающей в себя GPS приемный модуль из конфигурации, показанной на фиг. 42. То же самое будет справедливо и для конфигурации компьютера ех111, сотового телефона ех114 и др.[0258] In addition, the automobile ex+210 having the antenna ex205 can receive data from the satellite ex202 and others, and reproduce video on a display device such as the automobile navigation system ex+211 installed in the automobile ex210, in the digital broadcasting system ex200. Here, the configuration of the automobile navigation system ex211 will be a configuration including, for example, a GPS receiving module of the configuration shown in Fig. 42. The same will be true for the configuration of the computer ex111, the cellular phone ex114, etc.
[0259] Фиг. 45A иллюстрирует сотовый телефон ех114, который использует способ кодирования движущегося изображения и способ декодирования движущегося изображения, описанные в вариантах осуществления. Сотовый телефон ех114 включает в себя: антенну ех350 для передачи и приема радиоволн через базовую станцию ех110; модуль ех365 камеры, способный захватывать движущееся и неподвижное изображения; и модуль ех358 отображения, такой как жидкокристаллический дисплей для отображения данных, таких как декодированное видео, захваченное модулем ех365 камеры, или принимаемое антенной ех350. Сотовый телефон ех114 дополнительно включает в себя: основной корпус, включающий в себя модуль ех366 операционных клавиш; модуль ех357 вывода аудио, такой как громкоговоритель для вывода аудио; модуль ех356 ввода аудио, такой как микрофон для ввода аудио; модуль ех367 памяти для хранения захваченного видео или фотоснимков, записанного аудио, кодированных или декодированных данных принятого видео, фотоснимков, электронной почты или другого; и гнездовой модуль ех364, который является модулем интерфейса для носителя записи, который хранит данные таким же образом, что и модуль ех367 памяти.[0259] Fig. 45A illustrates a cellular phone ex114 that uses the moving image encoding method and the moving image decoding method described in the embodiments. The cellular phone ex114 includes: an antenna ex350 for transmitting and receiving radio waves via a base station ex110; a camera module ex365 capable of capturing a moving and a still image; and a display module ex358 such as a liquid crystal display for displaying data such as decoded video captured by the camera module ex365 or received by the antenna ex350. The cellular phone ex114 further includes: a main body including an operation key module ex366; an audio output module ex357 such as a speaker for outputting audio; an audio input module ex356 such as a microphone for inputting audio; a memory module ex367 for storing captured video or still images, recorded audio, encoded or decoded data of received video, still images, email or other; and a socket module ex364, which is an interface module for a recording medium that stores data in the same manner as the memory module ex367.
[0260] Далее, пример конфигурации сотового телефона ех114 будет описан со ссылкой на Фиг. 45B. В сотовом телефоне ех114 основной модуль ех360 управления, предназначенный для общего управления каждым модулем основного корпуса, включая модуль ех358 отображения, а также модуль ех366 операционных клавиш, соединен взаимно через модуль ех370 синхронной шины с модулем ех361 схемы питания, модулем ех362 управления операционным вводом, модулем ех355 обработки видеосигнала, модулем ех363 интерфейса камеры, модулем ех359 управления жидкокристаллическим дисплеем (LCD), модулем ех359 модуляции/демодуляции, модулем ех353 мультиплексирования/демультиплексирования, модулем ех354 обработки аудиосигнала, гнездовым модулем ех364 и модулем ех367 памяти.[0260] Next, an example of a configuration of a cellular phone ex114 will be described with reference to Fig. 45B. In the cellular phone ex114, a main control module ex360 for generally controlling each module of the main body including the display module ex358 and the operation key module ex366 is mutually connected via a synchronous bus module ex370 to a power supply circuit module ex361, an operation input control module ex362, a video signal processing module ex355, a camera interface module ex363, a liquid crystal display (LCD) control module ex359, a modulation/demodulation module ex359, a multiplexing/demultiplexing module ex353, an audio signal processing module ex354, a socket module ex364, and a memory module ex367.
[0261] Когда клавиша конца вызова или клавиша питания включается посредством пользовательской операции, модуль ех361 управления питанием снабжает соответствующе модули мощностью от аккумулятора, чтобы активировать сотовый телефон ех114.[0261] When the end call key or the power key is turned on by a user operation, the power control module ex361 supplies the corresponding modules with power from the battery to activate the cellular telephone ex114.
[0262] В сотовом телефоне ех114, модуль ех354 обработки аудиосигнала блока ех354 преобразует аудиосигналы, полученные модулем ех356 ввода аудио в режиме голосового диалога, в цифровые аудиосигналы под управлением основного модуля ех360 управления, включающего CPU, ROM и RAM. Затем модуль ех352 модуляции/демодуляции выполняет обработку расширения спектра на цифровых аудиосигналах, и модуль ех351 передачи и приема выполняет цифро-аналоговое преобразование и частотное преобразование на данных так, чтобы передавать результирующие данные через антенну ех350. Кроме того, в сотовом телефоне ех114 модуль ех351 передачи и приема усиливает данные, принятые антенной ех350 в режиме голосового диалога, и выполняет частотное преобразование и аналого-цифровое преобразование на данных. Затем модуль ех352 модуляции/демодуляции выполняет обработку инверсии расширения спектра на данных, и модуль ех354 обработки аудиосигнала преобразует его в аналоговые аудиосигналы, чтобы вывести их через модуль ех357 вывода аудио.[0262] In the cellular phone ex114, the audio signal processing module ex354 of the unit ex354 converts audio signals received by the audio input module ex356 in the voice dialogue mode into digital audio signals under the control of a main control module ex360 including a CPU, a ROM and a RAM. Then, the modulation/demodulation module ex352 performs spread spectrum processing on the digital audio signals, and the transmission and reception module ex351 performs digital-to-analog conversion and frequency conversion on the data so as to transmit the resulting data via the antenna ex350. Further, in the cellular phone ex114, the transmission and reception module ex351 amplifies the data received by the antenna ex350 in the voice dialogue mode and performs frequency conversion and analog-to-digital conversion on the data. Then, the modulation/demodulation module ex352 performs spread spectrum inversion processing on the data, and the audio signal processing module ex354 converts it into analog audio signals to output them through the audio output module ex357.
[0263] Кроме того, когда электронная почта передается в режиме передачи данных, текстовые данные электронной почты, введенные приведением в действие модуля ех366 операционных клавиш и др. основного корпуса, отсылаются на основной модуль ех360 управления посредством модуля ех362 управления операционным вводом. Основной модуль ех360 управления побуждает модуль ех352 модуляции/демодуляции к выполнению обработки расширения спектра на текстовых данных, и модуль ех351 передачи и приема выполняет цифро-аналоговое преобразование и частотное преобразование на результирующих данных для передачи данных к базовой станции ех110 через антенну ех350. Когда принимается электронная почта, обработка, которая является примерно обратной обработке для передачи электронной почты, выполняется на полученных данных, и результирующие данные предоставляются на модуль ех358 отображения.[0263] Furthermore, when an e-mail is transmitted in the data transmission mode, text data of the e-mail inputted by operating the operation key module ex366 etc. of the main body is sent to the main control module ex360 via the operation input control module ex362. The main control module ex360 causes the modulation/demodulation module ex352 to perform spread spectrum processing on the text data, and the transmission and reception module ex351 performs digital-to-analog conversion and frequency conversion on the resultant data to transmit the data to the base station ex110 via the antenna ex350. When the e-mail is received, processing that is approximately the inverse of the processing for transmitting the e-mail is performed on the received data, and the resultant data is provided to the display module ex358.
[0264] Когда видео, неподвижные изображения или видео и аудио передаются в режиме передачи данных, модуль ех355 обработки видео сигнала сжимает и кодирует видео сигналы, подаваемые из модуля ех365 камеры, с использованием способа кодирования движущегося изображения, показанного в каждом из вариантов осуществления (т.е., функционирует в качестве устройства кодирования изображения в соответствии с аспектом настоящего изобретения), и передает закодированные видеоданные на модуль ех353 мультиплексирования/демультиплексирования. В отличие от этого, когда модуль ех365 камеры захватывает видео, неподвижные изображения и другое, модуль ех354 обработки аудиосигнала кодирует аудиосигналы, полученные модулем ех356 ввода аудио, и передает кодированные аудиоданные в модуль ех353 мультиплексирования/демультиплексирования.[0264] When video, still images, or video and audio are transmitted in a data transmission mode, the video signal processing unit ex355 compresses and codes video signals supplied from the camera unit ex365 using the moving image encoding method shown in each of the embodiments (i.e., functions as an image encoding device according to an aspect of the present invention), and transmits the encoded video data to the multiplexing/demultiplexing unit ex353. In contrast, when the camera unit ex365 captures video, still images, etc., the audio signal processing unit ex354 codes audio signals received by the audio input unit ex356 and transmits the encoded audio data to the multiplexing/demultiplexing unit ex353.
[0265] Модуль ех353 мультиплексирования/ демультиплексирования мультиплексирует кодированные видеоданные, переданные из модуля ех355 обработки видеосигнала, и кодированные аудиоданные, переданные из модуля ех354 обработки аудиосигнала, с использованием предопределенного способа. Затем модуль ех352 модуляции/демодуляции (модуль схемы модуляции/ демодуляции) выполняет обработку расширения спектра на мультиплексированных данных, и модуль ех351 передачи и приема выполняет цифро-аналоговое преобразование и частотное преобразование на данных, чтобы передавать результирующие данные через антенну ех350.[0265] The multiplexing/demultiplexing unit ex353 multiplexes the encoded video data supplied from the video signal processing unit ex355 and the encoded audio data supplied from the audio signal processing unit ex354 using a predetermined method. Then, the modulation/demodulation unit ex352 (modulation/demodulation circuit unit) performs spread spectrum processing on the multiplexed data, and the transmission and reception unit ex351 performs digital-to-analog conversion and frequency conversion on the data to transmit the resulting data via the antenna ex350.
[0266] При приеме данных из видеофайла, который связан с веб-страницей и др. в режиме передачи данных, или при приеме сообщения электронной почты с видео- и/или аудиовложением, для того чтобы декодировать мультиплексированные данные, принятые через антенну ех350, модуль ех353 мультиплексирования/ демультиплексирования демультиплексирует мультиплексированные данные в битовый поток видеоданных и битовый поток аудиоданных и подает на модуль ех355 обработки видеосигнала кодированные видеоданные и на модуль ех354 обработки аудиосигнала кодированные аудиоданные через синхронную шину ех370. Модуль ех355 обработки видеосигнала декодирует видеосигнал, используя способ декодирования движущегося изображения, соответствующий способу кодирования движущегося изображения, показанного в каждом из вариантов осуществления (т.е. функционирует как устройство декодирования изображения в соответствии с аспектом настоящего изобретения), а затем модуль ех358 отображения отображает, например, видео и неподвижные изображения, включенные в видеофайл, связанный с веб-страницей, через модуль ех359 управления LCD. Кроме того, модуль ех354 обработки аудиосигнала декодирует аудиосигнал, и модуль ех3578 вывода аудио выдает аудио.[0266] When receiving data from a video file that is linked to a web page, etc. in a data transfer mode, or when receiving an e-mail message with a video and/or audio attachment, in order to decode the multiplexed data received via the antenna ex350, the multiplexing/demultiplexing unit ex353 demultiplexes the multiplexed data into a video data bitstream and an audio data bitstream and supplies the encoded video data to the video signal processing unit ex355 and the encoded audio data to the audio signal processing unit ex354 via the synchronous bus ex370. The video signal processing unit ex355 decodes the video signal using the moving image decoding method corresponding to the moving image encoding method shown in each of the embodiments (i.e., functions as an image decoding device according to an aspect of the present invention), and then the display unit ex358 displays, for example, the video and still images included in the video file linked to the web page, via the LCD control unit ex359. In addition, the audio signal processing unit ex354 decodes the audio signal, and the audio output unit ex3578 outputs the audio.
[0267] Кроме того, подобно телевизору ех300, терминал, такой как сотовый телефон ех114, вероятно, имеет 3 типа конфигураций реализации, включающих в себя не только (i) передающий и приемный терминал, включающий в себя как устройство кодирования, так и устройство декодирования, но и (ii) передающий терминал, включающий в себя только устройство кодирования, и (iii) приемный терминал, включающий в себя только устройство декодирования. Хотя цифровая вещательная система ех200 в описании принимает и передает мультиплексированные данные, полученные путем мультиплексирования аудиоданных на видеоданные, мультиплексированные данные могут быть данными, полученными посредством мультиплексирования не аудиоданных, а символьных данных, относящихся к видео, на видеоданных, и могут быть не мультиплексированными данными, а самими видеоданными.[0267] Furthermore, like the television ex300, a terminal such as the cellular telephone ex114 is likely to have 3 types of implementation configurations including not only (i) a transmitting and receiving terminal including both an encoding device and a decoding device, but also (ii) a transmitting terminal including only an encoding device, and (iii) a receiving terminal including only a decoding device. Although the digital broadcasting system ex200 in the description receives and transmits multiplexed data obtained by multiplexing audio data onto video data, the multiplexed data may be data obtained by multiplexing not audio data but character data related to video onto video data, and may not be multiplexed data but video data itself.
[0268] Таким образом, способ кодирования движущихся изображений и способ декодирования движущегося изображения в каждом из вариантов осуществления может быть использован в любом из описанных устройств и систем. Таким образом, преимущества, описанные в каждом из вариантов осуществления, могут быть получены.[0268] Thus, the method for coding moving images and the method for decoding a moving image in each of the embodiments can be used in any of the described devices and systems. Thus, the advantages described in each of the embodiments can be obtained.
[0269] Кроме того, различные модификации и изменения могут быть сделаны в любом из вариантов осуществления в настоящем изобретении.[0269] Furthermore, various modifications and changes can be made in any of the embodiments in the present invention.
[0270] (Вариант осуществления 6)[0270] (Embodiment 6)
Видеоданные могут генерироваться путем переключения, по мере необходимости, между (i) способом кодирования движущегося изображения или устройством кодирования движущегося изображения, показанными в каждом из вариантов осуществления, и (ii) способом кодирования движущегося изображения или устройством кодирования движущегося изображения в соответствии с другим стандартом, таким как MPEG-2, MPEG-4 AVC и VC-1.The video data may be generated by switching, as necessary, between (i) the moving picture coding method or the moving picture coding device shown in each of the embodiments and (ii) the moving picture coding method or the moving picture coding device in accordance with another standard such as MPEG-2, MPEG-4 AVC and VC-1.
[0271] Здесь, когда множество видеоданных, которые соответствует различным стандартам, генерируется и затем декодируется, способы декодирования должны быть выбраны, чтобы соответствовать различным стандартам. Однако, поскольку невозможно определить стандарт, которому соответствуют каждые из множества видеоданных, подлежащих декодированию, существует проблема, состоящая в том, что подходящий способ декодирования не может быть выбран.[0271] Here, when a plurality of video data that conforms to different standards is generated and then decoded, decoding methods must be selected to conform to the different standards. However, since it is impossible to determine the standard that each of the plurality of video data to be decoded conforms to, there is a problem that an appropriate decoding method cannot be selected.
[0272] Для того чтобы решить эту проблему, мультиплексированные данные, полученные с помощью мультиплексирования аудиоданных и др. на видео данных, имеют структуру, включающую идентификационную информацию, указывающую какому стандарту соответствует видеоданные. Конкретная структура мультиплексированных данных, включающих в себя видео данные, сгенерированные в способе кодирования движущегося изображения и устройством кодирования движущегося изображения, показанным в каждом из вариантов осуществления, будет описана ниже. Мультиплексированными данными является цифровой поток в формате MPEG-2 транспортного потока.[0272] In order to solve this problem, multiplexed data obtained by multiplexing audio data, etc., onto video data has a structure including identification information indicating which standard the video data conforms to. A specific structure of multiplexed data including video data generated in the moving image encoding method and the moving image encoding device shown in each of the embodiments will be described below. The multiplexed data is a digital stream in the MPEG-2 transport stream format.
[0273] Фиг. 46 иллюстрирует структуру мультиплексированных данных. Как показано на фиг. 46, мультиплексированные данные могут быть получены посредством мультиплексирования по меньшей мере одного из видеопотока, аудиопотока, потока презентационной графики (PG) и потока интерактивной графики. Видеопоток представляет первичное видео и вторичное видео из фильма, аудиопоток (IG) представляет собой первичную часть аудио и вторичную часть аудио, которая подлежит смешиванию с первичной частью аудио, и поток презентационной графики представляет субтитры фильма. Здесь, первичное видео является нормальным видео, подлежащим отображению на экране, и вторичное видео представляет собой видео, подлежащее отображению в меньшем окне в первичном видео. Кроме того, поток интерактивной графики представляет собой интерактивный экран, который будет генерироваться путем размещения компонентов графического пользовательского интерфейса (GUI) на экране. Видеопоток кодируется в способе кодирования движущегося изображения или устройством кодирования движущегося изображения, показанным в каждом из вариантов осуществления, или в способе кодирования движущегося изображения или устройством кодирования движущегося изображения в соответствии с обычным стандартом, таким как MPEG-2, MPEG-4 AVC и VC-1. Аудиопоток кодируется в соответствии с такими стандартами, как Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD и линейная PCM.[0273] Fig. 46 illustrates the structure of multiplexed data. As shown in Fig. 46, the multiplexed data can be obtained by multiplexing at least one of a video stream, an audio stream, a presentation graphics (PG) stream, and an interactive graphics stream. The video stream represents a primary video and a secondary video of a movie, the audio stream (IG) represents a primary audio part and a secondary audio part that is to be mixed with the primary audio part, and the presentation graphics stream represents subtitles of the movie. Here, the primary video is a normal video to be displayed on the screen, and the secondary video is a video to be displayed in a smaller window in the primary video. In addition, the interactive graphics stream represents an interactive screen that will be generated by placing graphical user interface (GUI) components on the screen. The video stream is encoded in the moving picture encoding method or the moving picture encoding device shown in each of the embodiments, or in the moving picture encoding method or the moving picture encoding device in accordance with a conventional standard such as MPEG-2, MPEG-4 AVC and VC-1. The audio stream is encoded in accordance with standards such as Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD and linear PCM.
[0274] Каждый поток, включенный в мультиплексированный данных, идентифицируется посредством PID. Например, 0x1011 выделяется видеопотоку, подлежащему использованию для видео фильма, от 0x1100 до 0x111F выделяются аудиопотоку, от 0x1200 до 0x121F выделяются для потоков презентационной графики, от 0x1400 до 0x141F выделяются для потоков интерактивной графики, от 0x1B00 до 0x1B1F выделяются для видеопотоков, подлежащих использованию для вторичного видео фильма, и от 0x1A00 до 0x1A1F выделяются для потоков аудио, подлежащих использованию для вторичного аудио, подлежащего смешиванию с первичным аудио.[0274] Each stream included in the data multiplex is identified by a PID. For example, 0x1011 is allocated to a video stream to be used for the movie video, 0x1100 to 0x111F are allocated to an audio stream, 0x1200 to 0x121F are allocated for presentation graphics streams, 0x1400 to 0x141F are allocated for interactive graphics streams, 0x1B00 to 0x1B1F are allocated for video streams to be used for the secondary movie video, and 0x1A00 to 0x1A1F are allocated for audio streams to be used for secondary audio to be mixed with the primary audio.
[0275] Фиг. 47 схематично иллюстрирует, как мультиплексированы данные. Во-первых, видеопоток ех235, состоящий из видеокадров, и аудиопоток ех238, состоящий из аудиокадров, преобразуются в поток PES-пакетов ех236 и поток PES-пакетов ех239 и далее в TS-пакеты ех237 и TS-пакеты ех240, соответственно. Кроме того, данные потока ех241 презентационной графики и данные потока ех244 интерактивной графики преобразуются в поток PES-пакетов ех242 и поток PES-пакетов ех245 и далее в TS-пакеты ех243 и TS-пакеты ех246, соответственно. Эти TS-пакеты мультиплексируются в поток, чтобы получить мультиплексированные данные ех247.[0275] Fig. 47 schematically illustrates how the data is multiplexed. First, a video stream ex235 consisting of video frames and an audio stream ex238 consisting of audio frames are converted into a stream of PES packets ex236 and a stream of PES packets ex239 and then into TS packets ex237 and TS packets ex240, respectively. In addition, data of a presentation graphics stream ex241 and data of an interactive graphics stream ex244 are converted into a stream of PES packets ex242 and a stream of PES packets ex245 and then into TS packets ex243 and TS packets ex246, respectively. These TS packets are multiplexed into a stream to obtain multiplexed data ex247.
[0276] Фиг. 48 более подробно показывает, как видеопоток сохраняется в потоке PES-пакетов. Первая строка на фиг. 48 показывает поток видео кадров в видеопотоке. Вторая строка показывает поток PES-пакетов. Как показано стрелками, обозначенными как yy1, yy2, yy3 и yy4 на фиг. 48, видео поток разделяется на изображения (картинки) как I-картинки, В-картинки и Р-картинки, каждая из которых является единицей видео-презентации, и картинки хранятся в полезной нагрузке каждого из PES-потоков. Каждый из PES-пакетов имеет PES-заголовок, и PES- заголовок хранит временную метку презентации (PTS), указывающую время отображения картинки, и временную метку декодирования (DTS), указывающую время декодирования картинки.[0276] Fig. 48 shows in more detail how a video stream is stored in a PES packet stream. The first row of Fig. 48 shows a stream of video frames in the video stream. The second row shows a stream of PES packets. As shown by the arrows labeled yy1, yy2, yy3 and yy4 in Fig. 48, the video stream is divided into pictures (images) as I-pictures, B-pictures and P-pictures, each of which is a unit of video presentation, and the pictures are stored in the payload of each of the PES streams. Each of the PES packets has a PES header, and the PES header stores a presentation timestamp (PTS) indicating the display time of the picture and a decoding timestamp (DTS) indicating the decoding time of the picture.
[0277] Фиг. 49 иллюстрирует формат TS-пакетов, подлежащих окончательной записи на мультиплексированные данные. Каждый из TS-пакетов является 188-байтовым пакетом фиксированной длины, включающим в себя 4-байтовый TS-заголовок, имеющий информацию, такую как PID для идентификации потока, и 184-байтовую TS-полезную нагрузку для хранения данных. PES-пакеты делятся и хранятся в TS-полезных нагрузках, соответственно. При использовании BD ROM, каждому из TS-пакетов задан 4-байтовый TP_Extra_Header (ТР дополнительный заголовок), что приводит в результате к 192-байтовым исходным пакетам. Исходные пакеты, записывается на мультиплексированных данных. TP_Extra_Header хранит информацию, такую как Arrival_Time_Stamp (ATS, метка времени прихода). АТS показывает начальное время передачи, в которое каждый из пакетов TS должен передаваться к PID фильтру. Исходные пакеты упорядочиваются в мультиплексированные данные, как показано в нижней части фиг. 49. Числа, возрастающие от начала мультиплексированных данных, называются номерами исходных пакетов (SPN).[0277] Fig. 49 illustrates the format of TS packets to be finally written onto the multiplexed data. Each of the TS packets is a 188-byte fixed-length packet including a 4-byte TS header having information such as a PID for identifying a stream, and a 184-byte TS payload for storing data. PES packets are divided and stored in the TS payloads, respectively. When using a BD ROM, each of the TS packets is given a 4-byte TP_Extra_Header (TP extra header), which results in 192-byte source packets. The source packets are written onto the multiplexed data. TP_Extra_Header stores information such as Arrival_Time_Stamp (ATS). ATS indicates the start transmission time at which each of the TS packets should be transmitted to the PID filter. The source packets are ordered into multiplexed data as shown at the bottom of Fig. 49. The numbers increasing from the start of the multiplexed data are called source packet numbers (SPNs).
[0278] Каждый из TS-пакетов, включенных в мультиплексированные данные, включает в себя не только потоки аудио, видео, субтитров и другие, но также таблицу с перечнем программ потока с их идентификаторами (PAT), таблицу структуры программ (PMT) и поле эталонных часов (PCR). PAT показывает, какой PID в PMT использован в мультиплексированных данных, и PID самого PAT зарегистрирован в качестве нуля. PMT сохраняет PID потоков видео, аудио, субтитров и другого, включенных в мультиплексированные данных, и информацию атрибутов потоков, соответствующих PID. PMT также имеет различные дескрипторы, относящиеся к мультиплексированным данным. Дескрипторы имеют информацию, такую как информация управления копированием, указывающую, разрешено ли копирование мультиплексированных данных или нет. PCR хранит STC информацию о времени, соответствующую АТS, показывающему, когда пакет PCR передается в декодер, чтобы достичь синхронизации между часами времени прихода (ATC), которое представляет собой временную ось ATS, и часами системного времени (STC), которое представляет собой временную ось PTS и DTS.[0278] Each of the TS packets included in the multiplexed data includes not only audio, video, subtitle and other streams, but also a program table with a list of stream programs with their identifiers (PAT), a program structure table (PMT) and a reference clock field (PCR). The PAT indicates which PID in the PMT is used in the multiplexed data, and the PID of the PAT itself is registered as zero. The PMT stores the PIDs of the video, audio, subtitle and other streams included in the multiplexed data, and the attribute information of the streams corresponding to the PIDs. The PMT also has various descriptors related to the multiplexed data. The descriptors have information such as copy control information indicating whether copying of the multiplexed data is permitted or not. The PCR stores STC time information corresponding to the ATS indicating when the PCR packet is transmitted to the decoder in order to achieve synchronization between the arrival time clock (ATC), which is the ATS time axis, and the system time clock (STC), which is the PTS and DTS time axis.
[0279] Фиг. 50 более детально иллюстрирует структуру данных РМТ. РМТ-заголовок расположен сверху РМТ. РМТ-заголовок описывает длину данных, включенных в РМТ, и другое. Множество дескрипторов, относящихся к мультиплексированным данным, расположено после РМТ-заголовка. Информация, такая как информация управления копированием, описана в дескрипторах. После дескрипторов расположено множество частей информации потока, относящейся к потокам, включенным в мультиплексированные данные. Каждая часть информации потока включает в себя дескрипторы потока, каждый из которых описывает информацию, такую как тип потока, для идентификации кодека сжатия потока, PID потока и информацию атрибутов потока (такую как частота кадров или формат кадра). Дескрипторы потока по количеству равны количеству потоков в мультиплексированных данных.[0279] Fig. 50 illustrates the structure of the PMT data in more detail. A PMT header is located at the top of the PMT. The PMT header describes the length of the data included in the PMT, etc. A plurality of descriptors related to the multiplexed data are located after the PMT header. Information such as copy control information is described in the descriptors. Following the descriptors, a plurality of pieces of stream information related to the streams included in the multiplexed data are located. Each piece of stream information includes stream descriptors, each of which describes information such as a stream type for identifying a stream compression codec, a stream PID, and stream attribute information (such as a frame rate or frame format). The number of stream descriptors is equal to the number of streams in the multiplexed data.
[0280] Когда мультиплексированные данные записываются на носитель записи и другое, они записываются вместе с файлами информации мультиплексированных данных.[0280] When multiplexed data is recorded on a recording medium etc., it is recorded together with multiplexed data information files.
[0281] Каждый из файлов информации мультиплексированных данных является информацией управления мультиплексированных данных, как показано на Фиг. 51. Файлы информации мультиплексированных данных находятся в однозначном соответствии с мультиплексированными данными, и каждый из файлов содержит информацию мультиплексированных данных, информацию атрибутов потока и карту элементов записи.[0281] Each of the multiplexed data information files is multiplexed data management information, as shown in Fig. 51. The multiplexed data information files are in one-to-one correspondence with the multiplexed data, and each of the files contains multiplexed data information, stream attribute information, and a recording element map.
[0282] Как показано на фиг. 51, информация мультиплексированных данных включает в себя скорость системы, время начала воспроизведения и время конца воспроизведения. Скорость системы указывает на максимальную скорость передачи, при которой целевой декодер системы, описанный далее, передает мультиплексированные данные в PID фильтр. Интервалы АТS, включенные в мультиплексированные данные, установлены на значение не выше, чем скорость системы. Время начала воспроизведения указывает PTS в видеокадре в начале мультиплексированных данных. Интервал в один кадр добавлен к PTS в видеокадре в конце мультиплексированных данных, и PTS установлен на время конца воспроизведения.[0282] As shown in Fig. 51, the multiplexed data information includes a system rate, a playback start time, and a playback end time. The system rate indicates a maximum transmission rate at which the target system decoder described later transmits the multiplexed data to the PID filter. The ATS intervals included in the multiplexed data are set to a value not higher than the system rate. The playback start time indicates a PTS in a video frame at the beginning of the multiplexed data. An interval of one frame is added to the PTS in a video frame at the end of the multiplexed data, and the PTS is set to the playback end time.
[0283] Как показано на фиг. 52, часть информации атрибутов регистрируется в информации атрибутов потока для каждого PID каждого потока, включенного в мультиплексированные данные. Каждая часть информации атрибутов имеет различную информацию в зависимости от того, является ли соответствующий поток видеопотоком, аудиопотоком, потоком презентационной графики или потоком интерактивной графики. Каждая часть информации атрибутов видеопотока несет информацию, включающую то, какой тип кодека сжатия используется для сжатия видеопотока, и разрешение, формат кадра и частоту кадров частей данных картинок, которые включены в видеопоток. Каждая часть информации атрибутов аудиопотока несет информацию, включающую в себя то, какой тип кодека сжатия используется для сжатия аудиопотока, сколько каналов включены в аудиопоток, какой язык поддерживает аудиопоток, и насколько высока частота дискретизации. Информация атрибутов видеопотока и информация атрибутов аудиопотока используются для инициализации декодера перед тем, как плеер будет воспроизводить информацию.[0283] As shown in Fig. 52, a piece of attribute information is registered in the stream attribute information for each PID of each stream included in the multiplexed data. Each piece of attribute information has different information depending on whether the corresponding stream is a video stream, an audio stream, a presentation graphics stream, or an interactive graphics stream. Each piece of video stream attribute information carries information including what type of compression codec is used to compress the video stream, and a resolution, a frame format, and a frame rate of parts of picture data that are included in the video stream. Each piece of audio stream attribute information carries information including what type of compression codec is used to compress the audio stream, how many channels are included in the audio stream, what language the audio stream supports, and how high the sampling frequency is. The video stream attribute information and the audio stream attribute information are used to initialize the decoder before the player reproduces the information.
[0284] В настоящем варианте осуществления, мультиплексированные данные, подлежащие использованию, представляют собой тип потока, включенный в РМТ. Кроме того, когда мультиплексированные данные записываются на носитель записи, используется информация атрибутов видеопотока, включенная в информацию мультиплексированных данных. Более конкретно, способ кодирования движущегося изображения или устройство кодирования движущегося изображения, описанные в каждом из вариантов осуществления, включают в себя этап или модуль для распределения уникальной информации, указывающей видеоданные, генерируемые способом кодирования изображения или устройством кодирования движущегося изображения в каждом из вариантов осуществления, для типа потока, включенного в РМТ или информацию атрибутов видеопотока. При такой конфигурации, видеоданные, генерируемые способом кодирования движущегося изображения или устройством кодирования движущегося изображения, описанным в каждом из вариантов осуществления, могут различаться от видеоданных, которые соответствуют другому стандарту.[0284] In the present embodiment, the multiplexed data to be used is a stream type included in the PMT. Furthermore, when the multiplexed data is recorded on the recording medium, the video stream attribute information included in the multiplexed data information is used. More specifically, the moving picture coding method or the moving picture coding device described in each of the embodiments includes a step or a module for distributing unique information indicating the video data generated by the image coding method or the moving picture coding device in each of the embodiments, for the stream type included in the PMT or the video stream attribute information. With such a configuration, the video data generated by the moving picture coding method or the moving picture coding device described in each of the embodiments can be distinguished from the video data that conforms to another standard.
[0285] Кроме того, фиг. 53 иллюстрирует этапы способа декодирования движущегося изображения в соответствии с настоящим вариантом осуществления. На этапе ехS100 тип потока, включенный в РМТ, или информация атрибутов видеопотока, включенная в информацию мультиплексированных данных, получается из мультиплексированных данных. Затем, на этапе ехS101, определяют, указывает ли тип потока или информация атрибутов видеопотока, что мультиплексированные данные генерированы способом кодирования движущегося изображения или устройством кодирования движущегося изображения в каждом из вариантов осуществления. Когда определено, что тип потока или информация атрибутов видеопотока указывает, что мультиплексированные данные сгенерированы способом кодирования движущегося изображения или устройством кодирования движущегося изображения в каждом из вариантов осуществления, на этапе ехS102 выполняется декодирование способом декодирования движущегося изображения в каждом из вариантов осуществления. Кроме того, если тип потока или информация атрибутов видеопотока указывает на соответствие с обычными стандартами, такими как MPEG-2, MPEG-4 AVC, и VC-1, на этапе ехS103 декодирование выполняется способом декодирования движущегося изображения в соответствии с обычными стандартами.[0285] Furthermore, Fig. 53 illustrates the steps of the moving picture decoding method according to the present embodiment. In step exS100, the stream type included in the PMT or the video stream attribute information included in the multiplexed data information is obtained from the multiplexed data. Then, in step exS101, it is determined whether the stream type or the video stream attribute information indicates that the multiplexed data is generated by the moving picture coding method or the moving picture coding device in each of the embodiments. When it is determined that the stream type or the video stream attribute information indicates that the multiplexed data is generated by the moving picture coding method or the moving picture coding device in each of the embodiments, decoding is performed in step exS102 by the moving picture decoding method in each of the embodiments. In addition, if the stream type or attribute information of the video stream indicates conformity with conventional standards such as MPEG-2, MPEG-4 AVC, and VC-1, in step exS103, decoding is performed by the moving picture decoding method in accordance with the conventional standards.
[0286] Таким образом, выделение нового уникального значения типу потока или информации атрибутов видеопотока позволяет определить, может ли способ декодирования изображения или устройство декодирования движущегося изображения, описанное в каждом из вариантов осуществления, выполнять декодирование. Даже когда вводятся мультиплексированные данные, соответствующие некоторому другому стандарту, может быть выбран соответствующий способ или устройство декодирования. Таким образом, становится возможным декодирование информации без каких-либо ошибок. Кроме того, способ или устройство кодирования движущегося изображения или способ или устройство декодирования движущегося изображение в настоящем варианте осуществления могут быть использованы в устройствах и системах, описанных выше.[0286] In this way, by allocating a new unique value to the type of stream or attribute information of the video stream, it is possible to determine whether the image decoding method or the moving image decoding device described in each of the embodiments can perform decoding. Even when multiplexed data conforming to some other standard is input, an appropriate decoding method or device can be selected. In this way, it becomes possible to decode the information without any errors. Furthermore, the moving image coding method or device or the moving image decoding method or device in the present embodiment can be used in the devices and systems described above.
[0287] (Вариант осуществления 7)[0287] (Embodiment 7)
Каждый из способа кодирования движущегося изображения, устройства кодирования движущегося изображения, способа декодирования движущегося изображения и устройства декодирования движущегося изображения в каждом из вариантов осуществления, как правило, реализуется в форме интегральной схемы или интегральной схемы с высокой степенью интеграции (LSI, БИС). В качестве примера БИС, фиг. 54 иллюстрирует конфигурацию БИС ех500, которая выполнена в одной микросхеме. БИС ех500 включает в себя элементы ех501, ех502, ех503, ех504, ех505, ех506, ех507, ех508 и ех509, которые будут описаны ниже, причем элементы соединены друг с другом через шину ех510. Модуль ех505 схемы питания активируется путем подачи мощности на каждый из элементов, когда модуль ех505 схемы питания включается.Each of the moving image encoding method, the moving image encoding device, the moving image decoding method, and the moving image decoding device in each of the embodiments is typically implemented in the form of an integrated circuit or a highly integrated circuit (LSI). As an example of the LSI, Fig. 54 illustrates a configuration of the LSI ex500, which is implemented in a single chip. The LSI ex500 includes elements ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, and ex509, which will be described below, and the elements are connected to each other via a bus ex510. The power supply circuit module ex505 is activated by supplying power to each of the elements when the power supply circuit module ex505 is turned on.
[0288] Например, когда выполняется кодирование, БИС ех500 получает AV сигнал от микрофона ех117, камеры ех113 и другого через AV ввод-вывод ех509 под управлением модуля ех501 управления, включающего в себя CPU ех502, контроллер ех503 памяти, контроллер ех504 потока и модуль ех512 управления частотой возбуждения. Принятый AV сигнал временно сохраняется во внешней памяти ех511, такой как SDRAM. Под управлением модуля ех501 управления сохраненные данные сегментируются на порции данных в соответствии с объемом и скоростью обработки, чтобы передаваться в модуль ех507 обработки сигналов. Затем модуль ех507 обработки сигналов кодирует аудиосигнал и/или видеосигнал. Здесь кодирование видеосигнала является кодированием, описанным в каждом из вариантов осуществления. Кроме того, модуль ех507 обработки сигналов иногда мультиплексирует кодированные аудиоданные и кодированные видеоданные, и ввод-вывод (I/O) ех506 потока выдает мультиплексированные данные вовне. Выведенные мультиплексированные данные передаются на базовую станцию ех107 или записываются на носитель ех215 записи. Если наборы данных мультиплексированы, эти данные должны быть временно сохранены в буфере ех508, так что наборы данных синхронизированы друг с другом.[0288] For example, when encoding is performed, the LSI ex500 receives an AV signal from the microphone ex117, the camera ex113 and others via the AV input/output ex509 under the control of a control unit ex501 including a CPU ex502, a memory controller ex503, a stream controller ex504 and a driving frequency control unit ex512. The received AV signal is temporarily stored in an external memory ex511 such as an SDRAM. Under the control of the control unit ex501, the stored data is segmented into data portions according to the volume and processing speed to be supplied to the signal processing unit ex507. Then, the signal processing unit ex507 encodes the audio signal and/or the video signal. Here, the encoding of the video signal is the encoding described in each of the embodiments. In addition, the signal processing unit ex507 sometimes multiplexes the encoded audio data and the encoded video data, and the stream input/output (I/O) ex506 outputs the multiplexed data to the outside. The output multiplexed data is transmitted to the base station ex107 or recorded on the recording medium ex215. If the data sets are multiplexed, these data must be temporarily stored in the buffer ex508 so that the data sets are synchronized with each other.
[0289] Хотя память ех511 является элементом внешним относительно БИС ех500, она может быть включена в БИС ех500. Буфер ех508 не ограничивается одним буфером, но может состоять из буферов. Кроме того, БИС ех500 может быть выполнена на одной микросхеме или множестве микросхем.[0289] Although the memory ex511 is an element external to the LSI ex500, it may be included in the LSI ex500. The buffer ex508 is not limited to a single buffer, but may consist of buffers. In addition, the LSI ex500 may be implemented on a single chip or a plurality of chips.
[0290] Кроме того, хотя модуль ех501 управления включает в себя CPU ех502, контроллер ех503 памяти, контроллер ех504 потока, модуль ех512 управления частотой возбуждения, конфигурация модуля ех501 управления не ограничивается этим. Например, модуль ех507 обработки сигналов может дополнительно включать в себя CPU. Включение другого CPU в модуль ех507 обработки сигналов может улучшить скорость обработки. Кроме того, в качестве другого примера, CPU ех502 может служить в качестве модуля ех507 обработки сигналов или быть его частью и, например, может включать в себя модуль обработки аудиосигнала. В таком случае, модуль ех501 управления включает в себя модуль ех507 обработки сигналов, или CPU ех502 включает в себя часть модуля ех507 обработки сигналов.[0290] Furthermore, although the control unit ex501 includes a CPU ex502, a memory controller ex503, a flow controller ex504, an excitation frequency control unit ex512, the configuration of the control unit ex501 is not limited thereto. For example, the signal processing unit ex507 may further include a CPU. Including another CPU in the signal processing unit ex507 can improve the processing speed. Furthermore, as another example, the CPU ex502 may serve as the signal processing unit ex507 or be a part thereof, and, for example, may include an audio signal processing unit. In such a case, the control unit ex501 includes the signal processing unit ex507, or the CPU ex502 includes a part of the signal processing unit ex507.
[0291] Термином, используемым здесь, является БИС, но это также может определяться как интегральная схема (IC, ИС), система БИС, супер-БИС или ультра-БИС в зависимости от степени интеграции.[0291] The term used here is LSI, but it can also be referred to as an integrated circuit (IC), a system LSI, a super LSI, or an ultra LSI depending on the degree of integration.
[0292] Кроме того, способы достижения интеграции не ограничиваются БИС, и специализированная схема или процессор общего назначения и т.д. может также реализовывать интеграцию. Программируемая пользователем вентильная матрица (FPGA), которая может быть запрограммирована после изготовления БИС, или процессор с изменяемой конфигурацией, которые позволяют изменять соединение или конфигурацию БИС, могут быть использованы с той же целью.[0292] Furthermore, the methods for achieving integration are not limited to the LSI, and a specialized circuit or a general-purpose processor, etc. may also implement the integration. A field-programmable gate array (FPGA) that can be programmed after the LSI is manufactured, or a reconfigurable processor that allows the connection or configuration of the LSI to be changed, may be used for the same purpose.
[0293] В будущем, с прогрессом в технологии полупроводников, совершенно новая технология может заменить БИС. Функциональные блоки могут быть интегрированы с использованием такой технологии. Возможно также, что настоящее изобретение будет применяться к биотехнологии.[0293] In the future, with the advancement of semiconductor technology, a completely new technology may replace the LSI. Functional blocks may be integrated using such technology. It is also possible that the present invention will be applied to biotechnology.
[0294] (Вариант осуществления 8)[0294] (Embodiment 8)
Когда видеоданные, сгенерированные способом кодирования движущегося изображения или устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления, декодируются, по сравнению с тем, когда декодируются видеоданные, которые соответствуют обычным стандартом, таким как MPEG-2, MPEG-4 AVC и VC-1, объем обработки, вероятно, увеличивается. Таким образом, БИС ех500 требуется установить на частоту возбуждения более высокую, чем у CPU ех502, который должен использоваться, когда декодируются видеоданные в соответствии с обычным стандартом. Однако когда частота возбуждения устанавливается выше, имеет место проблема, состоящая в том, что потребление мощности повышается.When video data generated by the moving image encoding method or the moving image encoding device described in each of the embodiments is decoded, compared with when video data that conforms to a conventional standard such as MPEG-2, MPEG-4 AVC, and VC-1 is decoded, the amount of processing is likely to increase. Therefore, the LSI ex500 needs to be set to a driving frequency higher than that of the CPU ex502 to be used when video data conforming to a conventional standard is decoded. However, when the driving frequency is set higher, there is a problem that power consumption increases.
[0295] Для того чтобы решить эту проблему, устройство декодирования движущегося изображения, такое как телевизор ех300 и БИС ех500, конфигурируется, чтобы определять, какому стандарту соответствуют видеоданные, и переключаться между частотами возбуждения в соответствии с определенным стандартом. Фиг. 55 иллюстрирует конфигурацию ех800 в настоящем варианте осуществления. Модуль ех803 переключения частоты возбуждения устанавливает частоту возбуждения на более высокую частоту возбуждения, когда видеоданные генерируются способом кодирования движущегося изображения или устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления. Затем, модуль ех803 переключения частоты возбуждения инструктирует модуль ех801 обработки декодирования, который исполняет способ декодирования движущегося изображения, описанный в каждом из вариантов осуществления, чтобы декодировать видеоданные. Когда видеоданные соответствует общепринятому стандарту, модуль ех803 переключения частоты возбуждения устанавливает частоту возбуждения на более низкую частоту возбуждения, чем для видеоданных, полученных с помощью способа кодирования движущегося изображения или устройства кодирования движущегося изображения, описанных в каждом из вариантов осуществления. Затем, модуль ех803 переключения частоты возбуждения инструктирует модуль ех802 обработки декодирования, который соответствует общепринятому стандарту, чтобы декодировать видеоданные.[0295] In order to solve this problem, a moving picture decoding device such as the television ex300 and the LSI ex500 is configured to determine which standard the video data conforms to and to switch between driving frequencies in accordance with the determined standard. Fig. 55 illustrates a configuration ex800 in the present embodiment. The driving frequency switching unit ex803 sets the driving frequency to a higher driving frequency when the video data is generated by the moving picture coding method or the moving picture coding device described in each of the embodiments. Then, the driving frequency switching unit ex803 instructs the decoding processing unit ex801, which executes the moving picture decoding method described in each of the embodiments, to decode the video data. When the video data conforms to a conventional standard, the driving frequency switching unit ex803 sets the driving frequency to a lower driving frequency than that of the video data obtained by the moving image coding method or the moving image coding device described in each of the embodiments. Then, the driving frequency switching unit ex803 instructs the decoding processing unit ex802, which conforms to the conventional standard, to decode the video data.
[0296] Более конкретно, модуль ех803 переключения частоты возбуждения включает в себя CPU ех502 и модуль ех512 управления частотой возбуждения по фиг. 54. Здесь каждый из модуля ех801 обработки декодирования, который исполняет способ декодирования движущегося изображения, описанный в каждом из вариантов осуществления, и модуля ех802 обработки декодирования, который соответствует общепринятому стандарту, соответствует модулю ех507 обработки сигнала по фиг. 54. CPU ex502 определяет, какому стандарту соответствуют видеоданные. Затем модуль ех512 управления частотой возбуждения определяет частоту возбуждения на основе сигнала от CPU ex502. Кроме того, модуль ех507 обработки сигнала декодирует видеоданные на основе сигнала от CPU ex502. Например, идентификационная информация, описанная в варианте осуществления 6, может использоваться для идентификации видеоданных. Идентификационная информация не ограничивается описанной в варианте осуществления 6, но может быть любой информацией, если эта информация указывает, какому стандарту соответствует видеоданные. Например, если то, какому стандарту соответствуют видеоданные, может быть определено на основе внешнего сигнала для определения того, что видеоданные используются для телевизора или диска и т.д., определение может быть выполнено на основе такого внешнего сигнала. Кроме того, CPU ех502 выбирает частоту возбуждения на основе, например, справочной таблицы, в которой стандарты видеоданных ассоциированы с частотами возбуждения, как показано на фиг. 57. Частота возбуждения может быть выбрана посредством сохранения справочной таблицы в буфере ех508 и во внутренней памяти БИС и со ссылкой на справочную таблицу посредством CPU ex502.[0296] More specifically, the driving frequency switching unit ex803 includes a CPU ex502 and a driving frequency control unit ex512 of Fig. 54. Here, each of the decoding processing unit ex801 that executes the moving image decoding method described in each of Embodiments and the decoding processing unit ex802 that conforms to a conventional standard corresponds to the signal processing unit ex507 of Fig. 54. The CPU ex502 determines which standard the video data conforms to. Then, the driving frequency control unit ex512 determines the driving frequency based on the signal from the CPU ex502. Furthermore, the signal processing unit ex507 decodes the video data based on the signal from the CPU ex502. For example, the identification information described in
[0297] Фиг. 56 иллюстрирует этапы для исполнения способа в настоящем варианте осуществления. Сначала на этапе exS200 модуль ех507 обработки сигнала получает идентификационную информацию из мультиплексированных данных. Затем на этапе exS201 CPU ex502 определяет, сгенерированы ли видеоданные посредством способа кодирования и устройства кодирования, описанных в каждом из вариантов осуществления, на основе идентификационной информации. Если видеоданные сгенерированы посредством способа кодирования и устройства кодирования, описанных в каждом из вариантов осуществления, то на этапе exS202 CPU ex502 передает сигнал для установки частоты возбуждения на более высокую частоту возбуждения в модуль ех512 управления частотой возбуждения. Затем модуль ех512 управления частотой возбуждения устанавливает частоту возбуждения на более высокую частоту возбуждения. С другой стороны, когда идентификационная информация указывает, что видеоданные соответствует общепринятому стандарту, например, MPEG-2, MPEG-4 AVC и VC-1, на этапе ехS203 CPU ex502 передает сигнал для установки частоты возбуждения на более низкую частоту в модуль ех512 управления частотой возбуждения. Затем модуль ех512 управления частотой возбуждения устанавливает частоту возбуждения на более низкую частоту возбуждения, чем в случае, когда видеоданные сгенерированы способом кодирования движущегося изображения и устройством кодирования движущегося изображения, описанными в каждом варианте осуществления.[0297] Fig. 56 illustrates steps for executing the method in the present embodiment. First, in step exS200, the signal processing unit ex507 obtains identification information from the multiplexed data. Then, in step exS201, the CPU ex502 determines whether the video data is generated by the encoding method and the encoding device described in each of the embodiments, based on the identification information. If the video data is generated by the encoding method and the encoding device described in each of the embodiments, then, in step exS202, the CPU ex502 transmits a signal for setting the driving frequency to a higher driving frequency to the driving frequency control unit ex512. Then, the driving frequency control unit ex512 sets the driving frequency to the higher driving frequency. On the other hand, when the identification information indicates that the video data conforms to a conventional standard such as MPEG-2, MPEG-4 AVC and VC-1, in step exS203, the CPU ex502 transmits a signal for setting the driving frequency to a lower frequency to the driving frequency control unit ex512. Then, the driving frequency control unit ex512 sets the driving frequency to a lower driving frequency than in the case where the video data is generated by the moving image coding method and the moving image coding device described in each embodiment.
[0298] Кроме того, наряду с переключением частот возбуждения, эффект сбережения мощности может быть улучшен путем изменения напряжения, подаваемого на БИС ех500 или устройство, включающее в себя БИС ех500. Например, когда частота возбуждения установлена более низкой, напряжение, подаваемое на БИС ех500 или устройство, включающее в себя БИС ех500, может устанавливаться на напряжение более низкое, чем в случае, если частота возбуждения установлена более высокой.[0298] In addition, in addition to switching the driving frequencies, the power saving effect can be improved by changing the voltage supplied to the LSI ex500 or the device including the LSI ex500. For example, when the driving frequency is set lower, the voltage supplied to the LSI ex500 or the device including the LSI ex500 can be set to a voltage lower than in the case where the driving frequency is set higher.
[0299] Кроме того, когда объем обработки для декодирования больше, частота возбуждения может быть установлена более высокой, а когда объем обработки для декодирования меньше, частота возбуждения может быть установлена ниже в качестве способа установки частоты возбуждения. Таким образом, способ установки не ограничивается описанным выше. Например, когда объем обработки для декодирования видеоданных в соответствии с MPEG-4 AVC больше, чем объем обработки для декодирования видео данных, сгенерированных способом кодирования движущегося изображения и устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления, частота возбуждения может устанавливаться в порядке, обратном установке, описанной выше.[0299] Furthermore, when the amount of processing for decoding is larger, the driving frequency can be set higher, and when the amount of processing for decoding is smaller, the driving frequency can be set lower as a method for setting the driving frequency. Thus, the setting method is not limited to the one described above. For example, when the amount of processing for decoding video data according to MPEG-4 AVC is larger than the amount of processing for decoding video data generated by the moving picture coding method and the moving picture coding device described in each of the embodiments, the driving frequency can be set in the reverse order of the setting described above.
[0300] Кроме того, способ для установки частоты возбуждения не ограничивается способом для установки частоты возбуждения более низкой. Например, когда идентификационная информация указывает, что видеоданные генерируются способом кодирования движущегося изображения и устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления, напряжение, подаваемое на БИС ех500 или устройство, включающее в себя БИС ех500, может устанавливаться выше. Когда идентификационная информация указывает, что видеоданные соответствуют общепринятому стандарту, например, MPEG-2, MPEG-4 AVC и VC-1, напряжение, подаваемое на БИС ех500 или устройство, включающее в себя БИС ех500, может устанавливаться ниже. В качестве другого примера, когда идентификационная информация указывает, что видеоданные генерируются способом кодирования движущегося изображения и устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления, приведение в действие CPU ех502, вероятно, не потребуется приостанавливать. Когда идентификационная информация указывает, что видеоданные соответствует общепринятому стандарту, например, MPEG-2, MPEG-4 AVC и VC-1, приведение в действие CPU ех502, вероятно, приостанавливается в данный момент времени, потому что CPU ex502 имеет дополнительную производительность обработки. Даже тогда, когда идентификационная информация указывает, что видеоданные генерируются способом кодирования движущегося изображения и устройством кодирования движущегося изображения, описанными в каждом из вариантов осуществления, в случае, когда CPU ex502 имеет дополнительную производительность обработки, приведение в действие CPU ех502 может приостанавливаться в данный момент времени. В таком случае, время приостановки, вероятно, устанавливается меньшим, чем в случае, когда идентификационная significant_flag информация указывает, что видеоданные соответствует общепринятому стандарту, например, MPEG-2, MPEG-4 AVC и VC-1.[0300] Furthermore, the method for setting the driving frequency is not limited to the method for setting the driving frequency lower. For example, when the identification information indicates that the video data is generated by the moving image coding method and the moving image coding device described in each of the embodiments, the voltage supplied to the LSI ex500 or the device including the LSI ex500 may be set higher. When the identification information indicates that the video data conforms to a conventional standard such as MPEG-2, MPEG-4 AVC and VC-1, the voltage supplied to the LSI ex500 or the device including the LSI ex500 may be set lower. As another example, when the identification information indicates that the video data is generated by the moving image coding method and the moving image coding device described in each of the embodiments, the operation of the CPU ex502 may not need to be suspended. When the identification information indicates that the video data conforms to a conventional standard such as MPEG-2, MPEG-4 AVC and VC-1, the operation of the CPU ex502 is likely to be suspended at this point in time because the CPU ex502 has additional processing capacity. Even when the identification information indicates that the video data is generated by the moving image coding method and the moving image coding device described in each of the embodiments, in the case where the CPU ex502 has additional processing capacity, the operation of the CPU ex502 may be suspended at this point in time. In such a case, the pause time is likely to be set to a smaller value than in the case where the significant_flag identification information indicates that the video data complies with a common standard, such as MPEG-2, MPEG-4 AVC, and VC-1.
[0301] Соответственно, эффект сбережения мощности может быть улучшен путем переключения между частотами возбуждения в соответствии со стандартом, которому соответствуют видеоданные. Кроме того, когда БИС ех500 или устройство, включающее в себя БИС ех500, приводится в действие с использованием аккумулятора, срок службы батареи может быть продлен за счет эффекта сбережения мощности.[0301] Accordingly, the power saving effect can be improved by switching between driving frequencies in accordance with the standard to which the video data conforms. In addition, when the LSI ex500 or a device including the LSI ex500 is driven using a battery, the life of the battery can be extended due to the power saving effect.
[0302] (Вариант осуществления 9)[0302] (Embodiment 9)
Имеются случаи, когда множество видеоданных, которые соответствуют различным стандартам, подаются на устройства и системы, такие как телевизор и сотовый телефон. Для того чтобы декодировать множество видеоданных, которые соответствует различным стандартам, модуль ех507 обработки сигнала БИС ех500 должен соответствовать различным стандартам. Однако возникают проблемы увеличения степени интеграции БИС ех500 и увеличения стоимости при индивидуальном использовании модулей ех507 обработки сигнала, которые отвечают соответствующим стандартам.There are cases where a plurality of video data that conforms to different standards are supplied to devices and systems such as a television and a cellular phone. In order to decode a plurality of video data that conforms to different standards, the signal processing module ex507 of the LSI ex500 must conform to different standards. However, there are problems of increasing the integration degree of the LSI ex500 and increasing the cost when using the signal processing modules ex507 that conform to the corresponding standards individually.
[0303] Для того чтобы решить эту проблему, предложена конфигурация, в которой модуль обработки декодирования для реализации способа декодирования движущегося изображения, описанного в каждом из вариантов осуществления, и модуль обработки декодирования, который соответствует общепринятому стандарту, такому как MPEG-2, MPEG-4 AVC и VC-1, частично используются совместно. Ex900 на фиг. 58A показывает пример такой конфигурации. Например, способ декодирования движущегося изображения, описанный в каждом из вариантов осуществления, и способ декодирования движущегося изображения, который соответствует MPEG-4 AVC, имеют, частично общие детали обработки, такие как энтропийное кодирование, обратное квантование, фильтрация устранения блочности и предсказание, скомпенсированное по движению. Детали обработки для совместного использования могут включать в себя использование модуля ех902 обработки декодирования, который соответствует MPEG-4 AVC. В отличие от этого, выделенный модуль ех901 обработки декодирования может использоваться для другой обработки, которая является уникальной для аспекта настоящего изобретения и не соответствует MPEG-4 AVC. Поскольку аспект настоящего изобретения характеризуется энтропийным декодированием, в частности, например, выделенный модуль ех901 обработки декодирования используется для энтропийного декодирования. В противном случае, модуль обработки декодирования может совместно использоваться для одного из обратного квантования, фильтрации устранения блочности и компенсации движения или всей обработки. Модуль обработки декодирования для реализации способа декодирования движущегося изображения, описанного в каждом из вариантов осуществления, может совместно использоваться для совместно используемой обработки, и выделенный модуль обработки декодирования может быть использован для обработки уникальной для MPEG-4 AVC.[0303] In order to solve this problem, a configuration is proposed in which a decoding processing unit for implementing the moving picture decoding method described in each of the embodiments and a decoding processing unit that conforms to a conventional standard such as MPEG-2, MPEG-4 AVC and VC-1 are partially shared. Ex900 in Fig. 58A shows an example of such a configuration. For example, the moving picture decoding method described in each of the embodiments and the moving picture decoding method that conforms to MPEG-4 AVC have partially common processing details such as entropy coding, inverse quantization, deblocking filtering and motion compensated prediction. The processing details for shared use may include using the decoding processing unit ex902 that conforms to MPEG-4 AVC. In contrast, the dedicated decoding processing unit ex901 may be used for other processing that is unique to the aspect of the present invention and does not correspond to MPEG-4 AVC. Since the aspect of the present invention is characterized by entropy decoding, in particular, for example, the dedicated decoding processing unit ex901 is used for entropy decoding. Otherwise, the decoding processing unit may be shared for one of inverse quantization, deblocking filtering and motion compensation or all processing. The decoding processing unit for implementing the moving picture decoding method described in each of the embodiments may be shared for shared processing, and the dedicated decoding processing unit may be used for processing unique to MPEG-4 AVC.
[0304] Кроме того, ех1000 на фиг. 58B показывает еще один пример, того, что обработка частично разделена. Этот пример использует конфигурацию, включающую в себя выделенный модуль ех1001 обработки декодирования, который поддерживает обработку, уникальную для аспекта настоящего изобретения, выделенный модуль ех1002 обработки декодирования, который поддерживает обработку, уникальную для другого общепринятого стандарта, и модуль ех1003 обработки декодирования, который поддерживает обработку, совместно используемую между способом декодирования движущегося изображения в соответствии с аспектом настоящего изобретения и обычным способом декодирования движущегося изображения. Здесь, выделенные модули ех1001 и ех1002 обработки декодирования не обязательно специализированы для обработки в соответствии с аспектом настоящего изобретения и обработки общепринятого стандарта, соответственно, и могут быть любыми, допускающими реализацию общей обработки. Кроме того, конфигурация настоящего варианта осуществления может быть реализована посредством БИС ех500.[0304] Furthermore, ex1000 in Fig. 58B shows another example that the processing is partially divided. This example uses a configuration including a dedicated decoding processing unit ex1001 that supports the processing unique to an aspect of the present invention, a dedicated decoding processing unit ex1002 that supports the processing unique to another conventional standard, and a decoding processing unit ex1003 that supports the processing shared between the moving picture decoding method according to an aspect of the present invention and the conventional moving picture decoding method. Here, the dedicated decoding processing units ex1001 and ex1002 are not necessarily specialized for the processing according to the aspect of the present invention and the processing of the conventional standard, respectively, and may be any capable of implementing the common processing. Furthermore, the configuration of the present embodiment can be implemented by the LSI ex500.
[0306] Таким образом, уменьшение степени интеграции БИС и снижение стоимости возможны за счет совместного использования модуля обработки декодирования для обработки, совместно используемой между способом декодирования движущегося изображения в соответствии с аспектом настоящего изобретения и способом декодирования движущегося изображения в соответствии с общепринятым стандартом.[0306] Thus, a reduction in the degree of integration of the LSI and a reduction in cost are possible by sharing the decoding processing module for the processing shared between the moving image decoding method according to an aspect of the present invention and the moving image decoding method according to a conventional standard.
[0306] Промышленная применимость[0306] Industrial applicability
Настоящее изобретение может быть применено к способам кодирования изображения, способам декодирования изображения, устройствам кодирования изображения и устройствам декодирования изображений. Настоящее изобретение также применимо к устройствам отображения информации высокого разрешения или устройствам формирования изображений, таким как телевизоры, цифровые видеомагнитофоны, автомобильные навигационные системы, портативные телефоны, цифровые камеры, каждое из которых включает в себя устройство кодирования изображения.The present invention can be applied to image encoding methods, image decoding methods, image encoding devices and image decoding devices. The present invention is also applicable to high-resolution information display devices or image forming devices, such as televisions, digital video recorders, car navigation systems, portable telephones, digital cameras, each of which includes an image encoding device.
Перечень ссылочных позицийList of reference positions
[0307][0307]
100 устройство кодирования изображения100 image encoding device
101 модуль разделения на блоки кодирования101 Coding Block Division Module
102 модуль вычитания102 subtraction module
103 модуль преобразования103 Conversion Module
104 модуль кодирования c переменной длиной слова104 Variable Length Coding Module
105, 202 модуль обратного преобразования105, 202 inverse transform module
106, 203 модуль суммирования106, 203 summation module
107, 205 память кадров107, 205 frame memory
108 модуль предсказания108 prediction module
121 входное изображение121 input images
122 блок кодирования122 coding block
123, 126, 223 дифференциальный блок123, 126, 223 differential block
124, 222 коэффициент частоты (коэффициент)124, 222 frequency coefficient (coefficient)
125, 221 кодированный поток125, 221 coded stream
127, 224 декодированный блок127, 224 decoded block
128, 225, 226 декодированное изображение128, 225, 226 decoded image
129 блок предсказания129 prediction block
131 модуль разделения на блоки коэффициентов131 module of division into blocks of coefficients
132 модуль кодирования significant_flag132 module encoding significant_flag
133, 133А модуль кодирования уровня133, 133A level coding module
134 модуль кодирования sign_flag134 coding module sign_flag
141 модуль установки greater1_flag141 module install greater1_flag
142 модуль установки greater2_flag142 greater2_flag installation module
143, 143А модуль установки остатка143, 143A residual installation module
144, 248 модуль обновления параметра бинаризации144, 248 binarization parameter update module
145, 145А, 241, 241А модуль выбора наборов контекста145, 145A, 241, 241A context set selection module
146, 243 память greater1_flag146, 243 memory greater1_flag
147, 242 модуль выбора контекста greater1_flag147, 242 context selection module greater1_flag
148, 244 память контекста greater1_flag148, 244 greater1_flag context memory
149, 245 модуль выбора контекста greater2_flag149, 245 context selection module greater2_flag
150, 246 память контекста greater2_flag150, 246 greater2_flag context memory
151 модуль арифметического кодирования151 arithmetic coding module
152 модуль бинаризации остатка152 Residue Binarization Module
153 модуль определения префикса-суффикса153 Prefix-Suffix Definition Module
154 модуль вывода бина суффикса154 suffix bin output module
155 модуль вывода бина префикса155 Bin Prefix Output Module
160, 260 модуль переключения greater_flag160, 260 greater_flag switching module
200 устройство декодирования изображения200 image decoding device
201 модуль декодирования c переменной длиной слова201 variable length decoding module
204 модуль объединения декодированных блоков204 decoded block merging module
231 модуль декодирования significant_flag231 decoding module significant_flag
232, 232А модуль декодирования уровня232, 232A level decoding module
233 модуль декодирования sign_flag233 sign_flag decoding module
234 модуль декодирования коэффициента234 Coefficient Decoding Module
247, 247А модуль арифметического декодирования247, 247A arithmetic decoding module
249 модуль многозначного остатка249 module of multi-valued remainder
250 модуль декодирования префикса250 Prefix Decoding Module
251 модуль декодирования суффикса251 Suffix Decoding Module
252 модуль объединения префикса-суффикса252 Prefix-Suffix Merge Module
Claims (13)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US61/663,121 | 2012-06-22 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2023129546A Division RU2815733C1 (en) | 2012-06-22 | 2023-11-15 | Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding and decoding device |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2827404C1 true RU2827404C1 (en) | 2024-09-25 |
Family
ID=
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020114529A1 (en) * | 2001-02-22 | 2002-08-22 | Matsushita Graphic Communication Systems, Inc. | Arithmetic coding apparatus and image processing apparatus |
US20060028359A1 (en) * | 2004-08-05 | 2006-02-09 | Samsung Electronics Co., Ltd. | Context-based adaptive binary arithmetic coding method and apparatus |
JP2007142637A (en) * | 2005-11-16 | 2007-06-07 | Matsushita Electric Ind Co Ltd | Image information encoder |
RU2324302C1 (en) * | 2005-10-19 | 2008-05-10 | Самсунг Электроникс Ко., Лтд. | Method for encoding flags in layer using interlayer correlation, method and device for decoding encoded flags |
US20090263036A1 (en) * | 2006-11-28 | 2009-10-22 | Panasonic Corporation | Encoding device and encoding method |
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020114529A1 (en) * | 2001-02-22 | 2002-08-22 | Matsushita Graphic Communication Systems, Inc. | Arithmetic coding apparatus and image processing apparatus |
US20060028359A1 (en) * | 2004-08-05 | 2006-02-09 | Samsung Electronics Co., Ltd. | Context-based adaptive binary arithmetic coding method and apparatus |
RU2324302C1 (en) * | 2005-10-19 | 2008-05-10 | Самсунг Электроникс Ко., Лтд. | Method for encoding flags in layer using interlayer correlation, method and device for decoding encoded flags |
JP2007142637A (en) * | 2005-11-16 | 2007-06-07 | Matsushita Electric Ind Co Ltd | Image information encoder |
US20090263036A1 (en) * | 2006-11-28 | 2009-10-22 | Panasonic Corporation | Encoding device and encoding method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7003100B2 (en) | Image decoding method and image decoding device | |
KR102134367B1 (en) | Image coding method, image decoding method, image coding device, image decoding device, and image coding/decoding device | |
KR102060617B1 (en) | Video image encoding method, video image encoding device, video image decoding method, and video image decoding device | |
CA2825767C (en) | Image coding method, image decoding method, image coding apparatus and image decoding apparatus | |
WO2012108205A1 (en) | Picture encoding method, picture encoding device, picture decoding method, picture decoding device and picture encoding decoding device | |
TWI580254B (en) | A moving picture coding method, a moving picture coding apparatus, a moving picture decoding method, a moving picture decoding apparatus, and a moving picture coding / decoding apparatus | |
JP6210368B2 (en) | Image decoding method and image decoding apparatus | |
CA2841107C (en) | Image encoding and decoding using context adaptive binary arithmetic coding with a bypass mode | |
RU2827404C1 (en) | Method of transmitting bit stream over network | |
RU2815733C1 (en) | Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding and decoding device | |
RU2808610C1 (en) | Image coding method, image decoding method, image coding device, image decoding device and image coding and decoding device | |
RU2794163C2 (en) | Image coding method, image decoding method, image coding device, image decoding device and image coding and decoding device | |
JP2016146556A (en) | Image coding method, image decoding method, image coding device and image decoding device |