FR2683968A1 - Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. - Google Patents
Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. Download PDFInfo
- Publication number
- FR2683968A1 FR2683968A1 FR9114226A FR9114226A FR2683968A1 FR 2683968 A1 FR2683968 A1 FR 2683968A1 FR 9114226 A FR9114226 A FR 9114226A FR 9114226 A FR9114226 A FR 9114226A FR 2683968 A1 FR2683968 A1 FR 2683968A1
- Authority
- FR
- France
- Prior art keywords
- format
- image
- images
- coding
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/587—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
L'invention concerne un procédé de codage/décodage d'images vidéo numériques. Elle concerne également un codeur et un décodeur permettant de mettre œuvre le procédé. Le procédé consiste au codage, à passer d'un format d'image CIF au format quart de CIF (QCIF) et vice versa et à réaliser une interpolation sur les images QCIF pour les mémoriser sous la forme d'images CIF afin d'une part de pouvoir réaliser les traitements de compression au codage et d'autre part, de visualiser des images CIF après décodage. Application à la visiophonie, à la visioconférence, à la télévision.
Description
PROCEDE DE CODAGE/DECODAGE D'IMAGES VIDEO
NUMERIQUES ET CODEUR/DECODEUR PERMETTANT
DE METTRE EN OEUVRE LE PROCEDE
DESCRIPTION
L'invention concerne un procédé de codage d'images vidéo numériques, de décodage de ces images, un codeur et un décodeur permettant de mettre en oeuvre le procédé.
NUMERIQUES ET CODEUR/DECODEUR PERMETTANT
DE METTRE EN OEUVRE LE PROCEDE
DESCRIPTION
L'invention concerne un procédé de codage d'images vidéo numériques, de décodage de ces images, un codeur et un décodeur permettant de mettre en oeuvre le procédé.
L'invention s 'applique à la transmission d'images vidéo numériques pour notamment la télévision, la visioconférence, la visiophonie.
Les procédés de codage concernant de telles applications ont pour objet de traiter les images en vue de comprimer Le volume de données à transmettre pour représenter ces images.
Le codage des images est réalisé en temps réel et les images sont transmises à partir d'un réseau de transmission numérique, notamment un réseau numérique commuté tel que le réseau numérique à intégration de services (RNIS).
L'invention s'applique tout particulièrement à la transmission d'images visiophoniques à partir du réseau numérique à intégration de services qui offre deux voies de transmission à 64 Kbit/s pour l'accès de base.
Différentes techniques de compression sont aujourd'hui connues et permettent de transmettre des images animées (de télévision ou vi siophoniques) à partir du réseau numérique commuté.
On pourra se reporter à L'article "L'écho des Recherches" NO 140 du deuxième trimestre 1990 pour plus de précisions sur les différentes techniques de compression existantes.
On pourra également se reporter aux documents EP-A-2 0844270, EP-A-2 0123456 et US-4 185188, dans lesquels sont décrits différents systèmes de codage d'images.
On pourra également se reporter à l'article de "L'écho des Recherches" NO 140 précédemment cité pour la description de la norme H 261, norme internationale qui couvre les débits allant de 48 Kbit/s à 2 Mbit/s et prévoit deux formats d'images
CIF et quart de CIF. Les formats d'images qui ont été retenus pour cette norme tiennent compte des problèmes de l'interfonctionnement entre régions du monde qui possèdent des standards de télévisions différents (Europe : 625 lignes/50 Hz, Amérique du Nord et
Japon :525 lignes/60Hz). Le format CIF correspond à un format commun intermédiaire et le format QCIF correspond à un format réduit au quart et défini comme étant la base minimum et obligatoire du service.
CIF et quart de CIF. Les formats d'images qui ont été retenus pour cette norme tiennent compte des problèmes de l'interfonctionnement entre régions du monde qui possèdent des standards de télévisions différents (Europe : 625 lignes/50 Hz, Amérique du Nord et
Japon :525 lignes/60Hz). Le format CIF correspond à un format commun intermédiaire et le format QCIF correspond à un format réduit au quart et défini comme étant la base minimum et obligatoire du service.
On rappelle toutefois que le CIF (Common
Intermediate Format) est défini par :
- 352 points x 288 lignes pour le signal de luminance,
- 176 points x 144 lignes pour les signaux de chrominance,
- 30/k images/s (format non entrelacé) ; k=1,2,3 ou 4.
Intermediate Format) est défini par :
- 352 points x 288 lignes pour le signal de luminance,
- 176 points x 144 lignes pour les signaux de chrominance,
- 30/k images/s (format non entrelacé) ; k=1,2,3 ou 4.
Le QCIF (quart de CIF) correspond à une réduction par deux du nombre de points et de lignes
- 176 points x 144 lignes pour le signal de luminance,
- 88 points x 72 lignes pour les signaux de chrominance,
- 30/k images par seconde (format non entrelacé) ; k= 1, 2, 3 ou 4.
- 176 points x 144 lignes pour le signal de luminance,
- 88 points x 72 lignes pour les signaux de chrominance,
- 30/k images par seconde (format non entrelacé) ; k= 1, 2, 3 ou 4.
Le format CIF donne des images d'assez bonne définition et est utilisé avec des écrans de grande taille (de 20 à 60 cm de diagonale).
Le format QCIF produit des images plus fLoues et est réservé à des écrans de 12 à 20 cm de diagonale, observés à une distance d'environ 60 cm.
On a pensé jusqu'à présent naturel d'associer le format d'images CIF à la visioconférence et à la visiophonie professionnelle et le format d'images QCIF à la visiophonie grand public, pour laquelle le coût de l'écran est un élément important du coût total d'un visiophone.
Pour les installations déjà mises en place, au moment de l'établissement d'une communication les terminaux (visiophones) échangent leur capacité et déclarent s'ils peuvent ou veulent travailler en format
CIF ou QCIF. De par la norme H 261, le matériel existant doit assurer le minimum, c'est-à-dire doit être capable de fonctionner en mode QCIF à la fréquence image de 7,5 Hz. Le décodeur à la norme H 261 placé dans le matériel permet ce service.
CIF ou QCIF. De par la norme H 261, le matériel existant doit assurer le minimum, c'est-à-dire doit être capable de fonctionner en mode QCIF à la fréquence image de 7,5 Hz. Le décodeur à la norme H 261 placé dans le matériel permet ce service.
Un terminal à la norme H 261 qui est prévu pour fonctionner en mode CIF peut fonctionner de façon automatique en mode QCIF. Ce choix du mode est réalisé à L'établissement d'une communication une fois pour toutes. Jusqu'à présent il n'a jamais été envisagé de passer du mode CIF au mode QCIF et vice versa, au cours d'une communication. C'est ce que s'est proposé de faire la demanderesse afin d'exploiter au mieux les performances du matériel existant.
Cependant, la demanderesse s'est heurtée à un problème lié aux techniques de compression répondant à la norme H 261 et qui font appel à un algorithme de prédiction à prédiction temporelle car en effet, la prédiction d'une image est fournie principalement par la précédente. Lorsqu'une image est traitée en mode CIF et la suivante en mode QCIF, ou vice versa, il y a un problème de taille d'image pour faire coincider l'image nouvelle avec sa prédiction.
La présente invention a pour but de résoudre ce problème et d'une façon générale de résoudre le problème du passage d'un premier format quel qu'il soit à un deuxième format réduit par rapport au premier et vice versa, changement de format opéré lors du passage d'une image à une autre.
La présente invention a pour objet un procédé de codage d'images vidéo numériques par un codeur permettant de réaliser un traitement des images, pour réduire le volume d'informations à transmettre et les transmettre selon un premier format d'images, ces traitements comportant une succession d'étapes dont l'une consiste à réaliser une prédiction de manière à ne traiter et ne transmettre que la différence entre une image et sa prédiction, caractérisé en ce qu'il comporte les étapes suivantes
- changer de format d'images avant codage, d'une image à l'autre, de manière à transmettre cette image selon soit le premier format, soit le deuxième format réduit par rapport au premier,
- réaliser une interpolation sur les images se trouvant dans le deuxième format pour les enregistrer sous la forme d'images conformes au premier format de manière à disposer des images sous ce premier format pour les étapes de prédiction,
- réaliser les autres étapes de traitement sur la différence obtenue après prédiction dans le format de l'image en cours et transmettre dans ce format.
- changer de format d'images avant codage, d'une image à l'autre, de manière à transmettre cette image selon soit le premier format, soit le deuxième format réduit par rapport au premier,
- réaliser une interpolation sur les images se trouvant dans le deuxième format pour les enregistrer sous la forme d'images conformes au premier format de manière à disposer des images sous ce premier format pour les étapes de prédiction,
- réaliser les autres étapes de traitement sur la différence obtenue après prédiction dans le format de l'image en cours et transmettre dans ce format.
L'invention a également pour objet un procédé de décodage vidéo numérique consistant à recevoir des images numériques selon un premier format, ce format pouvant être modifié en cours de transmission d'une image à l'autre pour correspondre à un deuxième format réduit par rapport au premier et consistant en cours du décodage d'une image se trouvant selon le deuxième format, à réaliser une interpolation de l'image pour obtenir et enregistrer cette image selon le premier format, afin de la visualiser dans ce format.
L'invention a également pour objet un codeur d'images vidéo numériques comprenant une mémoire d'images d'entrée recevant des images numériques selon un premier ou un deuxième format, le deuxième format étant un format réduit par rapport au premier, des moyens de compression comprenant une boucle de prédiction comportant une mémoire d'images, principalement caractérisé en ce qu'il comporte en outre des moyens de changement de format d'images permettant de passer du premier format au deuxième format, un interpolateur en amont de la mémoire d'images permettant d'interpoler les images afin de les enregistrer dans la mémoire d'images selon le premier format, la mémoire étant lue selon le premier ou le deuxième format.
L'invention a également pour objet un décodeur d'images vidéo numériques recevant des images numériques selon un premier ou un deuxième format, le deuxième format étant un format réduit par rapport au premier, ce décodeur comprenant une mémoire tampon d'entrée, des moyens de décompression comportant une boucle de reconstitution de l'image incluant une mémoire, principalement caractérisé en ce qu'il comporte un interpolateur en amont de la mémoire, permettant d'interpoLer les images qui se trouvent selon le deuxième format afin de les enregistrer dans la mémoire selon le premier format et de les visualiser dans ce format -
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description faite à titre d'exemple non limitatif, à partir des dessins sur lesquels ::
- la figure la représente un schéma de principe d'un décodeur permettant de mettre en oeuvre le procédé conforme à l'invention,
- la figure lb représente un schéma détaillé d'un codeur conforme à l'invention,
- la figure 2 représente un schéma détaillé d'un décodeur conforme à l'invention,
- la figure 3a schématise une image au format CIF en mémoire,
- la figure 3b schématise une image au format QCIF en mémoire,
- la figure 4 schématise un macrobloc après interpolation conformément à l'invention et qualifié de format ICIF,
- la figure Sa représente un sous-bloc d'un macrobloc au format QCIF,
- la figure 5b représente un sous-bloc d'un macrobloc au format ICIF,
- la figure 6 schématise une image QCIF interpolée.
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description faite à titre d'exemple non limitatif, à partir des dessins sur lesquels ::
- la figure la représente un schéma de principe d'un décodeur permettant de mettre en oeuvre le procédé conforme à l'invention,
- la figure lb représente un schéma détaillé d'un codeur conforme à l'invention,
- la figure 2 représente un schéma détaillé d'un décodeur conforme à l'invention,
- la figure 3a schématise une image au format CIF en mémoire,
- la figure 3b schématise une image au format QCIF en mémoire,
- la figure 4 schématise un macrobloc après interpolation conformément à l'invention et qualifié de format ICIF,
- la figure Sa représente un sous-bloc d'un macrobloc au format QCIF,
- la figure 5b représente un sous-bloc d'un macrobloc au format ICIF,
- la figure 6 schématise une image QCIF interpolée.
Avant de procéder à la description détaillée de l'invention, on rappelle quelques considérations générales portant sur le codage d'images vidéo numériques.
Comme cela a déjà été précisé, on exploite au maximum la redondance temporelle de L'image dans les systèmes de codage actuels, le codage d'une image se faisant en tenant compte de L'image précédente.
Un premier type de codage connu, appelé codage inter-image, consiste à comparer l'image à coder à l'image précédente et à ne transmettre après codage que les informations relatives à la partie de l'image qui est en mouvement.
Un autre type de codage connu, appelé codage par estimation du mouvement, consiste à anticiper le mouvement de L'image en estimant une image au vu de L'image précédente et à ne transmettre que des informations relatives à la différence entre cette image estimée et l'image effectivement reçue.
On rappelle également que de manière classique le système de codage d'images comprend un moyen de transformation pour appliquer une opération de transformation à ladite image telle qu'une transformée en cosinus discrète. Cette opération de transformation traduit l'image du domaine spatial dans un domaine dit fréquentiel. L'opération de transformation peut précéder ou suivre le codage inter-image ou par estimation de mouvement appliqué à L'image.
On rappelle également qu'en pratique une image est divisée en une pluralité de blocs avant d'être traitée soit par le codage inter-image ou par estimation de mouvement, soit par l'opérateur de transformation.
Ceci permet de mieux cerner les parties de l'image qui sont modifiées entre deux images successives et donc de réduire le débit envoyé sur le réseau de transmission, puisque seules ces parties modifiées sont codées et transmises.
Cette transmission consiste d'ailleurs dans le cas d'une image par estimation de mouvement, à émettre, pour chaque bloc en mouvement, un vecteur de déplacement indiquant le déplacement du bloc entre
L'image précédente et L'image courante.
L'image précédente et L'image courante.
Il est usuel de décomposer les images en blocs identiques de taille couramment utilisée telle que 8 x 8 pixels, 16 x 16 pixels et parfois 32 x 32 pixels. Les ensembles de taille 16 x 16 pixels sont généralement appelés macroblocs de luminance et les ensembles de 8 x 8 sont généralement appelés blocs ou sous-blocs ; un macrobloc pour la luminance est formé de quatre blocs.
Une image au format CIF est constituée de 22 x 18 = 396 macroblocs Chaque macrobloc est constitué de six blocs, quatre blocs provenant du signal de luminance et deux blocs provenant des signaux de chrominance.
En raison de la définition plus faible de la chrominance, des blocs de 8 x 8 de couleur occupent la même surface que des macroblocs 16 x 16 de luminance.
Une image au format QCIF est, elle, constituée de Il x 9 = 99 macroblocs.
Le procédé de codage conforme à L'invention consiste à changer de format d'images avant codage d'une image à l'autre, de manière à transmettre cette image selon soit un premier format donné, soit un deuxième format réduit par rapport à ce premier format.
Le procédé consiste, dans le cas où l'on est passé du premier format au format réduit, à réaliser une interpolation sur les images se trouvant dans ce deuxième format, pour les mémoriser sous la forme d'images conformes au premier format. Les images sont lues pour être transmises soit dans le premier format, soit dans le deuxième, selon le format dans lequel on opère.
Les images ainsi interpolées seront qualifiées d'images au format ICIF dans la suite de la description. Ces images au format ICIF sont utilisées dans la partie de traitement consistant à réaliser une prédiction d'images telle que définie précédemment ; les autres étapes de traitement portant sur la différence obtenue après prédiction sont réalisées dans le format des images en cours et transmises ainsi dans ce format.
L'étape de changement de format d'une image avant codage s'obtient en opérant une lecture sélective des points de cette image enregistrés dans une mémoire d'entrée du codeur. Selon l'exemple pratique de réalisation qui est donné dans la suite, le premier format est le format CIF, le deuxième format est le format QCIF.
Lorsque deux images successives sont lues selon le format QCIF, la première image ayant été interpolée et enregistrée après interpolation selon le format CIF, l'étape de prédiction qui consiste à réaliser la différence entre la prédiction et la deuxième image et l'image elle-même est obtenue en réalisant une lecture des points non interpolés de
L'image de prédiction et comparaison à la deuxième mage.
L'image de prédiction et comparaison à la deuxième mage.
Lorsqu'une image est lue selon le format
QCIF et que L'image suivante est lue selon le format
CIF, l'étape de prédiction est obtenue en réalisant une lecture des points non interpolés et interpolés de L'image de prédiction et comparaison à la deuxième image.
QCIF et que L'image suivante est lue selon le format
CIF, l'étape de prédiction est obtenue en réalisant une lecture des points non interpolés et interpolés de L'image de prédiction et comparaison à la deuxième image.
Le schéma de la figure la représente un codeur conforme à l'invention. Ce codeur comporte une mémoire d'entrée 1 suivie de moyens de compression 2, de multiplexage 3, d'une mémoire tampon 5 et de moyens de régulation 6. La mémoire tampon 5 permet d'envoyer les signaux sur le réseau de transmission et de commander les moyens de régulation 6. Les moyens de régulation agissent en fonction de la commande qu'ils reçoivent sur les moyens de compression 2.
Ce codeur comporte en outre une boucle de prédiction 7 reliée à un interpolateur 8. L'interpolateur est relié à une mémoire d'images 9 qui est reliée à la boucle de prédiction 7, pour lui fournir les images de prédiction.
Lors de l'acquisition des images vidéo, ces images sont enregistrées dans la mémoire 1, puis codées au moyen des moyens de compression 2, pour être ensuite multiplexées par le multiplexeur vidéo 3 qui construit un train numérique à partir des données fournies par le système de codage.
La mémoire tampon 5 permet d'ajuster le débit des informations issues du système de codage à celui du réseau. La mémoire tampon agit sur les moyens de régulation 6 lorsqu'elle est saturée, de manière à obtenir une régulation du débit des données. Les fonctions de compression, multiplexage et régulation sont des fonctions connues de l'état de la technique.
Conformément à l'invention, un interpolateur 8 est prévu en amont de la mémoire d'images 9, mémoire dans laquelle est enregistrée chaque image reconstruite servant à réaliser l'étape de prédiction.
La fonction de l'interpolateur va être décrite dans la suite à partir des schémas des figures 3a, 3b, 4, Sa et 5b.
La figure 3a représente une image CIF en mémoire. Cette image est constituée pour la luminance de 352 points et de 288 lignes. L'image est divisée en macroblocs de taille 16 x 16.
La figure 3b représente une image QCIF en mémoire. L'image comporte pour la luminance 176 points et 144 lignes. L'image est divisée en macroblocs de 16 x 16.
La figure 4 représente un macrobloc ICIF de 32 x 32, constitué de quatre blocs 16 x 16 en luminance. Ce macrobloc ICIF est obtenu après l'opération d'interpolation.
Après interpolation, un macrobloc QCIF recouvre quatre macroblocs CIF. Un macrobloc ICIF a donc une taille de 32 x 32. Le passage d'un macrobloc
QCIF vers un macrobloc ICIF se fait sur la base des blocs de 8 x 8 qui constituent les macroblocs de la façon suivante (on se reporte pour cela aux schémas des figures 3a, Sa et 5b)
- la figure Sa représente un bloc 8 x 8 d'un macrobloc QCIF,
- la figure 5b représente un bloc 16 x 16 d'un macrobloc ICIF.
QCIF vers un macrobloc ICIF se fait sur la base des blocs de 8 x 8 qui constituent les macroblocs de la façon suivante (on se reporte pour cela aux schémas des figures 3a, Sa et 5b)
- la figure Sa représente un bloc 8 x 8 d'un macrobloc QCIF,
- la figure 5b représente un bloc 16 x 16 d'un macrobloc ICIF.
On appel le a (i,j) un point d'un bloc 8 x 8 d'un macrobloc QCIF, i allant de 1 à 8 et j allant de 1 à 8.
On appelle b(k,l) un point du bloc 16 x 16 d'un macrobloc ICIF, k allant de 1 à 16 et l allant de 1 à 16.
L'interpolation se fait comme suit b(k,l)=a[(k+1)/2,(l+1)/2] pour k et l impairs, b(k,l)=a(k/2,(l+1)/2)+a((k/2)+1,(L+1)/2))/2 pour k pair différent de 16 et l impair ; b(16,l)=b(15,l) b(k,L)=Ea((k+1)/2,l/2)+a((k+1)/2,(l/2)+1))/2 pour k impair et l pair différent de 16 ; b(k,16)=b(k,15)
4xb(k,l) =
Ea(k/2,l/2)+a( (k/2)+1),l/2)+a(k/2,(l/2)+1)+a( (k/2)+1,(l/2)+îj pour k et l pairs différents de 16 ;
b(16,[)=[b(16,[-1)+b(16,@+1)]2 , l pair
b(k,16)=[b(k-1,16) +b(k+1,16)]/2 , k pair
Le passage d'un macrobloc ICIF vers un macrobloc QCIF se fait de la façon suivante
a(i,j)=b(2i-1,2j-1) ; i=1 à 8 et j=1 à 8
Conformément à l'invention, on obtient donc une image ICIF à la même taille que l'image CIF, comme on peut le voir sur la figure 6 et sur la figure 3a.
4xb(k,l) =
Ea(k/2,l/2)+a( (k/2)+1),l/2)+a(k/2,(l/2)+1)+a( (k/2)+1,(l/2)+îj pour k et l pairs différents de 16 ;
b(16,[)=[b(16,[-1)+b(16,@+1)]2 , l pair
b(k,16)=[b(k-1,16) +b(k+1,16)]/2 , k pair
Le passage d'un macrobloc ICIF vers un macrobloc QCIF se fait de la façon suivante
a(i,j)=b(2i-1,2j-1) ; i=1 à 8 et j=1 à 8
Conformément à l'invention, on obtient donc une image ICIF à la même taille que l'image CIF, comme on peut le voir sur la figure 6 et sur la figure 3a.
La figure 6 correspond à une image QCIF devenue ICIF après interpolation. Cette opération correspond à une dilatation de l'image QCIF de la figure 3b ; elle coïncide avec l'image CIF de la figure 3a.
L'image ICIF comporte 352 points dont un point sur deux provient de l'image QCIF et 288 lignes dont une ligne sur deux provient de l'image QCIF. Les autres points et les autres lignes sont obtenus au moyens de l'interpolation.
On vient de décrire une façon particulière de réaliser l'interpolation à partir des blocs de taille 8 x 8, ce choix étant fait pour rendre homogène le traitement entre la luminance et la chrominance. Il est tout à fait possible de faire cette interpolation sur la base des macrobiocs 16 x 16 pour la luminance.
Les points impairs du bloc ICIF sont rigoureusement identiques à ceux du bloc QCIF. On pourrait tout aussi bien choisir les points pairs.
L'important est que le bloc QCIF soit contenu dans le bloc ICIF par les points pairs ou impairs.
Les autres points ont été interpolés de façon relativement simple dans l'exemple qui est décrit, en utilisant les moyennes des points les plus proches.
Une interpolation plus simple (répétition) ou plus complexe est bien entendu envisageable.
Pour obtenir le point b1,2 on a donc réalisé
la moyenne entre les points al,l et a1,2 ; pour obtenir
le point b2,1 on a réalisé la moyenne entre le point a1,1 et le point a2,1 ; pour obtenir le point b2,2 on a réalisé la moyenne entre les points a1,1 , a1,2, a2,1 et a2,2. Les derniers points ont été répétés.
la moyenne entre les points al,l et a1,2 ; pour obtenir
le point b2,1 on a réalisé la moyenne entre le point a1,1 et le point a2,1 ; pour obtenir le point b2,2 on a réalisé la moyenne entre les points a1,1 , a1,2, a2,1 et a2,2. Les derniers points ont été répétés.
En effet, on a choisi pour le point b16,1 de répéter le point ag,1 ; pour le point b1,16 de répéter le point a1,g. Bien entendu, d'autres solutions peuvent être envisagées.
La figure lb représente de façon plus détaillée et schématique un codeur conforme à
L'invention. Les mêmes éléments portent les mêmes références entre la figure la et cette figure lb.
L'invention. Les mêmes éléments portent les mêmes références entre la figure la et cette figure lb.
Ce schéma permet de mieux illustrer les moyens de compression et la boucle de prédiction qui est de type à prédiction temporelle avec compensation de mouvement, telle que l'on peut en trouver une description dans l'article "l'Echo des Recherches" précédemment cité.
Conformément à l'invention, ce codeur comporte un interpolateur 8 entre la sortie de cette boucle et la mémoire d'images 9. L'opération d'interpolation qui vient d'être décrite ne perturbe en rien l'opérateur de compensation de mouvement. Cet opérateur réalise les calculs dans le mode QCIF entre deux images réduites de 99 macroblocs chacune, celle d'entrée et celle issue de la mémoire de boucle. De cette dernière, lue au format ICIF, L'opérateur de compensation de mouvement ne conserve que la partie QCIF (les points impairs dans le cas qui a été décrit).
De la même façon, l'application du filtre dans La boucle n'opère que sur les points QCIF des blocs ICI F.
Le changement de mode de fonctionnement format CIF en format QCIF, tel que le propose le procédé conforme à l'invention, respecte entièrement la norme
H 261. Les images QCIF occupent simplement autant de place en mémoire interne que les images CIF après leur extension au format ICIF.
H 261. Les images QCIF occupent simplement autant de place en mémoire interne que les images CIF après leur extension au format ICIF.
La figure 2 représente le schéma d'un décodeur conforme à l'invention. Ce décodeur comporte en entrée une mémoire 20 suivie d'un ensemble de traitement permettant de reconstruire l'image et portant la référence 21, d'une mémoire d'images 22 et d'un interpolateur 23. L'ensemble 21 comporte de manière classique un démultiplexeur 22, suivi d'un opérateur 23 réalisant la fonction inverse de la fonction de codage à longueur variable CLV'1 opérée par le codeur qui lui envoie les signaux d'entrée, suivi d'un opérateur réalisant la fonction de quantification inverse Q1, suivi d'un opérateur réalisant la transformée en cosinus inverse T'1 des opérations réalisées par le codeur. Cet ensemble 21 comporte en outre un filtre de boucle F et des moyens de compensation de mouvement CV agissant sur le démultiplexeur.
Le décodeur permet ainsi de reconstruire chaque image à partir du signal d'entrée qui lui arrive par le réseau. L'interpolateur 23 permet de mémoriser l'image reconstruite lorsque cette image se trouve au format QCIF sous la forme d'une image au format
CIF, utilisée pour la visualisation. Les traitements se font sur la base de L'image au format QCIF lorsque l'image en entrée se trouve dans ce format.
CIF, utilisée pour la visualisation. Les traitements se font sur la base de L'image au format QCIF lorsque l'image en entrée se trouve dans ce format.
En ce qui concerne les changements de format, ces changements peuvent être obtenus de deux façons.
En effet, le changement de format peut être donné par le codeur lui-même lorsque sa mémoire tampon 5 de sortie sature.
De façon classique, la saturation de la mémoire tampon 5 provoque une commande des moyens de régulation, de manière par exemple à augmenter le pas de quantification et de sous-échantillonnage temporel.
Conformément à L'invention, lorsque la mémoire tampon continuera à être saturée après ces deux actions par exemple, les moyens de régulation commanderont le changement de format par une lecture de la mémoire 1 selon le mode QCIF.
Cela consiste à opérer à une lecture sélective des points images enregistrés dans cette mémoire d'entrée.
Le changement de format peut avoir lieu également par exemple lorsqu'un ordre transmis par le réseau a été reçu par le codeur, cet ordre ayant été donné par le décodeur distant avec lequel ce codeur est en communication.
Lorsque le codeur fonctionne en mode CIF et que le mouvement de l'image devient très important, ce codeur a donc la possibilité, comme cela a déjà été décrit, d'agir grâce aux moyens de régulation de manière à laisser paraître des défauts de codage dus à une augmentation du pas de quantification ou à un sous-échantillonnage temporel de la séquence d'images, c'est-à-dire de traiter moins d'images par seconde, ce qui va en pratique introduire un saccadé et un retard dans la transmission.
On choisira donc conformément au procédé de l'invention de passer en mode QCIF en cas de fort mouvement de L'image, L'image devenant plus floue, mais uniquement pour ce qui concerne les parties en mouvement.
Ce flou devient un avantage dans la mesure où il permet de tromper l'oeil et où il permet d'éviter
Le saccadé et le retard de la transmission.
Le saccadé et le retard de la transmission.
En effet, dès lors qu'une image a été codée en CIF, l'arrière-plan fixe reste codé finement (CIF), même s' il y a mouvement d'une partie de cette image (celle qui représentera le personnage dans le cas d'un visiophone) et passage en QCIF pour la partie codée.
D'une image à l'autre tous les macroblocs ne sont pas recodés, seuls ceux correspondant à la partie en mouvement le sont.
Dans le cas du visiophone, le fond fixe n'est pas recodé à chaque image, seules les informations qui représentent le personnage en mouvement sont transmises. Si donc le décor derrière le personnage a été codé une fois en CIF, i i conservera sa netteté.
Seuls le personnage et la partie découverte du fond seront codés et donc rendus flous temporairement si ce codage a lieu en QCIF.
Le changement de format CIF, QCIF sur la base d'une image à la suivante permet donc des stratégies de régulation plus riches, dans la mesure où cette technique permet de jouer sur le flou de la partie en mouvement et d'éviter les défauts de codage qui apparaissent dans ces cas.
Cette technique, qui vient d'être décrite, vient donc s'ajouter aux méthodes de régulation de débit habituelles par augmentation du pas de quantification et par sous-échantillonnage temporel.
Claims (14)
1. Procédé de codage d'images vidéo numériques par un codeur permettant de réaliser un traitement des images pour réduire le volume d'informations à transmettre et les transmettre selon un premier format d'image, ces traitements comportant une succession d'étapes dont l'une consiste à réaliser une prédiction, de manière à ne traiter et ne transmettre que la différence entre une image et sa prédiction, caractérisé en ce qu'il comporte les étapes suivantes
- changer de format d'image avant codage, d'une image à l'autre, de manière à transmettre cette image selon soit le premier format, soit un deuxième format réduit par rapport au premier,
- réaliser une interpolation sur les images se trouvant dans le deuxième format pour les enregistrer sous la forme d'images conformes au premier format de manière à disposer des images sous ce premier format pour les étapes de prédiction,
- réaliser les autres étapes de traitement sur la différence obtenue après prédiction dans le format de l'image en cours et transmettre dans ce format
2. Procédé de codage d'images vidéo selon la revendication 1, caractérisé en ce que L'étape de changement de format d'une image s'obtient par une lecture sélective des points de cette image enregistrés dans une mémoire.
3. Procédé de codage d'images vidéo selon les revendications précédentes, caractérisé en ce que lorsque deux images successives sont lues selon le deuxième format, la première ayant été interpolée et enregistrée après interpolation selon le premier format, l'étape de prédiction qui consiste à réaliser la différence entre la prédiction de la deuxième image et l'image elle-m8me, est obtenue en réalisant une lecture des points non interpolés de l'image de prédiction et comparaison à la deuxième image.
4. Procédé de codage d'images vidéo selon les revendications 1 à 3, caractérisé en ce que lorsqu'une image est lue selon le deuxième format et que l'image suivante est lue selon le premier format, l'étape de prédiction est obtenue en réalisant une lecture des points non interpolés et interpolés de l'image de prédiction et comparaison à la deuxième image.
5. Procédé de codage selon l'une quelconque des revendications précédentes, caractérisé en ce que le premier format est de type format commun intermédiaire (CIF) et en ce que le deuxième format est un format réduit au quart de CIF.
6. Procédé de codage selon l'une quelconque des revendications précédentes, caractérisé en ce que l'image ayant été divisée pour Les traitements en macroblocs, chaque macrobloc étant divisé en blocs constitués d'une matrice de points au format QCIF, l'interpolation consiste à avoir interposé une ligne et une colonne de points entre chaque ligne et entre chaque colonne de la matrice au format QCIF pour obtenir un bloc d'image au format CIF.
7. Procédé de codage selon L'une quelconque des revendications précédentes, caractérisé en ce que le codage des images vidéo est réalisé en temps réel par le codeur pour être transmises par un réseau de transmission vers un décodeur.
8. Procédé de codage selon l'une quelconque des revendications précédentes, caractérisé en ce que le changement de format a lieu lorsqu'un ordre est donné par le codeur lui-même.
9. Procédé de codage selon l'une quelconque des revendications précédentes, caractérisé en ce que le changement de format a lieu lorsqu'un ordre transmis par le réseau a été reçu.
10. Procédé de codage selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il consiste à transmettre les images au moyen d'un réseau de transmission à bas débit.
11. Procédé de décodage d'images vidéo numériques, caractérisé en ce qu'il consiste à recevoir des images numériques selon un premier format, ce format pouvant être modifié en cours de transmission d'une image à l'autre et correspondre à un deuxième format réduit par rapport au premier et caractérisé en ce qu'il consiste, en cours du décodage d'une image se trouvant selon le deuxième, à réaliser une interpolation de L'image pour obtenir et enregistrer cette image selon le premier format afin de la visualiser dans ce format.
12. Codeur d'images vidéo numériques comprenant une mémoire d'image d'entrée (1) recevant des images numériques selon un premier ou un deuxième format, le deuxième format étant un format réduit par rapport au premier, des moyens de compression (2) comprenant une boucle de prédiction (7) comportant une mémoire d'images (9), caractérisé en ce qu'il comporte en outre :
- des moyens de changement du format d images (6) permettant de passer du premier format à un deuxième format réduit par rapport au premier,
- un interpolateur (8) placé en amont de la mémoire d'images permettant d'interpoler les images afin de les enregistrer dans la mémoire d'images selon
le premier format.
13. Codeur d'images selon la revendication 12 comportant des moyens de régulation (6), une mémoire tampon de sortie (5), des moyens de quantification (Q), des moyens de codage à longueur variable (CLV), caractérisé en ce que les moyens de changement de format (6) sont réalisés par les moyens de régulation sur commande de la mémoire tampon de sortie (5).
14. Décodeur d'images vidéo numériques comprenant une mémoire tampon d'entrée (20), des moyens de décompression (21) comportant une boucle de reconstitution de l'image incluant une mémoire (22), caractérisé en ce qu'il comporte un interpolateur (23) en amont de la mémoire permettant d'interpoler les images qui se trouvent selon le deuxième format afin de les enregistrer dans la mémoire selon le premier format et les visualiser dans ce format.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9114226A FR2683968B1 (fr) | 1991-11-19 | 1991-11-19 | Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. |
PCT/FR1992/001072 WO1993010633A1 (fr) | 1991-11-19 | 1992-11-19 | Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en ×uvre le procede |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9114226A FR2683968B1 (fr) | 1991-11-19 | 1991-11-19 | Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2683968A1 true FR2683968A1 (fr) | 1993-05-21 |
FR2683968B1 FR2683968B1 (fr) | 1998-07-03 |
Family
ID=9419086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9114226A Expired - Fee Related FR2683968B1 (fr) | 1991-11-19 | 1991-11-19 | Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. |
Country Status (2)
Country | Link |
---|---|
FR (1) | FR2683968B1 (fr) |
WO (1) | WO1993010633A1 (fr) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4691233A (en) * | 1986-09-30 | 1987-09-01 | Rca Corporation | Rate buffer control of difference signal decimation and interpolation for adaptive differential pulse code modulator |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3833538A1 (de) * | 1988-10-01 | 1990-04-05 | Bosch Gmbh Robert | Gegenseheinrichtung |
-
1991
- 1991-11-19 FR FR9114226A patent/FR2683968B1/fr not_active Expired - Fee Related
-
1992
- 1992-11-19 WO PCT/FR1992/001072 patent/WO1993010633A1/fr active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4691233A (en) * | 1986-09-30 | 1987-09-01 | Rca Corporation | Rate buffer control of difference signal decimation and interpolation for adaptive differential pulse code modulator |
Non-Patent Citations (3)
Title |
---|
IEEE COMMUNICATIONS MAGAZINE vol. 28, no. 2, Février 1990, NEW YORK, US pages 30 - 38; MING L. LIOU: 'Visual Telephony as an ISDN Application' * |
NTT REVIEW vol. 2, no. 3, Mai 1990, TOKYO, JP pages 110 - 117; SAKAE OKUBO ET AL.: 'International Standardization of Video Codecs for ISDN Videoconferencing and Videophone Services' * |
SIGNAL PROCESSING IMAGE COMMUNICATION vol. 2, no. 2, Août 1990, AMSTERDAM, NE pages 109 - 116; A. NAGATA ET AL.: 'Moving Picture Coding System for Digital Storage Media Using Hybrid Coding' * |
Also Published As
Publication number | Publication date |
---|---|
FR2683968B1 (fr) | 1998-07-03 |
WO1993010633A1 (fr) | 1993-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0448491B1 (fr) | Procédé de codage et de transmission à au moins deux niveaux de qualité d'images numériques appartenant à une séquence d'images, et dispositifs correspondants | |
EP0558377B1 (fr) | Codec vidéo, notamment visiophonique | |
EP0449715A1 (fr) | Dispositif de codage/décodage de signaux d'image | |
WO2007020230A2 (fr) | Procede de codage et de decodage d'images video avec echelonnabilite spatiale | |
EP0418952B1 (fr) | Dispositif de codage d'informations bidimensionnelles et dispositif de décodage correspondant | |
EP1354482A1 (fr) | Procede de codage et de decodage d'images, dispositifs, et applications correspondants | |
EP0347325B1 (fr) | Procédé et installation de diffusion de programmes de télévision haute définition compatible | |
FR2670348A1 (fr) | Dispositif de codage d'images appartenant a une sequence d'images, a rearrangement des lignes avant transformation mathematique, systeme de transmission d'images, recepteur et procede de codage correspondants. | |
EP0368400A1 (fr) | Codage, décodage et système de transmission d'images de télévision | |
EP0337565B1 (fr) | Dispositif de codage de signaux représentatifs d'une suite d'images et système de transmission d'images de télévision à haute définition incluant un tel dispositif | |
FR3087309A1 (fr) | Optimisation d'un sous-echantillonnage intervenant avant le codage d'images en compression | |
EP0365090B1 (fr) | Dispositif de doublement du rythme de signaux de télévision, et décodeur d'images de télévision comprenant un tel dispositif | |
FR2683968A1 (fr) | Procede de codage/decodage d'images video numeriques et codeur/decodeur permettant de mettre en óoeuvre le procede. | |
FR2886787A1 (fr) | Procede et dispositif de codage et de decodage d'une sequence d'images | |
FR2809572A1 (fr) | Codage video de source avec prediction du mouvement et filtrage des effets de blocs | |
FR2634086A1 (fr) | Dispositif de sous-echantillonnage temporel et d'interpolation temporelle compensee en mouvement dans une sequence d'images entrelacees, utilisation d'un tel dispositif dans les dispositifs de codage et de decodage d'un systeme de transmission d'images de television a haute definition, et dispositifs de codage et de decodage pour un tel systeme | |
FR2759524A1 (fr) | Procede et dispositif de codage par estimation de luminance | |
WO2014096638A1 (fr) | Procédé et dispositif de transmission d'une séquence d'images basé sur un codage région adaptatif | |
FR2638926A1 (fr) | Procede, dispositif de codage numerique d'images de tele a haute definition; dispositif de decodage correspondant, systeme de transmission d'images equipe d'un etage d'emission et d'un de reception incluant un tel dispositif de codage ou de decodage; etages d'emission et de reception comprenant de tels dispositifs | |
FR2646047A1 (fr) | Procede et installation de codage et de transmission d'images animees sous forme numerique a bas debit | |
FR2646576A1 (fr) | Systeme d'emission-reception pour la transmission d'images couleur animees et du son a partir de canaux independants | |
FR2654285A1 (fr) | Systeme de compression d'images numeriques appartenant a une sequence d'images, a quantification adaptative en fonction d'une information psychovisuelle. | |
WO1993002526A1 (fr) | Procede de compression de sequences d'images numeriques | |
FR2652214A1 (en) | Device for coding information intended to be transmitted and/or stored after data rate reduction | |
WO2016059196A1 (fr) | Decodeur, procede et systeme de decodage de flux multimedia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ST | Notification of lapse |
Effective date: 20100730 |