[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2000049525A1 - Method and system for storing at least one image and its associated relational information - Google Patents

Method and system for storing at least one image and its associated relational information Download PDF

Info

Publication number
WO2000049525A1
WO2000049525A1 PCT/DE2000/000386 DE0000386W WO0049525A1 WO 2000049525 A1 WO2000049525 A1 WO 2000049525A1 DE 0000386 W DE0000386 W DE 0000386W WO 0049525 A1 WO0049525 A1 WO 0049525A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
information
relational information
objects
relational
Prior art date
Application number
PCT/DE2000/000386
Other languages
German (de)
French (fr)
Inventor
André KAUP
Jörg Heuer
Original Assignee
Siemens Aktiengesellschaft
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Aktiengesellschaft filed Critical Siemens Aktiengesellschaft
Publication of WO2000049525A1 publication Critical patent/WO2000049525A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/27Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding involving both synthetic and natural picture components, e.g. synthetic natural hybrid coding [SNHC]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7837Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using objects detected or recognised in the video content

Definitions

  • the invention relates to a method and an arrangement for storing at least one image by a computer.
  • a method for image compression with the associated arrangement is known from [1].
  • the known method serves as a coding method in the MPEG standard and is essentially based on the hybrid DCT (Discrete Cosine Transformation) with motion compensation.
  • a similar procedure is used for video telephony with nx 64kbit / s (CCITT recommendation H.261), for TV contribution (CCR recommendation 723) with 34 or 45Mbit / s and for multimedia applications with 1.2Mbit / s (ISO-MPEG-1) is used.
  • the hybrid DCT consists of a temporal processing stage, which takes advantage of the relationship between successive images, and a local processing stage, which uses correlation within an image.
  • the local processing essentially corresponds to the classic DCT coding.
  • the image is broken down into blocks of 8x8 pixels, each using
  • DCT can be transformed into the frequency domain.
  • the result is a matrix of 8x8 coefficients, which approximately reflect the two-dimensional spatial frequencies in the transformed image block.
  • a coefficient with frequency 0 (DC component) represents an average gray value of the image block.
  • a second step of data reduction takes the form of an adaptive quantization, by means of which the amplitude accuracy of the coefficients is further reduced or by which the small amplitudes are set to zero.
  • Quantization depends on the fill level of the output buffer: If the buffer is empty, fine quantization takes place, so that more data is generated, while if the buffer is full, it is coarser, which reduces the amount of data.
  • variable-length coding VLC
  • a further compression gain is obtained through the temporal processing (Interfra e coding).
  • a lower data rate is required for coding differential images than for the original images, because the amplitude values are much lower.
  • the motion information is transmitted with the image information, usually only one motion vector per macroblock (e.g. four 8x8 image blocks) is used.
  • the coder also has a temporal recursion loop, because the predictor must calculate the prediction value from the values of the (coded) images already transmitted.
  • An identical time recursion loop is in the decoder, so that the encoder and decoder are completely synchronized.
  • I-pictures There are three main methods in the MPEG-2 coding method with which images can be processed: I-pictures: No temporal prediction is used for the I-pictures, ie the picture values are directly transformed and encoded. I-pictures are used in order to be able to start the decoding process again without knowing the past, or to achieve a resynchronization in the event of transmission errors.
  • a temporal prediction is made based on the P-pictures, the DCT is based on the temporal
  • B-pictures With the B-pictures, the temporal bidirectional prediction error is calculated and then transformed.
  • the bidirectional prediction works basically adaptively, i.e. forward prediction, backward prediction or interpolation are permitted.
  • the distance between the P-pictures is denoted by m, where there are m-1 B-pictures between the P-pictures.
  • the MPEG syntax leaves it up to the user to choose m and n.
  • [2] discloses a method for estimating movement in the context of a method for block-based image coding. It is assumed that a digitized image has pixels which are combined in m image blocks of 8x8 pixels or 16x16 pixels. If necessary, an image block can also comprise several image blocks. An example of this is a macro block with 6 picture blocks, of which 4 picture blocks for Brightness information and 2 image blocks for color information are provided.
  • a value for an error measure is determined.
  • a sum is preferably determined via the amounts of the differences from the coding information associated with the pixels of the image block and the previous image block.
  • Coding information here means brightness information (luminance value) and / or color information (chrominance value), each of which is assigned to a pixel. "In a search space of predeterminable size and shape around the starting position in the previous image, a value of the error measure is determined for an area of the same size of the previous image block, shifted by one or half an image point.
  • Picture block is assumed that this previous picture block best matches the picture block of the picture to be encoded for which the motion estimation is to be performed.
  • the result of the movement estimation is a
  • Compression of the image data is achieved in that the motion vector and the error signal are encoded.
  • the motion estimation is carried out for each image block of an image.
  • the object of the invention is to make an image data stream searchable with regard to the information contained in the image data.
  • a method for storing at least one image by a computer is specified, in which relational information associated with the at least one image is stored.
  • This relational information can in particular be stored together with the at least one image.
  • a reference pointer, pointer
  • the relational information can in particular be stored together with the at least one image.
  • a reference pointer, pointer
  • a further development consists in that the -relational information is determined before the storage.
  • relational information is a feature information and a
  • Reference information between objects and / or images includes.
  • the feature information provides e.g. Information about a movement feature, the reference information creates the link to the object or image for which the feature information is relevant.
  • relational information identifies information relating to a predefined relationship between two objects, wherein on the one hand the information for the type of relationship (feature information) and the objects involved in the relationship (reference formation) can be combined in the relational information.
  • the association of the relational information with the image can be realized in such a way that a reference to the relational information is stored. It is not necessary to use the same memory for the information and the image data. A division over any storage locations is possible, preferably a link information (pointer) is stored, on the basis of which the actual information can be found.
  • a link information pointer
  • a further development consists in the fact that the at least one picture is a sequence of several pictures.
  • relational information When storing images, additional information, referred to here as relational information, is accordingly determined and stored with the images.
  • the type of relational information explained below enables a later search for certain image data.
  • the search preferably takes place in the data of the relational information (s), the image data, which is preferably in compressed form do not need to be specially restored.
  • This search at a high level of abstraction "red car drives from left to right through the picture", specific pictures, here the red car, can be found.
  • red car drives from left to right through the picture specific pictures, here the red car
  • Image compression can in particular be based on an image compression standard, e.g. an MPEG or an H.26x standard.
  • an image compression standard e.g. an MPEG or an H.26x standard.
  • a further development consists in the relational information comprising at least one of the following options:
  • motion information (especially between objects) can be determined automatically from image data.
  • objects can be identified in a picture; the picture itself is hierarchical (comparable to a tree structure).
  • the hierarchical relationships of the objects to one another can be supplemented by movement information between the respective objects. This movement information identifies the relative movement of the connected objects.
  • the total movement (relative and absolute) of all objects existing and relevant in the picture results from the complete hierarchical structure.
  • the hierarchical structure of the image (or the scene) can be given according to different specifications: An example is an "included-in" relationship, that is, the hierarchical structure indicates which objects are (at least partially) contained in other objects. Other examples of hierarchical division of the scene are also possible.
  • b) Distance information is also possible.
  • the distance information between objects can be determined and stored.
  • the distance can be determined, for example, on the basis of an edge boundary or a center of gravity of an object. The distances between the multiple objects in the scene are fully described.
  • the type or degree of overlap between objects is recorded as relational information.
  • the sum of the overlaps results in the arrangement of the objects within the scene.
  • any relationship between objects and / or images can be used as relational information.
  • the hierarchical arrangement of the objects of a scene described above can take place according to the chosen relationship.
  • transformation information over time can also serve as relational information.
  • objects / images are preferably transformed over a predetermined period of time, the transformation yielding values that provide average values of the movement over time.
  • Such an average is obtained, for example, by means of a discrete cosine transformation (DCT).
  • DCT discrete cosine transformation
  • the relational information can be determined in particular between two images or between two objects of an image, taking into account the change in the relational information over time (for example movement information).
  • an image or a scene can comprise a large number of objects which are connected to one another and whose position changes differently over time.
  • the relational information can be determined between two objects according to their hierarchical arrangement. Alternatively, the relational information can also be determined based on absolute information (e.g. absolute coordinates within the image). From the absolute information, the information of the objects to each other emerges and vice versa.
  • the relational information is added to a feature set using an image compression method.
  • the image compression process is particularly standardized. Examples are an MPEG standard or an H.26x standard.
  • the method described can preferably be used in the context of encoding using an image compression method.
  • a further development consists in that image data which have been stored according to the described method can be accessed selectively by means of suitable
  • Relational information is implemented. For example, the movement information between objects that is stored in the feature set can be searched and found in a targeted manner. This makes it possible to search for the red car that moves from left to right through an image mentioned at the beginning. It should be pointed out that the search itself can use the relational information described by the method based on different functionality. This enables an "intelligent" evaluation of the different information within an application-specific search. Relational information alone enables the search in image data that otherwise do not have any searchable features.
  • Fig.l a scene that is hierarchically divided into three objects
  • 4 is a sketch illustrating a transmitter and receiver for image compression
  • 5 shows a sketch with an image encoder and an image decoder in greater detail
  • FIG. 7 shows an alternative embodiment for storing object-related image data.
  • FIG. 1 shows a hierarchical structure consisting of a square 101, a rectangle 102 and a triangle 103 in the form of a tree diagram.
  • triangle 103 correspond to an "included-in" relation, i.e. the square 101 contains both the rectangle
  • FIG.2. 2 comprises a scene which is shown in different forms 201, 202, 203 and 204 over time.
  • Fig.l are present in every temporal version of the scene.
  • the square 101 moves from its starting position 205 downward to the left 206, further downward 207 and then to the right 208.
  • the rectangle 102 remains unchanged during the changes over time (indicated by arrows 217, 218 and 219) Position at top left (see positions 209, 210, 211 and 212).
  • the triangle 103 is also contained in the square 101 and moves gradually from an initial position 213 in the different time steps 217 to 219 (see positions 214, 215 and 216).
  • the relations 104 and 105 from FIG. 1 can thus be expanded by the time step
  • the relative change in position per time step is preferably specified using the parameters translation (along the coordinate axes), rotation and zoom.
  • FIG. 3 shows a possibility for storing image data, in particular dividing an image into objects, e.g. according to the MPEG-4 standard.
  • a sequence 301 of image data for an object 1 and a sequence 302 of image data for an object 2 are shown
  • Feature set which contains both intrinsic data 303 and 305 (e.g. shape and color of the object) and relational information 304 and 306.
  • the relation is preferably also supplemented by a reference 315 or 316 (pointer).
  • This reference represents the linking of the hierarchically structured objects.
  • object 1 corresponds to square 101 and object 2 corresponds to rectangle 102.
  • Arrow 316 indicates the relation "contains” and arrow 315 indicates that
  • the change in position between object 1 and object 2 for sequences 301 and 302 is also stored in the fields for relational information 304 and 306, respectively.
  • the object-related data 307 to 310 (for object 1) or 311 to 314 (for object 2) determine the respective sequences 301 and 302. Relational information is determined and stored for these sequences, in particular each sequence is interpreted as a "global" movement, i.e. for the
  • FIG. 1 shows an arrangement which comprises two computers and a camera, with image coding, transmission of the image data and image decoding being illustrated.
  • a camera 1101 is connected to a first computer 1102 via a line 1119.
  • the camera 1101 transmits captured images 1104 to the first computer 1102.
  • the first computer 1102 has a first processor unit 1103, which is connected via a bus 1118 to an image memory 1105.
  • the image coding methods are carried out with the processor unit 1103 of the first computer 1102.
  • Image data 1106 encoded in this way is transmitted from the first computer 1102 to a second computer 1108 via a communication link 1107, preferably a line or a radio link.
  • the second computer 1108 contains a second processor unit 1109 which is connected to the image memory 1111 via a bus 1110. Methods for image decoding are carried out on the second processor unit 1109.
  • Both the first computer 1102 and the second computer 1108 each have a screen 1112 or 1113 on which the image data 1104 are visualized.
  • Input units are provided for operating both the first computer 1102 and the second computer 1108, preferably a keyboard 1114 or 1115, and a computer mouse 1116 or 1117.
  • the image data 1104, which are transmitted from the camera 1101 to the first computer 1102 via the line 1119, are preferably data in the time domain, while the data 1106 which are transmitted from the first computer 1102 to the second computer 1108 via the communication link 1107, Image data are in the spectral range.
  • the decoded image data is displayed on a screen 1120.
  • FIG. 5 shows a sketch of an arrangement for carrying out a block-based image coding method.
  • a video data stream to be encoded with chronologically successive digitized images is fed to an image coding unit 1201.
  • the digitized images are divided into macro blocks 1202, each
  • Macroblock has 16x16 pixels.
  • the macro block 1202 comprises 4 picture blocks 1203, 1204, 1205 and 1206, each picture block containing 8x8 picture elements to which luminance values (brightness values) are assigned.
  • each macro block 1202 comprises two chrominance blocks 1207 and 1208 with chrominance values (color information, color saturation) assigned to the pixels.
  • luminance value, first chrominance value and second chrominance value are referred to as color values.
  • the image blocks are fed to a transformation coding unit 1209.
  • a transformation coding unit 1209 In the case of differential image coding, values to be coded from image blocks of temporally preceding images are subtracted from the image blocks currently to be coded; only the difference formation information 1210 of the transformation coding unit (discrete cosine
  • the current macro block 1202 is communicated to a motion estimation unit 1229 via a connection 1234.
  • Spectral coefficients 1211 are formed in the transformation coding unit 1209 for the picture blocks or difference picture blocks to be coded and are fed to a quantization unit 1212.
  • This Quantization unit 1212 corresponds to the quantization device according to the invention.
  • Quantized spectral coefficients 1213 become both a scan unit 1214 and an inverse
  • Quantization unit 1215 fed in a reverse path.
  • entropy coding is carried out on the scanned spectral coefficients 1232 in an entropy coding unit 1216 provided for this purpose.
  • the entropy-coded spectral coefficients are transmitted as coded image data 1217 via a channel, preferably a line or a radio link, to a decoder.
  • Spectral coefficients 1218 obtained in this way are fed to an inverse transformation coding unit 1219 (inverse discrete cosine transformation, IDCT).
  • Reconstructed coding values (also differential coding values) 1220 are supplied to an adder 1221 in the differential image mode.
  • the adder 1221 also receives coding values of an image block which result from a temporally preceding image after motion compensation has already been carried out. The adder 1221 is used to reconstruct
  • Image blocks 1222 are formed and stored in an image memory 1223.
  • Chrominance values 1224 of the reconstructed image blocks 1222 become one from the image memory 1223
  • Motion compensation unit 1225 supplied.
  • an interpolation takes place in an interpolation unit 1227 provided for this purpose. Based on the interpolation, the number of brightness values contained in the respective image block is preferably doubled.
  • All brightness values 1228 are both the motion compensation unit 1225 and the Motion estimation unit 1229 supplied.
  • the motion estimation unit 1229 also receives the image blocks of the macro block to be coded in each case (16x16 pixels) via the connection 1234. This takes place in the motion estimation unit 1229
  • Motion estimation taking into account the interpolated brightness values ("motion estimation on a half-pixel basis").
  • motion estimation on a half-pixel basis absolute differences between the individual brightness values are preferably determined in the macro block 1202 currently to be coded and in the reconstructed one
  • Macroblock determined from the previous image.
  • the result of the motion estimation is a motion vector 1230, by means of which a local displacement of the selected macroblock from the temporally previous image to the macroblock 1202 to be coded is expressed.
  • Both brightness information and chrominance information relating to the macroblock determined by the motion estimation unit 1229 are shifted by the motion vector 1230 and subtracted from the coding values of the macroblock 1202 (see data path 1231).
  • the processor unit PRZE comprises a processor CPU, one
  • Memory SPE and an input / output interface IOS which are used in different ways via an interface IFC: output is displayed on a monitor MON and / or output on a printer PRT via a graphic interface. An entry is made using a mouse MAS or a keyboard TAST.
  • the processor unit PRZE also has a data bus BUS, which ensures the connection of a memory MEM, the processor CPU and the input / output interface IOS. Furthermore, additional components can be connected to the data bus BUS, for example additional memory, data storage (hard disk) or scanner.
  • FIG. 7 shows an alternative embodiment to FIG. 3 for storing object-related image data. A sequence 701 of image data for the object 1 and a sequence 702 image data for the object 2 are shown. An intrinsic information belonging to the respective object (shape, color of the object).
  • Object 703 or 704 is stored with object 701 or 702.
  • the relational information 713 is preferably stored separately from the respective objects 701 and 702.
  • Relational information 713 includes feature information 714 relating to the linking of objects 701 and 702, e.g. the movement of the object 1 relative to the object 2.
  • the link itself is established using the reference information 715, 716, which preferably has references to the objects 701 and 702 associated with the feature information 714.
  • the object-related data 705 to 708 or 704 to 712 each determine a sequence belonging to the respective object.
  • the sequence can include any number of images (for the respective object).

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The invention relates to a method for storing at least one image by means of a computing unit, according to which relational information is stored such that it is associated with said at least one image.

Description

Beschreibung description
VERFAHREN UND ANORDNUNG ZUM ABSPEICHERN VON MINDESTENS EINEM BILD MIT ZUGEHÖRIG ER RELATIONALEN INFORMATIONMETHOD AND ARRANGEMENT FOR STORING AT LEAST ONE PICTURE WITH RELATED RELATIONAL INFORMATION
Die Erfindung betrifft ein Verfahren und eine Anordnung zum Abspeichern von mindestens einem Bild durch einen Rechner.The invention relates to a method and an arrangement for storing at least one image by a computer.
Ein Verfahren zur Bildkomprimierung mit dazugehöriger Anordnung ist bekannt aus [1] . Das bekannte Verfahren dient im MPEG-Standard als Codierverfahren und basiert im wesentlichen auf der hybriden DCT (Diskreten Cosinus Transformation) mit Bewegungskompensation. Ein ähnliches Verfahren wird für die Bildtelefonie mit n x 64kbit/s (CCITT- Empfehlung H.261), für die TV-Kontribution (CCR-Empfehlung 723) mit 34 bzw. 45Mbit/s und für Multimedia-Applikationen mit l,2Mbit/s ( ISO-MPEG-1) verwendet. Die hybride DCT besteht aus einer zeitlichen Verarbeitungsstufe, die die Verwandtschaftsbeziehungen aufeinanderfolgender Bilder ausnutzt, und einer örtlichen Verarbeitungsstufe, die die Korrelation innerhalb eines Bildes ausnutzt.A method for image compression with the associated arrangement is known from [1]. The known method serves as a coding method in the MPEG standard and is essentially based on the hybrid DCT (Discrete Cosine Transformation) with motion compensation. A similar procedure is used for video telephony with nx 64kbit / s (CCITT recommendation H.261), for TV contribution (CCR recommendation 723) with 34 or 45Mbit / s and for multimedia applications with 1.2Mbit / s (ISO-MPEG-1) is used. The hybrid DCT consists of a temporal processing stage, which takes advantage of the relationship between successive images, and a local processing stage, which uses correlation within an image.
Die örtliche Verarbeitung (Intraframe-Codierung) entspricht im wesentlichen der klassischen DCT-Codierung. Das Bild wird in Blöcke von 8x8 Bildpunkten zerlegt, die jeweils mittelsThe local processing (intraframe coding) essentially corresponds to the classic DCT coding. The image is broken down into blocks of 8x8 pixels, each using
DCT in den Frequenzbereich transformiert werden. Das Ergebnis ist eine Matrix von 8x8 Koeffizienten, die näherungsweise die zweidimensionalen Ortsfrequenzen im transformierten Bildblock widerspiegeln. Ein Koeffizient mit Frequenz 0 (Gleichanteil) stellt einen mittleren Grauwert des Bildblocks dar.DCT can be transformed into the frequency domain. The result is a matrix of 8x8 coefficients, which approximately reflect the two-dimensional spatial frequencies in the transformed image block. A coefficient with frequency 0 (DC component) represents an average gray value of the image block.
Nach der Transformation findet eine Datenexpansion statt. Allerdings wird in natürlichen Bildvorlagen eine Konzentration der Energie um den Gleichanteil (DC-Wert) stattfinden, während die höchstfrequenten Koeffizienten meist Null sind. In einem nächsten Schritt erfolgt eine spektrale Gewichtung der Koeffizienten, so daß die Amplitudengenauigkeit der hochfrequenten Koeffizienten verringert wird. Hierbei nützt man die Eigenschaften des menschlichen Auges aus, das hohe Ortsfrequenzen weniger genau auflöst als niedrige.After the transformation, data expansion takes place. However, a concentration of energy around the DC component will take place in natural images, while the highest-frequency coefficients are usually zero. In a next step, the coefficients are spectrally weighted, so that the amplitude accuracy of the high-frequency coefficients is reduced. Here one takes advantage of the properties of the human eye, which resolves high spatial frequencies less accurately than low ones.
Ein zweiter Schritt der Datenreduktion erfolgt in Form einer adaptiven Quantisierung, durch die die Amplitudengenauigkeit der Koeffizienten weiter verringert wird bzw. durch die die kleinen Amplituden zu Null gesetzt werden. Das Maß derA second step of data reduction takes the form of an adaptive quantization, by means of which the amplitude accuracy of the coefficients is further reduced or by which the small amplitudes are set to zero. The measure of
Quantisierung hängt dabei vom Füllstand des Ausgangspuffers ab: Bei leerem Puffer erfolgt eine feine Quantisierung, so daß mehr Daten erzeugt werden, während bei vollem Puffer gröber quantisiert wird, wodurch sich die Datenmenge reduziert.Quantization depends on the fill level of the output buffer: If the buffer is empty, fine quantization takes place, so that more data is generated, while if the buffer is full, it is coarser, which reduces the amount of data.
Nach der Quantisierung wird der Block diagonal abgetastet ("zigzag"-Scanning) , anschließend erfolgt eine Entropiecodierung, die eine weitere Datenreduktion bewirkt. Hierfür werden zwei Effekte ausgenutzt:After quantization, the block is scanned diagonally ("zigzag" scanning), followed by entropy coding, which brings about a further reduction in data. Two effects are used for this:
1.) Die Statistik der Amplitudenwerte (hohe Amplitudenwerte treten seltener auf als kleine, so daß den seltenen Ereignissen lange und den häufigen Ereignissen kurze Codewörter zugeordnet werden (Variable-Length-Codierung, VLC) . Auf diese Weise ergibt sich im Mittel eine geringere Datenrate als bei einer Codierung mit fester Wortlänge. Die variable Rate der VLC wird anschließend im Pufferspeicher geglättet.1.) The statistics of the amplitude values (high amplitude values occur less frequently than small ones, so that long code words are assigned to the rare events and short code words to the frequent events (variable-length coding, VLC). This results in a lower data rate on average than with a fixed word length coding. The variable rate of the VLC is then smoothed in the buffer memory.
2.) Man nutzt die Tatsache aus, daß von einem bestimmten Wert an in den meisten Fällen nur noch Nullen folgen. Statt aller dieser Nullen überträgt man lediglich einen EOB-Code (End Of Block) , was zu einem signifikanten Codiergewinn bei der Kompression der Bilddaten führt. Statt der Ausgangsrate von bspw. 512bit sind dann nur 46bιt für diesen Block zu übertragen, was einem Kompressionsfaktor von über 11 entspricht.2.) One takes advantage of the fact that in most cases only zeros follow from a certain value. Instead of all these zeros, only an EOB code (End Of Block) is transmitted, which leads to a significant coding gain in the compression of the image data. Instead of the output rate of 512bit, for example, are then only 46bιt for this block, which corresponds to a compression factor of over 11.
Einen weiteren Kompressionsgewinn erhalt man durch die zeitliche Verarbeitung (Interfra e-Codierung) . Zur Codierung von Differenzbildern wird weniger Datenrate benotigt als für die Origmalbilder, denn die Amplitudenwerte sind weitaus geringer.A further compression gain is obtained through the temporal processing (Interfra e coding). A lower data rate is required for coding differential images than for the original images, because the amplitude values are much lower.
Allerdings sind die zeitlichen Differenzen nur klein, wenn auch die Bewegungen im Bild gering sind. Sind hingegen die Bewegungen im Bild groß, so entstehen große Differenzen, die wiederum schwer zu codieren sind. Aus diesem Grund w rd die Bild-zu-Bild-Bewegung gemessen (Bewegungsschatzung) und vor der Differenzbildung kompensiert (Bewegungskompensation) .However, the time differences are only small, even if the movements in the picture are small. If, on the other hand, the movements in the picture are large, large differences arise, which in turn are difficult to code. For this reason, the picture-to-picture movement is measured (movement estimation) and compensated before the difference is formed (movement compensation).
Dabei wird die Bewegungsinformation mit der Bildmformation übertragen, wobei üblicherweise nur ein Bewegungsvektor pro Makroblock (z.B. vier 8x8-Bιldblocke) verwendet wird.The motion information is transmitted with the image information, usually only one motion vector per macroblock (e.g. four 8x8 image blocks) is used.
Noch kleinere Amplitudenwerte der Differenzbilder werden erhalten, wenn statt der verwendeten Pradiktion eine bewegungskompensierte bidirektionale Pradiktion benutzt wird.Even smaller amplitude values of the difference images are obtained if a motion-compensated bidirectional prediction is used instead of the prediction used.
Be einem bewegungskompensierten Hybrideoder wird nicht das Bildsignal selbst transformiert, sondern das zeitlicheIn a motion-compensated hybrid, it is not the image signal itself that is transformed, but the temporal one
Differenzsignal. Aus diesem Grund verfugt der Coder auch über eine zeitliche Rekursionsschleife, denn der Pradiktor muß den Pradiktionswert aus den Werten der bereits übertragenen (codierten) Bilder berechnen. Eine identische zeitliche Rekursionsschleife befindet sich im Decoder, so daß Coder und Decoder völlig synchronisiert sind.Differential signal. For this reason, the coder also has a temporal recursion loop, because the predictor must calculate the prediction value from the values of the (coded) images already transmitted. An identical time recursion loop is in the decoder, so that the encoder and decoder are completely synchronized.
Im MPEG-2-Codιerverfahren gibt es hauptsächlich drei verschiedene Methoden, mit denen Bilder verarbeitet werden können: I-Bilder: Bei den I-Bildern wird keine zeitliche Pradiktion verwendet, d.h., die Bildwerte werden direkt transformiert und codiert. I-Bilder werden verwendet, um den Decodiervorgang ohne Kenntnis der 7eAlichen Vergangenheit neu beginnen zu können, bzw. um eine Resynchronisation bei Übertragungsfehlem zu erreichen.There are three main methods in the MPEG-2 coding method with which images can be processed: I-pictures: No temporal prediction is used for the I-pictures, ie the picture values are directly transformed and encoded. I-pictures are used in order to be able to start the decoding process again without knowing the past, or to achieve a resynchronization in the event of transmission errors.
P-Bilder: Anhand der P-Bilder wird eine zeitliche Pradiktion vorgenommen, die DCT wird auf den zeitlichenP-pictures: A temporal prediction is made based on the P-pictures, the DCT is based on the temporal
Pradiktionsfehler angewandt.Prediction error applied.
B-Bilder: Bei den B-Bildern wird der zeitliche bidirektionale Pradiktionsfehler berechnet und anschließend transformiert. Die bidirektionale Pradiktion arbeitet grundsätzlich adaptiv, d.h. es wird eine Vorwartspradiktion, eine Ruckwartspradiktion oder eine Interpolation zugelassen.B-pictures: With the B-pictures, the temporal bidirectional prediction error is calculated and then transformed. The bidirectional prediction works basically adaptively, i.e. forward prediction, backward prediction or interpolation are permitted.
Ein Bildsequenz wird bei der MPEG-2-Codιerung m sog. GOPsAn image sequence is used in MPEG-2 coding m so-called GOPs
(Group Of Pictures) eingeteilt, n Bilder von einem I-Bild zum nächsten bilden eine GOP. Der Abstand zwischen den P-Bildern wird mit m bezeichnet, wobei sich jeweils m-1 B-Bilder zwischen den P-Bildern befinden. Die MPEG-Syntax überlaßt es jedoch dem Anwender, wie m und n gewählt werden. m=l bedeutet, daß keine B-Bilder verwendet werden, und n=l bedeutet, daß nur I-Bilder codiert werden.(Group Of Pictures) divided, n pictures from one I picture to the next form a GOP. The distance between the P-pictures is denoted by m, where there are m-1 B-pictures between the P-pictures. The MPEG syntax, however, leaves it up to the user to choose m and n. m = 1 means that no B-pictures are used, and n = 1 means that only I-pictures are encoded.
Aus [2] ist ein Verfahren zur Bewegungsschatzung im Rahmen eines Verfahrens zur blockbasierten Bildcodierung bekannt. Dabei w rd vorausgesetzt, daß ein digitalisiertes Bild Bildpunkte aufweist, die m Bildblocken von insbesondere 8x8 Bildpunkten oder 16x16 Bildpunkten zusammengefaßt sind. Gegebenenfalls kann ein Bildblock auch mehrere Bildblocke umfassen. Ein Beispiel hierfür stellt ein Makroblock mit 6 Bildblocken dar, von denen 4 Bildblocke für Helligkeitsinformation und 2 Bildblöcke für Farbinformation vorgesehen sind.[2] discloses a method for estimating movement in the context of a method for block-based image coding. It is assumed that a digitized image has pixels which are combined in m image blocks of 8x8 pixels or 16x16 pixels. If necessary, an image block can also comprise several image blocks. An example of this is a macro block with 6 picture blocks, of which 4 picture blocks for Brightness information and 2 image blocks for color information are provided.
Bei einer Folge von Bildern wird für ein zu codierendes Bild unter Berücksichtigung der Bildblöcke dieses Bildes wie folgt verfahren:In the case of a sequence of pictures, the following is done for a picture to be coded, taking into account the picture blocks of this picture:
■ Es wird für den Bildblock, für den eine Bewegungsschätzung durchgeführt werden soll, in einem zeitlich vorhergehenden Bild, ausgehend von einem Bildblock, der sich in der gleichen relativen Position in dem vorhergehenden Bild befand■ It is used for the image block for which a motion estimation is to be carried out in a temporally previous image, starting from an image block which was in the same relative position in the previous image
(= vorangegangener Bildblock) , ein Wert für ein Fehlermaß bestimmt. Dazu wird bevorzugt eine Summe über die Beträge der Differenzen von den Bildpunkten zugeordneter Codierungsinformation des Bildblocks und des vorangegangenen Bildblocks bestimmt.(= previous image block), a value for an error measure is determined. For this purpose, a sum is preferably determined via the amounts of the differences from the coding information associated with the pixels of the image block and the previous image block.
Unter Codierungsinformation ist hierbei eine Helligkeitsinformation (Luminanzwert ) und/oder eine Farbinformation (Chrominanzwert) zu verstehen, welche jeweils einem Bildpunkt zugeordnet ist. " In einem Suchraum vorgebbarer Größe und Form um die Ausgangsposition in dem zeitlich vorhergehenden Bild wird jeweils für ein Gebiet derselben Größe des vorangegangenen Bildblocks, verschoben um einen oder einen halben Bildpunkt, ein Wert des Fehlermaßes bestimmt.Coding information here means brightness information (luminance value) and / or color information (chrominance value), each of which is assigned to a pixel. "In a search space of predeterminable size and shape around the starting position in the previous image, a value of the error measure is determined for an area of the same size of the previous image block, shifted by one or half an image point.
In einem Suchraum der Größe nxn-Bildpunkte ergeben sich n (Fehler-) Werte . Es wird derjenige verschobene vorangegangene Bildblock in dem zeitlich vorhergehenden Bild ermittelt, für den das Fehlermaß einen minimalen Fehlerwert ergibt. Für diesen In a search space the size of nxn pixels, there are n (error) values. The shifted previous image block in the temporally preceding image is determined for which the error measure gives a minimum error value. For this
Bildblock wird angenommen, daß dieser vorangegangene Bildblock mit dem Bildblock des zu codierenden Bildes, für den die Bewegungsschätzung durchgeführt werden soll, am besten übereinstimmt. Das Ergebnis der Bewegungsschatzung ist einPicture block is assumed that this previous picture block best matches the picture block of the picture to be encoded for which the motion estimation is to be performed. The result of the movement estimation is a
Bewegungsvektor, mit dem die Verschiebung zwischen dem Bildblock in dem zu codierenden Bild und dem ausgewählten Bildblock in dem zweiltich vorhergehenden Bild beschrieben wird.Motion vector with which the displacement between the picture block in the picture to be coded and the selected picture block is described in the two previous picture.
■ Eine Kompression der Bilddaten wird dadurch erreicht, daß der Bewegungsvektor und das Fehlersignal codiert werden.Compression of the image data is achieved in that the motion vector and the error signal are encoded.
■ Insbesondere wird die Bewegungsschätzung für jeden Bildblock eines Bildes durchgeführt.■ In particular, the motion estimation is carried out for each image block of an image.
Die Anwendung der Bewegungsschätzung im Rahmen der blockbasierten oder objektbasierten Bildcodierung ist in [3] beschrieben.The use of motion estimation in the context of block-based or object-based image coding is described in [3].
In Bilddaten ist es generell - in komprimierten Bilddaten insbesondere - nahezu unmöglich, nach Inhalten zu suchen. Eine solche Suche müßte abstellen auf etwaige Objekte in den Bildsequenzen, die in beschreibender Form nicht vorliegen, sondern ausschließlich Teil des Bilddatenstroms sind.In general, it is almost impossible to search for content in image data - especially in compressed image data. Such a search would have to be based on any objects in the image sequences which are not available in a descriptive form but are only part of the image data stream.
Die Aufgabe der Erfindung besteht darin, einen Bilddatenstrom hinsichtlich der in den Bilddaten enthaltenen Informationen durchsuchbar zu machen.The object of the invention is to make an image data stream searchable with regard to the information contained in the image data.
Diese Aufgabe wird gemäß den Merkmalen der unabhängigen Patentansprüche gelöst. Weiterbildungen der Erfindung ergeben sich auch aus den abhängigen Ansprüchen.This object is achieved in accordance with the features of the independent claims. Further developments of the invention also result from the dependent claims.
Zur Lösung der Aufgabe wird ein Verfahren zum Abspeichern mindestens eines Bildes durch einen Rechner angegeben, bei dem eine relationale Information mit dem mindestens einen Bild assoziiert abgespeichert wird.To achieve the object, a method for storing at least one image by a computer is specified, in which relational information associated with the at least one image is stored.
Diese relationale Information kann insbesondere zusammen mit dem mindestens einen Bild abgespeichert werden. Alternativ kann eine Referenz (Zeiger, Pointer) auf die relationale Information zusammen mit dem Bild abgespeichert werden. Eine Weiterbildung besteht darin, daß die -relationale Information vor dem Abspeichern ermittelt wird.This relational information can in particular be stored together with the at least one image. Alternatively, a reference (pointer, pointer) to the relational information can be stored together with the image. A further development consists in that the -relational information is determined before the storage.
Auch ist es eine Weiterbildung, daß die relationale Information eine Merkmalsinformation und eineIt is also a further development that the relational information is a feature information and a
Bezugsinformation zwischen Objekten und/oder Bildern umfaßt. Die Merkmalsinformation stellt dabei z.B. Information zu einem Bewegungsmerkmal dar, durch die Bezugsinformation wird die Verknüpfung zu dem Objekt bzw. Bild, für die bzw. für das die Merkmalsinformation relevant ist, hergestellt.Reference information between objects and / or images includes. The feature information provides e.g. Information about a movement feature, the reference information creates the link to the object or image for which the feature information is relevant.
Insbesondere kennzeichnet die relationale Information dabei eine Information betreffend eine vorgegebene Beziehung zwischen zwei Objekten, wobei einerseits die Information für die Art der Beziehung (Merkmalsinformation) und die an der Beziehung beteiligten Objekte (Bezugsiformation) in der relationalen Information zusammengefaßt sein können.In particular, the relational information identifies information relating to a predefined relationship between two objects, wherein on the one hand the information for the type of relationship (feature information) and the objects involved in the relationship (reference formation) can be combined in the relational information.
Hierbei sei darauf hingewiesen, daß die Assoziation der relationalen Information mit dem Bild derart realisiert sein kann, daß eine Verweisung auf die relationale Information abgespeichert wird. Es ist nicht notwendig, denselben Speicher für die Information und die Bilddaten zu verwenden. Eine Aufteilung über beliebige Speicherplätze ist möglich, bevorzugt wird eine Verknüpfungsinformation (Pointer) abgespeichert, anhand derer die tatsächliche Information auffindbar ist.It should be pointed out here that the association of the relational information with the image can be realized in such a way that a reference to the relational information is stored. It is not necessary to use the same memory for the information and the image data. A division over any storage locations is possible, preferably a link information (pointer) is stored, on the basis of which the actual information can be found.
Eine Weiterbildung besteht darin, daß das mindestens eine Bild eine Sequenz von mehreren Bildern ist.A further development consists in the fact that the at least one picture is a sequence of several pictures.
Beim Abspeichern von Bildern wird demgemäß eine zusätzliche Information, hier als relationale Information bezeichnet, bestimmt und mit dem Bildern abgespeichert. Die nachfolgend erläuterte Art der relationalen Information ermöglicht eine spätere Suche nach bestimmten Bilddaten. Die Suche findet vorzugsweise in den Daten der relationalen Information (en) statt, die Bilddaten, die bevorzugt in komprimierter Form vorliegen, müssen dabei nicht extra wiederhergestellt werden. Anhand dieser Suche auf hoher Abstraktionsebene "rotes Auto fährt von links nach rechts durch das Bild", können gezielt bestimmte Bilder, hier das rote Auto, gefunden werden. Eine derartige Sυchmöglichkeit in (insbesondere komprimierten) Bilddaten existierte bislang nicht.When storing images, additional information, referred to here as relational information, is accordingly determined and stored with the images. The type of relational information explained below enables a later search for certain image data. The search preferably takes place in the data of the relational information (s), the image data, which is preferably in compressed form do not need to be specially restored. Using this search at a high level of abstraction "red car drives from left to right through the picture", specific pictures, here the red car, can be found. Such a possibility in (in particular compressed) image data has not existed up to now.
Eine Bildkompression kann insbesondere nach einem Bildkompressionsstandard, z.B. einem MPEG- oder einem H.26x- Standard, erfolgen.Image compression can in particular be based on an image compression standard, e.g. an MPEG or an H.26x standard.
Eine Weiterbildung besteht darin, daß die relationale Information mindestens eine der folgenden Möglichkeiten umfaßt :A further development consists in the relational information comprising at least one of the following options:
a) Bewegungsinformation:a) Movement information:
Wie in [2] ausgeführt ist, kann aus Bilddaten automatisch Bewegungsinformation (insbesondere zwischen Objekten) bestimmt werden. Ab MPEG-4 sind Objekte in einem Bild identifizierbar, das Bild selbst ist hierarchisch (vergleichbar einer Baumstruktur) aufgebaut. Die hierarchischen Beziehungen der Objekte zueinander kann um eine Bewegungsinformation zwischen den jeweiligen Objekten ergänzt werden. Diese Bewegungsinformation kennzeichnet die relative Bewegung der verbundenen Objekte. Dabei ergibt sich die Gesamtbewegung (relativ und absolut) aller in dem Bild existierender und relevanter Objekte durch den vollständigen hierarchischen Aufbau. Der hierarchische Aufbau des Bildes (oder der Szene) kann nach unterschiedlichen Vorgaben gegeben sein: Ein Beispiel ist eine "enthalten-in"-Relation, also die hierarchische Struktur gibt an, welche Objekte in anderen Objekten (zumindest teilweise) enthalten sind. Auch andere Beispiele einer hierarchischen Aufteilung der Szene sind möglich. b) Abstandsinformation:As stated in [2], motion information (especially between objects) can be determined automatically from image data. As of MPEG-4, objects can be identified in a picture; the picture itself is hierarchical (comparable to a tree structure). The hierarchical relationships of the objects to one another can be supplemented by movement information between the respective objects. This movement information identifies the relative movement of the connected objects. The total movement (relative and absolute) of all objects existing and relevant in the picture results from the complete hierarchical structure. The hierarchical structure of the image (or the scene) can be given according to different specifications: An example is an "included-in" relationship, that is, the hierarchical structure indicates which objects are (at least partially) contained in other objects. Other examples of hierarchical division of the scene are also possible. b) Distance information:
Anstelle bzw. zusätzlich zu der Bewegungsinformation kann die Abstandsinformation zwischen Objekten bestimmt und abgespeichert werden. Der Abstand kann beispielsweise anhand einer Randbegrenzung oder eines Schwerpunktes eines Objekts bestimmt werden. Anhand der Abstände zwischen den mehreren Objekten der Szene ist dieselbe vollständig beschrieben.Instead of or in addition to the movement information, the distance information between objects can be determined and stored. The distance can be determined, for example, on the basis of an edge boundary or a center of gravity of an object. The distances between the multiple objects in the scene are fully described.
c) Überlappungsinformation:c) Overlap information:
Mit der Überlappungsinformation wird als relationale Information die Art bzw. der Grad der Überlappung zwischen Objekten erfaßt. Die Summe der Überlappungen ergibt die Anordnung der Objekte innerhalb der Szene.With the overlap information, the type or degree of overlap between objects is recorded as relational information. The sum of the overlaps results in the arrangement of the objects within the scene.
d) Information bezüglich einer Beziehung zwischen Objekten und/oder Bildern:d) Information regarding a relationship between objects and / or images:
Allgemein kann jede Beziehung zwischen Objekten und/oder Bildern als relationale Information genutzt werden. Die oben beschriebene hierarchische Anordnung der Objekte einer Szene kann entsprechend der gewählten Beziehung erfolgen.In general, any relationship between objects and / or images can be used as relational information. The hierarchical arrangement of the objects of a scene described above can take place according to the chosen relationship.
Insbesondere bei der Bewegungsinformation können die folgenden Parameter erfaßt werden: Translation (entlang der Koordinatenachse (n) ) , Rotation und Zoom (Vergrößerung / Verkleinerung) des Objekts.The following parameters in particular can be recorded for the movement information: translation (along the coordinate axis (s)), rotation and zoom (enlargement / reduction) of the object.
Ferner kann als relationale Information auch eine Transformationsinformation über der Zeit dienen. In so einem Fall werden bevorzugt Objekte/Bilder über eine vorgegebene Zeitdauer transformiert, wobei die Transformation Werte ergibt, die Mittelwerte der Bewegung über der Zeit liefert. Einen solchen Mittelwert erhält man bspw. mittels Diskreter Cosinus-Transformation (DCT) . Hierbei sei ausdrücklich angemerkt, daß die relationale Information insbesondere zwischen jeweils zwei Bildern oder zwischen jeweils zwei Objekten eines Bildes unter Berücksichtigung der Veränderung der relationalen Information über der Zeit (z.B. Bewegungsinformation) ermittelt werden kann.Furthermore, transformation information over time can also serve as relational information. In such a case, objects / images are preferably transformed over a predetermined period of time, the transformation yielding values that provide average values of the movement over time. Such an average is obtained, for example, by means of a discrete cosine transformation (DCT). It should be expressly noted here that the relational information can be determined in particular between two images or between two objects of an image, taking into account the change in the relational information over time (for example movement information).
Wie oben bereits angeführt wurde, kann ein Bild bzw. eine Szene eine Vielzahl von Objekten umfassen, die miteinander in Verbindung stehen und deren Position sich über der Zeit unterschiedlich verändert. Die relationale Information kann zwischen zwei Objekten entsprechend ihrer hierarchischen Anordnung bestimmt werden. Alternativ kann die relationale Information auch anhand absoluter Information (z.B. absoluter Koordinaten innerhalb des Bildes) bestimmt werden. Aus der absoluten Information geht die Information der Objekte zueinander hervor und umgekehrt.As already mentioned above, an image or a scene can comprise a large number of objects which are connected to one another and whose position changes differently over time. The relational information can be determined between two objects according to their hierarchical arrangement. Alternatively, the relational information can also be determined based on absolute information (e.g. absolute coordinates within the image). From the absolute information, the information of the objects to each other emerges and vice versa.
In einer Ausgestaltung wird die relationale Information zu einem Merkmalssatz nach einem Bildkompressionsverfahren hinzugefügt. Das Bildkompressionsverfahren ist dabei insbesondere standardisiert. Beispiele stellen ein MPEG- Standard oder ein H.26x-Standard dar.In one embodiment, the relational information is added to a feature set using an image compression method. The image compression process is particularly standardized. Examples are an MPEG standard or an H.26x standard.
Das beschriebene Verfahren kann bevorzugt eingesetzt werden im Rahmen des Encoding nach einem Bildkompressionsverfahren.The method described can preferably be used in the context of encoding using an image compression method.
Eine Weiterbildung besteht darin, daß auf Bilddaten, die nach dem beschriebenen Verfahren abgespeichert wurden, selektiv zugegriffen werden kann, indem mittels geeigneterA further development consists in that image data which have been stored according to the described method can be accessed selectively by means of suitable
Suchmechanismen die relationale Information umgesetzt wird. Z.B. kann die Bewegungsinformation zwischen Objekten, die in dem Merkmalssatz abgespeichert ist, gezielt gesucht und gefunden werden. Die eingangs erwähnte Suche nach dem roten Auto, das sich von links nach rechts durch ein Bild bewegt, ist dadurch möglich. Es sei darauf hingewiesen, daß die Suche selbst anhand unterschiedlicher Funktionalität die mit dem Verfahren beschriebenen relationalen Informationen nutzen kann. So ist eine "intelligente" Auswertung der unterschiedlichen Information innerhalb einer anwendungsspezifisch definierten Suche möglich. Allein die relationale Information ermöglicht die Suche in Bilddaten, die ansonsten keinerleich suchbaren Merkmale aufweisen.Search mechanisms that relational information is implemented. For example, the movement information between objects that is stored in the feature set can be searched and found in a targeted manner. This makes it possible to search for the red car that moves from left to right through an image mentioned at the beginning. It should be pointed out that the search itself can use the relational information described by the method based on different functionality. This enables an "intelligent" evaluation of the different information within an application-specific search. Relational information alone enables the search in image data that otherwise do not have any searchable features.
Auch wird zur Lösung der Aufgabe eine Anordnung zumTo solve the problem, an arrangement for
Abspeichern von mindestens einem Bild angegeben, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß eine relationale Information mit dem mindestens einen Bild assoziiert abspeicherbar ist.Saving of at least one image specified, in which a processor unit is provided which is set up in such a way that relational information associated with the at least one image can be stored.
Diese Anordnung ist insbesondere geeignet zur Durchführung des erfindungsgemäßen Verfahrens oder einer seiner vorstehend erläuterten Weiterbildungen.This arrangement is particularly suitable for carrying out the method according to the invention or one of its developments explained above.
Ausführungsbeispiele der Erfindung werden nachfolgend anhand der Zeichnung dargestellt und erläutert.Embodiments of the invention are illustrated and explained below with reference to the drawing.
Es zeigenShow it
Fig.l eine Szene, die hierarchisch in drei Objekte unterteilt ist;Fig.l a scene that is hierarchically divided into three objects;
Fig.2 eine Bildfolge, die eine Szene im Verlauf der Zeit darstellt;2 shows an image sequence which represents a scene over the course of time;
Fig.3 eine Möglichkeit zur Abspeicherung objektbezogener3 shows a possibility for storing object-related
Bilddaten;Image data;
Fig.4 eine Skizze, die einen Sender und Empfänger zur Bildkompression darstellt; Fig.5 eine Skizze mit einem Bildeoder und einem Bilddecoder in höherer Detaillierung;4 is a sketch illustrating a transmitter and receiver for image compression; 5 shows a sketch with an image encoder and an image decoder in greater detail;
Fig.6 eine Prozessoreinheit;6 shows a processor unit;
Fig.7 eine alternative Ausführungsform zur Abspeicherung objektbezogener Bilddaten.7 shows an alternative embodiment for storing object-related image data.
In Fig.l ist eine hierarchische Struktur aus einem Quadrat 101, einem Rechteck 102 und einem Dreieck 103 in Form eines Baumdiagramms dargestellt. Die Verbindungen 104 und 105 zwischen Quadrat 101 und Rechteck 102 bzw. zwischen Quadrat1 shows a hierarchical structure consisting of a square 101, a rectangle 102 and a triangle 103 in the form of a tree diagram. The connections 104 and 105 between square 101 and rectangle 102 and between square, respectively
101 und Dreieck 103 entsprechen einer "enthalten-in"- Relation, d.h. das Quadrat 101 enthält sowohl das Rechteck101 and triangle 103 correspond to an "included-in" relation, i.e. the square 101 contains both the rectangle
102 als auch das Dreieck 103.102 as well as the triangle 103.
Dieser Zusammenhang wird mit Hilfe von Fig.2 veranschaulicht. Fig.2 umfaßt eine Szene, die über der Zeit in unterschiedlichen Ausprägungen 201, 202, 203 und 204 dargestellt ist. Die Objekte der hierarchischen Struktur vonThis relationship is illustrated with the help of Fig.2. 2 comprises a scene which is shown in different forms 201, 202, 203 and 204 over time. The objects of the hierarchical structure of
Fig.l sind jeweils in jeder zeitlichen Ausprägung der Szene vorhanden.Fig.l are present in every temporal version of the scene.
So bewegt sich das Quadrat 101 von seiner Ausgangsposition 205 nach unten links 206, weiter nach unten 207 und dann nach rechts 208. Innerhalb des Quadrats 101 bleibt das Rechteck 102 während der zeitlichen Veränderungen (angedeutet durch die Pfeile 217, 218 und 219) an unveränderter Position oben links (siehe Positionen 209, 210, 211 und 212) . Das Dreieck 103 ist ebenfalls in dem Quadrat 101 enthalten und bewegt sich von einer Ausgangsposition 213 in den unterschiedlichen Zeitschritten 217 bis 219 allmählich nach oben (siehe Positionen 214, 215 und 216) . Die Relationen 104 und 105 aus Fig.l können somit pro Zeitschritt jeweils erweitert werden um dieThus, the square 101 moves from its starting position 205 downward to the left 206, further downward 207 and then to the right 208. Within the square 101, the rectangle 102 remains unchanged during the changes over time (indicated by arrows 217, 218 and 219) Position at top left (see positions 209, 210, 211 and 212). The triangle 103 is also contained in the square 101 and moves gradually from an initial position 213 in the different time steps 217 to 219 (see positions 214, 215 and 216). The relations 104 and 105 from FIG. 1 can thus be expanded by the time step
Bewegungsinformation der beiden verbundenen Objekte Quadrat 101 und Rechteck 102 (für die Verbindung 104) und Quadrat 101 und Dreieck 103 (für die Verbindung 105) . -Bevorzugt wird die relative Veränderung der Position pro Zeitschritt mittels der Parameter Translation (entlang der Koordinatenachsen) , Drehung und Zoom angegeben.Motion information of the two connected objects square 101 and rectangle 102 (for the connection 104) and square 101 and triangle 103 (for connection 105). - The relative change in position per time step is preferably specified using the parameters translation (along the coordinate axes), rotation and zoom.
Hierbei können auch Verfahren zur Bewegungsschätzung, wie einleitend erwähnt, eingesetzt werden.Methods for motion estimation, as mentioned in the introduction, can also be used here.
Fig.3 zeigt eine Möglichkeit zur Abspeicherung von Bilddaten, wobei insbesondere eine Unterteilung eines Bildes in Objekte, z.B. gemäß dem MPEG-4-Standard, vorgenommen wird. Dargestellt sind eine Sequenz 301 von Bilddaten für ein Objekt1 und eine Sequenz 302 von Bilddaten für ein Objekt 2. Die relationale Information, insbesondere zu obigen Ausführungen passende Bewegungsinformation, wird pro Objekt innerhalb eines3 shows a possibility for storing image data, in particular dividing an image into objects, e.g. according to the MPEG-4 standard. A sequence 301 of image data for an object 1 and a sequence 302 of image data for an object 2 are shown
Merkmalssatzes, der sowohl intrinsische Daten 303 bzw. 305 (z.B. Form und Farbe des Objekts) als auch relationale Information 304 bzw. 306 enthält, abgespeichert.Feature set, which contains both intrinsic data 303 and 305 (e.g. shape and color of the object) and relational information 304 and 306.
Vorzugsweise wird die Relation auch um eine Verweisung 315 bzw. 316 (Pointer) ergänzt. Diese Verweisung stellt die Verknüpfung der hierarchisch strukturierten Objekte dar. Im Beispiel von Fig.l entspricht Objektl dem Quadrat 101 und Objekt2 dem Rechteck 102. Der Pfeil 316 kennzeichnet die Relation "enthält" und der Pfeil 315 kennzeichnet dieThe relation is preferably also supplemented by a reference 315 or 316 (pointer). This reference represents the linking of the hierarchically structured objects. In the example of FIG. 1, object 1 corresponds to square 101 and object 2 corresponds to rectangle 102. Arrow 316 indicates the relation "contains" and arrow 315 indicates that
Relation "enthalten in". Die Veränderung in der Position zwischen Objektl und Objekt2 ist für die Sequenzen 301 und 302 ebenfalls in den Feldern für die relationale Information 304 bzw. 306 abgespeichert.Relation "contained in". The change in position between object 1 and object 2 for sequences 301 and 302 is also stored in the fields for relational information 304 and 306, respectively.
Die objektbezogenen Daten 307 bis 310 (für Objektl) bzw. 311 bis 314 (für Objekt2) bestimmen die jeweiligen Sequenzen 301 und 302. Für diese Sequenzen werden relationale Informationen bestimmt und abgespeichert, insbesondere wird jede Sequenz als eine "globale" Bewegung interpretiert, d.h. für dieThe object-related data 307 to 310 (for object 1) or 311 to 314 (for object 2) determine the respective sequences 301 and 302. Relational information is determined and stored for these sequences, in particular each sequence is interpreted as a "global" movement, i.e. for the
Gesamtheit einer Sequenz wird ein Merkmalssatz (303 und 304 bzw. 305 und 306) bestimmt und abgespeichert. In Fig. ist eine Anordnung dargestellt, die zwei Rechner und eine Kamera umfaßt, wobei Bildcodierung, Übertragung der Bilddaten und Bilddecodierung veranschaulicht werden.A set of features (303 and 304 or 305 and 306) is determined and stored in its entirety. FIG. 1 shows an arrangement which comprises two computers and a camera, with image coding, transmission of the image data and image decoding being illustrated.
Eine Kamera 1101 ist mit einem ersten Rechner 1102 über eine Leitung 1119 verbunden. Die Kamera 1101 übermittelt aufgenommene Bilder 1104 an den ersten Rechner 1102. Der erste Rechner 1102 verfügt über eine erste Prozessoreinheit 1103, die über eine Bus 1118 mit einem Bildspeicher 1105 verbunden ist. Mit der Prozessoreinheit 1103 des ersten Rechners 1102 werden die Verfahren zur Bildcodierung durchgeführt. Auf diese Art codierte Bilddaten 1106 werden von dem ersten Rechner 1102 über eine Kommunikationsverbindung 1107, vorzugsweise eine Leitung oder eine Funkstrecke, zu einem zweiten Rechner 1108 übertragen. Der zweite Rechner 1108 enthält eine zweite Prozessoreinheit 1109 die über einen Bus 1110 mit dem Bildspeicher 1111 verbunden ist. Auf der zweiten Prozessoreinheit 1109 werden Verfahren zur Bilddecodierung durchgeführt.A camera 1101 is connected to a first computer 1102 via a line 1119. The camera 1101 transmits captured images 1104 to the first computer 1102. The first computer 1102 has a first processor unit 1103, which is connected via a bus 1118 to an image memory 1105. The image coding methods are carried out with the processor unit 1103 of the first computer 1102. Image data 1106 encoded in this way is transmitted from the first computer 1102 to a second computer 1108 via a communication link 1107, preferably a line or a radio link. The second computer 1108 contains a second processor unit 1109 which is connected to the image memory 1111 via a bus 1110. Methods for image decoding are carried out on the second processor unit 1109.
Sowohl der erste Rechner 1102 als auch der zweite Rechner 1108 verfügen jeweils über einen Bildschirm 1112 bzw. 1113, auf dem die Bilddaten 1104 visualisiert werden. Zur Bedienung sowohl des ersten Rechners 1102 als auch des zweiten Rechners 1108 sind jeweils Eingabeeinheiten vorgesehen, vorzugsweise eine Tastatur 1114 bzw. 1115, sowie eine Computermaus 1116 bzw. 1117.Both the first computer 1102 and the second computer 1108 each have a screen 1112 or 1113 on which the image data 1104 are visualized. Input units are provided for operating both the first computer 1102 and the second computer 1108, preferably a keyboard 1114 or 1115, and a computer mouse 1116 or 1117.
Die Bilddaten 1104, die von der Kamera 1101 über die Leitung 1119 zu dem ersten Rechner 1102 übertragen werden, sind vorzugsweise Daten im Zeitbereich, während die Daten 1106, die von dem ersten Rechner 1102 zu dem zweiten Rechner 1108 über die Kommunikationsverbindung 1107 übertragen werden, Bilddaten im Spektralbereich sind. Auf einem Bildschirm 1120 werden die decodierten Bilddaten dargestellt.The image data 1104, which are transmitted from the camera 1101 to the first computer 1102 via the line 1119, are preferably data in the time domain, while the data 1106 which are transmitted from the first computer 1102 to the second computer 1108 via the communication link 1107, Image data are in the spectral range. The decoded image data is displayed on a screen 1120.
Fig.5 zeigt eine Skizze einer Anordnung zur Durchführung eines blockbasierten Bildcodierverfahrens.5 shows a sketch of an arrangement for carrying out a block-based image coding method.
Ein zu codierender Videodatenstrom mit zeitlich aufeinanderfolgenden digitalisierten Bildern wird einer Bildcodierungseinheit 1201 zugeführt. Die digitalisierten Bilder sind unterteilt in Makroblöcke 1202, wobei jederA video data stream to be encoded with chronologically successive digitized images is fed to an image coding unit 1201. The digitized images are divided into macro blocks 1202, each
Makroblock 16x16 Bildpunkte hat. Der Makroblock 1202 umfaßt 4 Bildblöcke 1203, 1204, 1205 und 1206, wobei jeder Bildblock 8x8 Bildpunkte, denen Luminanzwerte (Helligkeitswerte) zugeordnet sind, enthält. Weiterhin umfaßt jeder Makroblock 1202 zwei Chrominanzblöcke 1207 und 1208 mit den Bildpunkten zugeordneten Chrominanzwerten (Farbinformation, Farbsättigung) .Macroblock has 16x16 pixels. The macro block 1202 comprises 4 picture blocks 1203, 1204, 1205 and 1206, each picture block containing 8x8 picture elements to which luminance values (brightness values) are assigned. Furthermore, each macro block 1202 comprises two chrominance blocks 1207 and 1208 with chrominance values (color information, color saturation) assigned to the pixels.
Der Block eines Bildes enthält einen Luminanzwert (=Helligkeit) , einen ersten Chrominanzwert (=Farbton) und einen zweiten Chrominanzwert (=Farbsättigung) . Dabei werden Luminanzwert, erster Chrominanzwert und zweiter Chrominanzwert als Farbwerte bezeichnet.The block of an image contains a luminance value (= brightness), a first chrominance value (= hue) and a second chrominance value (= color saturation). The luminance value, first chrominance value and second chrominance value are referred to as color values.
Die Bildblöcke werden einer Transformationscodierungseinheit 1209 zugeführt. Bei einer Differenzbildcodierung werden zu codierende Werte von Bildblöcken zeitlich vorangegangener Bilder von den aktuell zu codierenden Bildblöcken abgezogen, es wird nur die Differenzbildungsinformation 1210 der Transformationscodierungseinheit (Diskrete CosinusThe image blocks are fed to a transformation coding unit 1209. In the case of differential image coding, values to be coded from image blocks of temporally preceding images are subtracted from the image blocks currently to be coded; only the difference formation information 1210 of the transformation coding unit (discrete cosine
Transformation, DCT) 1209 zugeführt. Dazu wird über eine Verbindung 1234 der aktuelle Makroblock 1202 einer Bewegungsschätzungseinheit 1229 mitgeteilt. In der Transformationscodierungseinheit 1209 werden für die zu codierenden Bildblöcke bzw. Differenzbildblöcke Spektralkoeffizienten 1211 gebildet und einer Quantisierungseinheit 1212 zugeführt. Diese Quantisierungseinheit 1212 entspricht der -erfindungsgemäßen Vorrichtung zur Quantisierung.Transformation, DCT) 1209. For this purpose, the current macro block 1202 is communicated to a motion estimation unit 1229 via a connection 1234. Spectral coefficients 1211 are formed in the transformation coding unit 1209 for the picture blocks or difference picture blocks to be coded and are fed to a quantization unit 1212. This Quantization unit 1212 corresponds to the quantization device according to the invention.
Quantisierte Spektralkoeffizienten 1213 werden sowohl einer Scaneinheit 1214 als auch einer inversenQuantized spectral coefficients 1213 become both a scan unit 1214 and an inverse
Quantisierungseinheit 1215 in einem Rückwärtspfad zugeführt. Nach einem Scanverfahren, z.B. einem "zigzag"-Scanverfahren, wird auf den gescannten Spektralkoeffizienten 1232 eine Entropiecodierung in einer dafür vorgesehenen Entropiecodierungseinheit 1216 durchgeführt. Die entropiecodierten Spektralkoeffizienten werden als codierte Bilddaten 1217 über einen Kanal, vorzugsweise eine Leitung oder eine Funkstrecke, zu einem Decoder übertragen.Quantization unit 1215 fed in a reverse path. After a scanning process, e.g. a "zigzag" scanning method, entropy coding is carried out on the scanned spectral coefficients 1232 in an entropy coding unit 1216 provided for this purpose. The entropy-coded spectral coefficients are transmitted as coded image data 1217 via a channel, preferably a line or a radio link, to a decoder.
In der inversen Quantisierungseinheit 1215 erfolgt eine inverse Quantisierung der quantisierten Spektralkoeffizienten 1213. So gewonnene Spektralkoeffizienten 1218 werden einer inversen Transformationscodierungseinheit 1219 (Inverse Diskrete Cosinus Transformation, IDCT) zugeführt. Rekonstruierte Codierungswerte (auch Differenzcodierungswerte) 1220 werden im Differenzbildmodus einen Addierer 1221 zugeführt. Der Addierer 1221 erhält ferner Codierungswerte eines Bildblocks, die sich aus einem zeitlich vorangegangenen Bild nach einer bereits durchgeführten Bewegungskompensation ergeben. Mit dem Addierer 1221 werden rekonstruierteAn inverse quantization of the quantized spectral coefficients 1213 takes place in the inverse quantization unit 1215. Spectral coefficients 1218 obtained in this way are fed to an inverse transformation coding unit 1219 (inverse discrete cosine transformation, IDCT). Reconstructed coding values (also differential coding values) 1220 are supplied to an adder 1221 in the differential image mode. The adder 1221 also receives coding values of an image block which result from a temporally preceding image after motion compensation has already been carried out. The adder 1221 is used to reconstruct
Bildblöcke 1222 gebildet und in einem Bildspeicher 1223 abgespeichert .Image blocks 1222 are formed and stored in an image memory 1223.
Chrominanzwerte 1224 der rekonstruierten Bildblöcke 1222 werden aus dem Bildspeicher 1223 einerChrominance values 1224 of the reconstructed image blocks 1222 become one from the image memory 1223
Bewegungskompensationseinheit 1225 zugeführt. Für Helligkeitswerte 1226 erfolgt eine Interpolation in einer dafür vorgesehenen Interpolationseinheit 1227. Anhand der Interpolation wird die Anzahl in dem jeweiligen Bildblock enthaltener Helligkeitswerte vorzugsweise verdoppelt. Alle Helligkeitswerte 1228 werden sowohl der Bewegungskompensationseinheit 1225 als auch der Bewegungsschätzungseinheit 1229 zugeführt. Die Bewegungsschätzungseinheit 1229 erhalt außerdem die Bildblöcke des jeweils zu codierenden Makroblocks (16x16 Bildpunkte) über die Verbindung 1234. In der Bewegungsschätzungseinheit 1229 erfolgt dieMotion compensation unit 1225 supplied. For brightness values 1226, an interpolation takes place in an interpolation unit 1227 provided for this purpose. Based on the interpolation, the number of brightness values contained in the respective image block is preferably doubled. All brightness values 1228 are both the motion compensation unit 1225 and the Motion estimation unit 1229 supplied. The motion estimation unit 1229 also receives the image blocks of the macro block to be coded in each case (16x16 pixels) via the connection 1234. This takes place in the motion estimation unit 1229
Bewegungsschatzung unter Berücksichtigung der interpolierten Helligkeitswerte ("Bewegungsschatzung auf Halbpixelbasis") . Vorzugsweise werden bei der Bewegungsschatzung absolute Differenzen der einzelnen Helligkeitswerte m dem aktuell zu codierenden Makroblock 1202 und dem rekonstruiertenMotion estimation taking into account the interpolated brightness values ("motion estimation on a half-pixel basis"). When estimating the movement, absolute differences between the individual brightness values are preferably determined in the macro block 1202 currently to be coded and in the reconstructed one
Makroblock aus dem zeitlich vorangegangenen Bild ermittelt.Macroblock determined from the previous image.
Das Ergebnis der Bewegungsschatzung ist ein Bewegungsvektor 1230, durch den eine örtliche Verschiebung des ausgewählten Makroblocks aus dem zeitlich vorangegangenen Bild zu dem zu codierenden Makroblock 1202 zum Ausdruck kommt.The result of the motion estimation is a motion vector 1230, by means of which a local displacement of the selected macroblock from the temporally previous image to the macroblock 1202 to be coded is expressed.
Sowohl Helligkeitsinformation als auch Chrominanzinformation bezogen auf den durch die Bewegungsschätzungseinheit 1229 ermittelten Makroblock werden um den Bewegungsvektor 1230 verschoben und von den Codierungswerten des Makroblocks 1202 subtrahiert (siehe Datenpfad 1231) .Both brightness information and chrominance information relating to the macroblock determined by the motion estimation unit 1229 are shifted by the motion vector 1230 and subtracted from the coding values of the macroblock 1202 (see data path 1231).
In Fig.6 ist eine Prozessoreinheit PRZE dargestellt. Die Prozessoreinheit PRZE umfaßt einen Prozessor CPU, einenA processor unit PRZE is shown in FIG. The processor unit PRZE comprises a processor CPU, one
Speicher SPE und eine Input/Output-Schnittstelle IOS, die über ein Interface IFC auf unterschiedliche Art und Weise genutzt wird: Über eine Grafikschnittstelle wird eine Ausgabe auf einem Monitor MON sichtbar und/oder auf einem Drucker PRT ausgegeben. Eine Eingabe erfolgt über eine Maus MAS oder eine Tastatur TAST. Auch verfugt die Prozessoreinheit PRZE über einen Datenbus BUS, der die Verbindung von einem Speicher MEM, dem Prozessor CPU und der Input/Output-Schnittstelle IOS gewahrleistet. Weiterhin sind an den Datenbus BUS zusätzliche Komponenten anschließbar, z.B. zusätzlicher Speicher, Datenspeicher (Festplatte) oder Scanner. Fig.7 zeigt eine zu Fig.3 alternative Ausführungsform zur Abspeicherung objektbezogener Bilddaten. Dargestellt sind eine Sequenz 701 von Bilddaten für das Objektl und eine Sequenz 702 Bilddaten für das Objekt2. Eine zu dem jeweiligen Objekt gehörende intrinsische Information (Form, Farbe desMemory SPE and an input / output interface IOS, which are used in different ways via an interface IFC: output is displayed on a monitor MON and / or output on a printer PRT via a graphic interface. An entry is made using a mouse MAS or a keyboard TAST. The processor unit PRZE also has a data bus BUS, which ensures the connection of a memory MEM, the processor CPU and the input / output interface IOS. Furthermore, additional components can be connected to the data bus BUS, for example additional memory, data storage (hard disk) or scanner. FIG. 7 shows an alternative embodiment to FIG. 3 for storing object-related image data. A sequence 701 of image data for the object 1 and a sequence 702 image data for the object 2 are shown. An intrinsic information belonging to the respective object (shape, color of the
Objekts) 703 bzw. 704 ist jeweils mit dem Objekt 701 bzw. 702 abgespeichert. Die relationale Information 713 ist vorzugsweise gesondert von den jeweiligen Objekten 701 und 702 abgespeichert. Dabei umfaßt die relationale Information 713 eine Merkmalsinformation 714 betreffend die Verknüpfung der Objekte 701 und 702, z.B. die Bewegung des Objektesl relativ zu dem Objekt2. Die Verknüpfung selbst wird hergestellt mittels der Bezugsinformation 715, 716, die bevorzugt Referenzen zu den mit der Merkmalsinformation 714 assoziierten Objekten 701 und 702 aufweist.Object) 703 or 704 is stored with object 701 or 702. The relational information 713 is preferably stored separately from the respective objects 701 and 702. Relational information 713 includes feature information 714 relating to the linking of objects 701 and 702, e.g. the movement of the object 1 relative to the object 2. The link itself is established using the reference information 715, 716, which preferably has references to the objects 701 and 702 associated with the feature information 714.
Die objektbezogenen Daten 705 bis 708 bzw. 704 bis 712 bestimmen jeweils eine zu dem jeweiligen Objekt gehörende Sequenz. Die Sequenz kann eine beliebige Anzahl Bilder (für das jeweilige Objekt) umfassen. The object-related data 705 to 708 or 704 to 712 each determine a sequence belonging to the respective object. The sequence can include any number of images (for the respective object).
Literaturverzeichnis:Bibliography:
[1] J. De Lameillieure, R. Schäfer: "MPEG-2-Bildcodierung für das digitale Fernsehen", Fernseh- und Kino-Technik, 48. Jahrgang, Nr.3/1994, Seiten 99-107.[1] J. De Lameillieure, R. Schäfer: "MPEG-2 image coding for digital television", television and cinema technology, 48th year, No. 3/1994, pages 99-107.
[2] M. Bierling: "Displacement Estimation by Hierarchical[2] M. Bierling: "Displacement Estimation by Hierarchical
Blockmatching", SPIE, Vol.1001, Visual Communications and Image Processing '88, S.942-951, 1988.Block Matching ", SPIE, Vol.1001, Visual Communications and Image Processing '88, S.942-951, 1988.
[3] ITU-T, International Telecommunication Union, Telecommunications Sector of ITU, Draft ITU-T Recommendation H.263, Videocoding for low bitrate communication, 2.5.96. [3] ITU-T, International Telecommunication Union, Telecommunications Sector of ITU, Draft ITU-T Recommendation H.263, Videocoding for low bitrate communication, 2.5.96.

Claims

Patentansprüche claims
1. Verfahren zum Abspeichern von mindestens einem Bild durch einen Rechner, bei dem eine relationale Information mit dem mindestens einen Bild assoziiert abgespeichert wird.1. A method for storing at least one image by a computer, in which relational information associated with the at least one image is stored.
2. Verfahren nach Anspruch 1, bei dem die relationale Information zu dem mindestens einen Bild ermittelt wird.2. The method of claim 1, wherein the relational information on the at least one image is determined.
3. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die relationale Information eine Merkmalsmformation und eine Bezugsinformation zwischen Objekten und/oder Bildern umfaßt.3. The method according to any one of the preceding claims, wherein the relational information comprises feature information and reference information between objects and / or images.
4. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das mindestens eine Bild eine Sequenz von mehreren Bildern ist.4. The method according to any one of the preceding claims, wherein the at least one image is a sequence of several images.
5. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die relationale Information mindestes eine der folgenden Möglichkeiten umfaßt: a) Bewegungsinformation; b) Abstandsinformation; c) Uberlappungsmformation; d) Information bezuglich einer Beziehung zwischen Objekten und/oder Bildern.5. The method according to any one of the preceding claims, wherein the relational information comprises at least one of the following options: a) movement information; b) distance information; c) overlap information; d) Information related to a relationship between objects and / or images.
6. Verfahren nach Anspruch 5, bei dem die Bewegungsinformation folgende Parameter umfaßt: a) Translation, b) Rotation, c) Zoom. 6. The method of claim 5, wherein the movement information comprises the following parameters: a) translation, b) rotation, c) zoom.
7. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die relationale Information anhand einer Transformation über der Zeit bestimmt wird.7. The method according to any one of the preceding claims, wherein the relational information is determined based on a transformation over time.
8. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die relationale Information zu jeweils zwei Bildern bestimmt wird.8. The method according to any one of the preceding claims, wherein the relational information is determined for two images.
9. Verfahren nach einem der vorhergehenden Ansprüche, bei dem das mindestens eine Bild mindestens zwei Objekte enthält, für die die relationale Information bestimmt wird.9. The method according to any one of the preceding claims, wherein the at least one image contains at least two objects for which the relational information is determined.
10. Verfahren nach Anspruch 9, bei dem die relationale Information zu jeweils zwei Objekten bestimmt wird.10. The method of claim 9, wherein the relational information is determined for two objects.
11. Verfahren nach einem der vorhergehenden Ansprüche, bei dem die relationale Information zu einem Merkmalssatz nach einem Bildkompressionsstandard hinzugefügt wird.11. The method according to any one of the preceding claims, wherein the relational information is added to a set of features according to an image compression standard.
12. Verfahren nach Anspruch 11, bei dem der Bildkompressionsstandard ein MPEG-Standard oder ein H.26x-Standard ist.12. The method of claim 11, wherein the image compression standard is an MPEG standard or an H.26x standard.
13. Verfahren nach einem der vorhergehenden Ansprüche zum Einsatz beim Encoding nach einem Bildkompressionsverfahren.13. The method according to any one of the preceding claims for use in encoding according to an image compression method.
14. Verfahren nach einem der vorhergehenden Ansprüche, bei dem anhand der mit dem mindestens einen Bild abgespeicherten relationalen Information eine Suche in den abgespeicherten Daten ermöglicht wird.14. The method according to any one of the preceding claims, in which a search in the stored data is made possible on the basis of the relational information stored with the at least one image.
15. Anordnung zum Abspeichern von mindestens einem Bild durch einen Rechner, bei der eine Prozessoreinheit vorgesehen ist, die derart eingerichtet ist, daß eine relationale Information mit dem mindestens einen Bild assoziiert abspeicherbar ist. 15. Arrangement for storing at least one image by a computer, in which a processor unit is provided which is set up in such a way that relational information associated with the at least one image can be stored.
PCT/DE2000/000386 1999-02-18 2000-02-09 Method and system for storing at least one image and its associated relational information WO2000049525A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19906830A DE19906830A1 (en) 1999-02-18 1999-02-18 Method and arrangement for storing at least one image by a computer
DE19906830.5 1999-02-18

Publications (1)

Publication Number Publication Date
WO2000049525A1 true WO2000049525A1 (en) 2000-08-24

Family

ID=7897925

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2000/000386 WO2000049525A1 (en) 1999-02-18 2000-02-09 Method and system for storing at least one image and its associated relational information

Country Status (2)

Country Link
DE (1) DE19906830A1 (en)
WO (1) WO2000049525A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108730A (en) * 1991-08-29 1993-04-30 Internatl Business Mach Corp <Ibm> Retrieval of dynamic image database
JPH1084525A (en) * 1996-02-05 1998-03-31 Texas Instr Inc <Ti> Method for generating index to video sources
US5969755A (en) * 1996-02-05 1999-10-19 Texas Instruments Incorporated Motion based event detection system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108730A (en) * 1991-08-29 1993-04-30 Internatl Business Mach Corp <Ibm> Retrieval of dynamic image database
US5892520A (en) * 1991-08-29 1999-04-06 International Business Machines Corporation Picture query system using abstract exemplary motions of a pointing device
JPH1084525A (en) * 1996-02-05 1998-03-31 Texas Instr Inc <Ti> Method for generating index to video sources
US5969755A (en) * 1996-02-05 1999-10-19 Texas Instruments Incorporated Motion based event detection system and method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LIANG ET AL.: "Video Indexing by Spatial Representation", PROCEEDINGS OF THE THIRD AUSTRALIAN AND NEW ZEALAND CONFERENCE ON INTELLIGENT INFORMATION SYSTEMS, 1995. ANZIIS-95, 27 November 1995 (1995-11-27), pages 99 - 104, XP002140419 *
PISSINOU ET AL.: "A Topological - Directional Model for the Spatio-Temporal Composition of Video Objects", EIGHTH INTERNATIONAL WORKSHOP ON RESEARCH ISSUES IN DATA ENGINEERING 1998. 'CONTINUOUS-MEDIA DATABASES AND APPLICATIONS', 23 February 1998 (1998-02-23), pages 17 - 24, XP002140418 *

Also Published As

Publication number Publication date
DE19906830A1 (en) 2000-08-31

Similar Documents

Publication Publication Date Title
DE69623330T2 (en) FEATURE-BASED VIDEO COMPRESSION PROCESS
DE69723550T2 (en) CODING AND DECODING OF GRAPHIC SYMBOLS
DE19704439C2 (en) Method and device for motion estimation in a digital video encoder using trajectories
EP1025708B1 (en) Method and device for processing a digitized image
DE69521255T2 (en) METHOD FOR OPERATING AN INTERACTIVE IMAGE DISPLAY SYSTEM AND IMAGE DISPLAY SYSTEM FOR IMPLEMENTING THE METHOD
DE69915843T2 (en) PART BAND CODING / decoding
EP0773690A2 (en) Method for encoding a video data stream
EP1101196B1 (en) Method and device for estimating motion in a digitized image with pixels
DE10022520A1 (en) Method for spatially scalable moving image coding e.g. for audio visual and video objects, involves at least two steps of different local resolution
EP0985317B1 (en) Method for coding and decoding a digitalized image
EP1110407B1 (en) Method and array for coding and decoding a digitized image using an overall motion vector
EP1116184B1 (en) Method and array for processing a digitized image with image points
EP1285537B1 (en) Method and an arrangement for the coding and decoding of a series of images
DE19951341B4 (en) Method for the motion-compensating prediction of moving pictures and device therefor
DE69909880T2 (en) Decoding a compressed digital picture signal
EP0981910B1 (en) Method and device for coding a digitized image
WO2001049038A1 (en) Method, device and computer programme generation for prediction in encoding an image divided into image blocks
WO2001062009A1 (en) Method and device for coding or coding and decoding a sequence of numbers
WO2000049525A1 (en) Method and system for storing at least one image and its associated relational information
EP0981909B1 (en) Method and device for coding and decoding a digitized image
EP1121809B1 (en) Method and device for coding a digitized image and method for decoding a digitized image
DE19944300C2 (en) Method, arrangement and computer program product for motion estimation when encoding an image object in an image
DE19903859A1 (en) Method and arrangement for transforming an image area
WO2001028252A1 (en) Progressive fault-tolerant encoding or decoding of a sequence of images
WO2001041450A1 (en) Method and device for coding or decoding a series of numbers

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CN JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase