[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2018059629A1 - Detection and validation of objects from sequential images from a camera by means of homographs - Google Patents

Detection and validation of objects from sequential images from a camera by means of homographs Download PDF

Info

Publication number
WO2018059629A1
WO2018059629A1 PCT/DE2017/200100 DE2017200100W WO2018059629A1 WO 2018059629 A1 WO2018059629 A1 WO 2018059629A1 DE 2017200100 W DE2017200100 W DE 2017200100W WO 2018059629 A1 WO2018059629 A1 WO 2018059629A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
corresponding features
plane
images
homography
Prior art date
Application number
PCT/DE2017/200100
Other languages
German (de)
French (fr)
Inventor
Michael Walter
Original Assignee
Conti Temic Microelectronic Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Conti Temic Microelectronic Gmbh filed Critical Conti Temic Microelectronic Gmbh
Priority to DE112017003463.9T priority Critical patent/DE112017003463A5/en
Publication of WO2018059629A1 publication Critical patent/WO2018059629A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads

Definitions

  • the invention relates to a method for the detection of objects from images of a camera and can be used in ippoba ⁇ overbased driver assistance systems in particular.
  • Vehicle recognition systems according to the current state of the art are mostly classification-based. Classification-based systems can recognize vehicles or vehicle components that they have seen in their training data. However, new vehicle designs, as well as changing structures can lead to a greatly reduced system performance and require generic approaches to object recognition.
  • EP 2 993 654 A1 shows a method for front collision warning (FCW) from camera images.
  • FCW front collision warning
  • US 2014/0161323 A1 shows a method for generating dense three-dimensional structures in a road environment from images taken with a monocamera.
  • a starting point of the invention are the following considerations: If the camera positions of two frames (frames) are known, point correspondences can (corresponding feature points) triangulate, but there are no objects ge ⁇ neriert because the triangulation has no model knowledge that a point cloud could clusters into meaningful objects. Disadvantages of monocular systems are that objects close to the epipole can only be inaccurately triangulated and there are the smallest errors in the egomotion (camera self-motion) noticeable.
  • An epipole is the pixel in a first camera image, at which the center of the camera is imaged at a second time. For example, during a straight-ahead journey, the vanishing point corresponds to the epipole. However, this is the relevant area to detect collisions with stationary or forward vehicles. Dynamic objects can be triangulated as they move according to the epipolar geometry. However, they are estimated too close or too far away due to the unknown relative speed.
  • An inventive method for the detection of objects from a sequence of images of a vehicle camera comprises the steps:
  • step d) assignment of (adjacent) determined corresponding features in an image area to a plane in space, and f) determination of additional corresponding features in the image area, taking into account the level associated with (in step d)).
  • the vehicle camera is designed to receive an environment of a vehicle.
  • the environment is in particular the environment in front of the vehicle.
  • the vehicle camera in a Augustassistenzvor- direction integrated or connectable to this, wherein the driver assistance device is formed in particular for object recognition from the provided by the vehicle camera device image data.
  • the vehicle camera device is a camera to be arranged in the interior of the motor vehicle behind the windshield and directed in the direction of travel.
  • the vehicle camera is a mo ⁇ nokulare camera.
  • individual images are taken with the vehicle camera at specific or known times, resulting in a sequence of images.
  • Correspondence is the equivalent of a feature in a first image to the same feature in a second image.
  • Corresponding features in two images can also be described as a flow vector indicating how the feature has shifted in the image.
  • a feature may be an image patch, a pixel, an edge or a corner.
  • step d it is also subsumed that a plurality of levels is specified in space, and an assignment of (adjacent) corresponding features to one of the given levels is carried out (see step d2 below or d3)).
  • plane in the context of the present invention describes the following relationships: on the one hand a criterion for the accumulation of adjacent corresponding features, ie these are considered to belong together if they lie in a common plane in space and develop in time according to the movement of the plane.
  • ground level Such accumulated corresponding features are referred to as ⁇ closing as "ground level”, as they are all in the Plane corresponding to the road level.
  • ground plane does not extend to infinity, but rather means a subarea of the plane, namely the one in which corresponding features are actually arranged.
  • step f) the phrase "taking into account " means that the level associated with an image area in step d) is taken into account in determining additional corresponding features Features in an image area, a motion of the associated plane is determined and then predicted, where features of the same image area in a first image will be found in a (subsequent) second image as a result of the movement of the associated plane determined corresponding features.
  • detection of objects may mean a generation of object hypotheses or objects.
  • the method comprises the step:
  • Homography describes the correspondence of points on a plane between two camera positions or the correspondence of two points in two consecutive images of the vehicle camera. By calculating homographies for the determined corresponding features in an image area, the assignment to one level in space can thus take place (see step d)).
  • the homographies are preferably determined generically from the image or from successive images. A default of a distance of a plane to the camera position is typically not required.
  • the method comprises the steps:
  • the backprojection error of a plane describes the difference between a point x at time t-0 and the corresponding point mapped according to the homography of that plane at the previous time t-1 (see below: equation 4).
  • the corresponding features can be segmented, that is, assigned to different image regions (or segments).
  • step f) it is then possible to determine additional corresponding features in an image area taking into account the assigned plane.
  • An advantageous development of the method comprises the step d3): Assignment of (adjacent) corresponding features to a respective ground level, a backplane or a sidewall level.
  • a ground plane normal to the y-direction, a backplane normal to the z-direction and a side wall plane normal to the x-direction can be specified.
  • the distance (from the on-vehicle camera), in particular to a rear wall or side wall layer is advantageous that He ⁇ result of Homographiebetician and not a predetermined assumption.
  • the homographies for the backplane can be calculated according to equation (10) or for the ground plane according to equation (9) or for the sidewall plane according to equation (11).
  • a, b, c are constants
  • xo, yo, xi, yi denote correspondences in the first image (index 0) taken at a time t-0
  • a second image (index 1) taken at an earlier time t-1 and t x, t y, t z are the components of the vector t / d.
  • t describes the translation of the vehicle camera and d the distance to a plane (perpendicular to this plane), ie along the normal vector of this plane.
  • the components t x , t y and t z are also referred to below as "inverse TTC.”
  • TTC comes from, time to collision x and results in a spatial direction as a distance divided by translation speed.
  • first or few mutually corresponding features in an image region in the second and a subsequent third image can be determined.
  • a homography for this image area is recalculated, and the newly calculated homography is used to predict the position and shape of additional or further corresponding features in the third image.
  • the homography from the second image calculated for the image area (based on the first and second images) can be the position and predetermining additional corresponding features of the image area in the third image.
  • a current image may be warped (projected or transformed) onto a previous image corresponding to the computed homography (the associated plane) to determine additional features corresponding to each other in the last and in the current image , These Fully ⁇ staltung leads to compression of the optic flow field.
  • the planes with identical orientation can be separated on the basis of the associated t x , t y , t z values.
  • two backplane levels which are different distances from the vehicle camera in the z-direction, can be distinguished from each other by different t z values.
  • an image can be subdivided by a grid into similar cells and for each cell may be made of the fact he ⁇ mediated corresponding features a homography loading be expected. Cells with consistent homography can then be clustered.
  • a so-called rear projection errors of the various corresponding features are considered before ⁇ geous.
  • the backprojection error indicates the difference between the measured flux and the flux predicted from the computed homography.
  • the boundary (or cluster boundary) within the first cell can be refined. In this way, different corresponding characteristics of a cell can be assigned to different levels.
  • the assignment of planes to adjacent corresponding features can be determined substantially in the entire image of the vehicle camera (for example in at least 80% of the image area, preferably at least 90%). Since the method according to the invention can be designed very quickly, generic object detection or scene interpretation is possible for almost the entire image in real time.
  • the invention further provides an apparatus for detecting objects of a sequence of images of an in-vehicle camera comprising a camera control device and an off ⁇ evaluation electronics.
  • the camera control unit is designed to
  • the transmitter is designed to
  • the camera control unit or the evaluation electronics may in particular comprise a microcontroller or processor, a digital signal processor (DSP), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array) and the like, as well as software for carrying out the corresponding control or evaluation steps include.
  • DSP digital signal processor
  • ASIC Application Specific Integrated Circuit
  • FPGA Field Programmable Gate Array
  • the present invention thus may be plemented in digital electronic circuitry, computer hardware, firmware or software in ⁇ .
  • Fig. 1 shows schematically a typical deformation of an approaching backplane
  • Fig. 2 schematically shows a typical deformation of an approaching ground plane
  • Fig. 3 shows schematically a typical deformation a) of a fast and b) a slowly approaching or further away backplane;
  • Fig. 4 shows schematically a subdivision of an image with two different segments into cells;
  • Fig. 8 Projection (or warping) of the guardrail segment at time t-0 (right) to t-1 (left).
  • a backplane is shown schematically (back plane), which occupies the hatched area (20, dotted line) at a first time t-1.
  • the distance between the vehicle camera and the rear wall plane has decreased, which leads to the deformation of the area (21, solid line) of the backplane in the image indicated by the arrows (d1).
  • the range (20; 21) scales or increases as a result of the relative movement of the vehicle camera to the backplane.
  • FIG. 2 schematically shows a ground plane (ground plane) which occupies the region (30, dotted line) shown hatched at a first instant t-1.
  • This could be a section of road surface on which the vehicle is traveling.
  • the area (in the picture) changes to a subsequent one Time t, which leads to the sketched by the arrows (d2) deformation of the region (32) of the ground plane.
  • the lines labeled 32 limit the area of the ground plane.
  • the "edge plane” is thus understood to mean, for example, signatures (or boundary points) on the roadway surface that can be tracked in the image sequence Fig. 3a: 20, 21, deformation dl) and a slowly (Fig. 3b) approaching backplane (20, 23, deformation d3), if at time t-1, the backplane (20) in Fig. 3a the same Distance to the vehicle camera has as the backplane (20) in Fig. 3b.
  • Figure 3 could illustrate the difference between a near backplane (Figure 3a: 20, 21; deformation dl) and a more distant backplane (20, 23; deformation d3), e.g. moving at the same (relative) speed, then the object (20, 21) shown in Fig. 3b would be larger in real space than the object (20, 23) shown in Fig. 3a.
  • a homography describes the correspondence of points on a plane between two camera positions or the correspondence of two points in two consecutive frames: XQ ' ⁇ - ⁇ '
  • the vector x t0 describes the 3D correspondence at time t-0 of the vector x tl at time t-1.
  • Homography can be calculated image-based by knowing four point correspondences (see tutorial: Multiple View Geometry, Hartley, R. and Zisserman, A, CVPR June 1999:
  • Equation 3 illustrates that with an inverse TTC t / d not equal to zero, planes with different orientation n can be modeled and that flattening with identical orientation n can be separated by their inverse TTC.
  • Fig. 4 shows schematically a subdivision into cells (grid, grid / lines).
  • the scene is divided into NxM initial cells, and each point correspondence is a unique ID-assigned ⁇ .
  • This ID first indicates the affiliation to a cell.
  • the ID can indicate the membership of a cluster or an object.
  • Hatched is an object (especially a backplane) in the foreground.
  • the background is white. If a cell contains only one object (cells B3, D3), homography will describe this cell very well. However, if a cell contains more than one object (cell C3), the homography will not describe any of the two objects well. If the point correspondences (black dot or black cross or x) are assigned to the clusters (or segment) of the neighboring cells (B3 or D3) via their backprojection errors, the black dot becomes the segment of cell B3 and the black cross assigned to the segment of the cell D3, since the homography for the cell C3 neither the foreground nor the background well ⁇ writes.
  • the segment sizes can be adapted to the scene, for example, by generating larger areas in the vicinity of the vehicle or in areas with a positive classification answer. For every segment For example, as shown in Eqs. 5-10, a de- termined back / ground and side-plane homography is computed.
  • the backprojection error e ⁇ is therefore a measure of how well a point x at time t-0 is described by the homography of a plane i of the corresponding point at time t-1: x to (4)
  • Equation 5 gives the simplified form:
  • Bigger consisting of several cell objects to seg ⁇ menting, can be adjacent in a further step
  • Two adjacent clusters are summarized if £ t o- HJX t l l smaller £ t £ H o- # t ii st or, for example, normalized to the predicted flow length backprojection error is below an adjustable threshold.
  • two adjacent clusters can be grouped together if ⁇ ⁇ - HjX t l l smaller t t o- and the two reproduction errors Hi x ti falls below a threshold normalized to the flow length.
  • backprojection errors can be used as potentials in a graph and compute a global solution. The compactness of the clusters can be determined by the edge potentials in the graph.
  • the homographies are recalculated and the point correspondences are assigned to the clusters with the least backprojection error. If you only consider directly adjacent clusters, very compact objects can be generated. If the minimum error exceeds an adjustable threshold, the correspondences are assigned new (cluster / object) IDs in order to be able to recognize partially concealed objects or objects with slightly different TTCs. By setting the threshold, the resolution (slightly) of different objects can be adjusted.
  • Fig. 5 shows an example of scene segmentation:
  • Fig. 5a shows an image taken by a vehicle camera disposed inside the vehicle and detecting the surrounding environment through the windshield.
  • the lanes are separated by corresponding lane markings.
  • On all three lanes drive vehicles.
  • the preceding vehicle in the same lane vehicle (53) covered possible SHORT- more present on the own lane vo ⁇ out moving vehicles.
  • On the left of the three-lane road is a built-up raised boundary (52) to the opposite lane.
  • Right of the three-lane road (51) is a Randrang. Hard shoulder bordered to the right by a guardrail, followed by a forest area.
  • FIGS. 5b to 5d show cells (56). Point correspondences (55) are shown in the cells. The assignment of a cell (56) to a segment is shown by the color of the cell frame or point correspondences (55).
  • Fig. 5b shows the red channel of the segmented image
  • Fig. 5c the green channel
  • Fig. 5d the blue channel.
  • a segment which is green in the original, extends over the lowest five to six lines (shown correspondingly white in FIGS. 5b and 5d and without a cell frame).
  • This segment corresponds to the ground plane, ie the surface of the road (51) on which your own car drives.
  • Another segment can be seen in the middle of the picture, in the original it is pink. Therefore, it has high red values in FIG. 5b, weaker blue values in FIG. 5d and no green values in FIG. 5c.
  • This segment corresponds to the backplane of the (lorry) vehicle (53) traveling in its own lane.
  • the segmentation result shown was determined without prior knowledge of the scene in only three iterations. This shows the enormous speed and performance of an embodiment of the invention by temporal integration.
  • FIG. 6 shows a determination of the orientation of planes in the scene already described in FIG. 5.
  • FIG. 6a again shows the environmental situation according to FIG. 5a for orientation. All correspondences associated with a sidewall plane are shown in Fig. 6b. The correspondences at the left edge were assigned to a right side wall plane, which is true, as there is the right side of the structural boundary (52) to the opposite lane in the picture. The correspondence in the right half were left side wall levels associated, which is also applicable, since there is located "left side" of the road-edge development or -bepflanzung in the image.
  • FIG. 6c shows the correspondence of a bottom level are supplied ⁇ assigns what N is because there in the picture, the surface of the road (51) can be seen.
  • Fig. 6d shows which correspondences are assigned to a backplane. That is largely true. From this determination alone different backplane levels can not yet be sufficiently distinguished, for example, from the on the same lane ahead of delivery vans (53) of the arranged in the picture above signs of the gantry (54). However, important information can already be found in this representation of where elevated objects occur in the surroundings of the vehicle. As illustrated in Fig. 7, for detecting dyna ⁇ mixer objects inverse TTC (t x, t y, t z) be used.
  • FIG. 7a again shows the image of the vehicle situation (identical to FIG. 6a).
  • the vehicle (73) driving ahead in its own lane is a delivery truck. On the left lane are two vehicles (71 and 72) and on the right lane two more vehicles (74 and 75).
  • Fig. 7b shows correspondences, which in turn correspond to the ground level (purple in the original) and the only one have a red component.
  • Fig. 7c shows correspondences associated with moving objects. These are green in the original, if they move away from their own vehicle (ie drive faster) or turquoise, if they drive slower.
  • Fig. 7d shows correspondences with blue component, ie those corresponding to the ground plane (see Fig. 7b), moving objects approaching the own vehicle (see Fig. 7c) and those corresponding to static raised objects shown only in Fig. 7d, such as Forest areas left and right of the highway and the gantries. From FIGS. 7c and 7d in common, it can be seen that the vehicle is approaching on its own lane (73). The same applies to the front vehicle in the right lane (75). On the other hand, the other vehicles (71, 72 and 74) move away.
  • the pitch and yaw rate by the coordinates of the epipole (x e , y e ) are predicted by the homography of static segments and the atan ((x e0 -x el ) / f) or atan ((y e0 -y el / f) with the one pixel related focal length / is calculated.
  • the segmentation is known at time t-1, it can be used both to predict the objects and to generate a dense flow field.
  • Signature-based flow methods generate signatures and try to uniquely assign them in consecutive frames. In most cases, the signatures are calculated from a patch (image section or image area) of defined size. However, if the size and shape of a patch change, this is a correspondence finding with a fixed template (Template pattern, meaning, for example, an image section of an image of the image sequence, corresponding to an object - when ⁇ play, a vehicle-template) no longer possible.
  • Tempolate pattern meaning, for example, an image section of an image of the image sequence, corresponding to an object - when ⁇ play, a vehicle-template
  • the size of a patch changes. Or when moving over a ground plane or parallel to a side plane, both size and shape of a patch change, see Figs. 1 and 2).
  • the homogra- phies can be recomputed over already found flow vectors and used to predict the
  • the current frame may be transformed to time t-1 at time t-0 to compensate for scale and shape changes.
  • Fig. 8 illustrates such a procedure.
  • Fig. 8a shows an image of another driving situation taken by the vehicle camera at a time t-1. You can see a highway with three lanes in each direction of travel. To the left of the own three-lane roadway is a guardrail (81) as a raised boundary to the opposite lane. To the right of the roadway is a noise barrier (82). Fig. 8b shows an image that was taken at the next time t and transformed via the homography of the guardrail in such a way ("warped", English: to warp) was that occurring as a result of the movement of the vehicle and thus the vehicle camera between the two recording times In Fig. 8b, the forward movement of the own vehicle results in that the closest tine of the lane marking is closer to the own vehicle than in Fig. 8a to the trapezoidal displacement of the image, which is illustrated in Fig. 8f by a dashed line.
  • Fig. 8c now shows corresponding features (85), which were determined in the area of the guardrail (81, see Fig. 8a), as white dots.
  • Fig. 8d shows where these corresponding features are to be expected in the next image (86) after being transformed as described for Fig. 8b.
  • the current image can be warmed to the previous image for each segment in order to find existing correspondences that have changed in their scale or shape, or to establish new correspondences by means of congruent templates.
  • the approximate homography from the last frame can be used to make the correspondence finding more robust against shape and scale changes.
  • the image is subdivided into NxM cells and the point correspondences of a cell are assigned a unique cell ID. From the correspondences with same IDs are calculated using the RANSAC baking / Si ground- and de-plane homographies (Equation 9, 10 and 10) and both the homography with the smallest rear projection ⁇ jetechnischsvent, as well as the reference points used to calculate the homography stored.
  • RANSAC Random SAmple Consensus
  • a minimum number of randomly selected correspondences are usually used in each iteration to form a hypothesis.
  • a value is then calculated that describes whether the corresponding feature supports the hypothesis. If the hypothesis reaches out ⁇ ranging support through the corresponding characteristics which are not under-support alarm collapsing corresponding features can be discarded as outliers. Otherwise, a minimum number of correspondences will be randomly selected again.
  • the rear-projection error ⁇ ⁇ be - or HJX t l l. , x t J 0 - iX t J l calculated over the nodes of the adjacent homography. If the backprojection error Y, x t l o ⁇ Hj x ti is smaller than ⁇ - ⁇ i x ti or if the errors are below a threshold normalized to the flow length, the IDs are combined and the homographies recalculated.
  • two neighboring cells as ⁇ be at the same level (or to the same segment or to the same object) can be clustered related if the Rear-Ceiling etations Computing less than - HiX l tl ) and if both backprojection errors ⁇ ⁇ 0 ⁇ - HjX l tl ) and ⁇ ⁇ 0 ⁇ - HiX l tl ) fall below a normal nor ⁇ mêt threshold.
  • the backprojection errors x t Q- H t x t all
  • Point correspondences are for the adjacent segments and a point correspondence is assigned to the segment with least backprojection error. If the minimum error exceeds a threshold, the correspondences are provided with a new object ID in order to be able to recognize even smaller or partially hidden objects.
  • the homographies of the segments extracted at time t-1 are recalculated at the beginning of a new frame (t-0) via the already found image correspondences and the already existing segment IDs are predicted in the current frame. If there are not enough flow vectors available in the current frame to recalculate a homography, the approximate homographies from the last frame can be used.
  • the current frame (t-0) for each segment is warmed to the last frame (t-1) to find already existing correspondences that have changed in their scale or shape, or new correspondences to establish.
  • the rear projection error of the baking / ground- and Side-tarpaulin can be used to validate raised objectives, see Fig. 6. For example, if in a vehicle stereo camera a Dispari ⁇ tiquess registration present, the absolute velocities from the inverse TTC can t / are calculated d, because then there are the absolute distances d for individual pixels in the disparity map.
  • the rotation matrix R is determined.
  • the 3D environment can be reconstructed from the predicted position (Hx tl , x tl ) instead of the measured position (x Q , x tl ) and also allows to reconstruct objects on the epipole.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)
  • Image Processing (AREA)

Abstract

The invention relates to a method and to a device for identifying objects from images from a camera and can be used in particular in camera-based driver assistance systems. The method for detecting objects from a series of images from a vehicle camera comprises the following steps: a) capturing a series of images by means of the vehicle camera, b) determining corresponding features in two consecutive images, d) associating determined adjacent corresponding features in an image region with a plane in space, and f) determining additional corresponding features in the image region while taking into account the associated plane. The invention offers the advantage of compression of the optical flow field.

Description

DETEKTION UND VALIDIERUNG VON OBJEKTEN AUS SEQUENTIELLEN BILDERN EINER KAMERA MITTELS HOMOGRAPHIEN  DETECTION AND VALIDATION OF OBJECTS FROM SEQUENTIAL IMAGES OF A CAMERA BY HOMOGRAPHIES
Die Erfindung betrifft ein Verfahren zur Erkennung von Objekten aus Bildern einer Kamera und kann insbesondere bei kameraba¬ sierten Fahrerassistenzsystemen verwendet werden. The invention relates to a method for the detection of objects from images of a camera and can be used in kameraba ¬ overbased driver assistance systems in particular.
Fahrzeugerkennungssysteme nach dem aktuellen Stand der Technik sind meist klassifikationsbasiert . Klassifikationsbasierte Systeme können Fahrzeuge bzw. Fahrzeugkomponenten wiedererkennen, die sie in ihren Trainingsdaten gesehen haben. Neue Fahrzeugdesigns, sowie sich verändernde Aufbauten können jedoch zu einer stark reduzierten System Performance führen und fordern generische Ansätze zur Objekterkennung. Vehicle recognition systems according to the current state of the art are mostly classification-based. Classification-based systems can recognize vehicles or vehicle components that they have seen in their training data. However, new vehicle designs, as well as changing structures can lead to a greatly reduced system performance and require generic approaches to object recognition.
EP 2 993 654 AI zeigt ein Verfahren zur Frontkollisionswarnung (FCW) aus Kamerabildern. Hierbei wird ein Bildausschnitt analysiert, wohin das eigene Fahrzeug in einem vorgegebenen Zeitintervall gelangen wird. Sofern dort ein Objekt erkannt wird, wird eine Kollisionswarnung ausgegeben. EP 2 993 654 A1 shows a method for front collision warning (FCW) from camera images. Here an image section is analyzed, where the own vehicle will arrive within a given time interval. If an object is detected there, a collision warning is issued.
US 2014/0161323 AI zeigt ein Verfahren zur Erzeugung dichter dreidimensionaler Strukturen in einer Straßenumgebung aus Bildern, die mit einer Monokamera aufgenommen werden. US 2014/0161323 A1 shows a method for generating dense three-dimensional structures in a road environment from images taken with a monocamera.
Es ist eine Aufgabe der vorliegenden Erfindung, ein verbessertes Verfahren zur Detektion von Objekten anzugeben. It is an object of the present invention to provide an improved method for detecting objects.
Ein Ausgangspunkt der Erfindung sind die folgenden Überlegungen: Sind die Kamerapositionen zweier Frames (Einzelbilder) bekannt, lassen sich Punkt-Korrespondenzen (korrespondierende Merkmalspunkte) triangulieren, aber es werden keine Objekte ge¬ neriert, da die Triangulation über kein Modelwissen verfügt, das eine Punktewolke in sinnvolle Objekten Clustern könnte. Nachteile monokularer Systeme sind, dass Objekte nahe dem Epipol nur ungenau trianguliert werden können und sich dort kleinste Fehler in der Egomotion (Kamera-Eigenbewegung) bemerkbar machen . Als Epipol bezeichnet man den Bildpunkt in einem ersten Ka- merabild, an dem das Zentrum der Kamera zu einem zweiten Zeitpunkt abgebildet wird. Während einer Geradeausfahrt entspricht z.B. der Fluchtpunkt dem Epipol. Dies ist jedoch der relevante Bereich, um Kollisionen mit stehenden bzw. vorrausfahrenden Fahrzeugen zu erkennen. Dynamische Objekte können trianguliert werden, wenn sie sich gemäß der Epipolar-Geometrie bewegen. Sie werden jedoch aufgrund der nicht bekannten Relativgeschwindigkeit zu nah oder zu weit entfernt geschätzt. A starting point of the invention are the following considerations: If the camera positions of two frames (frames) are known, point correspondences can (corresponding feature points) triangulate, but there are no objects ge ¬ neriert because the triangulation has no model knowledge that a point cloud could clusters into meaningful objects. Disadvantages of monocular systems are that objects close to the epipole can only be inaccurately triangulated and there are the smallest errors in the egomotion (camera self-motion) noticeable. An epipole is the pixel in a first camera image, at which the center of the camera is imaged at a second time. For example, during a straight-ahead journey, the vanishing point corresponds to the epipole. However, this is the relevant area to detect collisions with stationary or forward vehicles. Dynamic objects can be triangulated as they move according to the epipolar geometry. However, they are estimated too close or too far away due to the unknown relative speed.
Werden anstelle einzelner Korrespondenzen, mehrere (benach- barte) Korrespondenzen (korrespondierende Merkmale) betrachtet, lassen sich Objekte aufgrund unterschiedlicher Geschwindig¬ keiten, Skalierungen und Deformation segmentieren. If, instead of individual correspondence, a plurality of (neigh- bouring) correspondences (corresponding features) are considered, objects can be due to different VELOCITY ¬ speeds, segment scaling and deformation.
Ein erfindungsgemäßes Verfahren zur Detektion von Objekten aus einer Folge von Bildern einer Fahrzeugkamera umfasst die Schritte : An inventive method for the detection of objects from a sequence of images of a vehicle camera comprises the steps:
a) Aufnahme einer Folge von Bildern mit der Fahrzeugkamera, b) Ermittlung von korrespondierenden Merkmalen in zwei aufeinander folgenden Bildern, a) taking a sequence of images with the vehicle camera, b) determining corresponding features in two successive images,
d) Zuordnung (benachbarter) ermittelter korrespondierender Merkmale in einem Bildbereich zu einer Ebene im Raum, und f) Bestimmung zusätzlicher korrespondierender Merkmale in dem Bildbereich unter Berücksichtigung der (in Schritt d) ) zugeordneten Ebene. d) assignment of (adjacent) determined corresponding features in an image area to a plane in space, and f) determination of additional corresponding features in the image area, taking into account the level associated with (in step d)).
Bevorzugt ist die Fahrzeugkamera zur Aufnahme einer Umgebung eines Fahrzeugs ausgebildet. Bei der Umgebung handelt es sich insbesondere um die vor dem Fahrzeug liegende Umgebung. Vor¬ zugsweise ist die Fahrzeugkamera in eine Fahrerassistenzvor- richtung integrierbar oder mit dieser verbindbar, wobei die Fahrerassistenzvorrichtung insbesondere zur Objekterkennung aus den von der Fahrzeugkameravorrichtung bereitgestellten Bilddaten ausgebildet ist. Bevorzugt ist die Fahrzeugkameravor- richtung eine im Innenraum des Kraftfahrzeugs hinter der Windschutzscheibe anzuordnende und in Fahrtrichtung gerichtete Kamera. Besonders bevorzugt ist die Fahrzeugkamera eine mo¬ nokulare Kamera. Bevorzugt werden mit der Fahrzeugkamera zu bestimmten bzw. bekannten Zeitpunkten Einzelbilder aufgenommen, woraus sich eine Folge von Bildern ergibt. Preferably, the vehicle camera is designed to receive an environment of a vehicle. The environment is in particular the environment in front of the vehicle. Before ¬ Preferably, the vehicle camera in a Fahrerassistenzvor- direction integrated or connectable to this, wherein the driver assistance device is formed in particular for object recognition from the provided by the vehicle camera device image data. Preferably, the vehicle camera device is a camera to be arranged in the interior of the motor vehicle behind the windshield and directed in the direction of travel. Particularly preferably, the vehicle camera is a mo ¬ nokulare camera. Preferably, individual images are taken with the vehicle camera at specific or known times, resulting in a sequence of images.
Als Korrespondenz wird die Entsprechung eines Merkmals in einem ersten Bild zu demselben Merkmal in einem zweiten Bild bezeichnet. Korrespondierende Merkmale in zwei Bildern können auch als Flussvektor beschrieben werden, der angibt wie sich das Merkmal im Bild verschoben hat. Ein Merkmal kann insbesondere ein Bildausschnitt (bzw. Patch) , ein Pixel, eine Kante oder eine Ecke sein. Correspondence is the equivalent of a feature in a first image to the same feature in a second image. Corresponding features in two images can also be described as a flow vector indicating how the feature has shifted in the image. In particular, a feature may be an image patch, a pixel, an edge or a corner.
Unter Schritt d) wird auch subsummiert, dass eine Mehrzahl von Ebenen im Raum vorgegeben wird, und eine Zuordnung von (benachbarten) korrespondierenden Merkmalen zu jeweils einer der vorgegebenen Eben vorgenommen wird (vgl. unten Schritt d2) bzw. d3) ) .  In step d), it is also subsumed that a plurality of levels is specified in space, and an assignment of (adjacent) corresponding features to one of the given levels is carried out (see step d2 below or d3)).
Der Begriff „Ebene" beschreibt im Kontext der vorliegenden Erfindung folgende Zusammenhänge: einerseits ein Kriterium zur Akkumulation benachbarter korrespondierender Merkmale. D.h. diese werden als zusammengehörig angesehen, wenn sie in einer gemeinsamen Ebene im Raum liegen und sich entsprechend der Bewegung der Ebene zeitlich entwickeln. The term "plane" in the context of the present invention describes the following relationships: on the one hand a criterion for the accumulation of adjacent corresponding features, ie these are considered to belong together if they lie in a common plane in space and develop in time according to the movement of the plane.
Derart akkumulierte korrespondierende Merkmale werden an¬ schließend als z.B. „Bodenebene" bezeichnet, da sie alle in der Ebene, die der Fahrbahnebene entspricht liegen. Jedoch erstreckt sich eine solche Bodenebene nicht ins Unendliche, sondern meint einen Teilbereich der Ebene, nämlich den, in dem tatsächlich korrespondierende Merkmale angeordnet sind. Such accumulated corresponding features are referred to as ¬ closing as "ground level", as they are all in the Plane corresponding to the road level. However, such a ground plane does not extend to infinity, but rather means a subarea of the plane, namely the one in which corresponding features are actually arranged.
In Schritt f) meint die Formulierung „unter Berücksichtigung...", dass die in Schritt d) korrespondierenden Merkmalen in einem Bildbereich zugeordnete Ebene bei der Bestimung zusätzlicher korrespondierender Merkmale berücksichtigt wird. Dies kann beispielsweise in der Art geschehen, dass anhand von wenigen korrespondierenden Merkmalen in einem Bildbereich eine Bewegung der zugeordneten Ebene bestimmt bzw. berechnet wird und dann prädiziert wird, wo Merkmale desselben Bildbereichs in einem ersten Bild infolge der Bewegung der zugeordnete Ebene in einem (nachfolgenden) zweiten Bild aufzufinden sein werden. Mit Hilfe dieser Prädiktion werden zusätzliche korrespondierende Merkmale ermittelt . In step f), the phrase "taking into account ..." means that the level associated with an image area in step d) is taken into account in determining additional corresponding features Features in an image area, a motion of the associated plane is determined and then predicted, where features of the same image area in a first image will be found in a (subsequent) second image as a result of the movement of the associated plane determined corresponding features.
Mit der Formulierung „Detektion von Objekten" kann also bei- spielsweise eine Generierung von Objekthypothesen bzw. Objekten gemeint sein. For example, the term "detection of objects" may mean a generation of object hypotheses or objects.
Gemäß einer bevorzugten Ausführungsform umfasst das Verfahren den Schritt: According to a preferred embodiment, the method comprises the step:
c) Berechnung von Homographien für die ermittelten korrespondierende Merkmale in einem Bildbereich, damit diese einer Ebene im Raum zugeordnet werden können. c) Calculation of homographies for the determined corresponding features in an image area so that they can be assigned to a level in the room.
Eine Homographie beschreibt die Korrespondenz von Punkten auf einer Ebene zwischen zwei Kamerapositionen bzw. die Korres- pondenz zweier Punkte in zwei aufeinanderfolgenden Bildern der Fahrzeugkamera. Durch die Berechnung von Homographien für die ermittelten korrespondierenden Merkmale in einem Bildbereich kann so die Zuordnung zu jeweils einer Ebene im Raum erfolgen (s. Schritt d) ) . Die Homographien werden bevorzugt generisch aus dem Bild bzw. aus aufeinanderfolgenden Bildern bestimmt. Eine Vorgabe von einem Abstand einer Ebene zur Kameraposition ist typischerweise nicht erforderlich . Homography describes the correspondence of points on a plane between two camera positions or the correspondence of two points in two consecutive images of the vehicle camera. By calculating homographies for the determined corresponding features in an image area, the assignment to one level in space can thus take place (see step d)). The homographies are preferably determined generically from the image or from successive images. A default of a distance of a plane to the camera position is typically not required.
Vorteilhaft umfasst das Verfahren die Schritte: Advantageously, the method comprises the steps:
d2) Zuordnung der ermittelten korrespondierenden Merkmale zu einer von einer Mehrzahl von Ebenen vorgegebener Orientierung im Raum, und d2) assignment of the determined corresponding features to one of a plurality of planes predetermined orientation in space, and
e) Zuordnung zu der Ebene im Raum, die für die ermittelten korrespondierenden Merkmale den kleinsten Rückprojektionsfehler ergibt, wobei der Rückprojektionsfehler den Unterschied an zwischen der gemessenen Korrespondenz eines Merkmals in zwei aufeinanderfolgenden Bildern und dem aus der berechneten Ho- mographie prädizierten Korrespondenz des Merkmals angibt. Mit anderen Worten bezeichnet der Rückprojektionsfehler einer Ebene die Differenz zwischen einem Punkt x zum Zeitpunkt t-0 und dem gemäß der Homographie dieser Ebene abgebildeten korrespondierenden Punktes zum vorangegangenen Zeitpunkt t-1 beschrieben wird (siehe unten: Gleichung 4) . e) Assignment to the plane in space which gives the least backprojection error for the identified corresponding features, the backprojection error indicating the difference in between the measured correspondence of a feature in two successive images and the prediction of the feature predicted from the computed homography. In other words, the backprojection error of a plane describes the difference between a point x at time t-0 and the corresponding point mapped according to the homography of that plane at the previous time t-1 (see below: equation 4).
Insbesondere anhand der berechneten Homographien können die korrespondierenden Merkmale segmentiert werden, also unterschiedlichen Bildbereichen (bzw. Segmenten) zugeordnet werden. In Schritt f) kann dann eine Bestimmung zusätzlicher korres- pondierender Merkmale in einem Bildbereich unter Berücksichtigung der zugeordneten Ebene erfolgen.  In particular, based on the calculated homographies, the corresponding features can be segmented, that is, assigned to different image regions (or segments). In step f), it is then possible to determine additional corresponding features in an image area taking into account the assigned plane.
Eine vorteilhafte Weiterbildung des Verfahrens umfasst den Schritt d3) : Zuordnung von (benachbarten) korrespondierenden Merkmalen zu jeweils einer Bodenebene, einer Rückwandebene oder einer Seitenwandebene . Im Falle eines Koordinatensystems, bei dem die x-Richtung horizontal bzw. lateral, die y-Richtung vertikal und die z-Richtung in Fahrzeuglängsrichtung verläuft, kann eine Bodenebene normal zur y-Richtung, eine Rückwandebene normal zur z-Richtung und eine Seitenwandebene normal zur x-Richtung vorgegeben werden. An advantageous development of the method comprises the step d3): Assignment of (adjacent) corresponding features to a respective ground level, a backplane or a sidewall level. In the case of a coordinate system in which the x-direction is horizontal or lateral, the y-direction vertical and the z-direction in the vehicle longitudinal direction, a ground plane normal to the y-direction, a backplane normal to the z-direction and a side wall plane normal to the x-direction can be specified.
Durch eine Berechnung von Homographien einer Bodenebene, einer Rückwandebene und einer Seitenwandebene kann für korrespon- dierende Merkmale in einem Bildbereich bzw. für jedes korrespondierende Merkmal eine Zuordnung zu einer dieser Ebenen erfolgen. Der Abstand (von der Fahrzeugkamera) insbesondere zu einer Rückwand- oder Seitenwandebene ist vorteilhaft das Er¬ gebnis der Homographieberechnung und nicht etwa eine vorgegebene Annahme. By calculating homographies of a ground plane, a backplane and a sidewall plane, an assignment to one of these planes can take place for corresponding features in an image area or for each corresponding feature. The distance (from the on-vehicle camera), in particular to a rear wall or side wall layer is advantageous that He ¬ result of Homographieberechnung and not a predetermined assumption.
Bevorzugt können die Homographien für die Rückwandebene nach Gleichung (10) bzw. für die Bodenebene nach Gleichung (9) bzw. für die Seitenwandebene nach Gleichung (11) berechnet werden. Hierbei sind a, b, c Konstanten, xo , yo , xi , yi bezeichnen Korrespondenzen im ersten Bild (Index 0), aufgenommen zu einem Zeitpunkt t-0, und zweiten Bild (Index 1), aufgenommen zu einem früheren Zeitpunkt t-1, und tx, ty, tz sind die Komponenten des Vektors t/d. t beschreibt die Translation der Fahrzeugkamera und d die Entfernung zu einer Ebene (senkrecht zu dieser Ebene) , also entlang des Normalenvektors dieser Ebene. Die Komponenten tx, ty bzw. tz werden im Folgenden auch als „inverse TTC" bezeichnet. TTC kommt von , Time to collisionx und ergibt sich in einer Raumrichtung als Abstand geteilt durch Translationsgeschwindigkeit . Preferably, the homographies for the backplane can be calculated according to equation (10) or for the ground plane according to equation (9) or for the sidewall plane according to equation (11). Here, a, b, c are constants, xo, yo, xi, yi denote correspondences in the first image (index 0) taken at a time t-0, and a second image (index 1) taken at an earlier time t-1 and t x, t y, t z are the components of the vector t / d. t describes the translation of the vehicle camera and d the distance to a plane (perpendicular to this plane), ie along the normal vector of this plane. The components t x , t y and t z are also referred to below as "inverse TTC." TTC comes from, time to collision x and results in a spatial direction as a distance divided by translation speed.
Vorteilhaft können ausgehend von einer bereits ermittelten Aufteilung eines Bildes in unterschiedliche Bildbereiche mit jeweils einer zugeordneten Ebene für ein zweites Bild, erste bzw. wenige einander korrespondierende Merkmale in einem Bildbereich im zweiten und einem nachfolgenden dritten Bild bestimmt werden. Aus diesen ersten bzw. wenigen korrespondierenden Merkmalen wird dann eine Homographie für diesen Bildbereich neu berechnet, und die neu berechnete Homographie wird dazu verwendet, die Position und Form zusätzlicher bzw. weiterer korrespondierender Merkmale im dritten Bild zu prädizieren. Bevorzugt können, falls in einem nachfolgenden dritten Bild in einem Bildbereich nicht genügend (erste) korrespondierende Merkmale zur Neuberechnung einer Homographie bestimmbar sind, die für den Bildbereich (anhand des ersten und zweiten Bildes) berechnete Homographie aus dem zweiten Bild dazu verwendet werden, die Position und Form zusätzlicher korrespondierender Merkmale des Bildbereichs im dritten Bild zu prädizieren. Advantageously, starting from an already determined division of an image into different image regions, each with an associated plane for a second image, first or few mutually corresponding features in an image region in the second and a subsequent third image can be determined. From this first or a few corresponding features then a homography for this image area is recalculated, and the newly calculated homography is used to predict the position and shape of additional or further corresponding features in the third image. Preferably, if in a subsequent third image in an image area not enough (first) corresponding features for the recalculation of a homography can be determined, the homography from the second image calculated for the image area (based on the first and second images) can be the position and predetermining additional corresponding features of the image area in the third image.
Dadurch wird die Korrespondenzfindung robuster gegen Form- und Skalenänderungen gestaltet. Gemäß einer bevorzugten Ausgestaltung kann für jeden Bildbereich mit einer zugeordneten Ebene ein aktuelles Bild auf ein vorheriges Bild entsprechend der berechneten Homographie (der zugeordneten Ebene) gewarpt (projiziert bzw. transformiert) werden, um zusätzliche einander im letzten und im aktuellen Bild korrespondierende Merkmale zu bestimmen. Auch diese Ausge¬ staltung führt zu einer Verdichtung des optischen Flussfeldes. This makes the correspondence finding more robust against changes in shape and scale. According to a preferred embodiment, for each image area with an associated level, a current image may be warped (projected or transformed) onto a previous image corresponding to the computed homography (the associated plane) to determine additional features corresponding to each other in the last and in the current image , These Fully ¬ staltung leads to compression of the optic flow field.
Gemäß einer vorteilhaften Weiterbildung können, falls mehrere Ebenen mit identischer Orientierung auftreten, die Ebenen mit identischer Orientierung anhand der zugehörigen tx, ty, tz -Werte getrennt werden. Beispielsweise können zwei Rückwandebenen, die in z-Richtung unterschiedlich weit von der Fahrzeugkamera entfernt sind, über unterschiedliche tz-Werte voneinander unterschieden werden. According to an advantageous development, if several levels occur with identical orientation, the planes with identical orientation can be separated on the basis of the associated t x , t y , t z values. For example, two backplane levels, which are different distances from the vehicle camera in the z-direction, can be distinguished from each other by different t z values.
Bevorzugt kann ein Bild durch ein Gitter in gleichartige Zellen unterteilt werden, und für jede Zelle kann aus den darin er¬ mittelten korrespondierenden Merkmalen eine Homographie be- rechnet werden. Zellen mit übereinstimmender Homographie können anschließend geclustert werden. Preferably, an image can be subdivided by a grid into similar cells and for each cell may be made of the fact he ¬ mediated corresponding features a homography loading be expected. Cells with consistent homography can then be clustered.
Bevorzugt kann, falls die berechnete Homographie einer ersten Zelle nicht hinreichend mit einer Homographie einer benachbarten Zelle übereinstimmt, zur Ermittlung einer Ebenengrenze vor¬ teilhaft ein sogenannter Rückprojektionsfehler einzelner korrespondierender Merkmale betrachtet werden. Preferably, if the calculated homography a first cell is not sufficiently matches a homography a neighboring cell for determining a level limit, a so-called rear projection errors of the various corresponding features are considered before ¬ geous.
Korrespondierende Merkmale können durch den Rückproj ektions- fehler bewertet werden. Der Rückprojektionsfehler gibt den Unterschied an zwischen dem gemessenen Fluss und dem aus der berechneten Homographie prädizierten Fluss an.  Corresponding characteristics can be evaluated by the backprojection error. The backprojection error indicates the difference between the measured flux and the flux predicted from the computed homography.
Wird der Rückprojektionsfehler eines korrespondierenden Merkmals in einer ersten Zelle mit den Rückprojektionsfehlern der Homographien der benachbarten Zellen verglichen und dieses korrespondierende Merkmal der Homographie mit dem geringstem Fehler zugewiesen werden, kann die Ebenengrenze (bzw. Segmentgrenze bzw. Clustergrenze) innerhalb der ersten Zelle verfeinert werden. Auf diese Weise können verschiedene kor- respondierende Merkmale einer Zelle unterschiedlichen Ebenen zugeordnet werden.  If the backprojection error of a corresponding feature in a first cell is compared with the backprojection errors of the neighboring cell homographies and that corresponding least-homography feature is assigned, then the boundary (or cluster boundary) within the first cell can be refined. In this way, different corresponding characteristics of a cell can be assigned to different levels.
Bevorzugt kann die Zuordnung von Ebenen zu benachbarten korrespondierenden Merkmalen im Wesentlichen im gesamten Bild der Fahrzeugkamera (z.B. in mindestens 80% der Bildfläche, bevorzugt mindestens 90%) ermittelt werden. Da das erfindungsgemäße Verfahren sehr schnell ausgestaltet werden kann, ist eine generische Obj ektdetektion bzw. Szeneninterpretation für nahezu das gesamte Bild in Echtzeit möglich. Preferably, the assignment of planes to adjacent corresponding features can be determined substantially in the entire image of the vehicle camera (for example in at least 80% of the image area, preferably at least 90%). Since the method according to the invention can be designed very quickly, generic object detection or scene interpretation is possible for almost the entire image in real time.
Gegenstand der Erfindung ist weiterhin eine Vorrichtung zur Detektion von Objekten aus einer Folge von Bildern einer Fahrzeugkamera umfassend ein Kamerasteuergerät und eine Aus¬ werteelektronik. Das Kamerasteuergerät ist dazu ausgebildet, The invention further provides an apparatus for detecting objects of a sequence of images of an in-vehicle camera comprising a camera control device and an off ¬ evaluation electronics. The camera control unit is designed to
a) eine Folge von Bildern mit der Fahrzeugkamera aufzunehmen. Die Auswerteelektronik ist dazu ausgebildet, a) to record a sequence of images with the vehicle camera. The transmitter is designed to
b) korrespondierende Merkmale in einem Bildbereich in zwei aufeinander folgenden Bildern zu ermitteln, b) to determine corresponding features in one image area in two successive images,
d) die ermittelten korrespondierender Merkmale in einem Bildbereich zu einer Ebene im Raum zuzuordnen, und d) to assign the determined corresponding features in an image area to a plane in the room, and
f) zusätzliche korrespondierende Merkmale in dem Bildbereich unter Berücksichtigung der zugeordneten Ebene zu bestimmen. f) determine additional corresponding features in the image area taking into account the associated plane.
Das Kamerasteuergerät bzw. die Auswertungselektronik können insbesondere einen MikroController oder -prozessor, einen Digital Signal Processor (DSP) , einen ASIC (Application Specific Integrated Circuit) , einen FPGA (Field Programmable Gate Array) und dergleichen mehr sowie Software zur Durchführung der entsprechenden Steuerungs- bzw. Auswertungsschritte umfassen. Die vorliegende Erfindung kann somit in digitalen elektronischen Schaltkreisen, Computer-Hardware, Firmware oder Software im¬ plementiert sein. The camera control unit or the evaluation electronics may in particular comprise a microcontroller or processor, a digital signal processor (DSP), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array) and the like, as well as software for carrying out the corresponding control or evaluation steps include. The present invention thus may be plemented in digital electronic circuitry, computer hardware, firmware or software in ¬.
Weitere Merkmale, Vorteile und Wirkungen der Erfindung ergeben sich aus der nachfolgenden Beschreibung bevorzugter Ausführungsbeispiele der Erfindung. Dabei zeigen: Further features, advantages and effects of the invention will become apparent from the following description of preferred embodiments of the invention. Showing:
Fig. 1 schematisch eine typische Deformation einer sich nähernden Rückwandebene; Fig. 1 shows schematically a typical deformation of an approaching backplane;
Fig. 2 schematisch eine typische Deformation einer sich nähernden Bodenebene; Fig. 2 schematically shows a typical deformation of an approaching ground plane;
Fig. 3 schematisch eine typische Deformation a) einer sich schnell und b) einer sich langsam nähernden oder weiter entfernten Rückwandebene; Fig. 4 schematisch eine Unterteilung eines Bildes mit zwei unterschiedlichen Segmenten in Zellen; Fig. 3 shows schematically a typical deformation a) of a fast and b) a slowly approaching or further away backplane; Fig. 4 shows schematically a subdivision of an image with two different segments into cells;
Fig. 5 Segmentierungsergebnisse nach einem dritten Fig. 5 Segmentation results after a third
Iterationsschritt ;  Iteration step;
Fig. 6 Ebenen-Orientation zur Target Validierung Fig. 6 Plane orientation for target validation
(Validierung potentieller Kollisionsobekte) ;  (Validation of potential collision effects);
Fig. 7 Time to Collision-Betrachtung; Fig. 7 time to collision view;
Fig. 8 Projektion (bzw. Warpen) des Leitplankensegments zum Zeitpunkt t-0 (rechts) auf t-1 (links) . Fig. 8 Projection (or warping) of the guardrail segment at time t-0 (right) to t-1 (left).
Einander entsprechende Teile sind in der Regel in allen Figuren mit denselben Bezugszeichen versehen. Corresponding parts are generally provided in all figures with the same reference numerals.
In Fig. 1 ist schematisch eine Rückwandebene (back plane) dargestellt, die zu einem ersten Zeitpunkt t-1 den schraffiert dargestellten Bereich (20, gepunktete Linie) einnimmt. Zu einem darauf folgenden Zeitpunkt t hat sich der Abstand zwischen der Fahrzeugkamera und der Rückwandebene verringert, was zu der durch die Pfeile (dl) angedeuteten Deformation des Bereichs (21, durchgezogene Linie) der Rückwandebene im Bild führt . Der Bereich (20; 21) skaliert bzw. vergrößert sich infolge der Relativ¬ bewegung von der Fahrzeugkamera zu der Rückwandebene. In Fig. 1, a backplane is shown schematically (back plane), which occupies the hatched area (20, dotted line) at a first time t-1. At a subsequent time t, the distance between the vehicle camera and the rear wall plane has decreased, which leads to the deformation of the area (21, solid line) of the backplane in the image indicated by the arrows (d1). The range (20; 21) scales or increases as a result of the relative movement of the vehicle camera to the backplane.
In Fig. 2 ist schematisch eine Bodenebene (ground plane) dargestellt, die zu einem ersten Zeitpunkt t-1 den schraffiert dargestellten Bereich (30, gepunktete Linie) einnimmt. Dies könnte ein Abschnitt einer Fahrbahnoberfläche sein, auf der das Fahrzeug fährt. Infolge der Eigenbewegung der Fahrzeugkamera ändert sich der Bereich (im Bild) zu einem darauf folgenden Zeitpunkt t, was zu der durch die Pfeile (d2) skizzierten Deformation des Bereichs (32) der Bodenebene führt . Zum Zeitpunkt t begrenzen die mit 32 bezeichneten Linien den Bereich der Bodenebene. Unter der „Bodenebene" wird hier also ein abge- grenzter Bereich auf der Fahrbahnoberfläche verstanden. Der Randbereich ergibt sich z.B. aus Signaturen (bzw. Randpunkten) auf der Fahrbahnoberfläche, die in der Bilderfolge getrackt werden können. Fig. 3 veranschaulicht den Unterschied zwischen einer sich schnell (Fig. 3a: 20, 21; Deformation dl) und einer sich langsam (Fig. 3b) nähernden Rückwandebene (20, 23; Deformation d3) , falls zum Zeitpunkt t-1 die Rückwandebene (20) in Fig. 3a denselben Abstand zur Fahrzeugkamera aufweist wie die Rückwandebene (20) in Fig. 3b. FIG. 2 schematically shows a ground plane (ground plane) which occupies the region (30, dotted line) shown hatched at a first instant t-1. This could be a section of road surface on which the vehicle is traveling. As a result of the self-motion of the vehicle camera, the area (in the picture) changes to a subsequent one Time t, which leads to the sketched by the arrows (d2) deformation of the region (32) of the ground plane. At time t, the lines labeled 32 limit the area of the ground plane. The "edge plane" is thus understood to mean, for example, signatures (or boundary points) on the roadway surface that can be tracked in the image sequence Fig. 3a: 20, 21, deformation dl) and a slowly (Fig. 3b) approaching backplane (20, 23, deformation d3), if at time t-1, the backplane (20) in Fig. 3a the same Distance to the vehicle camera has as the backplane (20) in Fig. 3b.
Alternativ könnte Fig. 3 den Unterschied zwischen einer nahen Rückwandebene (Fig. 3a: 20, 21; Deformation dl) und einer weiter entfernten Rückwandebene (20, 23; Deformation d3) darstellen, die sich z.B. mit derselben (Relativ-) Geschwindigkeit bewegen, dann wäre das in Fig. 3b dargestellte Objekt (20, 21) im realen Raum größer als das in Fig. 3a dargestellte Objekt (20, 23) .  Alternatively, Figure 3 could illustrate the difference between a near backplane (Figure 3a: 20, 21; deformation dl) and a more distant backplane (20, 23; deformation d3), e.g. moving at the same (relative) speed, then the object (20, 21) shown in Fig. 3b would be larger in real space than the object (20, 23) shown in Fig. 3a.
Werden anstelle einzelner Korrespondenzen, mehrere benachbarte Korrespondenzen betrachtet, lassen sich Objekte aufgrund unterschiedlicher Geschwindigkeiten, Skalierungen und Deformation segmentieren . If several adjacent correspondences are considered instead of individual correspondences, objects can be segmented due to different speeds, scaling and deformation.
Geht man davon aus, dass die Welt aus Ebenen besteht, kann man diese durch Homographien beschreiben und wie im Folgenden gezeigt wird über Ihre Distanz, Geschwindigkeit und Orientierung trennen. Assuming that the world is made up of layers, you can describe them with homographies and, as shown below, separate them by their distance, speed and orientation.
Eine Homographie beschreibt die Korrespondenz von Punkten auf einer Ebene zwischen zwei Kamerapositionen bzw. die Korrespondenz zweier Punkte in zwei aufeinanderfolgenden Frames: XQ 'Χ-^' A homography describes the correspondence of points on a plane between two camera positions or the correspondence of two points in two consecutive frames: XQ ' Χ- ^ '
xt0 = H * xtl mit xt0 = y0 , xtl— Vi x t0 = H * x tl with x t0 = y 0 , x tl - Vi
L 1 -1 Li J  L 1 -1 Li J
Hierbei beschreibt der Vektor xt0 die 3D-Korrespondenz zum Zeitpunkt t-0 des Vektors xtl zum Zeitpunkt t-1. Eine Homographie kann bildbasiert durch Kenntnis von vier Punkt-Korrespondenzen berechnet werden (vgl. Tutorial: Multiple View Geometry, Hartley, R. and Zisserman, A . , CVPR June 1999: Here, the vector x t0 describes the 3D correspondence at time t-0 of the vector x tl at time t-1. Homography can be calculated image-based by knowing four point correspondences (see Tutorial: Multiple View Geometry, Hartley, R. and Zisserman, A, CVPR June 1999:
https : //de . scribd. com/document/96810936/Hartley-Tut-4up ab¬ gerufen am 26.09.2016) . Die auf Seite 6 des Tutorials links oben (Folie 21) angegebenen Zusammenhänge lassen sich in der Notation von Gleichung 1 wie folgt formulieren: https: // en. scribd. com / document / 96810936 / Hartley-Tut-4up from ¬ launched on 26/09/2016). The relationships given on page 6 of the tutorial top left (slide 21) can be formulated in the notation of equation 1 as follows:
Figure imgf000014_0001
Figure imgf000014_0001
Alternativ kann bei Kenntnis der Kameratranslation t, der Rotation R und der Entfernung d entlang des Normalen Vektors n der Ebene die Homographie nach Gleichung 3 berechnet werden. Gleichung 3 verdeutlicht, dass sich bei einer inversen TTC t/d ungleich Null, Ebenen mit unterschiedlichen Orientierung n modellieren lassen und dass sich Ebnen mit identischer Orientierung n über ihre inverse TTC trennen lassen. Alternatively, knowing the camera translation t, the rotation R and the distance d along the normal vector n of the plane, the homography of Equation 3 can be calculated. Equation 3 illustrates that with an inverse TTC t / d not equal to zero, planes with different orientation n can be modeled and that flattening with identical orientation n can be separated by their inverse TTC.
« = [«-£ ] (3) Eine Homographie lässt sich theoretisch in den Normalenvektor n, die Rotationsmatrix R und die inverse TTC t/d zerlegen. Leider ist diese Zerlegung numerisch äußerst instabil und empfindlich auf Messfehler. «= [« - £] (3) A homography can theoretically be decomposed into the normal vector n, the rotation matrix R and the inverse TTC t / d. Unfortunately, this decomposition is numerically extremely unstable and sensitive to measurement errors.
Beschreibt man eine Szene durch Ebenen, lässt sie sich wie im Folgenden angegeben segmentieren. If you describe a scene through layers, you can segment it as shown below.
Fig. 4 zeigt schematisch eine Unterteilung in Zellen (Grid, Gitter/-linien) . Die Szene wird in NxM initiale Zellen unterteilt und jeder Punkt-Korrespondenz wird eine eindeutige ID zuge¬ wiesen. Diese ID gibt zunächst die Zugehörigkeit zu einer Zelle an. Im weiteren Verlauf kann die ID die Zugehörigkeit zu einem Cluster oder einem Objekt angeben. Fig. 4 shows schematically a subdivision into cells (grid, grid / lines). The scene is divided into NxM initial cells, and each point correspondence is a unique ID-assigned ¬. This ID first indicates the affiliation to a cell. In the further course, the ID can indicate the membership of a cluster or an object.
Schraffiert ist ein Objekt (insb. eine Rückwandebene) im Vordergrund dargestellt. Der Hintergrund ist weiß dargestellt. Beinhaltet eine Zelle nur ein Objekt (Zellen B3, D3) wird eine Homographie diese Zelle sehr gut beschreiben. Beinhaltet eine Zelle jedoch mehr als ein Objekt (Zelle C3) , wird die Homographie keines der beiden Objekte gut beschreiben. Werden die Punkt-Korrespondenzen ( schwarzer Punkt bzw . schwarzes Kreuz bzw . x) den Clustern (bzw. Segment) der benachbarten Zellen (B3 bzw. D3) über Ihre Rückprojektionsfehler zugeordnet, wird der schwarze Punkt dem Segment der Zelle B3 und das schwarze Kreuz dem Segment der Zelle D3 zugeordnet, da die Homographie für die Zelle C3 weder den Vordergrund noch den Hintergrund gut be¬ schreibt . Hatched is an object (especially a backplane) in the foreground. The background is white. If a cell contains only one object (cells B3, D3), homography will describe this cell very well. However, if a cell contains more than one object (cell C3), the homography will not describe any of the two objects well. If the point correspondences (black dot or black cross or x) are assigned to the clusters (or segment) of the neighboring cells (B3 or D3) via their backprojection errors, the black dot becomes the segment of cell B3 and the black cross assigned to the segment of the cell D3, since the homography for the cell C3 neither the foreground nor the background well ¬ writes.
Ist Vorwissen über eine Szene vorhanden, lassen sich die Segmentgrößen an die Szene anpassen, indem z.B. größere Bereiche im Nahbereich des Fahrzeuges oder in Bereichen mit positiver Klassifikations-Antwort generiert werden. Für jedes Segment wird, wie in den Gleichungen 5 bis 10 gezeigt wird, eine de- dizierte Back-/Ground- und Side-Plane-Homographie berechnet. If there is prior knowledge of a scene, the segment sizes can be adapted to the scene, for example, by generating larger areas in the vicinity of the vehicle or in areas with a positive classification answer. For every segment For example, as shown in Eqs. 5-10, a de- termined back / ground and side-plane homography is computed.
Die Berechnung der Back-/Ground- und Side-Plane-Homographie, erhöht die Trennschärfe, da eine Homographie mit weniger Freiheitsgraden Bereiche, die unterschiedliche Ebenen bein¬ halten, nur schlecht modellieren kann und somit korrespondierende Punkte einen höheren Rückprojektionsfehler aufweisen werden, siehe Fig. 4. Der Rückprojektionsfehler e± ist also ein Maß dafür, wie gut ein Punkt x zum Zeitpunkt t-0 durch die Homographie einer Ebene i des korrespondierenden Punktes zum Zeitpunkt t-1 beschrieben wird: x to (4) Setzt man die statische Einbaulage der Kamera und Kamera Rotation in zwei unterschiedlichen Ansichten als gegeben voraus (z.B. durch Kenntnis der Kamera Kalibration und durch die Berechnung der Fundamental-Matrix in einem monokularen System oder durch Rotationswerte eines Drehratensensor-Clusters ) , lässt die inverse TTC t/d mittels der um die statische Kamera-Rotation kompensierten Flussvektoren berechnen, wie im Folgenden exemplarisch für eine Ground Plane n' = [010] gezeigt wird. Ist die Rotation nicht bekannt, kann sie näherungsweise durch eine Einheitsmatrix ersetzt werden. The calculation of the baking / ground- and side-plane homography, increases the selectivity, since an homography with fewer degrees of freedom areas, consider the differing levels leg ¬ can model poorly and thus corresponding points will have a higher rear-projection error, see Figure 4. The backprojection error e ± is therefore a measure of how well a point x at time t-0 is described by the homography of a plane i of the corresponding point at time t-1: x to (4) Set the static mounting position Given the camera and camera rotation in two different views as given (eg by knowing the camera calibration and by calculating the fundamental matrix in a monocular system or by rotation values of a rotation rate sensor cluster), the inverse TTC t / d is reversed calculate the static camera rotation compensated flux vectors, as exemplified below for a ground plane n '= [010] is shown. If the rotation is not known, it can be approximately replaced by a unit matrix.
Ersetzt man den Quotienten t/d in Gleichung 3 durch die inverse If we replace the quotient t / d in equation 3 by the inverse
Time Time
Figure imgf000016_0001
Durch Einführung der Konstanten a, b, c, wobei ist ,
Figure imgf000017_0001
Figure imgf000016_0001
By introducing the constants a, b, c, where is,
Figure imgf000017_0001
ergibt Gleichung 5 die vereinfachte Form: Equation 5 gives the simplified form:
(6)
Figure imgf000017_0005
(6)
Figure imgf000017_0005
Durch Normierung der homogenen Koordinaten ergibt sich: By normalizing the homogeneous coordinates results:
(7)
Figure imgf000017_0002
(7)
Figure imgf000017_0002
Für mehr als eine Messung ergibt sich ein Gleichungssystem der Form Mx = v, mit einem zu bestimmenden Vektor x, einer Matrix M und einem Vektor v (siehe Gleichung 9) , das sich für mindestens drei Bild-Korrespondenzen als Stützstellen durch z.B. eine Singular Value Decomposition ( SingulärwertZerlegung der Matrix) oder ein Least-Square-Verfahren lösen lässt. For more than one measurement, a system of equations of the form Mx = v, with a vector x to be determined, a matrix M and a vector v (see Equation 9), which can be used for at least three image correspondences as support points by e.g. solve a singular value decomposition (singular value decomposition of the matrix) or a least square method.
Figure imgf000017_0003
Figure imgf000017_0003
Die Herleitung der Back- und Side-Plane-Homographien erfolgt analog und ergibt: The derivation of the back and side plane homographies is analogous and yields:
Figure imgf000017_0006
Figure imgf000017_0004
Um größere, aus mehreren Zellen bestehende Objekte zu seg¬ mentieren, lassen sich in einem weiteren Schritt benachbarte
Figure imgf000017_0006
Figure imgf000017_0004
Bigger, consisting of several cell objects to seg ¬ menting, can be adjacent in a further step
Zellen zusammenfassen, indem die Rückprojektionsfehler £ to—Summarizing cells by using the backprojection errors £ t o-
Hj xt l l bzw . Y,xt J 0— Hi^ti über Stützstellen (siehe unten Punkt 1.: RANSAC) der benachbarten Segmente j und i und deren Homographien berechnet werden. Zwei benachbarte Cluster werden zusammen- gefasst, falls £ to— HjXt l l kleiner £ to— H£#ti ist oder z.B. der auf die prädizierte Flusslänge normierte Rückprojektionsfehler unter einer einstellbaren Schwelle liegt. Insbesondere können zwei benachbarte Cluster zusammengefasst werden, falls Σχ ο HjXt l l kleiner £ to—
Figure imgf000018_0001
ist und die beiden Rückproj ektionsfehler
Figure imgf000018_0002
Hixti eine auf die Flusslänge normierte Schwelle unterschreiten. Alternativ lassen sich Rückprojektionsfehler als Potentiale in einem Graph verwenden und eine globale Lösung berechnen. Die Kompaktheit der Cluster lässt sich hierbei über die Kantenpotentiale im Graphen bestimmen.
Hj x t l l resp. Y, x t J 0 - Hi ^ t i via nodes (see below point 1 .: RANSAC) of the adjacent segments j and i and their homographies are calculated. Two adjacent clusters are summarized if £ t o- HJX t l l smaller £ t £ H o- # t ii st or, for example, normalized to the predicted flow length backprojection error is below an adjustable threshold. In particular, two adjacent clusters can be grouped together if Σχ ο - HjX t l l smaller t t o-
Figure imgf000018_0001
and the two reproduction errors
Figure imgf000018_0002
Hi x ti falls below a threshold normalized to the flow length. Alternatively, backprojection errors can be used as potentials in a graph and compute a global solution. The compactness of the clusters can be determined by the edge potentials in the graph.
Wurden die Segmente zusammengefasst , werden die Homographien neu berechnet und die Punkt-Korrespondenzen den Clustern mit ge- ringstem Rückprojektionsfehler zugeordnet. Betrachtet man nur direkt angrenzende Cluster, lassen sich sehr kompakte Objekte generieren. Überschreitet der minimale Fehler eine einstellbare Schwelle, werden den Korrespondenzen neue (Cluster-/Objekt-) IDs zugewiesen, um teilverdeckte Objekte oder Objekte mit leicht unterschiedlicher TTC erkennen zu können. Durch die Einstellung der Schwelle kann die Auflösung (leicht) unterschiedlicher Objekte angepasst werden. When the segments have been combined, the homographies are recalculated and the point correspondences are assigned to the clusters with the least backprojection error. If you only consider directly adjacent clusters, very compact objects can be generated. If the minimum error exceeds an adjustable threshold, the correspondences are assigned new (cluster / object) IDs in order to be able to recognize partially concealed objects or objects with slightly different TTCs. By setting the threshold, the resolution (slightly) of different objects can be adjusted.
Die Rückprojektionsfehler lassen sich mit einem Bias versehen, der Kosten für zusammenhängende Bereiche reduziert oder einem Bias, der die Kosten für einen ID-Wechsel erhöht, falls Punkt-Korrespondenzen über eine längere Zeit dieselbe ID-Zugehörigkeit hatten. Fig. 5 zeigt ein Beispiel einer Szenensegmentierung: The backprojection errors can be biased to reduce costs for contiguous areas or a bias that increases the cost of an ID change if point correspondences have had the same ID affiliation over an extended period of time. Fig. 5 shows an example of scene segmentation:
Fig. 5a zeigt ein Bild, das von einer Fahrzeugkamera aufgenommen wurde, die im Inneren des Fahrzeugs angeordnet ist und die vorausliegende Umgebung durch die Windschutzscheibe erfasst. Zu sehen ist eine dreispurige Fahrbahn (51) , z.B. eine Autobahn. Die Fahrspuren sind durch entsprechende Fahrspurmarkierungen getrennt. Auf allen drei Fahrspuren fahren Fahrzeuge. Das auf der eigenen Fahrspur vorausfahrende Fahrzeug (53) verdeckt mög- licherweise weitere auf der eigenen Fahrspur befindliche vo¬ rausfahrende Fahrzeuge. Links der dreispurigen Fahrbahn befindet sich eine bauliche erhabene Begrenzung (52) zur Gegenfahrbahn. Rechts der dreispurigen Fahrbahn (51) befindet sich ein Randbzw. Standstreifen, der nach rechts von einer Leitplanke begrenzt wird, hinter der sich ein Waldgebiet anschließt. In einiger Entfernung vor dem eigenen Fahrzeug sind Schilderbrücken (54) zu erkennen, von denen eine die dreispurige Fahrbahn (51) überspannt . Analog dem anhand von Fig. 4 beschriebenen Verfahren, kann diese Szene segmentiert werden. In Fig. 5b bis 5d sind Zellen (56) zu erkennen. In den Zellen sind Punktkorrespondenzen (55) dargestellt. Die Zuordnung einer Zelle (56) zu einem Segment ist über die Farbe des Zellrahmens bzw. der Punktkorrespondenzen (55) dargestellt. Fig. 5a shows an image taken by a vehicle camera disposed inside the vehicle and detecting the surrounding environment through the windshield. You can see a three-lane road (51), eg a motorway. The lanes are separated by corresponding lane markings. On all three lanes drive vehicles. The preceding vehicle in the same lane vehicle (53) covered possible SHORT- more present on the own lane vo ¬ out moving vehicles. On the left of the three-lane road is a built-up raised boundary (52) to the opposite lane. Right of the three-lane road (51) is a Randbzw. Hard shoulder bordered to the right by a guardrail, followed by a forest area. At some distance in front of their own vehicle gantries (54) can be seen, one of which spans the three-lane roadway (51). Analogous to the method described with reference to FIG. 4, this scene can be segmented. FIGS. 5b to 5d show cells (56). Point correspondences (55) are shown in the cells. The assignment of a cell (56) to a segment is shown by the color of the cell frame or point correspondences (55).
Fig. 5b zeigt den roten Kanal des segmentierten Bildes,  Fig. 5b shows the red channel of the segmented image,
Fig. 5c den grünen Kanal und Fig. 5d den blauen Kanal. Fig. 5c the green channel and Fig. 5d the blue channel.
Unterschiedliche Segmente wurden mit unterschiedlichen Farben versehen. Ein Segment, welches im Original grün ist, erstreckt sich über die untersten fünf bis sechs Zeilen (in Fig. 5b und 5d entsprechend weiss dargestellt und ohne Zellrahmen) . Dieses Segment entspricht der Bodenebene, also der Oberfläche der Fahrbahn (51), auf der das eigene Auto fährt. Ein weiteres Segment ist in der Mitte des Bildes zu erkennen, im Original ist es pink. Daher weist es in Fig. 5b hohe Rotwerte auf, in Fig. 5d schwächere Blauwerte und in Fig. 5c keine Grünwerte. Dieses Segment entspricht der Rückwandebene des auf der eigenen Fahrspur vorausfahrenden (Transporter-) Fahrzeugs (53) . Different segments were provided with different colors. A segment, which is green in the original, extends over the lowest five to six lines (shown correspondingly white in FIGS. 5b and 5d and without a cell frame). This segment corresponds to the ground plane, ie the surface of the road (51) on which your own car drives. Another segment can be seen in the middle of the picture, in the original it is pink. Therefore, it has high red values in FIG. 5b, weaker blue values in FIG. 5d and no green values in FIG. 5c. This segment corresponds to the backplane of the (lorry) vehicle (53) traveling in its own lane.
Das gezeigte Segmentierungsergebnis wurde ohne Vorwissen über die Szene in nur drei Iterationsschritten ermittelt. Das zeigt die enorme Schnelligkeit und Leistungsfähigkeit einer Aus¬ führungsform der Erfindung durch zeitliche Integration. The segmentation result shown was determined without prior knowledge of the scene in only three iterations. This shows the enormous speed and performance of an embodiment of the invention by temporal integration.
Fig. 6 zeigt eine Ermittlung der Orientierung von Ebenen in der bereits bei Fig. 5 beschriebenen Szene. Fig. 6a zeigt zur Orientierung nochmals die Umgebungssituation gemäß Fig. 5a. Sämtliche Korrespondenzen, die einer Seitenwandebene zugeordnet zeigt Fig. 6b. Die Korrespondenzen am linken Rand wurden einer rechten Seitenwandebene zugeordnet, was zutreffend ist, da dort im Bild die rechte Seite der baulichen Begrenzung (52) zur Gegenfahrbahn befindlich ist. Die Korrespondenzen in der rechten Bildhälfte wurden linken Seitenwandebenen zugeordnet, was ebenfalls zutreffend ist, da dort die „linke Seite" der Fahrbahnrandbebauung bzw. -bepflanzung im Bild befindlich ist. Fig. 6c zeigt, welche Korrespondenzen einer Bodenebene zuge¬ ordnet werden, was zutreffend ist, da dort im Bild die Oberfläche der Fahrbahn (51) zu sehen ist. FIG. 6 shows a determination of the orientation of planes in the scene already described in FIG. 5. FIG. 6a again shows the environmental situation according to FIG. 5a for orientation. All correspondences associated with a sidewall plane are shown in Fig. 6b. The correspondences at the left edge were assigned to a right side wall plane, which is true, as there is the right side of the structural boundary (52) to the opposite lane in the picture. The correspondence in the right half were left side wall levels associated, which is also applicable, since there is located "left side" of the road-edge development or -bepflanzung in the image. FIG. 6c shows the correspondence of a bottom level are supplied ¬ assigns what N is because there in the picture, the surface of the road (51) can be seen.
Fig. 6d zeigt, welche Korrespondenzen einer Rückwandebene zugeordnet werden. Das ist weitestgehend zutreffend. Aus dieser Ermittlung alleine können unterschiedliche Rückwandebenen noch nicht hinreichend unterschieden werden, z.B. die von dem auf derselben Fahrspur vorausfahrenden Lieferwagen (53) von den im Bild darüber angeordneten Schildern der Schilderbrücke (54). Dieser Darstellung können aber bereits wichtige Hinweise entnommen werden, wo erhabene Objekte in der Umgebung des Fahrzeugs auftreten. Wie in Fig. 7 veranschaulicht wird, kann zur Erkennung dyna¬ mischer Objekte die inverse TTC (tx, ty, tz) verwendet werden. Fig. 7a zeigt wiederum das Bild der Fahrzeugsituation (identisch mit Fig. 6a) . Das auf der eigenen Fahrspur vorausfahrende Fahrzeug (73) ist ein Lieferwagen. Auf der linken Spur fahren zwei Fahrzeuge (71 und 72) und auf der rechten Spur zwei weitere Fahrzeuge (74 und 75) . Fig. 6d shows which correspondences are assigned to a backplane. That is largely true. From this determination alone different backplane levels can not yet be sufficiently distinguished, for example, from the on the same lane ahead of delivery vans (53) of the arranged in the picture above signs of the gantry (54). However, important information can already be found in this representation of where elevated objects occur in the surroundings of the vehicle. As illustrated in Fig. 7, for detecting dyna ¬ mixer objects inverse TTC (t x, t y, t z) be used. FIG. 7a again shows the image of the vehicle situation (identical to FIG. 6a). The vehicle (73) driving ahead in its own lane is a delivery truck. On the left lane are two vehicles (71 and 72) and on the right lane two more vehicles (74 and 75).
Fig. 7b zeigt Korrespondenzen, die wiederum der Bodenebene entsprechen (im Original violett) und als einzige einen Rotanteil aufweisen.  Fig. 7b shows correspondences, which in turn correspond to the ground level (purple in the original) and the only one have a red component.
Fig. 7c zeigt Korrespondenzen, die bewegten Objekten zugeordnet werden. Diese sind im Original grün, wenn sie sich vom eigenen Fahrzeug entfernen (also schneller fahren) bzw. türkis, wenn sie langsamer fahren.  Fig. 7c shows correspondences associated with moving objects. These are green in the original, if they move away from their own vehicle (ie drive faster) or turquoise, if they drive slower.
Fig. 7d zeigt Korrespondenzen mit Blauanteil, also solche, die der Bodenebene entsprechen (vgl. Fig. 7b), bewegte Objekte, die sich dem eigenen Fahrzeug nähern (vgl. Fig. 7c) und solche, die statischen erhabenen Objekten entsprechen, diese sind nur in Fig. 7d dargestellt, wie z.B. Waldbereiche links und rechts der Autobahn und die Schilderbrücken. Aus Fig. 7c und 7d gemeinsam, ist zu erkennen, dass sich das Fahrzeug auf der eigenen Fahrspur (73) nähert. Dasselbe gilt für das vordere Fahrzeug auf der rechten Fahrspur (75) . Dagegen entfernen sich die übrigen Fahrzeuge (71, 72 und 74) . Fig. 7d shows correspondences with blue component, ie those corresponding to the ground plane (see Fig. 7b), moving objects approaching the own vehicle (see Fig. 7c) and those corresponding to static raised objects shown only in Fig. 7d, such as Forest areas left and right of the highway and the gantries. From FIGS. 7c and 7d in common, it can be seen that the vehicle is approaching on its own lane (73). The same applies to the front vehicle in the right lane (75). On the other hand, the other vehicles (71, 72 and 74) move away.
Der Bereich, der im Bild dem Himmel entspricht, führt mangels Struktur im Bild zu keinen Korrespondenzen (weiß in Fig. 7b bis 7d) . The area that corresponds to the sky in the image leads to lack of structure in the image to no correspondences (white in Fig. 7b to 7d).
Wird die Eigenrotation in den Korrespondenzen vor der Berechnung der Homographie berücksichtigt, bzw. wird die Eigenrotation in der Rotationsmatrix R berücksichtigt, lassen sich überholende Fahrzeuge aufgrund Ihrer negativen tz Komponente erkennen bzw. ausscherende oder in einer Kurve fahrende Fahrzeuge durch eine laterale tx Komponente ungleich Null erkennen. Werden die dynamischen Segmente über ihre Homographien prädiziert (siehe unten „Verdichtung des optischen Flusses basierend auf Homo- graphien ") , kann über die Zeit eine dynamische Karte aufgebaut werden . Betrachtet man Gleichung 3, erkennt man, dass Segmente mit einer inversen TTC gleich Null die Rotationsmatrix beschreiben und man kann sie durch Berechnung einer Homographie mit vollen Freiheitsgrad (Gleichung 2) aus Segmenten mit t/d gleich Null be¬ stimmen. Geht man davon aus, dass sich die translatorische Komponenten in der Nähe des Epipols nicht bemerkbar machen, kann man die Pitch- und Gierrate auch bestimmen, indem die Koordinaten des Epipols (xe , ye) durch die Homographie statischer Segmente prädiziert werden und der atan ( (xe0— xel)/f) bzw. atan ((ye0— yel /f) mit der auf einen Pixel bezogenen Brennweite /berechnet wird. Is included in the correspondence before calculating the homography the self-rotation, or the self-rotation in the rotation matrix R is taken into account, overtaking vehicles leave because of your negative t recognize such component or ausscherende or driving in a curve vehicles through a lateral t x component recognize nonzero. If the dynamic segments are predicated on their homographies (see "Dynamic Optical Compaction Compression Based on Homologies" below), a dynamic map can be constructed over time Considering Equation 3, it can be seen that segments with an inverse TTC equal to zero describe the rotation matrix and can be computed by computation Homography with full degree of freedom (equation 2) from segments with t / d equal to 0. Assuming that the translational components in the vicinity of the epipole are not noticeable, one can also determine the pitch and yaw rate by the coordinates of the epipole (x e , y e ) are predicted by the homography of static segments and the atan ((x e0 -x el ) / f) or atan ((y e0 -y el / f) with the one pixel related focal length / is calculated.
Wird für jedes Cluster eine Homographie mit allen Freiheitsgraden berechnet, können diese auch zur Rekonstruktion der 3D-Umgebung verwendet werden, indem anstelle der gemessenen Position xt0 die prädizierte Position H * xtl zur Triangulation verwendet wird. Dies reduziert nicht nur den Einfluss von Messfehlern, sondern ermöglicht es auch Objekte nahe des Epipols zu rekonstruieren. If a homography with all degrees of freedom is calculated for each cluster, they can also be used to reconstruct the 3D environment by using the predicted position H * x tl for triangulation instead of the measured position x t0 . This not only reduces the influence of measurement errors, but also allows objects near the epipole to be reconstructed.
Im Folgenden wird ein Ausführungsbeispiel zur Verdichtung des optischen Flusses basierend auf Homographien beschrieben. Hereinafter, an embodiment for condensing the optical flux based on homographs will be described.
Ist die Segmentierung zum Zeitpunkt t-1 bekannt, kann sie sowohl zur Prädiktion der Objekte als auch zur Generierung eines dichten Flussfeldes verwendet werden. Signaturbasierte Flussverfahren erzeugen Signaturen und versuchen diese in aufeinanderfolgenden Frames eindeutig zuzuordnen. Meist werden die Signaturen aus einem Patch (Bildausschnitt bzw. Bildbereich) definierter Größe berechnet. Verändern sich jedoch Größe und Form eines Patches, ist eine Korrespondenzfindung mit einem festen Template (Vorlage, Muster, gemeint ist z.B. ein Bildausschnitt eines Bildes der Bildfolge, der einem Objekt entspricht - bei¬ spielsweise ein Fahrzeug-Template) nicht mehr möglich. Wenn man sich z.B. einer Back-Plane annähert, verändert sich die Größe eines Patches. Oder wenn man sich über einer Ground-Plane oder parallel zu einer Side-Plane bewegt, verändern sich sowohl Größe als auch Form eines Patches, siehe Fig. 1 und 2) . Ist die Segmentierung zum Zeitpunkt t-1 vorhanden, können die Homo- graphien über bereits gefunden Flussvektoren neu berechnet und dazu verwendet werden die Position und Form bereits etablierter Korrespondenzen von t-1 auf t-0 zu prädizieren. If the segmentation is known at time t-1, it can be used both to predict the objects and to generate a dense flow field. Signature-based flow methods generate signatures and try to uniquely assign them in consecutive frames. In most cases, the signatures are calculated from a patch (image section or image area) of defined size. However, if the size and shape of a patch change, this is a correspondence finding with a fixed template (Template pattern, meaning, for example, an image section of an image of the image sequence, corresponding to an object - when ¬ play, a vehicle-template) no longer possible. For example, when approaching a backplane, the size of a patch changes. Or when moving over a ground plane or parallel to a side plane, both size and shape of a patch change, see Figs. 1 and 2). If the segmentation is present at time t-1, the homogra- phies can be recomputed over already found flow vectors and used to predict the position and form of already established correspondences from t-1 to t-0.
Alternativ lässt sich der aktuelle Frame zum Zeitpunkt t-0 auf den Zeitpunkt t-1 transformieren, um Skalen- und Formänderungen zu kompensieren. Alternatively, the current frame may be transformed to time t-1 at time t-0 to compensate for scale and shape changes.
Fig. 8 veranschaulicht ein solches Vorgehen.  Fig. 8 illustrates such a procedure.
Fig. 8a zeigt ein Bild einer anderen Fahrsituation, das von der Fahrzeugkamera zu einem Zeitpunkt t-1 aufgenommen wurde. Zu sehen ist eine Autobahn mit drei Fahrspuren je Fahrtrichtung. Links der eigenen dreispurigen Fahrbahn befindet sich eine Leitplanke (81) als erhabene Begrenzung zur Gegenfahrbahn. Rechts der Fahrbahn befindet sich eine Lärmschutzwand (82) . Fig. 8b zeigt ein Bild, das zum darauffolgenden Zeitpunkt t aufgenommen wurde und über die Homographie der Leitplanke derart transformiert („gewarpt", englisch: to warp) wurde, dass die infolge der Bewegung des Fahrzeuges und damit der Fahrzeugkamera zwischen den beiden Aufnahmezeitpunkten auftretenden Änderungen im Bild im Bereich der Leitplanke kompensiert werden. Die Vorwärtsbewegung des eigenen Fahrzeugs führt in Fig. 8b dazu, dass der naheliegendste Teilstrich der Fahrspurmarkierung näher am eigenen Fahrzeug ist als in Fig. 8a. Die Transformation führt zu der trapezförmigen Versetzung des Bildes, welche in Fig. 8f durch eine gestrichelte Linie veranschaulicht ist. Fig. 8a shows an image of another driving situation taken by the vehicle camera at a time t-1. You can see a highway with three lanes in each direction of travel. To the left of the own three-lane roadway is a guardrail (81) as a raised boundary to the opposite lane. To the right of the roadway is a noise barrier (82). Fig. 8b shows an image that was taken at the next time t and transformed via the homography of the guardrail in such a way ("warped", English: to warp) was that occurring as a result of the movement of the vehicle and thus the vehicle camera between the two recording times In Fig. 8b, the forward movement of the own vehicle results in that the closest tine of the lane marking is closer to the own vehicle than in Fig. 8a to the trapezoidal displacement of the image, which is illustrated in Fig. 8f by a dashed line.
Fig. 8c zeigt nun korrespondierende Merkmale (85) , die im Bereich der Leitplanke (81, vgl. Fig. 8a) ermittelt wurden, als weiße Punkte . Fig. 8c now shows corresponding features (85), which were determined in the area of the guardrail (81, see Fig. 8a), as white dots.
Fig. 8d zeigt, wo diese korrespondierenden Merkmale im nächsten Bild zu erwarten sind (86), nachdem dieses wie zu Fig. 8b beschrieben transformiert worden ist.  Fig. 8d shows where these corresponding features are to be expected in the next image (86) after being transformed as described for Fig. 8b.
In Fig. 8e und 8f ist dieser Sachverhalt nochmals in einer schwarz-weiß Darstellung gezeigt, wobei die korrespondierenden Merkmale (85) nun den schwarzen Punkten auf der Leitplanke (81) in der linken Bildhälfte entsprechen. In Fig. 8e and 8f, this fact is shown again in a black and white representation, wherein the corresponding features (85) now correspond to the black dots on the guardrail (81) in the left half of the picture.
Zur Generierung eines dichten Flussfeldes kann also für jedes Segment das aktuelle Bild auf das vorherige Bild gewarpt werden, um bereits bestehende Korrespondenzen, die sich in ihrer Skale oder Form veränderte haben, wieder zu finden bzw. um neue Korrespondenzen mittels deckungsgleicher Templates zu etablieren . In order to generate a dense flow field, the current image can be warmed to the previous image for each segment in order to find existing correspondences that have changed in their scale or shape, or to establish new correspondences by means of congruent templates.
Sind in einem aktuellen Frame nicht genügend Flussvektoren zur Neuberechnung einer Homographie vorhanden, lassen sich nähe- rungsweise die Homographie aus dem letzten Frame verwenden um die Korrespondenzfindung robuster gegen Formund Skalenänderungen zu gestalten . If there are not enough flow vectors in a current frame to recalculate a homography, the approximate homography from the last frame can be used to make the correspondence finding more robust against shape and scale changes.
Folgende Ausgestaltungsformen bzw. -aspekte sind vorteilhaft und können einzeln oder in Kombination vorgesehen werden: The following embodiments or aspects are advantageous and can be provided individually or in combination:
1. Das Bild wird in NxM Zellen unterteilt und den Punkt-Korrespondenzen einer Zelle wird eine eindeutige Zellen-ID zugewiesen. Aus den Korrespondenzen mit gleichen IDs werden mittels RANSAC die Back-/Ground- und Si- de-Plane-Homographien (Gleichung 9, 10 und 10) berechnet und sowohl die Homographie mit dem geringsten Rückpro¬ jektionsfehler, als auch die zur Berechnung der Homographie verwendeten Stützstellen gespeichert. Bei RANSAC (RAndom SAmple Consensus) Verfahren wird üblicherweise bei jeder Iteration eine minimale Anzahl an zufällig ausgewählten Korrespondenzen verwendet, um eine Hypothese zu bilden. Für jedes korrespondierende Merkmal wird anschließend ein Wert berechnet, der beschreibt, ob das korrespondierende Merkmal die Hypothese unterstützt. Wenn die Hypothese eine hin¬ reichende Unterstützung durch die korrespondierenden Merkmale erreicht, können die nicht-unterstüt zenden korrespondierenden Merkmale als Ausreißer verworfen werden. Andernfalls wird erneut eine minimale Anzahl an Korrespondenzen zufällig ausgewählt. 1. The image is subdivided into NxM cells and the point correspondences of a cell are assigned a unique cell ID. From the correspondences with same IDs are calculated using the RANSAC baking / Si ground- and de-plane homographies (Equation 9, 10 and 10) and both the homography with the smallest rear projection ¬ jektionsfehler, as well as the reference points used to calculate the homography stored. In RANSAC (RAndom SAmple Consensus) methods, a minimum number of randomly selected correspondences are usually used in each iteration to form a hypothesis. For each corresponding feature, a value is then calculated that describes whether the corresponding feature supports the hypothesis. If the hypothesis reaches out ¬ ranging support through the corresponding characteristics which are not under-support alarm collapsing corresponding features can be discarded as outliers. Otherwise, a minimum number of correspondences will be randomly selected again.
Für benachbarte Zellen i, j werden die Rückprojektions¬ fehler Σ — HjXt l lbzw . ,xt J 0 — iXt J l über die Stützstellen der benachbarten Homographie berechnet. Ist der Rückprojektionsfehler Y,xt lo ~ Hjxti kleiner Σ ^ixti bzw. unter¬ schreiten die Fehler eine auf die Flusslänge normierte Schwelle, werden die IDs zusammengefasst und die Homo- graphien neu berechnet. Insbesondere können zwei be¬ nachbarte Zellen als zur selben Ebene (bzw. zum selben Segment oder zum selben Objekt) zugehörig geclustert werden, wenn der Rückproj ektionsfehler
Figure imgf000025_0001
kleiner als
Figure imgf000025_0002
— HiXl tl) ist und wenn beide Rückprojektionsfehler Σί0 ο HjXl tl) und Σί0 ο HiXl tl) eine auf die Flusslänge nor¬ mierte Schwelle unterschreiten. Die Rückprojektionsfehler xtQ— Htxt sämtlicher
For neighboring cells i, j, the rear-projection error ¬ Σ be - or HJX t l l. , x t J 0 - iX t J l calculated over the nodes of the adjacent homography. If the backprojection error Y, x t l o ~ Hj x ti is smaller than Σ - ^ i x ti or if the errors are below a threshold normalized to the flow length, the IDs are combined and the homographies recalculated. In particular, two neighboring cells as ¬ be at the same level (or to the same segment or to the same object) can be clustered related if the Rear-Ceiling ektionsfehler
Figure imgf000025_0001
less than
Figure imgf000025_0002
- HiX l tl ) and if both backprojection errors Σ ί 0 ο - HjX l tl ) and Σ ί 0 ο - HiX l tl ) fall below a normal nor ¬ mierte threshold. The backprojection errors x t Q- H t x t all
Punkt-Korrespondenzen werden für die angrenzenden Segmente berechnet und eine Punkt-Korrespondenz wird dem Segment mit geringstem Rückprojektionsfehler zugeordnet. Überschreitet der minimale Fehler eine Schwelle, werden die Korrespondenzen mit einer neuen Objekt ID versehen um auch kleinere bzw. teilverdeckte Objekte erkennen zu können. Die Homographien der zum Zeitpunkt t-1 extrahierten Segmente werden zu Beginn eines neuen Frames (t-0) über die bereits gefunden Bild Korrespondenzen neu berechnet und die bereits bestehenden Segment IDs in den aktuellen Frame prädiziert. Sind im aktuellen Frame nicht genügend Flussvektoren zur Neuberechnung einer Homographie vorhanden, lassen sich näherungsweise die Homographien aus dem letzten Frame verwenden. Zur Generierung eines dichten Flussfeldes wird für jedes Segment der aktuelle Frame (t-0) auf den letzten Frame (t-1) gewarpt um bereits bestehende Korrespondenzen, die sich in ihrer Skale oder Form veränderte haben, wieder zu finden bzw. um neue Korrespondenzen zu etablieren. Die Rückprojektionsfehler der Back- /Ground- und Side-Plane können zur Validierung erhabener Ziele verwendet werden, siehe Fig. 6. Ist z.B. bei einer Fahrzeugstereokamera eine Dispari¬ tätskarte vorhanden, können die absoluten Geschwindigkeiten aus der inversen TTC t/d berechnet werden, da dann die absoluten Entfernungen d für einzelne Pixel in der Disparitätskarte vorliegen. Wird für jedes Segment eine vollständige Homographie mit allen Freiheitsgraden berechnet, kann aus Segmenten mit einer TTC nahe unendlich (bzw. inverse TTCs annähernd Null) die Rotationsmatrix R bestimmt werden. Die 3D-Umgebung kann aus der prädizierten Position (Hxtl, xtl) anstelle der gemessenen Position (x Q, xtl) rekonstruiert werden und erlaubt es, auch Objekte am Epipol zu rekonstruieren. Point correspondences are for the adjacent segments and a point correspondence is assigned to the segment with least backprojection error. If the minimum error exceeds a threshold, the correspondences are provided with a new object ID in order to be able to recognize even smaller or partially hidden objects. The homographies of the segments extracted at time t-1 are recalculated at the beginning of a new frame (t-0) via the already found image correspondences and the already existing segment IDs are predicted in the current frame. If there are not enough flow vectors available in the current frame to recalculate a homography, the approximate homographies from the last frame can be used. To generate a dense flow field, the current frame (t-0) for each segment is warmed to the last frame (t-1) to find already existing correspondences that have changed in their scale or shape, or new correspondences to establish. The rear projection error of the baking / ground- and Side-tarpaulin can be used to validate raised objectives, see Fig. 6. For example, if in a vehicle stereo camera a Dispari ¬ tätskarte present, the absolute velocities from the inverse TTC can t / are calculated d, because then there are the absolute distances d for individual pixels in the disparity map. If a complete homography with all degrees of freedom is calculated for each segment, it is possible to use segments with of a TTC close to infinity (or inverse TTCs approaching zero), the rotation matrix R is determined. The 3D environment can be reconstructed from the predicted position (Hx tl , x tl ) instead of the measured position (x Q , x tl ) and also allows to reconstruct objects on the epipole.

Claims

Patentansprüche claims
1. Verfahren zur Detektion von Objekten aus einer Folge von Bildern einer Fahrzeugkamera umfassend die Schritte: A method of detecting objects from a sequence of images of a vehicle camera comprising the steps of:
a) Aufnahme einer Folge von Bildern mit der Fahrzeugkamera, b) Ermittlung von korrespondierenden Merkmalen in zwei aufeinander folgenden Bildern,  a) taking a sequence of images with the vehicle camera, b) determining corresponding features in two successive images,
d) Zuordnung ermittelter korrespondierender Merkmale in einem Bildbereich zu einer Ebene im Raum, und  d) assignment of determined corresponding features in an image area to a plane in space, and
f) Bestimmung zusätzlicher korrespondierender Merkmale in dem Bildbereich unter Berücksichtigung der zugeordneten Ebene .  f) determining additional corresponding features in the image area taking into account the associated level.
2. Verfahren nach Anspruch 1, umfassend den Schritt: 2. The method of claim 1, comprising the step:
c) Berechnung von Homographien für die ermittelten korrespondierenden Merkmale in einem Bildbereich, damit diese einer Ebene im Raum zugeordnet werden können.  c) Calculation of homographies for the determined corresponding features in an image area so that they can be assigned to a plane in space.
3. Verfahren nach Anspruch 2, umfassend die Schritte: d2) Zuordnung der ermittelten korrespondierenden Merkmale zu einer von einer Mehrzahl von Ebenen vorgegebener Orientierung im Raum, und 3. The method of claim 2, comprising the steps: d2) assignment of the determined corresponding features to one of a plurality of planes predetermined orientation in space, and
e) Zuordnung zu der Ebene im Raum, die für die ermittelten korrespondierenden Merkmale den kleinsten Rückprojektionsfehler ergibt, wobei der Rückprojektionsfehler den Unterschied an zwischen der gemessenen Korrespondenz eines Merkmals in zwei aufeinanderfolgenden Bildern und dem aus der berechneten Homographie prädizierten Korrespondenz des Merkmals angibt.  e) Assignment to the plane in space that gives the smallest backprojection error for the identified corresponding features, the backprojection error indicating the difference in between the measured correspondence of a feature in two consecutive images and the prediction of the feature from the computed homography.
4. Verfahren nach einem der vorhergehenden Ansprüche, umfassend den Schritt: d3) Zuordnung der ermittelten korrespondierenden Merkmalen in einem Bildbereich zu jeweils einer Bodenebene, einer Rückwandebene oder einer Seitenwandebene . 4. The method according to any one of the preceding claims, comprising the step: d3) assignment of the determined corresponding features in an image area to a respective ground level, a backplane or a sidewall level.
5. Verfahren nach Anspruch 4, wobei die mindestens eine Rückwandebene berechnet wird nach 5. The method of claim 4, wherein the at least one backplane is calculated according to
Figure imgf000029_0001
wobei a, b, c Konstanten sind, xo, yo, xi, yi Korrespondenzen in einem ersten Bild (Index 0) und einem zweiten Bild (Index 1) und tx, ty, tz, die Komponenten des Vektors t/d sind, t beschreibt die Translation der Fahrzeugkamera und d die Entfernung zu einer Ebene.
Figure imgf000029_0001
where a, b, c are constants, xo, yo, xi, yi correspondences in a first image (index 0) and a second image (index 1) and t x , t y , t z , the components of the vector t / d t describes the translation of the vehicle camera and d the distance to a plane.
6. Verfahren nach Anspruch 4 oder 5, wobei die mindestens eine Bodenebene berechnet wird nach 6. The method of claim 4 or 5, wherein the at least one ground plane is calculated according to
Figure imgf000029_0002
Figure imgf000029_0002
7. Verfahren nach Anspruch 4, 5 oder 6, wobei die mindestens eine Seitenwandebene berechnet wird nach
Figure imgf000029_0004
Figure imgf000029_0003
7. The method of claim 4, 5 or 6, wherein the at least one sidewall plane is calculated according to
Figure imgf000029_0004
Figure imgf000029_0003
8. Verfahren nach einem der vorhergehenden Ansprüche, wobei ausgehend von einer ermittelten Aufteilung eines Bildes in unterschiedliche Bildbereiche mit zugeordneten Ebenen für ein zweites Bild, werden erste einander korrespondierende Merkmale in einem Bildbereich im zweiten und einem nachfolgenden dritten Bild bestimmt, 8. The method according to any one of the preceding claims, wherein starting from a determined division of an image into different image areas with associated levels for a second image are first corresponding to each other Determines features in one image area in the second and subsequent third image,
aus diesen ersten korrespondierenden Merkmalen wird eine Homographie für diesen Bildbereich neu berechnet, und die neu berechnete Homographie wird dazu verwendet, die Position und Form zusätzlicher korrespondierender Merkmale im dritten Bild zu prädizieren. From these first corresponding features, a homography for this image area is recalculated, and the newly calculated homography is used to predict the position and shape of additional corresponding features in the third image.
9. Verfahren nach einem der vorhergehenden Ansprüche, wobei falls in einem nachfolgenden dritten Bild in einem Bildbereich nicht genügend erste korrespondierende Merkmale zur Neuberechnung einer Homographie bestimmbar sind, 9. Method according to one of the preceding claims, wherein if in a subsequent third image in an image area not enough first corresponding features for the recalculation of a homography can be determined,
die für den Bildbereich berechnete Homographie aus dem zweiten Bild dazu verwendet wird, die Position und Form zusätzlicher korrespondierender Merkmale des Bildbereichs im dritten Bild zu prädizieren. the homograph from the second image calculated for the image area is used to predict the position and shape of additional corresponding features of the image area in the third image.
10. Verfahren nach einem der vorhergehenden Ansprüche, wobei zur für jeden Bildbereich mit einer zugeordneten Ebene ein aktuelles Bild auf ein vorheriges Bild entsprechend der berechneten Homographie gewarpt wird, um zusätzliche einander im letzten und im aktuellen Bild korrespondierende Merkmale zu bestimmen. 10. The method according to claim 1, wherein, for each image area with an associated plane, a current image is warmed to a previous image in accordance with the calculated homography in order to determine additional features corresponding to one another in the last image and in the current image.
11. Vorrichtung zur Detektion von Objekten aus einer Folge von Bildern einer Fahrzeugkamera umfassend: 11. An apparatus for detecting objects from a sequence of images of a vehicle camera, comprising:
ein Kamerasteuergerät, welches dazu ausgebildet ist, a) eine Folge von Bildern mit der Fahrzeugkamera aufzu¬ nehmen; a camera controller which is adapted to aufzu a sequence of images with the vehicle camera to take a) ¬;
und eine Auswerteelektronik, welche dazu ausgebildet ist, b) korrespondierende Merkmale in einem Bildbereich in zwei aufeinander folgenden Bildern zu ermitteln, d) ermittelte korrespondierende Merkmale in einem Bild¬ bereich zu einer Ebene im Raum zuzuordnen, und and evaluation electronics which are designed to determine b) corresponding features in one image area in two consecutive images, d) determined corresponding features in an image ¬ area to a plane in space assigned, and
f) zusätzliche korrespondierende Merkmale in dem Bild¬ bereich unter Berücksichtigung der zugeordneten Ebene zu bestimmen . f) determine additional corresponding features in the image ¬ area taking into account the associated level.
PCT/DE2017/200100 2016-09-29 2017-09-28 Detection and validation of objects from sequential images from a camera by means of homographs WO2018059629A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE112017003463.9T DE112017003463A5 (en) 2016-09-29 2017-09-28 Detection and validation of objects from sequential images of a camera by means of homographies

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102016218851.8A DE102016218851A1 (en) 2016-09-29 2016-09-29 Compaction of an optical flow field for the detection of objects from images of a camera
DE102016218851.8 2016-09-29

Publications (1)

Publication Number Publication Date
WO2018059629A1 true WO2018059629A1 (en) 2018-04-05

Family

ID=60244821

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2017/200100 WO2018059629A1 (en) 2016-09-29 2017-09-28 Detection and validation of objects from sequential images from a camera by means of homographs

Country Status (2)

Country Link
DE (2) DE102016218851A1 (en)
WO (1) WO2018059629A1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140161323A1 (en) 2010-09-21 2014-06-12 Mobileye Technologies Limited Dense structure from motion
US20150332114A1 (en) * 2014-05-14 2015-11-19 Mobileye Vision Technologies Ltd. Systems and methods for curb detection and pedestrian hazard assessment
EP2993654A1 (en) 2010-12-07 2016-03-09 Mobileye Vision Technologies Ltd. Method and system for forward collision warning

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140161323A1 (en) 2010-09-21 2014-06-12 Mobileye Technologies Limited Dense structure from motion
EP2993654A1 (en) 2010-12-07 2016-03-09 Mobileye Vision Technologies Ltd. Method and system for forward collision warning
US20150332114A1 (en) * 2014-05-14 2015-11-19 Mobileye Vision Technologies Ltd. Systems and methods for curb detection and pedestrian hazard assessment

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HARTLEY, R.; ZISSERMAN, A.: "Tutorial: Multiple View Geometry", CVPR, June 1999 (1999-06-01), Retrieved from the Internet <URL:https://de.scribd.com/document/96810936/Hartley-Tut-4up>
M.I.A. LOURAKIS ET AL: "Detecting Planes In An Uncalibrated Image Pair", PROCEEDINGS OF THE 13TH BRITISH MACHINE VISION CONFERENCE : 2ND - 5TH SEPTEMBER 2002, CARDIFF UNIVERSITY, 1 January 2002 (2002-01-01), Cardiff, pages 57.1 - 57.10, XP055439691, ISBN: 978-1-901725-19-3, DOI: 10.5244/C.16.57 *
OLAF KÄHLER ET AL: "DETECTING COPLANAR FEATURE POINTS IN HANDHELD IMAGE SEQUENCES", 1 January 2007 (2007-01-01), XP055439695, Retrieved from the Internet <URL:http://www.robots.ox.ac.uk/~olaf/bib/kaehler07detecting.pdf> [retrieved on 20180110] *
PRATEEK SINGHAL ET AL: "Top Down Approach to Detect Multiple Planes from Pair of Images", PROCEEDINGS OF THE 2014 INDIAN CONFERENCE ON COMPUTER VISION GRAPHICS AND IMAGE PROCESSING, ICVGIP '14, 1 January 2014 (2014-01-01), New York, New York, USA, pages 1 - 8, XP055439700, ISBN: 978-1-4503-3061-9, DOI: 10.1145/2683483.2683536 *

Also Published As

Publication number Publication date
DE112017003463A5 (en) 2019-03-21
DE102016218851A1 (en) 2018-03-29

Similar Documents

Publication Publication Date Title
EP3520024B1 (en) Detection and validation of objects from sequential images of a camera using homograpies
DE102019114622B4 (en) DETECTION AND PLANAR REPRESENTATION OF THREE-DIMENSIONAL LANES IN A STREET SCENE
DE69624980T2 (en) Object monitoring method and device with two or more cameras
DE102009005553B4 (en) Method and device for detecting the environment of a motor vehicle
EP2888604B1 (en) Method for determining the course of a lane for a vehicle
EP3520023B1 (en) Detection and validation of objects from sequential images of a camera
DE102014213981A1 (en) Parking lot detection device and corresponding method
DE102010030044A1 (en) Restoration device for weather-impaired images and driver assistance system hereby
EP2396746A2 (en) Method for detecting objects
DE102015111907B4 (en) Algorithm to extend the detection range for an AVM stop line detection
DE102018121008B4 (en) SYSTEM FOR DRIVING AN AUTONOMOUS VEHICLE AND VEHICLE EQUIPPED THEREFROM
DE102019133642A1 (en) DIGITAL IMAGING SYSTEM INCLUDING OPTICAL PLENOPTIC DEVICE AND IMAGE DATA PROCESSING METHOD FOR DETECTING VEHICLE OBSTACLES AND GESTURES
DE102013113960A1 (en) Road surface shape determining device
EP2023265A1 (en) Method for recognising an object
DE112017007347T5 (en) OBJECT DETECTION DEVICE AND VEHICLE
DE102018100909A1 (en) Method of reconstructing images of a scene taken by a multifocal camera system
EP3520025B1 (en) Detection and validation of objects from sequential images of a camera using homograpies
DE102012024878A1 (en) Method for detecting a target object on the basis of a camera image by clustering a plurality of adjacent image cells, camera device and motor vehicle
DE102018124979A1 (en) Driver assistance system for determining a distance between two vehicles with a camera
DE102020209605A1 (en) VEHICLE AND METHOD OF CONTROLLING IT
DE102014201409B4 (en) PARKING - TRACKING DEVICE AND PROCEDURES OF THE SAME
DE102019129107A1 (en) Method and system for image analysis using boundary detection
DE102015204529A1 (en) Method and device for object recognition in a means of transportation
WO2018059629A1 (en) Detection and validation of objects from sequential images from a camera by means of homographs
DE102018202753A1 (en) Method for determining a distance between a motor vehicle and an object

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17793826

Country of ref document: EP

Kind code of ref document: A1

REG Reference to national code

Ref country code: DE

Ref legal event code: R225

Ref document number: 112017003463

Country of ref document: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17793826

Country of ref document: EP

Kind code of ref document: A1