[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP7480436B2 - Image processing device and vehicle - Google Patents

Image processing device and vehicle Download PDF

Info

Publication number
JP7480436B2
JP7480436B2 JP2023526803A JP2023526803A JP7480436B2 JP 7480436 B2 JP7480436 B2 JP 7480436B2 JP 2023526803 A JP2023526803 A JP 2023526803A JP 2023526803 A JP2023526803 A JP 2023526803A JP 7480436 B2 JP7480436 B2 JP 7480436B2
Authority
JP
Japan
Prior art keywords
filter
values
image
vehicle
symmetry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023526803A
Other languages
Japanese (ja)
Other versions
JPWO2022259520A5 (en
JPWO2022259520A1 (en
Inventor
雄介 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Subaru Corp
Original Assignee
Subaru Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Subaru Corp filed Critical Subaru Corp
Publication of JPWO2022259520A1 publication Critical patent/JPWO2022259520A1/ja
Publication of JPWO2022259520A5 publication Critical patent/JPWO2022259520A5/ja
Application granted granted Critical
Publication of JP7480436B2 publication Critical patent/JP7480436B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/02Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to ambient conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Automation & Control Theory (AREA)
  • Mathematical Physics (AREA)
  • Transportation (AREA)
  • Mechanical Engineering (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本開示は、撮像画像に基づいて物体認識を行う画像処理装置、および、そのような画像処理装置を備えた車両に関する。 The present disclosure relates to an image processing device that performs object recognition based on captured images, and a vehicle equipped with such an image processing device.

撮像装置により得られた撮像画像には、様々な物体の画像が含まれる。例えば特許文献1には、そのような撮像画像に基づいて物体認識を行う画像処理装置が開示されている。The captured images obtained by the imaging device include images of various objects. For example, Patent Document 1 discloses an image processing device that performs object recognition based on such captured images.

特開2018-97766号公報JP 2018-97766 A

ところで、このような画像処理装置では、処理モデルの軽量化を図ったり、モデル性能を担保したりすることが、求められている。処理モデルの軽量化を図りつつモデル性能を担保することが可能な画像処理装置、および、そのような画像処理装置を備えた車両を提供することが望ましい。However, in such image processing devices, there is a demand for reducing the weight of the processing model while ensuring model performance. It is desirable to provide an image processing device that can ensure model performance while reducing the weight of the processing model, and a vehicle equipped with such an image processing device.

本開示の一実施の形態に係る第1の画像処理装置は、撮像画像に含まれる特徴量を抽出する抽出部と、その特徴量に基づいて物体を識別する物体識別部と、を備えたものである。抽出部は、撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、特徴量を抽出する。また、フィルタにおける複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されている。
本開示の一実施の形態に係る第2の画像処理装置は、1または複数のプロセッサと、この1または複数のプロセッサに通信可能に接続される1または複数のメモリと、を備えたものである。1または複数のプロセッサは、撮像画像に含まれる特徴量を抽出することと、その特徴量に基づいて物体を識別することと、を行うと共に、撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、特徴量を抽出する。また、フィルタにおける複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されている。
A first image processing device according to an embodiment of the present disclosure includes an extraction unit that extracts a feature included in a captured image, and an object identification unit that identifies an object based on the feature. The extraction unit extracts the feature based on the captured image by performing a convolution operation using a filter having a plurality of filter values arranged two-dimensionally. In addition, each of the filter values in the filter is set to a line symmetric value with respect to a symmetry axis along a predetermined direction.
A second image processing device according to an embodiment of the present disclosure includes one or more processors and one or more memories communicably connected to the one or more processors. The one or more processors extract features included in a captured image, identify an object based on the features, and extract the features by performing a convolution operation using a filter having a plurality of filter values arranged two-dimensionally based on the captured image. In addition, each of the filter values in the filter is set to a line symmetric value with respect to a symmetry axis along a predetermined direction.

本開示の一実施の形態に係る車両は、上記本開示の一実施の形態に係る画像処理装置と、上記物体識別部による物体の識別結果を利用して、車両制御を行う車両制御部と、を備えたものである。A vehicle according to one embodiment of the present disclosure includes an image processing device according to the embodiment of the present disclosure, and a vehicle control unit that controls the vehicle using the object identification result by the object identification unit.

本開示の一実施の形態に係る車両の概略構成例を表すブロック図である。1 is a block diagram illustrating an example of a schematic configuration of a vehicle according to an embodiment of the present disclosure. 図1に示した車両の外観構成例を模式的に表す上面図である。FIG. 2 is a top view illustrating an example of the external configuration of the vehicle illustrated in FIG. 1 . 図1に示したステレオカメラが生成した左画像および右画像の一例を表す模式図である。2 is a schematic diagram illustrating an example of a left image and a right image generated by the stereo camera illustrated in FIG. 1 . 撮像画像において設定される画像領域の一例を表す模式図である。4 is a schematic diagram illustrating an example of an image area set in a captured image. FIG. 畳み込み演算に用いられるフィルタの更新処理の概要について説明するための模式図である。1 is a schematic diagram for explaining an overview of a filter update process used in a convolution operation; FIG. 図1に示した特徴量抽出部における畳み込み演算および活性化関数の適用例を表す模式図である。2 is a schematic diagram illustrating an example of application of a convolution operation and an activation function in the feature extraction unit illustrated in FIG. 1 . 図6に示した畳み込み演算の具体的な処理例を表す模式図である。7 is a schematic diagram illustrating a specific processing example of the convolution operation shown in FIG. 6. 図6に示した活性化関数の具体的な構成例を表す模式図である。FIG. 7 is a schematic diagram illustrating a specific configuration example of the activation function shown in FIG. 6 . 比較例に係るフィルタの構成例を表す模式図である。FIG. 13 is a schematic diagram illustrating a configuration example of a filter according to a comparative example. 比較例に係るフィルタを用いた場合の物体認識結果の一例を表す模式図である。11A and 11B are schematic diagrams illustrating an example of an object recognition result when a filter according to a comparative example is used. 実施の形態に係るフィルタにおけるフィルタ値の更新処理例を表す模式図である。11A and 11B are schematic diagrams illustrating an example of a process of updating a filter value in a filter according to an embodiment. 実施の形態に係るフィルタの構成例を表す模式図である。1 is a schematic diagram illustrating an example of a configuration of a filter according to an embodiment. 実施例等に係るデータセットの構成例を表す模式図である。FIG. 2 is a schematic diagram illustrating an example of the configuration of a data set according to the embodiments. 実施例等に係る機械学習モデルの構成例を表す模式図である。FIG. 1 is a schematic diagram illustrating an example of the configuration of a machine learning model according to an embodiment. 比較例、参考例および実施例に係る物体認識結果の一例を表す図である。11A to 11C are diagrams illustrating examples of object recognition results according to a comparative example, a reference example, and an example. 比較例、参考例および実施例に係る物体認識結果の他の例を表す図である。11A to 11C are diagrams illustrating other examples of object recognition results according to the comparative example, the reference example, and the working example. 比較例および実施例に係るパラメータ数の一例を表す図である。FIG. 13 is a diagram illustrating an example of the number of parameters according to a comparative example and an example.

以下、本開示の実施の形態について、図面を参照して詳細に説明する。なお、説明は以下の順序で行う。
1.実施の形態(畳み込み演算の際のフィルタにおけるフィルタ値の設定例)
2.実施例(具体的な物体認識結果の例)
3.変形例
Hereinafter, embodiments of the present disclosure will be described in detail with reference to the drawings. The description will be made in the following order.
1. Embodiment (Example of setting filter values in a filter during convolution calculation)
2. Working Examples (Examples of Specific Object Recognition Results)
3. Modifications

<1.実施の形態>
[構成]
図1は、本開示の一実施の形態に係る車両(車両10)の概略構成例を、ブロック図で表したものである。図2は、図1に示した車両10の外観構成例を、模式的に上面図で表したものである。
1. Preferred embodiment
[composition]
Fig. 1 is a block diagram showing an example of a schematic configuration of a vehicle (vehicle 10) according to an embodiment of the present disclosure. Fig. 2 is a schematic top view showing an example of an external configuration of the vehicle 10 shown in Fig. 1.

車両10は、図1に示したように、ステレオカメラ11、画像処理装置12および車両制御部13を備えている。なお、この図1では、車両10の駆動力源(エンジンやモータなど)等の図示については、省略している。この車両10は、例えば、ハイブリッド自動車(HEV)や電気自動車(EV:Electric Vehicle)などの電動車両、あるいは、ガソリン車により構成されている。As shown in Fig. 1, the vehicle 10 is equipped with a stereo camera 11, an image processing device 12, and a vehicle control unit 13. Note that in Fig. 1, the driving power source (engine, motor, etc.) of the vehicle 10 is omitted. The vehicle 10 is, for example, an electric vehicle such as a hybrid electric vehicle (HEV) or an electric vehicle (EV), or a gasoline vehicle.

(A.ステレオカメラ11)
ステレオカメラ11は、例えば図2に示したように、車両10の前方を撮像することにより、互いに視差を有する一組の画像(左画像PLおよび右画像PR)を生成するカメラである。このステレオカメラ11は、図1,図2に示したように、左カメラ11Lおよび右カメラ11Rを有している。
(A. Stereo camera 11)
The stereo camera 11 is a camera that captures an image of the area ahead of the vehicle 10 to generate a pair of images (a left image PL and a right image PR) having a parallax therebetween, as shown in Fig. 2 for example. The stereo camera 11 includes a left camera 11L and a right camera 11R, as shown in Figs. 1 and 2.

左カメラ11Lおよび右カメラ11Rはそれぞれ、例えば、レンズおよびイメージセンサを含んでいる。左カメラ11Lおよび右カメラ11Rは、例えば図2に示したように、車両10におけるフロントガラス19の上部近傍に、車両10の幅方向に沿って所定距離だけ離間して、配置されている。これらの左カメラ11Lおよび右カメラ11Rは、互いに同期して撮像動作を行うようになっている。具体的には図1に示したように、左カメラ11Lは左画像PLを生成し、右カメラ11Rは右画像PRを生成する。左画像PLは複数の画素値を含み、右画像PRは複数の画素値を含んでいる。これらの左画像PLおよび右画像PRは、図1に示したように、ステレオ画像PICを構成している。The left camera 11L and the right camera 11R each include, for example, a lens and an image sensor. The left camera 11L and the right camera 11R are arranged near the upper part of the windshield 19 of the vehicle 10, for example, as shown in FIG. 2, at a predetermined distance apart along the width direction of the vehicle 10. The left camera 11L and the right camera 11R are configured to perform imaging operations in synchronization with each other. Specifically, as shown in FIG. 1, the left camera 11L generates a left image PL, and the right camera 11R generates a right image PR. The left image PL includes a plurality of pixel values, and the right image PR includes a plurality of pixel values. The left image PL and the right image PR constitute a stereo image PIC, as shown in FIG. 1.

図3は、このようなステレオ画像PICの一例を表したものである。具体的には、図3(A)は、左画像PLの一例を示しており、図3(B)は、右画像PRの一例を示している。なお、図3中に示したx,yはそれぞれ、x軸,y軸を表している。この例では、車両10が走行している走行路における車両10の前方に、他車両(先行車両90)が走行している。左カメラ11Lは先行車両90を撮像することにより左画像PLを生成し、右カメラ11Rは先行車両90を撮像することにより右画像PRを生成する。 Figure 3 shows an example of such a stereo image PIC. Specifically, Figure 3(A) shows an example of a left image PL, and Figure 3(B) shows an example of a right image PR. Note that x and y shown in Figure 3 represent the x-axis and y-axis, respectively. In this example, another vehicle (preceding vehicle 90) is traveling ahead of vehicle 10 on the road on which vehicle 10 is traveling. The left camera 11L generates the left image PL by capturing an image of the preceding vehicle 90, and the right camera 11R generates the right image PR by capturing an image of the preceding vehicle 90.

ステレオカメラ11は、このような左画像PLおよび右画像PRを含む、ステレオ画像PICを生成するようになっている。また、ステレオカメラ11は、所定のフレームレート(例えば60[fps])にて撮像動作を行うことにより、一連のステレオ画像PICを生成するようになっている。The stereo camera 11 generates a stereo image PIC including the left image PL and the right image PR. The stereo camera 11 also generates a series of stereo images PIC by performing an imaging operation at a predetermined frame rate (e.g., 60 fps).

(B.画像処理装置12)
画像処理装置12は、ステレオカメラ11から供給されたステレオ画像PICに基づいて、各種の画像処理(車両10の前方の物体の認識処理等)を行う装置である。この画像処理装置12は、図1に示したように、画像メモリ121、特徴量抽出部122および物体識別部123を有している。
(B. Image Processing Device 12)
The image processing device 12 is a device that performs various image processing (such as recognition processing of objects in front of the vehicle 10) based on the stereo images PIC supplied from the stereo camera 11. As shown in FIG. 1, the image processing device 12 has an image memory 121, a feature extraction unit 122, and an object identification unit 123.

このような画像処理装置12は、例えば、プログラムを実行する1または複数のプロセッサ(CPU:Central Processing Unit)と、これらのプロセッサに通信可能に接続される1または複数のメモリと、を含んで構成される。また、このようなメモリは、例えば、処理データを一時的に記憶するRAM(Random Access Memory)、および、プログラムを記憶するROM(Read Only Memory)等により構成される。Such an image processing device 12 includes, for example, one or more processors (CPU: Central Processing Unit) that execute programs, and one or more memories communicatively connected to these processors. Such memories include, for example, a RAM (Random Access Memory) that temporarily stores processing data, and a ROM (Read Only Memory) that stores programs.

なお、上記した特徴量抽出部122は、本開示における「抽出部」の一具体例に対応している。 Note that the feature extraction unit 122 described above corresponds to a specific example of an "extraction unit" in this disclosure.

(画像メモリ121)
画像メモリ121は、図1に示したように、ステレオ画像PICに含まれる左画像PLおよび右画像PRをそれぞれ、一旦記憶するメモリである。また、画像メモリ21は、このようにして記憶された左画像PLおよび右画像PRの少なくとも一方を、撮像画像Pとして、特徴量抽出部122に対して順次供給するようになっている(図1参照)。
(Image memory 121)
1, the image memory 121 is a memory for temporarily storing the left image PL and the right image PR included in the stereo image PIC. The image memory 121 is also configured to sequentially supply at least one of the left image PL and the right image PR thus stored as a captured image P to the feature extraction unit 122 (see FIG. 1).

(特徴量抽出部122)
特徴量抽出部122は、画像メモリ121から読み出された撮像画像P(ここでは、左画像PLおよび右画像PRのうちの一方の画像)における1または複数の画像領域Rに含まれる、特徴量Fを抽出するものである(図1参照)。この特徴量Fは、詳細は後述するが(図7)、行列状に配置(2次元配置)された複数の画素における画素値により構成されている。なお、このような特徴量Fとしては、例えば、RGB(Red, Green, Blue)特徴量やHOG(Histograms of Oriented Gradients)特徴量等が挙げられる。
(Feature Extraction Unit 122)
The feature extraction unit 122 extracts feature values F (see FIG. 1) contained in one or more image regions R in the captured image P (here, one of the left image PL and the right image PR) read out from the image memory 121. The feature values F are composed of pixel values of a plurality of pixels arranged in a matrix (two-dimensional arrangement), as will be described in detail later (FIG. 7). Examples of such feature values F include RGB (Red, Green, Blue) feature values and HOG (Histograms of Oriented Gradients) feature values.

特徴量抽出部122は、詳細は後述するが、DNN(Deep Neural Network)等の学習済みモデルを用いて(機械学習を利用して)、撮像画像Pにおいて上記した画像領域Rを設定したり、上記した特徴量Fを抽出するようになっている。また、画像領域Rを設定する際には、特徴量抽出部122は、例えば、撮像画像P内の物体を識別すると共に、その識別した物体の座標を出力することにより、矩形領域である画像領域Rを設定するようになっている。The feature extraction unit 122, which will be described in detail later, is configured to use a trained model such as a DNN (Deep Neural Network) (machine learning) to set the above-mentioned image region R in the captured image P and extract the above-mentioned feature F. When setting the image region R, the feature extraction unit 122 is configured to, for example, identify an object in the captured image P and output the coordinates of the identified object, thereby setting the image region R, which is a rectangular region.

図4は、そのような画像領域Rの一例を、模式的に表したものである。この図4に示した例では、撮像画像Pにおいて、2つの車両にそれぞれ、画像領域Rが設定されている。なお、この例では、車両に画像領域Rが設定されているが、この例には限定されず、例えば、人、ガードレール、壁などにも、画像領域Rが設定されるようにしてもよい。 Figure 4 is a schematic representation of an example of such an image region R. In the example shown in Figure 4, an image region R is set for each of two vehicles in the captured image P. Note that in this example, an image region R is set for the vehicles, but this is not limiting, and for example, an image region R may also be set for a person, a guardrail, a wall, etc.

ここで、図5~図8を参照して、特徴量抽出部122による、撮像画像Pに含まれる(1または複数の画像領域Rにおける)特徴量Fの抽出処理について、詳細に説明する。 Here, with reference to Figures 5 to 8, the extraction process of feature F (in one or more image regions R) contained in the captured image P by the feature extraction unit 122 will be described in detail.

図5は、後述する畳み込み演算に用いられるフィルタFLの更新処理の概要について、模式的に表したものである。図6は、特徴量抽出部122における後述する畳み込み演算および活性化関数の適用例を、模式的に表したものである。図7は、図6に示した畳み込み演算の具体的な処理例を、模式的に表したものである。図8は、図6に示した活性化関数の具体的な構成例を、模式的に表したものである。 Figure 5 is a schematic diagram showing an overview of the update process of the filter FL used in the convolution operation described below. Figure 6 is a schematic diagram showing an example of the application of the convolution operation and activation function described below in the feature extraction unit 122. Figure 7 is a schematic diagram showing a specific processing example of the convolution operation shown in Figure 6. Figure 8 is a schematic diagram showing a specific configuration example of the activation function shown in Figure 6.

まず、例えば図5に示したように、特徴量抽出部122では、入力された撮像画像Pにおいて、後述するフィルタFLを用いた畳み込み演算等が行われることで、機械学習による物体認識の推論結果(上記した画像領域R内での特徴量Fの抽出結果等)が、得られる。この推論結果と、物体認識の正解データとは随時比較され(図5中の破線の矢印CF参照)、これらの推論結果と正解データとの差分が小さくなるように、フィルタFLのパラメータ(後述する各フィルタ値)の更新処理が、随時行われる。つまり、そのような機械学習によるフィルタFLの更新時ごとに、そのフィルタFLにおける各フィルタ値に対する更新処理が随時実行され、機械学習の学習済みモデルが生成される。First, as shown in FIG. 5, the feature extraction unit 122 performs a convolution operation using a filter FL (described later) on the input captured image P to obtain an inference result of object recognition by machine learning (such as the extraction result of the feature F in the image region R described above). This inference result is compared with the correct answer data for object recognition at any time (see the dashed arrow CF in FIG. 5), and the parameters of the filter FL (each filter value described later) are updated at any time so that the difference between these inference results and the correct answer data becomes small. In other words, each time the filter FL is updated by such machine learning, an update process is performed on each filter value in the filter FL at any time, and a learned model of machine learning is generated.

このようにして、従来のルールベース開発のように具体的な処理数式を規定するではなく、機械学習用の教師データと対応する正解データとを大量に準備しておき、上記した更新処理を繰り返すことで、最終的には、正解データと同じ推論結果が得られることになる。In this way, rather than prescribing specific processing formulas as in conventional rule-based development, large amounts of training data for machine learning and corresponding correct answer data are prepared, and by repeating the update process described above, the same inference results as the correct answer data can ultimately be obtained.

そして、例えば図6に示したように、特徴量抽出部122は、このようにして得られた学習済みモデルを用いて、入力された撮像画像Pに基づく各種演算処理を複数回繰り返して行うことにより、撮像画像Pにおける各画像領域R内で物体認識(特徴量Fの抽出等)を行う。具体的には、特徴量抽出部122は、そのような各種演算処理として、上記したフィルタFLを用いた畳み込み演算CNと、活性化関数CAを用いた演算とを、交互に複数回繰り返すようになっている(図6参照)。6, for example, the feature extraction unit 122 uses the trained model obtained in this manner to perform various computational processes based on the input captured image P multiple times, thereby performing object recognition (such as extracting feature F) within each image region R in the captured image P. Specifically, the feature extraction unit 122 performs such various computational processes by alternately repeating a convolution operation CN using the above-mentioned filter FL and an operation using an activation function CA multiple times (see FIG. 6).

ここで、例えば図7に示したように、上記した畳み込み演算CNは、以下のようにして行われる。すなわち、特徴量抽出部122は、まず、行列状に2次元配置された複数の画素PXを有する撮像画像Pにおいて、所定の大きさ(この例では3画素×3画素)の領域を設定する。また、特徴量抽出部122は、設定したこの領域における9個の画素値(この例では、「0」または「1」の値)に対して、フィルタFLにおける9個のフィルタ値を、重み係数として重みづけ加算する。これにより、その領域での特徴量Fの値が、得られる(この例では、「4」の値)。なお、図7に示した例では、フィルタFLにおけるフィルタ値(「×0」または「×1」として記載)は、行列状に2次元配置されており、(行方向(x軸方向)に沿って3個×列方向(y軸方向)に沿って3個)=9個となっている。そして、特徴量抽出部122は、撮像画像Pにおいて、上記した領域を1画素分ずつずらしながら順次設定し、設定した各領域において、上記したフィルタFLを用いた重みづけ加算を個別に行うことにより、各領域での特徴量Fの値を順次算出する。これにより、例えば図7に示したように、行列状に2次元配置された複数の画素PXを有する、特徴量Fが抽出されることになる。なお、例えば図6に示した複数回の畳み込み演算CNではそれぞれ、上記したフィルタFLが、個別に設定されるようになっている。Here, as shown in FIG. 7, the above-mentioned convolution operation CN is performed as follows. That is, the feature extraction unit 122 first sets a region of a predetermined size (3 pixels x 3 pixels in this example) in the captured image P having a plurality of pixels PX arranged two-dimensionally in a matrix. The feature extraction unit 122 also weights and adds the nine filter values in the filter FL as weighting coefficients to the nine pixel values (values of "0" or "1" in this example) in the set region. This results in the value of the feature F in that region (value of "4" in this example). In the example shown in FIG. 7, the filter values in the filter FL (written as "x0" or "x1") are arranged two-dimensionally in a matrix, (3 along the row direction (x-axis direction) x 3 along the column direction (y-axis direction)) = 9. The feature extraction unit 122 then sequentially sets the above-mentioned regions in the captured image P while shifting them by one pixel at a time, and sequentially calculates the value of the feature F in each of the set regions by individually performing weighted addition using the above-mentioned filter FL in each of the set regions. As a result, a feature F having a plurality of pixels PX arranged two-dimensionally in a matrix is extracted, for example, as shown in Fig. 7. Note that, for example, in the multiple convolution operations CN shown in Fig. 6, the above-mentioned filter FL is set individually for each of them.

また、例えば図8に示したように、上記した活性化関数CAを用いた演算は、以下のようにして行われる。すなわち、入力値(各畳み込み演算CNによって得られた特徴量Fにおける各画素PXの値)に対して、例えば図8に示したような活性化関数CAが適用されることで、そのような活性化関数CAの適用後の出力値が、得られることになる。なお、この図8の例では、入力値が所定値未満の場合、出力値が固定値(例えば「0」など)に設定され、入力値が所定値以上の場合、その入力値の大きさに応じて出力値が線形的に増加するように、出力値が設定されている。 For example, as shown in FIG. 8, the calculation using the activation function CA described above is performed as follows. That is, the activation function CA shown in FIG. 8 is applied to the input value (the value of each pixel PX in the feature F obtained by each convolution calculation CN), and the output value after application of such activation function CA is obtained. In the example of FIG. 8, the output value is set so that if the input value is less than a predetermined value, the output value is set to a fixed value (for example, "0"), and if the input value is equal to or greater than the predetermined value, the output value increases linearly according to the magnitude of the input value.

なお、このような各種演算処理が複数回繰り返して行われることで得られた、最終的な特徴量Fは、特徴量抽出部122から物体識別部123に対して、供給されるようになっている(図1参照)。The final feature value F obtained by repeating these various calculation processes multiple times is supplied from the feature value extraction unit 122 to the object identification unit 123 (see Figure 1).

(物体識別部123)
物体識別部123は、特徴量抽出部122にて抽出された特徴量Fに基づき、撮像画像P(前述した1または複数の画像領域Rの各々)における、物体を識別するものである。すなわち、例えば、画像領域Rの画像が車両を示す場合には、特徴量Fは車両の特徴を含み、画像領域Rの画像が人を示す場合には、特徴量Fは人の特徴を含むことから、物体識別部123は、そのような特徴量Fに基づいて、各画像領域Rにおける物体を識別する。
(Object Identification Unit 123)
The object identification unit 123 identifies objects in the captured image P (each of the one or more image regions R described above) based on the feature amount F extracted by the feature amount extraction unit 122. That is, for example, if the image in the image region R shows a vehicle, the feature amount F includes the feature of the vehicle, and if the image in the image region R shows a person, the feature amount F includes the feature of the person, so the object identification unit 123 identifies objects in each image region R based on such feature amount F.

そして、物体識別部123は、各画像領域Rに対して、その物体が何であるかを示すカテゴリを付与する。具体的には、物体識別部123は、画像領域Rの画像における物体が車両である場合には、その画像領域Rに対して、車両を示すカテゴリを付与し、画像領域Rの画像における物体が人である場合には、その画像領域Rに対して、人を示すカテゴリを付与するようになっている。Then, the object identification unit 123 assigns a category indicating what the object is to each image region R. Specifically, if the object in the image of image region R is a vehicle, the object identification unit 123 assigns a category indicating a vehicle to that image region R, and if the object in the image of image region R is a person, the object identification unit 123 assigns a category indicating a person to that image region R.

(C.車両制御部13)
車両制御部13は、物体識別部123による物体の識別結果(画像処理装置12における物体認識結果)を利用して、車両10における各種の車両制御を行うものである(図1参照)。具体的には、車両制御部13は、そのような物体の識別結果(物体認識結果)の情報に基づき、例えば、車両10の走行制御や、車両10における各種部材の動作制御などを、行うようになっている。
(C. Vehicle control unit 13)
The vehicle control unit 13 uses the object identification result by the object identification unit 123 (object recognition result in the image processing device 12) to perform various vehicle controls in the vehicle 10 (see FIG. 1). Specifically, the vehicle control unit 13 performs, for example, driving control of the vehicle 10 and operation control of various members in the vehicle 10 based on information on such object identification result (object recognition result).

このような車両制御部13は、画像処理装置12と同様に、例えば、プログラムを実行する1または複数のプロセッサ(CPU)と、これらのプロセッサに通信可能に接続される1または複数のメモリと、を含んで構成される。また、このようなメモリも、画像処理装置12と同様に、例えば、処理データを一時的に記憶するRAM、および、プログラムを記憶するROM等により構成される。 Similar to the image processing device 12, the vehicle control unit 13 is configured to include, for example, one or more processors (CPUs) that execute programs and one or more memories communicatively connected to these processors. Also, like the image processing device 12, such memories are configured, for example, with a RAM that temporarily stores processing data, a ROM that stores programs, etc.

[動作および作用・効果]
続いて、本実施の形態における動作および作用・効果について、比較例と比較しつつ詳細に説明する。
[Actions, actions and effects]
Next, the operation, function and effect of the present embodiment will be described in detail while comparing with a comparative example.

(A.比較例)
図9は、比較例に係る一般的なフィルタFLcの構成例を、模式的に表したものである。また、図10は、比較例に係るフィルタFLcを用いた場合の物体認識結果(物体識別結果)の一例を、模式的に表したものである。
A. Comparative Examples
Fig. 9 is a schematic diagram showing an example of the configuration of a general filter FLc according to a comparative example, and Fig. 10 is a schematic diagram showing an example of an object recognition result (object identification result) when the filter FLc according to the comparative example is used.

まず、図9に示した比較例のフィルタFLcでは、後述する本実施の形態のフィルタFL(図11,図12)とは異なり、複数のフィルタ値Vfがそれぞれ、任意に設定されている。具体的には、後述する本実施の形態のフィルタFLとは異なり、この比較例のフィルタFLcにおける各フィルタ値Vfは、所定の対称軸Asを中心とした、線対称(左右対称)の値とはなっていない(図9中の破線の矢印参照)。First, in the filter FLc of the comparative example shown in Figure 9, unlike the filter FL of the present embodiment described later (Figures 11 and 12), each of the filter values Vf is set arbitrarily. Specifically, unlike the filter FL of the present embodiment described later, each filter value Vf in the filter FLc of this comparative example is not linearly symmetric (bilaterally symmetric) about a predetermined axis of symmetry As (see dashed arrow in Figure 9).

ところで、前述したDNNにおける畳み込み演算では、一般的に、以下のような課題がある。However, the convolution calculations in the DNN mentioned above generally have the following problems:

すなわち、まず、前述したように、畳み込み演算用のフィルタは一般に、複数回の畳み込み演算ごとに個別に設けられるため、各フィルタに設定されるパラメータ数(フィルタ値Vfが示す値の個数)が、学習済みモデル全体では、膨大なものとなる(例えば数百万個のオーダー)。したがって、画像処理(物体認識)の際の処理モデル(学習済みモデル)の軽量化が困難となり、例えば組み込み等の小規模ハードウェアへの実装難易度が、高くなってしまう。なお、例えば、モデルサイズ自体を縮小したり、畳み込み演算の精度を下げるなどの手法も考えられるが、モデル性能(認識性能)とのトレードオフがある。That is, first, as mentioned above, a filter for convolution calculation is generally provided for each of the multiple convolution calculations, so the number of parameters set for each filter (the number of values indicated by the filter value Vf) becomes enormous (for example, on the order of millions) for the entire trained model. Therefore, it becomes difficult to reduce the weight of the processing model (trained model) during image processing (object recognition), and the difficulty of implementation in small-scale hardware such as embedded systems increases. For example, methods such as reducing the model size itself or reducing the accuracy of the convolution calculation can be considered, but there is a trade-off with model performance (recognition performance).

また、車両の走行環境(左側走行環境または右側走行環境)は一般に、国によって異なっていることから、物体認識の性能は左右対称になっているのが望ましいが、一般的なDNNでの畳み込み演算では、そのような物体認識の性能は、左右非対称となってしまう。したがって、そのような左側走行環境の場合と右側走行環境の場合との双方について、機械学習の際に個別の評価作業が必要となり、評価工数が増大してしまうことになる。なお、例えば、左右反転させた人工画像(左右反転画像)を機械学習させる等の手法も考えられるが、その手法を用いた場合でも、厳密な左右対称性は得らないことから、結局は、評価工数が増大してしまうことになる。 In addition, since the vehicle driving environment (left-side driving environment or right-side driving environment) generally differs from country to country, it is desirable for the object recognition performance to be symmetrical, but with the convolution calculation in a typical DNN, such object recognition performance becomes asymmetrical. Therefore, separate evaluation work is required during machine learning for both the left-side driving environment and the right-side driving environment, which increases the evaluation labor hours. For example, a method can be considered in which machine learning is performed on an artificial image that is reversed left to right (left-side reversed image), but even when this method is used, strict left-right symmetry cannot be obtained, so the evaluation labor hours end up increasing.

具体的には、例えば図10に示したように、元の撮像画像Pにおいて、車両の走行環境が左側走行環境である場合(図10(A)参照)、上記した人工的な左右反転画像PLR(図10(B)参照)では、物体認識結果が以下のようになる。なお、これらの図10(A),図10(B)ではそれぞれ、物体認識の際に設定された各画像領域Rにおいて、認識された車両の前方部分を実線で示し、認識された車両の後方部分を破線で示している。Specifically, for example, as shown in Figure 10, when the vehicle driving environment in the original captured image P is a left-hand driving environment (see Figure 10 (A)), the object recognition result in the above-mentioned artificial left-right inverted image PLR (see Figure 10 (B)) is as follows. Note that in each of Figures 10 (A) and 10 (B), the front part of the recognized vehicle is shown by a solid line, and the rear part of the recognized vehicle is shown by a dashed line in each image region R set during object recognition.

ここで、図10(A)に示した元の撮像画像Pにおける物体認識結果では、例えば破線の丸で示した領域内の画像領域Rのように、認識された車両の前方部分と後方部分とが、正確に認識されている。一方、図10(B)に示した左右反転画像PLRにおける物体認識結果では、元の撮像画像Pの場合とは異なり、部分的に不正確な認識結果が、得られている。具体的には、例えば図10(B)中の破線の丸で示した領域内の画像領域Rのように、認識された車両の前方部分と後方部分とが、前後逆になってしまっている。つまり、この図10の例では、物体認識の性能が、左右対称になっていないことが分かる。Here, in the object recognition results for the original captured image P shown in FIG. 10(A), the front and rear parts of the recognized vehicle are accurately recognized, for example, as in image region R within the area indicated by the dashed circle. On the other hand, in the object recognition results for the left-right inverted image PLR shown in FIG. 10(B), unlike the case of the original captured image P, partially inaccurate recognition results are obtained. Specifically, for example, as in image region R within the area indicated by the dashed circle in FIG. 10(B), the front and rear parts of the recognized vehicle are reversed. In other words, in the example of FIG. 10, it can be seen that the object recognition performance is not symmetrical.

このようにして、比較例に係るフィルタFLcを用いた場合、画像処理(物体認識)の際の処理モデル(学習済みモデル)の軽量化を図ることや、モデル性能(認識性能)を担保することが、困難であると言える。In this way, when using the filter FLc according to the comparative example, it can be said that it is difficult to reduce the weight of the processing model (trained model) during image processing (object recognition) and to ensure model performance (recognition performance).

(B.本実施の形態)
そこで、例えば図11,図12に示したように、本実施の形態のフィルタFLでは、上記比較例のフィルタFLcとは異なり、複数のフィルタ値Vfが、以下のように設定されている。なお、図11は、本実施の形態のフィルタFLにおけるフィルタ値Vfの更新処理例を、模式的に表したものであり、図12は、本実施の形態のフィルタFLの構成例を、模式的に表したものである。
(B. This embodiment)
11 and 12, in the filter FL of this embodiment, unlike the filter FLc of the comparative example, a plurality of filter values Vf are set as follows: Note that Fig. 11 is a schematic diagram showing an example of an update process of the filter value Vf in the filter FL of this embodiment, and Fig. 12 is a schematic diagram showing an example of the configuration of the filter FL of this embodiment.

まず、例えば図12に示したように、本実施の形態のフィルタFLでは、複数のフィルタ値Vfがそれぞれ、所定方向(この例ではy軸方向)に沿った対称軸Asを中心として、線対称の値に設定されている。具体的には、この例では、そのような線対称が、対称軸Asを中心とした左右対称(x軸方向に沿った対称)となっており、複数のフィルタ値Vsが、左右対称の値に設定されている(図12中の破線の矢印参照)。First, as shown in FIG. 12, in the filter FL of this embodiment, the multiple filter values Vf are each set to values that are linearly symmetrical about a symmetry axis As that runs along a predetermined direction (the y-axis direction in this example). Specifically, in this example, such linear symmetry is bilateral symmetry (symmetry along the x-axis direction) about the symmetry axis As, and the multiple filter values Vs are set to values that are bilaterally symmetrical (see the dashed arrows in FIG. 12).

また、このような各フィルタ値Vfにおける左右対称の設定は、例えば図11に示したようにして、行われるようになっている。すなわち、前述した機械学習によるフィルタFLの更新時(図5参照)ごとに、複数のフィルタ値Vfに対する更新処理が随時実行されることによって、そのフィルタFLにおける複数のフィルタ値Vfがそれぞれ、上記した線対称の値に設定されるようになっている。具体的には、例えば図11中の破線の矢印および計算式(除算の式)で示したように、この場合におけるフィルタ値Vfの更新処理は、以下のようになっている。すなわち、上記した対称軸Asを中心とした2つの線対称位置(この例では左右対称位置)におけるフィルタ値Vfをそれぞれ、その2つの線対称位置におけるフィルタ値Vf同士の平均値に更新する処理となっている。このような更新処理により、例えば図11中に示したように、前述した比較例のフィルタFLcのように、複数のフィルタ値Vfが線対称とはなっていない(各フィルタ値Vfが任意に設定されている)構成が、上記したような線対称を示すフィルタFLに、更新されることになる。 In addition, the left-right symmetry setting of each filter value Vf is performed, for example, as shown in FIG. 11. That is, each time the filter FL is updated by the machine learning described above (see FIG. 5), the update process for the multiple filter values Vf is performed as needed, so that the multiple filter values Vf in the filter FL are set to the above-mentioned line symmetrical values. Specifically, as shown by the dashed arrows and the calculation formula (division formula) in FIG. 11, the update process for the filter value Vf in this case is as follows. That is, the filter values Vf at two line symmetrical positions (in this example, left-right symmetrical positions) centered on the symmetry axis As described above are updated to the average value of the filter values Vf at the two line symmetrical positions. By such an update process, for example, as shown in FIG. 11, a configuration in which the multiple filter values Vf are not line symmetrical (each filter value Vf is set arbitrarily) like the filter FLc of the comparative example described above is updated to a filter FL showing line symmetry as described above.

また、本実施の形態のフィルタFLでは、例えば図11,図12に示したように、複数のフィルタ値Vfが左右対称の値に設定されていることで、物体識別部123による物体の識別結果(物体認識結果)に関し、左右対称性が担保されるようになっている。具体的には、例えば、車両10の走行環境が左側走行環境である場合における、物体識別部123による物体の識別結果と、車両10の走行環境が右側走行環境である場合における、物体識別部123による物体の識別結果とに関して、左右対称性が担保されるようなっている。これにより、例えば前述した図10の比較例の場合とは異なり、本実施の形態では、以下のようになる。すなわち、例えば図10(B)に示したような、左右反転画像PLRにおける物体認識結果においても、前述した比較例の場合とは異なり、図10(A)に示した元の撮像画像Pにおける物体認識結果と、同様の結果が得られることになる。 In addition, in the filter FL of this embodiment, as shown in, for example, FIG. 11 and FIG. 12, a plurality of filter values Vf are set to symmetrical values, so that symmetry is ensured for the object identification result (object recognition result) by the object identification unit 123. Specifically, for example, symmetry is ensured for the object identification result by the object identification unit 123 when the vehicle 10 is in a left-side driving environment and the object identification result by the object identification unit 123 when the vehicle 10 is in a right-side driving environment. As a result, unlike the comparative example of FIG. 10 described above, the present embodiment is as follows. That is, for example, even in the object recognition result in the left-right inverted image PLR shown in FIG. 10(B), unlike the comparative example described above, the same result as the object recognition result in the original captured image P shown in FIG. 10(A) is obtained.

(C.作用・効果)
このようにして本実施の形態では、2次元配置された複数のフィルタ値Vfを有するフィルタFLを用いた畳み込み演算が行われることにより、撮像画像Pに含まれる特徴量Fが抽出される。そして、このフィルタFLにおける複数のフィルタ値Vfがそれぞれ、所定方向に沿った対称軸Asを中心として、線対称の値に設定されている。
(C. Actions and Effects)
In this manner, in this embodiment, a convolution operation is performed using a filter FL having a plurality of filter values Vf arranged two-dimensionally, thereby extracting a feature amount F contained in a captured image P. Then, each of the plurality of filter values Vf in the filter FL is set to a value that is line symmetrical with respect to a symmetry axis As that is aligned in a predetermined direction.

これにより本実施の形態では、例えば、複数のフィルタ値Vfが線対称とはなっていない(各フィルタ値Vfが任意に設定されている)、上記比較例の場合と比べ、フィルタFLに含まれるパラメータ数(フィルタ値Vfが示す値の個数)が、削減される。具体的には、前述した図11,図12の例では、比較例のフィルタFLcと比べ、本実施の形態のフィルタFLでは、そのようなパラメータ数が約半分まで削減されることになる。また、抽出した特徴量Fに基づく物体識別(物体認識)の際に、本実施の形態では例えば前述したように、上記比較例の場合とは異なり、線対称の性能が担保されることになる。よって、本実施の形態では、画像処理(物体認識)の際の処理モデル(学習済みモデル)の軽量化を図りつつ、モデル性能(認識性能)を担保することが可能となる。 As a result, in this embodiment, for example, the number of parameters included in the filter FL (the number of values indicated by the filter value Vf) is reduced compared to the case of the above comparative example in which the multiple filter values Vf are not line symmetric (each filter value Vf is set arbitrarily). Specifically, in the examples of Figures 11 and 12 described above, the number of such parameters is reduced to about half in the filter FL of this embodiment compared to the filter FLc of the comparative example. In addition, in this embodiment, for example, as described above, line symmetry performance is guaranteed, unlike the case of the comparative example. Therefore, in this embodiment, it is possible to ensure model performance (recognition performance) while reducing the weight of the processing model (trained model) during image processing (object recognition).

また、本実施の形態では、前述した機械学習によるフィルタFLの更新時ごとに、複数のフィルタ値Vfに対する更新処理が随時実行されることによって、フィルタFLにおける複数のフィルタ値Vfがそれぞれ、線対称の値に設定されることから、以下のようになる。すなわち、各フィルタ値Vfを線対称の値に設定する処理を、容易に行うことが可能となる。 In addition, in this embodiment, each time the filter FL is updated by the machine learning described above, the update process for the multiple filter values Vf is executed as needed, and the multiple filter values Vf in the filter FL are set to linearly symmetric values, as follows. That is, it becomes possible to easily perform the process of setting each filter value Vf to a linearly symmetric value.

更に、本実施の形態では、上記した各フィルタ値Vfに対する更新処理が、上記した対称軸Asを中心とした2つの線対称位置におけるフィルタ値Vfをそれぞれ、2つの線対称位置におけるフィルタ値Vf同士の平均値に更新する処理であることから、以下のようになる。すなわち、各フィルタ値Vfを線対称の値に設定する処理を、更に容易に行うことが可能となる。 Furthermore, in this embodiment, the update process for each filter value Vf is a process for updating the filter values Vf at two line-symmetric positions centered on the symmetry axis As to the average value of the filter values Vf at the two line-symmetric positions, as follows. In other words, it becomes possible to more easily perform the process of setting each filter value Vf to a line-symmetric value.

加えて、本実施の形態では、画像処理装置12が車両10に搭載されたものであると共に、上記した各フィルタ値Vfにおける線対称が、上記した対称軸Asを中心とした左右対称となっている。そして、複数のフィルタ値Vfが左右対称の値に設定されていることで、前述したように、車両10における左側走行環境の場合と右側走行環境の場合とにおいて、物体識別部123による物体の識別結果に関し、左右対称性が担保されるようにしたので、以下のようになる。すなわち、そのような左側走行環境の場合と右側走行環境の場合との双方について、物体識別性能の左右対称性が担保されることから、利便性を向上させることが可能となると共に、機械学習の際の評価作業を共通化することができ、評価工数を削減することが可能となる。In addition, in this embodiment, the image processing device 12 is mounted on the vehicle 10, and the line symmetry in each of the above-mentioned filter values Vf is symmetrical about the above-mentioned symmetry axis As. Since the multiple filter values Vf are set to symmetrical values, as described above, the left-right symmetry is ensured for the object identification results by the object identification unit 123 in the case of a left-side driving environment and the case of a right-side driving environment in the vehicle 10, as described below. In other words, since the left-right symmetry of the object identification performance is ensured for both the case of the left-side driving environment and the case of the right-side driving environment, it is possible to improve convenience, and the evaluation work during machine learning can be shared, making it possible to reduce the evaluation man-hours.

<2.実施例>
続いて、上記実施の形態に係る具体的な実施例について、前述した比較例の場合等と適宜比較しつつ、詳細に説明する。
2. Examples
Next, specific examples according to the above-mentioned embodiment will be described in detail while appropriately comparing them with the comparative examples described above.

図13は、実施例等に係るデータセットDSの構成例を、模式的に表したものである。図14は、実施例等に係る機械学習モデル(DNNにおける学習済みモデル)の構成例を、模式的に表したものである。図15,図16はそれぞれ、比較例、参考例および実施例に係る物体認識結果(後述する評価(1),(2)の結果)の一例を、表したものである。具体的には、図15では、横軸がエポック数(Epoch)、縦軸が正解率(Accuracy)に設定されており、比較例、参考例および実施例の各々において、「val(validationデータ)」の場合と「train(trainデータ)」の場合とについて、示している。一方、図16では、横軸がエポック数(Epoch)、縦軸が、元の撮像画像での正解率と左右反転画像での正解率との差分の絶対値(|Original Accuracy - Flipped Accuracy|)に設定されている。また、図17は、比較例および実施例に係るパラメータ数(後述する評価(3)の結果)の一例を、表したものである。 FIG. 13 is a schematic diagram of a configuration example of a dataset DS according to the embodiment. FIG. 14 is a schematic diagram of a configuration example of a machine learning model (a trained model in a DNN) according to the embodiment. FIG. 15 and FIG. 16 are diagrams showing an example of an object recognition result (the result of evaluations (1) and (2) described later) according to the comparative example, the reference example, and the embodiment, respectively. Specifically, in FIG. 15, the horizontal axis is set to the number of epochs (Epoch), and the vertical axis is set to the accuracy rate (Accuracy), and the comparative example, the reference example, and the embodiment are shown for the cases of "val (validation data)" and "train (train data)". On the other hand, in FIG. 16, the horizontal axis is set to the number of epochs (Epoch), and the vertical axis is set to the absolute value of the difference between the accuracy rate in the original captured image and the accuracy rate in the left-right flipped image (|Original Accuracy - Flipped Accuracy|). FIG. 17 is a diagram showing an example of the number of parameters (the result of evaluation (3) described later) according to the comparative example and the embodiment.

なお、これらの図13~図16中に示した、比較例、参考例および実施例とはそれぞれ、以下のような機械学習による物体認識手法となっている。
・比較例:一般的な機械学習による物体認識手法
(図9,図10に示した比較例のフィルタFLcを用いた畳み込み演算の例)
・参考例:元の撮像画像に加えて左右反転画像も機械学習させた場合の物体認識手法
・実施例:本実施の形態のフィルタFLを用いた畳み込み演算を利用した物体認識手法
(図11,図12の例を参照)
The comparative example, reference example, and working example shown in FIGS. 13 to 16 are each an object recognition method using machine learning as described below.
・Comparison example: General object recognition method using machine learning
(Example of convolution calculation using filter FLc of the comparative example shown in FIGS. 9 and 10)
Reference Example: An object recognition method in which machine learning is performed on a left-right inverted image in addition to an original captured image. Example: An object recognition method using a convolution operation with the filter FL of this embodiment.
(See examples in Figures 11 and 12.)

まず、これらの実施例等(比較例、参考例および実施例)における機械学習による物体認識では、図13中に模式的に示した、公知のデータセットDS(Fashion-MNISTデータセット)の衣服画像を使用し、10クラス分の分類問題を扱うようにした。また、これらの実施例等に係る機械学習モデルとしては、図14に示したモデルを使用した。すなわち、前述した畳み込み演算CNと活性化関数CAとを交互に組み合わせた、合計(20+1)層のニューラルネットワークを使用した。そして、これらの実施例等について、以下説明する3種類の評価(評価(1)~(3))を実施した。First, in the object recognition by machine learning in these examples (comparative examples, reference examples, and examples), clothing images from the known dataset DS (Fashion-MNIST dataset) shown in FIG. 13 were used to handle classification problems for 10 classes. In addition, the model shown in FIG. 14 was used as the machine learning model for these examples. That is, a neural network with a total of (20+1) layers was used, in which the above-mentioned convolution operation CN and activation function CA were alternately combined. Then, three types of evaluations (evaluations (1) to (3)) were performed on these examples, as described below.

最初に、図15に示した評価(1)の結果では、実施例および参考例ではそれぞれ、比較例と比べて正解率が高くなっており、高性能な物体認識結果が得られていることが分かる。また、実施例および参考例では、ほぼ同等の性能が得られているが、実施例のほうが参考例と比べ、若干高性能となっており、実施例において、最も高性能な物体認識結果が得られている。First, in the results of evaluation (1) shown in Figure 15, the accuracy rate is higher in the Example and the Reference Example than in the Comparative Example, and it can be seen that high-performance object recognition results are obtained. In addition, the Example and the Reference Example have almost the same performance, but the Example has slightly higher performance than the Reference Example, and the Example has the highest performance object recognition results.

次に、図16に示した評価(2)の結果では、上記した正解率の差分(元の撮像画像での正解率と左右反転画像での正解率との差分の絶対値)が、比較例では、実施例および参考例と比べ、大幅に大きくなっていることが分かる。これは、比較例は一般的な機械学習であることから、前述したように、物体認識の性能が、左右非対称になっているためである。一方、参考例では、上記した正解率の差分が小さいものの、完全には「0」となっておらず、物体認識の性能が、完全には左右対称になっていないことが分かる。これらの比較例および参考例に対し、実施例では、上記した正解率の差分が、完全に常時「0」となっており、物体認識の性能が、完全に左右対称になっている(左右対称性が担保されている)ことが分かる。Next, in the results of evaluation (2) shown in FIG. 16, it can be seen that the difference in accuracy rate (the absolute value of the difference between the accuracy rate in the original captured image and the accuracy rate in the left-right inverted image) is significantly larger in the comparative example than in the embodiment and the reference example. This is because the comparative example is a general machine learning, and the object recognition performance is asymmetrical, as described above. On the other hand, in the reference example, although the difference in accuracy rate is small, it is not completely "0", and it can be seen that the object recognition performance is not completely symmetrical. In contrast to these comparative examples and reference examples, in the embodiment, the difference in accuracy rate is completely "0" at all times, and it can be seen that the object recognition performance is completely symmetrical (left-right symmetry is guaranteed).

続いて、図17に示した評価(3)の結果では、前述したように、実施例では比較例と比べ、畳み込み演算の際に用いられるフィルタに含まれるパラメータ数(フィルタ値Vfが示す値の個数)が、削減されていることが分かる(図17中の破線の矢印参照)。具体的には、この例では、比較例におけるパラメータ数が「34950」、実施例におけるパラメータ数が「22134」となっており、実施例では比較例と比べ、パラメータ数が約63%まで、削減されている。Next, in the results of evaluation (3) shown in Figure 17, as mentioned above, it can be seen that the number of parameters (the number of values indicated by the filter value Vf) included in the filter used in the convolution operation is reduced in the Example compared to the Comparative Example (see the dashed arrow in Figure 17). Specifically, in this example, the number of parameters in the Comparative Example is "34950" and the number of parameters in the Example is "22134", and the number of parameters in the Example is reduced to approximately 63% compared to the Comparative Example.

以上のことから、本実施例では比較例等と比べ、前述したように、物体認識における線対称(左右対称)の性能が、担保されると共に、上記したパラメータ数が約半分まで削減されることが、実際に確認された。なお、上記した実施例等において使用したデータセットは、あくまでも一例であり、他のデータセットを使用した場合においても、比較例、参考例および実施例において、同様の評価結果(物体認識結果)が得られた。 From the above, it was actually confirmed that in this embodiment, as described above, line symmetric (left-right symmetric) performance in object recognition is guaranteed and the number of parameters described above is reduced to about half, compared to the comparative examples, etc. Note that the data set used in the above-mentioned embodiments is merely an example, and similar evaluation results (object recognition results) were obtained in the comparative examples, reference examples, and embodiments even when other data sets were used.

<3.変形例>
以上、実施の形態および実施例を挙げて本開示を説明したが、本開示はこれらの実施の形態等に限定されず、種々の変形が可能である。
3. Modifications
Although the present disclosure has been described above by giving embodiments and examples, the present disclosure is not limited to these embodiments, and various modifications are possible.

例えば、車両10や画像処理装置12における各部材の構成(形式、形状、配置、個数等)については、上記実施の形態等で説明したものには限られない。すなわち、これらの各部材における構成については、他の形式や形状、配置、個数等であってもよい。また、上記実施の形態等で説明した各種パラメータの値や範囲、大小関係等についても、上記実施の形態等で説明したものには限られず、他の値や範囲、大小関係等であってもよい。For example, the configuration (type, shape, arrangement, number, etc.) of each component in the vehicle 10 and the image processing device 12 is not limited to that described in the above embodiment, etc. In other words, the configuration of each of these components may be of other types, shapes, arrangements, numbers, etc. Furthermore, the values, ranges, magnitude relationships, etc. of the various parameters described in the above embodiment, etc. are not limited to those described in the above embodiment, etc., and may be other values, ranges, magnitude relationships, etc.

具体的には、例えば上記実施の形態等では、ステレオカメラ11が車両10の前方を撮像するように構成されていたが、このような構成には限定されず、例えばステレオカメラ11が、車両10の側方や後方を撮像するように構成してもよい。また、上記実施の形態等では、ステレオカメラ11を用いた場合の例について説明したが、この例には限られず、例えば単眼のカメラを用いて、上記実施の形態等で説明した各種処理を行うようにしてもよい。Specifically, for example, in the above-described embodiment, the stereo camera 11 is configured to capture an image in front of the vehicle 10, but the present invention is not limited to this configuration, and for example, the stereo camera 11 may be configured to capture an image of the side or rear of the vehicle 10. Also, in the above-described embodiment, an example in which the stereo camera 11 is used is described, but the present invention is not limited to this example, and for example, a monocular camera may be used to perform the various processes described in the above-described embodiment.

また、例えば、上記実施の形態等では、車両10や画像処理装置12において行われる各種処理について、具体例を挙げて説明したが、これらの具体例には限られない。すなわち、他の手法を用いて、これらの各種処理を行うようにしてもよい。具体的には、例えば、前述したフィルタ値の設定手法や、フィルタ値の更新処理の手法については、上記実施の形態等で説明した手法には限られず、他の手法を用いるようにしてもよい。より具体的には、例えば、上記実施の形態等では、y軸方向(列方向)に沿った対称軸を中心とした線対称(左右対称)の場合を、例に挙げて説明したが、この例には限られない。すなわち、例えば、x軸方向(行方向)に沿った対称軸を中心とした線対称(上下対称)の場合や、斜め方向に沿った対称軸を中心とした線対称の場合などであってもよい。また、上記実施の形態等では、フィルタ値の更新処理が随時実行されることによって、フィルタ値が線対称に設定される場合を、例に挙げて説明したが、この例には限られず、他の手法を用いて、フィルタ値が線対称に設定されるようにしてもよい。加えて、上記実施の形態等では、畳み込み演算を複数回繰り返して行う場合を、例に挙げて説明したが、この例には限られない。すなわち、例えば、畳み込み演算を1回だけ行うと共に、他の演算手法を組み合わせて行うことによって、特徴量を抽出するようにしてもよい。 In addition, for example, in the above embodiment, the various processes performed in the vehicle 10 and the image processing device 12 are described using specific examples, but are not limited to these specific examples. That is, these various processes may be performed using other methods. Specifically, for example, the above-mentioned filter value setting method and filter value update processing method are not limited to the methods described in the above embodiment, and other methods may be used. More specifically, for example, in the above embodiment, a case of line symmetry (left-right symmetry) centered on an axis of symmetry along the y-axis direction (column direction) is described as an example, but is not limited to this example. That is, for example, a case of line symmetry (up-down symmetry) centered on an axis of symmetry along the x-axis direction (row direction) or a case of line symmetry centered on an axis of symmetry along a diagonal direction may be used. In addition, in the above embodiment, a case in which the filter value is set to line symmetry by the filter value update processing being performed at any time is described as an example, but is not limited to this example, and the filter value may be set to line symmetry using other methods. In addition, in the above embodiment, the case in which the convolution operation is repeated multiple times is described as an example, but is not limited to this example. That is, for example, the feature amount may be extracted by performing the convolution operation only once in combination with other operation methods.

更に、上記実施の形態等で説明した一連の処理は、ハードウェア(回路)で行われるようにしてもよいし、ソフトウェア(プログラム)で行われるようにしてもよい。ソフトウェアで行われるようにした場合、そのソフトウェアは、各機能をコンピュータにより実行させるためのプログラム群で構成される。各プログラムは、例えば、上記コンピュータに予め組み込まれて用いられてもよいし、ネットワークや記録媒体から上記コンピュータにインストールして用いられてもよい。 Furthermore, the series of processes described in the above embodiments may be performed by hardware (circuits) or by software (programs). When performed by software, the software is composed of a group of programs for causing a computer to execute each function. Each program may, for example, be pre-installed in the computer and used, or may be installed in the computer from a network or recording medium and used.

また、上記実施の形態等では、画像処理装置12が車両に搭載されている場合の例について説明したが、この例には限られず、そのような画像処理装置12が、例えば、車両以外の移動体や、移動体以外の装置に設けられているようにしてもよい。 In addition, in the above embodiments, an example has been described in which the image processing device 12 is mounted on a vehicle, but this is not limited to the example, and such an image processing device 12 may be provided, for example, in a moving body other than a vehicle or in a device other than a moving body.

更に、これまでに説明した各種の例を、任意の組み合わせで適用させるようにしてもよい。 Furthermore, the various examples described above may be applied in any combination.

なお、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、また、他の効果があってもよい。Note that the effects described in this specification are merely examples and are not limiting, and other effects may also exist.

また、本開示は、以下のような構成を取ることも可能である。
(1)
撮像画像に含まれる特徴量を抽出する抽出部と、
前記特徴量に基づいて物体を識別する物体識別部と
を備え、
前記抽出部は、前記撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、前記特徴量を抽出し、
前記フィルタにおける前記複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されている
画像処理装置。
(2)
機械学習による前記フィルタの更新時ごとに、前記複数のフィルタ値に対する更新処理が随時実行されることによって、
前記フィルタにおける前記複数のフィルタ値がそれぞれ、前記線対称の値に設定されるようになっている
上記(1)に記載の画像処理装置。
(3)
前記更新処理が、前記対称軸を中心とした2つの線対称位置における前記フィルタ値をそれぞれ、前記2つの線対称位置における前記フィルタ値同士の平均値に更新する処理である
上記(2)に記載の画像処理装置。
(4)
前記画像処理装置が、車両に搭載されたものであると共に、
前記線対称が、前記対称軸を中心とした左右対称であり、
前記複数のフィルタ値が、前記左右対称の値に設定されていることにより、
前記車両の走行環境が左側走行環境である場合における、前記物体識別部による前記物体の識別結果と、
前記車両の走行環境が右側走行環境である場合における、前記物体識別部による前記物体の識別結果と
に関して、左右対称性が担保されるようなっている
上記(1)ないし(3)のいずれかに記載の画像処理装置。
(5)
上記(1)ないし(4)のいずれかに記載の画像処理装置と、
前記物体識別部による前記物体の識別結果を利用して、車両制御を行う車両制御部と
を備えた車両。
(6)
1または複数のプロセッサと、
前記1または複数のプロセッサに通信可能に接続される1または複数のメモリと
を備え、
前記1または複数のプロセッサは、
撮像画像に含まれる特徴量を抽出することと、
前記特徴量に基づいて物体を識別することと
を行うと共に、
前記撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、前記特徴量を抽出し、
前記フィルタにおける前記複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されている
画像処理装置。
The present disclosure can also be configured as follows.
(1)
An extraction unit that extracts a feature amount included in a captured image;
an object identification unit that identifies an object based on the feature amount,
the extraction unit extracts the feature amount by performing a convolution operation using a filter having a plurality of filter values that are two-dimensionally arranged on the basis of the captured image;
the filter values in the filter are set to values that are line-symmetric with respect to an axis of symmetry along a predetermined direction.
(2)
An update process is performed on the plurality of filter values at each time the filter is updated by machine learning,
The image processing device according to (1) above, wherein the filter values in the filter are each set to values symmetrical to the axis.
(3)
The image processing device according to claim 2, wherein the update process updates each of the filter values at two line-symmetric positions centered on the axis of symmetry to an average value of the filter values at the two line-symmetric positions.
(4)
The image processing device is mounted on a vehicle,
The linear symmetry is bilateral symmetry around the axis of symmetry,
The plurality of filter values are set to the symmetrical values,
A result of identifying the object by the object identifying unit when the vehicle is in a left-side driving environment; and
The image processing device according to any one of (1) to (3) above, wherein left-right symmetry is ensured with respect to the object identification result by the object identification unit when the vehicle is in a right-side driving environment.
(5)
An image processing device according to any one of (1) to (4) above;
a vehicle control unit that performs vehicle control using a result of the object identification by the object identification unit.
(6)
one or more processors;
one or more memories communicatively coupled to the one or more processors;
The one or more processors:
Extracting a feature amount included in a captured image;
and identifying an object based on the feature amount,
extracting the feature amount by performing a convolution operation using a filter having a plurality of filter values arranged two-dimensionally based on the captured image;
the filter values in the filter are set to values that are line-symmetric with respect to an axis of symmetry along a predetermined direction.

Claims (6)

撮像画像に含まれる特徴量を抽出する抽出部と、
前記特徴量に基づいて物体を識別する物体識別部と
を備え、
前記抽出部は、前記撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、前記特徴量を抽出し、
機械学習による前記フィルタの更新時ごとに、前記複数のフィルタ値に対する更新処理が随時実行されることによって、前記フィルタにおける前記複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されており、
前記更新処理が、前記対称軸を中心とした2つの線対称位置における前記フィルタ値をそれぞれ、前記2つの線対称位置における前記フィルタ値同士の平均値に更新する処理である
画像処理装置。
An extraction unit that extracts a feature amount included in a captured image;
an object identification unit that identifies an object based on the feature amount,
the extraction unit extracts the feature amount by performing a convolution operation using a filter having a plurality of filter values that are two-dimensionally arranged on the basis of the captured image;
an update process is executed on the plurality of filter values whenever the filter is updated by machine learning, so that the plurality of filter values in the filter are set to values that are line symmetric about an axis of symmetry along a predetermined direction;
The image processing device, wherein the update process is a process of updating each of the filter values at two line-symmetric positions about the axis of symmetry to an average value of the filter values at the two line-symmetric positions.
(削除)(delete) (削除)(delete) 前記画像処理装置が、車両に搭載されたものであると共に、
前記線対称が、前記対称軸を中心とした左右対称であり、
前記複数のフィルタ値が、前記左右対称の値に設定されていることにより、
前記車両の走行環境が左側走行環境である場合における、前記物体識別部による前記物体の識別結果と、
前記車両の走行環境が右側走行環境である場合における、前記物体識別部による前記物体の識別結果と
に関して、左右対称性が担保されるようなっている
請求項1に記載の画像処理装置。
The image processing device is mounted on a vehicle,
The linear symmetry is bilateral symmetry around the axis of symmetry,
The plurality of filter values are set to the symmetrical values,
A result of identifying the object by the object identifying unit when the vehicle driving environment is a left-side driving environment; and
The image processing device according to claim 1 , wherein left-right symmetry is ensured with respect to the identification result of the object by the object identification unit when the vehicle is traveling in a right-hand driving environment.
請求項1または請求項4に記載の画像処理装置と、
前記物体識別部による前記物体の識別結果を利用して、車両制御を行う車両制御部と
を備えた車両。
The image processing device according to claim 1 or 4,
a vehicle control unit that performs vehicle control using a result of the object identification by the object identification unit.
1または複数のプロセッサと、
前記1または複数のプロセッサに通信可能に接続される1または複数のメモリと
を備え、
前記1または複数のプロセッサは、
撮像画像に含まれる特徴量を抽出することと、
前記特徴量に基づいて物体を識別することと
を行うと共に、
前記撮像画像に基づいて、2次元配置された複数のフィルタ値を有するフィルタを用いた畳み込み演算を行うことにより、前記特徴量を抽出し、
機械学習による前記フィルタの更新時ごとに、前記複数のフィルタ値に対する更新処理が随時実行されることによって、前記フィルタにおける前記複数のフィルタ値がそれぞれ、所定方向に沿った対称軸を中心として、線対称の値に設定されており、
前記更新処理が、前記対称軸を中心とした2つの線対称位置における前記フィルタ値をそれぞれ、前記2つの線対称位置における前記フィルタ値同士の平均値に更新する処理である
画像処理装置。
one or more processors;
one or more memories communicatively coupled to the one or more processors;
The one or more processors:
Extracting a feature amount included in a captured image;
Identifying an object based on the feature amount,
extracting the feature amount by performing a convolution operation using a filter having a plurality of filter values arranged two-dimensionally based on the captured image;
an update process is executed on the plurality of filter values whenever the filter is updated by machine learning, so that the plurality of filter values in the filter are set to values that are line symmetric about an axis of symmetry along a predetermined direction;
The image processing device, wherein the update process is a process of updating each of the filter values at two line-symmetric positions about the axis of symmetry to an average value of the filter values at the two line-symmetric positions.
JP2023526803A 2021-06-11 2021-06-11 Image processing device and vehicle Active JP7480436B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/022298 WO2022259520A1 (en) 2021-06-11 2021-06-11 Image processing device and vehicle

Publications (3)

Publication Number Publication Date
JPWO2022259520A1 JPWO2022259520A1 (en) 2022-12-15
JPWO2022259520A5 JPWO2022259520A5 (en) 2024-02-15
JP7480436B2 true JP7480436B2 (en) 2024-05-09

Family

ID=84425048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023526803A Active JP7480436B2 (en) 2021-06-11 2021-06-11 Image processing device and vehicle

Country Status (4)

Country Link
US (1) US20230377347A1 (en)
JP (1) JP7480436B2 (en)
CN (1) CN115734907A (en)
WO (1) WO2022259520A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000187733A (en) 1998-12-22 2000-07-04 Canon Inc Image processor, its method and recording medium
JP2018055470A (en) 2016-09-29 2018-04-05 国立大学法人神戸大学 Facial expression recognition method, facial expression recognition apparatus, computer program, and advertisement management system
JP2020030598A (en) 2018-08-22 2020-02-27 株式会社東芝 Image processing device and image processing method
JP2020102111A (en) 2018-12-25 2020-07-02 トヨタ自動車株式会社 Information processing device and visual inspection device
JP2020177444A (en) 2019-04-18 2020-10-29 三井住友海上火災保険株式会社 Crew member injury estimation server, crew member injury estimation system, crew member injury estimation method and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000187733A (en) 1998-12-22 2000-07-04 Canon Inc Image processor, its method and recording medium
JP2018055470A (en) 2016-09-29 2018-04-05 国立大学法人神戸大学 Facial expression recognition method, facial expression recognition apparatus, computer program, and advertisement management system
JP2020030598A (en) 2018-08-22 2020-02-27 株式会社東芝 Image processing device and image processing method
JP2020102111A (en) 2018-12-25 2020-07-02 トヨタ自動車株式会社 Information processing device and visual inspection device
JP2020177444A (en) 2019-04-18 2020-10-29 三井住友海上火災保険株式会社 Crew member injury estimation server, crew member injury estimation system, crew member injury estimation method and program

Also Published As

Publication number Publication date
US20230377347A1 (en) 2023-11-23
CN115734907A (en) 2023-03-03
WO2022259520A1 (en) 2022-12-15
JPWO2022259520A1 (en) 2022-12-15

Similar Documents

Publication Publication Date Title
US20210350168A1 (en) Image segmentation method and image processing apparatus
Jaritz et al. Sparse and dense data with cnns: Depth completion and semantic segmentation
Voigtlaender et al. Online adaptation of convolutional neural networks for the 2017 davis challenge on video object segmentation
Saha et al. Enabling spatio-temporal aggregation in birds-eye-view vehicle estimation
US10958869B1 (en) System, device and method for video frame interpolation using a structured neural network
CN109416727B (en) Method and device for removing glasses in face image
CN104899921B (en) Single-view videos human body attitude restoration methods based on multi-modal own coding model
CN112529904B (en) Image semantic segmentation method, device, computer readable storage medium and chip
Qi et al. 3D motion decomposition for RGBD future dynamic scene synthesis
Cho et al. Event-image fusion stereo using cross-modality feature propagation
CN101739670B (en) Non-local mean space domain time varying image filtering method
DE102017108255A1 (en) PARALLEL DETECTION OF PRIMITIVES IN A SCENE USING A ROUNDUM CAMERA SYSTEM
JP7480436B2 (en) Image processing device and vehicle
Huang et al. ES-Net: An efficient stereo matching network
CN104809705A (en) Image denoising method and system based on threshold value block matching
Hirohashi et al. Removal of image obstacles for vehicle-mounted surrounding monitoring cameras by real-time video inpainting
Chang et al. StereoVAE: A lightweight stereo-matching system using embedded GPUs
Vien et al. Bidirectional motion estimation with cyclic cost volume for high dynamic range imaging
CN113592021B (en) Stereo matching method based on deformable and depth separable convolution
JP2023092268A (en) Image processing apparatus and vehicle
JP2023047062A (en) Image processing device and vehicle
CN112070817B (en) Image depth estimation method, terminal equipment and computer readable storage medium
JP2022181996A (en) Image processing apparatus and vehicle
WO2022244333A1 (en) Object recognition device and object recognition method
US20220076045A1 (en) Image processing apparatus

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A527

Effective date: 20231110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240402

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240424

R150 Certificate of patent or registration of utility model

Ref document number: 7480436

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150