JP7359735B2

JP7359735B2 - 物体状態識別装置、物体状態識別方法及び物体状態識別用コンピュータプログラムならびに制御装置

Info

Publication number: JP7359735B2
Application number: JP2020068674A
Authority: JP
Inventors: 大輔橋本; 龍介黒田
Original assignee: Denso Corp; Toyota Motor Corp
Current assignee: Denso Corp; Toyota Motor Corp
Priority date: 2020-04-06
Filing date: 2020-04-06
Publication date: 2023-10-11
Anticipated expiration: 2040-04-06
Also published as: CN113496201A; US11829153B2; CN113496201B; US20210312199A1; JP2021165914A

Description

本発明は、画像に表された物体の状態を識別する物体状態識別装置、物体状態識別方法及び物体状態識別用コンピュータプログラム、ならびに、そのような物体状態識別装置を利用した、車両の走行を制御する制御装置に関する。

車両を自動運転するよう、車両を制御する技術が研究されている。車両を自動運転するためには、車両の周囲に存在する他の物体と車両とが衝突しないように、他の物体の挙動を予測した上で、車両の走行予定経路を設定することが求められる。そのために、車両の周囲に存在する他の物体の挙動を予測する技術が提案されている（例えば、特許文献１を参照）。

例えば、特許文献１に開示された移動体挙動予測装置は、車両から認識可能な移動体の挙動の予測結果と、予測時間経過後の移動体の挙動の認識結果に基づいて、移動体の第一予測挙動を出力するとともに、車両の挙動に基づいて、車両から認識可能な移動体の第二予測挙動を出力する。そしてこの移動体挙動予測装置は、移動体の挙動の予測結果と、予測時間経過後の移動体の挙動の認識結果との誤差を最小化するように第一予測挙動を学習し、自車両が不安全な運転を行わないように自車両の周辺の移動体の将来の第二予測挙動を学習する。さらに、この移動体挙動予測装置は、教師有り学習に基づいて第一予測挙動を出力する第一ニューラルネットワークと、強化学習に基づいて第二予測挙動を出力する第二ニューラルネットワークとを有する。

特開２０１９－１０９６９１号公報

上記の技術のように、他の物体の挙動を予測する処理を、ニューラルネットワークを用いて実行する場合、演算量が非常に多くなることがある。そのため、他の物体の挙動を予測する処理を実行するハードウェアに対する要求が過大となり、あるいは、他の物体の挙動を予測する処理が所望の時間までに終了しないことがある。

そこで、本発明は、処理負荷を時間的に分散させることが可能な物体状態識別装置を提供することを目的とする。

一つの実施形態によれば、物体状態識別装置が提供される。この物体状態識別装置は、撮像部から画像を取得する度に、画像を第１の識別器に入力することで、画像に表された少なくとも一つの所定の物体のそれぞれについて、画像上でその物体を含む物体領域を検出する物体検出部と、少なくとも一つの所定の物体のそれぞれについて、撮像部から取得された画像の次に撮像部から得られる次画像におけるその物体の位置を予測可能か否か判定し、その物体の位置を予測可能な場合、次画像上の予測されるその物体の位置を含む予測物体領域を設定する予測部と、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されている物体について、次画像から物体領域が検出されるよりも前に、次画像上の予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別し、一方、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されていない物体について、次画像から検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別する状態識別部とを有する。

この物体状態識別装置において、第１の識別器よる物体領域の検出と、第２の識別器による少なくとも一つの所定の物体のそれぞれの状態の識別とは互いに異なる演算回路により実行されることが好ましい。

この場合において、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されている物体についての第２の識別器による状態の識別は、第１の識別器による次画像からの物体領域の検出と並列に実行されることが好ましい。

また、この物体状態識別装置において、予測部は、少なくとも一つの所定の物体のうち、画像上の物体領域の少なくとも一端が画像の何れか一端と接している物体について、次画像におけるその物体の位置を予測不能と判定し、その物体について次画像における予測物体領域を設定しないことが好ましい。

あるいはまた、この物体状態識別装置において、撮像部は、車両に搭載され、予測部は、少なくとも一つの所定の物体のそれぞれについて、車両が走行中の車線と隣接する車線を走行しているか否か判定し、かつ、車両からの距離を求め、少なくとも一つの所定の物体のうち、隣接する車線を走行しており、かつ、車両からの距離が所定距離以下となる物体について、次画像におけるその物体の位置を予測不能と判定し、その物体について次画像における予測物体領域を設定しないことが好ましい。

本発明の他の形態によれば、車両の走行を制御する制御装置が提供される。この制御装置は、車両に搭載された撮像部から画像を取得する度に、画像を第１の識別器に入力することで、画像に表された車両周囲の少なくとも一つの所定の物体のそれぞれについて、画像上でその物体を含む物体領域を検出する物体検出部と、少なくとも一つの所定の物体のそれぞれについて、撮像部から取得された画像の次に撮像部から得られる次画像におけるその物体の位置を予測可能か否か判定し、その物体の位置を予測可能な場合、次画像上の予測されるその物体の位置を含む予測物体領域を設定する予測部と、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されている物体について、次画像から物体領域が検出されるよりも前に、次画像上の予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別し、一方、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されていない物体について、次画像から検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別する状態識別部と、少なくとも一つの所定の物体のそれぞれについて、その物体の状態に基づいて、その物体が移動する軌跡を予測し、予測した軌跡に基づいて、車両が少なくとも一つの所定の物体の何れとも所定距離以上離れるように車両の走行予定経路を設定する運転計画部と、走行予定経路に沿って車両が走行するように車両を制御する車両制御部とを有する、

本発明のさらに他の形態によれば、物体状態識別方法が提供される。この物体状態識別方法は、撮像部から画像を取得する度に、画像を第１の識別器に入力することで、画像に表された少なくとも一つの所定の物体のそれぞれについて、画像上でその物体を含む物体領域を検出し、少なくとも一つの所定の物体のそれぞれについて、撮像部から取得された画像の次に撮像部から得られる次画像におけるその物体の位置を予測可能か否か判定し、その物体の位置を予測可能な場合、次画像上の予測されるその物体の位置を含む予測物体領域を設定し、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されている物体について、次画像から物体領域が検出されるよりも前に、次画像上の予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別し、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されていない物体について、次画像から検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで時系列の外観変化を伴うその物体の状態を識別する、ことを含む。

本発明のさらに他の形態によれば、物体状態識別用コンピュータプログラムが提供される。この物体状態識別用コンピュータプログラムは、撮像部から画像を取得する度に、画像を第１の識別器に入力することで、画像に表された少なくとも一つの所定の物体のそれぞれについて、画像上でその物体を含む物体領域を検出し、少なくとも一つの所定の物体のそれぞれについて、撮像部から取得された画像の次に撮像部から得られる次画像におけるその物体の位置を予測可能か否か判定し、その物体の位置を予測可能な場合、次画像上の予測されるその物体の位置を含む予測物体領域を設定し、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されている物体について、次画像から物体領域が検出されるよりも前に、次画像上の予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴うその物体の状態を識別し、少なくとも一つの所定の物体のうち、次画像について予測物体領域が設定されていない物体について、次画像から検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで時系列の外観変化を伴うその物体の状態を識別することをコンピュータに実行させるための命令を含む。

本発明に係る物体状態識別装置は、処理負荷を時間的に分散させることができるという効果を奏する。

物体状態識別装置が実装される車両制御システムの概略構成図である。物体状態識別装置の一実施形態である電子制御装置のハードウェア構成図である。物体状態識別処理を含む車両制御処理に関する、電子制御装置のプロセッサの機能ブロック図である。第１の識別器として利用されるDNNの構成の一例を示す図である。次画像上での位置が予測可能な検出対象物体と次画像上での位置が予測不能な検出対象物体の一例を示す図である。状態識別処理に関連する各部の処理のタイミングチャートである。検出物体リストの一例を示す図である。物体状態識別処理を含む車両制御処理の動作フローチャートである。

以下、図を参照しつつ、物体状態識別装置、及び、物体状態識別装置において実行される物体状態識別方法ならびに物体状態識別用コンピュータプログラムについて説明する。この物体状態識別装置は、例えば、車両に搭載され、車両周囲の他の車両といった、検出対象となる物体（以下、検出対象物体と呼ぶことがある）に関して、時系列の外観変化を伴う状態を識別する。そのために、この物体状態識別装置は、車両に搭載されたカメラにより画像が得られる度に、その画像を、検出対象物体を検出するように予め学習された第１の識別器に入力することで、その画像上で検出対象物体を含む領域（以下、物体領域と呼ぶことがある）を検出する。また、この物体状態識別装置は、検出された検出対象物体を追跡することで、各画像において同じ検出対象物体が表された物体領域同士を対応付ける。一方、この物体状態識別装置は、追跡中の検出対象物体を含む物体領域の位置などに基づいて、次に得られる画像におけるその検出対象物体の位置を予測可能か否か判定し、その位置を予測可能な場合には、その検出対象物体の予測位置を含む予測物体領域を求める。そしてこの物体状態識別装置は、次に画像が得られたときに、検出対象物体の位置が予測可能と判定されている場合には、次の画像から第１の識別器により物体領域が検出されるよりも前に、予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで検出対象物体の状態を識別する。一方、次に画像が得られたときに、検出対象物体の位置が予測不能と判定されている場合には、この物体状態識別装置は、次の画像に対して第１の識別器により検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで検出対象物体の状態を識別する。これにより、同時に追跡中の複数の検出対象物体が存在しても、この物体状態識別装置は、第２の識別器による処理が実行されるタイミングを、検出対象物体ごとに異ならせることができる。そのため、この物体状態識別装置は、処理負荷を時間的に分散させることができる。さらに、この物体状態識別装置が複数の演算回路を有している場合、その複数の演算回路のうち、第２の識別器による処理を実行する演算回路の待ち時間が減少し、その結果として物体状態識別処理全体のスループットが向上する。

例えば、検出対象物体が車両であるとする。車両は、左折または右折する場合、ターンシグナルを点滅させる。また、車両は、減速する際にブレーキランプを点灯させ、停車する際などにハザードランプを点滅させる。これらターンシグナルまたはブレーキランプといった、車両の信号灯の点灯または点滅は、時系列の車両の外観の変化を伴うものであり、かつ、車両の挙動に関する状態を表している。しかし、ターンシグナル、ブレーキランプまたはハザードランプが表された個々の画像では、それらのランプの明滅の時系列変化が分からないため、ターンシグナルまたはハザードランプが点滅しているか否か、ブレーキランプが点灯しているか消灯しているかを、ターンシグナル、ブレーキランプまたはハザードランプが表された個々の画像から精度良く識別することは困難である。そこで、この物体状態識別装置は、上記のように、時系列の一連の画像のそれぞれの物体領域内の画素値から求められる特徴を、再帰構造を持つ第２の識別器に入力することで、ターンシグナルまたはハザードランプの点滅の有無、ブレーキランプの点灯及び消灯を精度良く識別することができる。

以下では、物体状態識別装置を、車両制御システムに適用した例について説明する。この例では、物体状態識別装置は、車両に搭載されたカメラにより得られた時系列の一連の画像に対して物体状態識別処理を実行することで、検出対象物体として、車両の周囲に存在する他の車両を検出する。そしてこの物体状態識別装置は、検出した他の車両の、外観変化を伴う状態として、左右何れかのターンシグナルまたはハザードランプの点滅状態か否か、ブレーキランプが点灯している状態あるいは消灯している状態かを識別する。

図１は、物体状態識別装置が実装される車両制御システムの概略構成図である。また図２は、物体状態識別装置の一つの実施形態である電子制御装置のハードウェア構成図である。本実施形態では、車両１０に搭載され、かつ、車両１０を制御する車両制御システム１は、車両１０の周囲を撮影するためのカメラ２と、物体状態識別装置の一例である電子制御装置（ＥＣＵ）３とを有する。カメラ２とＥＣＵ３とは、コントローラエリアネットワークといった規格に準拠した車内ネットワーク４を介して通信可能に接続される。なお、車両制御システム１は、車両１０の自動運転制御に用いられる地図を記憶するストレージ装置をさらに有していてもよい。さらに、車両制御システム１は、LiDARあるいはレーダといった測距センサ、GPS受信機といった、衛星測位システムに準拠して車両１０の自己位置を測位するための受信機、他の機器と無線通信するための無線端末、及び、車両１０の走行予定ルートを探索するためのナビゲーション装置などを有していてもよい。

カメラ２は、所定の検知範囲内に存在する物体を検出するためのセンサである撮像部の一例であり、CCDあるいはC-MOSなど、可視光に感度を有する光電変換素子のアレイで構成された２次元検出器と、その２次元検出器上に撮影対象となる領域の像を結像する結像光学系を有する。そしてカメラ２は、車両１０の前方を向くように、例えば、車両１０の車室内に取り付けられる。そしてカメラ２は、所定の撮影周期（例えば1/30秒～1/10秒）ごとに車両１０の前方領域を撮影し、その前方領域が写った画像を生成する。カメラ２により得られた画像は、カラー画像であることが好ましい。なお、車両１０には、撮影方向または焦点距離が異なる複数のカメラが設けられてもよい。

カメラ２は、画像を生成する度に、その生成した画像を、車内ネットワーク４を介してＥＣＵ３へ出力する。

ＥＣＵ３は、車両１０を制御する。本実施形態では、ＥＣＵ３は、カメラ２により得られた時系列の一連の画像から検出された物体に基づいて車両１０を自動運転するよう、車両１０を制御する。そのために、ＥＣＵ３は、通信インターフェース２１と、メモリ２２と、プロセッサ２３とを有する。

通信インターフェース２１は、通信部の一例であり、ＥＣＵ３を車内ネットワーク４に接続するためのインターフェース回路を有する。すなわち、通信インターフェース２１は、車内ネットワーク４を介して、カメラ２と接続される。そして通信インターフェース２１は、カメラ２から画像を受信する度に、受信した画像をプロセッサ２３へわたす。

メモリ２２は、記憶部の一例であり、例えば、揮発性の半導体メモリ及び不揮発性の半導体メモリを有する。なお、メモリ２２は、後述するようにプロセッサ２３が複数の演算ユニットを有する場合に、演算ユニットごとに専用のメモリ回路を有していてもよい。そしてメモリ２２は、ＥＣＵ３のプロセッサ２３により実行される物体状態識別処理において使用される各種のデータ及びパラメータ、例えば、カメラ２から受信した画像、物体状態識別処理で利用される各識別器を特定するための各種パラメータ、及び、物体の種類ごとの確信度閾値などを記憶する。さらに、メモリ２２は、検出された物体に関する情報を表す検出物体リストといった、物体状態識別処理の途中で生成される各種のデータを一定期間記憶する。さらにまた、メモリ２２は、地図情報といった車両１０の走行制御に利用される情報を記憶してもよい。

プロセッサ２３は、制御部の一例である。本実施形態では、プロセッサ２３は、第１演算回路２３１と、第２演算回路２３２と、第３演算回路２３３とを有する。第１演算回路２３１は、例えば、１個または複数個のCPU(Central Processing Unit)及びその周辺回路を有する。また、第２演算回路２３２は、１個または複数個のグラフィック処理ユニット(Graphics Processing Unit, GPU)を有する。さらに、第３演算回路２３３は、いわゆるニューラルネットワークアクセラレータといった、第２の識別器で実行される所定の演算（例えば、畳み込み演算）に特化した１個または複数個の数値演算回路を有する。第１演算回路２３１と、第２演算回路２３２と、第３演算回路２３３とは、例えば、互いに参照可能な共有メモリ（図示せず）などを介して協働して所定の演算処理を実行することが可能となっている。また、第１演算回路２３１、第２演算回路２３２及び第３演算回路２３３のうち、第１演算回路２３１の汎用性が最も高いものの、第１演算回路２３１の演算速度は、第２演算回路２３２及び第３演算回路２３３の演算速度よりも遅い。これに対して、第２演算回路２３２が実行可能な演算の種類は、第１演算回路２３１が実行可能な演算の種類よりも制限されるものの、第２演算回路２３２の演算速度は第１演算回路２３１の演算速度よりも速い。そして第３演算回路２３３が実行可能な演算の種類は、第２演算回路２３２が実行可能な演算の種類よりもさらに制限されるものの、第３演算回路２３３の演算速度は、第１演算回路２３１の演算速度及び第２演算回路２３２の演算速度よりもさらに速い。なお、変形例によれば、第３演算回路２３３も、第２演算回路２３２が有するGPUと同じGPUを有してもよい。

プロセッサ２３は、車両１０が走行している間、カメラ２から画像を受信する度に、受信した画像に対して物体状態識別処理を含む車両制御処理を実行する。そしてプロセッサ２３は、検出された車両１０の周囲の物体に基づいて、車両１０を自動運転するよう、車両１０を制御する。

図３は、物体状態識別処理を含む車両制御処理に関する、ＥＣＵ３のプロセッサ２３の機能ブロック図である。プロセッサ２３は、物体検出部３１と、追跡部３２と、予測部３３と、状態識別部３４と、運転計画部３５と、車両制御部３６とを有する。プロセッサ２３が有するこれらの各部は、例えば、プロセッサ２３上で動作するコンピュータプログラムにより実現される機能モジュールである。また、プロセッサ２３が有するこれらの各部のうち、物体検出部３１、追跡部３２、予測部３３及び状態識別部３４が、物体状態識別処理を実行する。なお、車両１０に複数のカメラが設けられる場合には、プロセッサ２３は、カメラごとに、そのカメラにより得られた画像に基づいて物体状態識別処理を実行してもよい。

物体検出部３１は、カメラ２から画像を受信する度に、受信した最新の画像を物体検出用の第１の識別器に入力することで、その画像に表されている検出対象物体を含む物体領域を検出するとともに、その検出対象物体の種類を特定する。なお、物体検出部３１による物体検出処理のうち、第１の識別器による演算処理は、例えば、第２演算回路２３２により実行され、それ以外の処理は、例えば、第１演算回路２３１により実行される。

本実施形態では、物体検出部３１は、第１の識別器として、画像に表された検出対象物体を含む物体領域を検出し、かつ、検出対象物体の種類を識別するように予め学習されたDNNを利用する。物体検出部３１が利用するDNNは、例えば、Single Shot MultiBox Detector（SSD）、または、Faster R-CNNといった、コンボリューショナルニューラルネットワーク（以下、単にCNNと呼ぶ）型のアーキテクチャを持つ、いわゆるディープニューラルネットワーク（以下、単にDNNと呼ぶ）とすることができる。

図４は、第１の識別器として利用されるDNNの構成の一例を示す図である。DNN４００は、画像が入力される入力側に設けられる主幹部４０１と、主幹部４０１よりも出力側に設けられる位置検出部４０２及び種類推定部４０３とを有する。位置検出部４０２は、主幹部４０１からの出力に基づいて、画像上に表された検出対象物体の外接矩形を物体領域として出力する。種類推定部４０３は、主幹部４０１からの出力に基づいて、位置検出部４０２で検出された物体領域に表された検出対象物体の種類ごとの確信度を算出する。なお、位置検出部４０２及び種類推定部４０３は一体的に形成されてもよい。

主幹部４０１は、例えば、入力側から出力側へ向けて直列に接続される複数の層を有するCNNとすることができる。その複数の層には２以上の畳み込み層が含まれる。さらに、主幹部４０１が有する複数の層には、１または複数の畳み込み層ごとに設けられるプーリング層が含まれてもよい。さらにまた、主幹部４０１が有する複数の層には、１以上の全結合層が含まれてもよい。例えば、主幹部４０１は、SSDのベースレイヤーと同様の構成とすることができる。あるいは、主幹部４０１は、VGG-19、AlexNetあるいはNetwork-In-Networkといった他のCNNアーキテクチャに従って構成されてもよい。

主幹部４０１は、画像が入力されると、その画像に対して各層での演算を実行することで、その画像から算出したfeature mapを出力する。なお、主幹部４０１は、解像度の異なる複数のfeature mapを出力してもよい。例えば、主幹部４０１は、入力された画像の解像度と同じ解像度を持つfeature mapと、入力された画像の解像度よりも低い解像度の１以上のfeature mapを出力してもよい。

位置検出部４０２及び種類推定部４０３には、それぞれ、主幹部４０１から出力されたfeature mapが入力される。そして位置検出部４０２及び種類推定部４０３は、それぞれ、例えば、入力側から出力側へ向けて直列に接続される複数の層を有するCNNとすることができる。位置検出部４０２及び種類推定部４０３のそれぞれについて、CNNが有する複数の層には２以上の畳み込み層が含まれる。また、位置検出部４０２及び種類推定部４０３のそれぞれについて、CNNが有する複数の層には、１または複数の畳み込み層ごとに設けられるプーリング層が含まれてもよい。なお、CNNが有する畳み込み層及びプーリング層は、位置検出部４０２及び種類推定部４０３について共通化されてもよい。さらに、位置検出部４０２及び種類推定部４０３のそれぞれについて、複数の層には、１以上の全結合層が含まれてもよい。この場合、全結合層は、各畳み込み層よりも出力側に設けられることが好ましい。また全結合層には、各畳み込み層からの出力が直接入力されてもよい。また、種類推定部４０３の出力層は、ソフトマックス関数に従って検出対象物体の種類のそれぞれの確信度を算出するソフトマックス層としてもよいし、シグモイド関数に従って検出対象物体の種類のそれぞれの確信度を算出するシグモイド層としてもよい。

位置検出部４０２及び種類推定部４０３は、例えば、画像上の様々な位置、様々なサイズ及び様々なアスペクト比の領域ごとに、検出対象物体の種類のそれぞれの確信度を出力するように学習される。したがって、識別器４００は、画像が入力されることで、画像上の様々な位置、様々なサイズ及び様々なアスペクト比の領域ごとに、検出対象物体の種類のそれぞれの確信度を出力する。そして位置検出部４０２及び種類推定部４０３は、何れかの種類の検出対象物体についての確信度が所定の確信度閾値以上となる領域を、その種類の検出対象物体が表された物体領域として検出する。

識別器４００の学習に利用される教師データに含まれる画像（教師画像）には、例えば、検出対象物体の種類（例えば、普通乗用車、バス、トラック、二輪車など）と、検出対象物体が表された物体領域である、その検出対象物体の外接矩形とがタグ付けされる。

識別器４００は、上記のような多数の教師画像を用いて、例えば、誤差逆伝搬法といった学習手法に従って学習される。プロセッサ２３は、このように学習された識別器４００を利用することで、画像から検出対象となる物体を精度良く検出できる。

なお、物体検出部３１は、車両１０の周囲の他の車両以外の、車両１０の走行制御に影響する物体を検出してもよい。そのような物体には、例えば、人、道路標識、信号機、車線区画線などの道路標示、及び、道路上のその他の物体などが含まれる。この場合、第１の識別器は、これらの物体も検出するように予め学習されればよい。そして物体検出部３１は、画像をその第１の識別器に入力することで、これらの物体も検出することができる。

物体検出部３１は、さらに、Non-maximum suppression(NMS)処理を実行することで、少なくとも部分的に重複する２以上の物体領域のうち、同一の物体が表されていると推定される物体領域から一つを選択してもよい。

物体検出部３１は、各物体領域の画像上での位置及び範囲と、その物体領域に含まれる物体の種類とを、検出物体リストに登録する。そして物体検出部３１は、検出物体リストをメモリ２２に記憶する。

追跡部３２は、最新の画像から検出された物体領域のそれぞれについて、その物体領域に表された検出対象物体を、検出物体リストを参照して過去の画像から検出された検出対象物体と対応付けることで、その物体領域に表された検出対象物体を追跡する。なお、追跡部３２による追跡処理は、例えば、第１演算回路２３１により実行される。

追跡部３２は、例えば、Lucas-Kanade法といった、オプティカルフローに基づく追跡処理を、最新の画像における、着目する物体領域及び過去の画像における物体領域に対して適用することで、その物体領域に表された検出対象物体を追跡する。そのため、追跡部３２は、例えば、着目する物体領域に対してSIFTあるいはHarrisオペレータといった特徴点抽出用のフィルタを適用することで、その物体領域から複数の特徴点を抽出する。そして追跡部３２は、複数の特徴点のそれぞれについて、過去の画像における物体領域における対応する点を、適用される追跡手法に従って特定することで、オプティカルフローを算出すればよい。あるいは、追跡部３２は、画像から検出された移動物体の追跡に適用される他の追跡手法を、最新の画像における、着目する物体領域及び過去の画像における物体領域に対して適用することで、その物体領域に表された検出対象物体を追跡してもよい。

追跡部３２は、最新の画像から検出された検出対象物体のうち、過去の画像に表された検出対象物体と対応付けられなかった検出対象物体に対して、新たな追跡対象として、他の追跡中の検出対象物体と異なる識別番号を割り当て、その割り当てた識別番号を検出物体リストに登録する。一方、追跡部３２は、最新の画像から検出された検出対象物体のうち、過去の画像に表された検出対象物体と対応付けられた検出対象物体、すなわち、追跡中の検出対象物体について、その追跡中の検出対象物体に割り当てられた識別番号と同じ識別番号を対応付ける。

なお、追跡部３２は、追跡中の検出対象物体が所定数よりも多く存在する場合、追跡中の検出対象物体の中から、所定数の検出対象物体を状態識別の対象となる物体として選択してもよい。例えば、車両１０に近い検出対象物体ほど、車両１０の運転制御に対する影響が大きいので、追跡部３２は、追跡中の検出対象物体のうち、車両１０に近い方から順に所定数の検出対象物体を選択してもよい。例えば、画像上で検出対象物体が表された物体領域が大きいほど、車両１０からその検出対象物体までの距離が近いと推定される。そこで、追跡部３２は、例えば、最新の画像上での物体領域のサイズが大きい方から順に所定数の検出対象物体を選択してもよい。あるいは、車両制御システム１がLiDARあるいはレーダといった測距センサ（図示せず）を有している場合、その測距センサにより、追跡中の各検出対象物体までの距離が測定されてもよい。この場合、例えば、画像上での検出対象物体が表された物体領域の重心に対応する、カメラ２からの方位に相当する測距センサからの方位における距離が、車両１０からその検出対象物体までの距離として測定される。そして追跡部３２は、推定または測定された車両１０からの距離が近い方から順に、所定数の検出対象物体を選択すればよい。あるいはまた、追跡部３２は、追跡中の検出対象物体のなかから、車線ごとに決められた数の検出対象物体を選択してもよい。

予測部３３は、カメラ２から得られた最新の画像（以下、現画像と呼ぶことがある）から物体検出部３１が検出対象物体を検出し、かつ、追跡部３２により追跡処理が行われると、追跡中の検出対象物体のそれぞれについて、次に得られる画像（以下、単に次画像と呼ぶことがある）上でのその検出対象物体の位置を予測可能か否か判定する。そして予測部３３は、次画像上での位置を予測可能な検出対象物体について、その予測位置を含む、予測物体領域を設定する。なお、予測部３３による予測処理は、例えば、第１演算回路２３１により実行される。

例えば、予測部３３は、物体領域の少なくとも一端が現画像の何れか一端と接している場合、その物体領域に含まれる検出対象物体について、次画像上での位置を予測不能と判定する。これは、その検出対象物体全体が現画像上に表されておらず、現画像の取得時と次画像の取得時との間の車両１０とその検出対象物体間の相対的な位置関係の変化を正確に予測できない可能性が有るためである。

図５は、次画像上での位置が予測可能な検出対象物体と次画像上での位置が予測不能な検出対象物体の一例を示す図である。図５に示される画像５００において、車両１０が走行する車線と同じ車線を走行する車両５０１を含む物体領域５１１は、画像５００の何れの端部とも接していない。そのため、車両５０１については、次画像上の位置は予測可能と判定される。一方、車両１０が走行する車線に隣接する車線を走行する車両５０２を含む物体領域５１２の右端は、画像５００の右端と接している。そのため、車両５０２については、次画像上の位置は予測不能と判定される。

あるいは、予測部３３は、現画像において、着目する検出対象物体が、車両１０が走行中の車線と隣接する車線を走行しており、かつ、その検出対象物体と車両１０間の距離が所定距離以下またはその検出対象物体を含む物体領域のサイズが所定サイズ以上である場合、その検出対象物体について、次画像上での位置を予測不能と判定する。これは、その検出対象物体が、車両１０が走行中の車線へ進入し、車両１０を追い越し、あるいは車両１０に追い越されるなどにより、現画像でのその検出対象物体の位置に対して次画像でのその検出対象物体の位置が大きく移動する可能性が有るためである。

例えば、物体検出部３１が現画像から車線区画線を検出している場合、あるいは、ローカライズ処理部（図示せず）が、現画像から車線区画線を検出している場合には、予測部３３は、車線区画線と物体領域との位置関係に基づいて、各検出対象物体が走行中の車線を特定すればよい。例えば、予測部３３は、着目する検出対象物体について、その検出対象物体を含む物体領域の下端の両側に位置する二つの車線区画線で挟まれた車線上にその検出対象物体が位置していると判定すればよい。これにより、予測部３３は、着目する検出対象物体が、車両１０が走行中の車線と隣接する車線を走行しているか否かを判定できる。

また、車両１０が走行中の道路と同じ道路を着目する検出対象物体が走行している場合、画像上でのその検出対象物体を含む物体領域の下端の位置は、その検出対象物体の路面上の位置を表していると推定される。また、画像上での各画素の位置は、カメラ２からその画素に相当する方位と１対１に対応している。したがって、予測部３３は、画像上での着目する検出対象物体を含む物体領域の下端の位置に基づいて、カメラ２からその検出対象物体の路面上の位置への方位を特定することができる。したがって、予測部３３は、メモリ２２に記憶されているカメラ２の取り付け位置（路面からの高さを含む）と、カメラ２からその検出対象物体の路面上の位置への位置までの特定された方位とに基づいて、車両１０からその検出対象物体までの距離を推定できる。

あるいは、予測部３３は、着目する検出対象物体について、その検出対象物体が表された物体領域のサイズ（例えば、横幅）と、その検出対象物体と同一種類の基準物体が車両１０から所定距離に位置していると仮定した場合の基準サイズとの比に基づいて、車両１０からその検出対象物体までの距離を推定してもよい。あるいはまた、車両制御システム１がLiDARあるいはレーダといった測距センサ（図示せず）を有している場合、その測距センサにより、着目する検出対象物体までの距離が測定されてもよい。この場合、例えば、画像上での着目する検出対象物体が表された物体領域の重心に対応する、カメラ２からの方位に相当する測距センサからの方位における距離が、車両１０からその検出対象物体までの距離として測定される。予測部３３は、上記のようにして推定された車両１０から着目する検出対象物体までの距離を上記の所定距離と比較して、その検出対象物体について、次画像上での位置を予測可能か否か判定すればよい。

あるいはまた、予測部３３は、着目する検出対象物体よりも先行する他の検出対象物体の挙動に基づいて、着目する検出対象物体について、次画像上での位置を予測可能か否か判定してもよい。例えば、予測部３３は、所定時間前の第１の時点において、着目する検出対象物体が走行する車線と同じ車線を走行していた、先行する他の検出対象物体が、その第１の時点以降に車線変更した場合、着目する検出対象物体について、次画像上での位置を予測不能と判定してもよい。これは、例えば、何らかの障害物、例えば、駐車車両などがその先行する他の検出対象物体よりも前に存在するために、後続する着目する検出対象物体も車線変更する可能性が有るためである。なお、予測部３３は、各検出対象物体について、画像ごとに、上記の方法と同様に走行する車線を特定することで、その検出対象物体が車線変更したか否かを判定できる。

予測部３３は、次画像上での位置を予測可能と判定した検出対象物体について、次画像上での予測位置を含む予測物体領域を求める。一般に、車両１０と、次画像上での位置を予測可能な、車両周囲の検出対象物体との相対的な位置関係は急激に変化しない。そこで、予測部３３は、現画像上での検出対象物体の位置と次画像上での検出対象物体の予測位置は同じと推定することができる。そこで、予測部３３は、現画像上での検出対象物体を含む物体領域と同一の次画像上の領域を、予測物体領域として設定する。

あるいは、予測部３３は、直近の所定期間に含まれる一連の画像のそれぞれにおける物体領域の重心位置の時系列順の並びを直線または多項式にて近似することで得られる、次画像上での物体領域の重心の予測位置を、検出対象物体の予測位置としてもよい。同様に、予測部３３は、直近の所定期間に含まれる一連の画像のそれぞれにおける物体領域のサイズ（幅及び高さを含む）の時系列順の並びを直線または多項式にて近似することで得られる、次画像上での物体領域の予測サイズを、予測物体領域のサイズとしてもよい。そして予測部３３は、次画像上での検出対象物体の予測位置を重心位置とし、かつ、予測されたサイズの領域を、予測物体領域として設定する。

予測部３３は、次画像上での位置を予測不能と判定した検出対象物体について、検出物体リストに含まれる、次画像上での位置が予測可能か否かを表すフラグの値を、次画像上での位置が予測不能であることを表す値に更新する。さらに、予測部３３は、次画像上での位置を予測不能と判定した検出対象物体について、次画像上での予測物体領域の位置及び範囲を示す情報（例えば、予測物体領域の左上端及び右下端の座標）を、検出物体リストに登録する。

なお、変形例によれば、予測部３３は、物体検出部３１による物体検出処理の後に、現画像に対して上記の処理を行う代わりに、物体検出部３１による物体検出処理の前、あるいは、物体検出処理と並列に上記の処理を実行してもよい。この場合には、予測部３３は、現画像における検出対象物体の位置またはその検出対象物体を含む物体領域の位置の代わりに、直前の画像におけるその検出対象物体の位置またはその検出対象物体を含む物体領域の位置に対して上記の実施形態と同様の処理を実行することで、現画像上での位置を予測可能か否か判定すればよい。また、この変形例によれば、予測部３３は、直前の画像と現画像との比較に基づいて、検出対象物体の現画像上での位置を予測可能か否か判定してもよい。例えば、予測部３３は、直前の画像における各画素の輝度値の統計的代表値（例えば、平均値、中央値または最頻値）と、現画像における各画素の輝度値の統計的代表値の差の絶対値が所定の輝度閾値以上である場合、検出対象物体の現画像上での位置を予測不能と判定してもよい。これにより、例えば、車両１０がトンネル内に進入する前後、あるいはトンネルから出る前後といった、車両１０の周囲の明るさが急激に変化する場合において、予測部３３は、検出対象物体の現画像上での位置を予測不能と判定することができる。その結果として、物体検出部３１が現画像から実際に検出した物体領域の情報が、検出対象物体の状態の識別に利用されることとなる。なお、車両１０の周囲の明るさが急激に変化する場合には、変化前、すなわち直前の画像における検出対象物体の位置から予測した、変化後、すなわち現画像における検出対象物体の位置の方が、物体検出部３１が現画像から実際に検出した検出対象物体の位置よりも正確なことがある。そこで、上記の例とは逆に、予測部３３は、直前の画像における各画素の輝度値の統計的代表値と、現画像における各画素の輝度値の統計的代表値の差の絶対値が所定の閾値以上である場合、直前の画像におけるその検出対象物体の位置及びその検出対象物体を含む物体領域の位置によらずに、検出対象物体の現画像上での位置を予測可能と判定してもよい。

また、予測部３３は、直前の画像に基づいて、次画像上での位置が予測不能と判定された検出対象物体について、物体検出部３１による物体検出処理の前、あるいは、物体検出処理と並列に、予測物体領域を設定してもよい。なお、直前の画像を基準としたときの次画像は、現画像となるので、予測部３３は、現画像に対して予測物体領域を設定すればよい。この場合、予測部３３は、上記の予測物体領域の設定処理と同様の処理を、直前の画像またはそれ以前の画像における物体領域に対して実行することで、現画像上に予測物体領域を設定すればよい。

あるいは、予測部３３は、Kanade-Lucas-Tomasi法といった、オプティカルフローに基づく追跡処理を、直前の画像上の物体領域と現画像に対して適用することで、現画像上に予測物体領域を設定してもよい。この場合、予測部３３は、例えば、直前の画像上の物体領域に対してSIFTあるいはHarrisオペレータといった特徴点抽出用のフィルタを適用することで、その物体領域から複数の特徴点を抽出する。予測部３３は、複数の特徴点のそれぞれについて、現画像における対応する点を、適用される追跡手法に従って特定することで、オプティカルフローを算出すればよい。そして予測部３３は、求めたオプティカルフロー及び直前の画像上の物体領域に基づいて、現画像上でその物体領域に対応する領域を推定し、推定した領域を予測物体領域として設定すればよい。

状態識別部３４は、カメラ２から画像が得られる度に、すなわち、カメラ２により得られる時系列の一連の画像のそれぞれについて、追跡中の検出対象物体の状態を識別する。

本実施形態では、状態識別部３４は、検出物体リストを参照して、追跡中の検出対象物体のうち、直前に得られた画像において予測部３３により予測物体領域が設定されている検出対象物体を特定する。そして状態識別部３４は、予測物体領域が設定されている検出対象物体については、物体検出部３１による物体検出処理の結果を待たず、すなわち、第１の識別器による現画像上での物体領域の検出よりも前に、現画像上の予測物体領域内の画素値から求められる特徴を第２の識別器に入力することで、時系列の外観変化を伴う、その検出対象物体の状態を識別する。一方、予測物体領域が設定されていない検出対象物体については、状態識別部３４は、物体検出部３１により検出された物体検出領域内の画素値から求められる特徴を、第２の識別器に入力することで、時系列の外観変化を伴う、その検出対象物体の状態を識別する。なお、状態識別部３４による状態識別処理のうち、第２の識別器による演算処理は、例えば、第３演算回路２３３により実行され、その他の処理は、例えば、第１演算回路２３１または第２演算回路２３２により実行される。

状態識別部３４は、予測物体領域または物体領域内の画素値から求められる特徴を、例えば、その予測物体領域または物体領域内の各画素の値そのものとする。あるいは、状態識別部３４は、予測物体領域または物体領域内の画素値から求められる特徴を、その予測物体領域または物体領域内の各画素に対して、畳み込み演算といった所定のフィルタ処理を行って得られた値としてもよい。

状態識別部３４は、各予測物体領域または各物体領域について、抽出した特徴をダウンサンプリング、アップサンプリング、bi-linear補間またはbi-cubic補間などのサイズ変換処理を実行することで所定のサイズ（例えば、32×32）にリサイズする。これにより、検出対象物体の追跡の途中で車両１０と検出対象物体間の相対距離が変化して、画像上での検出対象物体のサイズが変化しても、第２の識別器は、入力される特徴を一定のサイズとして扱えるので、第２の識別器の構成が簡単化される。

状態識別部３４は、第２の識別器として、例えば、Recurrent Neural Network(RNN)、Long Short Term Memory(LSTM)またはGated Recurrent Unit(GRU)といった、再帰的な構造を持つニューラルネットワークを用いることができる。第２の識別器は、物体領域または予測物体領域に含まれる特徴を処理すればよいため、第１の識別器と比較して、入力層及び中間層のサイズが小さくて済み、かつ、重み係数といった第２の識別器を規定するためのパラメータ数が少なくて済む。そのため、第２の識別器は、第１の識別器と比較して演算量が少なく、プロセッサ２３に対する演算負荷を小さくすることができる。さらに、第２の識別器の学習に要する演算量も削減される。なお、第１の識別器及び第２の識別器がそれぞれニューラルネットワークとして構成されている場合、共通の教師データを用いて、誤差逆伝搬法によりそれらニューラルネットワークが一体的に学習されてもよい。

第２の識別器は、再帰構造を有しているため、時系列に順次特徴が入力される度に、内部で再帰的に利用される内部状態（中間状態または隠れ状態とも呼ばれる）を更新する。これにより、第２の識別器は、着目する追跡中の検出対象物体の外観の時系列の変化に基づいて、その検出対象物体の状態を識別することができる。この内部状態は、メモリ２２に記憶される。そして第２の識別器は、着目する追跡中の検出対象物体についての特徴が入力される度に、メモリ２２から、その検出対象物体に関する最新の内部状態を読み込んで第２の識別器の演算に適用する。

本実施形態では、状態識別部３４は、上記のように、検出対象物体（すなわち、車両１０の周囲の他の車両）の状態として、左右何れかのターンシグナルまたはハザードランプの点滅状態か否か、ブレーキランプが点灯している状態あるいは消灯している状態かを識別する。そのために、第２の識別器の出力層の活性化関数として、例えば、シグモイド関数が用いられる。これにより、第２の識別器は、各状態の確信度を出力することができる。そして状態識別部３４は、各状態の確信度を対応する閾値と比較し、検出対象物体の状態は、確信度が対応する閾値以上となる状態であると判定する。例えば、検出対象物体の左のターンシグナルが点滅している状態についての確信度が0.8であり、一方、左のターンシグナルが点滅していない状態についての確信度が0.2であるとする。そして閾値が0.5であるとすると、状態識別部３４は、検出対象物体の状態は、左のターンシグナルが点滅している状態であると判定する。

あるいは、第２の識別器の出力層の活性化関数として、ソフトマックス関数が用いられてもよい。この場合には、第２の識別器は、検出対象物体の状態として、左のターンシグナルが点滅、右のターンシグナルが点滅、ハザードランプが点滅、ブレーキランプが点灯、あるいはその何れでもないとの判定結果を出力する。したがって、状態識別部３４は、第２の識別器から出力された判定結果で表される状態を、検出対象物体の状態とすればよい。

変形例によれば、状態識別部３４は、第２の識別器として、時間軸方向の畳み込み演算を実行する、CNN型のアーキテクチャを有するニューラルネットワークを用いてもよい。この場合、第２の識別器は、例えば、直前の層から出力されたfeature mapに対して、時間軸方向に沿って畳み込み演算を実行する畳み込み層（以下、時間特徴畳み込み層と呼ぶ）を一つ以上有する。個々の時間特徴畳み込み層の時間軸方向のカーネルサイズは、例えば、全ての時間特徴畳み込み層を経由することで、一度に入力される複数の特徴が含まれる期間全体にわたって畳み込み演算が行われるように設定される。時間特徴畳み込み層は、例えば、時間軸方向及び空間方向の何れについても畳み込み演算（以下、３次元畳み込み演算と呼ぶ）を実行してもよく、あるいは、時間軸方向についてのみの畳み込み演算（以下、時間次元畳み込み演算と呼ぶ）を実行してもよい。さらに、時間特徴畳み込み層は、チャネル方向に関しても畳み込み演算または全結合演算を実行してもよい。また、第２の識別器が複数の時間特徴畳み込み層を有する場合には、その複数の時間特徴畳み込み層の何れかの層が３次元畳み込み演算を実行し、その複数の時間特徴畳み込み層の他の層が時間次元畳み込み演算を実行してもよい。さらに、第２の識別器は、時間軸方向には畳み込み演算を実行せず、空間方向について畳み込み演算を実行する畳み込み層（以下、空間特徴畳み込み層と呼ぶ）を一つ以上有してもよい。この空間特徴畳み込み層も、チャネル方向に関して畳み込み演算または全結合演算を実行してもよい。第２の識別器が１以上の空間特徴畳み込み層を有する場合、空間特徴畳み込み層と時間特徴畳み込み層の順序はどのような順序でもよい。例えば、入力側から出力側へ順に、空間特徴畳み込み層、時間特徴畳み込み層の順に各畳み込み層が設けられてもよく、あるいはその逆の順序であってもよい。さらに、空間特徴畳み込み層と時間特徴畳み込み層とが交互に設けられてもよい。さらに、第２の識別器は、１以上のプーリング層を有してもよい。さらにまた、第２の識別器は、１以上の活性化層及び１以上の全結合層を有してもよい。第２の識別器の出力層は、例えば、活性化関数としてシグモイド関数またはソフトマックス関数を使用する。

状態識別部３４は、状態識別の対象となる検出対象物体のそれぞれについて、第２の識別器による状態識別結果及び更新された内部状態をメモリ２２に書き込んで、メモリ２２に記憶されている、状態識別結果及び内部状態を更新するとともに、状態識別結果を運転計画部３５へ通知する。

図６は、状態識別処理に関連する各部の処理のタイミングチャートである。プロセッサ２３の各部の処理は、例えば、プロセッサ２３の第１演算回路２３１上で動作するスケジューラ（図示せず）により管理され、図６に示されるタイミングチャートに従って実行される。図６において、横軸は時間を表す。また、図６において、個々のブロックは、そのブロック内に示された処理が実行されることを表し、個々の矢印は、各処理間でのデータ（画像、特徴等）の受け渡しを表す。例えば、時刻t1にてＥＣＵ３がカメラ２から現画像を受け取ると、プロセッサ２３が有する第２演算回路２３２にて、その現画像に対する、物体検出部３１の第１の識別器による検出対象物体の物体検出処理が実行される。なお、物体検出処理が行われる前に、現画像に対してコントラスト補正または色変換といった前処理が行われてもよい。

物体検出処理が行われると、プロセッサ２３が有する第１演算回路２３１にて、検出された物体の種類及び物体領域の検出物体リストへの登録などの物体検出の後処理が行われ、その後に、追跡部３２による追跡処理が実行される。そして、追跡処理の後に、追跡中の各検出対象物体について、次画像における位置の予測が可能か否かの判定、及び、次画像上での予測物体領域の設定を含む予測処理が実行される。なお、上記のように、予測処理は、第１の識別器による物体検出処理の前、あるいは、その物体検出処理の実行中に予測処理が実行されてもよい。この場合には、予測部３３は、時刻t1にて取得された画像の直前に取得された画像に対する物体検出処理の結果に基づいて予測処理を実行することで、時刻t1にて取得された画像に対して予測物体領域を設定すればよい。

また、追跡処理の後に、第２演算回路２３２にて、直前の画像に基づいて現画像上に予測物体領域が設定されなかった検出対象物体について、現画像から検出された物体領域からの特徴の抽出、抽出した特徴のリサイズが行われる。そして第３演算回路２３３にて、第２の識別器を用いた状態識別処理が実行される。なお、プロセッサ２３のスループットを向上するために、第３演算回路２３３による、各検出対象物体に対する状態識別処理はバッチ処理としてまとめて実行されることが好ましい。

一方、直前の画像に基づいて現画像上に予測物体領域が設定された検出対象物体について、第２演算回路２３２による現画像に対する物体検出処理と並列に、第１演算回路２３１による、現画像上の予測物体領域からの特徴の抽出及び抽出した特徴のリサイズが行われ、第３演算回路２３３にて、第２の識別器を用いた状態識別処理が実行される。得られた検出対象物体の状態識別の結果は、運転計画部３５及び車両制御部３６の処理に利用される。なお、プロセッサ２３のスループットを向上するために、第３演算回路２３３による、各検出対象物体に対する状態識別処理はバッチ処理としてまとめて実行されることが好ましい。

このように、同じ画像に表された複数の検出対象物体のうちの何れかについては、第３演算回路２３３による状態識別処理と第２演算回路２３２による物体検出処理とが並列に実行される。また、その複数の検出対象物体のうちのそれ以外のものについては、第２演算回路２３２による物体検出処理が終了した後に、第３演算回路２３３による状態識別処理が実行される。特に、次画像上での位置の予測が不能と判定される条件を満たすような、車両１０と検出対象物体の相対的な位置関係は限られる。そのため、次画像上での位置の予測が不能と判定される、すなわち、物体検出処理の終了後に状態識別処理が実行される検出対象物体の数は、物体検出処理の実行中に状態識別処理が実行される検出対象物体の数よりも少なくなることが想定される。そのため、車両制御処理全体のスループットが向上する。

図７は、検出物体リストの一例を示す図である。検出物体リスト７００には、追跡中の検出対象物体のそれぞれについて、その物体が状態識別対象か否かを表すインデックス、その物体に割り当てられた識別番号、その物体に関する情報が記憶されているメモリ２２のアドレスを表すポインタ及び状態識別部３４により状態識別された回数（すなわち、第２の識別器に、対応する物体領域から求められた特徴が入力された回数）が格納される。さらに、検出物体リスト７００には、追跡中の検出対象物体のそれぞれについて、物体領域の位置及び範囲を表す情報（図示せず）及び検出対象物体の種類を表す情報（図示せず）などが格納される。さらにまた、検出物体リスト７００には、追跡中の検出対象物体のそれぞれについて、次画像上の位置について予測可能か否かを表すフラグ（図示せず）、及び、次画像上での予測物体領域の位置及び範囲を表す情報（図示せず）が格納される。また、各検出対象物体についてのポインタで示されるメモリ２２上の格納領域７０１には、最新の画像における、第２の識別器に入力される特徴、最後に更新された第２の識別器の内部状態、及び、最後に更新された第２の識別器からの出力結果などが記憶される。

運転計画部３５は、検出物体リストを参照して、車両１０の周囲に存在する物体と車両１０とが衝突しないように車両１０の走行予定経路（トラジェクトリ）を１以上生成する。走行予定経路は、例えば、現時刻から所定時間先までの各時刻における、車両１０の目標位置の集合として表される。例えば、運転計画部３５は、検出物体リストを参照して、カメラ２についての車両１０への取り付け位置などの情報を用いて視点変換処理を実行することで、検出物体リストにおける物体の画像内座標を鳥瞰画像上の座標（鳥瞰座標）に変換する。そして運転計画部３５は、一連の鳥瞰座標に対してKalman FilterまたはParticle filterなどを用いたトラッキング処理を実行することで、検出物体リストに登録されている物体を追跡し、その追跡結果により得られた軌跡から、物体のそれぞれの所定時間先までの予測軌跡を推定する。その際、運転計画部３５は、検出対象物体の状態識別結果を予測軌跡の推定に利用する。例えば、着目する検出対象物体の状態が、左のターンシグナルが点滅している状態である場合、その検出対象物体は左側へ車線変更し、あるいは、左折する可能性が高い。そこで、運転計画部３５は、その検出対象物体について、左側へ車線変更し、あるいは、左折する予測軌跡を推定する。また、着目する検出対象物体の状態が、ブレーキランプが点灯している状態である場合、あるいは、ハザードランプが点滅している状態である場合、その検出対象物体は減速する可能性が高い。そこで、運転計画部３５は、その検出対象物体について、現時点よりも減速するような予測軌跡を推定する。さらに、着目する検出対象物体の状態が、左右のターンシグナル及びハザードランプの何れも点滅しておらず、かつ、ブレーキランプが消灯している状態である場合、その検出対象物体は減速せずに直進する可能性が高い。そこで、運転計画部３５は、その検出対象物体について、減速せずに直進するような予測軌跡を推定する。

運転計画部３５は、追跡中の各物体の予測軌跡と、車両１０の位置、速度及び姿勢に基づいて、何れの物体についても所定時間先までの追跡中の物体のそれぞれと車両１０間の距離の予測値が所定距離以上となるように、車両１０の走行予定経路を生成する。なお、運転計画部３５は、車両１０の位置、速度及び姿勢を、例えば、車両１０に搭載されたＧＰＳ受信機（図示せず）から得た車両１０の現在位置を表す現在位置情報に基づいて推定できる。あるいは、ローカライズ処理部（図示せず）が、カメラ２により画像が得られる度に、その画像から車両１０の左右の車線区画線を検出し、検出された車線区画線とメモリ２２に記憶されている地図情報とをマッチングすることで、車両１０の位置、速度及び姿勢が推定されてもよい。さらに、運転計画部３５は、例えば、車両１０の現在位置情報と、メモリ２２に記憶されている地図情報とを参照して、車両１０が走行可能な車線の数を確認してもよい。そして運転計画部３５は、車両１０が走行可能な車線が複数存在する場合には、車両１０が走行する車線を変更するように走行予定経路を生成してもよい。
なお、運転計画部３５は、複数の走行予定経路を生成してもよい。この場合、運転計画部３５は、複数の走行予定経路のうち、車両１０の加速度の絶対値の総和が最小となる経路を選択してもよい。

運転計画部３５は、生成した走行予定経路を車両制御部３６へ通知する。

車両制御部３６は、車両１０が通知された走行予定経路に沿って走行するように車両１０の各部を制御する。例えば、車両制御部３６は、通知された走行予定経路、及び、車速センサ（図示せず）により測定された車両１０の現在の車速に従って、車両１０の加速度を求め、その加速度となるようにアクセル開度またはブレーキ量を設定する。そして車両制御部３６は、設定されたアクセル開度に従って燃料噴射量を求め、その燃料噴射量に応じた制御信号を車両１０のエンジンの燃料噴射装置へ出力する。あるいは、車両制御部３６は、設定されたブレーキ量に応じた制御信号を車両１０のブレーキへ出力する。

さらに、車両制御部３６は、車両１０が走行予定経路に沿って走行するために車両１０の進路を変更する場合には、その走行予定経路に従って車両１０の操舵角を求め、その操舵角に応じた制御信号を、車両１０の操舵輪を制御するアクチュエータ（図示せず）へ出力する。

図８は、プロセッサ２３により実行される、物体状態識別処理を含む車両制御処理の動作フローチャートである。プロセッサ２３は、カメラ２から画像を受信する度に、図８に示される動作フローチャートに従って車両制御処理を実行する。なお、以下に示される動作フローチャートにおいて、ステップＳ１０１～Ｓ１０８の処理が物体状態識別処理に対応する。

プロセッサ２３の物体検出部３１は、カメラ２から得られた最新の画像（すなわち、現画像）を第１の識別器に入力して、現画像に表された１以上の検出対象物体を検出する。すなわち、物体検出部３１は、現画像上で検出対象物体を含む１以上の物体領域を検出する（ステップＳ１０１）。さらに、物体検出部３１は、検出された検出対象物体ごとに、その検出対象物体の種類を識別する。そして物体検出部３１は、検出された検出対象物体を検出物体リストに登録する。

プロセッサ２３の追跡部３２は、現画像における、検出対象物体を含む物体領域のそれぞれについて、その物体領域と、過去の画像における物体領域とに基づいて、現画像における、その物体領域に表されている検出対象物体を追跡する（ステップＳ１０２）。

また、プロセッサ２３の状態識別部３４は、ステップＳ１０１の処理の実行と平行して、追跡中の検出対象物体のうち、現画像上の位置が予測可能と判定されている検出対象物体について、現画像上の予測物体領域内の画素値から求められる特徴を抽出する（ステップＳ１０３）。そして状態識別部３４は、抽出した特徴を、再帰構造を持つ第２の識別器に入力することで、その検出対象物体の状態を識別する（ステップＳ１０４）。

一方、状態識別部３４は、追跡中の検出対象物体のうち、現画像上の位置が予測不能と判定されている検出対象物体について、ステップＳ１０１の処理によって検出された物体領域内の画素値から求められる特徴を抽出する（ステップＳ１０５）。そして状態識別部３４は、抽出した特徴を、再帰構造を持つ第２の識別器に入力することで、その検出対象物体の状態を識別する（ステップＳ１０６）。

また、プロセッサ２３の予測部３３は、追跡中の各検出対象物体について、次画像上での位置を予測可能か否か判定する（ステップＳ１０７）。そして予測部３３は、次画像上での位置を予測可能な検出対象物体について、次画像上の予測物体領域を設定する（ステップＳ１０８）。

プロセッサ２３の運転計画部３５は、検出物体リストを参照して、検出物体リストに登録されている各検出対象物体について、状態識別結果を参照して推定されるその物体の予測軌跡と所定の距離以上となるように、車両１０の走行予定経路を生成する（ステップＳ１０９）。そしてプロセッサ２３の車両制御部３６は、走行予定経路に沿って車両１０が走行するように車両１０を制御する（ステップＳ１１０）。そしてプロセッサ２３は、車両制御処理を終了する。

以上に説明してきたように、この物体状態識別装置は、車両に搭載されたカメラにより画像が得られる度に、その画像を、検出対象物体を検出するように予め学習された第１の識別器に入力することで、その画像上で検出対象物体を含む物体領域を検出する。また、この物体状態識別装置は、検出された検出対象物体を追跡することで、各画像において同じ検出対象物体が表された物体領域同士を対応付ける。一方、この物体状態識別装置は、直前の画像における、追跡中の検出対象物体を含む物体領域の位置などに基づいて、次に得られる画像におけるその検出対象物体の位置を予測可能か否か判定し、その位置を予測可能な場合には、その検出対象物体の予測位置を含む予測物体領域を設定する。そしてこの物体状態識別装置は、次に画像が得られたときに、検出対象物体の位置が予測可能と判定されている場合には、予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで検出対象物体の状態を識別する。一方、次に画像が得られたときに、検出対象物体の位置が予測不能と判定されている場合には、この状態識別装置は、その画像に対して第１の識別器により検出された物体領域内の画素値から求められる特徴を第２の識別器に入力することで検出対象物体の状態を識別する。これにより、同時に追跡中の複数の検出対象物体が存在しても、この物体状態識別装置は、第２の識別器による処理が実行されるタイミングを、検出対象物体ごとに異ならせることができる。そのため、この物体状態識別装置は、処理負荷を時間的に分散させることができ、その結果として、物体状態識別処理全体のスループットを向上させることができる。特に、この物体状態識別装置は、検出対象物体の位置が予測可能と判定されている検出対象物体に対する、第２の識別器による状態識別処理を、第１の識別器による物体検出処理と平行して実行することで、物体状態識別処理全体のスループットをさらに向上させることができる。さらに、この物体状態識別装置は、個々の画像から物体を検出する第１の識別器を利用して、時系列の一連の画像のそれぞれから、第２の識別器に入力する特徴を抽出するので、画像全体を、再帰構造を持つ識別器に入力して物体の状態を識別するよりも、全体として演算量を削減することができる。また、第１の識別器の学習に用いられる画像は静止画像であればよく、一方、第２の識別器の学習には、動画像が必要となるものの、その動画像に含まれる個々の画像のサイズは、第１の識別器の学習に利用される画像のサイズよりも小さくてよい。そのため、この物体状態識別装置は、各識別器の学習に必要なコスト（例えば、教師画像のアノテーションに要するコスト、教師画像の収集に要するコストなど）を削減するとともに、各識別器の学習に要する演算量及び演算時間を削減することができる。

変形例によれば、時系列の外観変化を伴う状態の識別の対象となる検出対象物体は車両に限られず、例えば、車両１０の周囲に位置する人（または子供）であってもよい。この場合、状態識別部３４は、追跡中の人を含む時系列の一連の画像のそれぞれから検出され、または設定される物体領域または予測物体領域からの特徴を第２の識別器に時系列順に入力することで、その人の状態（例えば、その人が歩行している歩行状態か、その人が走っている走行状態か、あるいは、その人が走り出そうとしている走行開始状態か）を識別してもよい。この場合、予測部３３は、第１の識別器により、人であると推定された検出対象物体については、次画像における位置を予測不能と判定し、予測物体領域を設定しないようにしてもよい。これにより、物体状態識別装置は、検出対象物体である人が道路に急に飛び出してくることで、車両１０との相対的な位置関係が急激に変化する場合でも、検出対象物体である人が表された領域の特徴をその人の状態識別に利用することができるので、その人の状態を精度良く識別することができる。

他の変形例によれば、物体検出部３１は、DNN以外の識別器を利用して、画像から検出対象物体を検出してもよい。例えば、物体検出部３１は、第1の識別器として、画像上に設定されるウィンドウから算出される特徴量（例えば、HOG）を入力として、そのウィンドウに検出対象となる物体が表される確信度を出力するように予め学習されたサポートベクトルマシン（SVM）を用いてもよい。物体検出部３１は、画像上に設定するウィンドウの位置、サイズ及びアスペクト比を様々に変更しながら、そのウィンドウから特徴量を算出し、算出した特徴量をSVMへ入力することで、そのウィンドウについて確信度を求める。そして物体検出部３１は、何れかの種類の検出対象物体について確信度が所定の確信度閾値以上となるウィンドウに、その検出対象物体が表されていると判定し、かつ、そのウィンドウを物体領域とすればよい。なお、SVMは、検出対象となる物体の種類ごとに用意されてもよい。この場合には、物体検出部３１は、各ウィンドウについて、そのウィンドウから算出された特徴量をそれぞれのSVMへ入力することで、物体の種類ごとに確信度を算出すればよい。

また、上記の実施形態または変形例による、物体状態識別装置のプロセッサ２３の各部の機能を実現するコンピュータプログラムは、半導体メモリ、磁気記録媒体または光記録媒体といった、コンピュータ読取可能な可搬性の記録媒体に記録された形で提供されてもよい。

以上のように、当業者は、本発明の範囲内で、実施される形態に合わせて様々な変更を行うことができる。

１車両制御システム
２カメラ
３電子制御装置（物体状態識別装置）
４車内ネットワーク
２１通信インターフェース
２２メモリ
２３プロセッサ
３１物体検出部
３２追跡部
３３予測部
３４状態識別部
３５運転計画部
３６車両制御部

Claims

撮像部から画像を取得する度に、前記画像を第１の識別器に入力することで、前記画像に表された少なくとも一つの所定の物体のそれぞれについて、前記画像上で当該物体を含む物体領域を検出する物体検出部と、
前記少なくとも一つの所定の物体のそれぞれについて、前記画像の次に前記撮像部から得られる次画像における当該物体の位置を予測可能か否か判定し、当該物体の位置を予測可能な場合、前記次画像上の予測される当該物体の位置を含む予測物体領域を設定する予測部と、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されている物体について、前記次画像から前記物体領域が検出されるよりも前に、前記次画像上の前記予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴う当該物体の状態を識別し、一方、前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されていない物体について、前記次画像から検出された前記物体領域内の画素値から求められる特徴を前記第２の識別器に入力することで時系列の外観変化を伴う当該物体の状態を識別する状態識別部と、
を有する物体状態識別装置。
前記第１の識別器よる前記物体領域の検出と、前記第２の識別器による前記少なくとも一つの所定の物体のそれぞれの状態の識別とは、互いに異なる演算回路により実行される、請求項１に記載の物体状態識別装置。
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されている物体についての前記第２の識別器による状態の識別は、前記第１の識別器による前記次画像からの前記物体領域の検出と並列に実行される、請求項２に記載の物体状態識別装置。
前記予測部は、前記少なくとも一つの所定の物体のうち、前記画像上の前記物体領域の少なくとも一端が前記画像の何れか一端と接している物体について、前記次画像における当該物体の位置を予測不能と判定し、当該物体について前記次画像における前記予測物体領域を設定しない、請求項１～３の何れか一項に記載の物体状態識別装置。
前記撮像部は、車両に搭載され、
前記予測部は、前記少なくとも一つの所定の物体のそれぞれについて、前記車両が走行中の車線と隣接する車線を走行しているか否か判定し、かつ、前記車両からの距離を求め、前記少なくとも一つの所定の物体のうち、前記隣接する車線を走行しており、かつ、前記車両からの距離が所定距離以下となる物体について、前記次画像における当該物体の位置を予測不能と判定し、当該物体について前記次画像における前記予測物体領域を設定しない、請求項１～３の何れか一項に記載の物体状態識別装置。
車両の走行を制御する制御装置であって、
前記車両に搭載された撮像部から画像を取得する度に、前記画像を第１の識別器に入力することで、前記画像に表された前記車両周囲の少なくとも一つの所定の物体のそれぞれについて、前記画像上で当該物体を含む物体領域を検出する物体検出部と、
前記少なくとも一つの所定の物体のそれぞれについて、前記画像の次に前記撮像部から得られる次画像における当該物体の位置を予測可能か否か判定し、当該物体の位置を予測可能な場合、前記次画像上の予測される当該物体の位置を含む予測物体領域を設定する予測部と、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されている物体について、前記次画像から前記物体領域が検出されるよりも前に、前記次画像上の前記予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで、時系列の外観変化を伴う当該物体の状態を識別し、一方、前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されていない物体について、前記次画像から検出された前記物体領域内の画素値から求められる特徴を前記第２の識別器に入力することで、時系列の外観変化を伴う当該物体の状態を識別する状態識別部と、
前記少なくとも一つの所定の物体のそれぞれについて、当該物体の状態に基づいて、当該物体が移動する軌跡を予測し、予測した前記軌跡に基づいて、前記車両が前記少なくとも一つの所定の物体の何れとも所定距離以上離れるように前記車両の走行予定経路を設定する運転計画部と、
前記走行予定経路に沿って前記車両が走行するように前記車両を制御する車両制御部と、
を有する制御装置。
撮像部から画像を取得する度に、前記画像を第１の識別器に入力することで、前記画像に表された少なくとも一つの所定の物体のそれぞれについて、前記画像上で当該物体を含む物体領域を検出し、
前記少なくとも一つの所定の物体のそれぞれについて、前記画像の次に前記撮像部から得られる次画像における当該物体の位置を予測可能か否か判定し、当該物体の位置を予測可能な場合、前記次画像上の予測される当該物体の位置を含む予測物体領域を設定し、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されている物体について、前記次画像から前記物体領域が検出されるよりも前に、前記次画像上の前記予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで時系列の外観変化を伴う当該物体の状態を識別し、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されていない物体について、前記次画像から検出された前記物体領域内の画素値から求められる特徴を前記第２の識別器に入力することで時系列の外観変化を伴う当該物体の状態を識別する、
ことを含む物体状態識別方法。
撮像部から画像を取得する度に、前記画像を第１の識別器に入力することで、前記画像に表された少なくとも一つの所定の物体のそれぞれについて、当該物体を含む物体領域を検出し、
前記少なくとも一つの所定の物体のそれぞれについて、前記画像の次に前記撮像部から得られる次画像における当該物体の位置を予測可能か否か判定し、当該物体の位置を予測可能な場合、前記次画像上の予測される当該物体の位置を含む予測物体領域を設定し、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されている物体について、前記次画像から前記物体領域が検出されるよりも前に、前記次画像上の前記予測物体領域内の画素値から求められる特徴を、再帰構造を有し、または時間軸方向における畳み込み演算を実行する第２の識別器に入力することで時系列の外観変化を伴う当該物体の状態を識別し、
前記少なくとも一つの所定の物体のうち、前記次画像について前記予測物体領域が設定されていない物体について、前記次画像から検出された前記物体領域内の画素値から求められる特徴を前記第２の識別器に入力することで時系列の外観変化を伴う当該物体の状態を識別する、
ことをコンピュータに実行させる物体状態識別用コンピュータプログラム。