WO2020261549A1

WO2020261549A1 - 機械学習装置、機械学習プログラム、及び機械学習方法

Info

Publication number: WO2020261549A1
Application number: PCT/JP2019/025880
Authority: WO
Inventors: 一紀中田
Original assignee: Tdk株式会社
Priority date: 2019-06-28
Filing date: 2019-06-28
Publication date: 2020-12-30
Also published as: US20220114418A1

Abstract

重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習を行う機械学習装置は、入力層が１次元以上の入力データを予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行い、重み更新処理は、拡張カルマンフィルタ法に基づいて導出された式と、１次元以上の第１中間データと、１次元以上の出力データとによって、第１中間ノードと第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、第２中間ノードと出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である、機械学習装置。

Description

機械学習装置、機械学習プログラム、及び機械学習方法

　本発明は、機械学習装置、機械学習プログラム、及び機械学習方法に関する。

　時系列データの機械学習を行う方法として、再帰型ニューラルネットワーク（リカレントニューラルネットワーク）を用いた方法が知られている（非特許文献１－３参照）。

　しかしながら、これらの方法では、多次元の互いに相関を持つ時系列データの機械学習を行うことができない。そこで、当該時系列データの機械学習を行う方法として、再帰型ニューラルネットワークの１つであるリザボアコンピューティングとフィードフォワードニューラルネットワークとを組み合わせたニューラルネットワークを用いた方法が提案されている（非特許文献４参照）。

"Reservoir computing approaches for representation and classification of multivariate time series", Filippo Maria Bianchia, Simone Scardapaneb, Sigurd L ksea, and Rovert Jenssen, arXiv:1803.07870v2 [cs.NE] 6 Nov 2018. "Merging Echo State and Feedforward Neural Networks for Time Series Forecasting", Stefan Babinec, and Jiri Pospichal, International Conference on Artificial Neural Networks ICANN 2006: Artificial Neural Networks - ICANN 2006 pp 367-375. "Real-Time Computing Without Stable States: A New Framework for Neural Computation Based on Perturbations", Wolfgang Maass, Thomas Natschlager, and Henry Markram. "Encoding Multi-Dimensional Time Series Data with Reservoir Computing", Yuichi Katori, 2016 International Symposium on Nonlinear Theory and Its Applications, NOLTA2016, Yugawara, Japan, November 27th-30th, 2016.

　ここで、特許文献４に記載された方法では、ニューラルネットワークにおけるノード（ニューロン）間を結合するエッジに割り当てられた重みの更新を行う際、逆行列演算が行われる。このため、当該方法では、計算コストが増大してしまい、時系列データのオンライン学習を行うことが困難な場合があった。

　本発明の一態様は、重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習を行う機械学習装置であって、前記再帰型ニューラルネットワークは、１以上の入力ノードを有する入力層と、１以上の第１中間ノードを有する第１中間層と、１以上の第２中間ノードを有する第２中間層と、１以上の出力ノードを有する出力層と、を有し、前記入力ノードと、前記第１中間ノードと、前記第２中間ノードと、前記出力ノードとは、前記複数のノードのうちの互いに異なるノードであり、前記第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさに固定されており、前記機械学習装置は、前記入力層が前記１次元以上の入力データを前記予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行い、前記出力データ生成処理は、前記入力層により受け付けた前記１次元以上の入力データを前記入力層から前記第１中間層に出力する第１処理と、前記第１処理により前記第１中間層に入力された前記１次元以上の入力データに応じた１次元以上の第１中間データを前記第１中間層から前記第２中間層に出力する第２処理と、前記第２処理により前記第２中間層に入力された前記１次元以上の第１中間データに応じた１次元以上の第２中間データを前記第２中間層から前記出力層に出力する第３処理と、前記第３処理により前記出力層に入力された前記１次元以上の第２中間データに応じた１次元以上の出力データを生成する第４処理と、を前記第１処理、前記第２処理、前記第３処理、前記第４処理の順に行う処理であり、前記重み更新処理は、拡張カルマンフィルタ法に基づいて導出された式と、前記１次元以上の第１中間データと、前記１次元以上の出力データとによって、前記第１中間ノードと前記第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、前記第２中間ノードと前記出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である、機械学習装置である。

　本発明によれば、予め決められた順に並ぶ１次元以上の入力データのオンライン学習を行うことができる。

実施形態に係る機械学習装置１の構成の一例を示す図である。実施形態に係る再帰型ニューラルネットワークの構成の一例を示す図である。機械学習装置１が行う重み更新処理の流れの一例を示す図である。重み更新処理におけるデータフローの全体構成の一例を示す図である。ブロックＢ５内部のデータフローの最も単純な具体例を示す図である。ブロックＢ５の内部のデータフローの他の具体例を示す図である。ブロックＢ５の内部のデータフローの更に他の具体例を示す図である。原点から長さｌ１の棒によって繋がれた質量ｍ１の第１錘と、当該錘と長さｌ２の棒によって繋がれた質量ｍ２の第２錘とによって構成される二重振り子の一例を示す図である。図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させている期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの一例を示す図である。図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させた後の期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの一例を示す図である。図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させている期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの他の例を示す図である。図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させた後の期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの他の例を示す図である。

　＜実施形態＞
　以下、本発明の実施形態について、図面を参照して説明する。

　＜機械学習装置の構成＞
　まず、図１を参照し、実施形態に係る機械学習装置１の構成について説明する。図１は、実施形態に係る機械学習装置１の構成の一例を示す図である。

　機械学習装置１は、Ｐ次元の入力データの機械学習を行う。Ｐは、１以上の整数であれば、如何なる整数であってもよい。そして、機械学習装置１は、このような機械学習を、複数のノードを有する再帰型ニューラルネットワークを用いて行う。なお、当該再帰型ニューラルネットワークでは、当該複数のノードは、重みが割り当てられたエッジによって互いに結合されている。

　ここで、Ｐ次元の入力データは、互いに相関を持つデータである。また、Ｐ次元の入力データは、予め決められた順に並ぶデータである。以下では、一例として、予め決められた順が時系列順である場合について説明する。この場合、Ｐ次元の入力データは、Ｐ次元の時系列データである。Ｐ次元の時系列データは、例えば、Ｐ個のセンサから時系列順に取得されたデータ等である。なお、Ｐ個のセンサは、Ｐ種類のセンサであってもよく、一部又は全部が互いに同じ種類のＰ個のセンサであってもよい。また、予め決められた順は、時系列順に代えて、空間的に並べられた順等の他の順であってもよい。

　以下では、説明の便宜上、時系列順を示す時刻を、離散化された時刻ｔによって示す。ｔは、例えば、整数であるが、これに限られず、実数等の他の数であってもよい。また、以下では、説明の便宜上、あるデータＤ１が時刻ｔに対応付けられている場合、時刻ｔに対応付けられたデータＤ１のことを、時刻ｔのデータＤ１と称して説明する。また、時刻ｔのデータＤ１に基づいて算出された他のデータＤ２を、時刻ｔのデータＤ２と称して説明する。すなわち、データＤ２は、時刻ｔに対応付けられたデータである。なお、ここで例として挙げたデータＤ１及びデータＤ２は、以下において説明するデータのうちの何らかのデータを示している。

　ここで、図２に示すように、実施形態に係る再帰型ニューラルネットワークは少なくとも、入力層Ｌ１と、第１中間層Ｌ２と、第２中間層Ｌ３と、出力層Ｌ４を有する。図２は、実施形態に係る再帰型ニューラルネットワークの構成の一例を示す図である。以下では、説明の便宜上、実施形態に係る再帰型ニューラルネットワークのことを、深層ＦＯＲＣＥ学習器と称して説明する。

　なお、あるニューラルネットワークにおいて、各ノードは、当該ニューラルネットワークにおいて流れるデータ同士の演算そのものを意味する。このため、各ノードは、ソフトウェアによって実現された当該ニューラルネットワークでは、当該演算を行う関数を意味する。また、各ノードは、ハードウェアによって実現された当該ニューラルネットワークでは、当該演算を行う素子を意味する。

　また、あるニューラルネットワークにおいて、あるノードＮ１から他のノードＮ２の間を接続するエッジは、ノードＮ１からノードＮ２へのデータの流れを示す。ノードＮ１からノードＮ２へ流れるデータには、ノードＮ１とノードＮ２との間を接続するエッジに割り当てられた重みが乗算される。すなわち、ノードＮ２には、エッジを通ることによって当該重みが乗算された後の当該データが当該エッジから入力される。このため、ソフトウェアによって実現された当該ニューラルネットワークでは、当該エッジは、このような重みの乗算を行う関数を意味する。また、当該エッジは、ハードウェアによって実現された当該ニューラルネットワークでは、このような重みの乗算を行う素子を意味する。

　入力層Ｌ１は、入力ノードを有する。ここで、入力層Ｌ１は、Ｐ次元の入力データの次元数と同じ数の入力ノードを有してもよく、Ｐ次元の入力データの次元数と異なる数の入力ノードを有してもよい。なお、Ｐ次元の入力データの次元数と異なる数の入力ノードを入力層Ｌ１が有する場合、これらの入力ノードの数は、Ｐ個よりも少ない数であってもよく、Ｐ個よりも多い数であってもよい。そして、当該場合、これらの入力ノードには、例えば、Ｐ次元の入力データの重み付き線形和が入力される。以下では、一例として、入力層Ｌ１が、Ｐ個の入力ノードを有する場合について説明する。この場合、ある入力ノードは、入力データのうち当該入力ノードに対応付けられた入力データを受け付ける。換言すると、Ｐ個の入力ノードのうちｐ番目の入力ノードは、Ｐ次元の時系列データのうちｐ番目の入力データを受け付ける。ここで、ｐは、１以上Ｐ以下の整数のうちのいずれかの整数である。すなわち、ｐは、Ｐ個の入力ノードのそれぞれを互いに識別する数（ラベル）である。入力層Ｌ１は、Ｐ個の入力ノードにより受け付けたＰ次元の入力データのそれぞれを第１中間層Ｌ２に出力する。

　また、第１中間層Ｌ２は、複数の第１中間ノードを有する。また、第１中間層Ｌ２は、入力層Ｌ１が出力するＰ次元の入力データのそれぞれを受け付ける。より具体的には、第１中間層Ｌ２は、複数の第１中間ノードのうちの一部又は全部により、入力層Ｌ１が出力するＰ次元の入力データのそれぞれを受け付ける。第１中間層Ｌ２は、受け付けたＰ次元の入力データに応じたＱ次元の第１中間データを第２中間層Ｌ３に出力する。Ｑは、１以上の整数であれば、如何なる整数であってもよい。このため、第１中間層Ｌ２は少なくとも、Ｑ次元の第１中間データのそれぞれを第２中間層Ｌ３に出力するＱ個の第１中間ノードを有する。ここで、これらＱ個の第１中間ノードのうちｑ番目の第１中間ノードは、Ｑ次元の第１中間データのうちｑ番目の第１中間データを第２中間層Ｌ３に出力する。ｑは、１以上Ｑ以下の整数のうちのいずれかの整数である。ｑは、Ｑ個の第１中間ノードのそれぞれを互いに識別する数（ラベル）であるとともに、Ｑ次元の第１中間データのそれぞれを互いに識別する数（ラベル）でもある。

　ここで、ある第１中間ノードは、１以上の入力データを受け付けた場合、受け付けた１以上の入力データの総和を第１活性化関数へ入力した場合に得られる出力値を生成する。なお、第１活性化関数は、非線形関数であれば、如何なる関数であってもよい。そして、当該第１中間ノードは、生成した当該出力値を、エッジにより当該第１中間ノードに結合されている他のノードへと出力する。当該第１中間ノードが前述のＱ個の第１中間ノードのうちのいずれかである場合、生成した当該出力値は、第１中間データとして第２中間層Ｌ３に出力される。第１中間層Ｌ２が有する個々の第１中間ノードは、このような出力値の生成を行う。なお、第１中間ノードが行う処理のうちバイアスの加算等の他の処理については、説明を省略する。

　第１中間層Ｌ２は、例えば、リザボアコンピューティングにおけるリザボアである。このため、第１中間層Ｌ２内における重みは、事前に乱数によって決定されている。そして、第１中間層Ｌ２内における重みの更新は、行われない。換言すると、第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさ（すなわち、乱数によって決定された大きさ）に固定されている。なお、第１中間層Ｌ２は、リザボアに代えて、層内における重みの更新が行われない他の中間層であってもよい。

　第２中間層Ｌ３は、Ｒ個の第２中間ノードを有する。ここで、Ｒは、１以上の整数であれば、如何なる整数であってもよい。第２中間層Ｌ３は、これらＲ個の第２中間ノードにより、第１中間層Ｌ２からＱ次元の第１中間データを受け付ける。第２中間層Ｌ３は、受け付けたＱ次元の第１中間データに応じたＲ次元の第２中間データを出力層Ｌ４に出力する。すなわち、Ｒ個の第２中間ノードのうちｒ番目の第２中間ノードは、Ｒ次元の第２中間データのうちｒ番目の第２中間データを出力層Ｌ４に出力する。ｒは、１以上Ｒ以下の整数のうちのいずれかの整数である。ｒは、Ｒ個の第２中間ノードのそれぞれを互いに識別する数（ラベル）であるとともに、Ｒ次元の第２中間データのそれぞれを互いに識別する数（ラベル）でもある。

　ここで、ある第２中間ノードは、１以上の第１中間データを受け付けた場合、受け付けた１以上の第１中間データの総和を第２活性化関数へ入力した場合に得られる出力値を生成する。第２活性化関数については、後述する。そして、当該第２中間ノードは、生成した当該出力値を、エッジにより当該第２中間ノードに結合されている他のノードへと出力する。これにより、当該第２中間ノードは、当該出力値を第２中間データとして出力層Ｌ４に出力する。第２中間層Ｌ３が有する個々の第２中間ノードは、このような出力値の生成を行う。なお、第２中間ノードが行う処理のうちバイアスの加算等の他の処理については、説明を省略する。

　第２中間層Ｌ３は、フィードフォワードニューラルネットワークにおける中間層である。なお、第２中間層Ｌ３は、図２に示すような１層である構成に代えて、多層である構成であってもよい。この場合、深層ＦＯＲＣＥ学習器では、第１中間層Ｌ２と出力層Ｌ４との間に存在する複数の層を、まとめて第２中間層Ｌ３と称する。例えば、第２中間層Ｌ３は、第２１中間層～第２ｎ中間層とのｎ個の層によって構成されてもよい。ここで、ｎは、２以上の整数である。この場合、第２中間層Ｌ３は、第２１中間層が有する複数のノードのそれぞれによってＱ次元の第１中間データを受け付ける。これにより、当該場合、第２中間層Ｌ３では、フィードフォワードニューラルネットワークにおけるデータフローと同様のデータフローによって第２１中間層から第２ｎ中間層までの間をデータが流れる。そして、当該場合、第２中間層Ｌ３では、第２ｎ中間層から、Ｒ次元の第２中間データを出力層Ｌ４に出力する。

　出力層Ｌ４は、Ｓ個の出力ノードを有する。ここで、Ｓは、１以上の整数であれば、如何なる整数であってもよい。出力層Ｌ４は、これらＳ個の出力ノードにより、第２中間層Ｌ３からＲ次元の第２中間データを受け付ける。出力層Ｌ４は、受け付けたＲ次元の第２中間データに応じたＳ次元の出力データを生成して出力する。すなわち、Ｓ個の出力ノードのうちｓ番目の出力ノードは、Ｓ次元の出力データのうちｓ番目の出力データを生成する。ｓは、１以上Ｓ以下の整数のうちのいずれかの整数である。ｓは、Ｓ個の出力ノードのそれぞれを互いに識別する数（ラベル）であるとともに、Ｓ次元の出力データのそれぞれを互いに識別する数（ラベル）でもある。

　ここで、ある出力ノードは、１以上の第２中間データを受け付けた場合、受け付けた１以上の第２中間データの総和を第３活性化関数へ入力した場合に得られる出力値を生成する。これにより、当該出力ノードは、当該出力値を出力データとして出力する。第３活性化関数については、後述する。出力層Ｌ４が有する個々の出力ノードは、このような出力値の生成を行う。なお、出力ノードが行う処理のうちバイアスの加算、当該出力値の出力等の他の処理については、説明を省略する。

　このように、深層ＦＯＲＣＥ学習器は、この一例において、リザボアである第１中間層Ｌ２と、フィードフォワードニューラルネットワークにおける中間層である第２中間層Ｌ３とを有する。このため、深層ＦＯＲＣＥ学習器は、この一例では、リザボアコンピューティングとフィードフォワードニューラルネットワークとを組み合わせた再帰型ニューラルネットワークである。

　なお、入力ノードと、第１中間ノードと、第２中間ノードと、出力ノードとは、深層ＦＯＲＣＥ学習器が有する複数のノードのうちの互いに異なるノードであり、重複することはない。

　ここで、ある入力ノードＸ１１からある第１中間ノードＸ１２へあるデータＤ１が出力される場合、データＤ１には、入力ノードＸ１１と第１中間ノードＸ１２とを結合するエッジに割り当てられた重みが乗算される。そして、当該重みが乗算された後のデータＤ１が第１中間ノードＸ１２へと入力される。

　また、ある第１中間ノードＸ２１から他の第１中間ノードＸ２２へあるデータＤ２が出力される場合、データＤ２には、第１中間ノードＸ２１と第１中間ノードＸ２２とを結合するエッジに割り当てられた重みが乗算される。そして、当該重みが乗算された後のデータＤ２が第１中間ノードＸ２２へと入力される。

　また、ある第１中間ノードＸ３１からある第２中間ノードＸ３２へあるデータＤ３が出力される場合、データＤ３には、第１中間ノードＸ３１と第２中間ノードＸ３２とを結合するエッジに割り当てられた重みが乗算される。そして、当該重みが乗算された後のデータＤ３が第２中間ノードＸ３２へと入力される。

　また、ある第２中間ノードＸ４１からある出力ノードＸ４２へあるデータＤ４が出力される場合、データＤ４には、第２中間ノードＸ４１と出力ノードＸ４２とを結合するエッジに割り当てられた重みが乗算される。そして、当該重みが乗算された後のデータＤ４が出力ノードＸ４２へと入力される。

　また、第１中間層Ｌ２内における重みが更新されないため、深層ＦＯＲＣＥ学習器では、重みの更新は、第１中間ノードと第２中間ノードとを結合するエッジに割り当てられた重みと、第２中間ノードと出力ノードとを結合するエッジに割り当てられた重みとについて行われる。また、重みの更新は、入力ノードと第１中間ノードとを結合するエッジに割り当てられた重みについて行われない。そこで、以下では、説明の便宜上、これらの重みの更新が行われる重みを区別する必要がない限り、まとめて更新対象重みと称して説明する。

　なお、図２に示した「○」はそれぞれ、ノードを示している。すなわち、入力層Ｌ１に含まれている「○」はそれぞれ、入力ノードを示す。また、第１中間層Ｌ２に含まれている「○」はそれぞれ、第１中間ノードを示す。また、第２中間層Ｌ３に含まれている「○」はそれぞれ、第２中間ノードを示す。また、出力層Ｌ４に含まれている「○」はそれぞれ、出力ノードを示す。

　また、図２に示したノード間を結合する矢印は、深層ＦＯＲＣＥ学習器における各ノード間のエッジによる接続態様のイメージを分かりやすく表すために描かれているものであり、実際の深層ＦＯＲＣＥ学習器における各ノード間のエッジによる接続態様とは異なる。

　また、入力層Ｌ１への入力データの入力と、出力層Ｌ４からの出力データの出力とについては、既知の方法によって行われてもよく、これから開発される方法によって行われてもよいため、説明を省略する。

　機械学習装置１は、このような深層ＦＯＲＣＥ学習器を用いて、前述のＰ次元の入力データの機械学習を行う。より具体的には、機械学習装置１は、入力層Ｌ１がＰ次元の入力データを時系列順に受け付ける毎に（すなわち、当該入力データを予め決められた順に受け付ける毎に）、出力データ生成処理と重み更新処理とを行う。

　出力データ生成処理は、第１処理と、第２処理と、第３処理と、第４処理とを、第１処理、第２処理、第３処理、第４処理の順に行う処理である。

　第１処理は、入力層Ｌ１により受け付けたＰ次元の入力データを入力層Ｌ１から第１中間層Ｌ２に出力する処理である。

　第２処理は、第１処理により第１中間層Ｌ２に入力されたＰ次元の入力データに応じたＱ次元の第１中間データを第１中間層Ｌ２から第２中間層Ｌ３に出力する処理である。

　第３処理は、第２処理により第２中間層Ｌ３に入力されたＱ次元の第１中間データに応じたＲ次元の第２中間データを第２中間層Ｌ３から出力層Ｌ４に出力する処理である。なお、第３処理は、前述したように第２１中間層～第２ｎ中間層とのｎ個の層によって構成される場合、第２処理により第２中間層Ｌ３の第２１中間層に入力されたＱ次元の第１中間データに応じたＲ次元の第２中間データを第２中間層Ｌ３の第２ｎ中間層から出力層Ｌ４に出力する処理である。

　第４処理は、第３処理により出力層Ｌ４に入力されたＲ次元の第２中間データに応じたＳ次元の出力データを生成する処理である。

　出力データ生成処理については、一般的なフィードフォワードニューラルネットワークにおいて出力データを生成する処理と同様の処理である。このため、出力データ生成処理については、これ以上の詳細な説明を省略する。

　重み更新処理は、Ｑ次元の第１中間データと、Ｓ次元の出力データと、拡張カルマンフィルタ法に基づいて導出された式とによって、前述の更新対象重み（すなわち、第１中間ノードと第２中間ノードとを結合するエッジそれぞれに割り当てられた重み、及び、第２中間ノードと出力ノードとを結合するエッジそれぞれに割り当てられた重み）を更新する処理である。

　以下では、機械学習装置１の構成とともに、このような重み更新処理の詳細について詳しく説明する。

　図１に戻る。機械学習装置１は、演算装置１１と、メモリ１２と、ネットワークインターフェース１３を備える。なお、機械学習装置１は、これらに加えて、他の回路、他の装置を備える構成であってもよい。例えば、機械学習装置１は、キーボード、マウス等の入力装置を備える構成であってもよい。また、例えば、機械学習装置１は、ディスプレイ等の出力装置を備える構成であってもよい。また、例えば、機械学習装置１は、当該入力装置と当該出力装置との少なくとも一方を接続するインタフェースを備える構成であってもよい。

　演算装置１１は、プロセッサであり、例えば、ＦＰＧＡ（Field　Programmable　Gate　Array）である。なお、演算装置１１は、ＦＰＧＡに代えて、ＣＰＵ（Central　Processing　Unit）であってもよく、ＦＰＧＡとＣＰＵの組み合わせであってもよく、他のプロセッサであってもよい。

　この一例では、演算装置１１は、ＦＰＧＡである。このため、演算装置１１は、ＦＰＧＡが有するハードウェア（例えば、集積回路等）によって深層ＦＯＲＣＥ学習器を実現し、ｐ次元の入力データについての機械学習を行う。なお、演算装置１１がＣＰＵである場合、演算装置１１は、ＣＰＵが有するハードウェアと、ＣＰＵにより実行されるソフトウェアとの組み合わせによって当該機械学習を行う構成であってもよい。また、演算装置１１は、後述するように、ニアメモリ、メモリロジック等によって構成されてもよい。換言すると、演算装置１１は、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアによって構成されてもよい。

　メモリ１２は、例えば、演算装置１１が用いる各種の情報を記憶する。メモリ１２は、例えば、ＳＳＤ（Solid　State　Drive）、ＨＤＤ（Hard　Disk　Drive）、ＥＥＰＲＯＭ（Electrically　Erasable　Programmable　Read－Only　Memory）、ＲＯＭ（Read－Only　Memory）、ＲＡＭ（Random　Access　Memory）等を含む。なお、メモリ１２は、演算装置１１に内蔵されるものに代えて、ＵＳＢ等のデジタル入出力ポート等によって接続された外付け型の記憶装置であってもよい。

　ネットワークインターフェース１３は、ネットワークを介して、センサ等の外部装置と接続するインタフェースである。

　＜重み更新処理＞
　以下、機械学習装置１が行う重み更新処理について説明する。ここで、以下において説明する重み更新処理は、拡張カルマンフィルタ法に基づく処理である。拡張カルマンフィルタ法に基づく重み更新処理では、離散化された時刻ｔが示す時系列順に応じた逐次計算が行われる。このため、以下において説明する関数、ベクトル、行列等の引数として現われる時刻ｔは、このような逐次計算における時系列順を示す。なお、拡張カルマンフィルタ法による以下の定式化は、一例に過ぎず、他の定式化であってもよい。

　深層ＦＯＲＣＥ学習器では、重み更新処理において更新される重みは、前述した更新対象重みであった。このため、実施形態では、層内における重みが更新されない第１中間層Ｌ２を、仮想的に入力層Ｌ１の一部として考える。このような考えの下では、前述の第１中間データを入力データの代わりとして扱うことができる。そこで、Ｑ次元の第１中間データを成分として有するＱ次元のベクトルは、以下の式（１）のように表すことができる。

　上記の式（１）が示すベクトルｙ^Ｉの各成分は、Ｑ次元の第１中間データを示す。また、式（１）におけるｔは、前述した通り、逐次計算における時系列順を示す時刻である。すなわち、ｙ^Ｉ（ｔ）は、時刻ｔの入力データに応じて第１中間層Ｌ２が出力したＱ次元の第１中間データ（すなわち、時刻ｔの第１中間データ）を示す。なお、時刻ｔの入力データに応じて第１中間層Ｌ２が出力したＱ次元の第１中間データは、時刻ｔの入力データが入力層Ｌ１に受け付けられた場合において第１中間層Ｌ２が出力したＱ次元の第１中間データのことである。このため、ｙ^Ｉ（ｔ）は、時刻ｔにおいて算出された第１中間データを示しているわけではない。

　また、時刻ｔの入力データに応じて出力層Ｌ４が生成するＳ次元の出力データは、以下の式（２）のように表すことができる。なお、時刻ｔの入力データに応じて出力層Ｌ４が出力したＳ次元の出力データは、時刻ｔの入力データが入力層Ｌ１に受け付けられた場合において出力層Ｌ４が生成したＳ次元の出力データのことである。

　上記の式（２）が示すベクトルｙ^Ｏの各成分は、Ｓ次元の出力データを示す。すなわち、ｙ^Ｏ（ｔ）は、時刻ｔの入力データが入力層Ｌ１に受け付けられた直後において出力層Ｌ４が生成したＳ次元の出力データ（すなわち、時刻ｔの出力データ）を示す。このため、ｙ^Ｏ（ｔ）は、時刻ｔにおいて算出された出力データを示しているわけではない。

　また、時刻ｔの入力データに応じて第２中間層Ｌ３が出力するＲ次元の第２中間データは、以下の式（３）のように表すことができる。なお、時刻ｔの入力データに応じて第２中間層Ｌ３が出力したＲ次元の第２中間データは、時刻ｔの入力データが入力層Ｌ１に受け付けられた場合において第２中間層Ｌ３が出力したＲ次元の第２中間データのことである。

　上記の式（３）が示すベクトルｙ^Ｈの各成分は、Ｒ次元の第２中間データを示す。すなわち、ｙ^Ｈ（ｔ）は、時刻ｔの入力データに応じて第２中間層Ｌ３が出力したＲ次元の第２中間データ（すなわち、時刻ｔの第２中間データ）を示す。このため、ｙ^Ｈ（ｔ）は、時刻ｔにおいて算出された第２中間データを示しているわけではない。

　また、時刻ｔの入力データが入力層Ｌ１に受け付けられた場合において、第１中間データを出力するＱ個の第１中間ノードのうちｑ番目の第１中間ノードと、Ｒ個の第２中間ノードのうちｒ番目の第２中間ノードとを結合するエッジに割り当たられている重みは、以下の式（４）のように表すことができる。

　上記の式（４）が示すベクトルｗ^ＨＩの各成分は、第１中間データを出力するＱ個の第１中間ノードのうちｑ番目の第１中間ノードと、Ｒ個の第２中間ノードのうちｒ番目の第２中間ノードとを結合するエッジに割り当たられている重みを示す。すなわち、ｗ^ＨＩ（ｔ）の各成分は、時刻ｔの入力データに応じた当該重み（すなわち、時刻ｔの当該重み）を示す。

　また、時刻ｔの入力データが入力層Ｌ１に受け付けられた場合において、第２中間データを出力するＲ個の第２中間ノードのうちｒ番目の第２中間ノードと、Ｓ個の出力ノードのうちｓ番目の出力ノードとを結合するエッジに割り当たられている重みは、以下の式（５）のように表すことができる。

　上記の式（５）が示すベクトルｗ^ＯＨの各成分は、第２中間データを出力するＲ個の第２中間ノードのうちｒ番目の第２中間ノードと、Ｓ個の出力ノードのうちｓ番目の出力ノードとを結合するエッジに割り当たられている重みを示す。すなわち、ｗ^ＯＨ（ｔ）の各成分は、時刻ｔの入力データに応じた当該重み（すなわち、時刻ｔの当該重み）を示す。

　また、深層ＦＯＲＣＥ学習器における時刻ｔの教師データは、以下の式（６）のように表すことができる。

　上記の式（６）が示すベクトルｄ（ｔ）の各成分は、時刻ｔのＳ次元の出力データのそれぞれに対応する教師データを示す。

　ここで、上記の式（２）に示したＳ次元の出力データのうちのｓ番目の出力データは、式（３）及び式（５）に基づいて、以下の式（７）及び式（８）のように表すことができる。

　一方、上記の式（３）に示したＲ次元の第２中間データのうちのｒ番目の第２中間データは、式（１）及び式（４）に基づいて、以下の式（９）及び式（１０）のように表すことができる。

　式（７）における関数ｆ^Ｏは、前述の第３活性化関数である。また、式（９）における関数ｆ^Ｈは、前述の第２活性化関数である。ただし、深層ＦＯＲＣＥ学習器において、第２活性化関数及び第３活性化関数のそれぞれは、所定の条件を満たす関数である。所定の条件は、奇関数であること（すなわち、原点を中心とした１８０°回転に対する対称性を有する非線形関数であること）、である。このような所定の条件を満たす関数は、例えば、双曲線正接関数である。なお、第２活性化関数と第３活性化関数とのうちいずれか一方又は両方は、双曲線正接関数に代えて、所定の条件を満たす他の非線形関数であってもよい。

　ここで、深層ＦＯＲＣＥ学習器は、以下の式（１１）及び式（１２）に示した非線形ベクトル関数によって表すことができる。

　上記の式（１１）におけるベクトルθ（ｔ）は、式（１２）によって算出されるベクトルであり、式（１２）に示したように更新対象重みを成分として有する重みベクトルである。上記の式（１１）におけるベクトルη（ｔ）は、ベクトルθ（ｔ）に対するモデル化誤差を示す。すなわち、ベクトルη（ｔ）は、深層ＦＯＲＣＥ学習器を何らかの非線形関数によって表すアルゴリズムによって導出される。

　そのようなアルゴリズムとして拡張カルマンフィルタ法を採用した場合、上記の式（１１）は、式（１１）の右辺第１項を推定重みベクトルとし、式（１１）の左辺を予測重みベクトルとして、以下の式（１３）～式（１５）のように表し直すことができる。なお、推定重みベクトルは、前述の重みベクトルについての、拡張カルマンフィルタ法における推定値のことである。また、予測重みベクトルは、重みベクトルについての、拡張カルマンフィルタ法における予測値のことである。

　上記の式（１３）においてベクトルθの上に付いている「＾」は、「＾」付きのベクトルθが推定重みベクトルであることを示している。また、式（１３）においてベクトルθの上に付いている「￣」は、「￣」付きのベクトルθが予測重みベクトルであることを示している。また、式（１３）におけるベクトルｅ（ｔ）は、式（１５）に示したように、時刻ｔの出力データと、時刻ｔの教師データとの差分を示す。そして、式（１３）における行列Ｋは、拡張カルマンフィルタ法におけるカルマンゲイン行列を示す。すなわち、行列Ｋ（ｔ）は、時刻ｔにおけるカルマンゲイン行列を示す。行列Ｋ（ｔ）は、（Ｑ×Ｒ＋Ｓ×Ｒ）行Ｓ列の行列である。何故なら、式（１３）の左辺に示した推定重みベクトルが（Ｑ×Ｒ＋Ｓ×Ｒ）次元のベクトルであり、ベクトルｅ（ｔ）がＳ次元のベクトルであるからである。ここで、時刻ｔにおける行列Ｋ（ｔ）は、以下の式（１６）～（１９）のように表される。

　上記の式（１６）において行列Ｕ（ｔ）の上に付いている「￣」は、「￣」付きの行列Ｕ（ｔ）が、共分散行列についての、拡張カルマンフィルタ法における予測値であることを示している。また、式（１６）における行列Ａ（ｔ）は、時刻ｔのスケーリングファクタを示す。この行列Ａ（ｔ）は、式（１７）によって算出される。また、式（１７）における行列Ｗ（ｔ）は、時刻ｔのモデル化誤差についての共分散行列を示す。また、式（１８）の行列Ｖ（ｔ）は、予め与えられた誤差分布に応じた成分を有する行列であり、「＾」付きの行列Ｕ（ｔ－１）に対する誤差を示す。「＾」付きの行列Ｕ（ｔ－１）は、共分散行列の、拡張カルマンフィルタ法における推定値を示す。「＾」付きの行列Ｕ（ｔ）は、式（１９）により算出される。すなわち、「＾」付きの行列Ｕ（ｔ）は、式（１８）及び式（１９）による逐次計算により算出される。また、式（１６）における行列Ｈ（ｔ）は、拡張カルマンフィルタ法におけるヤコビアンを示す。行列Ｈ（ｔ）は、式（２０）によって算出される。行列Ｈ（ｔ）、すなわち、ヤコビアンは、制御工学における観測行列に相当する。

　機械学習装置１は、上記の式（１３）～（２０）を用いた逐次計算により、更新対象重みの更新を行う。この逐次計算による更新対象重みの更新を行うためには、式（２０）に示したヤコビアンを具体的に算出する必要がある。ヤコビアンは、式（２０）の右辺に示したように、２つのブロック行列によって表される。そして、これら２つのブロック行列の各成分は、以下の式（２１）及び式（２２）によって表される。

　また、上記の式（２１）に示したブロック行列の各成分は、上記の式（７）～（１０）を用いて、以下の式（２３）のように展開することができる。

　なお、上記の式（２３）は、ノードの結合先が一致していない場合、すなわち、ｑ≠ｒである場合、０となる。

　また、上記の式（２２）に示したブロック行列の各成分は、上記の式（７）～（１０）を用いて、以下の式（２４）のように展開することができる。

　このように、上記の式（２０）の右辺に示した２つのブロック行列の各成分は、上記の式（２３）及び式（２４）に基づいて算出することができる。その結果、前述のヤコビアンが算出可能であるため、前述の「＾」付きの行列Ｕ（ｔ）と、行列Ｖ（ｔ）と、行列Ｗ（ｔ）とのそれぞれに対して初期値を与えることにより、機械学習装置１は、カルマンゲイン行列である行列Ｋ（ｔ）を算出することができる。これにより、機械学習装置１は、上記の式（１３）～式（１５）に基づいて、更新対象重みの更新を行うことができる。

　ここで、図３を参照し、機械学習装置１が行う重み更新処理の流れについて説明する。図３は、機械学習装置１が行う重み更新処理の流れの一例を示す図である。機械学習装置１は、入力層Ｌ１がＰ次元の入力データを時系列順に受け付ける毎に、図３に示したフローチャートの処理を行う。

　機械学習装置１は、出力データ生成処理が終了するまで待機する（ステップＳ１１０）。

　機械学習装置１は、出力データ生成処理が終了したと判定した場合（ステップＳ１１０－ＹＥＳ）、上記の式（７）～（１０）及び式（２０）～（２４）と、前述の第２活性化関数及び第３活性化関数（例えば、両関数ともに双曲線正接関数）とに基づいて、前述のヤコビアンを算出する（ステップＳ１２０）。この際、機械学習装置１は、第１中間層Ｌ２から出力された第１中間データと、第２中間層Ｌ３から出力された第２中間データと、出力層Ｌ４により生成された出力データと、更新対象重みとを用いて、ヤコビアンを算出する。

　次に、機械学習装置１は、式（１６）～（１９）と、ステップＳ１２０において算出されたヤコビアンとに基づいて、前述のカルマンゲイン行列を算出する（ステップＳ１３０）。ステップＳ１３０の処理は、上記の式（１９）に示した「＾」付きの行列Ｕを最小化するための算出処理である。ここで、機械学習装置１は、１回目のステップＳ１３０の処理が行われる際、３つの行列「＾」付きの行列Ｕ（ｔ）と、行列Ｖ（ｔ）と、行列Ｗ（ｔ）とのそれぞれについてユーザにより予め与えられた初期値を用いて、カルマンゲイン行列を算出する。

　次に、機械学習装置１は、上記の式（１３）～式（１５）と、モデル化誤差であるベクトルη（ｔ）と、ステップＳ１３０において算出した行列Ｋ（ｔ）と、教師データと、出力層Ｌ４が生成した出力データと、更新対象重みとに基づいて、更新対象重みの更新を行い（ステップＳ１４０）、処理を終了する。

　以上のようなフローチャートの処理により、機械学習装置１は、重み更新処理を行う。ここで、図３に示したフローチャートの処理では、機械学習装置１は、前述したように、逆行列演算を行っていない。換言すると、機械学習装置１は、当該処理において、解析計算によって予め導出されている式を用いた逐次計算を行っているに過ぎない。このため、機械学習装置１は、当該処理の計算コストを、逆行列演算を行う処理と比べて小さくすることができる。また、機械学習装置１は、当該処理によって、図２に示した深層ＦＯＲＣＥ学習器によるオンライン学習を行うことができる。その結果、機械学習装置１は、例えば、当該深層ＦＯＲＣＥ学習器による機械学習を行う装置として、エッジデバイスに搭載することができる。深層ＦＯＲＣＥ学習器をエッジデバイス等への搭載を考える場合、当該処理の効率化が重要となる。このため、当該処理においては、効率的なデータフローを実現することが求められる。特に、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとして深層ＦＯＲＣＥ学習器をエッジデバイス等に実装する場合、効率的なデータフローの実現は、メモリアクセスの速度、計算速度等の高速化に繋がるため、非常に重要である。そこで、以下では、当該処理における効率的なデータフローについて説明する。

　＜重み更新処理におけるデータフロー＞
　前述した通り、深層ＦＯＲＣＥ学習器は、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとしてエッジデバイス等に実装することができる。そして、当該ハードウェアとしてエッジデバイス等に実装される深層ＦＯＲＣＥ学習器のメモリアクセスの速度、計算速度等は、重み更新処理におけるデータフローの設計に応じて異なる。このような事情から、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとして深層ＦＯＲＣＥ学習器をエッジデバイス等に実装にする場合、効率的な当該データフローを考える必要がある。

　そこで、以下では、重み更新処理におけるデータフローとして効率的であると考えられる具体例について説明する。

　図４は、重み更新処理におけるデータフローの全体構成の一例を示す図である。重み更新処理におけるデータフローは、図４に示したように、大きく分けてブロックＢ１～ブロックＢ６の６つのブロックから構成される。なお、当該６つのブロックのそれぞれは、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアを示す。なお、図４において、データフローにおける時系列順は、時刻ｔによって示している。

　ブロックＢ１は、上記の式（１４）に基づく処理により、前述の予測重みベクトルを算出するブロックである。ブロックＢ１には、ベクトルη（ｔ）と「＾」付きのベクトルθ（ｔ）とが入力される。そして、ブロックＢ１は、「￣」付きのベクトルθ（ｔ）、すなわち、予測重みベクトルを算出する。ブロックＢ１は、算出した予測重みベクトルを、ブロックＢ２に出力する。

　ブロックＢ２は、上記の式（１８）に基づく処理により、共分散行列についての拡張カルマンフィルタ法における予測値を算出するブロックである。ブロックＢ２には、「＾」付きの行列Ｕ（ｔ－１）と、行列Ｖ（ｔ）とが入力される。そして、ブロックＢ２は、共分散行列についての予測値、すなわち、「￣」付きの行列Ｕ（ｔ）を算出する。ブロックＢ２は、算出した「￣」付きの行列Ｕ（ｔ）を、ブロックＢ４とブロックＢ６とのそれぞれに出力する。

　ブロックＢ３は、上記の式（１３）に基づく処理により、推定重みベクトルを更新するブロックである。ブロックＢ３には、ベクトルｅ（ｔ）と、ブロックＢ１から出力される「￣」付きのベクトルθ（ｔ）と、後述するブロックＢ６から出力される行列Ｋ（ｔ）とが入力される。そして、ブロックＢ３は、推定重みベクトル、すなわち、「＾」付きのベクトルθ（ｔ＋１）を算出する。ブロックＢ３は、算出した「＾」付きのベクトルθ（ｔ＋１）を出力する。

　ブロックＢ４は、上記の式（１９）に基づく処理により、共分散行列についての拡張カルマンフィルタ法における推定値を算出するブロックである。ブロックＢ４には、ブロックＢ２から出力される「￣」付きの行列Ｕ（ｔ）と、後述するブロックＢ５から出力される行列Ｈ（ｔ）と、後述するブロックＢ６から出力される行列Ｋ（ｔ）とが入力される。そして、ブロックＢ４は、当該推定値、すなわち、「＾」付きの行列Ｕ（ｔ）を算出する。ブロックＢ４は、算出した「＾」付きの行列Ｕ（ｔ）を出力する。

　ブロックＢ５は、上記の式（７）～式（１０）に基づく処理により、ヤコビアンを算出するブロックである。ブロックＢ５には、ベクトルｙ^Ｉ（ｔ）が入力される。そして、ブロックＢ５は、ヤコビアン、すなわち、行列Ｈ（ｔ）を算出する。ブロックＢ５は、算出した行列Ｈ（ｔ）を、ブロックＢ４とブロックＢ６とのそれぞれに出力する。また、ブロックＢ５は、前述の出力データ生成処理も行う。ブロックＢ５内部のデータフローについては、後述する。

　ブロックＢ６は、上記の式（１６）及び式（１７）に基づく処理により、カルマンゲイン行列を算出するブロックである。ブロックＢ６には、ブロックＢ２から出力される「￣」付きの行列Ｕ（ｔ）と、ブロックＢ５から出力される行列Ｈ（ｔ）と、行列Ｗ（ｔ）とが入力される。そして、ブロックＢ６は、カルマンゲイン行列、すなわち、行列Ｋ（ｔ）を算出する。ブロックＢ６は、算出した行列Ｋ（ｔ）を出力する。この際、ブロックＢ６は、ブロックＢ３にも行列Ｋ（ｔ）を出力する。

　ここで、図５は、ブロックＢ５内部のデータフローの最も単純な具体例を示す図である。図５に示したデータフローは、深層ＦＯＲＣＥ学習器において採用される第２活性化関数及び第３活性化関数のそれぞれが、前述の所定の条件を満たしていれば、如何なる関数であっても成立するデータフローである。また、図５に示したデータフローには、前述の出力データ生成処理におけるデータフローも含まれている。図５に示したデータフローは、大きく分けてブロックＢ５１Ａ～ブロックＢ５１Ｈの８つのブロックから構成される。なお、当該８つのブロックのそれぞれは、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアを示す。なお、図５において、データフローにおける時系列順は、時刻ｔによって示している。

　ブロックＢ５１Ａは、上記の式（１０）の計算を行うブロックである。すなわち、ブロックＢ５１Ａには、ベクトルｙ^Ｉ（ｔ）と、ベクトルｗ^ＨＩ（ｔ）とが入力される。そして、ブロックＢ５１Ａは、ａｃｔ_ｒ（ｔ）を算出し、算出したａｃｔ_ｒ（ｔ）を出力する。より具体的には、ブロックＢ５１Ａは、算出したａｃｔ_ｒ（ｔ）を、ブロックＢ５１ＢとブロックＢ５１Ｅのそれぞれに出力する。

　ブロックＢ５１Ｂは、上記の式（９）の計算を行うブロックである。すなわち、ブロックＢ５１Ｂには、ブロックＢ５１Ａから出力されるａｃｔ_ｒ（ｔ）が入力される。そして、ブロックＢ５１Ｂは、ベクトルｙ^Ｈ（ｔ）を算出し、算出したベクトルｙ^Ｈ（ｔ）を出力する。より具体的には、ブロックＢ５１Ｂは、算出したベクトルｙ^Ｈ（ｔ）を、ブロックＢ５１ＣとブロックＢ５１Ｈのそれぞれに出力する。

　ブロックＢ５１Ｃは、上記の式（８）の計算を行うブロックである。すなわち、ブロックＢ５１Ｃには、ブロックＢ５１Ｂから出力されるベクトルｙ^Ｈ（ｔ）と、ベクトルｗ^ＯＨ（ｔ）とが入力される。そして、ブロックＢ５１Ｃは、ａｃｔ_ｓ（ｔ）を算出し、算出したａｃｔ_ｓ（ｔ）を出力する。より具体的には、ブロックＢ５１Ｃは、算出したａｃｔ_ｓ（ｔ）を、ブロックＢ５１ＤとブロックＢ５１Ｆのそれぞれに出力する。

　ブロックＢ５１Ｄは、上記の式（７）の計算を行うブロックである。すなわち、ブロックＢ５１Ｄには、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）が入力される。そして、ブロックＢ５１Ｄは、ベクトルｙ^Ｏ（ｔ）を算出し、算出したベクトルｙ^Ｏ（ｔ）を出力する。

　このように、ブロックＢ５１Ａ、ブロックＢ５１Ｂ、ブロックＢ５１Ｃ、ブロックＢ５１Ｄの順に流れるデータフローが、出力データ生成処理におけるデータフローである。

　ブロックＢ５１Ｅは、上記の式（２３）におけるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出するブロックである。すなわち、ブロックＢ５１Ｅには、ブロックＢ５１Ａから出力されるａｃｔ_ｒ（ｔ）が入力される。そして、ブロックＢ５１Ｅは、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出し、算出したｆ^Ｈ’（ａｃｔ_ｒ（ｔ））をブロックＢ５１Ｇに出力する。

　ブロックＢ５１Ｆは、上記の式（２３）及び式（２４）におけるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））を算出するブロックである。すなわち、ブロックＢ５１Ｆには、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）が入力される。そして、ブロックＢ５１Ｆは、ｆ^Ｏ’（ａｃｔ_ｓ（ｔ））を算出し、算出したｆ^Ｏ’（ａｃｔ_ｓ（ｔ））を出力する。より具体的には、ブロックＢ５１Ｆは、算出したｆ^Ｏ’（ａｃｔ_ｓ（ｔ））を、ブロックＢ５１ＧとブロックＢ５１Ｈのそれぞれに出力する。

　ブロックＢ５１Ｇは、上記の式（２３）の計算を行うブロックである。すなわち、ブロックＢ５１Ｇには、ベクトルｙ^Ｉ（ｔ）と、ベクトルｗ^ＯＨ（ｔ）と、ブロックＢ５１Ｅから出力されるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））と、ブロックＢ５１Ｆから出力されるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））とが入力される。そして、ブロックＢ５１Ｇは、式（２３）の左辺の各成分を算出する。

　ブロックＢ５１Ｈは、上記の式（２４）の計算を行うブロックである。すなわち、ブロックＢ５１Ｈには、ブロックＢ５１Ｂから出力されるベクトルｙ^Ｈ（ｔ）と、ブロックＢ５１Ｆから出力されるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））とが入力される。そして、ブロックＢ５１Ｇは、式（２４）の左辺の各成分を算出する。

　ここで、ブロックＢ５１ＧとブロックＢ５１Ｈとのそれぞれから出力される値は、ヤコビアン、すなわち、行列Ｈ（ｔ）の各成分に他ならない。

　このように、図５に示したデータフローでは、出力データ生成処理と、ヤコビアンの算出処理とにおいて、ａｃｔ_ｒ（ｔ）及びａｃｔ_ｓ（ｔ）を算出する処理が共通化されている。すなわち、当該データフローは、出力データ生成処理の一部と、重み更新処理の一部とにおける演算処理が共通化されたデータフローである。機械学習装置１は、このようなデータフローに基づいて、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとして深層ＦＯＲＣＥ学習器をエッジデバイス等に実装することができる。その結果、機械学習装置１は、第２活性化関数及び第３活性化関数のそれぞれとして特殊な関数を用いることなく、メモリアクセスの速度、計算速度等の高速化を図ることができる。

　図６は、ブロックＢ５の内部のデータフローの他の具体例を示す図である。図６に示したデータフローは、第２活性化関数ｆ^Ｈが双曲線正接関数であり、且つ、第３活性化関数ｆ^Ｏが恒等関数である場合に成立するデータフローである。また、図６に示したデータフローにも、前述の出力データ生成処理におけるデータフローも含まれている。図６に示したデータフローは、大きく分けてブロックＢ５１Ａと、ブロックＢ５２Ａ～ブロックＢ５２Ｅとの６つのブロックから構成される。なお、当該６つのブロックのそれぞれは、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアを示す。なお、図６において、データフローにおける時系列順は、時刻ｔによって示している。また、図６では、図５に示したブロックと同じ機能を有するブロック（すなわち、ブロックＢ５１Ａ）については、同様の符号を付して説明を省略する。ただし、図６では、ブロックＢ５１Ａは、ａｃｔ_ｒ（ｔ）をブロックＢ５２Ａに出力する。

　ブロックＢ５２Ａは、上記の式（９）の計算を行うブロックである。ただし、ブロックＢ５２Ａは、第２活性化関数として双曲線正接関数を用いて、当該計算を行う。ブロックＢ５２Ａには、ブロックＢ５１Ａから出力されるａｃｔ_ｒ（ｔ）が入力される。そして、ブロックＢ５２Ａは、第２活性化関数として双曲線正接関数を用いてベクトルｙ^Ｈ（ｔ）を算出し、算出したベクトルｙ^Ｈ（ｔ）を出力する。より具体的には、ブロックＢ５２Ａは、算出したベクトルｙ^Ｈ（ｔ）を、ブロックＢ５１ＣとブロックＢ５２Ｃのそれぞれに出力する。

　ブロックＢ５２Ｂは、上記の式（８）の計算を行うブロックである。すなわち、ブロックＢ５２Ｂには、ブロックＢ５１Ｂから出力されるベクトルｙ^Ｈ（ｔ）と、ベクトルｗ^ＯＨ（ｔ）とが入力される。そして、ブロックＢ５２Ｂは、ａｃｔ_ｓ（ｔ）を算出する。ここで、図６に示した例では、第３活性化関数は、恒等関数である。すなわち、図６では、図５に示したブロックＢ５１Ｄに相当するブロックが不要であり、ブロックＢ５２Ｂにより算出されたａｃｔ_ｓ（ｔ）が、ベクトルｙ^Ｏ（ｔ）となる。また、恒等関数の微分は、１である。すなわち、ｆ^Ｏ’（ａｃｔ_ｓ（ｔ））＝１である。このため、図６では、図５に示したブロックＢ５１Ｆに相当するブロックが不要である。

　ブロックＢ５２Ｃは、上記の式（２３）におけるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出するブロックである。ただし、図６に示した例では、第２活性化関数ｆ^Ｈが双曲線正接関数である。この場合、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））は、以下の式（２５）に示すように、ベクトルｙ^Ｈ（ｔ）の２乗によって書き下すことができる。

　このため、図６に示したデータフローは、図５に示したブロックＢ５１Ｅに代えて、ブロックＢ５２Ｃを含むことができる。また、ブロックＢ５２Ｃは、例えば、ルックアップテーブルにすることができる。これは、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））が、ベクトルｙ^Ｈ（ｔ）の２乗によって書き下すことができることによる恩恵の１つである。ブロックＢ５２Ｃは、ブロックＢ５２Ａから出力されるベクトルｙ^Ｈ（ｔ）が入力される。そして、ブロックＢ５２Ｃは、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出（又は特定）する。ブロックＢ５２Ｃは、算出したｆ^Ｈ’（ａｃｔ_ｒ（ｔ））をブロックＢ５２Ｄに出力する。

　ブロックＢ５２Ｄは、上記の式（２３）の計算を行うブロックである。すなわち、ブロックＢ５２Ｄには、ベクトルｙ^Ｉ（ｔ）と、ベクトルｗ^ＯＨ（ｔ）と、ブロックＢ５２Ｃから出力されるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））とが入力される。そして、ブロックＢ５２Ｄは、式（２３）の左辺の各成分を算出する。ブロックＢ５２Ｄは、算出した当該各成分を出力する。なお、図６に示した例では、前述した通り、第３活性化関数ｆ^Ｏが恒等関数である。このため、ブロックＢ５２Ｄにおいて用いるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））は、恒等的に１である。

　ブロックＢ５２Ｅは、上記の式（２４）の計算を行うブロックである。すなわち、ブロックＢ５２Ｅには、ブロックＢ５２Ａから出力されるベクトルｙ^Ｈ（ｔ）が入力される。そして、ブロックＢ５２Ｅは、式（２４）の左辺の各成分を算出する。なお、図６に示した例では、前述した通り、第３活性化関数ｆ^Ｏが恒等関数である。このため、ブロックＢ５２Ｅにおいて用いるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））は、恒等的に１である。

　このように、図６に示したデータフローでは、図５に示したデータフローよりも、ブロックの数を少なくすることができる。これは、図６に示したデータフローに基づいて、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとして深層ＦＯＲＣＥ学習器をエッジデバイス等に実装した場合、機械学習装置１をより簡素に設計することができることを意味している。その結果、当該場合、機械学習装置１は、消費電力を低減することができるとともに、メモリアクセスの速度、計算速度等の高速化を図ることができる。

　図７は、ブロックＢ５の内部のデータフローの更に他の具体例を示す図である。図７に示したデータフローは、第２活性化関数ｆ^Ｈが以下の式（２６）及び式（２７）に示す区分線形関数であり、且つ、第３活性化関数ｆ^Ｏが微分すると恒等関数となる非線形関数である場合に成立するデータフローである。

　上記の式（２６）及び式（２７）におけるγは、第２活性化関数のゲイン（あるいは傾き）を決定するパラメータである。

　また、図７に示したデータフローにも、前述の出力データ生成処理におけるデータフローも含まれている。図７に示したデータフローは、大きく分けてブロックＢ５１Ａ～ブロックＢ５１Ｄと、ブロックＢ５２Ａ～ブロックＢ５２Ｃとの７つのブロックから構成される。なお、当該７つのブロックのそれぞれは、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアを示す。なお、図７において、データフローにおける時系列順は、時刻ｔによって示している。また、図７では、図５に示したブロックと同じ機能を有するブロック（すなわち、ブロックＢ５１Ａ～ブロックＢ５１Ｄ）については、同様の符号を付して説明を省略する。ただし、図６では、ブロックＢ５１Ａは、ａｃｔ_ｒ（ｔ）を、ブロックＢ５３Ａに出力する。また、図６では、ブロックＢ５１Ｂは、ベクトルｙ^Ｈ（ｔ）を、ブロックＢ５１ＣとブロックＢ５３Ｃとのそれぞれに出力する。また、図６では、ブロックＢ５１Ｃは、ａｃｔ_ｓ（ｔ）を、ブロックＢ５１ＤとブロックＢ５３ＢとブロックＢ５３Ｃとのそれぞれに出力する。

　ブロックＢ５３Ａは、上記の式（２３）におけるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出するブロックである。ただし、ブロックＢ５３Ａは、第２活性化関数として上記の式（２６）に示した区分線形関数を用いて、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出する。ブロックＢ５３Ａには、ブロックＢ５１Ａから出力されるａｃｔ_ｒ（ｔ）が入力される。そして、ブロックＢ５３Ａは、ｆ^Ｈ’として上記の式（２７）に示した関数を用いてｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を算出する。ブロックＢ５３Ａは、ｆ^Ｈ’（ａｃｔ_ｒ（ｔ））を、ブロックＢ５３Ｂに出力する。

　ブロックＢ５３Ｂは、上記の式（２３）の計算を行うブロックである。すなわち、ブロックＢ５３Ｂには、ベクトルｙ^Ｉ（ｔ）と、ベクトルｗ^ＯＨ（ｔ）と、ブロックＢ５３Ａから出力されるｆ^Ｈ’（ａｃｔ_ｒ（ｔ））と、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）とが入力される。そして、ブロックＢ５３Ｂは、式（２３）の左辺の各成分を算出する。ブロックＢ５３Ｂは、算出した当該各成分を出力する。なお、図７に示した例では、前述した通り、第３活性化関数ｆ^Ｏが、微分すると恒等関数になる非線形関数である。このため、ブロックＢ５３Ｂにおいて用いるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））は、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）そのものである。

　ブロックＢ５３Ｃは、上記の式（２４）の計算を行うブロックである。すなわち、ブロックＢ５３Ｃには、ブロックＢ５１Ｂから出力されるベクトルｙ^Ｈ（ｔ）と、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）とが入力される。そして、ブロックＢ５３Ｃは、式（２４）の左辺の各成分を算出する。なお、図７に示した例では、前述した通り、第３活性化関数ｆ^Ｏが、微分すると恒等関数になる非線形関数である。このため、ブロックＢ５３Ｃにおいて用いるｆ^Ｏ’（ａｃｔ_ｓ（ｔ））は、ブロックＢ５１Ｃから出力されるａｃｔ_ｓ（ｔ）そのものである。

　このように、図７に示したデータフローでも、図５に示したデータフローよりも、ブロックの数を少なくすることができる。これは、図７に示したデータフローに基づいて、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアとして深層ＦＯＲＣＥ学習器をエッジデバイス等に実装した場合、機械学習装置１をより簡素に設計することができることを意味している。その結果、当該場合、機械学習装置１は、消費電力を低減することができるとともに、メモリアクセスの速度、計算速度等の高速化を図ることができる。

　＜機械学習装置による機械学習の結果＞
　以下、機械学習装置１による機械学習の結果について説明する。

　以下では、機械学習装置１による機械学習の結果について、図８に示した二重振り子の変位の時間的変化を機械学習装置１に機械学習させた結果を例に挙げて説明する。図８は、原点から長さｌ１の棒によって繋がれた質量ｍ１の第１錘と、当該錘と長さｌ２の棒によって繋がれた質量ｍ２の第２錘とによって構成される二重振り子の一例を示す図である。図８に示した二重振り子における第１錘と第２錘とのＸ軸方向及びＹ軸方向それぞれの変位の時間的変化は、運動方程式によって決定論的に記述される。なお、図８において、重力が働く方向は、矢印ｇによって示される方向である。

　図８に示した二重振り子における運動方程式は、第１錘及び第２錘それぞれについて書き下される。その際、第１錘及び第２錘のそれぞれについて書き下された運動方程式における力は、図８に示したＹ軸と棒ｌ１との間の角度θ１と、当該Ｙ軸と棒ｌ２との間の角度θ２と、角度θ１の単位時間あたりの変化である角速度と、角度θ２の単位時間あたりの変化である角速度との４つのパラメータの関数によって示される。

　そこで、我々は、これら４つのパラメータをセンサによって時系列順に検出し、時系列順に検出した当該４つのパラメータを機械学習装置１に４次元の入力データとして入力した。その際、我々は、第１錘及び第２錘それぞれの変位の時間的変化についての教師データを機械学習装置１に予め記憶させておいた。そして、機械学習装置１に所定期間、第１錘及び第２錘それぞれの変位の時間的変化のオンライン学習を行わせた。その結果が、図９及び図１０に示したグラフである。

　図９は、図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させている期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの一例を示す図である。図９に示したグラフの縦軸は、第２錘のＸ軸方向における変位を示す。当該グラフの横軸は、経過時間を示す。なお、図９では、当該期間が、経過時間０～経過時間８００の期間として示されている。

　図９に示したグラフにおけるプロットＰＬＴ１は、教師データのプロットである。また、当該グラフにおけるプロットＰＬＴ２は、出力データのプロットである。図９に示したように、オンライン学習中の機械学習装置１から出力される出力データと教師データとの一致度は、それほど高くない。

　一方、図１０は、図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させた後の期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの一例を示す図である。図１０に示したグラフの縦軸は、第２錘のＸ軸方向における変位を示す。当該グラフの横軸は、経過時間を示す。なお、図１０では、当該期間が、経過時間８００～経過時間１６００の期間として示されている。

　図１０に示したグラフにおけるプロットＰＬＴ１は、教師データのプロットである。また、当該グラフにおけるプロットＰＬＴ３は、出力データのプロットである。図１０に示したように、オンライン学習後の機械学習装置１から出力される出力データと教師データとの一致度は、オンライン学習前と比べて、高くなっている。

　ここで、図９及び図１０に示した例は、第１中間ノードの数が１００個であり、第２中間ノードの数が１０個であり、出力ノードの数が１個である場合において機械学習装置１にオンライン学習を行わせた結果の例である。機械学習装置１が行うオンライン学習の結果は、これらのノードの数によって精度が変わる。

　図１１及び図１２に示した例は、第１中間ノードの数が２０個であり、第２中間ノードの数が１０個であり、出力ノードの数が１個である場合において、図９及び図１０に示したグラフと同様のグラフを機械学習装置１に描かせた場合の結果の例である。

　図１１は、図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させている期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの他の例を示す図である。図１１に示したグラフの縦軸は、第２錘のＸ軸方向における変位を示す。当該グラフの横軸は、経過時間を示す。なお、図１１では、当該期間が、経過時間０～経過時間８００の期間として示されている。

　図１１に示したグラフにおけるプロットＰＬＴ１は、教師データのプロットである。また、当該グラフにおけるプロットＰＬＴ４は、出力データのプロットである。図１１に示したように、オンライン学習中の機械学習装置１から出力される出力データと教師データとの一致度は、それほど高くない。また、図１１に示したように、図１１に示した例におけるオンライン学習中の機械学習装置１から出力される出力データと教師データとの一致度は、図９に示した例におけるオンライン学習中の機械学習装置１から出力される出力データと教師データとの一致度よりも低い。これは、図１１に示した例における第１中間ノードの数が、図９に示した例における第１中間ノードの数の５分の１となっているからである。

　一方、図１２は、図８に示した二重振り子における第２錘のＸ軸方向の変位の時間的変化を機械学習装置１に機械学習させた後の期間において機械学習装置１から出力された出力データの時間的変化をプロットしたグラフの他の例を示す図である。図１２に示したグラフの縦軸は、第２錘のＸ軸方向における変位を示す。当該グラフの横軸は、経過時間を示す。なお、図１２では、当該期間が、経過時間８００～経過時間１６００の期間として示されている。

　図１２に示したグラフにおけるプロットＰＬＴ１は、教師データのプロットである。また、当該グラフにおけるプロットＰＬＴ５は、出力データのプロットである。図１２に示したように、オンライン学習後の機械学習装置１から出力される出力データと教師データとの一致度は、オンライン学習前と比べて、高くなっている。また、図１２に示したように、図１２に示した例におけるオンライン学習中の機械学習装置１から出力される出力データと教師データとの一致度は、図１０に示した例におけるオンライン学習中の機械学習装置１から出力される出力データと教師データと比べて、それほど変化していない。これは、図１２に示した例における第１中間ノードの数が、図９に示した例における第１中間ノードの数の５分の１となっていても、機械学習装置１が行うオンライン学習の精度が高いことを意味する。

　すなわち、機械学習装置１は、深層ＦＯＲＣＥ学習器と拡張カルマンフィルタ法による重み更新処理とによって、第１中間ノードの数を少なくしつつ、オンライン学習の精度を向上させることができる。その結果、機械学習装置１は、製造コストを低減と、機械学習の精度の向上とを両立させることができる。

　以上のように、実施形態に係る機械学習装置は、重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習を行う機械学習装置であって、再帰型ニューラルネットワークは、１以上の入力ノードを有する入力層と、１以上の第１中間ノードを有する第１中間層と、１以上の第２中間ノードを有する第２中間層と、１以上の出力ノードを有する出力層と、を有し、入力ノードと、第１中間ノードと、第２中間ノードと、出力ノードとは、複数のノードのうちの互いに異なるノードであり、第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさに固定されており、機械学習装置は、入力層が１次元以上の入力データを予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行い、出力データ生成処理は、入力層により受け付けた１次元以上の入力データを入力層から第１中間層に出力する第１処理と、第１処理により第１中間層に入力された１次元以上の入力データに応じた１次元以上の第１中間データを第１中間層から第２中間層に出力する第２処理と、第２処理により第２中間層に入力された１次元以上の第１中間データに応じた１次元以上の第２中間データを第２中間層から出力層に出力する第３処理と、第３処理により出力層に入力された１次元以上の第２中間データに応じた１次元以上の出力データを生成する第４処理と、を第１処理、第２処理、第３処理、第４処理の順に行う処理であり、重み更新処理は、拡張カルマンフィルタ法に基づいて導出された式と、１次元以上の第１中間データと、１次元以上の出力データとによって、第１中間ノードと第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、第２中間ノードと出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である。これにより、機械学習装置は、予め決められた順に並ぶ１次元以上の入力データのオンライン学習を行うことができる。

　また、機械学習装置では、第１中間層は、リザボアである、構成が用いられてもよい。

　また、機械学習装置では、拡張カルマンフィルタ法に基づいて導出された式には、活性化関数として、奇関数である非線形関数が含まれている、構成が用いられてもよい。

　また、機械学習装置では、拡張カルマンフィルタ法に基づいて導出された式に含まれる非線形関数は、双曲線正接関数である、構成が用いられてもよい。

　また、機械学習装置では、拡張カルマンフィルタ法に基づいて導出された式は、拡張カルマンフィルタ法におけるカルマンゲイン行列を算出する式を含み、機械学習装置は、当該式に基づいてヤコビアンを算出し、算出したヤコビアンに基づいて、重み更新処理を行う、構成が用いられてもよい。

　また、機械学習装置は、少なくとも、重み更新処理を、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアによって行う、構成が用いられてもよい。

　また、機械学習装置は、出力データ生成処理と重み更新処理をハードウェアによって行い、出力データ生成処理の一部と、重み更新処理の一部とを共通のハードウェアによって行う、構成が用いられてもよい。

１…機械学習装置、１１…演算装置、１２…メモリ、１３…ネットワークインターフェース、Ｌ１…入力層、Ｌ２…第１中間層、Ｌ３…第２中間層、Ｌ４…出力層

Claims

　重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習を行う機械学習装置であって、
　前記再帰型ニューラルネットワークは、
　１以上の入力ノードを有する入力層と、
　１以上の第１中間ノードを有する第１中間層と、
　１以上の第２中間ノードを有する第２中間層と、
　１以上の出力ノードを有する出力層と、
　を有し、
　前記入力ノードと、前記第１中間ノードと、前記第２中間ノードと、前記出力ノードとは、前記複数のノードのうちの互いに異なるノードであり、
　前記第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさに固定されており、
　前記機械学習装置は、前記入力層が前記１次元以上の入力データを前記予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行い、
　前記出力データ生成処理は、
　前記入力層により受け付けた前記１次元以上の入力データを前記入力層から前記第１中間層に出力する第１処理と、
　前記第１処理により前記第１中間層に入力された前記１次元以上の入力データに応じた１次元以上の第１中間データを前記第１中間層から前記第２中間層に出力する第２処理と、
　前記第２処理により前記第２中間層に入力された前記１次元以上の第１中間データに応じた１次元以上の第２中間データを前記第２中間層から前記出力層に出力する第３処理と、
　前記第３処理により前記出力層に入力された前記１次元以上の第２中間データに応じた１次元以上の出力データを生成する第４処理と、
　を前記第１処理、前記第２処理、前記第３処理、前記第４処理の順に行う処理であり、
　前記重み更新処理は、
　拡張カルマンフィルタ法に基づいて導出された式と、前記１次元以上の第１中間データと、前記１次元以上の出力データとによって、前記第１中間ノードと前記第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、前記第２中間ノードと前記出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である、
　機械学習装置。
　前記第１中間層は、リザボアである、
　請求項１に記載の機械学習装置。
　前記式には、活性化関数として、奇関数である非線形関数が含まれている、
　請求項１又は２に記載の機械学習装置。
　前記非線形関数は、双曲線正接関数である、
　請求項３に記載の機械学習装置。
　前記式は、前記拡張カルマンフィルタ法におけるカルマンゲイン行列を算出する式を含み、
　前記式に基づいてヤコビアンを算出し、算出したヤコビアンに基づいて、前記重み更新処理を行う、
　請求項１から４のうちいずれか一項に記載の機械学習装置。
　少なくとも、前記重み更新処理を、ニアメモリとメモリロジックとの少なくとも一方を含むハードウェアによって行う、
　請求項１から５のうちいずれか一項に記載の機械学習装置。
　前記出力データ生成処理と前記重み更新処理を前記ハードウェアによって行い、
　前記出力データ生成処理の一部と、前記重み更新処理の一部とを共通の前記ハードウェアによって行う、
　請求項６に記載の機械学習装置。
　重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習をコンピュータに行わせる機械学習プログラムであって、
　前記再帰型ニューラルネットワークは、
　１以上の入力ノードを有する入力層と、
　１以上の第１中間ノードを有する第１中間層と、
　１以上の第２中間ノードを有する第２中間層と、
　１以上の出力ノードを有する出力層と、
　を有し、
　前記入力ノードと、前記第１中間ノードと、前記第２中間ノードと、前記出力ノードとは、前記複数のノードのうちの互いに異なるノードであり、
　前記第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさに固定されており、
　前記機械学習プログラムは、前記入力層が前記１次元以上の入力データを前記予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行わせ、
　前記出力データ生成処理は、
　前記入力層により受け付けた前記１次元以上の入力データを前記入力層から前記第１中間層に出力する第１処理と、
　前記第１処理により前記第１中間層に入力された前記１次元以上の入力データに応じた１次元以上の第１中間データを前記第１中間層から前記第２中間層に出力する第２処理と、
　前記第２処理により前記第２中間層に入力された前記１次元以上の第１中間データに応じた１次元以上の第２中間データを前記第２中間層から前記出力層に出力する第３処理と、
　前記第３処理により前記出力層に入力された前記１次元以上の第２中間データに応じた１次元以上の出力データを生成する第４処理と、
　を前記第１処理、前記第２処理、前記第３処理、前記第４処理の順に行う処理であり、
　前記重み更新処理は、
　拡張カルマンフィルタ法に基づいて導出された式と、前記１次元以上の第１中間データと、前記１次元以上の出力データとによって、前記第１中間ノードと前記第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、前記第２中間ノードと前記出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である、
　機械学習プログラム。
　重みが割り当てられたエッジによって互いに結合された複数のノードを有する再帰型ニューラルネットワークを用いて、予め決められた順に並ぶ１次元以上の入力データの機械学習を行う機械学習方法であって、
　前記再帰型ニューラルネットワークは、
　１以上の入力ノードを有する入力層と、
　１以上の第１中間ノードを有する第１中間層と、
　１以上の第２中間ノードを有する第２中間層と、
　１以上の出力ノードを有する出力層と、
　を有し、
　前記入力ノードと、前記第１中間ノードと、前記第２中間ノードと、前記出力ノードとは、前記複数のノードのうちの互いに異なるノードであり、
　前記第１中間ノード同士を結合するエッジに割り当てられた重みは、予め決められた大きさに固定されており、
　前記機械学習方法は、前記入力層が前記１次元以上の入力データを前記予め決められた順に受け付ける毎に、出力データ生成処理と重み更新処理とを行う方法であり、
　前記出力データ生成処理は、
　前記入力層により受け付けた前記１次元以上の入力データを前記入力層から前記第１中間層に出力する第１処理と、
　前記第１処理により前記第１中間層に入力された前記１次元以上の入力データに応じた１次元以上の第１中間データを前記第１中間層から前記第２中間層に出力する第２処理と、
　前記第２処理により前記第２中間層に入力された前記１次元以上の第１中間データに応じた１次元以上の第２中間データを前記第２中間層から前記出力層に出力する第３処理と、
　前記第３処理により前記出力層に入力された前記１次元以上の第２中間データに応じた１次元以上の出力データを生成する第４処理と、
　を前記第１処理、前記第２処理、前記第３処理、前記第４処理の順に行う処理であり、
　前記重み更新処理は、
　拡張カルマンフィルタ法に基づいて導出された式と、前記１次元以上の第１中間データと、前記１次元以上の出力データとによって、前記第１中間ノードと前記第２中間ノードとを結合するエッジそれぞれに割り当てられた重みと、前記第２中間ノードと前記出力ノードとを結合するエッジそれぞれに割り当てられた重みとを更新する処理である、
　機械学習方法。
　リザボアコンピューティングとフィードフォワードニューラルネットワークとを組み合わせた再帰型ニューラルネットワークにおいて、重みの更新を拡張カルマンフィルタ法によって行う、
　機械学習装置。