WO2024210013A1

WO2024210013A1 - コンピュータプログラム、情報処理装置、及び情報処理方法

Info

Publication number: WO2024210013A1
Application number: PCT/JP2024/012199
Authority: WO
Inventors: 累輝小林; 大小林; 隆央中村
Original assignee: 東京エレクトロン株式会社
Priority date: 2023-04-06
Filing date: 2024-03-27
Publication date: 2024-10-10

Abstract

コンピュータプログラム、情報処理装置、及び情報処理方法の提供。　基板処理に関する第１モダリティのデータを入力した場合に第１特徴量を出力するよう構成される第１特徴量抽出モデルから、第１特徴量を取得し、第１モダリティとは異なる第２モダリティのデータを入力した場合に第２特徴量を出力するよう構成される第２特徴量抽出モデルから、第２特徴量を取得し、取得した第１特徴量と第２特徴量との間の類似度に応じて、第１特徴量抽出モデル及び第２特徴量抽出モデルの少なくとも一方を学習する処理をコンピュータに実行させる。

Description

コンピュータプログラム、情報処理装置、及び情報処理方法

　本発明は、コンピュータプログラム、情報処理装置、及び情報処理方法に関する。

　近年、ニューラルネットワーク等を用いた人工知能が画像認識、音声認識、言語処理等の様々な分野に利用されている。また、特定様式のデータ（例えば画像データ）のみを扱う人工知能に限らず、画像データ、音声データ、テキストデータ等、一つの対象に対する複数の様式（モダリティ）を取り扱う人工知能の開発も進められている（例えば、特許文献１を参照）。

特表２０１９－５３５０６３号公報

　本開示は、複数のモダリティ間の相互関係を考慮した解析を行えるコンピュータプログラム、情報処理装置、及び情報処理方法を提供する。

　本開示に係るコンピュータプログラムは、基板処理に関する第１モダリティのデータを入力した場合に第１特徴量を出力するよう構成される第１特徴量抽出モデルから、第１特徴量を取得し、前記第１モダリティとは異なる第２モダリティのデータを入力した場合に第２特徴量を出力するよう構成される第２特徴量抽出モデルから、第２特徴量を取得し、取得した第１特徴量と第２特徴量との間の類似度に応じて、前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルの少なくとも一方を学習する処理をコンピュータに実行させるためのコンピュータプログラムである。

　本開示によれば、複数のモダリティ間の相互関係を考慮した解析を行うことができる。

実施の形態に係る情報処理システムの構成を説明する説明図である。情報処理装置の内部構成を示すブロック図である。第１モダリティ及び第２モダリティ間の相互関係を学習する手順について説明するフローチャートである。異常検知処理の実行手順を説明するフローチャートである。第１特徴量と第２特徴量との間に要求する類似度の設定手法を説明する説明図である。実施の形態２における学習手順を示すフローチャートである。要因分析処理の概要を説明する説明図である。実施の形態３に係る情報処理装置が実行する処理の手順を説明するフローチャートである。データ拡張処理の概要を説明する説明図である。実施の形態４に係る情報処理装置が実行する処理の手順を説明するフローチャートである。予測処理の概要を説明する説明図である。実施の形態５に係る情報処理装置が実行する処理の手順を説明するフローチャートである。ノイズ除去処理の概要を説明する説明図である。実施の形態６に係る情報処理装置が実行する処理の手順を説明するフローチャートである。

　以下、図面を参照して一実施形態について説明する。説明において、同一要素又は同一機能を有する要素には同一の符号を付し、重複する説明を省略する。

（実施の形態１）
　図１は実施の形態に係る情報処理システムの構成を説明する説明図である。実施の形態に係る情報処理システムは、互いに通信可能に接続された情報処理装置１００及び基板処理装置２００を備える。

　基板処理装置２００は、例えば、露光装置、エッチング装置、成膜装置、イオン注入装置、アッシング装置、スパッタリング装置などを少なくとも１つ含む半導体製造装置である。代替的に、基板処理装置２００は、液晶ディスプレイパネル、有機ＥＬ（Electro-Luminescence）パネルなどのＦＤＰ（Flat Display Panel）を製造するディスプレイ製造装置であってもよい。

　基板処理装置２００には、プロセスの開始時に、基板の温度、チャンバ内の圧力やガス流量、高周波電源より印加する電圧などの各種の設定値が設定される。設定値は例えばプロセスレシピによって与えられる。基板処理装置２００には、基板の温度、チャンバ内の圧力やガス流量、上部電極や下部電極に印加される電圧、プラズマ発光強度等を計測する各種のセンサや機器が設けられており、プロセスの実行中に各種の計測値が計測される。また、基板処理装置２００では、上述した計測値に限らず、プロセス前後の基板（ウェハ）の画像データやプロセスログなどのデータが随時収集される。基板処理装置２００は、プロセスの実行中に計測される計測値、画像データ、プロセスログ等の様々なモダリティ（様式）のデータを情報処理装置１００へ出力する。

　情報処理装置１００は、基板処理装置２００から様々なモダリティのデータを取得する。情報処理装置１００は、基板処理装置２００から取得したデータに基づき、各種の解析処理を行う。

　従来より、様々なモダリティのデータを用いた解析手法が知られている。例えば、特定のモダリティのデータから特徴量を抽出した上で、当該モダリティの特徴量を利用してタスクを解く解析処理が行われている。

　しかしながら、個々のモダリティの特徴量を利用してタスクを解く従来の手法では、特定のモダリティに依存した解析しか行えず、複数のモダリティがあっても、複数のモダリティ間の相互関係を考慮した解析は行えない。例えば、出来栄えを表すモダリティのデータ（例えば基板の画像データ）を用いて異常検知を行った場合、出来栄えに影響する異常を検知できるが、要因を特定することはできない。また、要因を特定しやすいモダリティ（例えばプロセスログ）で異常を検知した場合、異常の要因を特定できるが、出来栄えに影響する異常を検知することはできない。

　そこで、本実施の形態では、複数のモダリティ間の相互関係を学習し、一のモダリティ（第１モダリティ）に表れる特徴を別のモダリティ（第２モダリティ）で活用して解析処理を行う手法を提案する。実施の形態１では、一例として、第１特徴量抽出モデルＭＤ１、第２特徴量抽出モデルＭＤ２、及び異常検知モデルＭＤ１０を用いて、異常検知を行う構成について説明する。

　第１特徴量抽出モデルＭＤ１は、第１モダリティのデータを入力した場合、当該データの特徴量を出力するよう構成される。第１モダリティのデータは、例えば、ＯＥＳ（Optical Emission Spectrometer）により計測されるプラズマ発光強度の計測データである。第１モダリティのデータは、基板処理に関するデータであればよく、プラズマ発光強度の計測データに限定されない。第１モダリティのデータは、例えば、基板の温度、チャンバ内の圧力やガス流量、上部電極や下部電極に印加される電圧等の計測データや走査電子顕微鏡（SEM : Scanning Electron Microscope）等による観察画像の画像データであってもよく、プロセスログなどのデータであってもよい。

　第１特徴量抽出モデルＭＤ１として、深層学習を含む機械学習の学習モデルを用いることができる。例えば、ＣＮＮ（Convolutional Neural Network）、Ｔｒａｎｓｆｏｒｍｅｒ、ＲＮＮ（Recurrent Neural Networks）、ＬＳＴＭ（Long Short Term Memory）、ＭＬＰ（Multi-Layer Perceptrons）などに基づく学習モデルを用いることができる。代替的に、自己回帰モデル、移動平均モデル、自己回帰移動平均モデルなど、深層学習以外の学習モデルを用いてもよい。第１特徴量抽出モデルＭＤ１に用いる学習モデルは、入力される第１モダリティのデータや解析すべき内容などに応じて適宜設定される。

　第１特徴量抽出モデルＭＤ１は、例えば、入力層、１又は複数の中間層、及び出力層を備え、入力層へのデータの入力に応じて、出力層から特徴量を出力するよう学習される。代替的に、中間層の何れか１つから出力される値を特徴量として抽出してもよい。第１特徴量抽出モデルＭＤ１は、中間層を備えずに、入力層及び出力層のみを備える構成であってもよい。以下では、第１モダリティのデータを第１モーダルデータ、第１特徴量抽出モデルＭＤ１より抽出される特徴量を第１特徴量ともいう。

　第２特徴量抽出モデルＭＤ２は、第２モダリティのデータを入力した場合、当該データの特徴量を出力するよう構成される。第２モダリティのデータは、例えば、ウェハ光学検査システム（ＷＩＳとも呼ばれる）により撮像される基板表面のカラー画像に係る画像データである。第２モダリティのデータは、基板処理に関するデータであればよく、ウェハ光学検査システムによる画像データに限定されない。第２モダリティのデータは、例えば、基板の温度、チャンバ内の圧力やガス流量、上部電極や下部電極に印加される電圧等の計測データやＳＥＭ等による観察画像の画像データであってもよく、プロセスログなどのデータであってもよい。第２モダリティは、第１モダリティとは異なるモダリティであればよい。

　第２特徴量抽出モデルＭＤ２には、第１特徴量抽出モデルＭＤ１と同様に、深層学習を含む機械学習の学習モデルや深層学習以外の学習モデルなど、任意のモデルが用いられる。第２特徴量抽出モデルＭＤ２に用いる学習モデルは、入力される第２モダリティのデータや解析すべき内容などに応じて適宜設定される。以下では、第２モダリティのデータを第２モーダルデータ、第２特徴量抽出モデルＭＤ２より抽出される特徴量を第２特徴量ともいう。

　異常検知モデルＭＤ１０は、第１特徴量又は第２特徴量の入力に応じて、基板処理における異常の有無に関する情報を出力するよう構成されるモデルである。異常検知モデルＭＤ１０には、深層学習を含む機械学習の学習モデルを用いることができる。例えば、ＣＮＮ、Ｔｒａｎｓｆｏｒｍｅｒ、ＲＮＮ、ＬＳＴＭ、ＭＬＰなどに基づく学習モデルを用いることができる。代替的に、自己回帰モデル、移動平均モデル、自己回帰移動平均モデルなど、深層学習以外の学習モデルを用いてもよい。

　本実施の形態では、第１特徴量と第２特徴量との間の類似度に応じて、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の少なくとも一方を学習することにより、モダリティ間の相互関係を学習する。情報処理装置１００は、例えば、モダリティ間の相互関係が学習された第１特徴量抽出モデルＭＤ１を用いて、第１モーダルデータから第１特徴量を抽出し、抽出した第１特徴量を異常検知モデルＭＤ１０に入力して異常検知を行う。この結果、例えば、第１モーダルデータをＯＥＳによる計測データ、第２モーダルデータをＷＩＳによる画像データとした場合、ＯＥＳの計測データのみを用いて、空間情報（画像データより得られる特徴）を加味した異常検知が可能となる。

　図２は情報処理装置１００の内部構成を示すブロック図である。情報処理装置１００は、例えば、制御部１０１、記憶部１０２、通信部１０３、操作部１０４、及び表示部１０５を備える専用又は汎用のコンピュータである。

　制御部１０１は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）などを備える。制御部１０１が備えるＲＯＭには、情報処理装置１００が備えるハードウェア各部の動作を制御する制御プログラム等が記憶される。制御部１０１内のＣＰＵは、ＲＯＭに記憶されている制御プログラムや記憶部１０２に記憶されている後述のコンピュータプログラムを読み込んで実行し、ハードウェア各部の動作を制御することにより、装置全体を本開示の情報処理装置として機能させる。制御部１０１が備えるＲＡＭには、演算の実行中に利用されるデータが一時的に記憶される。

　実施の形態では、制御部１０１がＣＰＵ、ＲＯＭ、及びＲＡＭを備える構成としたが、制御部１０１の構成は上記のものに限定されない。制御部１０１は、例えば、ＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）、ＤＳＰ（Digital Signal Processor）、量子プロセッサ、揮発性又は不揮発性のメモリ等を備える１又は複数の制御回路又は演算回路であってもよい。また、制御部１０１は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を備えてもよい。

　記憶部１０２は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、ＥＥＰＲＯＭ（Electronically Erasable Programmable Read Only Memory）などの記憶装置を備える。記憶部１０２には、制御部１０１によって実行される各種のコンピュータプログラムや制御部１０１によって利用される各種のデータが記憶される。

　記憶部１０２に記憶されるコンピュータプログラム（プログラム製品）は、第１特徴量抽出モデルＭＤ１を含むモデルを生成する処理をコンピュータに実行させるためのモデル生成プログラムＰＧ１、解析処理をコンピュータに実行させるための解析処理プログラムＰＧ２などを含む。これらのコンピュータプログラムは、単一のコンピュータプログラムであってもよく、複数のコンピュータプログラムにより構成されるプログラム群であってもよい。また、上記コンピュータプログラムは、複数のコンピュータにより協働して実行されるものであってもよい。更に、上記コンピュータプログラムは、既存のライブラリを部分的に用いるものであってもよい。

　モデル生成プログラムＰＧ１や解析処理プログラムＰＧ２などのコンピュータプログラムは、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体ＲＭにより提供される。記録媒体ＲＭは、ＣＤ－ＲＯＭ、ＵＳＢメモリ、ＳＤ（Secure Digital）カード、マイクロＳＤカードなどの可搬型メモリである。制御部１０１は、図に示していない読取装置を用いて、記録媒体ＲＭから各種コンピュータプログラムを読み取り、読み取った各種コンピュータプログラムを記憶部１０２に記憶させる。また、記憶部１０２に記憶されるコンピュータプログラムは、通信により提供されてもよい。この場合、制御部１０１は、通信部１０３を介した通信によりコンピュータプログラムをダウンロードし、ダウンロードしたコンピュータプログラムを記憶部１０２に記憶させる。

　また、記憶部１０２には、第１特徴量抽出モデルＭＤ１，第２特徴量抽出モデルＭＤ２，異常検知モデルＭＤ１０などのモデルが記憶される。これらのモデルは、外部装置に格納されてもよい。この場合、情報処理装置１００の制御部１０１は、通信ネットワーク経由で外部装置にアクセスし、基板処理装置２００から取得したデータを外部装置へ送信し、外部装置に実行させた解析結果を通信ネットワーク経由で取得してもよい。

　通信部１０３は、外部装置との間で各種のデータを送受信するための通信インタフェースを備える。通信部１０３の通信インタフェースとして、ＬＡＮ（Local Area Network）などの通信規格に準拠した通信インタフェースを用いることができる。外部装置の一例は、上述した基板処理装置２００である。代替的に、外部装置は、ユーザ端末や外部サーバであってもよい。通信部１０３は、送信すべきデータが制御部１０１から入力された場合、宛先の外部装置へデータを送信し、外部装置から送信されたデータを受信した場合、受信したデータを制御部１０１へ出力する。

　操作部１０４は、タッチパネル、キーボード、スイッチなどの操作デバイスを備え、ユーザ等による各種の操作及び設定を受付ける。制御部１０１は、操作部１０４より与えられる各種の操作情報に基づき適宜の制御を行い、必要に応じて設定情報を記憶部１０２に記憶させる。

　表示部１０５は、液晶モニタや有機ＥＬ（Electro-Luminescence）モニタなどの表示デバイスを備え、制御部１０１からの指示に応じてユーザ等に報知すべき情報を表示する。

　本実施の形態における情報処理装置１００は、単一のコンピュータであってもよく、複数のコンピュータや周辺機器などにより構成されるコンピュータシステムであってもよい。また、情報処理装置１００は、実体が仮想化された仮想マシンであってもよく、クラウドであってもよい。更に、本実施の形態では、情報処理装置１００と基板処理装置２００とを別体として記載したが、情報処理装置１００は基板処理装置２００の内部に設けられてもよい。

　以下、情報処理装置１００の動作について説明する。
　本実施の形態に係る情報処理装置１００は、基板処理装置２００での実運用が開始される前の学習フェーズにおいて、第１モダリティ及び第２モダリティ間の相互関係を学習する。

　図３は第１モダリティ及び第２モダリティ間の相互関係を学習する手順について説明するフローチャートである。相互関係を学習する前の時点において、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２は、それぞれ内部パラメータが設定され、第１モーダルデータ及び第２モーダルデータをそれぞれ入力した場合、第１特徴量及び第２特徴量をそれぞれ抽出する抽出器として用意されているものとする。ここで、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の内部パラメータとは、各モデルの入力層、中間層及び出力層に含まれるノード間の重みやバイアスなどのパラメータである。

　制御部１０１は、記憶部１０２からモデル生成プログラムＰＧ１を読み出して実行することにより、以下の処理を行う。

　制御部１０１は、基板処理装置２００から一組の第１モーダルデータ及び第２モーダルデータを取得する（ステップＳ１０１）。ステップＳ１０１では、例えば、同じレシピの同じステップで観測される第１モーダルデータ及び第２モーダルデータを一組のデータとして取得すればよい。

　制御部１０１は、取得した第１モーダルデータを第１特徴量抽出モデルＭＤ１に入力し、第１特徴量抽出モデルＭＤ１による演算を実行して第１特徴量を抽出する（ステップＳ１０２）。同様に、制御部１０１は、取得した第２モーダルデータを第２特徴量抽出モデルＭＤ２に入力し、第２特徴量抽出モデルＭＤ２による演算を実行して第２特徴量を抽出する（ステップＳ１０３）。本フローチャートでは、第１特徴量を抽出した後に第２特徴量を抽出する手順としたが、これらの手順は前後してもよく、同時並行的に実施されてもよい。

　制御部１０１は、ステップＳ１０２で抽出した特徴量と、ステップＳ１０３で抽出した特徴量との間の類似度を算出する（ステップＳ１０４）。類似度は、各モーダルデータから抽出した特徴量同士がどれほど近しいか又は遠いかの指標である。具体的には、類似度は、平均二乗誤差（MSE : Mean Squared Error）やコサイン類似度といった公知の手法を用いて算出される。例えば、第１特徴量をｘ、第２特徴量をｙと表した場合（ｘ，ｙはベクトル）、平均二乗誤差は数１によって算出され、コサイン類似度は数２によって算出される。

　制御部１０１は、算出した類似度が閾値未満であるか否かを判断する（ステップＳ１０５）。閾値は事前に設定され、記憶部１０２に記憶されているものとする。制御部１０１は、ステップＳ１０４で算出した類似度と、記憶部１０２に記憶されている閾値とを比較し、算出した類似度が閾値未満であるか否かを判断する。

　算出した類似度が閾値以上であると判断した場合（Ｓ１０５：ＮＯ）、制御部１０１は、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の内部パラメータ（ノード間の重み及びバイアス）を更新し（ステップＳ１０６）、処理をステップＳ１０１へ戻し、学習を継続する。制御部１０１は、各モデルの出力層から入力層に向かって、ノード間の重み及びバイアスを順次更新する誤差逆伝搬法を用いて、学習を進めることができる。

　制御部１０１は、最急降下法などの勾配効果法により誤差関数（類似度）を最小化する過程で、誤差関数（類似度）が閾値未満となった場合（Ｓ１０５：ＹＥＳ）、学習が完了したと判断する。このとき、第１モダリティ及び第２モダリティ間の相互関係を学習した第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２が得られるので、制御部１０１は、これらを学習済みのモデルとして記憶部１０２に記憶させる（ステップＳ１０７）。なお、制御部１０１は、過学習の問題を避けるために、交差検定、早期打ち切りなどの手法を取り入れ、適切なタイミングにて学習を終了させてもよい。

　図３に示すフローチャートでは、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の双方を学習する手順としたが、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の何れか一方を固定し、他方を学習する手順としてもよい。例えば、第２特徴量抽出モデルＭＤ２を公知の手法を用いて事前に学習しておき、第２特徴量抽出モデルＭＤ２から抽出される第２特徴量と、第１特徴量抽出モデルＭＤ１から抽出される第１特徴量との類似度に応じて、第１特徴量抽出モデルＭＤ１を学習（第２特徴量抽出モデルＭＤ２の内部パラメータについては固定）してもよい。同様に、第１特徴量抽出モデルＭＤ１を事前学習しておき、特徴量同士の類似度に応じて、第２特徴量抽出モデルＭＤ２を学習（第１特徴量抽出モデルＭＤ１については固定）してもよい。

　実施の形態１に係る情報処理装置１００は、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の学習が完了した後の運用フェーズにおいて、異常検知を行う。

　図４は異常検知処理の実行手順を説明するフローチャートである。制御部１０１は、記憶部１０２から解析処理プログラムＰＧ２を読み出して実行することにより、以下の処理を行う。

　制御部１０１は、基板処理の実行中に基板処理装置２００にて観測される第１モーダルデータを取得する（ステップＳ１２１）。制御部１０１は、取得した第１モーダルデータを第１特徴量抽出モデルＭＤ１に入力し、第１特徴量抽出モデルＭＤ１による演算を実行して第１特徴量を抽出する（ステップＳ１２２）。

　制御部１０１は、抽出した第１特徴量に基づき、基板処理における異常の有無を判断する（ステップＳ１２３）。制御部１０１は、例えば、第１特徴量が設定値や設定範囲から外れるか否かを判断することによって異常の有無を判断する。代替的に、第１モーダルデータが正常である場合の第１特徴量を記憶部１０２に記憶させておき、ステップＳ１２２で抽出した第１特徴量と、記憶部１０２に記憶させておいた正常時の第１特徴量とを比較し、差分が設定値又は設定量以上であれば異常と判断してもよい。制御部１０１は、これらの手法に限らず、任意の手法を用いて異常を検知すればよい。

　制御部１０１は、ステップＳ１２３で異常ありと判断した場合（Ｓ１２３：ＹＥＳ）、基板処理に異常がある旨の情報を出力し（ステップＳ１２４）、ステップＳ１２３で異常なしと判断した場合（Ｓ１２３：ＮＯ）、基板処理に異常がない旨の情報を出力する（ステップＳ１２５）。具体的には、制御部１０１は、異常がある旨（若しくは異常がない旨）の情報を表示部１０５に表示させる。代替的に、異常がある旨（若しくは異常がない旨）の情報を通信部１０３よりユーザ端末に通知してもよい。

　図４のフローチャートでは、第１モーダルデータのみを用いて基板処理における異常の有無を判断している。本実施の形態では、学習フェーズにおいて第１モダリティと第２モダリティとの間の相互関係を学習してあるので、第１モーダルデータのみを用いて異常検知を行ったとしても、第２モダリティの情報を加味した異常検知が可能となる。例えば、ＯＥＳ（第１モダリティ）とＷＩＳ（第２モダリティ）との間の相互関係を学習してある場合、例えば、ＯＥＳの計測データのみを用いた場合であっても、ＷＩＳより得られる空間情報を加味した異常検知が可能となる。

（実施の形態２）
　実施の形態２では、基板処理に関する複数の実験を通じて、複数のモダリティ間の相互関係を学習する構成について説明する。

　図５は第１特徴量と第２特徴量との間に要求する類似度の設定手法を説明する説明図である。本実施の形態２に係る情報処理装置１００は、基板処理に関する参照データを用いて、第１特徴量と第２特徴量との間に要求する類似度を設定する。参照データとして、例えば、実験手順を定めるレシピ内の設定値を用いることができる。

　図５の例は、第１特徴量抽出モデルＭＤ１から得られる第１特徴量と、第２特徴量抽出モデルＭＤ２から得られる第２特徴量との間に要求する類似度の高低を白黒の濃淡により示している。この例では、レシピ内に規定されているガスＡに関するパラーメタ（流速、流量、圧力等）が参照データとして用いられている。第１モーダルデータが得られたときのガスＡに関するパラメータと、第２モーダルデータが得られたときのガスＡに関するパラメータとの差の絶対値が相対的に小さい（若しくは相対的に大きい）場合、第１特徴量と第２特徴量との間に要求する類似度は、高く（若しくは低く）設定される。

　本実施の形態では、参照データとしてレシピを用いた例について説明するが、レシピに限らず、計測された出来栄えデータ、他のモーダルデータ、ログデータなどを用いることが可能である。

　情報処理装置１００の制御部１０１は、第１特徴量と第２特徴量との間に要求する類似度の高低に応じて、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の少なくとも一方を学習する。すなわち、２つのパラメータの差が小さければ、制御部１０１は、第１特徴量と第２特徴量との間の類似度が高くなるように、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の少なくとも一方を学習する。また、２つのパラメータの差が小さければ、制御部１０１は、第１特徴量と第２特徴量との間の類似度が低くなるように、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の少なくとも一方を学習する。

　説明のために、図５の例では、第１特徴量と第２特徴量との間に要求する類似度を白黒の濃淡により表現したが、実際にはテーブルや関数によって与えられるとよい。制御部１０１は、第１特徴量及び第２特徴量を用いて計算される類似度と、参照データを基に設定される類似度（第１特徴量及び第２特徴量間に要求する類似度）とを比較し、要求する類似度を満たすように、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の少なくとも一方を学習する。

　図６は実施の形態２における学習手順を示すフローチャートである。制御部１０１は、実施の形態１と同様の手順にて、一組の第１モーダルデータ及び第２モーダルデータを取得し（ステップＳ２０１）、それぞれから第１特徴量及び第２特徴量を抽出する（ステップＳ２０２，Ｓ２０３）。制御部１０１は、ステップＳ２０２で抽出した第１特徴量と、ステップＳ２０３で抽出した第２特徴量との間の類似度を算出する（ステップＳ２０４）。類似度は、平均二乗誤差やコサイン類似度などの公知の手法を用いて算出される。

　次いで、制御部１０１は、基板処理装置２００から参照データを取得する（ステップＳ２０５）。制御部１０１は、取得した参照データに基づき、第１特徴量及び第２特徴量間に要求する類似度を設定する（ステップＳ２０６）。制御部１０１は、例えば第１モーダルデータが得られた際の参照データと、第２モーダルデータが得られた際の参照データとを比較し、それらの差に基づいて第１特徴量及び第２特徴量間に要求する類似度を設定すればよい。

　制御部１０１は、ステップＳ２０４で算出した類似度と、ステップＳ２０６で設定した類似度とを比較し、算出した類似度が要求を満たすか否かを判断する（ステップＳ２０７）。要求を満たさないと判断した場合（Ｓ２０７：ＮＯ）、制御部１０１は、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２の内部パラメータ（ノード間の重み及びバイアス）を更新し（ステップＳ２０８）、処理をステップＳ２０１へ戻し、学習を継続する。制御部１０１は、各モデルの出力層から入力層に向かって、ノード間の重み及びバイアスを順次更新する誤差逆伝搬法を用いて、学習を進めることができる。

　制御部１０１は、要求を満たすと判断した場合（Ｓ２０７：ＹＥＳ）、学習が完了したと判断する。このとき、第１モダリティ及び第２モダリティ間の相互関係を学習した第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２が得られるので、制御部１０１は、これらを学習済みのモデルとして記憶部１０２に記憶させる（ステップＳ２０９）。なお、制御部１０１は、過学習の問題を避けるために、交差検定、早期打ち切りなどの手法を取り入れ、適切なタイミングにて学習を終了させてもよい。

　以上のように、実施の形態２では、基板処理における参照データの類似度を考慮した特徴量抽出が可能となり、複数の実験結果を利用して学習を進めることができる。

（実施の形態３）
　実施の形態３では、異常検知モデルＭＤ１０により異常を検知した場合、その要因分析を行う構成について説明する。

　図７は要因分析処理の概要を説明する説明図である。実施の形態３に係る情報処理装置１００は、上述した第１特徴量抽出モデルＭＤ１、第２特徴量抽出モデルＭＤ２、異常検知モデルＭＤ１０に加え、要因分析器ＭＤ１１を備える。

　要因分析器ＭＤ１１は、異常検知モデルＭＤ１０を用いて基板処理における異常を検知した場合、異常な特徴量から具体的な異常箇所を特定する。例えば、要因分析器ＭＤ１１は、異常に対する第１特徴量又は第２特徴量の寄与度を算出し、算出した寄与度に基づき、第１モーダルデータ又は第２モーダルデータの異常箇所を特定する。重要度の算出には、Ｌｉｍｅ（Local Interpretable Model-Agnostic Explanations）、ＳＨＡＰ（SHapley Additive exPlanations）、ＣＡＭ（Class Activation Mapping）などの公知の手法が用いられる。ＬｉｍｅやＳＨＡＰは、入力を減らした際に、出力がどれほど変化したのかを特定し、出力が大きく変化したものほど重要度が高いと判断する手法である。ＣＡＭは、学習時の誤差逆伝搬を利用して重要度を算出する手法である。

　図８は実施の形態３に係る情報処理装置１００が実行する処理の手順を説明するフローチャートである。制御部１０１は、実施の形態１と同様の手順にて、異常検知処理を実行し、異常を検知したか否かを判断する（ステップＳ３０１）。異常を検知しない場合（Ｓ３０１：ＮＯ）、制御部１０１は、以下の処理を実行することなく本フローチャートによる処理を終了する。

　異常を検知したと判断した場合（Ｓ３０１：ＹＥＳ）、制御部１０１は、異常に対する第１特徴量又は第２特徴量の寄与度を算出する（ステップＳ３０２）。制御部１０１は、Ｌｉｍｅ，ＳＨＡＰ，ＣＡＭなどの公知の手法を用いて、異常に対する第１特徴量又は第２特徴量の寄与度を算出することができる。

　制御部１０１は、算出した寄与度に基づき、異常への寄与度が高い第１モーダルデータ又は第２モーダルデータの箇所を特定する（ステップＳ３０３）。

　制御部１０１は、特定した異常箇所の情報を出力する（ステップＳ３０４）。具体的には、制御部１０１は、特定した異常箇所の情報を表示部１０５に表示させる。代替的に、特定した異常箇所の情報を通信部１０３よりユーザ端末に通知してもよい。

　以上のように、実施の形態３では、異常検知モデルＭＤ１０により異常を検知した場合、その要因分析が行える。

（実施の形態４）
　実施の形態４では、データ拡張処理について説明する。

　図９はデータ拡張処理の概要を説明する説明図である。実施の形態４に係る情報処理装置１００は、上述した第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２に加え、データ生成モデルＭＤ２０を備える。

　実施の形態４におけるデータ生成モデルＭＤ２０は、第２特徴量の入力に応じて、第２モーダルデータの再現データを生成するように学習される。データ生成モデルＭＤ２０には、ＶＡＥ（Variable Auto-Encoder）などの公知のモデルを利用することができる。ＶＡＥは、入力データを特徴量に圧縮し、その特徴量を元のデータに戻すという仕組みのオートエンコーダであり、特徴量に対して確率分布を導入することにより未知のデータを確率的に生成できるようにしたモデルである。本実施の形態では、入力データを特徴量に圧縮する処理を第２特徴量抽出モデルＭＤ２により実行すればよい。

　なお、データ生成モデルＭＤ２０は公知の手法を用いて生成される。例えば、データ生成モデルＭＤ２０は、第２特徴量抽出モデルＭＤ２への入力データと、データ生成モデルＭＤ２０からの出力データとを比較し、その比較結果に応じて、モデルの内部パラメータを更新する処理を繰り返し実行することにより生成される。

　データ生成モデルＭＤ２０は、ＶＡＥに限らず、ＧＡＮ（Generative Adversarial Network）、ＳｅｇＮｅｔ、ＦＣＮ（Fully Convolutional Network）、Ｕ－Ｎｅｔ（U-Shaped Network）、ＰＳＰＮｅｔ（Pyramid Scene Parsing Network）などを利用したモデルであってもよい。

　実施の形態４では、第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２は共通の特徴量を含むように学習される。具体的には、実施の形態１と同様の手法を用いて、第１モダリティ及び第２モダリティ間の相互関係が学習されることにより、第１特徴量抽出モデルＭＤ１から抽出される第１特徴量と、第２特徴量抽出モデルＭＤ２から抽出される第２特徴量とが共通の特徴量を含むように学習される。

　実施の形態４では、第１特徴量及び第２特徴量が共通の特徴量を含むため、第１特徴量をデータ生成モデルＭＤ２０に入力した場合であっても、第２モーダルデータの再現データを生成することができる。すなわち、第１モーダルデータをＯＥＳによるプラズマ発光強度の計測データ、第２モーダルデータをＷＩＳによる画像データとすると、プラズマ発光強度の計測データからＷＩＳによる画像データを生成することができる。

　図１０は実施の形態４に係る情報処理装置１００が実行する処理の手順を説明するフローチャートである。情報処理装置１００の記憶部１０２には、第１モダリティ及び第２モダリティ間の相互関係を学習することにより得られる第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２が記憶されているものとする。また、記憶部１０２には、第１特徴量又は第２特徴量を入力した場合、第２モーダルの再現データを出力するよう学習されたデータ生成モデルＭＤ２０が記憶されているものとする。

　制御部１０１は、基板処理装置２００から第１モーダルデータを取得する（ステップＳ４０１）。制御部１０１は、取得した第１モーダルデータを第１特徴量抽出モデルＭＤ１に入力し、第１特徴量抽出モデルＭＤ１による演算を実行することにより、第１特徴量を抽出する（ステップＳ４０２）。

　制御部１０１は、第１特徴量抽出モデルＭＤ１を用いて抽出した第１特徴量をデータ生成モデルＭＤ２０に入力して、データ生成モデルＭＤ２０による演算を実行し、第２モーダルの再現データを生成する（ステップＳ４０３）。

　以上のように、実施の形態４では、第１モーダルデータから、第２モーダルの再現データを生成することができる。実施の形態４では、取得が容易なモーダルのデータ（例えばＯＥＳによるプラズマ発光強度のデータ）から、相対的に取得が困難なデータ（例えばＳＥＭ画像のような出来栄えを表すデータ）を生成することができる。また、相対的に取得が困難なデータを生成させることができるので、これらのデータを訓練データに用いることにより、任意の機械学習モデルの汎化・精度向上が望める。

（実施の形態５）
　実施の形態５では、出来栄えの予測処理について説明する。

　図１１は予測処理の概要を説明する説明図である。実施の形態５に係る情報処理装置１００は、上述した第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２に加え、予測モデルＭＤ３０を備える。

　第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルは、実施の形態４と同様に、第１特徴量及び第２特徴量が共通の特徴量を含むように学習される。実施の形態５における第１モーダルデータは、例えばＯＥＳによるプラズマ発光強度の計測データであり、第２モーダルデータは、例えば基板処理の出来栄えを表すＳＥＭ画像データである。

　予測モデルＭＤ３０は、第２モーダルデータ（ＳＥＭ画像データ）を入力した場合、ＳＥＭ画像の再現データを出力するように学習される。予測モデルＭＤ３０には、実施の形態４と同様に、ＶＡＥ、ＧＡＮ、ＳｅｇＮｅｔ、ＦＣＮ、Ｕ－Ｎｅｔ、ＰＳＰＮｅｔなどを利用したモデルである。予測モデルＭＤ３０は公知の手法を用いて生成される。例えば、予測モデルＭＤ３０は、第２特徴量抽出モデルＭＤ２への入力データと、予測モデルＭＤ３０からの出力データとを比較し、その比較結果に応じて、モデルの内部パラメータを更新する処理を繰り返し実行することにより生成される。

　実施の形態５では、第１特徴量と第２特徴量とが共通の特徴量を含むため、第１特徴量を予測モデルＭＤ３０に入力した場合、第２モーダルの再現データを生成することができる。実施の形態５では、ＳＥＭ画像のような相対的に取得が困難なモーダルデータが得られない場合であっても、プラズマ発光強度のような取得が容易なモーダルデータを用いることによって、出来栄えを予測することができる。

　また、実施の形態５では、出来栄えを予測できるので、予測した出来栄え（再現データ）と、所望の出来栄え（理想形状のデータ）とを比較し、その比較結果に応じて、基板処理におけるパラメータを調整してもよい。ここで、基板処理におけるパラメータとは、チャンバ内の温度、ガス圧、ガス流量、上部電極や下部電極に印加する高周波電圧の電圧値などの装置パラメータ若しくはレシピの設定値である。

　パラメータの調整にはルールベースの調整手法を用いられる。例えば、予測した再現データから推定されるパターン形状と理想形状とを比較し、予測したパターン形状と理想形状との差がＸ％である場合、高周波電圧の電圧値などの設定値をＹ％（ＹはＸの関数）だけ変化させるといった規則に従って、パラメータを調整する。パラメータの調整手法は、ルールベースに限らず、機械学習モデルや統計モデルなどの任意の手法を用いてもよい。

　図１２は実施の形態５に係る情報処理装置１００が実行する処理の手順を説明するフローチャートである。情報処理装置１００の記憶部１０２には、第１モダリティ及び第２モダリティ間の相互関係を学習することにより得られる第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２が記憶されているものとする。また、記憶部１０２には、第１特徴量又は第２特徴量を入力した場合、基板処理における出来栄えの情報（第２モーダルの再現データ）を出力するよう学習された予測モデルＭＤ３０が記憶されているものとする。

　制御部１０１は、基板処理装置２００から第１モーダルデータを取得する（ステップＳ５０１）。第１モーダルデータは、例えばＯＥＳによるプラズマ発光強度の計測データである。制御部１０１は、取得した第１モーダルデータを第１特徴量抽出モデルＭＤ１に入力し、第１特徴量抽出モデルＭＤ１による演算を実行することにより、第１特徴量を抽出する（ステップＳ５０２）。

　制御部１０１は、第１特徴量抽出モデルＭＤ１を用いて抽出した第１特徴量を予測モデルＭＤ３０に入力し、予測モデルＭＤ３０による演算を実行することにより、第２モーダルの再現データを生成する（ステップＳ５０３）。第２モーダルの再現データは、例えばＳＥＭ画像データであり、基板処理における出来栄えを表す。

　制御部１０１は、予測した再現データから推定されるパターン形状と理想形状とを比較し（ステップＳ５０４）、比較結果に応じて、基板処理におけるパラメータを調整する（ステップＳ５０５）。

　以上のように、実施の形態５では、相対的に取得が困難なＳＥＭ画像を用いずとも、ＯＥＳのような比較的取得が容易なモーダルデータを用いて、出来栄えを予測することができる。また、実施の形態５では、出来栄えが所望の出来栄えに近づくように基板処理におけるパラメータを調整することができる。

（実施の形態６）
　実施の形態６では、ノイズ除去処理について説明する。

　図１３はノイズ除去処理の概要を説明する説明図である。実施の形態６に係る情報処理装置１００は、上述した第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２に加え、ノイズ除去モデルＭＤ４０を備える。

　第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルは、実施の形態４と同様に、第１特徴量及び第２特徴量が共通の特徴量を含むように学習される。実施の形態６における第１モーダルデータは、例えばＯＥＳによるプラズマ発光強度の計測データであり、第２モーダルデータは、例えばＷＩＳによる画像データである。

　ノイズ除去モデルＭＤ４０は、第２モーダルデータを入力した場合、ノイズのない第２モーダルの再現データを出力するように学習される。ノイズは、データにおける欠損値、外れ値、加算性白色ガウスノイズ（AWGN : Additive White Gaussian Noise）などである。ノイズ除去モデルＭＤ４０は、実施の形態４と同様に、ＶＡＥ、ＧＡＮ、ＳｅｇＮｅｔ、ＦＣＮ、Ｕ－Ｎｅｔ、ＰＳＰＮｅｔなどを利用したモデルである。ノイズ除去モデルＭＤ４０は公知の手法を用いて生成される。例えば、ノイズ除去モデルＭＤ４０は、ノイズのない入力データ（欠損等のない第２モーダルデータ）と、ノイズ除去モデルＭＤ４０からの出力データとを比較し、その比較結果に応じて、モデルの内部パラメータを更新する処理を繰り返し実行することにより生成される。

　実施の形態６では、第１特徴量と第２特徴量とが共通の特徴量を含むため、第１特徴量（若しくは第１特徴量及び第２特徴量の組み合わせ）をノイズ除去モデルＭＤ４０に入力した場合、ノイズのない第２モーダルの再現データを生成することができる。

　図１４は実施の形態６に係る情報処理装置１００が実行する処理の手順を説明するフローチャートである。情報処理装置１００の記憶部１０２には、第１モダリティ及び第２モダリティ間の相互関係を学習することにより得られる第１特徴量抽出モデルＭＤ１及び第２特徴量抽出モデルＭＤ２が記憶されているものとする。また、記憶部１０２には、第１特徴量又は第２特徴量の少なくとも一方を入力した場合、ノイズのない第２モーダルの再現データを出力するよう学習されたノイズ除去モデルＭＤ４０が記憶されているものとする。

　制御部１０１は、基板処理装置２００から第１モーダルデータを取得する（ステップＳ６０１）。第１モーダルデータは、例えばＯＥＳによるプラズマ発光強度の計測データである。制御部１０１は、取得した第１モーダルデータを第１特徴量抽出モデルＭＤ１に入力し、第１特徴量抽出モデルＭＤ１による演算を実行することにより、第１特徴量を抽出する（ステップＳ６０２）。

　制御部１０１は、第１特徴量抽出モデルＭＤ１を用いて抽出した第１特徴量をノイズ除去モデルＭＤ４０に入力し、ノイズ除去モデルＭＤ４０による演算を実行することにより、ノイズのない第２モーダルの再現データを生成する（ステップＳ６０３）。第２モーダルの再現データは、例えばＷＩＳによる画像データである。

　以上のように、実施の形態６では、入力（第１モーダルデータ）にノイズが含まれている場合であっても、ノイズのない第２モーダルデータを再現できる。

　今回開示された実施形態は、全ての点において例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。

　例えば、実施の形態１～６では、２種類のモダリティ間の相互関係を学習した特徴量抽出モデルを生成する構成としたが、３種類以上のモダリティ間の相互関係を学習した特徴量抽出モデルを生成する構成としてもよい。

　各実施形態に記載した事項は相互に組み合わせることが可能である。また、請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、請求の範囲には他の２以上のクレームを引用するクレームを記載する形式（マルチクレーム形式）を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム（マルチマルチクレーム）を記載する形式を用いて記載してもよい。

　１００　情報処理装置
　１０１　制御部
　１０２　記憶部
　１０３　通信部
　１０４　操作部
　１０５　表示部
　２００　基板処理装置
　ＰＧ１　モデル生成プログラム
　ＰＧ２　解析処理プログラム
　ＭＤ１　第１特徴量抽出モデル
　ＭＤ２　第２特徴量抽出モデル
　ＭＤ１０　異常検知モデル
　ＲＭ　記録媒体

Claims

　基板処理に関する第１モダリティのデータを入力した場合に第１特徴量を出力するよう構成される第１特徴量抽出モデルから、第１特徴量を取得し、
　前記第１モダリティとは異なる第２モダリティのデータを入力した場合に第２特徴量を出力するよう構成される第２特徴量抽出モデルから、第２特徴量を取得し、
　取得した第１特徴量と第２特徴量との間の類似度に応じて、前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルの少なくとも一方を学習する
　処理をコンピュータに実行させるためのコンピュータプログラム。
　前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルの一方を固定し、他方を前記類似度が高くなるように学習する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記基板処理に関する参照データを取得し、
　取得した参照データに基づき、前記第１特徴量と前記第２特徴量との間に要求する類似度を設定する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記第１特徴量又は前記第２特徴量の入力に応じて前記基板処理における異常の有無に関する情報を出力するよう構成される異常検知モデルを用いて、前記基板処理における異常を検知する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記異常に対する前記第１特徴量又は前記第２特徴量の寄与度を算出し、
　算出した寄与度に基づき、前記第１モダリティのデータ又は前記第２モダリティのデータにおける異常箇所を特定する
　処理を前記コンピュータに実行させるための請求項４記載のコンピュータプログラム。
　前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルは、前記第１特徴量と前記第２特徴量とが共通の特徴量を含むように学習されており、
　前記第１特徴量の入力に応じて前記第１モダリティの再現データを出力するよう構成されるデータ生成モデルに、前記第２特徴量を入力して、前記第１モダリティの再現データを生成する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記第１特徴量又は前記第２特徴量の入力に応じて前記基板処理における出来栄えに関する情報を出力するよう構成される予測モデルを用いて、前記基板処理における出来栄えを予測する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記予測モデルを用いて予測した出来栄えと所望の出来栄えとを比較し、
　比較結果に基づき、基板処理におけるパラメータを調整する
　処理を前記コンピュータに実行させるための請求項７記載のコンピュータプログラム。
　前記第１特徴量又は前記第２特徴量の入力に応じてノイズを除去した第２モダリティのデータを出力するよう構成されるノイズ除去モデルを用いて、ノイズを除去した第２モダリティのデータを生成する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　記憶部と、
　演算部と
　を備え、
　前記記憶部は、基板処理に関する第１モダリティのデータを入力した場合に第１特徴量を出力するよう構成される第１特徴量抽出モデルと、前記第１モダリティとは異なる第２モダリティのデータを入力した場合に第２特徴量を出力するよう構成される第２特徴量抽出モデルとを記憶してあり、
　前記演算部は、前記第１特徴量抽出モデルより得られる第１特徴量と、前記第２特徴量抽出モデルより得られる第２特徴量との類似度に応じて、前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルの少なくとも一方を学習する
　情報処理装置。
　基板処理に関する第１モダリティのデータを入力した場合に第１特徴量を出力するよう構成される第１特徴量抽出モデルから、第１特徴量を取得し、
　前記第１モダリティとは異なる第２モダリティのデータを入力した場合に第２特徴量を出力するよう構成される第２特徴量抽出モデルから、第２特徴量を取得し、
　取得した第１特徴量と第２特徴量との間の類似度に応じて、前記第１特徴量抽出モデル及び前記第２特徴量抽出モデルの少なくとも一方を学習する
　処理をコンピュータにより実行する情報処理方法。