JP2021533450A - 機械学習のためのハイパーパラメータの識別および適用 - Google Patents
機械学習のためのハイパーパラメータの識別および適用 Download PDFInfo
- Publication number
- JP2021533450A JP2021533450A JP2021504489A JP2021504489A JP2021533450A JP 2021533450 A JP2021533450 A JP 2021533450A JP 2021504489 A JP2021504489 A JP 2021504489A JP 2021504489 A JP2021504489 A JP 2021504489A JP 2021533450 A JP2021533450 A JP 2021533450A
- Authority
- JP
- Japan
- Prior art keywords
- machine learning
- learning model
- hyperparameters
- hyperparameter
- version
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000010801 machine learning Methods 0.000 title claims abstract description 261
- 238000000034 method Methods 0.000 claims abstract description 99
- 239000002245 particle Substances 0.000 claims description 23
- 238000012549 training Methods 0.000 claims description 20
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000004422 calculation algorithm Methods 0.000 description 30
- 238000004590 computer program Methods 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000007796 conventional method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/048—Fuzzy inferencing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Automation & Control Theory (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
選択された機械学習モデルの第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのあるハイパーパラメータと共通である選択された機械学習モデルの第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて、本方法は、各関連するハイパーパラメータについての識別された影響度に基づいて、決定された値の範囲から、ハイパーパラメータ値の第1のグループを選択することを含んでいてもよく、選択された機械学習モデルの第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのあるハイパーパラメータと共通でない選択された機械学習モデルの第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて、本方法は、各関連するハイパーパラメータについての識別された影響度に基づいて、ハイパーパラメータ値の第2のグループを選択することを含んでいてもよい。
本方法はさらに、ハイパーパラメータ値の第1の選択されたグループ、ハイパーパラメータ値の第2の選択されたグループ、および前記データセットを使用して、選択された機械学習モデルの第1のバージョンをトレーニングすることを含んでいてもよい。
メタデータは、トレーニング集合のサイズ、データセットの形、データセット内の特徴の数、データセット内の諸データ・フィールドの諸タイプの割合、分類問題のタイプ、データセット内のデータ・フィールドの諸タイプの分散、およびデータセットがある統計分布に従うかどうかの指標から選択された少なくとも1つを含んでいてもよい。
本方法は、入力としてのメタデータに基づいて二次機械学習モデルを実行することを含んでいてもよい。二次機械学習モデルは、選択された機械学習モデルの第1のバージョンの選択を返し、選択された機械学習モデルの第1のバージョンと一緒に使用するための好適な機械学習ハイパーパラメータ値を返す。
前記一つまたは複数のパフォーマンス・メトリックは、確度(accuracy)、誤差(error)、精度(precision)、再現率(recall)、受信者動作特性(receiver operating characteristic、ROC)曲線の下の面積、および精度再現率曲線(precision recall curve)の下の面積のうちの少なくとも1つを含んでいてもよい。
本方法は、さらに、入力としての選択された機械学習モデルの第1のバージョンに関連する前記複数のハイパーパラメータを使用して二次機械学習モデルを実行することを含んでいてもよく、二次機械学習モデルは、選択された機械学習モデルの第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に応じて、前記複数のハイパーパラメータのランク付けを返す。
本方法は、さらに、前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を探索に基づいて識別することを含んでいてもよく、探索は可変の粒度を有し、探索の粒度は、前記複数のハイパーパラメータのそれぞれの、選択された機械学習モデルの第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する。
本方法は、さらに、選択された機械学習モデルの第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含んでいてもよく、探索は可変の粒度を有し、探索の粒度は、前記複数のハイパーパラメータのそれぞれの、選択された機械学習モデルの第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する。
本方法は、さらに、選択された機械学習モデルの第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含んでいてもよく、探索は可変の粒度を有し、探索の粒度は、前記複数のハイパーパラメータのそれぞれの、選択された機械学習モデルの第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する。
閾値のサイズは、前記一つまたは複数の以前に記憶されたハイパーパラメータの、選択された機械学習モデルの第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に基づいて変わりうる。
ステージ225では、205で選択された機械学習モデルが、205で選択されたデータセットと、ステージ215で決定された選択された好適なハイパーパラメータ値とを用いてトレーニングされてもよい。
ステージ280では、255で選択された機械学習モデルが、255で選択されたデータセットとステージ275で決定された選択された好適なハイパーパラメータ値とを用いてトレーニングされてもよい。
いくつかの態様を記載しておく。
〔態様1〕
自動化された機械学習システムにおいて実行される、コンピュータ実装される方法であって、当該方法は:
第1のデータ・スキーマを有する第1のデータセットを受領する段階と;
前記データセットの特性に基づいてメタデータを生成する段階と;
前記メタデータに基づいて、コンピュータ・プロセッサによって、前記データセットへの適用に好適な機械学習モデルを選択する段階と;
選択された機械学習モデルに関連する複数のハイパーパラメータの各ハイパーパラメータについて、各ハイパーパラメータの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度を識別する段階と;
前記選択された機械学習モデルの第1のバージョンを識別する段階と;
前記選択された機械学習モデルの第1のバージョンと共通の一つまたは複数のハイパーパラメータを有する前記選択された機械学習モデルの第2のバージョンを識別し;
前記第1のデータ・スキーマと前記選択された機械学習モデルの前記第2のバージョンに関連する第2のデータセットの第2のデータ・スキーマとの間の類似性を識別することに基づいて、
前記選択された機械学習モデルの第1のバージョンに関連する複数の以前に記憶されたハイパーパラメータ値を取得する段階と;
前記以前に記憶されたハイパーパラメータ値の一つまたは複数についての値の範囲を、閾値に基づいて決定する段階と;
前記選択された機械学習モデルの前記第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのハイパーパラメータと共通である前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて:
各関連するハイパーパラメータについての識別された影響度に基づいて、決定された値の範囲から、ハイパーパラメータ値の第1のグループを選択し;
前記選択された機械学習モデルの前記第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのハイパーパラメータと共通でない前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて:
各関連するハイパーパラメータについての識別された影響度に基づいて、ハイパーパラメータ値の第2のグループを選択する段階と;
ハイパーパラメータ値の第1の選択されたグループ、ハイパーパラメータ値の第2の選択されたグループ、および前記データセットを使用して、前記選択された機械学習モデルの前記第1のバージョンをトレーニングする段階とを含む、
方法。
〔態様2〕
前記メタデータが:
トレーニング集合のサイズ、前記データセットにおける特徴の数、前記データセットにおける諸データ・フィールドの諸タイプの割合、分類問題のタイプ、前記データセットにおける諸データ・フィールドの諸タイプの分散、および前記データセットの特徴がある統計分布に従うかどうかの指標
からなる群から選択された少なくとも1つを含む、態様1に記載の方法。
〔態様3〕
機械学習モデルを選択する段階が:
入力としての前記メタデータに基づいて二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記第1のバージョンの選択を返し、前記選択された機械学習モデルの前記第1のバージョンと一緒に使用するための好適な機械学習ハイパーパラメータ値を返すものである、
態様1に記載の方法。
〔態様4〕
前記一つまたは複数のパフォーマンス・メトリックは、確度、エラー、精度、再現率、受信者動作特性(ROC)曲線の下の面積、および精度再現率曲線の下の面積からなる群から選択された少なくとも1つを含む、態様1に記載の方法。
〔態様5〕
影響度を識別する段階が、さらに:
入力としての前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータを使用して二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に応じて、前記複数のハイパーパラメータのランク付けを返すものである、
態様1に記載の方法。
〔態様6〕
各関連するハイパーパラメータについての識別された影響度に基づいて選択することが、さらに:
前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
態様1に記載の方法。
〔態様7〕
各関連するハイパーパラメータについての識別された影響度に基づいて、決定された値の範囲から、ハイパーパラメータ値の第1のグループを選択することが、さらに:
前記選択された機械学習モデルの前記第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
態様1に記載の方法。
〔態様8〕
各関連するハイパーパラメータについての識別された影響度に基づいて、ハイパーパラメータ値の第2のグループを選択することが、さらに:
前記選択された機械学習モデルの前記第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
態様1に記載の方法。
〔態様9〕
前記閾値のサイズは、前記一つまたは複数の以前に記憶されたハイパーパラメータの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に基づいて変わる、態様1に記載の方法。
〔態様10〕
自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定するコンピュータ実装される方法であって、当該方法は:
データ・スキーマを有するデータセットを受領する段階と;
前記データセットの特性に基づいてメタデータを生成する段階と;
前記メタデータに基づいて、コンピュータ・プロセッサによって、前記データセットへの適用に好適な機械学習モデルを選択する段階と;
前記データセットを使用して、前記選択された機械学習モデルをトレーニングする段階とを含む、
方法。
〔態様11〕
機械学習モデルを選択する段階が、さらに:
入力としての前記メタデータを使って二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記機械学習モデルの前記選択と、前記機械学習モデルと一緒に使用するための好適な機械学習ハイパーパラメータ値を返すものである、
態様10に記載の方法。
〔態様12〕
前記メタデータが:
トレーニング集合のサイズ、前記データセットにおける特徴の数、前記データセットにおける諸データ・フィールドの諸タイプの割合、分類問題のタイプ、前記データセットにおける諸データ・フィールドの諸タイプの分散、および前記データセットの特徴がある統計分布に従うかどうかの指標
からなる群から選択された少なくとも1つを含む、態様10に記載の方法。
〔態様13〕
自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定する方法であって、当該方法は:
機械学習モデルの選択を受領する段階と;
選択された機械学習モデルに関連する複数のハイパーパラメータの各ハイパーパラメータについて、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度を識別する段階と;
各ハイパーパラメータについての識別された影響度に基づいて、前記選択された機械学習モデルと関連して使用するための、前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を選択する段階と;
前記複数のハイパーパラメータのそれぞれについて、選択されたハイパーパラメータ値を使って前記選択された機械学習モデルをトレーニングする段階とを含む、
方法。
〔態様14〕
前記一つまたは複数のパフォーマンス・メトリックは、確度、エラー、精度、再現率、受信者動作特性(ROC)曲線の下の面積、および精度再現率曲線の下の面積からなる群から選択された少なくとも1つを含む、態様13に記載の方法。
〔態様15〕
前記識別する段階が、さらに:
入力としての前記選択された機械学習モデルに関連する前記複数のハイパーパラメータを使用して二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に応じて、前記複数のハイパーパラメータのランク付けを返すものである、
態様13に記載の方法。
〔態様16〕
前記選択することが、さらに:
前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
態様13に記載の方法。
〔態様17〕
自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定する方法であって、当該方法は:
機械学習モデルの選択を受領する段階と;
第1のデータ・スキーマを有する第1のデータセットを受領する段階と;
前記選択された機械学習モデルの第1のバージョンを識別する段階と;
前記選択された機械学習モデルの第1のバージョンと共通の一つまたは複数のハイパーパラメータを有する前記選択された機械学習モデルの第2のバージョンを識別し;
前記第1のデータ・スキーマと前記選択された機械学習モデルの前記第2のバージョンに関連する第2のデータセットの第2のデータ・スキーマとの間の類似性を識別することに基づいて、
前記選択された機械学習モデルに関連する複数の以前に記憶されたハイパーパラメータ値を受領する段階と;
前記以前に記憶されたハイパーパラメータ値の一つまたは複数についての値の範囲を、閾値に基づいて決定する段階と;
前記選択された機械学習モデルの一つまたは複数のハイパーパラメータについての値を、決定された値の範囲から選択する段階と;
選択された値を使用して、前記選択された機械学習モデルの前記第1のバージョンをトレーニングする段階とを含む、
方法。
〔態様18〕
前記選択された機械学習モデルの一つまたは複数のハイパーパラメータについての値を選択する段階が、さらに:
前記選択された機械学習モデルのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
態様17に記載の方法。
〔態様19〕
前記閾値のサイズは、前記一つまたは複数の以前に記憶されたハイパーパラメータの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度に基づいて変わる、態様17に記載の方法。
Claims (19)
- 自動化された機械学習システムにおいて実行される、コンピュータ実装される方法であって、当該方法は:
第1のデータ・スキーマを有する第1のデータセットを受領する段階と;
前記データセットの特性に基づいてメタデータを生成する段階と;
前記メタデータに基づいて、コンピュータ・プロセッサによって、前記データセットへの適用に好適な機械学習モデルを選択する段階と;
選択された機械学習モデルに関連する複数のハイパーパラメータの各ハイパーパラメータについて、各ハイパーパラメータの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度を識別する段階と;
前記選択された機械学習モデルの第1のバージョンを識別する段階と;
前記選択された機械学習モデルの第1のバージョンと共通の一つまたは複数のハイパーパラメータを有する前記選択された機械学習モデルの第2のバージョンを識別し;
前記第1のデータ・スキーマと前記選択された機械学習モデルの前記第2のバージョンに関連する第2のデータセットの第2のデータ・スキーマとの間の類似性を識別することに基づいて、
前記選択された機械学習モデルの第1のバージョンに関連する複数の以前に記憶されたハイパーパラメータ値を取得する段階と;
前記以前に記憶されたハイパーパラメータ値の一つまたは複数についての値の範囲を、閾値に基づいて決定する段階と;
前記選択された機械学習モデルの前記第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのハイパーパラメータと共通である前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて:
各関連するハイパーパラメータについての識別された影響度に基づいて、決定された値の範囲から、ハイパーパラメータ値の第1のグループを選択し;
前記選択された機械学習モデルの前記第2のバージョンに関連する前記一つまたは複数のハイパーパラメータのうちのハイパーパラメータと共通でない前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータの各ハイパーパラメータについて:
各関連するハイパーパラメータについての識別された影響度に基づいて、ハイパーパラメータ値の第2のグループを選択する段階と;
ハイパーパラメータ値の第1の選択されたグループ、ハイパーパラメータ値の第2の選択されたグループ、および前記データセットを使用して、前記選択された機械学習モデルの前記第1のバージョンをトレーニングする段階とを含む、
方法。 - 前記メタデータが:
トレーニング集合のサイズ、前記データセットにおける特徴の数、前記データセットにおける諸データ・フィールドの諸タイプの割合、分類問題のタイプ、前記データセットにおける諸データ・フィールドの諸タイプの分散、および前記データセットの特徴がある統計分布に従うかどうかの指標
からなる群から選択された少なくとも1つを含む、請求項1に記載の方法。 - 機械学習モデルを選択する段階が:
入力としての前記メタデータに基づいて二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記第1のバージョンの選択を返し、前記選択された機械学習モデルの前記第1のバージョンと一緒に使用するための好適な機械学習ハイパーパラメータ値を返すものである、
請求項1に記載の方法。 - 前記一つまたは複数のパフォーマンス・メトリックは、確度、エラー、精度、再現率、受信者動作特性(ROC)曲線の下の面積、および精度再現率曲線の下の面積からなる群から選択された少なくとも1つを含む、請求項1に記載の方法。
- 影響度を識別する段階が、さらに:
入力としての前記選択された機械学習モデルの前記第1のバージョンに関連する前記複数のハイパーパラメータを使用して二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に応じて、前記複数のハイパーパラメータのランク付けを返すものである、
請求項1に記載の方法。 - 各関連するハイパーパラメータについての識別された影響度に基づいて選択することが、さらに:
前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
請求項1に記載の方法。 - 各関連するハイパーパラメータについての識別された影響度に基づいて、決定された値の範囲から、ハイパーパラメータ値の第1のグループを選択することが、さらに:
前記選択された機械学習モデルの前記第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
請求項1に記載の方法。 - 各関連するハイパーパラメータについての識別された影響度に基づいて、ハイパーパラメータ値の第2のグループを選択することが、さらに:
前記選択された機械学習モデルの前記第1のバージョンのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
請求項1に記載の方法。 - 前記閾値のサイズは、前記一つまたは複数の以前に記憶されたハイパーパラメータの、前記選択された機械学習モデルの前記第1のバージョンの一つまたは複数のパフォーマンス・メトリックに対する影響度に基づいて変わる、請求項1に記載の方法。
- 自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定するコンピュータ実装される方法であって、当該方法は:
データ・スキーマを有するデータセットを受領する段階と;
前記データセットの特性に基づいてメタデータを生成する段階と;
前記メタデータに基づいて、コンピュータ・プロセッサによって、前記データセットへの適用に好適な機械学習モデルを選択する段階と;
前記データセットを使用して、前記選択された機械学習モデルをトレーニングする段階とを含む、
方法。 - 機械学習モデルを選択する段階が、さらに:
入力としての前記メタデータを使って二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記機械学習モデルの前記選択と、前記機械学習モデルと一緒に使用するための好適な機械学習ハイパーパラメータ値を返すものである、
請求項10に記載の方法。 - 前記メタデータが:
トレーニング集合のサイズ、前記データセットにおける特徴の数、前記データセットにおける諸データ・フィールドの諸タイプの割合、分類問題のタイプ、前記データセットにおける諸データ・フィールドの諸タイプの分散、および前記データセットの特徴がある統計分布に従うかどうかの指標
からなる群から選択された少なくとも1つを含む、請求項10に記載の方法。 - 自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定する方法であって、当該方法は:
機械学習モデルの選択を受領する段階と;
選択された機械学習モデルに関連する複数のハイパーパラメータの各ハイパーパラメータについて、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度を識別する段階と;
各ハイパーパラメータについての識別された影響度に基づいて、前記選択された機械学習モデルと関連して使用するための、前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を選択する段階と;
前記複数のハイパーパラメータのそれぞれについて、選択されたハイパーパラメータ値を使って前記選択された機械学習モデルをトレーニングする段階とを含む、
方法。 - 前記一つまたは複数のパフォーマンス・メトリックは、確度、エラー、精度、再現率、受信者動作特性(ROC)曲線の下の面積、および精度再現率曲線の下の面積からなる群から選択された少なくとも1つを含む、請求項13に記載の方法。
- 前記識別する段階が、さらに:
入力としての前記選択された機械学習モデルに関連する前記複数のハイパーパラメータを使用して二次機械学習モデルを実行することを含み、前記二次機械学習モデルは、前記選択された機械学習モデルの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に応じて、前記複数のハイパーパラメータのランク付けを返すものである、
請求項13に記載の方法。 - 前記選択することが、さらに:
前記複数のハイパーパラメータのそれぞれについてのハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの前記一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
請求項13に記載の方法。 - 自動化された機械学習システムにおいて機械学習モデルのための一つまたは複数の好適なハイパーパラメータを決定する方法であって、当該方法は:
機械学習モデルの選択を受領する段階と;
第1のデータ・スキーマを有する第1のデータセットを受領する段階と;
前記選択された機械学習モデルの第1のバージョンを識別する段階と;
前記選択された機械学習モデルの第1のバージョンと共通の一つまたは複数のハイパーパラメータを有する前記選択された機械学習モデルの第2のバージョンを識別し;
前記第1のデータ・スキーマと前記選択された機械学習モデルの前記第2のバージョンに関連する第2のデータセットの第2のデータ・スキーマとの間の類似性を識別することに基づいて、
前記選択された機械学習モデルに関連する複数の以前に記憶されたハイパーパラメータ値を受領する段階と;
前記以前に記憶されたハイパーパラメータ値の一つまたは複数についての値の範囲を、閾値に基づいて決定する段階と;
前記選択された機械学習モデルの一つまたは複数のハイパーパラメータについての値を、決定された値の範囲から選択する段階と;
選択された値を使用して、前記選択された機械学習モデルの前記第1のバージョンをトレーニングする段階とを含む、
方法。 - 前記選択された機械学習モデルの一つまたは複数のハイパーパラメータについての値を選択する段階が、さらに:
前記選択された機械学習モデルのハイパーパラメータのうちの一つまたは複数について、決定された値の範囲内のハイパーパラメータ値を探索に基づいて識別することを含み、前記探索は可変の粒度を有し、前記探索の粒度は、前記複数のハイパーパラメータのそれぞれの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度に対応する、
請求項17に記載の方法。 - 前記閾値のサイズは、前記一つまたは複数の以前に記憶されたハイパーパラメータの、前記選択された機械学習モデルの一つまたは複数のパフォーマンス・メトリックに対する影響度に基づいて変わる、請求項17に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862764667P | 2018-08-15 | 2018-08-15 | |
US62/764,667 | 2018-08-15 | ||
US16/264,583 US11526799B2 (en) | 2018-08-15 | 2019-01-31 | Identification and application of hyperparameters for machine learning |
US16/264,583 | 2019-01-31 | ||
PCT/US2019/046622 WO2020037105A1 (en) | 2018-08-15 | 2019-08-15 | Identification and application of hyperparameters for machine learning |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021533450A true JP2021533450A (ja) | 2021-12-02 |
JP7343568B2 JP7343568B2 (ja) | 2023-09-12 |
Family
ID=69523954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021504489A Active JP7343568B2 (ja) | 2018-08-15 | 2019-08-15 | 機械学習のためのハイパーパラメータの識別および適用 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11526799B2 (ja) |
EP (1) | EP3814939A1 (ja) |
JP (1) | JP7343568B2 (ja) |
CN (1) | CN112889042A (ja) |
CA (1) | CA3109481A1 (ja) |
WO (1) | WO2020037105A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023144998A1 (ja) * | 2022-01-28 | 2023-08-03 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7170000B2 (ja) * | 2018-01-24 | 2022-11-11 | 富士フイルム株式会社 | 学習システム、方法及びプログラム |
US11614733B2 (en) | 2018-04-30 | 2023-03-28 | Aspentech Corporation | Computer system and method for automated batch data alignment in batch process modeling, monitoring and control |
US10354205B1 (en) * | 2018-11-29 | 2019-07-16 | Capital One Services, Llc | Machine learning system and apparatus for sampling labelled data |
WO2020192896A1 (en) * | 2019-03-26 | 2020-10-01 | Huawei Technologies Co., Ltd. | Apparatus and method for hyperparameter optimization of a machine learning model in a federated learning system |
US20200279180A1 (en) * | 2019-05-17 | 2020-09-03 | Mengjie Yu | Artificial intelligence customer support case management system |
US20210056220A1 (en) * | 2019-08-22 | 2021-02-25 | Mediatek Inc. | Method for improving confidentiality protection of neural network model |
TWI724515B (zh) * | 2019-08-27 | 2021-04-11 | 聯智科創有限公司 | 機器學習服務提供方法 |
JP7032366B2 (ja) * | 2019-10-09 | 2022-03-08 | 株式会社日立製作所 | 運用支援システム及び方法 |
US11809968B2 (en) * | 2020-02-24 | 2023-11-07 | Capital One Services, Llc | Control of hyperparameter tuning based on machine learning |
US11763196B2 (en) * | 2020-03-25 | 2023-09-19 | International Business Machines Corporation | Dynamically applying machine learning models from profiling received data |
CN111553482B (zh) * | 2020-04-09 | 2023-08-08 | 哈尔滨工业大学 | 机器学习模型超参数的调优方法 |
US11055639B1 (en) | 2020-04-28 | 2021-07-06 | Sas Institute Inc. | Optimizing manufacturing processes using one or more machine learning models |
US11151480B1 (en) | 2020-06-22 | 2021-10-19 | Sas Institute Inc. | Hyperparameter tuning system results viewer |
US20220019936A1 (en) * | 2020-07-17 | 2022-01-20 | Servicenow, Inc. | Machine learning feature recommendation |
US11526155B2 (en) | 2020-07-30 | 2022-12-13 | Aspentech Corporation | Computer system and method for batch data alignment with active learning in batch process modeling, monitoring, and control |
JP7453895B2 (ja) * | 2020-11-11 | 2024-03-21 | 株式会社日立製作所 | 探索条件提示装置、探索条件提示方法、及び探索条件提示プログラム |
US20220180246A1 (en) * | 2020-12-09 | 2022-06-09 | Walmart Apollo Llc | Methods and apparatus for automatic attribute extraction for training machine learning models |
WO2022146072A1 (ko) * | 2020-12-31 | 2022-07-07 | 주식회사 제이엘케이 | Api를 이용한 컨테이너 기반의 automl 방법, 장치 및 프로그램 |
US20230099635A1 (en) * | 2021-09-28 | 2023-03-30 | International Business Machines Corporation | Context aware automated artificial intelligence framework |
US11983184B2 (en) | 2021-10-07 | 2024-05-14 | Salesforce, Inc. | Multi-tenant, metadata-driven recommendation system |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100280979A1 (en) * | 2007-04-25 | 2010-11-04 | Stephan Alexander Raaijmakers | Machine learning hyperparameter estimation |
JP2016218869A (ja) * | 2015-05-22 | 2016-12-22 | 富士通株式会社 | 設定方法、設定プログラム、及び設定装置 |
JP2017049677A (ja) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理装置および機械学習管理方法 |
JP2017111548A (ja) * | 2015-12-15 | 2017-06-22 | 株式会社東芝 | サーバ、システム及び探索方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10366346B2 (en) * | 2014-05-23 | 2019-07-30 | DataRobot, Inc. | Systems and techniques for determining the predictive value of a feature |
WO2016061283A1 (en) * | 2014-10-14 | 2016-04-21 | Skytree, Inc. | Configurable machine learning method selection and parameter optimization system and method |
US20160132787A1 (en) * | 2014-11-11 | 2016-05-12 | Massachusetts Institute Of Technology | Distributed, multi-model, self-learning platform for machine learning |
US10097574B2 (en) * | 2014-12-18 | 2018-10-09 | International Business Machines Corporation | Auto-tuning program analysis tools based on user feedback |
US9699205B2 (en) * | 2015-08-31 | 2017-07-04 | Splunk Inc. | Network security system |
JP6703264B2 (ja) * | 2016-06-22 | 2020-06-03 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理方法および機械学習管理装置 |
US10360517B2 (en) * | 2017-02-22 | 2019-07-23 | Sas Institute Inc. | Distributed hyperparameter tuning system for machine learning |
US11915152B2 (en) * | 2017-03-24 | 2024-02-27 | D5Ai Llc | Learning coach for machine learning system |
US10474926B1 (en) * | 2017-11-16 | 2019-11-12 | Amazon Technologies, Inc. | Generating artificial intelligence image processing services |
CN108009643B (zh) * | 2017-12-15 | 2018-10-30 | 清华大学 | 一种机器学习算法自动选择方法和系统 |
US20190362222A1 (en) * | 2018-05-22 | 2019-11-28 | Adobe Inc. | Generating new machine learning models based on combinations of historical feature-extraction rules and historical machine-learning models |
US20190385052A1 (en) * | 2018-06-15 | 2019-12-19 | Deep Insight Solutions, Inc. | Methods for deep learning optimization |
-
2019
- 2019-01-31 US US16/264,583 patent/US11526799B2/en active Active
- 2019-08-15 CN CN201980051066.4A patent/CN112889042A/zh active Pending
- 2019-08-15 EP EP19762272.3A patent/EP3814939A1/en not_active Ceased
- 2019-08-15 WO PCT/US2019/046622 patent/WO2020037105A1/en unknown
- 2019-08-15 JP JP2021504489A patent/JP7343568B2/ja active Active
- 2019-08-15 CA CA3109481A patent/CA3109481A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100280979A1 (en) * | 2007-04-25 | 2010-11-04 | Stephan Alexander Raaijmakers | Machine learning hyperparameter estimation |
JP2016218869A (ja) * | 2015-05-22 | 2016-12-22 | 富士通株式会社 | 設定方法、設定プログラム、及び設定装置 |
JP2017049677A (ja) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理装置および機械学習管理方法 |
JP2017111548A (ja) * | 2015-12-15 | 2017-06-22 | 株式会社東芝 | サーバ、システム及び探索方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023144998A1 (ja) * | 2022-01-28 | 2023-08-03 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US11526799B2 (en) | 2022-12-13 |
WO2020037105A1 (en) | 2020-02-20 |
CN112889042A (zh) | 2021-06-01 |
CA3109481A1 (en) | 2020-02-20 |
EP3814939A1 (en) | 2021-05-05 |
US20200057958A1 (en) | 2020-02-20 |
JP7343568B2 (ja) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7343568B2 (ja) | 機械学習のためのハイパーパラメータの識別および適用 | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
WO2022063151A1 (en) | Method and system for relation learning by multi-hop attention graph neural network | |
US20190362222A1 (en) | Generating new machine learning models based on combinations of historical feature-extraction rules and historical machine-learning models | |
US10621492B2 (en) | Multiple record linkage algorithm selector | |
US9536201B2 (en) | Identifying associations in data and performing data analysis using a normalized highest mutual information score | |
US20190347281A1 (en) | Apparatus and method for semantic search | |
WO2019047790A1 (zh) | 生成机器学习样本的组合特征的方法及系统 | |
WO2014160648A1 (en) | Ranking product search results | |
US10467307B1 (en) | Grouping of item data using seed expansion | |
CN110941698B (zh) | 一种基于bert下卷积神经网络的服务发现方法 | |
US20230195809A1 (en) | Joint personalized search and recommendation with hypergraph convolutional networks | |
CN114298323A (zh) | 生成机器学习样本的组合特征的方法及系统 | |
CN107729915A (zh) | 用于确定机器学习样本的重要特征的方法及系统 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN110990533A (zh) | 确定查询文本所对应标准文本的方法及装置 | |
US20190205475A1 (en) | Search engine for identifying analogies | |
CN104615723B (zh) | 查询词权重值的确定方法和装置 | |
US11109085B2 (en) | Utilizing one hash permutation and populated-value-slot-based densification for generating audience segment trait recommendations | |
Zhang et al. | NASRec: weight sharing neural architecture search for recommender systems | |
KR101811211B1 (ko) | 빅데이터 기반의 사용성 테스트 방법 및 장치 | |
CN110852078A (zh) | 生成标题的方法和装置 | |
CN112579422B (zh) | 一种方案测试方法、装置、服务器及存储介质 | |
CN113239697A (zh) | 实体识别模型训练方法、装置、计算机设备及存储介质 | |
KR20230079292A (ko) | 빅데이터 기반의 사용성 테스트 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210301 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220809 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230801 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230831 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7343568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |