JP2019128634A - 最適化装置及びハイパーパラメータの最適化方法 - Google Patents
最適化装置及びハイパーパラメータの最適化方法 Download PDFInfo
- Publication number
- JP2019128634A JP2019128634A JP2018007955A JP2018007955A JP2019128634A JP 2019128634 A JP2019128634 A JP 2019128634A JP 2018007955 A JP2018007955 A JP 2018007955A JP 2018007955 A JP2018007955 A JP 2018007955A JP 2019128634 A JP2019128634 A JP 2019128634A
- Authority
- JP
- Japan
- Prior art keywords
- optimization
- visualization
- dimensional vector
- unit
- dimensional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 111
- 238000000034 method Methods 0.000 title claims description 50
- 238000012800 visualization Methods 0.000 claims abstract description 83
- 239000013598 vector Substances 0.000 claims abstract description 78
- 238000003058 natural language processing Methods 0.000 claims abstract description 11
- 238000011156 evaluation Methods 0.000 claims description 26
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000006870 function Effects 0.000 description 30
- 230000008569 process Effects 0.000 description 22
- 238000013500 data storage Methods 0.000 description 21
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 5
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008676 import Effects 0.000 description 4
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 3
- 238000003825 pressing Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000010937 topological data analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
101 データバス
102 CPU
103 メモリ
104 入出力インターフェイス
105 通信装置
106 ドライブ装置
107 入力装置
108 出力装置
109 記憶媒体
200 プログラム
210 参照データ格納部
220 文書解釈部
230 結果表示部
310 最適化部
320 高次元可視化部
410 ハイパーパラメータ生成部
420 単語選択部
430 自然言語学習部
440 結果評価部
510 可視化ハイパーパラメータ生成部
520 可視化調整部
530 可視化評価部
540 考察要素提示部
1400 表示画面
1401 Import fileボタン
1402 optimizingボタン
1403 mapボタン
1404 Saveボタン
1405 Import file name欄
1406 Export file name欄
1407 結果表示領域
1408 ラジオボタン
Claims (12)
- プロセッサとメモリを含んで自然言語処理により文書集合の学習を行う最適化装置であって、
予め設定されたグループデータに基づいて所定の条件を満たすハイパーパラメータを決定し、当該決定したハイパーパラメータで学習モデルを生成し、当該学習モデルから高次元ベクトルを取得する最適化部と、
解析対象の単語または文書の前記高次元ベクトルを前記グループデータに基づいて変換する高次元可視化部と、を有することを特徴とする最適化装置。 - 請求項1に記載の最適化装置であって、
前記最適化部は、
前記ハイパーパラメータを生成し、前記学習モデルの評価に用いる単語または文書を取得し、前記ハイパーパラメータを使用した学習により学習モデルを生成し、前記生成したモデルと前記モデルの評価に用いる単語または文書を用いて精度の評価を行うことを特徴とする最適化装置。 - 請求項1に記載の最適化装置であって、
前記高次元可視化部は、
可視化ハイパーパラメータを生成し、前記生成した可視化ハイパーパラメータを使用して、高次元ベクトルを2次元または3次元の低次元ベクトルに変換し、前記低次元ベクトルに対して精度評価を行い、最も高い精度であった可視化結果を提示することを特徴とする最適化装置。 - 請求項3に記載の最適化装置であって、
前記高次元可視化部は、
前記学習に用いた文書集合や辞書または高次元ベクトルや前記低次元ベクトルを考察要素に用いるデータとして用いて、前記可視化結果または高次元ベクトルの結果に対して考察を行うための考察要素を提示することを特徴とする最適化装置。 - 請求項2に記載の最適化装置であって、
前記最適化部は、
前記精度の評価を、単語間の距離に基づいてスコアを算出し、当該スコアが最小となる学習モデルのハイパーパラメータを、前記所定の条件を満たすハイパーパラメータとして決定することを特徴とする最適化装置。 - 請求項4に記載の最適化装置であって、
前記高次元可視化部は、
前記考察要素に用いるデータを読み込んで、前記データに含まれる単語についてクラスタリングを行った結果を前記考察要素として出力することを特徴とする最適化装置。 - プロセッサとメモリを含む計算機が、自然言語処理により文書集合の学習を行う際のハイパーパラメータの最適化方法であって、
前記計算機が、予め設定されたグループデータに基づいて所定の条件を満たすハイパーパラメータを決定し、当該決定したハイパーパラメータで学習モデルを生成し、当該学習モデルから高次元ベクトルを取得する第1のステップと、
前記計算機が、解析対象の単語または文書の前記高次元ベクトルを前記グループデータに基づいて変換する第2のステップと、
を含むことを特徴とするハイパーパラメータの最適化方法。 - 請求項7に記載のハイパーパラメータの最適化方法であって、
前記第1のステップは、
前記ハイパーパラメータを生成し、前記学習モデルの評価に用いる単語または文書を取得し、前記ハイパーパラメータを使用した学習により学習モデルを生成し、前記生成したモデルと前記モデルの評価に用いる単語または文書を用いて精度の評価を行うことを特徴とするハイパーパラメータの最適化方法。 - 請求項7に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
可視化ハイパーパラメータを生成し、前記生成した可視化ハイパーパラメータを使用して、高次元ベクトルを2次元または3次元の低次元ベクトルに変換し、前記低次元ベクトルに対して精度評価を行い、最も高い精度であった可視化結果を提示することを特徴とするハイパーパラメータの最適化方法。 - 請求項9に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
前記学習に用いた文書集合や辞書または高次元ベクトルや前記低次元ベクトルを考察要素に用いるデータとして用いて、前記可視化結果または高次元ベクトルの結果に対して考察を行うための考察要素を提示することを特徴とするハイパーパラメータの最適化方法。 - 請求項8に記載のハイパーパラメータの最適化方法であって、
前記第1のステップは、
前記精度の評価を、単語間の距離に基づいてスコアを算出し、当該スコアが最小となる学習モデルのハイパーパラメータを、前記所定の条件を満たすハイパーパラメータとして決定することを特徴とするハイパーパラメータの最適化方法。 - 請求項10に記載のハイパーパラメータの最適化方法であって、
前記第2のステップは、
前記考察要素に用いるデータを読み込んで、前記データに含まれる単語についてクラスタリングを行った結果を前記考察要素として出力することを特徴とするハイパーパラメータの最適化方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018007955A JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
US16/248,822 US10936971B2 (en) | 2018-01-22 | 2019-01-16 | Optimization apparatus and optimization method for hyper parameter |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018007955A JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019128634A true JP2019128634A (ja) | 2019-08-01 |
JP6856557B2 JP6856557B2 (ja) | 2021-04-07 |
Family
ID=67299383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018007955A Active JP6856557B2 (ja) | 2018-01-22 | 2018-01-22 | 最適化装置及びハイパーパラメータの最適化方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10936971B2 (ja) |
JP (1) | JP6856557B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021179323A (ja) * | 2020-05-11 | 2021-11-18 | Jrcモビリティ株式会社 | 属性の識別装置および識別方法 |
WO2023037399A1 (ja) * | 2021-09-07 | 2023-03-16 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US12248888B2 (en) * | 2018-09-21 | 2025-03-11 | Cloudera, Inc. | Hyperparameter tuning using visual analytics in a data science platform |
CN111538776B (zh) * | 2020-03-19 | 2021-10-01 | 浙江中海达空间信息技术有限公司 | 多层认知约束的高维地理空间数据聚焦可视化方法 |
WO2021199198A1 (ja) * | 2020-03-30 | 2021-10-07 | 日本電気株式会社 | チャットボットシステム,選択肢整形装置,選択肢整形方法及び非一時的なコンピュータ可読媒体 |
CN114650230B (zh) * | 2020-12-15 | 2025-03-21 | 中国移动通信有限公司研究院 | 一种信息处理方法、装置及设备 |
US12332944B2 (en) * | 2021-04-14 | 2025-06-17 | International Business Machines Corporation | Identifying equivalent technical terms in different documents |
CN114722969A (zh) * | 2022-05-06 | 2022-07-08 | 厦门快商通科技股份有限公司 | 一种高维数据可视化聚类分析方法、电子设备及可读介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
US20170293687A1 (en) * | 2016-04-12 | 2017-10-12 | Abbyy Infopoisk Llc | Evaluating text classifier parameters based on semantic features |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9355171B2 (en) * | 2009-10-09 | 2016-05-31 | Hewlett Packard Enterprise Development Lp | Clustering of near-duplicate documents |
KR102219346B1 (ko) * | 2013-05-30 | 2021-02-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 베이지안 최적화를 수행하기 위한 시스템 및 방법 |
US11436270B2 (en) * | 2014-02-28 | 2022-09-06 | San Diego State University Research Foundation | Knowledge reference system and method |
US10534994B1 (en) * | 2015-11-11 | 2020-01-14 | Cadence Design Systems, Inc. | System and method for hyper-parameter analysis for multi-layer computational structures |
-
2018
- 2018-01-22 JP JP2018007955A patent/JP6856557B2/ja active Active
-
2019
- 2019-01-16 US US16/248,822 patent/US10936971B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053848A (ja) * | 2010-09-03 | 2012-03-15 | Nippon Telegr & Teleph Corp <Ntt> | データ可視化装置、データ変換装置、方法、及びプログラム |
US20170293687A1 (en) * | 2016-04-12 | 2017-10-12 | Abbyy Infopoisk Llc | Evaluating text classifier parameters based on semantic features |
Non-Patent Citations (1)
Title |
---|
斎藤 康毅, ゼロから作るDEEP LEARNING, vol. 第1版, JPN6020049870, 13 February 2017 (2017-02-13), JP, pages 197 - 203, ISSN: 0004413752 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021179323A (ja) * | 2020-05-11 | 2021-11-18 | Jrcモビリティ株式会社 | 属性の識別装置および識別方法 |
JP7377494B2 (ja) | 2020-05-11 | 2023-11-10 | Jrcモビリティ株式会社 | 属性の識別装置および識別方法 |
WO2023037399A1 (ja) * | 2021-09-07 | 2023-03-16 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7619470B2 (ja) | 2021-09-07 | 2025-01-22 | 日本電気株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20190228335A1 (en) | 2019-07-25 |
JP6856557B2 (ja) | 2021-04-07 |
US10936971B2 (en) | 2021-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6856557B2 (ja) | 最適化装置及びハイパーパラメータの最適化方法 | |
Smilkov et al. | Embedding projector: Interactive visualization and interpretation of embeddings | |
Brehmer et al. | A multi-level typology of abstract visualization tasks | |
Raikwal et al. | Performance evaluation of SVM and k-nearest neighbor algorithm over medical data set | |
Paiva et al. | An approach to supporting incremental visual data classification | |
Sherkat et al. | Interactive document clustering revisited: A visual analytics approach | |
KR20210023452A (ko) | 속성 단위 리뷰 분석 장치 및 방법 | |
JP2016212838A (ja) | 発見情報学システム、方法、及びコンピュータプログラム | |
Zhu et al. | Exploratory gene ontology analysis with interactive visualization | |
Edeki et al. | Comparison of data mining techniques used to predict cancer survivability | |
WO2019019969A1 (zh) | 知识验证方法、知识验证设备以及存储介质 | |
Upadhyay et al. | Semantic knowledge extraction from research documents | |
CN119066179B (zh) | 问答处理方法、计算机程序产品、设备及介质 | |
JP2024092727A (ja) | 画像生成検索装置、画像生成検索システム及び画像生成検索方法 | |
Natingga | Data Science Algorithms in a Week: Top 7 algorithms for scientific computing, data analysis, and machine learning | |
AU2015204339B2 (en) | Information processing apparatus and information processing program | |
Mahmood et al. | Interactive subspace cluster analysis guided by semantic attribute associations | |
Tu et al. | A domain-independent text segmentation method for educational course content | |
JP7292235B2 (ja) | 分析支援装置及び分析支援方法 | |
JP6942104B2 (ja) | 判定装置、判定方法、および判定プログラム | |
WO2022003816A1 (ja) | 情報処理プログラム、提案方法、および情報処理装置 | |
Juhász | A search for structural similarities of oral musical traditions in Eurasia and America using the self organizing cloud algorithm | |
JP7034453B1 (ja) | 情報解析装置、情報解析方法および情報解析用プログラム | |
JP6515438B2 (ja) | 重要度算出装置、重要度算出装置方法、及び重要度算出装置システム | |
KR101602898B1 (ko) | 객체의 코멘트 데이터를 이용한 데이터 시각화 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210302 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6856557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |