JP7396062B2 - 制御値決定装置 - Google Patents
制御値決定装置 Download PDFInfo
- Publication number
- JP7396062B2 JP7396062B2 JP2020004696A JP2020004696A JP7396062B2 JP 7396062 B2 JP7396062 B2 JP 7396062B2 JP 2020004696 A JP2020004696 A JP 2020004696A JP 2020004696 A JP2020004696 A JP 2020004696A JP 7396062 B2 JP7396062 B2 JP 7396062B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- control value
- control
- sensitivity
- reward
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000035945 sensitivity Effects 0.000 claims description 62
- 238000009795 derivation Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 230000002787 reinforcement Effects 0.000 claims description 13
- 230000001133 acceleration Effects 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000036461 convulsion Effects 0.000 claims description 7
- 238000006467 substitution reaction Methods 0.000 claims description 5
- 230000007423 decrease Effects 0.000 claims description 4
- 238000000342 Monte Carlo simulation Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims 1
- 238000000034 method Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Landscapes
- Feedback Control In General (AREA)
Description
110 試行処理部
120 報酬導出部
130 状態値導出部
140 試行制御値決定部
150 感度更新部
160 感度代入部
170 決定部
180 記憶部
200 試行実施手段
210 移動体
Claims (8)
- 移動体の移動状態が目標状態となるように移動体の移動を制御する制御パラメータの値である制御値を強化学習により決定する制御値決定装置であって、
前記移動体を移動させるための制御値を出力し、前記制御値に基づき仮想的、または現実的に前記移動体の移動を試行した結果値を取得する試行処理部と、
前記試行処理部が取得した結果値に基づき報酬を導出する報酬導出部と、
前記制御値と、前記報酬導出部により導出される前記報酬とに基づき前記制御値を更新するための基本価値を導出する基本更新式に前記移動体の試行回数に従い増加する基本係数を乗算した第一式と、影響感度による近似予測により前記制御値を更新するための予測価値を導出する予測更新式に前記移動体の試行回数に従い減少する予測係数を乗算した第二式とを足し合わせた統合更新式に基づき状態値を導出する状態値導出部と、
前記状態値導出部により導出された状態値に基づき試行用の制御値を決定する試行制御値決定部と、
を備える制御値決定装置。 - 前記影響感度を更新するための感度更新関係に基づき影響感度を更新する感度更新部と、
前記感度更新部により更新された影響感度を前記予測更新式に代入する感度代入部と、を備える請求項1に記載の制御値決定装置。 - 前記基本係数、および前記予測係数は、加算すれば一定値となる
請求項1または2に記載の制御値決定装置。 - 前記基本更新式は、
Q学習、Sarsa、またはモンテカルロ法に用いられる式である
請求項1から3のいずれか一項に記載の制御値決定装置。 - 前記予測更新式は、
前記報酬と、次候補の制御値から前記制御値を減算した差に前記影響感度を乗算した積とを加算する
請求項1から4のいずれか一項に記載の制御値決定装置。 - 前記制御パラメータは、
速度、加減速度、ジャーク、PID制御における比例ゲイン、PID制御における微分ゲイン、PID制御における積分ゲイン、走行用のモータのトルクの少なくとも1つである
請求項1から5のいずれか一項に記載の制御値決定装置。 - 前記報酬導出部は、
結果値の1つである前記移動体に関係する物体の最大振幅と予め設定される許容最大振幅の差分、および他の結果値である前記移動体の移動に関連する関連時間と予め設定される許容時間の差分の少なくとも一方に基づき報酬を導出する
請求項1から6のいずれか一項に記載の制御値決定装置。 - 前記予測更新式は、
前記報酬以外の項に、距離関数を乗算する
請求項5から7のいずれか一項に記載の制御値決定装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004696A JP7396062B2 (ja) | 2020-01-15 | 2020-01-15 | 制御値決定装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020004696A JP7396062B2 (ja) | 2020-01-15 | 2020-01-15 | 制御値決定装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021111282A JP2021111282A (ja) | 2021-08-02 |
JP7396062B2 true JP7396062B2 (ja) | 2023-12-12 |
Family
ID=77060003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020004696A Active JP7396062B2 (ja) | 2020-01-15 | 2020-01-15 | 制御値決定装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7396062B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157003A (ja) | 2000-11-17 | 2002-05-31 | Fuji Electric Co Ltd | 多変数モデル予測制御装置、方法、及びその記憶媒体 |
JP2007070106A (ja) | 2005-09-09 | 2007-03-22 | Daifuku Co Ltd | 物品収納設備における物品搬送装置 |
WO2015040980A1 (ja) | 2013-09-18 | 2015-03-26 | 日産自動車株式会社 | 作業経路作成装置、作業経路作成方法、作業経路作成プログラム、および記録媒体 |
JP2017107902A (ja) | 2015-12-07 | 2017-06-15 | ファナック株式会社 | コアシートの積層動作を学習する機械学習器、積層コア製造装置、積層コア製造システムおよび機械学習方法 |
JP2018180633A (ja) | 2017-04-04 | 2018-11-15 | ファナック株式会社 | 揺動切削を行う工作機械の制御装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6160507A (ja) * | 1984-08-29 | 1986-03-28 | Hitachi Ltd | スタツカ−クレ−ン制御方法 |
-
2020
- 2020-01-15 JP JP2020004696A patent/JP7396062B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002157003A (ja) | 2000-11-17 | 2002-05-31 | Fuji Electric Co Ltd | 多変数モデル予測制御装置、方法、及びその記憶媒体 |
JP2007070106A (ja) | 2005-09-09 | 2007-03-22 | Daifuku Co Ltd | 物品収納設備における物品搬送装置 |
WO2015040980A1 (ja) | 2013-09-18 | 2015-03-26 | 日産自動車株式会社 | 作業経路作成装置、作業経路作成方法、作業経路作成プログラム、および記録媒体 |
JP2017107902A (ja) | 2015-12-07 | 2017-06-15 | ファナック株式会社 | コアシートの積層動作を学習する機械学習器、積層コア製造装置、積層コア製造システムおよび機械学習方法 |
JP2018180633A (ja) | 2017-04-04 | 2018-11-15 | ファナック株式会社 | 揺動切削を行う工作機械の制御装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2021111282A (ja) | 2021-08-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6457563B2 (ja) | 数値制御装置及び機械学習装置 | |
Reynoso-Meza et al. | Controller tuning using evolutionary multi-objective optimisation: current trends and applications | |
JP6457472B2 (ja) | 制御システム及び機械学習装置 | |
Yeung et al. | Virtual CNC system. Part I. system architecture | |
JP2019034836A (ja) | 制御装置及び機械学習装置 | |
Etedali et al. | A GBMO-based PIλDμ controller for vibration mitigation of seismic-excited structures | |
CN109202394A (zh) | 部件供给装置以及机器学习装置 | |
Mahmoodabadi et al. | Online optimal decoupled sliding mode control based on moving least squares and particle swarm optimization | |
CN109725537A (zh) | 一种改进的线性最优半主动控制方法 | |
CN112601863A (zh) | 工程机械和评价装置 | |
JP7396062B2 (ja) | 制御値決定装置 | |
JP2005219929A (ja) | エレベータケージにおける振動減衰用調整器の設計の方法 | |
JP6664561B1 (ja) | 位置決め制御装置及び位置決め方法 | |
Kayacan et al. | Velocity control of a spherical rolling robot using a grey-PID type fuzzy controller with an adaptive step size | |
Bae et al. | Heave reduction of payload through crane control based on deep reinforcement learning using dual offshore cranes | |
Osaka et al. | Route optimization for autonomous bulldozer by distributed deep reinforcement learning | |
Galicki | Robust task space trajectory tracking control of robotic manipulators | |
Eaton et al. | Stability of neural net based model predictive control | |
Haemers et al. | Co-design of controller and setup configuration using genetic algorithm | |
Ma et al. | Adaptive feedback–feedforward control of building structures | |
JP6712022B2 (ja) | 制御システム、制御方法および制御装置 | |
Rubaai et al. | Hardware/software implementation of PI/PD-like fuzzy controller for high performance motor drives | |
EP3190471B1 (en) | Motor control device | |
Pandey | Transit Search Optimization Algorithm For Proportional-Integral-Derivative Controller Tuning For the Optimal DC Motor Speed Control: Classical Methods As Benchmark | |
Nahapetian et al. | PID gain tuning using genetic algorithms and fuzzy logic for robot manipulator control |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230830 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231113 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7396062 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |