JPH07210207A - 適応制御装置 - Google Patents
適応制御装置Info
- Publication number
- JPH07210207A JPH07210207A JP296694A JP296694A JPH07210207A JP H07210207 A JPH07210207 A JP H07210207A JP 296694 A JP296694 A JP 296694A JP 296694 A JP296694 A JP 296694A JP H07210207 A JPH07210207 A JP H07210207A
- Authority
- JP
- Japan
- Prior art keywords
- output
- neural network
- controlled object
- linear model
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Feedback Control In General (AREA)
Abstract
(57)【要約】
【目的】制御対象の非線形性や外乱等の影響を考慮する
ことなく線形モデルに基づいて線形制御系を構成するこ
とができ、安定した応答を得ることが可能となる。 【構成】ニューラルネットワーク4は、現時点の補償器
の出力信号Ubf(k)16と、現時点から数ステップ過去
までの制御対象の出力信号[Y(k),Y(k−1),…,
Y(k−n)]と操作量[U(k−1),U(k−2),…,
U(k−m)]を入力し、操作量U(k)3を出力する。学
習手段8は、制御対象の出力2と線形モデルの出力7と
の誤差が最小になるようにニューラルネットワーク4の
学習を行う。
ことなく線形モデルに基づいて線形制御系を構成するこ
とができ、安定した応答を得ることが可能となる。 【構成】ニューラルネットワーク4は、現時点の補償器
の出力信号Ubf(k)16と、現時点から数ステップ過去
までの制御対象の出力信号[Y(k),Y(k−1),…,
Y(k−n)]と操作量[U(k−1),U(k−2),…,
U(k−m)]を入力し、操作量U(k)3を出力する。学
習手段8は、制御対象の出力2と線形モデルの出力7と
の誤差が最小になるようにニューラルネットワーク4の
学習を行う。
Description
【0001】
【産業上の利用分野】本発明は、ロボット,工作機械,
XYステージ,ディスク装置などの位置決め制御装置に
おいて、制御対象の非線形性や外乱,環境経時変化に対
応できる高精度な位置決め制御系を実現するニューラル
ネットワークを用いた適応制御装置に関する。
XYステージ,ディスク装置などの位置決め制御装置に
おいて、制御対象の非線形性や外乱,環境経時変化に対
応できる高精度な位置決め制御系を実現するニューラル
ネットワークを用いた適応制御装置に関する。
【0002】
【従来の技術】適応制御方式には、モデル規範型適応制
御やセルフチューニングレギュレータなどがある。これ
らの方式では、制御対象の動特性モデルが線形ダイナミ
クスで記述できる場合にのみ効果があるが、制御対象の
非線形性や外乱,環境経時変化に対応することはできな
い。
御やセルフチューニングレギュレータなどがある。これ
らの方式では、制御対象の動特性モデルが線形ダイナミ
クスで記述できる場合にのみ効果があるが、制御対象の
非線形性や外乱,環境経時変化に対応することはできな
い。
【0003】一方、ニューラルネットワークは、比較的
単純な構造で、非線形系を含めたダイナミクスモデルを
学習する能力を持つことが知られている。制御対象の非
線形性や環境経時変化に対応するための一手段として、
特開平2−54304号公報にニューラルネットワークを用い
た適応制御方式について開示されている。
単純な構造で、非線形系を含めたダイナミクスモデルを
学習する能力を持つことが知られている。制御対象の非
線形性や環境経時変化に対応するための一手段として、
特開平2−54304号公報にニューラルネットワークを用い
た適応制御方式について開示されている。
【0004】図8にそこで開示されている適応制御装置
を示す。これは、制御対象51とフィードバック補償器
57からなるフィードバックループ内に加算点61を設
け、その加算点へ目標値59からのフィードフォワード
ループをニューラルネットワーク54で構成する装置と
なっている。
を示す。これは、制御対象51とフィードバック補償器
57からなるフィードバックループ内に加算点61を設
け、その加算点へ目標値59からのフィードフォワード
ループをニューラルネットワーク54で構成する装置と
なっている。
【0005】この装置の動作は以下の通りである。すな
わち、ニューラルネットワークが学習を開始する前は、
目標値R59は制御サンプリング毎に制御対象の出力Y
52と比較され、その偏差60に基づいてフィードバッ
ク補償器57の演算が行われ演算結果Ub58 が操作量
U53として制御対象51に印加される。ニューラルネ
ットワーク54の学習が開始すると、目標値とその一次
微分である速度目標値と二次微分である加速度目標値を
ニューラルネットワークへ入力し、ニューラルネットワ
ークの出力Uf55をフィードバック補償器の出力Ub5
8に加算して、操作量U53を制御対象51に印加す
る。
わち、ニューラルネットワークが学習を開始する前は、
目標値R59は制御サンプリング毎に制御対象の出力Y
52と比較され、その偏差60に基づいてフィードバッ
ク補償器57の演算が行われ演算結果Ub58 が操作量
U53として制御対象51に印加される。ニューラルネ
ットワーク54の学習が開始すると、目標値とその一次
微分である速度目標値と二次微分である加速度目標値を
ニューラルネットワークへ入力し、ニューラルネットワ
ークの出力Uf55をフィードバック補償器の出力Ub5
8に加算して、操作量U53を制御対象51に印加す
る。
【0006】図中、sは微分演算子である。ニューラル
ネットワーク54は、教師信号として操作量U53を用
い、J=(U−Uf)2=Ub2を最小にするように学習が進
む。すなわち、学習が進むにつれて、フィードバック補
償器57の出力Ub58 が小さくなり、徐々に制御対象
51の逆モデルがニューラルネットワーク54に構築さ
れ、獲得された逆モデルによるフィードフォワード制御
に移行していく。ニューラルネットワークの学習は、バ
ックプロパゲーション法を用いている。制御を行いなが
ら学習ができ、制御対象の特性変動,非線形性に対して
適応的に操作量を演算できるため、特にロボット等に応
用が検討されている。
ネットワーク54は、教師信号として操作量U53を用
い、J=(U−Uf)2=Ub2を最小にするように学習が進
む。すなわち、学習が進むにつれて、フィードバック補
償器57の出力Ub58 が小さくなり、徐々に制御対象
51の逆モデルがニューラルネットワーク54に構築さ
れ、獲得された逆モデルによるフィードフォワード制御
に移行していく。ニューラルネットワークの学習は、バ
ックプロパゲーション法を用いている。制御を行いなが
ら学習ができ、制御対象の特性変動,非線形性に対して
適応的に操作量を演算できるため、特にロボット等に応
用が検討されている。
【0007】
【発明が解決しようとする課題】しかし、従来技術で
は、ニューラルネットワークをフィードフォワード補償
器として用いているため、目標値に対する追従性は向上
するが、制御対象に加わる外乱やノイズ等に対する抑制
効果が十分でないという問題があった。特に、従来技術
では、ニューラルネットワークの入力信号として目標値
と速度目標値と加速度目標値しか入力していないため、
ダイナミクス変動や外乱等の影響を受ける制御対象の逆
ダイナミクスをニューラルネットワーク内に構築するこ
とは困難であった。
は、ニューラルネットワークをフィードフォワード補償
器として用いているため、目標値に対する追従性は向上
するが、制御対象に加わる外乱やノイズ等に対する抑制
効果が十分でないという問題があった。特に、従来技術
では、ニューラルネットワークの入力信号として目標値
と速度目標値と加速度目標値しか入力していないため、
ダイナミクス変動や外乱等の影響を受ける制御対象の逆
ダイナミクスをニューラルネットワーク内に構築するこ
とは困難であった。
【0008】また、従来技術では、事前に入手すること
が可能な非線形システムの線形なダイナミクスの情報を
有効に活用することができないという問題があった。特
に、従来技術では、非線形な制御対象を安定化するフィ
ードバック補償器が必要となる。通常、フィードバック
補償器を設計する際には非線形な制御対象の線形化した
ダイナミクスの情報を必要とするが、従来技術ではこの
線形化したダイナミクスの情報をニューラルネットワー
クの学習の際に有効に活用することが困難であった。
が可能な非線形システムの線形なダイナミクスの情報を
有効に活用することができないという問題があった。特
に、従来技術では、非線形な制御対象を安定化するフィ
ードバック補償器が必要となる。通常、フィードバック
補償器を設計する際には非線形な制御対象の線形化した
ダイナミクスの情報を必要とするが、従来技術ではこの
線形化したダイナミクスの情報をニューラルネットワー
クの学習の際に有効に活用することが困難であった。
【0009】本発明の目的は、制御対象の非線形性や外
乱に対しても十分な抑制効果を持ち、ニューラルネット
ワークの学習の負荷を軽減し高精度に学習することが可
能なニューラルネットワークを用いた適応制御装置を提
供することにある。
乱に対しても十分な抑制効果を持ち、ニューラルネット
ワークの学習の負荷を軽減し高精度に学習することが可
能なニューラルネットワークを用いた適応制御装置を提
供することにある。
【0010】
【課題を解決するための手段】上記目的を達成するため
の第一の発明は、制御対象の制御出力を目標値に一致さ
せるように前記目標値と前記制御出力との制御偏差をフ
ィードバック制御する制御器を有する制御装置におい
て、前記制御器の出力を入力信号とするニューラルネッ
トワークモデルと、前記制御器の出力を入力信号とする
線形モデルと、前記ニューラルネットワークの出力を前
記制御対象の入力信号とし、前記制御対象の出力と前記
線形モデルの出力が等しくなるように前記ニューラルネ
ットワークの各層間の重みを変化させる学習手段とを含
むものである。
の第一の発明は、制御対象の制御出力を目標値に一致さ
せるように前記目標値と前記制御出力との制御偏差をフ
ィードバック制御する制御器を有する制御装置におい
て、前記制御器の出力を入力信号とするニューラルネッ
トワークモデルと、前記制御器の出力を入力信号とする
線形モデルと、前記ニューラルネットワークの出力を前
記制御対象の入力信号とし、前記制御対象の出力と前記
線形モデルの出力が等しくなるように前記ニューラルネ
ットワークの各層間の重みを変化させる学習手段とを含
むものである。
【0011】また、上記目的を達成するための第二の発
明は、制御対象の制御出力を目標値に一致させるように
前記目標値と前記制御出力との制御偏差をフィードバッ
ク制御する制御器を有する制御装置において、前記制御
器の出力を入力信号とするニューラルネットワークモデ
ルと、前記制御器の出力を入力信号とする線形モデル
と、前記制御器の出力を前記制御対象の入力信号とし、
前記制御対象の出力と、前記線形モデルの出力に前記ニ
ューラルネットワークの出力を加算した信号とが等しく
なるように前記ニューラルネットワークの各層間の重み
を変化させる学習手段と、前記ニューラルネットワーク
の出力が前記制御対象の出力を補正する手段とを含むも
のである。
明は、制御対象の制御出力を目標値に一致させるように
前記目標値と前記制御出力との制御偏差をフィードバッ
ク制御する制御器を有する制御装置において、前記制御
器の出力を入力信号とするニューラルネットワークモデ
ルと、前記制御器の出力を入力信号とする線形モデル
と、前記制御器の出力を前記制御対象の入力信号とし、
前記制御対象の出力と、前記線形モデルの出力に前記ニ
ューラルネットワークの出力を加算した信号とが等しく
なるように前記ニューラルネットワークの各層間の重み
を変化させる学習手段と、前記ニューラルネットワーク
の出力が前記制御対象の出力を補正する手段とを含むも
のである。
【0012】また、上記目的を達成するための第三の発
明は、制御対象の制御出力を目標値に一致させるように
前記目標値と前記制御出力との制御偏差をフィードバッ
ク制御する制御器を有する制御装置において、前記制御
対象への入力信号を入力するニューラルネットワークモ
デルと、前記ニューラルネットワークの出力と前記制御
対象への入力信号とを加算した信号と、前記加算した信
号を入力信号とする線形モデルと、前記制御対象の出力
と前記線形モデルの出力が等しくなるように前記ニュー
ラルネットワークの各層間の重みを変化させる学習手段
と、前記ニューラルネットワークの出力が前記目標値を
補正する手段とを含むものである。
明は、制御対象の制御出力を目標値に一致させるように
前記目標値と前記制御出力との制御偏差をフィードバッ
ク制御する制御器を有する制御装置において、前記制御
対象への入力信号を入力するニューラルネットワークモ
デルと、前記ニューラルネットワークの出力と前記制御
対象への入力信号とを加算した信号と、前記加算した信
号を入力信号とする線形モデルと、前記制御対象の出力
と前記線形モデルの出力が等しくなるように前記ニュー
ラルネットワークの各層間の重みを変化させる学習手段
と、前記ニューラルネットワークの出力が前記目標値を
補正する手段とを含むものである。
【0013】さらに、第一の発明をディスク装置へ適用
した場合は、情報が記録される円板と、前記円板との間
で情報の読みだしまたは書き込みを行うヘッドと、前記
円板に記録された位置情報と前記ヘッドの位置との偏差
を検出し偏差位置信号を出力するヘッド位置検出器と、
前記偏差位置信号を零にするように前記偏差位置信号を
フィードバック制御する制御器と、前記制御器の出力を
駆動入力とする前記ヘッドと一体に移動するアクチュエ
ータを備えたディスク装置において、前記制御器の出力
を入力信号とするニューラルネットワークモデルと、前
記制御器の出力を入力信号とする線形モデルと、前記ニ
ューラルネットワークの出力を前記アクチュエータの入
力信号とし、前記偏差位置信号と前記線形モデルの出力
が等しくなるように前記ニューラルネットワークの各層
間の重みを変化させる学習手段とを含むものである。
した場合は、情報が記録される円板と、前記円板との間
で情報の読みだしまたは書き込みを行うヘッドと、前記
円板に記録された位置情報と前記ヘッドの位置との偏差
を検出し偏差位置信号を出力するヘッド位置検出器と、
前記偏差位置信号を零にするように前記偏差位置信号を
フィードバック制御する制御器と、前記制御器の出力を
駆動入力とする前記ヘッドと一体に移動するアクチュエ
ータを備えたディスク装置において、前記制御器の出力
を入力信号とするニューラルネットワークモデルと、前
記制御器の出力を入力信号とする線形モデルと、前記ニ
ューラルネットワークの出力を前記アクチュエータの入
力信号とし、前記偏差位置信号と前記線形モデルの出力
が等しくなるように前記ニューラルネットワークの各層
間の重みを変化させる学習手段とを含むものである。
【0014】また、上記第二の発明をディスク装置へ適
用した場合は、情報が記録される円板と、前記円板との
間で情報の読みだしまたは書き込みを行うヘッドと、前
記円板に記録された位置情報と前記ヘッドの位置との偏
差を検出し偏差位置信号を出力するヘッド位置検出器
と、前記偏差位置信号を零にするように前記偏差位置信
号をフィードバック制御する制御器と、前記制御器の出
力を駆動入力とする前記ヘッドと一体に移動するアクチ
ュエータを備えたディスク装置において、前記制御器の
出力を入力信号とするニューラルネットワークモデル
と、前記制御器の出力を入力信号とする線形モデルと、
前記制御器の出力を前記アクチュエータの入力信号と
し、前記偏差位置信号と、前記線形モデルの出力に前記
ニューラルネットワークの出力を加算した信号とが等し
くなるように前記ニューラルネットワークの各層間の重
みを変化させる学習手段と、前記ニューラルネットワー
クの出力が前記偏差位置信号を補正する手段とを含むも
のである。
用した場合は、情報が記録される円板と、前記円板との
間で情報の読みだしまたは書き込みを行うヘッドと、前
記円板に記録された位置情報と前記ヘッドの位置との偏
差を検出し偏差位置信号を出力するヘッド位置検出器
と、前記偏差位置信号を零にするように前記偏差位置信
号をフィードバック制御する制御器と、前記制御器の出
力を駆動入力とする前記ヘッドと一体に移動するアクチ
ュエータを備えたディスク装置において、前記制御器の
出力を入力信号とするニューラルネットワークモデル
と、前記制御器の出力を入力信号とする線形モデルと、
前記制御器の出力を前記アクチュエータの入力信号と
し、前記偏差位置信号と、前記線形モデルの出力に前記
ニューラルネットワークの出力を加算した信号とが等し
くなるように前記ニューラルネットワークの各層間の重
みを変化させる学習手段と、前記ニューラルネットワー
クの出力が前記偏差位置信号を補正する手段とを含むも
のである。
【0015】また、上記第三の発明をディスク装置へ適
用した場合は、情報が記録される円板と、前記円板との
間で情報の読みだしまたは書き込みを行うヘッドと、前
記円板に記録された位置情報と前記ヘッドの位置との偏
差を検出し偏差位置信号を出力するヘッド位置検出器
と、前記偏差位置信号を零にするように前記偏差位置信
号をフィードバック制御する制御器と、前記制御器の出
力を駆動入力とする前記ヘッドと一体に移動するアクチ
ュエータを備えたディスク装置において、前記アクチュ
エータへの入力信号を入力するニューラルネットワーク
モデルと、前記ニューラルネットワークの出力と前記ア
クチュエータへの入力信号とを加算した信号と、前記加
算した信号を入力信号とする線形モデルと、前記アクチ
ュエータの出力と前記線形モデルの出力が等しくなるよ
うに前記ニューラルネットワークの各層間の重みを変化
させる学習手段と、前記ニューラルネットワークの出力
が前記制御器の出力を補正する手段とを含むものであ
る。
用した場合は、情報が記録される円板と、前記円板との
間で情報の読みだしまたは書き込みを行うヘッドと、前
記円板に記録された位置情報と前記ヘッドの位置との偏
差を検出し偏差位置信号を出力するヘッド位置検出器
と、前記偏差位置信号を零にするように前記偏差位置信
号をフィードバック制御する制御器と、前記制御器の出
力を駆動入力とする前記ヘッドと一体に移動するアクチ
ュエータを備えたディスク装置において、前記アクチュ
エータへの入力信号を入力するニューラルネットワーク
モデルと、前記ニューラルネットワークの出力と前記ア
クチュエータへの入力信号とを加算した信号と、前記加
算した信号を入力信号とする線形モデルと、前記アクチ
ュエータの出力と前記線形モデルの出力が等しくなるよ
うに前記ニューラルネットワークの各層間の重みを変化
させる学習手段と、前記ニューラルネットワークの出力
が前記制御器の出力を補正する手段とを含むものであ
る。
【0016】
【作用】本発明では、制御対象を希望の線形モデルとな
るようにニューラルネットワークを用いて操作量や目標
値を補正するため、制御対象の非線形性や外乱等の影響
を考慮することなく設定した線形モデルに基づいて種々
の線形制御系を構成することができ、高精度で高速な応
答を得ることが可能となる。設計者が設定する希望の線
形モデルは、非線形な制御対象の平衡点まわりでの線形
化したダイナミクスに設定することが望ましいが、設定
した線形モデルと実際の線形化ダイナミクスとの間の誤
差は、ニューラルネットワーク内に獲得され適切に補償
されるため、特に厳密な線形化モデルを設定する必要は
ない。
るようにニューラルネットワークを用いて操作量や目標
値を補正するため、制御対象の非線形性や外乱等の影響
を考慮することなく設定した線形モデルに基づいて種々
の線形制御系を構成することができ、高精度で高速な応
答を得ることが可能となる。設計者が設定する希望の線
形モデルは、非線形な制御対象の平衡点まわりでの線形
化したダイナミクスに設定することが望ましいが、設定
した線形モデルと実際の線形化ダイナミクスとの間の誤
差は、ニューラルネットワーク内に獲得され適切に補償
されるため、特に厳密な線形化モデルを設定する必要は
ない。
【0017】また、第一の発明では、ニューラルネット
ワークが制御ループ内に直列に挿入されているため、制
御対象に乗法的な非線形性や外乱が作用した場合に特に
効果を発揮する。第二の発明では、ニューラルネットワ
ークが目標値を加法的に修正するため、制御対象の出力
端に加法的な非線形性や外乱が作用した場合に特に効果
を発揮する。第三の発明では、ニューラルネットワーク
が操作量を加法的に修正するため、制御対象の入力端に
加法的な非線形性や外乱が作用した場合に特に効果を発
揮する。
ワークが制御ループ内に直列に挿入されているため、制
御対象に乗法的な非線形性や外乱が作用した場合に特に
効果を発揮する。第二の発明では、ニューラルネットワ
ークが目標値を加法的に修正するため、制御対象の出力
端に加法的な非線形性や外乱が作用した場合に特に効果
を発揮する。第三の発明では、ニューラルネットワーク
が操作量を加法的に修正するため、制御対象の入力端に
加法的な非線形性や外乱が作用した場合に特に効果を発
揮する。
【0018】以上、本発明は制御対象の非線形性や外乱
等の作用する箇所に応じてニューラルネットワークを用
いて効果的に補正する手段を提供するものであるが、い
ずれの発明も特定した箇所の非線形性や外乱の影響のみ
を抑制するものではなく、他の箇所で作用する非線形性
や外乱の影響も有効に抑制することが可能である。
等の作用する箇所に応じてニューラルネットワークを用
いて効果的に補正する手段を提供するものであるが、い
ずれの発明も特定した箇所の非線形性や外乱の影響のみ
を抑制するものではなく、他の箇所で作用する非線形性
や外乱の影響も有効に抑制することが可能である。
【0019】
【実施例】以下、本発明の一実施例を図を用いて詳細に
説明する。
説明する。
【0020】図1は、第一の発明の一実施例を表す図で
ある。第一の発明は、制御対象に乗法的な非線形性や外
乱が作用した場合に特に効果を発揮する。
ある。第一の発明は、制御対象に乗法的な非線形性や外
乱が作用した場合に特に効果を発揮する。
【0021】図1において、1は制御対象、2は制御対
象の出力Y、3は制御対象への入力U、4はニューラル
ネットワーク、6は設計者が指定する線形モデル、8は
誤差信号9を最小にするようにニューラルネットワーク
4の各層間の結合加重をバックプロパゲーション法など
を用いて演算する学習手段、14は目標値R、10は線
形モデル6を安定に制御できるように設計されたフィー
ドバック補償器、12は線形モデル6の逆ダイナミクス
に基づいて高応答性を目的として設計されたフィードフ
ォワード補償器である。ここで、線形モデル6は、非線
形な制御対象を平衡点まわりで線形化したモデルに設定
することが望ましいが、それに限る必要はなく希望の線
形モデルとしてもよい。物理モデルを導くことが困難な
場合には、例えば、2次の線形モデルと仮定し、平衡点
まわりでのパラメータ同定を事前に行い、得られた結果
を線形モデルとして用いればよい。また、フィードフォ
ワード補償器12は、高応答性を必要としなければ用い
る必要はない。
象の出力Y、3は制御対象への入力U、4はニューラル
ネットワーク、6は設計者が指定する線形モデル、8は
誤差信号9を最小にするようにニューラルネットワーク
4の各層間の結合加重をバックプロパゲーション法など
を用いて演算する学習手段、14は目標値R、10は線
形モデル6を安定に制御できるように設計されたフィー
ドバック補償器、12は線形モデル6の逆ダイナミクス
に基づいて高応答性を目的として設計されたフィードフ
ォワード補償器である。ここで、線形モデル6は、非線
形な制御対象を平衡点まわりで線形化したモデルに設定
することが望ましいが、それに限る必要はなく希望の線
形モデルとしてもよい。物理モデルを導くことが困難な
場合には、例えば、2次の線形モデルと仮定し、平衡点
まわりでのパラメータ同定を事前に行い、得られた結果
を線形モデルとして用いればよい。また、フィードフォ
ワード補償器12は、高応答性を必要としなければ用い
る必要はない。
【0022】次に、本実施例のステップk時刻における
制御の流れについて説明する。まず、制御対象の出力Y
(k)2を読み取る。フィードバック補償器10は、目標
値R(k)14と制御対象の出力Y(k)2との偏差に基づ
いてUb(k)11 を発生する。フィードフォワード補償
器12は、目標値R(k)14に基づいてUf(k)13を
発生する。Uf(k)13とUb(k)11は加算され、Ubf
(k)16となる。ニューラルネットワーク4は、Ubf
(k)16、および制御対象の出力Y(k),1ステップ過
去の出力Y(k−1),…,nステップ過去の出力Y(k
−n)、および1ステップ過去の操作量U(k−1),2
ステップ過去の操作量U(k−2),…,mステップ過去
の操作量U(k−m)を入力層に設定する。ステップn及
びmの選定は、それぞれ線形モデル6の分母と分子の次
数と同じかそれ以上に設定することが望ましい。
制御の流れについて説明する。まず、制御対象の出力Y
(k)2を読み取る。フィードバック補償器10は、目標
値R(k)14と制御対象の出力Y(k)2との偏差に基づ
いてUb(k)11 を発生する。フィードフォワード補償
器12は、目標値R(k)14に基づいてUf(k)13を
発生する。Uf(k)13とUb(k)11は加算され、Ubf
(k)16となる。ニューラルネットワーク4は、Ubf
(k)16、および制御対象の出力Y(k),1ステップ過
去の出力Y(k−1),…,nステップ過去の出力Y(k
−n)、および1ステップ過去の操作量U(k−1),2
ステップ過去の操作量U(k−2),…,mステップ過去
の操作量U(k−m)を入力層に設定する。ステップn及
びmの選定は、それぞれ線形モデル6の分母と分子の次
数と同じかそれ以上に設定することが望ましい。
【0023】ニューラルネットワーク4は、制御対象に
加わる非線形性や外乱を獲得する都合上、三層以上が望
ましいが、二層にして線形なニューロンを用いることで
演算処理を低減しても良い。また、中間層の出力を入力
層の入力にフィードバックするリカレント型のニューラ
ルネットワークを用いても良い。この場合は、制御対象
の出力Y(k)2,操作量U(k−1)3,補償器の出力U
bf(k)16のみをニューラルネットワーク4の入力層に
入力すればよい。ニューラルネットワークの出力は、k
ステップにおける制御対象への操作量U(k)3となる。
加わる非線形性や外乱を獲得する都合上、三層以上が望
ましいが、二層にして線形なニューロンを用いることで
演算処理を低減しても良い。また、中間層の出力を入力
層の入力にフィードバックするリカレント型のニューラ
ルネットワークを用いても良い。この場合は、制御対象
の出力Y(k)2,操作量U(k−1)3,補償器の出力U
bf(k)16のみをニューラルネットワーク4の入力層に
入力すればよい。ニューラルネットワークの出力は、k
ステップにおける制御対象への操作量U(k)3となる。
【0024】以上の演算が終了した後に、ニューラルネ
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワーク4と制御対象1のダイナミクスの積が、
設定した線形モデル6と等しくなるようにニューラルネ
ットワーク4の学習を行う。すなわち、学習手段8を用
いて、制御対象の出力Y(k)2と線形モデルの出力Ym
(k)7の差が最小になるようにニューラルネットワーク
4の学習を行う。
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワーク4と制御対象1のダイナミクスの積が、
設定した線形モデル6と等しくなるようにニューラルネ
ットワーク4の学習を行う。すなわち、学習手段8を用
いて、制御対象の出力Y(k)2と線形モデルの出力Ym
(k)7の差が最小になるようにニューラルネットワーク
4の学習を行う。
【0025】まず、ニューラルネットワーク4の構造に
ついて説明する。ニューラルネットワークの構造は、基
本的には多層構造をとり、例えば、三層構造では、入力
層の各ニューロンは中間層のニューロンの入力となり、
中間層のニューロンの出力は出力層の入力となる。以
下、層数を三層に限定して説明する。ここで、入力層と
中間層間の結合荷重をWijとし、中間層と出力層間の結
合荷重をVj とする。各ニューロンの入出力特性は、シ
グモイド関数によってモデル化される。シグモイド関数
F(X)は、Xを入力信号とすると
ついて説明する。ニューラルネットワークの構造は、基
本的には多層構造をとり、例えば、三層構造では、入力
層の各ニューロンは中間層のニューロンの入力となり、
中間層のニューロンの出力は出力層の入力となる。以
下、層数を三層に限定して説明する。ここで、入力層と
中間層間の結合荷重をWijとし、中間層と出力層間の結
合荷重をVj とする。各ニューロンの入出力特性は、シ
グモイド関数によってモデル化される。シグモイド関数
F(X)は、Xを入力信号とすると
【0026】
【数1】 F(X)=2/(1+exp(−X))−1 …(数1) で表される。ここでは、入力層のニューロンはシグモイ
ド変換を施さず、中間層および出力層のニューロンはシ
グモイド変換を施す。入力層への入力信号をXi(k)(i
=1〜n+m+2),中間層の出力信号をHj(k)(j
=1〜q),出力層の出力信号をU(k)(第一の発明で
は操作量U(k)に等しい)とする。ただし、中間層のニ
ューロン数qは、試行錯誤的に決定する必要がある。す
ると、Hj(k),U(k)は、それぞれ数2,数3のよう
になる。ただし、ここではオフセット量については記述
しない。
ド変換を施さず、中間層および出力層のニューロンはシ
グモイド変換を施す。入力層への入力信号をXi(k)(i
=1〜n+m+2),中間層の出力信号をHj(k)(j
=1〜q),出力層の出力信号をU(k)(第一の発明で
は操作量U(k)に等しい)とする。ただし、中間層のニ
ューロン数qは、試行錯誤的に決定する必要がある。す
ると、Hj(k),U(k)は、それぞれ数2,数3のよう
になる。ただし、ここではオフセット量については記述
しない。
【0027】
【数2】
【0028】
【数3】
【0029】次に、ニューラルネットワーク4の学習ア
ルゴリズムについて説明する。ニューラルネットワーク
4の学習手段8は、ニューロン間の結合荷重を変化させ
ることによって行われる。ここでは、誤差逆伝播法(バ
ックプロパゲーションアルゴリズム)について説明す
る。学習手段8は、制御対象の出力Y(k)2と線形モデ
ルの出力Ym(k)7との誤差E(k)の二乗誤差、すなわ
ち、
ルゴリズムについて説明する。ニューラルネットワーク
4の学習手段8は、ニューロン間の結合荷重を変化させ
ることによって行われる。ここでは、誤差逆伝播法(バ
ックプロパゲーションアルゴリズム)について説明す
る。学習手段8は、制御対象の出力Y(k)2と線形モデ
ルの出力Ym(k)7との誤差E(k)の二乗誤差、すなわ
ち、
【0030】
【数4】 J(k)=(Y(k)−Ym(k))2/2 =E(k)2/2 …(数4) を最小にするように、結合荷重を変えることを行う。こ
の学習処理は、出力層から入力層へ向かって順次行う。
の学習処理は、出力層から入力層へ向かって順次行う。
【0031】結合荷重は、数5〜数8に従って変化させ
る。
る。
【0032】
【数5】 △Vj(k)=−η・∂J(k)/∂Vj(k) =η・E(k)・∂Y(k)/∂U(k)・(1−U(k)2)/2・Hj(k) …(数5)
【0033】
【数6】 △Wji(k)=−η・∂J(k)/∂Wji(k) =η・E(k)・∂Y(k)/∂U(k)・(1−U(k)2) ・Vj(k)・(1−Hj(k)2)/2・Xi(k) …(数6)
【0034】
【数7】 Vj(k+1)=Vj(k)+△Vj(k) …(数7)
【0035】
【数8】 Wji(k+1)=Wji(k)+△Wji(k) …(数8) ここで、ηは学習定数でニューロンの数や層の数さらに
は入出力値等から経験的に決定される。また、第一の発
明では、数5および数6の計算の際に、∂Y(k)/∂U
(k)の制御対象の情報が必要になる。これは、制御対象
の非線形性が弱い場合には、線形化したモデルの直流ゲ
インを∂Y(k)/∂U(k)とすればよい。また、制御対
象の非線形が強い場合には、事前に制御対象のダイナミ
クスを別の同定用のニューラルネットワークに学習さ
せ、∂Y(k)/∂U(k)の代わりに同定したニューラル
ネットワークから入力の変化分に対する出力の変化分を
計算すればよい。
は入出力値等から経験的に決定される。また、第一の発
明では、数5および数6の計算の際に、∂Y(k)/∂U
(k)の制御対象の情報が必要になる。これは、制御対象
の非線形性が弱い場合には、線形化したモデルの直流ゲ
インを∂Y(k)/∂U(k)とすればよい。また、制御対
象の非線形が強い場合には、事前に制御対象のダイナミ
クスを別の同定用のニューラルネットワークに学習さ
せ、∂Y(k)/∂U(k)の代わりに同定したニューラル
ネットワークから入力の変化分に対する出力の変化分を
計算すればよい。
【0036】図2は、図1で制御ループ内に直列に結合
されているニューラルネットワークを制御ループと並列
に配置したニューラルネットワークを用いた適応制御装
置である。ここで、17はループ内に設けた加算点であ
る。ニューラルネットワーク4の出力Un は、補償器の
出力信号Ubf16を加法的に補正する。すなわち、本実
施例では、従来の制御系の構造を変更することなく、ニ
ューラルネットワーク4,学習手段8、および線形モデ
ル6を付加することで特性の改善を行うことができる。
さらに、誤差信号E(k)9の収束状況に基づいてニュー
ラルネットワークの出力のループ内への補正を制御する
ことができる。
されているニューラルネットワークを制御ループと並列
に配置したニューラルネットワークを用いた適応制御装
置である。ここで、17はループ内に設けた加算点であ
る。ニューラルネットワーク4の出力Un は、補償器の
出力信号Ubf16を加法的に補正する。すなわち、本実
施例では、従来の制御系の構造を変更することなく、ニ
ューラルネットワーク4,学習手段8、および線形モデ
ル6を付加することで特性の改善を行うことができる。
さらに、誤差信号E(k)9の収束状況に基づいてニュー
ラルネットワークの出力のループ内への補正を制御する
ことができる。
【0037】図3は、第二の発明の一実施例を表すブロ
ック図である。第二の発明は、制御対象の出力端に加法
的な非線形性や外乱が作用した場合に特に効果を発揮す
る。
ック図である。第二の発明は、制御対象の出力端に加法
的な非線形性や外乱が作用した場合に特に効果を発揮す
る。
【0038】ステップk時刻における制御の流れについ
て説明する。まず、制御対象の出力Y(k)2を読み取
る。ニューラルネットワーク4は、制御対象の出力Y
(k),1ステップ過去の出力Y(k−1),…,nステッ
プ過去の出力Y(k−n)、および1ステップ過去の操作
量U(k−1),2ステップ過去の操作量U(k−2),
…,mステップ過去の操作量U(k−m)を入力層に設定
する。次に、ニューラルネットワークの出力Yn(k)5
を用いて目標値R(k)14を補正する。フィードバック
補償器10は、補正された目標値18と制御対象の出力
2との偏差に基づいてUb(k)11 を発生し、フィード
フォワード補償器12は、補正された目標値18に基づ
いてUf(k)13を発生する。Uf(k)13とUb(k)1
1 は加算され、kステップにおける操作量U(k)3と
なる。
て説明する。まず、制御対象の出力Y(k)2を読み取
る。ニューラルネットワーク4は、制御対象の出力Y
(k),1ステップ過去の出力Y(k−1),…,nステッ
プ過去の出力Y(k−n)、および1ステップ過去の操作
量U(k−1),2ステップ過去の操作量U(k−2),
…,mステップ過去の操作量U(k−m)を入力層に設定
する。次に、ニューラルネットワークの出力Yn(k)5
を用いて目標値R(k)14を補正する。フィードバック
補償器10は、補正された目標値18と制御対象の出力
2との偏差に基づいてUb(k)11 を発生し、フィード
フォワード補償器12は、補正された目標値18に基づ
いてUf(k)13を発生する。Uf(k)13とUb(k)1
1 は加算され、kステップにおける操作量U(k)3と
なる。
【0039】以上の演算が終了した後に、ニューラルネ
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワークの出力5と設定した線形モデルの出力7
の加算した信号が、制御対象の出力2と等しくなるよう
にニューラルネットワークの学習を行う。すなわち、学
習手段8は、制御対象の出力Y(k)2と線形モデルの出
力Ym(k)7とニューラルネットワークの出力Yn(k)の
誤差E(k)の二乗誤差、すなわち、
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワークの出力5と設定した線形モデルの出力7
の加算した信号が、制御対象の出力2と等しくなるよう
にニューラルネットワークの学習を行う。すなわち、学
習手段8は、制御対象の出力Y(k)2と線形モデルの出
力Ym(k)7とニューラルネットワークの出力Yn(k)の
誤差E(k)の二乗誤差、すなわち、
【0040】
【数9】 J(k)=(Y(k)−Ym(k)−Yn(k))2/2 =E(k)2/2 …(数9) を最小にするように、結合荷重を変えることを行う。こ
の学習処理は、出力層から入力層へ向かって順次行う。
の学習処理は、出力層から入力層へ向かって順次行う。
【0041】結合荷重は、次式に従って変化させる。
【0042】
【数10】 △Vj(k)=−η・∂J(k)/∂Vj(k) =η・E(k)・(1−Yn(k)2)/2・Hj(k) …(数10)
【0043】
【数11】 △Wji(k)=−η・∂J(k)/∂Wji(k) =η・E(k)・(1−Yn(k)2)・Vj(k) ・(1−Hj(k)2)/2・Xi(k) …(数11)
【0044】
【数12】 Vj(k+1)=Vj(k)+△Vj(k) …(数12)
【0045】
【数13】 Wji(k+1)=Wji(k)+△Wji(k) …(数13) 上式より、第二の発明では、第一の発明で数5および数
6を計算する際に必要とした∂Y(k)/∂U(k)の制御
対象の事前情報を必要としない。
6を計算する際に必要とした∂Y(k)/∂U(k)の制御
対象の事前情報を必要としない。
【0046】図4は、第三の発明の一実施例を表すブロ
ック図である。第三の発明は、制御対象の入力端に加法
的な非線形性や外乱が作用した場合に特に効果を発揮す
る。
ック図である。第三の発明は、制御対象の入力端に加法
的な非線形性や外乱が作用した場合に特に効果を発揮す
る。
【0047】ステップk時刻における制御の流れについ
て説明する。まず、制御対象の出力Y(k)2を読み取
る。フィードバック補償器10は、目標値R(k)14 と
制御対象の出力2との偏差に基づいてUb(k)11 を発
生する。フィードフォワード補償器12は、目標値R
(k)14に基づいてUf(k)13を発生する。ニューラ
ルネットワーク4は、制御対象の出力Y(k),1ステッ
プ過去の出力Y(k−1),…,nステップ過去の出力Y
(k−n)、および1ステップ過去の操作量U(k−1),
2ステップ過去の操作量U(k−2),…,mステップ過去
の操作量U(k−m)を入力層に設定する。ニューラルネ
ットワーク4の出力Yn(k)5は、Uf(k)13とUb
(k)11 の加算した信号を補正して、kステップにお
ける操作量U(k)3となる。
て説明する。まず、制御対象の出力Y(k)2を読み取
る。フィードバック補償器10は、目標値R(k)14 と
制御対象の出力2との偏差に基づいてUb(k)11 を発
生する。フィードフォワード補償器12は、目標値R
(k)14に基づいてUf(k)13を発生する。ニューラ
ルネットワーク4は、制御対象の出力Y(k),1ステッ
プ過去の出力Y(k−1),…,nステップ過去の出力Y
(k−n)、および1ステップ過去の操作量U(k−1),
2ステップ過去の操作量U(k−2),…,mステップ過去
の操作量U(k−m)を入力層に設定する。ニューラルネ
ットワーク4の出力Yn(k)5は、Uf(k)13とUb
(k)11 の加算した信号を補正して、kステップにお
ける操作量U(k)3となる。
【0048】以上の演算が終了した後に、ニューラルネ
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワークの出力Yn(k)5 と操作量U(k)3の加
算信号を入力した線形モデル4の出力Ym(k)7 が、制
御対象の出力Y(k)2と等しくなるようにニューラルネ
ットワークの学習を行う。すなわち、学習手段8は、制
御対象の出力Y(k)2と線形モデルの出力Ym(k)7 の
誤差E(k)の二乗誤差、すなわち、
ットワーク4の学習が行われる。本発明では、ニューラ
ルネットワークの出力Yn(k)5 と操作量U(k)3の加
算信号を入力した線形モデル4の出力Ym(k)7 が、制
御対象の出力Y(k)2と等しくなるようにニューラルネ
ットワークの学習を行う。すなわち、学習手段8は、制
御対象の出力Y(k)2と線形モデルの出力Ym(k)7 の
誤差E(k)の二乗誤差、すなわち、
【0049】
【数14】 J(k)=(Y(k)−Ym(k))2/2 =E(k)2/2 …(数14) を最小にするように、結合荷重を変えることを行う。こ
の学習処理は、出力層から入力層へ向かって順次行う。
の学習処理は、出力層から入力層へ向かって順次行う。
【0050】結合荷重は、次式に従って変化させる。
【0051】
【数15】 △Vj(k)=−η・∂J(k)/∂Vj(k) =η・E(k)・b0・(1−Yn(k)2)/2・Hj(k)…(数15)
【0052】
【数16】 △Wji(k)=−η・∂J(k)/∂Wji(k) =η・E(k)・b0・(1−Yn(k)2)・Vj(k) ・(1−Hj(k)2)/2・Xi(k) …(数16)
【0053】
【数17】 Vj(k+1)=Vj(k)+△Vj(k) …(数17)
【0054】
【数18】 Wji(k+1)=Wji(k)+△Wji(k) …(数18) ただし、b0は線形モデル6の直流ゲイン、すなわち、
b0=∂Ym(k)/∂Yn(k) である。上式より、第三
の発明では、第一の発明で数5および数6を計算する際
に必要とした∂Y(k)/∂U(k)の制御対象の事前情報
を必要としない。
b0=∂Ym(k)/∂Yn(k) である。上式より、第三
の発明では、第一の発明で数5および数6を計算する際
に必要とした∂Y(k)/∂U(k)の制御対象の事前情報
を必要としない。
【0055】図5は、第一の発明の上記実施例をディス
ク装置で実現するハードウエアのブロック図の一例であ
る。図5に示す構成法は、第二の発明や第三の発明の上
記実施例を実現するハードウエアの構成方法としても有
効である。
ク装置で実現するハードウエアのブロック図の一例であ
る。図5に示す構成法は、第二の発明や第三の発明の上
記実施例を実現するハードウエアの構成方法としても有
効である。
【0056】図5に示すように、図1における制御対象
1はヘッド支持機構系からなる。ヘッド支持機構系は、
具体的には、ヘッド31を支持する機構32,その機構
を駆動するボイスコイルモータ33,ボイスコイルモー
タに電流を印加するパワーアンプ34,ディジタル信号
をアナログ信号に変換するDA変換器35,ディスク円
板30に記録されたトラック上の目標軌道36とヘッド
31との偏差位置信号37:Ye を検出するヘッド位置
検出手段38、及びアナログ信号をディジタル信号に変
換するAD変換器39において、DA変換器からAD変
換器までのダイナミクスを表す。
1はヘッド支持機構系からなる。ヘッド支持機構系は、
具体的には、ヘッド31を支持する機構32,その機構
を駆動するボイスコイルモータ33,ボイスコイルモー
タに電流を印加するパワーアンプ34,ディジタル信号
をアナログ信号に変換するDA変換器35,ディスク円
板30に記録されたトラック上の目標軌道36とヘッド
31との偏差位置信号37:Ye を検出するヘッド位置
検出手段38、及びアナログ信号をディジタル信号に変
換するAD変換器39において、DA変換器からAD変
換器までのダイナミクスを表す。
【0057】これらのダイナミクスは、基本的には二次
遅れ系でモデル化される。しかし、ボイスコイルモータ
33の位置によるゲイン変動や、ヘッド位置検出手段3
8の非線形性や、ヘッド支持機構32の温度によるダイ
ナミクス変動などの乗法的非線形変動が存在する。ま
た、トラック上に記録されている目標軌道36は、目標
軌道を記録する際のディスク装置の振動やディスク円板
30の回転振動によりわずかながら真円よりうねって記
録される。すなわち、ディスク装置では、制御対象の出
力端に加法的な外乱が存在する。ディスク装置の制御目
的は、制御対象に加わる乗法的・加法的な非線形性の影
響を除去し、偏差位置信号と目標値との偏差を零にする
ことであり、この目的は、上記第一,第二,第三の発明
によって解決される。
遅れ系でモデル化される。しかし、ボイスコイルモータ
33の位置によるゲイン変動や、ヘッド位置検出手段3
8の非線形性や、ヘッド支持機構32の温度によるダイ
ナミクス変動などの乗法的非線形変動が存在する。ま
た、トラック上に記録されている目標軌道36は、目標
軌道を記録する際のディスク装置の振動やディスク円板
30の回転振動によりわずかながら真円よりうねって記
録される。すなわち、ディスク装置では、制御対象の出
力端に加法的な外乱が存在する。ディスク装置の制御目
的は、制御対象に加わる乗法的・加法的な非線形性の影
響を除去し、偏差位置信号と目標値との偏差を零にする
ことであり、この目的は、上記第一,第二,第三の発明
によって解決される。
【0058】図5における演算処理は、マイクロプロセ
ッサシステム46内で実行される。マイクロプロセッサ
システム46では、マイクロプロセッサ41とニューロ
プロセッサ40がバスライン45を介して、RAM(ラ
ンダムアクセスメモリ)42,ROM(読みだし専用メ
モリ)43に接続されている。ROM43は、ニューラ
ルネットワーク4の構造,学習手段8,フィードバック
補償器10,フィードフォワード補償器12、および線
形モデル6のプログラムを格納する。RAM42は、制
御対象の入出力信号を一時的に記憶する役割をはたす。
ニューロプロセッサ40は、マイクロプロセッサ41で
代用してもよいが、AD変換器39の出力結果を基にニ
ューラルネットワークの演算(数2,数3)と学習の演
算(数7,数8)を高速に実行する。ニューラルネット
ワークの出力の結果は、操作量3となり、バスライン4
5を介してDA変換器35へ印加される。コマンド発生
器44は、AD変換器の出力信号を監視し、学習手段9
のスイッチの役割をはたす。
ッサシステム46内で実行される。マイクロプロセッサ
システム46では、マイクロプロセッサ41とニューロ
プロセッサ40がバスライン45を介して、RAM(ラ
ンダムアクセスメモリ)42,ROM(読みだし専用メ
モリ)43に接続されている。ROM43は、ニューラ
ルネットワーク4の構造,学習手段8,フィードバック
補償器10,フィードフォワード補償器12、および線
形モデル6のプログラムを格納する。RAM42は、制
御対象の入出力信号を一時的に記憶する役割をはたす。
ニューロプロセッサ40は、マイクロプロセッサ41で
代用してもよいが、AD変換器39の出力結果を基にニ
ューラルネットワークの演算(数2,数3)と学習の演
算(数7,数8)を高速に実行する。ニューラルネット
ワークの出力の結果は、操作量3となり、バスライン4
5を介してDA変換器35へ印加される。コマンド発生
器44は、AD変換器の出力信号を監視し、学習手段9
のスイッチの役割をはたす。
【0059】図6は、上記実施例を用いない場合のディ
スク装置の操作量U3から制御対象の出力Y2までのヘ
ッド支持機構系のゲイン線図の一例である。加振信号の
ゲインを変えて3回測定した結果をプロットしている。
基本的には二次遅れ系としてモデル化可能であるが、低
域にはベアリング等の粘性抵抗等の影響が、高域にはヘ
ッドを支える支持系の影響が表れているのが分かる。従
来は、これらの影響を考慮することなく、平均化した二
次遅れ系で制御対象をモデル化し、各補償器の設計を行
っていた。
スク装置の操作量U3から制御対象の出力Y2までのヘ
ッド支持機構系のゲイン線図の一例である。加振信号の
ゲインを変えて3回測定した結果をプロットしている。
基本的には二次遅れ系としてモデル化可能であるが、低
域にはベアリング等の粘性抵抗等の影響が、高域にはヘ
ッドを支える支持系の影響が表れているのが分かる。従
来は、これらの影響を考慮することなく、平均化した二
次遅れ系で制御対象をモデル化し、各補償器の設計を行
っていた。
【0060】一方、図7は、実施例を用いた場合の補償
器の出力信号Ubf16から制御対象の出力Y2までのヘ
ッド支持機構系のゲイン線図の一例である。図6と同様
に、加振信号のゲインを変えて3回測定した結果をプロ
ットしている。ニューラルネットワークによって低域の
非線形性と高域の非線形性が補償され、すべての周波数
帯域で設計者が設定した二次遅れ系の線形モデルとなっ
ていることが分かる。これにより、線形モデルに基づい
たフィードバック補償器やフィードフォワード補償器が
有効に働き、制御対象に非線形や外乱が存在するにもか
かわらず、安定した応答を得ることが可能となる。
器の出力信号Ubf16から制御対象の出力Y2までのヘ
ッド支持機構系のゲイン線図の一例である。図6と同様
に、加振信号のゲインを変えて3回測定した結果をプロ
ットしている。ニューラルネットワークによって低域の
非線形性と高域の非線形性が補償され、すべての周波数
帯域で設計者が設定した二次遅れ系の線形モデルとなっ
ていることが分かる。これにより、線形モデルに基づい
たフィードバック補償器やフィードフォワード補償器が
有効に働き、制御対象に非線形や外乱が存在するにもか
かわらず、安定した応答を得ることが可能となる。
【0061】実施例では、ディスク装置について説明し
たが、本発明はロボットなどの他のメカトロニクス機器
のシステムに適用しても上記と同様の効果を得ることが
できる。
たが、本発明はロボットなどの他のメカトロニクス機器
のシステムに適用しても上記と同様の効果を得ることが
できる。
【0062】
【発明の効果】本発明によれば、制御対象を希望の線形
モデルとなるようにニューラルネットワークを用いて操
作量や目標値を補正する。このため、制御対象の非線形
性や外乱等の影響を考慮することなく設定した線形モデ
ルに基づいて線形制御系を構成することができ、安定し
た応答を得ることが可能となる。
モデルとなるようにニューラルネットワークを用いて操
作量や目標値を補正する。このため、制御対象の非線形
性や外乱等の影響を考慮することなく設定した線形モデ
ルに基づいて線形制御系を構成することができ、安定し
た応答を得ることが可能となる。
【図1】本発明の一実施例を示すブロック図。
【図2】本発明の第二の実施例を示すブロック図。
【図3】本発明の第三の実施例を示すブロック図。
【図4】本発明の第四の実施例を示すブロック図。
【図5】本発明のディスク装置への一例を示すブロック
図。
図。
【図6】本発明を用いない場合のゲイン線図。
【図7】本発明を用いた場合のゲイン線図。
【図8】従来のブロック図。
1…制御対象、2…制御対象の出力、3…操作量、4…
ニューラルネットワーク、6…線形モデル、7…線形モ
デルの出力、8…学習手段、9…学習手段への誤差信
号、10…フィードバック補償器、11…フィードバッ
ク補償器の出力、12…フィードフォワード補償器、1
3…フィードフォワード補償器の出力、14…目標値、
15…目標値と制御対象の出力の偏差。
ニューラルネットワーク、6…線形モデル、7…線形モ
デルの出力、8…学習手段、9…学習手段への誤差信
号、10…フィードバック補償器、11…フィードバッ
ク補償器の出力、12…フィードフォワード補償器、1
3…フィードフォワード補償器の出力、14…目標値、
15…目標値と制御対象の出力の偏差。
Claims (1)
- 【請求項1】制御対象の制御出力を目標値に一致させる
ように前記目標値と前記制御出力との制御偏差をフィー
ドバック制御する制御器を有する制御装置において、 前記制御器の出力を入力信号とするニューラルネットワ
ークモデルと、前記制御器の出力を入力信号とする線形
モデルと、前記ニューラルネットワークの出力を前記制
御対象の入力信号とし、前記制御対象の出力と前記線形
モデルの出力が等しくなるように前記ニューラルネット
ワークの各層間の重みを変化させる学習手段とを含むこ
とを特徴とする適応制御装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP296694A JPH07210207A (ja) | 1994-01-17 | 1994-01-17 | 適応制御装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP296694A JPH07210207A (ja) | 1994-01-17 | 1994-01-17 | 適応制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07210207A true JPH07210207A (ja) | 1995-08-11 |
Family
ID=11544119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP296694A Pending JPH07210207A (ja) | 1994-01-17 | 1994-01-17 | 適応制御装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07210207A (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003520478A (ja) * | 2000-01-13 | 2003-07-02 | シーメンス アクチエンゲゼルシヤフト | 高周波高電力増幅器を直線化する方法及び装置 |
KR100447135B1 (ko) * | 1997-12-30 | 2004-11-03 | 엘지전자 주식회사 | 비선형시스템의추종제어장치 |
JP2006107280A (ja) * | 2004-10-07 | 2006-04-20 | Honda Motor Co Ltd | プラントの制御装置 |
JP2014112282A (ja) * | 2012-12-05 | 2014-06-19 | Fuji Heavy Ind Ltd | 飛行制御システム |
JP2018106561A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社大気社 | 熱交換システム、コントローラ、及び、ニューラルネットワークの構築方法 |
DE102018203956A1 (de) | 2017-03-31 | 2018-10-04 | Fanuc Corporation | Maschinelle Lernvorrichtung, Servosteuerungsvorrichtung, Servosteuerungssystem und maschinelles Lernverfahren |
CN108693829A (zh) * | 2017-04-07 | 2018-10-23 | 发那科株式会社 | 控制装置 |
DE102018003769A1 (de) | 2017-05-16 | 2018-11-22 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Servosteuersystem und Verfahren zum maschinellen Lernen |
JP6456555B1 (ja) * | 2017-11-02 | 2019-01-23 | 三菱電機株式会社 | キャリブレーション装置、キャリブレーション方法および制御装置 |
US10935939B2 (en) | 2017-03-29 | 2021-03-02 | Fanuc Corporation | Machine learning device, servo control apparatus, servo control system, and machine learning method |
CN113295043A (zh) * | 2021-05-21 | 2021-08-24 | 江苏科技大学 | 基于bp神经网络的坦克垂向稳定器神经自适应控制方法 |
-
1994
- 1994-01-17 JP JP296694A patent/JPH07210207A/ja active Pending
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100447135B1 (ko) * | 1997-12-30 | 2004-11-03 | 엘지전자 주식회사 | 비선형시스템의추종제어장치 |
JP2003520478A (ja) * | 2000-01-13 | 2003-07-02 | シーメンス アクチエンゲゼルシヤフト | 高周波高電力増幅器を直線化する方法及び装置 |
JP2006107280A (ja) * | 2004-10-07 | 2006-04-20 | Honda Motor Co Ltd | プラントの制御装置 |
US7725239B2 (en) | 2004-10-07 | 2010-05-25 | Honda Motor Co., Ltd | Plant control system |
JP4598474B2 (ja) * | 2004-10-07 | 2010-12-15 | 本田技研工業株式会社 | プラントの制御装置 |
JP2014112282A (ja) * | 2012-12-05 | 2014-06-19 | Fuji Heavy Ind Ltd | 飛行制御システム |
JP2018106561A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社大気社 | 熱交換システム、コントローラ、及び、ニューラルネットワークの構築方法 |
US10935939B2 (en) | 2017-03-29 | 2021-03-02 | Fanuc Corporation | Machine learning device, servo control apparatus, servo control system, and machine learning method |
DE102018202654B4 (de) | 2017-03-29 | 2024-07-04 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Servoregeleinrichtung, Servoregelsystem und Verfahren für maschinelles Lernen |
DE102018203956A1 (de) | 2017-03-31 | 2018-10-04 | Fanuc Corporation | Maschinelle Lernvorrichtung, Servosteuerungsvorrichtung, Servosteuerungssystem und maschinelles Lernverfahren |
CN108693833A (zh) * | 2017-03-31 | 2018-10-23 | 发那科株式会社 | 机器学习装置、伺服控制装置和系统以及机器学习方法 |
JP2018173777A (ja) * | 2017-03-31 | 2018-11-08 | ファナック株式会社 | 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法 |
DE102018203956B4 (de) | 2017-03-31 | 2021-09-30 | Fanuc Corporation | Maschinelle Lernvorrichtung, Servosteuerungsvorrichtung, Servosteuerungssystem und maschinelles Lernverfahren |
CN108693833B (zh) * | 2017-03-31 | 2019-11-01 | 发那科株式会社 | 机器学习装置、伺服控制装置和系统以及机器学习方法 |
US10481566B2 (en) | 2017-03-31 | 2019-11-19 | Fanuc Corporation | Machine learning device, servo control device, servo control system and machine learning method |
JP2018180778A (ja) * | 2017-04-07 | 2018-11-15 | ファナック株式会社 | 制御装置 |
CN108693829A (zh) * | 2017-04-07 | 2018-10-23 | 发那科株式会社 | 控制装置 |
US10503130B2 (en) | 2017-04-07 | 2019-12-10 | Fanuc Corporation | Controller |
DE102018003769A1 (de) | 2017-05-16 | 2018-11-22 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Servosteuersystem und Verfahren zum maschinellen Lernen |
US11009837B2 (en) | 2017-05-16 | 2021-05-18 | Fanuc Corporation | Machine learning device that adjusts controller gain in a servo control apparatus |
DE102018003769B4 (de) | 2017-05-16 | 2021-09-23 | Fanuc Corporation | Vorrichtung für maschinelles Lernen, Servosteuersystem und Verfahren zum maschinellen Lernen |
DE112017008018B4 (de) * | 2017-11-02 | 2021-03-04 | Mitsubishi Electric Corporation | Kalibrierungsvorrichtung, kalibrierungsverfahren und steuerungsvorrichtung |
WO2019087357A1 (ja) * | 2017-11-02 | 2019-05-09 | 三菱電機株式会社 | キャリブレーション装置、キャリブレーション方法および制御装置 |
US11298828B2 (en) | 2017-11-02 | 2022-04-12 | Mitsubishi Electric Corporation | Calibration device, calibration method, and control device |
JP6456555B1 (ja) * | 2017-11-02 | 2019-01-23 | 三菱電機株式会社 | キャリブレーション装置、キャリブレーション方法および制御装置 |
CN113295043A (zh) * | 2021-05-21 | 2021-08-24 | 江苏科技大学 | 基于bp神经网络的坦克垂向稳定器神经自适应控制方法 |
CN113295043B (zh) * | 2021-05-21 | 2022-10-14 | 江苏科技大学 | 基于bp神经网络的坦克垂向稳定器神经自适应控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Miranda-Colorado et al. | Experimental parameter identification of flexible joint robot manipulators | |
JPH07210207A (ja) | 適応制御装置 | |
KR20190121972A (ko) | 계산 토크 방식 제어기, 이의 파라미터 결정 및 성능 평가 방법 | |
Tomizuka | Model based prediction, preview and robust controls in motion control systems | |
Starrenburg et al. | Learning feedforward controller for a mobile robot vehicle | |
US5548192A (en) | Adaptive feedback system for controlling head/arm position in a disk drive | |
JP3062606B2 (ja) | ニューラルネットワークを用いた適応制御装置 | |
JP3773686B2 (ja) | サーボ制御装置及びサーボ制御方法 | |
JP2968631B2 (ja) | 熱延プロセス制御方法 | |
Douratsos et al. | Neural network based model reference adaptive control for processes with time delay | |
US5394071A (en) | Control network with on-line iteration and adaptive filter | |
JP3340923B2 (ja) | Sacコントローラ | |
JP4038659B2 (ja) | サーボ制御装置 | |
JP4189716B2 (ja) | モータ速度制御装置 | |
Wu et al. | Sliding mode based learning control for track-following in hard disk drives | |
Daly et al. | Experimental results for output feedback adaptive robot control | |
Becedas et al. | GPI control for a single-link flexible manipulator | |
JPH0375906A (ja) | 多軸機構の制御方法及び装置 | |
JP4306299B2 (ja) | サーボシステムにおける周期的外乱を補償する制御方法及び制御装置 | |
JP2881873B2 (ja) | デジタル適応制御装置 | |
CN114114925B (zh) | 基于数据驱动协同自适应滑模约束控制方法及系统 | |
JP3200496B2 (ja) | 多関節型ロボット制御装置 | |
JP3834815B2 (ja) | 最適指令作成装置 | |
JP3039154B2 (ja) | コントローラの調整方法 | |
Jung | Neural network controllers for robot manipulators |