[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP6664561B1 - 位置決め制御装置及び位置決め方法 - Google Patents

位置決め制御装置及び位置決め方法 Download PDF

Info

Publication number
JP6664561B1
JP6664561B1 JP2019549492A JP2019549492A JP6664561B1 JP 6664561 B1 JP6664561 B1 JP 6664561B1 JP 2019549492 A JP2019549492 A JP 2019549492A JP 2019549492 A JP2019549492 A JP 2019549492A JP 6664561 B1 JP6664561 B1 JP 6664561B1
Authority
JP
Japan
Prior art keywords
position command
parameter
unit
value
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019549492A
Other languages
English (en)
Other versions
JPWO2020075316A1 (ja
Inventor
将哉 木村
将哉 木村
英俊 池田
英俊 池田
高野 直人
直人 高野
秀之 増井
秀之 増井
大作 松本
大作 松本
厚範 兼村
厚範 兼村
英樹 麻生
英樹 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority claimed from PCT/JP2019/003205 external-priority patent/WO2020075316A1/ja
Application granted granted Critical
Publication of JP6664561B1 publication Critical patent/JP6664561B1/ja
Publication of JPWO2020075316A1 publication Critical patent/JPWO2020075316A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/19Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41885Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by modeling, simulation of the manufacturing system
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/404Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for compensation, e.g. for backlash, overshoot, tool offset, tool wear, temperature, machine construction errors, load, inertia
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/42Servomotor, servo controller kind till VSS
    • G05B2219/42152Learn, self, auto tuning, calibrating, environment adaptation, repetition
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/42Servomotor, servo controller kind till VSS
    • G05B2219/42163Simulator

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Control Of Position Or Direction (AREA)
  • Feedback Control In General (AREA)

Abstract

位置決め制御装置(40)は、位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成する位置指令生成部(41)と、モータ(1)又は制御対象(3)の位置検出値が位置指令に追従するようにモータ(1)を駆動する駆動制御部(12)と、制御対象(3)についての位置決め制御の実行時のモータ(1)又は制御対象(3)の位置検出値に基づいて位置決め性能に関する評価値を算出する評価部(43)と、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の位置指令パラメータと評価値との関係を学習し、位置指令パラメータと評価値との関係を学習して学習結果を得る学習部(44)とを有する。

Description

本発明は、制御対象について位置決め制御を行う位置決め制御装置及び位置決め方法に関する。
電子部品実装機又は半導体製造装置のように、サーボモータの駆動により制御対象であるヘッドを繰り返し移動させる装置では、生産性能の向上のためにサーボモータについて高速な制御が求められる。サーボモータが高速に動作すると、装置の剛性の低さに起因する機械振動が生じる場合がある。この場合、サーボモータの位置指令の指令形状が適切に調整されていれば、機械振動の影響を受ける状況下であっても高速な位置決め制御を実現することができる。そのため、位置指令の指令形状を適切に調整することが求められる。
サーボモータの指令形状を調整するための従来の技術として、下記の特許文献1、特許文献2及び特許文献3の各々に記載されている技術が提案されている。特許文献1は、制御対象のモデルを用いたシミュレーションにおいて、遺伝的アルゴリズムを用いた指令形状の探索と制御対象のモデルの応答の評価とを繰り返すことで、シミュレーションにおける最適な指令形状を見つける技術を開示している。特許文献1が開示している技術は、シミュレーションを用いた指令形状の調整手段である。
特許文献2は、シミュレーションにおいて最適な指令形状を見つけた後に、実機を用いて指令形状の探索を行う技術を開示している。特許文献2が開示している技術の特徴は、実機を用いた指令形状の探索において、シミュレーションにおいて見つけられた最適な指令形状に基づいて探索範囲を決定することである。特許文献1及び特許文献2はいずれも、シミュレーションを活用して指令形状の調整を行う技術を開示している。
特許文献3は、複数の指令形状を予め準備して保持しておき、それら複数の指令形状のひとつずつに対して実機を用いた位置決め動作を実行させて応答を調べ、良好な応答を示す指令形状を探索する技術を開示している。
特開2004−240609号公報 特開2009−122779号公報 特開2016−19304号公報
上述の通り、特許文献1及び特許文献2はいずれも、シミュレーションを活用して指令形状の調整を行う技術を開示している。特許文献1が開示している技術は、実機の応答をシミュレーションして指令形状の最適化を行う技術であるが、実機の応答をシミュレーションするためには実機の数学モデルが必要となる。一般に、数学モデルにはモデル化誤差が含まれるため、数学モデルが実機の応答を完全に再現することは難しい。シミュレーションで見出された最適値は実機の最適値と相異するので、シミュレーションにおいて見つけられた最適な指令形状を実機に適用しても、実機は期待されるような良好な応答を示さない。つまり、特許文献1が開示している技術には、実機において位置決め制御を高速化するような良好な指令形状を得られないという課題がある。
特許文献2が開示している技術は、シミュレーションを行った後に実機を用いた指令形状の調整を行う。当該技術では、シミュレーションの結果に基づいて調整の際の探索範囲が決定されるため、例えばモデル化誤差の影響によって探索範囲が適切に設定されない可能性がある。つまり、特許文献2が開示している技術では、良好な指令形状を含む範囲が探索範囲として設定されない可能性がある。
特許文献3が開示している技術は、あらかじめ準備された複数の指令形状のひとつずつに対して実機を用いた位置決め動作を実行させて応答を調べ、最良な指令形状を見つける。サーボモータを動作させる指令形状のパターンは無数に存在するため、あらかじめ準備された複数の指令形状のすべてに対して実機を用いた位置決め動作をさせるのでは、位置決め動作の回数が膨大になる。位置決め動作の回数を低減するために指令形状の探索範囲を絞り込んで設定しようとしても、探索範囲を適切に設定する手段が与えられないため、探索範囲のなかに良好な応答を示す指令形状が存在しない可能性がある。つまり、特許文献3が開示している技術には、良好な指令形状を見つけることができないという課題がある。
上述の通り、従来の技術では、位置決め制御を高速化する指令形状の調整を効率良く行うことができない。
本発明は、上記に鑑みてなされたものであって、位置決め制御を高速化するための指令形状の調整を効率良く行う位置決め制御装置を得ることを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め制御装置であって、位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成する位置指令生成部と、前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動する駆動制御部とを有する。本発明は、前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出する評価部を更に有する。本発明は、前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータの上限値及び下限値を規定するパラメータ範囲における前記位置指令パラメータと前記評価値との関係を示す関係式を学習結果として得る学習部を更に有する。
本発明によれば、位置決め制御を高速化するための指令形状の調整を効率良く行うことができるという効果が得られる。
実施の形態1にかかる位置決め制御装置の構成を示す図 実施の形態1で用いられる位置指令と、位置指令の一階微分である速度指令と、位置指令の二階微分である加速度指令と、加速度指令の一階微分であるジャーク(加加速度)との各々の形状の例を示す図 実施の形態1において第1組目から第3組目までの位置指令パラメータに基づいて生成された各指令形状を用いて位置決め制御が行われた場合の目標移動距離と位置検出値との偏差の時間応答を示す図 実施の形態1で用いられるニューラルネットワークを示す図 実施の形態1における目標移動距離と優良パラメータとの関係を示すグラフ 実施の形態2にかかる位置決め制御装置の構成を示す図 実施の形態2における目標停止位置と優良パラメータとの関係を示すグラフ 実施の形態3にかかる位置決め制御装置の構成を示す図 実施の形態3における偏差の時間応答を示す図 実施の形態3において第4組目の位置指令パラメータと第5組目の位置指令パラメータとが用いられた場合の偏差の時間応答を示す図 実施の形態1にかかる位置決め制御装置が有する位置指令生成部、駆動制御部、評価部、学習部、学習結果保持部及びパラメータ範囲設定部の一部又は全部の機能がプロセッサによって実現される場合のプロセッサを示す図 実施の形態1にかかる位置決め制御装置が有する位置指令生成部、駆動制御部、評価部、学習部、学習結果保持部及びパラメータ範囲設定部の一部又は全部が処理回路によって実現される場合の処理回路を示す図 実施の形態4にかかる位置決め制御装置の構成を示す図 実施の形態4にかかる位置決め制御装置が位置指令パラメータを調整する際の動作の手順を示すフローチャート 実施の形態4にかかる位置決め制御装置によって得られる効果を説明するための第1図 実施の形態4にかかる位置決め制御装置によって得られる効果を説明するための第2図 実施の形態5にかかる位置決め制御装置の構成を示す図 実施の形態6にかかる位置決め制御装置の構成を示す図
以下に、本発明の実施の形態にかかる位置決め制御装置及び位置決め方法を図面に基づいて詳細に説明する。なお、この実施の形態によりこの発明が限定されるものではない。
実施の形態1.
図1は、実施の形態1にかかる位置決め制御装置10の構成を示す図である。位置決め制御装置10は、モータ1を駆動させて制御対象3を目標移動距離だけ移動させる装置であって、モータ1と位置検出器4とに接続される。モータ1は、ボールねじ2を介して制御対象3にトルク及び推力を与えて、制御対象3を移動させる。モータ1は、制御対象3を駆動することができるものであればよい。モータ1の例は、回転型サーボモータ、リニアモータ又はステッピングモータである。
制御対象3は、モータ1により所望の目標移動距離だけで移動させられる。制御対象3は、位置決め制御が必要とされる機械又は部品である。制御対象3の例は、電子部品実装機、又は、半導体製造装置のヘッド部分である。
位置検出器4は、モータ1の回転位置又は制御対象3の位置を検出し、位置検出値を示す情報を位置決め制御装置10に出力する。位置検出値は、位置検出器4による検出の結果である。位置検出器4の例は、エンコーダ又はリニアスケールである。
位置決め制御装置10には、位置決め制御装置10の外部から運転条件17が与えられる。運転条件17は、モータ1を駆動させるための目標移動距離を含む情報である。目標移動距離は、制御対象3が移動させられる際の所望の距離である。位置決め制御装置10は、運転条件17を満たすように制御対象3についての位置決め制御を実行する。
位置決め制御装置10は、モータ1を駆動させて制御対象3を目標移動距離だけ移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する位置指令生成部11を有する。位置指令生成部11は、位置指令パラメータに基づいて加速区間及び減速区間の加速度形状が決定される位置指令を生成する。位置決め制御装置10は、モータ1又は制御対象3の位置検出値が位置指令生成部11によって生成された位置指令に追従するようにモータ1を駆動する駆動制御部12を更に有する。
位置決め制御装置10は、制御対象3についての位置決め制御の実行時のモータ1又は制御対象3の位置検出値に基づいて駆動制御部12による位置決め制御の良し悪しを評価するための評価値を算出する評価部13を更に有する。評価部13は、制御対象3についての位置決め制御の実行時のモータ1又は制御対象3の位置検出値に基づいて位置決め性能に関する評価値を算出する。
位置決め制御装置10は、位置指令パラメータの上限値及び下限値を規定するパラメータ範囲の内において位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合の位置指令パラメータと評価部13によって算出された評価値との関係を学習し学習結果を得る学習部14を更に有する。学習部14は、位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の位置指令パラメータと評価値との関係を学習し、位置指令パラメータと評価値との関係を学習して学習結果を得る。更に言うと、学習部14は、学習結果に基づいて位置指令パラメータを決定する。
位置決め制御装置10は、目標移動距離を示す情報を含む運転条件17と学習部14によって得られた学習結果とを対応付けて保持する学習結果保持部15を更に有する。学習結果保持部15の一部は、記憶部である。記憶部の例は、半導体メモリである。位置決め制御装置10は、学習結果保持部15によって保持された運転条件17と学習結果とに基づいてパラメータ範囲を変更するパラメータ範囲設定部16を更に有する。以下に、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16について更に説明する。
位置指令生成部11は、位置指令パラメータと運転条件17とに基づいて、モータ1の位置指令を生成して出力する。位置指令パラメータは、位置指令の指令形状を規定するパラメータである。図2は、実施の形態1で用いられる位置指令と、位置指令の一階微分である速度指令と、位置指令の二階微分である加速度指令と、加速度指令の一階微分であるジャーク(加加速度)との各々の形状の例を示す図である。図2は、目標移動距離を示す情報を含む運転条件17が位置決め制御装置10に与えられた場合の各指令及びジャークの形状の例を示している。
図2に示す通り、実施の形態1における加速度指令は、第1区間から第3区間までにおいて加速方向の台形形状を示す指令であり、第4区間では0であり、第5区間から第7区間までにおいて減速方向の台形形状を示す指令である。第1区間が加速開始の区間を示し、第3区間が加速終了の区間を示し、第5区間が減速開始の区間を示し、第7区間が減速終了の区間を示す。第m区間の時間長を、第m時間長Tmとする。mは、1から7までの整数である。つまり、第1区間の時間長は第1時間長T1である。
図2の加速度指令において、第1区間から第3区間までの加速区間の台形形状と、第5区間から第7区間までの減速区間の台形形状とは合同でなくてもよい。加速区間の第1時間長T1と第3時間長T3とを0として、加速度指令の形状を矩形形状としてもよい。実施の形態1では、第1時間長T1から第7時間長T7までの7個のパラメータが位置指令パラメータである。指令形状は、位置指令パタメータと目標移動距離とに基づいて規定される。指令形状の計算方法は後述する。
駆動制御部12は、モータ1の回転位置が位置指令に追従するようにモータ1に電流を供給する。例えば、駆動制御部12は、位置検出器4からモータ1の回転位置を示す情報を取得し、モータ1の回転位置と位置指令との偏差が小さくなるようにPID(Proportional-Integral-Differential)制御に基づいてモータ1に供給される電流の値を計算し、計算によって得られた値の電流をモータ1に供給する。なお、駆動制御部12は、モータ1の回転位置を位置指令に追従させるものであれば、どのようなものであってもよい。例えば、駆動制御部12は、フィードバック制御にフィードフォワード制御を加えた2自由度制御を行なってもよい。
駆動制御部12は、モータ1の回転位置が位置指令に追従するようにモータ1を駆動するものではなく、制御対象3の位置をフィードバック制御のための信号として検出して、制御対象3の位置が位置指令に追従するようにモータ1を駆動するものであってもよい。
評価部13は、位置検出器4による検出の結果である位置検出値を示す情報を位置検出器4から受け取り、駆動制御部12による位置決め制御の良し悪しを評価するための評価値Qを後述する方法で計算して出力する。駆動制御部12は位置指令に基づいて動作し、位置指令は位置指令パラメータに基づいて計算される。したがって、評価部13によって算出される評価値Qは、位置指令パラメータの値に依存する。つまり、評価値Qは位置指令パラメータを評価するための指標であるといえる。
次に、評価値Qの具体的な計算方法を説明する。位置決め制御の開始から目標移動距離と位置検出値との偏差の大きさがあらかじめ決められた許容値IMPより小さくなる位置決め完了までの時間を、位置決め時間Tstとする。位置決め時間Tstが小さい場合、評価値Qが大きな値を示すように下記の式(1)が設定される。
Figure 0006664561
式(1)によれば、位置決め時間Tstが小さいほど評価値Qは大きな値になる。つまり、実施の形態1では、評価値Qが大きな値であるほど、位置指令パラメータは優良であるといえる。ただし、評価値Qは、位置決め制御を評価することができるものであれば、式(1)によって特定されるものに限定されない。例えば、位置決め時間Tstそのものを評価値Qとして、評価値Qが小さな値であるほど位置指令パラメータは優良であると定められてもよい。
学習部14は、評価値Qとパラメータ範囲とを入力として、位置指令パラメータと評価値Qとの関係を学習し、学習結果を出力する。具体的には、学習部14において、位置指令パラメータを入力として評価値Qを出力とするニューラルネットワークが構成され、学習部14は、ニューラルネットワークの重み係数を更新して学習を行う。重み係数を更新して学習が行われた場合、ニューラルネットワークは位置指令パラメータに対応する評価値Qの良好な推定値を出力する。学習部14は、ニューラルネットワーク用い、位置指令パラメータを入力として評価値Qを出力とする関数を得ることで、学習結果として位置指令パラメータと評価値Qとの関係式を得る。学習部14は、位置指令パラメータと評価値Qとの関係を学習することができれば、位置指令パラメータと評価値Qとの関係を、ニューラルネットワークを用いる方法によって学習しなくてもよい。
学習部14は、次の位置決め制御を実行するための位置指令パラメータを、規定されるパラメータ範囲のなかから選定して出力する。学習部14は、次の位置指令パラメータの選定にあたって、学習結果に基づいて優良な評価値を示す位置指令パラメータを選定してもよいし、各位置指令パラメータを等間隔に刻んだグリッドの点のなかから順に位置指令パラメータを選定してもよい。学習部14は、位置指令パラメータに基づいて評価値Qを計算する関数を更新する機能を有する。
学習結果保持部15は、学習部14の学習結果を入力とし、学習結果と目標移動距離とを対応付けて保持する。学習結果保持部15は、学習結果である位置指令パラメータと評価値Qとの関係式に基づいて、数値計算により、評価値Qが最大となる位置指令パラメータを求める。例えば、学習結果保持部15は、グリッド探索、ランダム探索又はニュートン法といった最適化アルゴリズムを用いて評価値Qを最大とする位置指令パラメータを求める。
学習結果保持部15は、評価値Qを最大とする位置指令パラメータを優良パラメータ(第一の優良パラメータ)として求めて、優良パラメータと目標移動距離とを対応付けて出力する。ただし、学習結果保持部15は、位置指令パラメータと評価値Qとの関係式を満たす位置指令パラメータのなかで評価値Qの真の最大値の位置指令パラメータを求める必要はない。学習結果保持部15は、あらかじめ決められた基準を満たす良好な位置決め制御を示す位置指令パラメータを優良パラメータとすればよい。学習結果保持部15は、ひとつ以上の位置指令パラメータを優良パラメータとして保持する機能を有する。
パラメータ範囲設定部16は、優良パラメータと運転条件17に含まれる情報が示す目標移動距離とに基づいて、位置指令パラメータの上限値と下限値とを定めるパラメータ範囲を決定する。パラメータ範囲設定部16は、学習部14によって得られた学習結果に基づいて、位置指令パラメータの上限値及び下限値を規定するパラメータ範囲を設定する。パラメータ範囲設定部16は、学習結果保持部15によって保持された優良パラメータより小さい値をパラメータ範囲の下限とすると共に、優良パラメータより大きい値をパラメータ範囲の上限として、パラメータ範囲を設定する。
パラメータ範囲設定部16は、運転条件17に含まれる情報が示す目標移動距離が変更された場合、過去に学習が実行されたときの目標移動距離に基づいて補間計算を行って、変更後の目標移動距離に対応する補間点の優良パラメータを推定する。加えて、パラメータ範囲設定部16は、推定された補間点の優良パラメータより小さい値をパラメータ範囲の下限とすると共に、推定された補間点の優良パラメータより大きい値をパラメータ範囲の上限として、パラメータ範囲を設定する。
例えば、パラメータ範囲設定部16は、目標移動距離と優良パラメータとの関係を示す1次関数式を作成しておき、目標移動距離が変更されれば、作成された1次関数式に基づいて変更後の目標移動距離についての優良パラメータの推定値を求める。パラメータ範囲設定部16は、優良パラメータの推定値より大きい値を上限値として設定し、優良パラメータの推定値より小さい値を下限値として設定する。位置指令パラメータが複数存在する場合、パラメータ範囲設定部16は、複数の位置指令パラメータの各々について、上限値及び下限値を設定する。
パラメータ範囲設定部16は、新たな目標移動距離に対応する優良パラメータの推定値を得ることができれば、優良パラメータと目標移動距離との関係を示す1次関数式以外の規則に基づいて優良パラメータの推定値を計算してもよい。
実施の形態1にかかる位置決め制御装置10の機能を更に説明する。学習部14は、パラメータ範囲で定められる範囲内で1組の位置指令パラメータを決定し、決定された位置指令パラメータを位置指令生成部11に出力する。位置指令生成部11は、入力された位置指令パラメータに基づいて位置指令を計算する。
位置指令の計算方法を説明する。第2区間の加速度の大きさをAaと定め、第6区間の加速度の大きさをAdと定める。第2区間の加速度の大きさAaと第6区間の加速度の大きさAdとは、位置指令パラメータの従属変数となるため、これらには設定自由度は無い。位置指令生成部11は、「0≦t<T1」の範囲の時間tにおける第1区間の加速度指令A1、速度指令V1及び位置指令P1の各々を、下記の式(2)、式(3)又は式(4)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1≦t<T1+T2」の範囲の時間tにおける第2区間の加速度指令A2、速度指令V2及び位置指令P2の各々を、下記の式(5)、式(6)又は式(7)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1+T2≦t<T1+T2+T3」の範囲の時間tにおける第3区間の加速度指令A3、速度指令V3及び位置指令P3の各々を、下記の式(8)、式(9)又は式(10)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1+T2+T3≦t<T1+T2+T3+T4」の範囲の時間tにおける第4区間の加速度指令A4、速度指令V4及び位置指令P4の各々を、下記の式(11)、式(12)又は式(13)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1+T2+T3+T4≦t<T1+T2+T3+T4+T5」の範囲の時間tにおける第5区間の加速度指令A5、速度指令V5及び位置指令P5の各々を、下記の式(14)、式(15)又は式(16)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1+T2+T3+T4+T5≦t<T1+T2+T3+T4+T5+T6」の範囲の時間tにおける第6区間の加速度指令A6、速度指令V6及び位置指令P6の各々を、下記の式(17)、式(18)又は式(19)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
位置指令生成部11は、「T1+T2+T3+T4+T5+T6≦t≦T1+T2+T3+T4+T5+T6+T7」の範囲の時間tにおける第7区間の加速度指令A7、速度指令V7及び位置指令P7の各々を、下記の式(20)、式(21)又は式(22)を用いて計算する。
Figure 0006664561
Figure 0006664561
Figure 0006664561
終端時間t=T1+T2+T3+T4+T5+T6+T7においては、速度指令は0に一致する必要があり、位置指令は目標移動距離Dに一致する必要がある。そのため、終端時間において下記の式(23)及び式(24)が成立する。
Figure 0006664561
Figure 0006664561
上記の式(5)及び式(17)より、第2区間の加速度の大きさAa及び第6区間の加速度の大きさAdが決定される。上述のように、指令形状は指令パラメータと目標移動距離Dとに基づいて計算される。
上述の通り、また図2に示す通り、第1区間、第3区間、第5区間及び第7区間では、加速度は時間の一次関数である。そのため、これらの区間では、図2に示す通り、加速度の一階微分であるジャークは非零の一定値である。つまり、第1時間長T1、第3時間長T3、第5時間長T5及び第7時間長T7は、ジャークが非零の一定値となる時間を定めたものであると言える。非零の一定値は、0より大きい一定値又は0より小さい一定値である。
これらの区間では、時間長の代わりにジャークの大きさを指定するパラメータが選択されてもよい。例えば、第1区間におけるジャークの大きさをJ1として定めると、ジャークJ1は、下記の式(25)に示す通り、第1時間長T1を用いて算出することができる。
Figure 0006664561
つまり、ジャークが非零の一定値となる区間の時間をパラメータとして定めることと、ジャークが非零の一定値となる区間のジャークの大きさをパラメータとして定めることとは、等価である。このように、指令形状を規定するパラメータの選択の仕方には任意性があり、指令形状を規定するパラメータの選択は上述の方法に限定されない。
上述のように、実施の形態1の位置指令生成部11が実行する指令生成方法では、指令形状を規定するために7個の位置指令パラメータを使用する。従来の技術で多く用いられる加速度及び速度の2個のパラメータにより指令形状を規定する方法と比較すると、実施の形態1における調整の自由度は従来のそれより高い。そのため、適切に位置指令パラメータを調整することができれば、位置決め制御装置10は、制御対象3が載置されている装置の機械振動の影響を受ける状況であっても、良好な応答を示す位置決め制御を実現することができる。
他方、制御対象3が載置されている装置の操作者が当該装置を動作させつつ、試行錯誤によって上記の7個のパラメータを人手で調整する場合、比較的大きな労力及び比較的長い時間が必要となる。以下では、位置決め制御装置10が評価部13、学習部14及び学習結果保持部15を有することにより、位置決め制御装置10が操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができることを説明する。
評価部13及び学習部14の動作によれば、学習部14による位置指令パラメータの変更と、変更された位置指令パラメータが用いられた位置決め制御と、評価部13による評価値Qの計算とが繰り返し実行される。この繰り返し実行される評価部13及び学習部14の動作を説明する。
学習部14は、位置指令パラメータの上限値及び下限値を規定するパラメータ範囲の内において位置指令パラメータを選定する。評価部13及び学習部14の動作が3回実行されて、第3組目までの位置指令パラメータが評価される過程を説明する。第1組目の位置指令パラメータを位置指令パラメータPr1と表記し、第2組目の位置指令パラメータを位置指令パラメータPr2と表記し、第3組目の位置指令パラメータを位置指令パラメータPr3と表記する。3組の位置指令パラメータの各々は、第1時間長T1から第7時間長T7までの7個のパラメータを有している。
図3は、実施の形態1において第1組目から第3組目までの位置指令パラメータに基づいて生成された各指令形状を用いて位置決め制御が行われた場合の目標移動距離と位置検出値との偏差の時間応答を示す図である。図3(a)は、第1組目の位置指令パラメータが用いられた場合の偏差の時間応答を示している。図3(b)は、第2組目の位置指令パラメータが用いられた場合の偏差の時間応答を示している。図3(c)は、第3組目の位置指令パラメータが用いられた場合の偏差の時間応答を示している。
学習部14から第1組目の位置指令パラメータPr1が出力され、位置指令生成部11が第1組目の位置指令パラメータPr1に基づいて位置指令を生成する。第1組目の位置指令パラメータPr1に基づいて生成された位置指令が用いられて、位置決め制御が実行される。評価部13は、この場合の位置検出値に基づいて、第1組目の位置指令パラメータPr1に対応する位置決め時間Tst1を取得する。位置決め制御の開始から、目標移動距離と位置検出値との偏差の大きさがあらかじめ決められた許容値IMPより小さくなる位置決め完了までの時間を位置決め時間とする。第1組目の位置指令パラメータPr1に対応する評価値Q1が、下記の式(26)が用いられて計算される。
Figure 0006664561
学習部14は、評価値Q1を受け取り、位置指令パラメータを第2組目の位置指令パラメータPr2に変更する。学習部14は、位置指令パラメータを変更する際、第1組目の位置指令パラメータPr1が用いられた位置決め制御の結果に基づいて第2組目の位置指令パラメータPr2を選定してもよいし、第1組目の位置指令パラメータPr1が用いられた位置決め制御の結果に関わらず、あらかじめ定められていた通りに第2組目の位置指令パラメータPr2を選定してもよい。
学習部14が位置指令パラメータを変更すると、第2組目の位置指令パラメータPr2に基づいて生成される位置指令が用いられて位置決め制御が実行される。評価部13は、この場合の位置検出値に基づいて、第2組目の位置指令パラメータPr2に対応する位置決め時間Tst2を取得する。位置決め制御の開始から、目標移動距離と位置検出値との偏差の大きさが許容値IMPより小さくなる位置決め完了までの時間を位置決め時間とする。第2組目の位置指令パラメータPr2に対応する評価値Q2が、下記の式(27)が用いられて計算される。
Figure 0006664561
学習部14は、評価値Q2を受け取り、位置指令パラメータを第3組目の位置指令パラメータPr3に変更する。評価部13は、評価値Q1と評価値Q2とを得た手順と同様にして、評価値Q3を、位置決め時間Tst3に基づいて下記の式(28)を用いて計算する。
Figure 0006664561
学習部14は、評価値Q3を受け取る。図3に示すように、Tst2<Tst1<Tst3という結果が得られたとすると、3つ評価値の中では評価値Q2が最も大きい値となる。ここまでの評価部13及び学習部14の動作によって、学習部14は3組の位置指令パラメータPr1、位置指令パラメータPr2及び位置指令パラメータPr3に対応する評価値Q1、評価値Q2及び評価値Q3を得る。
評価部13及び学習部14は、上述のように、位置指令パラメータに対応する評価値Qを取得する動作を繰り返し実施する。
学習部14は、位置指令パラメータと位置指令パラメータに対応する評価値Qとを学習用データとして、ニューラルネットワークを用いた学習動作を行う。図4は、実施の形態1で用いられるニューラルネットワークを示す図である。当該ニューラルネットワークは、入力層、中間層及び出力層を有する。左端の入力層に位置指令パラメータが入力され、右端の出力層から評価値Qが出力される。入力層の各ノードから中間層の各ノードに対する重み係数は全て独立に設定することができるが、図4ではこれらは全て同一の重み係数W1として表記されている。同様に、中間層の各ノードから出力層の各ノードに対する重み係数は、全て同一の重み係数W2として表記されている。
入力層の各ノードの出力値に対して重み係数W1が乗算され、乗算によって得られた結果の線形結合が中間層の各ノードに入力される。中間層の各ノードの出力値に対して重み係数W2が乗算され、乗算によって得られた結果の線形結合が出力層のノードに入力される。各層の各ノードでは、例えばシグモイド関数といった非線形関数により入力値から出力値が計算されてもよい。入力層及び出力層では、出力値は入力値の線形結合であってもよい。
学習部14は、位置指令パラメータと評価値Qとを用いて、ニューラルネットワークの重み係数W1と重み係数W2とを計算する。ニューラルネットワークの重み係数W1及び重み係数W2は、誤差逆伝播法又は勾配降下法を用いることで計算することができる。ただし、ニューラルネットワークの重み係数が得られる計算方法であれば、重み係数W1及び重み係数W2の計算方法は上述の方法に限られない。
ニューラルネットワークの重み係数が決定されれば、位置指令パラメータと評価値Qとの関係式が得られたことになる。ここまでにおいて、3層のニューラルネットワークを用いた学習を行う例が示された。ニューラルネットワークを用いた学習は、上述の例に限定されない。
ここまでの評価部13及び学習部14の動作によって、ニューラルネットワークによる関係式が学習結果として得られた。
次に、学習結果保持部15を更に説明する。上述のように評価部13及び学習部14の動作によってニューラルネットワークによる関係式が得られれば、位置指令パラメータを入力として評価値Qを出力とする関数が学習結果として得られたことになる。この学習結果を用いれば、新たな位置指令パラメータに対して位置決め制御を実行しなくとも、その新たな位置指令パラメータに対応する評価値Qを得ることが可能になる。
学習結果保持部15は、学習結果である位置指令パラメータと評価値Qとの関係式に基づいて、数値計算により、評価値Qが最大となる位置指令パラメータを求める。このとき、学習結果保持部15は、例えばグリッド探索、ランダム探索又はニュートン法といった最適化アルゴリズムを用いる。
上述のように、評価部13及び学習部14の動作によって指令パラメータと評価値との関係を学習することができる。加えて、学習結果保持部15の動作によれば、学習結果を用いることで評価値Qを最大とするような優良な位置指令パラメータを見つけることが可能である。この学習結果を用いれば位置決め制御を実施しなくても位置指令パラメータに対応する評価値Qを取得することができるため、位置決め制御装置10は、必ずしも優良パラメータを用いた位置決め制御を行なっていなくとも、優良パラメータを見つけることが可能である。よって、位置決め制御装置10は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。
次に、パラメータ範囲設定部16を更に説明する。上述のように、学習結果保持部15は、学習結果に基づいて評価値Qを最大とする位置指令パラメータを求め、求められた位置指令パラメータを優良パラメータとする。学習結果保持部15は、運転条件17に含まれる情報が示す目標移動距離Dと優良パラメータとを併せて保持する。複数の異なる運転条件において学習が行われた場合、学習結果保持部15は、複数の目標移動距離Dに対応する複数の優良パラメータを保持する。
パラメータ範囲設定部16は、学習結果保持部15に保持される運転条件17と学習結果とに基づいてパラメータ範囲を設定する。次に、パラメータ範囲設定部16によって行われるパラメータ範囲の設定方法を、図5を用いて説明する。図5は、実施の形態1における目標移動距離Dと優良パラメータとの関係を示すグラフである。図5では、優良パラメータは目標移動距離Dの1次元の関数で表現されている。
目標移動距離D1及び目標移動距離D2についての学習が既に実施されていて、目標移動距離D1に対応する優良パラメータPex1と目標移動距離D2に対応する優良パラメータPex2とが見つけられて学習結果保持部15に保持されていることを想定する。この状況で、目標移動距離D1とも目標移動距離D2とも異なる目標移動距離D3について学習を行うことを想定する。学習結果保持部15は、目標移動距離D3に対応する優良パラメータPex3を下記の式(29)を用いて補間計算を行って推定する。
Figure 0006664561
式(29)に示すように、学習結果保持部15は、優良パラメータPex3を推定する補間方法として、過去の2つの学習結果を用いた線形補間を行う。しかしながら、学習結果保持部15は、線形補間を行うのではなく、スプライン補間又はラグランジュ補間を用いる方法によって優良パラメータPex3を推定してもよい。
パラメータ範囲設定部16は、推定された優良パラメータPex3を用いて、パラメータ範囲の上限値ULと下限値LLとを下記の式(30)又は式(31)を用いて計算する。
Figure 0006664561
Figure 0006664561
上述の上限値UL及び下限値LLの計算方法は、上限値UL及び下限値LLの計算方法のひとつの例である。上限値UL及び下限値LLの計算方法は、推定される優良パラメータPex3より大きい値を上限値ULとし、優良パラメータPex3より小さい値を下限値LLとして計算される方法であればよく、上述の計算方法に限定されない。
パラメータ範囲設定部16は、計算によって得られた上限値UL及び下限値LLを新たなパラメータ範囲の上限値及び下限値として、パラメータ範囲を変更する。
上述の通り、パラメータ範囲設定部16が学習結果に基づいてパラメータ範囲の上限値ULと下限値LLとを計算するため、位置決め制御装置10は、パラメータ範囲の変更のために装置の操作者の試行錯誤を必要としない。
目標移動距離Dが変更された場合、パラメータ範囲設定部16は、変更後の目標移動距離Dに対応する優良パラメータの推定値の周辺をパラメータ範囲として設定することができ、パラメータ範囲を小さく絞ることが可能である。そのため、パラメータ範囲設定部16は、より少ない位置決め制御の試行回数で優良パラメータを見つけることが可能である。ゆえに、位置決め制御装置10は、位置指令の指令形状の調整を短時間で行うことが可能である。
実施の形態1では、指令形状を規定する位置指令パラメータの個数が7個である例が示された。さらに多くのパラメータによってより高い設計自由度が与えられる場合にも、実施の形態1の方法は適用可能である。設計自由度がより小さい場合に対しても、実施の形態1の方法を適用することができる。
実施の形態1では、位置指令パラメータと評価値Qとの関係式を構築するために、ニューラルネットワークが用いられた。しかしながら、位置指令パラメータと評価値Qとの関係を得ることができれば、ニューラルネットワークは用いられなくてもよい。例えば2次多項式のような単純な関数により位置指令パラメータと評価値Qとの関係が得られてもよいし、ガウス過程モデルのような確率モデルにより位置指令パラメータと評価値Qとの関係が得られてもよい。
実施の形態1では、目標移動距離が変更される際に指令形状の探索範囲を適切に設定することができることを述べたが、パラメータ範囲設定部16がもたらす効果は目標移動距離の変更の際にのみ得られると限られない。例えば、装置の連続運転による発熱又は経年劣化の影響により装置の機械振動の特性が変化した場合、位置決め制御装置10は、過去の学習で見つけた優良パラメータの周辺を探索することができるため、より少ない位置決め制御の試行回数で機械特性の変化に対応する良好な位置指令パラメータを見つけることが可能である。
実施の形態1にかかる位置決め制御装置10は、目標移動距離が変更された場合にも、指令形状の探索範囲を適切に設定することができ、ひいては指令形状の調整を効率良く行うことができる。
上述のことから、実施の形態1にかかる位置決め制御装置10は、位置決め制御を高速化する良好な指令形状を探索する際、指令形状の探索範囲を適切に設定することができ、ひいては指令形状の調整を効率良く行うことができる。
位置指令生成部11は、位置指令の信号を二回微分した信号である加速度指令信号が零より大きい一定値又は零より小さい一定値となる時間が存在するように、位置指令の信号の形状を定めてもよい。位置指令生成部11は、位置指令の信号を三回微分した信号であるジャークの信号が零より大きい一定値又は零より小さい一定値となる時間が存在するように、位置指令の信号の形状を定めてもよい。位置指令生成部11は、ジャークの信号が零より大きい一定値又は零より小さい一定値となる時間を示す情報を位置指令パラメータに含めてもよい。位置指令生成部11は、ジャークの信号が零より大きい一定値又は零より小さい一定値となる時間におけるジャークの信号の大きさを示す情報を位置指令パラメータに含めてもよい。
実施の形態1では、学習部14は位置指令パラメータを入力として評価値Qの推定値を計算する関数を学習結果として得るが、これに加えて、位置決め制御に使用された位置指令パラメータと位置決め制御を実行することによって得られた評価値Qとの組を学習結果に含めてもよい。これにより、学習結果保持部15は位置指令パラメータと位置決め制御を実行することによって得られた評価値Qとの組の中からも優良パラメータを選定することができる。
実施の形態1にかかる位置決め制御装置10によれば、学習部14の学習によって得られた位置指令パラメータが位置指令生成部(学習器)11に設定され、位置指令生成部(学習器)11が位置指令を生成することで高速な位置決め制御を実現することができる。
実施の形態2.
実施の形態1にかかる位置決め制御装置10は、位置決め制御の目標移動距離が変更される場合にも指令形状の探索範囲を適切に設定し、効率よく指令形状を探索する。実施の形態2では、位置決め制御の目標停止位置が変更される場合にも、指令形状の探索範囲を適切に設定することができる位置決め制御装置について説明する。
図6は、実施の形態2にかかる位置決め制御装置20の構成を示す図である。図6に示すように、位置決め制御装置20は、モータ1と位置検出器4とに接続される。位置決め制御装置20には、位置決め制御装置20の外部から運転条件27が与えられる。運転条件27は、モータ1を駆動させるための目標移動距離の情報と目標停止位置の情報とを含む。位置決め制御装置20は、運転条件27を満たすように位置決め制御を実行する。
位置決め制御装置20は、位置指令生成部11と、駆動制御部12と、評価部13と、学習部14と、学習結果保持部25と、パラメータ範囲設定部26とを有する。実施の形態2では、実施の形態1において説明された構成要素については詳細な説明を省略する。
学習結果保持部25は、学習部14の学習結果を入力とし、学習結果と目標停止位置とを対応付けて保持する。学習結果保持部25は、学習結果である位置指令パラメータと評価値との関係式に基づいて、数値計算により、評価値が最大となる位置指令パラメータを求める。例えば、学習結果保持部25は、グリッド探索や、ランダム探索又はニュートン法といった最適化アルゴリズムを用いて評価値を最大とする位置指令パラメータを求める。学習結果保持部25は、評価値が最大となる位置指令パラメータを優良パラメータ(第二の優良パラメータ)として求めて保持し、優良パラメータと目標停止位置とを対応付けて出力する。
学習結果保持部25は、評価値を最大とする位置指令パラメータを優良パラメータとすることなく、良好な位置決め制御を示す位置指令パラメータを優良パラメータとしてもよい。
パラメータ範囲設定部26は、優良パラメータと運転条件27に含まれる情報が示す目標停止位置とに基づいて、位置指令パラメータの上限値と下限値とを定めるパラメータ範囲を決定して出力する。パラメータ範囲設定部26は、運転条件27に含まれる情報が示す目標停止位置が変更された場合、過去に学習が実行されたときの目標停止位置に基づいて補間計算を行って、変更後の目標停止位置に対応する補間点の優良パラメータを推定する。加えて、パラメータ範囲設定部26は、推定された補間点の優良パラメータより小さい値をパラメータ範囲の下限とすると共に、推定された補間点の優良パラメータより大きい値をパラメータ範囲の上限として、パラメータ範囲を設定する。
具体的には、パラメータ範囲設定部26は、目標停止位置と優良パラメータとの関係を示す1次関数式を作成しておき、目標停止位置が変更されれば、作成された1次関数式に基づいて、変更された目標停止位置についての優良パラメータの推定値を求める。パラメータ範囲設定部26は、優良パラメータの推定値より大きい値を上限値として設定し、優良パラメータの推定値より小さい値を下限値として設定する。位置指令パラメータが複数存在する場合、パラメータ範囲設定部26は、複数の位置指令パラメータの各々について上限値及び下限値を定める。
パラメータ範囲設定部26は、変更された目標停止位置に対応する優良パラメータの推定値を得ることができれば、優良パラメータと目標停止位置との関係を示す1次関数式を作成することなく、他の規則に基づいて計算を行ってもよい。
パラメータ範囲設定部26が目標停止位置に基づいてパラメータ範囲を決定する点を除いて、位置決め制御装置20の動作は、実施の形態1にかかる位置決め制御装置10の動作と同じである。そのため、評価部13、学習部14及び学習結果保持部25の動作によって得られる効果は、実施の形態1で説明された効果と同様である。
学習結果保持部25は、学習部14の学習結果に基づいて、評価値Qを最大とする位置指令パラメータを求め、求められた位置指令パラメータを優良パラメータとする。学習結果保持部25は、運転条件27に含まれる情報が示す目標停止位置と優良パラメータとを併せて保持する。複数の異なる運転条件において学習が行われた場合、学習結果保持部25は、複数の目標停止位置SPに対応する複数の優良パラメータを保持する。
パラメータ範囲設定部26は、学習結果保持部25によって保持される運転条件27と学習結果とに基づいてパラメータ範囲を設定する。このときのパラメータ範囲の設定方法を、図7を用いて説明する。図7は、実施の形態2における目標停止位置SPと優良パラメータとの関係を示すグラフである。図7では、優良パラメータは目標停止位置SPの1次元関数で表現されている。
目標停止位置SP1と目標停止位置SP2とについて学習が既に実施されていて、目標停止位置SP1についての優良パラメータPex1と目標停止位置SP2についての優良パラメータPex2とが見つけられて、学習結果保持部25によって保持されていることを想定する。この状況で、目標停止位置SP1とも目標停止位置SP2とも異なる目標停止位置SP3について学習を行うことを想定する。目標停止位置SP3に対応する優良パラメータPex3は、下記の式(32)が用いられて推定される。
Figure 0006664561
式(32)に示すように、学習結果保持部25は、優良パラメータPex3を推定する補間方法として、過去の2つの学習結果を用いた線形補間を行う。しかしながら、学習結果保持部25は、線形補間を行うのではなく、スプライン補間又はラグランジュ補間を用いる方法によって優良パラメータPex3を推定してもよい。
パラメータ範囲設定部26は、推定された優良パラメータPex3を用いて、パラメータ範囲の上限値ULと下限値LLとを、下記の式(33)又は式(34)を用いて計算する。
Figure 0006664561
Figure 0006664561
上述の上限値UL及び下限値LLの計算方法は、上限値UL及び下限値LLの計算方法のひとつの例である。上限値UL及び下限値LLの計算方法は、推定される優良パラメータPex3より大きい値を上限値ULとし、優良パラメータPex3より小さい値を下限値LLとして計算される方法であればよく、上述の計算方法に限定されない。
パラメータ範囲設定部26は、計算によって得られた上限値UL及び下限値LLを新たなパラメータ範囲の上限値及び下限値として、パラメータ範囲を変更する。
パラメータ範囲設定部26が学習結果に基づいてパラメータ範囲の上限値ULと下限値LLとを計算するため、位置決め制御装置20は、パラメータ範囲の変更のために装置の操作者の試行錯誤を必要としない。
目標停止位置SPが変更される場合、位置決め制御装置20は、変更後の目標停止位置に対応する優良パラメータの推定値の周辺をパラメータ範囲として設定することができ、パラメータ範囲を小さく絞ることが可能である。そのため、位置決め制御装置20は、より少ない位置決め制御の試行回数で優良パラメータを見つけることが可能である。ゆえに、位置決め制御装置20は、位置指令の指令形状の調整を短時間で行うことが可能である。
ボールねじ機構又はリニア機構のような直動型の機構を持つ装置においての位置決め制御では、制御対象3の停止位置が異なれば、装置の剛性の低さに起因して生じる機械振動の特性が異なる。そのため、目標移動量が同じであっても、目標停止位置が変更されると、従来の技術では、機械振動の影響により高速な位置決め制御を行うことができない場合がある。
実施の形態2にかかる位置決め制御装置20は、目標停止位置が変更されても、指令形状の探索範囲を適切に設定することができ、ひいては指令形状の調整を効率良く行うことができる。
実施の形態2におけるパラメータ範囲設定部26は、パラメータ範囲の計算のために目標停止位置に対する優良パラメータの関係式を構築するが、目標停止位置と目標移動距離との両方に対する優良パラメータの関係式を構築してもよい。この場合、目標停止位置と目標移動距離との両方が変更されても、パラメータ範囲設定部26は、両方に対する優良パラメータを推定し、適切なパラメータ範囲を設定することができる。
上述のことから、実施の形態2にかかる位置決め制御装置20は、位置決め制御を高速化する良好な指令形状を探索して調整を行う際に、指令形状の探索範囲を適切に設定することができ、ひいては指令形状の調整を効率良く行うことができる。
実施の形態3.
実施の形態1にかかる位置決め制御装置10は、位置決め時間を最小とする指令形状を探索する。実施の形態3では、評価値の計算方法が異なる場合についても、指令形状の探索範囲を適切に設定することができる位置決め制御装置について説明する。
図8は、実施の形態3にかかる位置決め制御装置30の構成を示す図である。図8に示すように、位置決め制御装置30は、モータ1と位置検出器4とに接続される。位置決め制御装置30には、位置決め制御装置30の外部から運転条件17が与えられる。運転条件17は、モータ1を駆動させるための目標移動距離を示す情報を含む。位置決め制御装置30は、運転条件17を満たすように位置決め制御を実行する。
位置決め制御装置30は、位置指令生成部11と、駆動制御部12と、評価部33と、学習部14と、学習結果保持部15と、パラメータ範囲設定部16とを有する。実施の形態3では、実施の形態1において説明された構成要素については詳細な説明を省略する。
評価部33は、位置検出値を入力とし、駆動制御部12による位置決め制御の良し悪しを評価するための評価値Qを後述する方法で計算して出力する。駆動制御部12は、位置指令に基づいて動作する。位置指令は、位置指令パラメータに基づいて計算される。したがって、評価部33によって計算される評価値Qは、位置指令パラメータの値に依存する。つまり、評価値33によって計算される評価値Qは、位置指令パラメータを評価するための指標であるといえる。
評価値Qの具体的な計算方法を述べる。ここでは、位置決め制御の開始から、目標移動距離と位置検出値との偏差の大きさが許容値IMPより小さくなる位置決め完了までの時間を位置決め時間とする。位置決め時間Tstが小さい場合、評価値Qが大きな値を示す設定が行われる。実施の形態3では、偏差の大きさが許容値IMPより小さくなった後の残留振動の偏差の大きさについても評価をする。
図9は、実施の形態3における偏差の時間応答を示す図である。図9に示すように、偏差の大きさがあらかじめ決められた第2許容値IMP2より小さくなった後の残留振動の偏差の最大値を残留振動振幅AMPとする。第2許容値IMP2の範囲は、許容値IMPの範囲より狭い。残留振動振幅AMPの大きさが第2許容値IMP2より大きい場合、評価部33は評価値Qにペナルティを付与する。つまり、評価部33は、モータ1又は制御対象3の位置の残留振動の振幅である残留振動振幅AMPがあらかじめ決められた値以上である場合、評価値Qを減少させる計算を行う。具体的には、評価部33は下記の式(35)を用いて評価値Qを計算する。
Figure 0006664561
γは、正の値である。max(x1,x2)は、2つの引数x1と引数x2とのうちの大きい方を出力する関数である。
式(35)によれば、右辺の第1項により位置決め時間Tstが小さいほど評価値Qは大きな値になるが、右辺の第2項により残留振動振幅AMPが第2許容値IMP2より大きい場合には評価値Qが小さい値になる。つまり、位置決め時間Tstが小さく、かつ残留振動振幅AMPが第2許容値IMP2より小さい場合に評価値Qが大きい値となり、そのときの位置指令パラメータが良好な位置指令パラメータであるといえる。ただし、評価値Qは、位置決め制御を評価することができれば、式(35)を用いずに算出されてもよい。
評価部33が残留振動振幅AMPを評価値Qの計算に用いる点を除くと、位置決め制御装置30の動作は、実施の形態1にかかる位置決め制御装置10の動作と同じである。そのため、学習部14、学習結果保持部15及びパラメータ範囲設定部16の動作に基づいて得られる効果は、実施の形態1で説明された効果と同様である。
評価部33の動作によれば、位置決め制御装置30は、残留振動振幅AMPを第2許容値IMP2の大きさより小さい値に抑えつつ、位置決め時間を短時間化するような位置決め制御を実現することが可能である。
図10は、実施の形態3において第4組目の位置指令パラメータと第5組目の位置指令パラメータとが用いられた場合の偏差の時間応答を示す図である。第4組目の「4」及び第5組目の「5」は、第4組目及び第5組目を実施の形態1の第1組目から第3組目までと区別するために付与された数字であり、これらの数字に区別以外の意味はない。図10(a)は、第4組目の位置指令パラメータが用いられた場合の偏差の時間応答を示している。図10(b)は、第5組目の位置指令パラメータが用いられた場合の偏差の時間応答を示している。
図10に示す通り、第4組目の位置指令パラメータが用いられた場合の位置決め時間Tst4と第5組目の位置指令パラメータが用いられた場合の位置決め時間Tst5とを比較すると、Tst4<Tst5である。つまり、第4組目の位置指令パラメータが用いられた場合の位置決め時間Tst4は、第5組目の位置指令パラメータが用いられた場合の位置決め時間Tst5より短い。ただし、第4組目の位置指令パラメータが用いられた場合の残留振動振幅AMP4が第2許容値IMP2より大きいため、評価値Qにペナルティが付与される。図10(b)には、第5組目の位置指令パラメータが用いられた場合の残留振動振幅AMP5が示されている。
このとき下記の式(36)が成立するようにγを設定しておくことで、第4組目の位置指令パラメータの評価値Q4より、第5組目の位置指令パラメータの評価値Q5に大きな値を与えることができる。
Figure 0006664561
評価値Qの計算方法以外は、位置決め制御装置30の動作は実施の形態1にかかる位置決め制御装置10の動作と同様である。つまり、位置決め制御装置30は、評価値Qが最大となるように位置指令の指令形状を調整することができる。
評価部33の動作によれば、位置決め制御装置30は、残留振動振幅AMPが第2許容値IMP2を満たす範囲の中で、評価値Qを最大にする指令形状を調整することが可能となる。
目標移動距離が変更された場合、位置決め制御装置30は、変更後の目標移動距離に対応する優良パラメータ(第一の優良パラメータ)の推定値の周辺をパラメータ範囲として設定することができ、パラメータ範囲を小さく絞ることが可能である。そのため、位置決め制御装置30は、より少ない位置決め制御の試行回数で優良パラメータを見つけることが可能である。
電子部品実装機においては、位置決め制御が完了した後に電子部品の実装が行なわれる。その際、位置決め完了後の振動振幅が大きいと電子部品の実装精度が悪化する場合がある。つまり、位置決め時間が小さいことに加えて、位置決め完了後の残留振動振幅が小さいことが求められる。
実施の形態3にかかる位置決め制御装置30は、位置決め完了後の残留振動振幅を第2許容値の範囲に抑えつつ、良好な指令形状を探索することが可能である。
実施の形態3における評価部33は、位置決め完了後の偏差の振幅の最大値が第2許容値より大きい場合にペナルティを付与する。しかしながら、ペナルティの与え方は上述した方法に限られない。例えば、評価部33は、残留振動振幅が極大となるときの複数の残留振動振幅の値に対してペナルティを付与してもよいし、位置決め完了後の一定の時間のみの残留振動振幅が評価されるように時間についての条件をパラメータに加えてもよい。
上述のことから、実施の形態3にかかる位置決め制御装置30は、位置決め制御を高速化する良好な指令形状を探索する際に、指令形状の探索範囲を適切に設定することができ、ひいては指令形状の調整を効率良く行うことができる。
図11は、実施の形態1にかかる位置決め制御装置10が有する位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能がプロセッサ71によって実現される場合のプロセッサ71を示す図である。つまり、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能は、メモリ72に格納されるプログラムを実行するプロセッサ71によって実現されてもよい。
プロセッサ71は、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、又はDSP(Digital Signal Processor)である。図11には、メモリ72も示されている。
位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能がプロセッサ71によって実現される場合、当該一部又は全部の機能は、プロセッサ71と、ソフトウェア、ファームウェア、又は、ソフトウェア及びファームウェアとの組み合わせにより実現される。ソフトウェア又はファームウェアはプログラムとして記述され、メモリ72に格納される。プロセッサ71は、メモリ72に記憶されたプログラムを読み出して実行することにより、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能を実現する。
位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能がプロセッサ71によって実現される場合、位置決め制御装置10は、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリ72を有する。メモリ72に格納されるプログラムは、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部が実行する手順又は方法をコンピュータに実行させるものであるともいえる。
メモリ72は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable Programmable Read-Only Memory)等の不揮発性もしくは揮発性の半導体メモリ、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク又はDVD(Digital Versatile Disk)等である。
図12は、実施の形態1にかかる位置決め制御装置10が有する位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部が処理回路81によって実現される場合の処理回路81を示す図である。つまり、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部は、処理回路81によって実現されてもよい。
処理回路81は、専用のハードウェアである。処理回路81は、例えば、単一回路、複合回路、プログラム化されたプロセッサ、並列プログラム化されたプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、又はこれらを組み合わせたものである。
位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部は、残部とは別個の専用のハードウェアであってもよい。
位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の複数の機能について、当該複数の機能の一部がソフトウェア又はファームウェアで実現され、当該複数の機能の残部が専用のハードウェアで実現されてもよい。このように、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部15及びパラメータ範囲設定部16の複数の機能は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせによって実現することができる。
実施の形態2にかかる位置決め制御装置20が有する位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部25及びパラメータ範囲設定部26の一部又は全部の機能は、プロセッサ71と同等のプロセッサによって実現されてもよい。当該一部又は全部の機能がプロセッサによって実現される場合、位置決め制御装置20は、位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部25及びパラメータ範囲設定部26の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリを有する。当該メモリは、メモリ72と同等のメモリである。
実施の形態2にかかる位置決め制御装置20が有する位置指令生成部11、駆動制御部12、評価部13、学習部14、学習結果保持部25及びパラメータ範囲設定部26の一部又は全部の機能は、処理回路81と同等の処理回路によって実現されてもよい。
実施の形態3にかかる位置決め制御装置30が有する位置指令生成部11、駆動制御部12、評価部33、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能は、プロセッサ71と同等のプロセッサによって実現されてもよい。当該一部又は全部の機能がプロセッサによって実現される場合、位置決め制御装置30は、位置指令生成部11、駆動制御部12、評価部33、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリを有する。当該メモリは、メモリ72と同等のメモリである。
実施の形態3にかかる位置決め制御装置30が有する位置指令生成部11、駆動制御部12、評価部33、学習部14、学習結果保持部15及びパラメータ範囲設定部16の一部又は全部の機能は、処理回路81と同等の処理回路によって実現されてもよい。
実施の形態4.
図13は、実施の形態4にかかる位置決め制御装置40の構成を示す図である。実施の形態4では、実施の形態1において説明された構成要素については詳細な説明を省略する。位置決め制御装置40は、モータ1を駆動させて制御対象3を目標移動距離だけ移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する位置指令生成部41を有する。位置指令生成部41は、実施の形態1の位置指令生成部11が有する機能を有する。位置決め制御装置40は、モータ1又は制御対象3の位置検出値が位置指令生成部41によって生成された位置指令に追従するようにモータ1を駆動する駆動制御部12を更に有する。
位置指令生成部41は、モータ1の位置指令を生成して駆動制御部12に出力する。位置指令パラメータは、位置指令の指令形状を規定するパラメータである。実施の形態4で用いられる位置指令と、位置指令の一階微分である速度指令と、位置指令の二階微分である加速度指令と、加速度指令の一階微分であるジャークとの各々の形状は、実施の形態1で図2を用いて示した形状と同様である。図2の加速度指令において、第1区間から第3区間までの加速区間の台形形状と、第5区間から第7区間までの減速区間の台形形状とは合同でなくてもよい。加速区間の第1時間長T1と第3時間長T3とを0として、加速度指令の形状を矩形形状としてもよい。第1時間長T1から第7時間長T7までの7個のパラメータが、位置指令パラメータである。
位置決め制御装置40は、制御対象3についての位置決め制御の実行時のモータ1又は制御対象3の位置検出値に基づいて、駆動制御部12による位置決め制御の良し悪しを評価するための評価値を算出する評価部43を更に有する。評価部43は、実施の形態1の評価部13が有する機能を有する。位置決め制御装置40は、位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合の位置指令パラメータと評価部43によって算出された評価値との関係を学習して学習結果を得る学習部44を更に有する。学習部44は、実施の形態1の学習部14が有する機能を有する。以下に、評価部43及び学習部44について更に説明する。
評価部43は、位置検出器4による検出の結果である位置検出値を示す情報を位置検出器4から受け取り、駆動制御部12による位置決め制御の良し悪しを評価するための評価値Qを後述する方法で計算して出力する。駆動制御部12は位置指令に基づいて動作し、位置指令は位置指令パラメータに基づいて計算される。したがって、評価部43によって算出される評価値Qは位置指令パラメータの値に依存する。つまり、評価値Qは位置指令パラメータを評価するための指標であるといえる。実施の形態4では、実施の形態1と同様の方法で評価値Qは計算され、評価値Qが大きな値であるほど、位置指令パラメータは優良であるといえる。
学習部44は、評価値Qを入力として位置指令パラメータと評価値Qとの関係を学習して学習結果を得る。具体的には、学習部44は、位置指令パラメータに対応する評価値Qの平均値と分散値とを推定する関数を更新して学習を行う。学習部44は、学習を行うことで、位置指令パラメータに対応した評価値Qの平均値と、位置指令パラメータに対応する評価値Qの分散値とを計算して推定することが可能となる。平均値と分散値とを計算するための関数には、ガウス過程モデルが用いられてもよい。このように、学習部44は位置指令パラメータと評価値Qとの関係式を得る。
学習部44は、次の位置決め制御を実行するための位置指令パラメータを選定して位置指令生成部41に出力する。学習部44は、次の位置指令パラメータの選定にあたって、学習結果に基づいて評価値Qの平均値と分散値との和が最大値を示す位置指令パラメータを選定する。
学習部44は、位置指令パラメータを変更しつつあらかじめ決められた回数を終えるまで繰り返し実行された位置決め制御によって評価部43から得られた評価値Qの中から、評価値Qを最大とした位置指令パラメータを位置指令生成部41に出力する。
実施の形態4にかかる位置決め制御装置40の機能を更に説明する。学習部44は、1組の位置指令パラメータを決定し、決定された位置指令パラメータを位置指令生成部41に出力する。位置指令生成部41は、入力された位置指令パラメータに基づいて位置指令を計算する。位置指令生成部41は、実施の形態1の位置指令生成部11と同様に、指令形状を規定するために7個の位置指令パラメータを使用する。従来の技術で多く用いられる加速度及び速度の2個のパラメータにより指令形状を規定する方法と比較すると、実施の形態4における調整の自由度は従来のそれより高い。そのため、位置指令パラメータを適切に調整することができれば、位置決め制御装置40は、制御対象3が載置されている装置の機械振動の影響を受ける状況であっても、良好な応答を示す位置決め制御を実現することができる。
他方、制御対象3が載置されている装置の操作者が当該装置を動作させつつ、試行錯誤によって上記の7個のパラメータを人手で調整する場合、比較的大きな労力及び比較的長い時間が必要となる。以下では、位置決め制御装置40が評価部43及び学習部44を有することにより、位置決め制御装置40が操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができることを説明する。
評価部43及び学習部44の動作によれば、学習部44による位置指令パラメータの変更と、変更された位置指令パラメータが用いられた位置決め制御と、評価部43による評価値Qの計算とが繰り返し実行される。この繰り返し実行される評価部43及び学習部44の動作を説明する。
図14は、実施の形態4にかかる位置決め制御装置40が位置指令パラメータを調整する際の動作の手順を示すフローチャートである。ステップS1において、位置指令生成部41に位置指令パラメータの初期値が設定される。位置指令パラメータの初期値は、どのような値でもかまわない。ステップS2において、ステップS1で設定された位置指令パラメータに基づいて計算された位置指令によって位置決め制御が実行される。
ステップS3において、評価部43が評価値Qを計算する。ステップS4において、位置決め制御装置40は、あらかじめ決められた回数の位置決め制御が終了したか否かを判定する。図14のステップS4では、あらかじめ決められた回数は「所定回数」と記載されている。位置決め制御装置40があらかじめ決められた回数の位置決め制御が終了したと判定した場合(S4でYes)、位置決め制御装置40の動作はステップS7に移行する。位置決め制御装置40があらかじめ決められた回数の位置決め制御が終了していないと判定した場合(S4でNo)、位置決め制御装置40の動作はステップS5に移行する。ステップS5において、学習部44は、位置指令パラメータと取得された評価値Qとに基づいて、評価値Qの平均値と評価値Qの分散値とを計算する関数を更新する。
ステップS6において、学習部44は、ステップS5で更新された関数に基づいて、評価値Qの平均値と分散値との和が最大となる位置指令パラメータを求める。ステップS6で求められた位置指令パラメータによって位置決め制御を再度実行して評価値を得るべく、位置決め制御装置40の動作はステップS1に移行する。他方、ステップS4において、位置決め制御装置40があらかじめ決められた回数の位置決め制御が終了したと判定した場合(S4でYes)、あらかじめ決められた数の評価値Qが得られた状態である。
ステップS7において、位置決め制御装置40は、あらかじめ決められた数の評価値Qの中から、評価値Qを最大とする位置指令パラメータを選定し、位置指令生成部41に設定する。ステップS7の動作が終了すると、位置指令パラメータの調整は終了する。
上述のように、学習部44は、ステップS5において指令パラメータと評価値との関係を学習し、位置指令パラメータに対応する評価値Qの平均値と分散値とを得ることができる。学習部44は、ステップS6において、評価値Qの平均値と分散値との和を最大とする位置指令パラメータを求める。求められた位置指令パラメータは、次回の位置決め制御に用いられる。
次に、平均値と分散値との和を最大とする位置指令パラメータを次回の位置決め制御に用いることによって得られる効果を説明する。図15は、実施の形態4にかかる位置決め制御装置40によって得られる効果を説明するための第1図である。図16は、実施の形態4にかかる位置決め制御装置40によって得られる効果を説明するための第2図である。
評価部43及び学習部44の動作が2回実行された後に第3組目の位置指令パラメータが選定される過程を説明する。第1組目の位置指令パラメータは位置指令パラメータPr11と表記され、第2組目の位置指令パラメータは位置指令パラメータPr12と表記され、第3組目の位置指令パラメータは位置指令パラメータPr13と表記される。
図15及び図16は、説明のために位置指令パラメータを1次元に簡略化して示している。評価部43及び学習部44の動作が2回実行された場合、図15の丸印で示すように、位置指令パラメータPr11に対応する評価値Q11と、位置指令パラメータPr12に対応する評価値Q12とが得られる。学習部44は、得られた評価値Q11と評価値Q12とに基づく学習を行い、位置指令パラメータに対応する評価値Qの平均値と分散値とを計算する関数を更新する。
図15に示す平均値を示す曲線と、平均値と分散値との和を示す曲線とが、学習部44により得られた関数に基づいて計算される。図15に示すように、位置指令パラメータPr11と位置指令パラメータPr12との中間点のように、取得されたデータからの距離が遠いほど評価値の不確実性が高いため、分散値は大きくなる。学習部44の動作により、評価値の平均値と分散値との和が最大となる図15の星印の点に対応する位置指令パラメータPr13が次の位置指令パラメータとして選定される。
位置指令パラメータPr13を用いて位置指令が計算されて位置決め制御が行われた結果として、図16に示すように、評価値Q13が得られる。評価値Q13は、評価値Q11及び評価値Q12より大きい値であると仮定する。この段階で調整が終了した場合、評価値Q13が最大となるため、調整終了時点で位置指令パラメータPr13が最も優良なパラメータとなる。
仮に、第3組の位置指令パラメータを選定する段階で、評価値Qの平均値と分散値との和の最大値でなく、評価値Qの平均値の最大値を選ぶ場合を想定する。図15において平均値の曲線の最大値は位置指令パラメータPr13の点ではないため、第3組目の位置指令パラメータとして位置指令パラメータPr13が選定されることはない。そのため、評価値Qの平均値の最大値を選ぶ場合には優良なパラメータを選定することができない可能性がある。
上述のように、分散値は過去に取得されたデータからの距離が遠い点において大きくなる傾向がある。平均値は、過去に取得されたデータに基づいて良好と推定される点において大きくなる傾向がある。つまり、位置決め制御装置40は、平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定することで、比較的大きな評価値Qを得るための探索と搾取とのバランスを良好に保つことができ、調整の終了時に比較的大きな評価値Qを得る位置指令パラメータを見つけることができる。
よって、実施の形態4にかかる位置決め制御装置40は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。上述のことから、位置決め制御装置40は、位置決め制御を高速化する良好な指令形状の調整を効率良く行うことができる。
実施の形態4では、位置決め制御装置40は、評価値Qの平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定する。しかしながら、位置決め制御装置40は、評価値Qの平均値に分散値の2倍を加算した値が最大となる点に対応する位置指令パラメータを次の位置指令パラメータとして選定してもよい。位置決め制御装置40は、学習して得られた評価関数の平均値と分散値とを使って、EI(Expected Improvement)関数、PI(Probability of Improvement)関数又はその他の獲得関数を計算してもよい。
実施の形態4では、位置決め制御装置40は、評価値Qの平均値と分散値との和が最大となる点を次の位置指令パラメータとして選定する。位置決め制御装置40は、このとき評価値Qの平均値と分散値との和が最大となる点を見つけるにあたり、各位置指令パラメータを等間隔に刻んだグリッドの点のなかから順に評価値Qの平均値と分散値とを計算して、グリッドのなかで評価値Qの平均値と分散値とが最大となる位置指令パラメータを選定してもよい。また、位置決め制御装置40は、評価値Qの平均値と分散値との和が最大となる点を見つけるにあたり、疑似ランダム関数に基づくランダム探索により評価値Qの平均値と分散値とが最大となる位置指令パラメータを選定してもよい。
実施の形態5.
実施の形態4にかかる位置決め制御装置40は、位置指令パラメータと評価値Qとの関係式を用いて位置指令パラメータを変更することで位置指令パラメータを適切に調整する。実施の形態5では、疑似ランダム関数を用いて位置指令パラメータを適切に調整する位置決め制御装置について説明する。
図17は、実施の形態5にかかる位置決め制御装置50の構成を示す図である。実施の形態5では、実施の形態1において説明された構成要素については詳細な説明を省略する。位置決め制御装置50は、モータ1を駆動させて制御対象3を目標移動距離だけ移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する位置指令生成部51を有する。位置指令生成部51は、実施の形態1の位置指令生成部11が有する機能を有する。位置決め制御装置50は、モータ1又は制御対象3の位置検出値が位置指令生成部51によって生成された位置指令に追従するようにモータ1を駆動する駆動制御部12を更に有する。
位置指令生成部51は、モータ1の位置指令を生成して駆動制御部12に出力する。位置指令パラメータは、位置指令の指令形状を規定するパラメータである。実施の形態5で用いられる位置指令と、位置指令の一階微分である速度指令と、位置指令の二階微分である加速度指令と、加速度指令の一階微分であるジャークとの各々の形状は、実施の形態1で図2を用いて示した形状と同様である。図2の加速度指令において、第1区間から第3区間までの加速区間の台形形状と、第5区間から第7区間までの減速区間の台形形状とは合同でなくてもよい。加速区間の第1時間長T1と第3時間長T3とを0として、加速度指令の形状を矩形形状としてもよい。第1時間長T1から第7時間長T7までの7個のパラメータが、位置指令パラメータである。
位置決め制御装置50は、制御対象3についての位置決め制御の実行時のモータ1又は制御対象3の位置検出値に基づいて、駆動制御部12による位置決め制御の良し悪しを評価するための評価値を算出する評価部13を更に有する。位置決め制御装置50は、位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合の位置指令パラメータと評価部13によって算出された評価値との関係を学習し学習結果を得る学習部54を更に有する。学習部54は、実施の形態1の学習部14が有する機能を有する。
学習部54は、疑似ランダム関数を用いて位置指令生成部51によって生成された位置指令を変更し、複数回の位置決め制御が実行される度に評価値Qを取得して、位置指令パラメータと評価値Qとの関係を学習する。学習部54は、位置指令パラメータに基づいて決定される加速区間と減速区間との各々における加速度の形状を疑似ランダム関数に基づいて独立に変更する。
具体的に、学習部54は、PSO(Particle Swarm Optimization)を用いる。PSOは、パラメータ空間内に散りばめられた各粒子に対して評価値Qを計算し、疑似ランダム関数を用いて各粒子のパラメータ空間内での位置の更新を繰り返すことで、位置指令パラメータと評価値Qとの関係を学習しつつ、評価値Qが大きな値をとるような位置指令パラメータを見つける方法である。1つの粒子が、1つの位置指令パラメータに対応する。例えば、粒子数が10個であって、更新回数が100回である場合、合計で1000回の位置決め制御が実行され、位置指令パラメータと評価値Qとの組が1000個得られる。
更新前の粒子の位置をx(i)とし、更新後の粒子の位置をx(i+1)とした場合、更新後の粒子の位置x(i+1)は次の式によって計算される。「i」は、自然数である。
x(i+1)=x(i)+v(i+1)
v(i+1)=w×v(i)+c1×r1×(xp−x(i))+c2×r2×(xg−x(i))
上記の式において、w、c1及びc2の各々は、定数であって、1より小さい値に設定されればよい。r1及びr2の各々は、0以上1以下の範囲から疑似ランダム関数を用いて設定される疑似乱数である。xpは、各粒子がi番目までに得た評価値Qの中で、評価値Qを最大とする位置指令パラメータである。xgは、全ての粒子がi番目まで得た評価値Qの中で、評価値Qを最大とする位置指令パラメータである。
x(i)及びv(i)の各々の初期値は、疑似ランダム関数を用いて無作為に決定される。学習部54は、i番目までに得た評価値Qを最大とする位置指令パラメータの方向に探索を行いながら、疑似ランダム関数によって位置指令パラメータを変更することで、大きな評価値Qを得るための探索と搾取とのバランスを良好に保つことができ、調整の終了時に大きな評価値Qを得る位置指令パラメータを見つけることができる。
学習部54は、各粒子の位置の更新により、位置指令パラメータと評価値Qとの関係を学習して、評価値Qが大きな値をとるような位置指令パラメータを見つけることができる。学習部54は、学習結果として位置指令パラメータと評価値Qとの関係を得るが、位置指令パラメータと評価値Qとの組のリストを学習結果として得てもよいし、位置指令パラメータと評価値Qとの関係式を学習結果として得てもよい。
実施の形態5では、疑似ランダム関数に基づく位置指令パラメータの変更方法として、PSOが用いられる。しかしながら、PSOの代わりに、例えばGA(genetic algorithm)又はSA(simulated annealing)といった疑似ランダム関数を使用するアルゴリズムが用いられてもよい。学習部54は、ランダムサーチにより位置指令パラメータを変更してもよい。いずれにしても、学習部54は、学習結果として、位置指令パラメータと評価値Qとの関係を得ることができる。
上述の通り、学習部54は、位置指令パラメータと評価値Qとの関係を学習して、評価値Qが大きな値をとるような位置指令パラメータを見つけることができる。つまり、学習部54は、学習結果に基づいて、位置決め制御に用いられる位置指令パラメータを変更する。よって、位置決め制御装置50は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。
上述のことから、実施の形態5にかかる位置決め制御装置50は、位置決め制御を高速化する良好な指令形状の調整を効率良く行うことができる。
実施の形態6.
実施の形態4にかかる位置決め制御装置40は、位置指令パラメータと評価値Qとの関係式を用いて位置指令パラメータを変更することで位置指令パラメータを適切に調整する。実施の形態6では、制御対象の動作を模擬する動作模擬部を有することで位置指令パラメータを適切に調整する位置決め制御装置について説明する。
図18は、実施の形態6にかかる位置決め制御装置60の構成を示す図である。実施の形態6では、実施の形態1において説明された構成要素については詳細な説明を省略する。位置決め制御装置60は、モータ1を駆動させて制御対象3を目標移動距離だけ移動させるための位置指令を、当該位置指令の形状を定める位置指令パラメータに基づいて生成する位置指令生成部61を有する。位置指令生成部61は、実施の形態1の位置指令生成部11が有する機能を有する。位置決め制御装置60は、モータ1又は制御対象3の位置検出値が位置指令生成部61によって生成された位置指令に追従するようにモータ1を駆動する駆動制御部12を更に有する。
位置決め制御装置60は、制御対象3についての位置決め制御の実行時のモータ1又は制御対象3の位置検出値に基づいて、駆動制御部12による位置決め制御の良し悪しを評価するための評価値を算出する評価部13を更に有する。位置決め制御装置60は、位置指令パラメータが変更されて複数回の制御対象3についての位置決め制御が実行された場合の位置指令パラメータと評価部13によって算出された評価値との関係を学習して学習結果を得る学習部64を更に有する。学習部64は、実施の形態1の学習部14が有する機能を有する。
位置決め制御装置60は、位置指令パラメータを入力として、学習部64に対して位置指令パラメータの再選定を指示する動作模擬部68を更に有する。動作模擬部68は、図18の動作模擬対象68aで示される範囲に含まれる要素の動作を模擬する。つまり、動作模擬部68は、位置指令パラメータを入力とし、モータ1の回転位置又は制御対象3の位置を示す位置検出値の信号を模擬する。具体的には、動作模擬部68は、位置指令パラメータに基づいて制御対象3の動作を模擬し、模擬した結果が事前に設定された制約条件を満たす場合、動作を模擬する際に用いた位置指令パラメータを位置指令生成部61に出力する。
動作模擬部68は、位置検出値を模擬する信号と事前に設定された制約条件とに基づいて、位置指令パラメータの再計算の必要の有無を判定し、再計算の必要があると判定した場合、位置指令パラメータを再計算させる指示である再計算指示を学習部64に与える。以下に、学習部64及び動作模擬部68について更に説明する。
学習部64は、評価値Qを入力として位置指令パラメータと評価値Qとの関係を学習して学習結果を得る。具体的には、学習部64は、位置指令パラメータに対応する評価値Qの平均値と分散値とを計算するための関数を更新して学習を行う。学習部64は、学習を行うことで位置指令パラメータに対応した評価値Qの平均値と、位置指令パラメータに対応する評価値Qの分散値とを推定することが可能となる。平均値と分散値とを計算するための関数には、ガウス過程モデルが用いられてもよい。上述のように、学習部64は位置指令パラメータと評価値Qとの関係式を得る。
学習部64は、次の位置決め制御を実行するための位置指令パラメータを選定して動作模擬部68に出力する。学習部64は、次の位置指令パラメータの選定にあたって、学習結果に基づいて評価値Qの平均値と分散値との和が最大値を示す位置指令パラメータを選定する。
動作模擬部68は、学習部64で選定された位置指令パラメータを受け取り、位置検出値を模擬する信号と事前に設定された制約条件とに基づいて、位置指令パラメータの再計算の必要の有無を判定し、再計算の必要があると判定した場合、位置指令パラメータを再計算させる指示である再計算指示を学習部64に与える。
動作模擬部68は、位置検出値を模擬する信号の振幅があらかじめ決められた値以上である場合、位置指令パラメータを再計算するように、学習部64に再計算指示を与えてもよい。動作模擬部68は、位置検出値を模擬する信号が目標移動距離の値に到達する時間があらかじめ決められた時間以上である場合、位置指令パラメータを再計算するように、学習部64に再計算指示を与えてもよい。つまり、動作模擬部68は、モータ1を駆動させて位置決め制御を実行させることなく、位置指令パラメータを簡易的に評価して評価値があらかじめ決められた不良で小さい値となる場合、学習部64に対して位置指令パラメータを再度選定させる。
位置指令パラメータの再計算指示が与えられた場合、学習部64は、学習結果に基づいて評価値Qの平均値と分散値との和が2番目に大きな値となる位置指令パラメータを選定する。動作模擬部68は、位置指令パラメータを再び受け取り、再計算の必要の有無を判定する。
学習部64及び動作模擬部68の動作により、位置指令パラメータが簡易的に評価されて評価値が不良と判断される小さい値となる場合、位置指令パラメータが変更される。位置決め制御装置60は、学習部64及び動作模擬部68の動作に基づく位置指令パラメータの変更によって位置決め制御の実行回数を低減することができ、かつ位置指令パラメータを効率良く調整することができる。
動作模擬部68は、入力される位置指令パラメータに対応する評価値Qの大小のみを判定することで位置決め制御の実行回数を低減することができる。動作模擬部68には、精緻な制御対象の模擬は必ずしも必要とされない。例えば、位置指令に対してローパスフィルタを適用した信号が、位置検出値を模擬した信号であってもよい。
実施の形態6では、動作模擬部68は、位置検出値を模擬する信号に基づいて位置指令パラメータの再計算の必要の有無を判定する。しかしながら、動作模擬部68の動作はこれに限られない。図18で示された動作模擬対象68aに含まれる要素は、当該要素に限られない。例えば、動作模擬部68は、モータ1に与えられる電流の値を模擬し、模擬される電流の値があらかじめ決められた値以上である場合に位置指令パラメータの再計算を指示してもよい。
動作模擬部68は、位置指令パラメータから生成される位置指令を模擬し、位置指令を模擬する信号が目標移動距離の値に到達する時間があらかじめ決められた時間以上である場合、位置指令パラメータの再計算を指示してもよい。動作模擬部68は、位置指令に対してローパスフィルタを適用した信号を微分することで速度指令又は加速度指令を模擬し、速度指令又は加速度指令を模擬する信号の最大値があらかじめ決められた値以上である場合、位置指令パラメータの再計算を指示してもよい。
よって、実施の形態6にかかる位置決め制御装置60は、操作者の試行錯誤を必要とせず、位置指令パラメータを適切に調整することができる。上述のことから、位置決め制御装置60は、位置決め制御を高速化する良好な指令形状の調整を効率良く行うことができる。
上述した実施の形態1から6までの位置決め制御装置10、位置決め制御装置20、位置決め制御装置30、位置決め制御装置40、位置決め制御装置50及び位置決め制御装置60の一部又は全部は、位置指令パラメータによって、加速の開始、加速の終了、減速の開始及び減速の終了の各時点における加速度の大きさのうちの2つ以上のものを独立に設定してもよい。
実施の形態4にかかる位置決め制御装置40が有する位置指令生成部41、駆動制御部12、評価部43及び学習部44の一部又は全部の機能は、プロセッサ71と同等のプロセッサによって実現されてもよい。当該一部又は全部の機能がプロセッサによって実現される場合、位置決め制御装置40は、位置指令生成部41、駆動制御部12、評価部43及び学習部44の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリを有する。当該メモリは、メモリ72と同等のメモリである。
実施の形態4にかかる位置決め制御装置40が有する位置指令生成部41、駆動制御部12、評価部43及び学習部44の一部又は全部の機能は、処理回路81と同等の処理回路によって実現されてもよい。
実施の形態5にかかる位置決め制御装置50が有する位置指令生成部51、駆動制御部12、評価部13及び学習部54の一部又は全部の機能は、プロセッサ71と同等のプロセッサによって実現されてもよい。当該一部又は全部の機能がプロセッサによって実現される場合、位置決め制御装置50は、位置指令生成部51、駆動制御部12、評価部13及び学習部54の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリを有する。当該メモリは、メモリ72と同等のメモリである。
実施の形態5にかかる位置決め制御装置50が有する位置指令生成部51、駆動制御部12、評価部13及び学習部54の一部又は全部の機能は、処理回路81と同等の処理回路によって実現されてもよい。
実施の形態6にかかる位置決め制御装置60が有する位置指令生成部61、駆動制御部12、評価部13、学習部64及び動作模擬部68の一部又は全部の機能は、プロセッサ71と同等のプロセッサによって実現されてもよい。当該一部又は全部の機能がプロセッサによって実現される場合、位置決め制御装置60は、位置指令生成部61、駆動制御部12、評価部13、学習部64及び動作模擬部68の一部又は全部によって実行されるステップが結果的に実行されることになるプログラムを格納するためのメモリを有する。当該メモリは、メモリ72と同等のメモリである。
実施の形態6にかかる位置決め制御装置60が有する位置指令生成部61、駆動制御部12、評価部13、学習部64及び動作模擬部68の一部又は全部の機能は、処理回路81と同等の処理回路によって実現されてもよい。
以上の実施の形態に示した構成は、本発明の内容の一例を示すものであり、別の公知の技術と組み合わせることも可能であるし、本発明の要旨を逸脱しない範囲で、構成の一部を省略又は変更することも可能である。
1 モータ、2 ボールねじ、3 制御対象、4 位置検出器、10,20,30,40,50,60 位置決め制御装置、11,41,51,61 位置指令生成部、12 駆動制御部、13,33,43 評価部、14,44,54,64 学習部、15,25 学習結果保持部、16,26 パラメータ範囲設定部、17,27 運転条件、68 動作模擬部、68a 動作模擬対象、71 プロセッサ、72 メモリ、81 処理回路。

Claims (13)

  1. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め制御装置であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成する位置指令生成部と、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動する駆動制御部と、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出する評価部と、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータの上限値及び下限値を規定するパラメータ範囲における前記位置指令パラメータと前記評価値との関係を示す関係式を学習結果として得る学習部と
    を備えることを特徴とする位置決め制御装置。
  2. 前記学習部は、前記位置指令パラメータに対応する前記評価値の推定値を出力する関数または前記評価値の平均値と分散値の推定値を出力する関数を前記学習結果として得る
    ことを特徴とする請求項1に記載の位置決め制御装置。
  3. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め制御装置であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成する位置指令生成部と、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動する駆動制御部と、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出する評価部と、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を、実行された位置決め制御に用いた位置指令パラメータの中で評価値を最大とする位置指令パラメータと疑似ランダム関数とに基づいて独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習して学習結果を得る学習部と
    を備えることを特徴とする位置決め制御装置。
  4. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め制御装置であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令であって、加速区間及び減速区間の夫々においてジャークの大きさが非零の一定値となる区間を有する位置指令を生成する位置指令生成部と、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動する駆動制御部と、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出する評価部と、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータと前記評価値との関係を学習結果として得る学習部と
    を備えることを特徴とする位置決め制御装置。
  5. 前記位置指令パラメータに基づいて前記制御対象の動作を模擬し、模擬した結果が事前に設定された制約条件を満たす場合、動作を模擬する際に用いた位置指令パラメータを前記位置指令生成部に出力する動作模擬部を更に備える
    ことを特徴とする請求項1からのいずれか1項に記載の位置決め制御装置。
  6. 前記学習部によって得られた前記学習結果に基づいて、前記位置指令パラメータの上限値及び下限値を規定するパラメータ範囲を設定するパラメータ範囲設定部を更に備える
    ことを特徴とする請求項1からのいずれか1項に記載の位置決め制御装置。
  7. 前記目標移動距離を示す情報を含む運転条件と前記学習部によって得られた前記学習結果とを対応付けて保持する学習結果保持部を更に備え、
    前記学習結果保持部は、ひとつ以上の前記位置指令パラメータを優良パラメータとして保持し、
    前記パラメータ範囲設定部は、前記学習結果保持部によって保持された前記優良パラメータより小さい値を前記パラメータ範囲の下限とすると共に、前記優良パラメータより大きい値を前記パラメータ範囲の上限として、前記パラメータ範囲を設定する
    ことを特徴とする請求項に記載の位置決め制御装置。
  8. 前記目標移動距離を示す情報を含む運転条件と前記学習部によって得られた前記学習結果とを対応付けて保持する学習結果保持部を更に備え、
    前記学習結果保持部は、前記評価値が最大となる前記位置指令パラメータを第一の優良パラメータとして保持し、
    前記パラメータ範囲設定部は、前記運転条件に含まれる前記情報が示す前記目標移動距離が変更された場合、過去に学習が実行されたときの目標移動距離をもとに補間計算を行って、変更後の目標移動距離に対応する補間点の第一の優良パラメータを推定し、推定された前記補間点の第一の優良パラメータより小さい値を前記パラメータ範囲の下限とすると共に、推定された前記補間点の第一の優良パラメータより大きい値を前記パラメータ範囲の上限として、前記パラメータ範囲を設定する
    ことを特徴とする請求項に記載の位置決め制御装置。
  9. 前記制御対象の目標停止位置の情報を含む運転条件と前記学習部によって得られた前記学習結果とを対応付けて保持する学習結果保持部を更に備え、
    前記学習結果保持部は、前記評価値が最大となる前記位置指令パラメータを第二の優良パラメータとして保持し、
    前記パラメータ範囲設定部は、前記運転条件に含まれる前記情報が示す前記目標停止位置が変更された場合、過去に学習が実行されたときの目標停止位置をもとに補間計算を行って、変更後の目標停止位置に対応する補間点の第二の優良パラメータを推定し、推定された前記補間点の第二の優良パラメータより小さい値を前記パラメータ範囲の下限とすると共に、推定された前記補間点の第二の優良パラメータより大きい値を前記パラメータ範囲の上限として、前記パラメータ範囲を設定する
    ことを特徴とする請求項に記載の位置決め制御装置。
  10. 前記位置指令生成部は、前記学習部の学習によって得られた位置指令パラメータが設定されて前記位置指令を生成する学習器である
    ことを特徴とする請求項1から4のいずれか1項に記載の位置決め制御装置。
  11. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め方法であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成するステップと、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動するステップと、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出するステップと、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、前記位置指令パラメータの上限値及び下限値を規定するパラメータ範囲における前記位置指令パラメータと前記評価値との関係を示す関係式を学習し、学習結果に基づいて新たな位置指令パラメータを決定するステップと
    を含むことを特徴とする位置決め方法。
  12. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め方法であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令を生成するステップと、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動するステップと、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出するステップと、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を、実行された位置決め制御に用いた位置指令パラメータの中で評価値を最大とする位置指令パラメータと疑似ランダム関数とに基づいて独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、学習結果に基づいて新たな位置指令パラメータを決定するステップと
    を含むことを特徴とする位置決め方法。
  13. モータを駆動させて制御対象を目標移動距離だけ移動させる位置決め方法であって、
    位置指令パラメータに基づいて加速区間及び減速区間の加速度の形状が決定される位置指令であって、加速区間及び減速区間の夫々においてジャークの大きさが非零の一定値となる区間を有する位置指令を生成するステップと、
    前記モータ又は前記制御対象の位置検出値が前記位置指令に追従するように前記モータを駆動するステップと、
    前記制御対象についての位置決め制御の実行時の前記モータ又は前記制御対象の位置検出値に基づいて位置決め性能に関する評価値を算出するステップと、
    前記位置指令パラメータに基づいて決定される加速区間と減速区間とにおける加速度の形状の各々を独立に変更しつつ、複数回の位置決め制御が実行された場合の前記位置指令パラメータと前記評価値との関係を学習し、学習結果に基づいて新たな位置指令パラメータを決定するステップと
    を含むことを特徴とする位置決め方法。
JP2019549492A 2018-10-12 2019-01-30 位置決め制御装置及び位置決め方法 Active JP6664561B1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018193380 2018-10-12
JP2018193380 2018-10-12
PCT/JP2019/003205 WO2020075316A1 (ja) 2018-10-12 2019-01-30 位置決め制御装置及び位置決め方法

Publications (2)

Publication Number Publication Date
JP6664561B1 true JP6664561B1 (ja) 2020-03-13
JPWO2020075316A1 JPWO2020075316A1 (ja) 2021-02-15

Family

ID=70000325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019549492A Active JP6664561B1 (ja) 2018-10-12 2019-01-30 位置決め制御装置及び位置決め方法

Country Status (1)

Country Link
JP (1) JP6664561B1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114754477A (zh) * 2022-04-28 2022-07-15 广州奥特信息科技股份有限公司 空调控制系统、方法、中央空调系统、装置及存储介质
EP4047811A1 (fr) * 2021-02-23 2022-08-24 Gaw-R Company Sprl Méthode de commande d'un moteur pas à pas à l'aide d'un circuit logique programmable
JP7505695B2 (ja) 2020-12-07 2024-06-25 三菱電機株式会社 モータ制御装置
JP7557682B2 (ja) 2021-10-29 2024-09-30 パナソニックIpマネジメント株式会社 制御パラメータの生成方法、プログラム、記録媒体、および、制御パラメータの生成装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JPH07244517A (ja) * 1994-03-04 1995-09-19 Mitsubishi Electric Corp モーション制御装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
WO2012169278A1 (ja) * 2011-06-09 2012-12-13 三菱電機株式会社 モータ制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04324507A (ja) * 1991-04-25 1992-11-13 Hitachi Ltd 駆動装置の加減速制御方法及びロボットシステム
JPH07244517A (ja) * 1994-03-04 1995-09-19 Mitsubishi Electric Corp モーション制御装置
JP2007034781A (ja) * 2005-07-28 2007-02-08 Fuji Electric Fa Components & Systems Co Ltd 位置決め制御装置の制御パラメータ調整方法
WO2012169278A1 (ja) * 2011-06-09 2012-12-13 三菱電機株式会社 モータ制御装置
JP2018126796A (ja) * 2017-02-06 2018-08-16 セイコーエプソン株式会社 制御装置、ロボットおよびロボットシステム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7505695B2 (ja) 2020-12-07 2024-06-25 三菱電機株式会社 モータ制御装置
EP4047811A1 (fr) * 2021-02-23 2022-08-24 Gaw-R Company Sprl Méthode de commande d'un moteur pas à pas à l'aide d'un circuit logique programmable
BE1029131B1 (fr) * 2021-02-23 2022-09-19 Gaw R Company Méthode de commande d’un moteur pas à pas à l’aide d’un circuit logique programmable
JP7557682B2 (ja) 2021-10-29 2024-09-30 パナソニックIpマネジメント株式会社 制御パラメータの生成方法、プログラム、記録媒体、および、制御パラメータの生成装置
CN114754477A (zh) * 2022-04-28 2022-07-15 广州奥特信息科技股份有限公司 空调控制系统、方法、中央空调系统、装置及存储介质
CN114754477B (zh) * 2022-04-28 2023-11-28 广州奥特信息科技股份有限公司 空调控制系统、方法、中央空调系统、装置及存储介质

Also Published As

Publication number Publication date
JPWO2020075316A1 (ja) 2021-02-15
US20220004160A1 (en) 2022-01-06

Similar Documents

Publication Publication Date Title
JP6664561B1 (ja) 位置決め制御装置及び位置決め方法
KR102494187B1 (ko) 위치 결정 제어 장치 및 위치 결정 방법
JP6903240B1 (ja) モータ制御装置及びモータ制御方法
US9815201B2 (en) Method and apparatus for industrial robotic energy saving optimization using fly-by
JP2019530031A (ja) 反復運動制御の方法
CN111857052A (zh) 机器学习装置、数值控制系统以及机器学习方法
JP6981579B2 (ja) 位置決め制御装置及び位置決め制御方法
JP2022024333A (ja) 付加製造装置および付加製造方法
JP5012657B2 (ja) 運動指令生成装置
US12140925B2 (en) Positioning control device and positioning method
JP6800384B1 (ja) 位置決め制御装置および位置決め方法
JP7305061B2 (ja) パラメータ調整装置およびパラメータ調整方法
JP4485896B2 (ja) Pid制御装置
JP4301491B2 (ja) 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
JP7415100B1 (ja) パラメータ調整装置およびパラメータ調整方法
KR100970539B1 (ko) 최적 지령 작성 장치
JP2020184268A (ja) 演算処理装置、演算処理プログラム、及び演算処理方法
US12147216B2 (en) Machining program conversion device, numerical control device, and machining program conversion method
US12118280B1 (en) Electric drive unit simulation
JP7275389B2 (ja) サーボ制御装置
WO2024122066A1 (ja) パラメータ調整装置及びコンピュータ読み取り可能な記録媒体
JP2007004391A (ja) 生産・物流スケジュール作成装置及び方法、生産・物流プロセス制御装置及び方法、コンピュータプログラム、並びにコンピュータ読み取り可能な記録媒体
Altinoz et al. Modelling and controller design for ball and beam system
US20220382253A1 (en) Machining program conversion device, numerical control device, and machining program conversion method
CN117957088A (zh) 数控装置、加工系统、数控方法及加工方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190910

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190910

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190910

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200121

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200218

R150 Certificate of patent or registration of utility model

Ref document number: 6664561

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250