CN115917445A - 伺服控制装置 - Google Patents
伺服控制装置 Download PDFInfo
- Publication number
- CN115917445A CN115917445A CN202080101273.9A CN202080101273A CN115917445A CN 115917445 A CN115917445 A CN 115917445A CN 202080101273 A CN202080101273 A CN 202080101273A CN 115917445 A CN115917445 A CN 115917445A
- Authority
- CN
- China
- Prior art keywords
- command value
- unit
- servo motor
- servo
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/048—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Feedback Control In General (AREA)
- Control Of Electric Motors In General (AREA)
Abstract
伺服控制装置(1)基于周期性地输入的对伺服电动机(3)的动作进行指示的指令值,对伺服电动机(3)的动作进行控制。伺服控制装置(1)具有校正部(12)、判断部(13)和伺服放大器(11)。校正部(12)基于指令值和伺服电动机(3)的动作的实测结果,决定对指令值进行校正后的指令值即候选指令值和对候选指令值的信赖度进行评价的指标即信赖度指标,将用于对伺服电动机(3)进行控制的校正后的指令值即校正后指令值进行输出。判断部(13)基于信赖度指标而判断许可或者不许可候选指令值向伺服电动机(3)的控制的应用,将判断结果输出至校正部(12)。伺服放大器(11)基于校正后指令值对伺服电动机(3)进行控制。校正部(12)基于判断结果将候选指令值作为校正后指令值而输出至伺服放大器(3)。
Description
技术领域
本发明涉及伺服控制装置,该伺服控制装置控制对工作机械等控制对象的轴进行驱动的伺服电动机。
背景技术
一般来说,在驱动控制对工作机械、机器人及工业机械等控制对象进行驱动的电动机的伺服控制装置中,以实现从指令值生成装置指定出的位置及速度的方式对向电动机的驱动电流进行控制。指令值生成装置的一个例子是数控(Numerical Control:NC)装置或者运动控制器。特别地,在加工刀具在由加工程序指示出的移动轨迹上移动的情况下,一边对位置精细地进行管理,一边进行电动机的驱动控制。
在专利文献1中公开了一种控制装置,该控制装置将工件的特征量及生产产品的环境的属性值作为输入数据,通过预测模型,对向从工件生产产品的生产设备的指令值进行预测。在专利文献1所记载的控制装置中,在开始预测模型的运算处理之后,基于直至预测模型的运算处理完成为止的剩余处理时间,判定基于从预测模型得到的输出值的指令值的决定,是否赶得上对通过生产装置进行的生产的动作进行控制的控制定时。在指令值的决定赶得上控制定时的情况下,基于通过预测模型的运算处理的完成而得到的输出值,决定向生产装置的指令值。另一方面,在指令值的决定赶不上控制定时的情况下,预测模型的运算处理中止,判定中止的结果作为预测的结果是否能够信赖,在能够信赖的情况下基于中止的结果的值而决定向生产装置的指令值。
专利文献1:日本特开2019-179468号公报
发明内容
另外,在电动机的驱动控制中,已知下述技术,即,使用基于通过传感器等取得的电动机的位置及速度这样的数据对指令值的校正量进行推定的模型,对指令值进行校正。但是,如果无法充分地考虑模型在电动机的驱动控制中发生的现象,则校正效果没有全部表现,或者成为过校正,有时通过校正反而有可能使结果恶化。另外,在向模型的输入由于干扰等而紊乱的情况下或者存在未知的输入的情况下,有可能进行设想外的校正。因此,考虑对通过模型推定出的值能够以何种程度信赖即对预测的结果的不可靠性进行判断,有效使用于控制。但是,在专利文献1所记载的技术中的信赖度,是与通过预测模型直至最后为止运算出的结果相比较的情况下的信赖度,不是用于对从预测模型得到的预测结果的不可靠性进行判定的信赖度。即,在专利文献1所记载的技术中,通过预测模型直至最后为止运算的情况下的结果是不考虑预测的不可靠性,用于指令值的生成。因此,要求下述技术,即,在使用基于电动机的动作的状态对校正量进行推定的模型对指令值进行校正的情况下,能够判断在校正量的推定时刻推定出的校正量能够以何种程度信赖。
本发明就是鉴于上述情况而提出的,其目的在于得到在校正量的推定时刻,能够判断校正量的推定时刻以后所推定出的校正量能够以何种程度信赖的伺服控制装置。
为了解决上述的课题,并达到目的,本发明所涉及的伺服控制装置基于周期性地输入的对伺服电动机的动作进行指示的指令值对伺服电动机的动作进行控制。伺服控制装置具有校正部、判断部和伺服放大器。校正部基于指令值和伺服电动机的动作的实测结果,决定对指令值进行校正后的指令值即候选指令值和对候选指令值的信赖度进行评价的指标即信赖度指标,将用于对伺服电动机进行控制的校正后的指令值即校正后指令值进行输出。判断部基于信赖度指标而判断许可或者不许可候选指令值向伺服电动机的控制的应用,将判断结果输出至校正部。伺服放大器基于校正后指令值对伺服电动机进行控制。校正部基于判断结果将候选指令值作为校正后指令值而输出至伺服放大器。
发明的效果
本发明所涉及的伺服控制装置具有下述效果,即,在校正量的推定时刻,能够判断校正量的推定时刻以后所推定出的校正量能够以何种程度信赖。
附图说明
图1是示意地表示实施方式1所涉及的伺服控制装置的结构的一个例子的框图。
图2是用于概念性地对预测值和预测值的波动进行说明的图。
图3是表示实施方式1所涉及的伺服控制装置中的控制方法的顺序的一个例子的流程图。
图4是示意地表示实施方式2所涉及的伺服控制装置的结构的一个例子的框图。
图5是示意地表示实施方式2所涉及的伺服控制装置的模型信息更新部的结构的一个例子的框图。
图6是示意地表示实施方式3所涉及的伺服控制装置的结构的一个例子的框图。
图7是示意地表示实现实施方式1、2、3所涉及的伺服控制装置的硬件结构的一个例子的图。
具体实施方式
下面,基于附图,对本发明的实施方式所涉及的伺服控制装置详细地进行说明。
实施方式1.
在伺服电动机的驱动控制中,存在由于伺服电动机的旋转方向反转时的摩擦干扰的影响而产生轨迹误差这样的问题。该轨迹误差也被称为象限凸起或者空转,要求用于抑制轨迹误差的技术。作为对轨迹误差进行抑制的技术的一个例子,考虑下述方法,即,使用基于通过传感器等取得的电动机的位置及速度这样的数据,对抑制轨迹误差的校正量进行推定的模型,对指令值进行校正。但是,如果无法充分地考虑使轨迹误差产生的现象,则校正效果没有全部表现,或者成为过校正,通过校正反而有可能使结果恶化。另外,在向模型的输入由于干扰等而紊乱的情况下、或者存在未知的输入的情况下,有可能进行设想外的校正。因此,判断使用模型对校正量的推定时刻以后的时刻进行推定得到的值能够以何种程度信赖,即对预测的结果的不可靠性进行判断,有效使用于控制,由此能够抑制轨迹误差。在下面的实施方式中,对使用模型推定出的结果的预测的不可靠性进行判断,说明能够对伺服电动机的驱动控制中的轨迹误差的产生进行抑制的伺服控制装置。
图1是示意地表示实施方式1所涉及的伺服控制装置的结构的一个例子的框图。伺服控制装置1与指令值生成部2和伺服电动机3电连接。伺服控制装置1基于周期性地由指令值生成部2生成的指令值,进行控制以使得伺服电动机3的实际的动作的状态与校正后的指令值一致。动作的状态的一个例子是伺服电动机3的位置、速度及加速度。伺服控制装置1基于由指令值生成部2生成的指令值,生成用于对伺服电动机3进行驱动的电流及电压,施加至伺服电动机3。
指令值生成部2是以预先确定的时间间隔即伺服控制周期将指令值向伺服控制装置1输出的装置。指令值生成部2例如通过数控装置或者运动控制器而实现,使用公知的技术而生成指令值。在这里,指令值是用于将伺服电动机3的动作的状态或者控制量控制为期望的状态的目标值,包含伺服电动机3的位置、速度、加速度、扭矩、电流及模型位置中的至少1个。此外,模型位置是通过计算而求出的伺服电动机3的大致的位置,推定出本次的伺服控制周期中的伺服电动机3的实际的位置。使用模拟出伺服电动机3的构造的伺服模型,由此能够对模型位置进行推定。该伺服模型单纯地定义为具有截止频率的1次延迟滤波器,通常能够作为具有低通特性的滤波器进行处理。
伺服电动机3是用于经由未图示的滚珠丝杠等动力传递机构进行控制对象的驱动控制的驱动装置,从伺服控制装置1内的伺服放大器11接受电压的施加而旋转。控制对象的一个例子是工作机械、机器人或者工业机械。伺服电动机3具有对伺服电动机3的位置进行检测的编码器等位置检测器。位置检测器将检测出的位置输出至伺服控制装置1。由位置检测器检测出的位置输入至伺服控制装置1内的伺服放大器11及校正部12。
伺服控制装置1具有伺服放大器11、校正部12和判断部13。伺服放大器11是以预先确定的时间间隔即伺服控制周期对伺服电动机3的位置、速度及加速度进行控制的装置。伺服放大器11实际上进行控制,以使得伺服电动机3的实际的动作的状态与通过后面记述的校正部12进行校正后的指令值一致。下面,在对伺服电动机3的动作进行控制时使用的指令值被称为校正后指令值。
校正部12基于由指令值生成部2生成的指令值和伺服电动机3的实际的位置及速度等状态量,决定当前或者未来的校正后指令值的候选即候选指令值、和用于对该候选指令值的信赖度进行评价的指标即信赖度指标。另外,校正部12输出用于对伺服电动机3进行控制的校正后的指令值即校正后指令值。具体地说,校正部12将由指令值生成部2生成的指令值和伺服电动机3的实际的位置及速度等状态量作为输入,通过后面记述的方法,决定候选指令值和信赖度指标并输出。伺服电动机3的实际的状态量是伺服电动机3的动作的实测结果。
判断部13基于从校正部12输出的信赖度指标,对许可或者不许可候选指令值向伺服电动机3的控制的应用进行判断,将判断结果输出至校正部12。具体地说,判断部13在基于从校正部12输出的信赖度指标,针对候选指令值的应用而判断为能够信赖的情况下,针对校正部12而输出将候选指令值向伺服放大器11的输出设为许可的判断结果。判断部13在基于从校正部12输出的信赖度指标,针对候选指令值的应用而判断为无法信赖的情况下,针对校正部12而输出将候选指令值向伺服放大器11的输出设为不许可的判断结果。信赖度指标是用于对预测出的结果的不可靠性进行判定的指标,是判定是否能够将预测出的结果使用于指令值的校正的指标。在校正部12中,使用预测模型对未来的伺服电动机3的状态进行预测,因此在预测模型的精度低的情况下,有时未来的预测的不可靠性提高。另外,在向预测模型的输入由于干扰等而紊乱,或存在未知的输入的情况下,有时由预测模型预测出的结果的不可靠性也提高。在判断部13中,对如上所述的校正部12中的预测的不可靠性进行判断。作为通过校正部12根据信赖度指标对信赖度进行判断的方法,例如存在根据与预先设定出的基准值即阈值之间的大小关系进行判断等方法,但并不限定于该方法。
另外,校正部12按照来自判断部13的判断结果,选择用于对伺服电动机3进行控制的指令值,将选择出的指令值作为校正后指令值而输出至伺服放大器11。具体地说,校正部12在取得了许可的判断结果的情况下,将候选指令值作为校正后指令值而输出至伺服放大器11,在取得了不许可的判断结果的情况下,通过后面记述的方法将与候选指令值不同的指令作为校正后指令值而输出至伺服放大器11。
在这里,对校正部12的更详细的结构进行说明。校正部12具有预测部121和校正选择部122。预测部121具有对当前或者未来的伺服电动机3的位置等的动作的状态量进行预测的预测模型。预测部121将从指令值生成部2取得的指令值和从伺服电动机3取得的伺服电动机3的实际的动作的状态量作为输入,使用预测模型对预测出的当前或者未来的伺服电动机3的动作的状态即预测状态量进行预测。另外,预测部121计算使用预测模型对预测状态量的信赖度进行评价的信赖度指标。此外,信赖度指标对预测状态量的信赖度进行评价,但候选指令值是使用评价的对象即预测状态量进行校正后的指令值,因此有时对候选指令值的信赖度进行评价。
作为对预测模型、从预测模型预测出的预测状态量和与该预测状态量相对应的信赖度指标进行计算的一个例子,举出使用将预测状态量假定为按照特定的分布的概率变量的概率模型的一个例子即高斯过程回归的方法。在使用高斯过程回归对预测状态量和信赖度指标进行计算的情况下,例如,进行下述的计算。将N设为自然数,进行通过加工等使伺服电动机3动作时的N点的采样,将输入数据设为x,将输出数据设为y,将格拉姆矩阵设为CN。此时,如果将采样的输入数据的1个设为xi(i为自然数),将采样的输出数据的1个设为yi(i为自然数),将采样输入数据的值设为x1、···、xN,则针对新的输入xN+1的输出yN+1的预测值m(xN+1)和成为信赖度指标的基础的分散σ2(xN+1)通过下式(1)及下式(2)进行计算。
m(xN+1)=kT·(CN -1)·y···(1)
σ2(xN+1)=c-kT·(CN -1)·k···(2)
在这里,k如下式(3)所示,是将采样到的输入数据x1、···、xN各自和新的输入xN+1设为自变量时的内核函数的值排列得到的矢量。另外,c是在新的输入xN+1彼此的内核函数的值加上预测模型的精度参数而得到的标量值。此外,在(2)式中,求出分散σ2(xN+1),但通过对分散的平方根进行计算,从而能够求出标准偏差σ(xN+1)。
【式1】
接下来,对预测值及预测值的波动进行说明。图2是用于概念性地对预测值和预测值的波动进行说明的图。在图2中,示出了使用高斯过程回归对预测值和该预测值的波动的范围进行计算的例子。图2的横轴示出输入数据x,纵轴示出输出数据y。图2的黑圆点所示的点示出预先取得的数据的点。在使用高斯过程回归的预测中,输出数据y按照高斯分布对输出数据y的预测值进行预测。因此,如果将预测值作为高斯分布的平均m(x),将表示预测的不可靠性的指标作为高斯分布的标准偏差σ(x),则统计性地示出实际的输出数据y以大约95%的概率,进入m(x)-2σ(x)以上且m(x)+2σ(x)以下的范围。在图2中,实线所示的曲线示出输出数据y的预测值即m(x),虚线所示的曲线示出m(x)-2σ(x)及m(x)+2σ(x)的曲线。如图2所示,存在下述倾向,即,在与所取得的数据接近的部位,预测值的波动变小,在远离所取得的数据的部位,预测值的波动变大。
从该统计性的观点出发,基于标准偏差σ(x)对信赖度指标进行定义。例如,在将标准偏差σ(x)设为信赖度指标的情况下,信赖度指标变得越小,则波动变得越小,因此预测值变得越可靠。在此基础上,在实际的输出数据y要求容许误差δ(>0)的情况下,如果满足2σ(x)≤δ,则在进行校正时有可能收敛于容许误差以内。另外,在其他例子中,在将信赖度指标设为1/(1+α·σ(x))、α=2/δ的情况下,在波动为0时,信赖度指标成为1,在波动无限大时,信赖度指标成为0,信赖度指标的值越大,则波动越小,预测值变得越可靠。在此基础上,在信赖度指标大于或等于0.5的情况下,由于满足2σ(x)≤δ,因此在进行校正时有可能收敛于容许误差以内。如上所述,预测部121能够基于使用预测模型预测出的输出数据y即伺服电动机3的动作的状态量的波动而决定信赖度指标。此外,关于信赖度指标,并不限定于此。
在这里,说明了使用高斯过程回归对预测和针对预测的信赖度指标进行计算的例子。但是,预测方法并不限定于此,例如,也可以是使用决策树、线性回归、提升方法、神经网络这样的机器学习的方法。另外,信赖度指标的计算方法并不限定于此,例如也可以使用密度推定、混合密度网络等这样的方法。
返回至图1,校正选择部122以从预测部121输出的预测状态量与指令值一致的方式对校正量进行计算,对指令值进行校正而生成候选指令值。而且,校正选择部122基于从判断部13输出的判断结果对是否将候选指令值输出至伺服放大器11进行控制。校正选择部122在判断结果为许可的情况下,将候选指令值作为校正后指令值而输出至伺服放大器11,在判断结果为不许可的情况下,将与候选指令值不同的其他值作为校正后指令值而输出至伺服放大器11。其他值的一个例子是前1个周期的校正后指令值、从指令值生成部2输出的指令值即没有进行校正的指令值,或者预先指定出的值。但是,其他值并不限定于这些值。此外,在不许可的情况下,预先设定将上述其他值之中的哪个值进行输出。
接下来,对实施方式1所涉及的伺服控制装置1的动作进行说明。图3是表示实施方式1所涉及的伺服控制装置中的控制方法的顺序的一个例子的流程图。首先,指令值生成部2以伺服控制周期生成指令值,输出至伺服控制装置1。该指令值输入至伺服控制装置1的预测部121。另外,伺服电动机3将伺服电动机3的实际的动作的状态量输出至伺服控制装置1。该伺服电动机3的动作的状态量输入至预测部121。
预测部121取得指令值及伺服电动机3的动作的状态量(步骤S11),使用预测模型,对伺服电动机3的校正量的推定时刻以后的伺服电动机3的动作的预测状态量及信赖度指标进行计算(步骤S12)。预测部121将计算出的伺服电动机3的动作的预测状态量输出至校正选择部122,将信赖度指标输出至判断部13。
校正选择部122生成以动作的预测状态量与指令值一致的方式对指令值进行校正后的候选指令值(步骤S13)。另外,判断部13基于信赖度指标而判断是否许可候选指令值向伺服放大器11的输出(步骤S14)。判断部13在基于信赖度指标,针对候选指令值的应用而判断为能够信赖的情况下,将许可候选指令值向伺服放大器11的输出的判断结果对校正选择部122进行输出。另外,判断部13在基于信赖度指标,针对候选指令值的应用而判断为无法信赖的情况下,将不许可候选指令值向伺服放大器11的输出的判断结果对校正选择部122进行输出。
校正选择部122判定判断结果是否为许可(步骤S15)。在判断结果为许可的情况下(步骤S15为Yes的情况下),校正选择部122将候选指令值作为校正后指令值而输出至伺服放大器11(步骤S16)。另一方面,在判断结果为不许可的情况下,即在不许可的情况下(步骤S15为No的情况下),校正选择部122将不是候选指令值的其他值作为校正后指令值而输出至伺服放大器11(步骤S17)。在步骤S16或者步骤S17后,伺服放大器11基于校正后指令值对伺服电动机3进行控制(步骤S18)。而且,处理返回至步骤S11。以上的处理在每次从指令值生成部2以伺服控制周期输入指令值时进行重复。
在实施方式1中,校正部12将由指令值生成部2生成的指令值和伺服电动机3的动作的状态量的实测结果作为输入,决定对指令值进行校正后的候选指令值和表示该候选指令值的预测的不可靠性的信赖度指标。另外,判断部13基于信赖度指标,进行是否将候选指令值作为校正后指令值而应用于伺服电动机3的控制的判断,将该判断结果输出至校正部12。而且,校正部12基于判断结果,决定向伺服放大器11输出的校正后指令值。由此,具有能够抑制将预测的不可靠性高的候选指令值作为校正后指令值使用而加工精度恶化这一效果。即,通过实施方式1所涉及的伺服控制装置1,具有以下效果,即,能够在对指令值进行校正的校正量的推定时刻,判断校正量的推定时刻以后所推定出的校正量能够以何种程度信赖。
另外,校正部12使用预测模型,从决定候选指令值的时刻起对之后的时刻的伺服电动机3的动作的状态量即预测状态量和与预测状态量相对应的信赖度指标进行预测。并且,校正部12基于预测状态量,决定候选指令值。如上所述,能够使用将当前或者未来的校正量和与该校正量相对应的信赖度指标同时输出的预测模型,因此具有校正量的信赖度的评价变得容易这一效果。
并且,校正部12在候选指令值的应用为许可的情况下,将候选指令值作为校正后指令值而输出至伺服放大器11,在候选指令值的应用为不许可的情况下,将其他值作为校正后指令值而输出至伺服放大器11。如上所述,能够自动地对使用利用信赖度指标通过预测模型计算出的候选指令值进行的校正,或使用其以外的值进行的校正进行切换。另外,在向预测模型的输入由于干扰等而紊乱的情况下,或者在存在未知的输入的情况下,能够抑制成为设想外的校正量。并且,基于预测值的波动对信赖度指标进行计算,因此能够提高信赖度的精度。
实施方式2.
图4是示意地表示实施方式2所涉及的伺服控制装置的结构的一个例子的框图。下面,对与实施方式1相同的结构要素标注同一标号,省略其说明,关于与实施方式1不同的部分进行说明。实施方式2所涉及的伺服控制装置1A还具有累积部14和模型信息更新部15。
累积部14使来自指令值生成部2的指令值和来自伺服电动机3的实际的动作的状态量对应而存储为累积信息。动作的状态量的一个例子是伺服电动机3的位置或者速度或者在伺服电动机3中流动的电流。在实施方式2中,在累积部14中存储的动作的状态量被称为反馈信息。即,累积信息是使指令值和反馈信息对应后的信息。此外,反馈信息是基于伺服电动机3的动作的实测结果而由校正部12决定的。在一个例子中,将在预测模型的构建中使用的来自伺服电动机3的实际的动作的状态量决定为作为反馈信息而收集的数据。
累积信息包含判断部13中的判断结果成为不许可的情况下的指令值和反馈信息的组合。因此,累积部14在从判断部13向累积部14输出的判断结果成为不许可的定时,对累积信息进行记录。此外,记录的定时是一个例子,定时可以比以判断结果成为不许可的情况为基准而预先设定的时间早,或者也可以晚。在比以判断结果成为不许可的情况为基准而预先确定的时间早的情况下,在一个例子中,只要在以预先确定的时间比发出判断结果的定时早的定时对累积信息进行记录即可。在该情况下,在判断结果为不许可的情况下记录的累积信息保持不变,在判断结果为许可的情况下,记录的累积信息可以保持不变,也可以删除。另外,不仅以记录的时间也成为不许可的时间,也可以从开始定时起以预先设定的时间间隔对累积信息进行记录。
模型信息更新部15使用在累积部14中存储的累积信息对与预测模型有关的模型信息进行更新。模型信息包含将预测状态量和与该预测状态量相对应的信赖度指标进行输出的预测模型的模型参数或者超参数或者预测模型。即,模型信息更新部15将预测模型的模型参数或者超参数作为模型信息,按照累积信息进行更新,或者将预测模型作为模型信息,按照累积信息进行更新。在这里,举出使用机器学习对预测模型的模型参数进行更新的情况而进行说明。
图5是示意地表示实施方式2所涉及的伺服控制装置的模型信息更新部的结构的一个例子的框图。模型信息更新部15具有状态观测部151、学习部152、训练好的模型存储部153和输出部154。
状态观测部151对在累积部14中存储的累积信息进行观测而作为状态变量。此外,在这里,状态观测部151对累积信息进行观测而作为状态变量,但对至少包含累积信息的与伺服电动机3或者伺服控制装置1A相关的状态变量进行观测即可。与伺服电动机3或者伺服控制装置1A相关的状态变量的一个例子是伺服电动机3的位置、速度或者在伺服电动机3中流动的电流等状态量及指令值。
学习部152按照基于状态变量而创建的训练数据集,对预测模型的模型参数进行学习。学习部152所使用的学习算法可以使用任意的学习算法。作为一个例子,对应用了有教师学习算法的1个即高斯过程回归的情况进行说明。在预测模型使用了高斯过程回归的情况下,使用在累积部14中存储的累积信息对在内核函数等中使用的参数进行推定,对预测模型进行更新。例如,创建将从指令值生成部2输出的指令值的时序数据作为输入数据,将伺服电动机3的实际的状态作为输出数据的教师数据,基于这些数据进行学习,对参数进行推定。作为参数的推定方法而使用最优推定等,由此能够构建更可靠的预测模型,但参数的推定方法并不限定于该方法。学习部152在学习收敛的情况下,将学习后的预测模型或者应用于预测模型的学习后的模型参数或者超参数设为训练好的模型信息即学习结果。学习收敛这一判定能够使用公知的判定方法。
训练好的模型存储部153对学习结果进行存储。如上所述,学习结果是学习收敛后的模型即训练好的模型或者更新后的模型参数或者超参数。
输出部154从训练好的模型存储部153取得学习结果,在适当的定时将学习结果应用于预测部121的预测模型。即,输出部154在对预测模型进行了学习的情况下,使更新后的预测模型反映于预测部121的预测模型。另外,输出部154在对预测模型的模型参数或者超参数进行了学习的情况下,使更新后的模型参数或者超参数反映于预测部121的预测模型。如上所述,使用判断部13的判定结果中信赖度不足时的输入输出数据而逐次对预测模型进行更新,由此能够构建可以进行信赖度高的校正的预测模型。即,能够减少候选指令值向伺服电动机3的应用成为不许可的情况。
此外,在图4中,示出了累积部14及模型信息更新部15设置于伺服控制装置1A内的情况,但累积部14及模型信息更新部15也可以是与伺服控制装置1A分体的装置。在一个例子中,累积部14及模型信息更新部15也可以内置于外部的个人计算机等信息处理装置。在该情况下,构成为在外部的信息处理装置上进行累积信息的记录及预测模型的构建等,使该结果反映于伺服控制装置1A内的预测部121。
在实施方式2中,累积部14使来自指令值生成部2的指令值和来自伺服电动机3的反馈信息对应而存储为累积信息。在累积信息中包含有通过判断部13得到的判断结果成为不许可的指令值和反馈信息。模型信息更新部15通过机器学习,使用累积信息对预测模型或者模型参数或者超参数即结果信息进行更新,使更新后的结果信息反映于预测部121。由此,能够使用通过判断部13得到的判定结果中信赖度不足的情况下的输入输出数据而逐次对预测模型进行更新。即,使用信赖度低时的数据,再次对预测模型或者模型参数或者超参数进行更新,由此能够使预测模型的预测精度提高。另外,能够通过机器学习对更可靠的预测模型进行构建。
实施方式3.
图6是示意地表示实施方式3所涉及的伺服控制装置的结构的一个例子的框图。下面,对与实施方式1相同的结构要素标注同一标号,省略其说明,对与实施方式1不同的部分进行说明。在实施方式3所涉及的伺服控制装置1B中,校正部12具有大于或等于2个预测部。在图6的例子中,校正部12具有第1预测部121A和第2预测部121B。此外,校正部12也可以具有大于或等于3个预测部。
第1预测部121A和第2预测部121B所使用的预测模型不同。即,在第1预测部121A和第2预测部121B中,预测模型的构造或者预测方法不同,或者预测模型的构造或者预测方法相同但所使用的模型参数或者超参数不同。因此,通常,在第1预测部121A及第2预测部121B的预测结果中产生差异。
第1预测部121A及第2预测部121B取得从指令值生成部2输出的指令值和从伺服电动机3输出的伺服电动机3的实际的动作的状态量,使用各个预测模型,对预测状态量和与该预测状态量相对应的信赖度指标进行预测。第1预测部121A及第2预测部121B将预测状态量输出至校正选择部122,将信赖度指标输出至判断部13。在这里,为了对第1预测部121A及第2预测部121B各自的输出进行区分,将从第1预测部121A输出的预测状态量及信赖度指标分别称为第1预测状态量及第1信赖度指标,将从第2预测部121B输出的预测状态量及信赖度指标分别称为第2预测状态量及第2信赖度指标。
判断部13取得从第1预测部121A输出的第1信赖度指标及从第2预测部121B输出的第2信赖度指标。判断部13使用所取得的第1信赖度指标及第2信赖度指标和预先所设定的基准值即阈值对信赖度进行判断。在该信赖度的判断中存在下述情况:第1信赖度指标及第2信赖度指标都满足阈值,判断为满足信赖度的第1情况;第1信赖度指标及第2信赖度指标中的仅任一者满足阈值,判断为满足信赖度的第2情况;以及第1信赖度指标及第2信赖度指标都不满足阈值,判断为不满足信赖度的第3情况。
在第1情况下,判断部13将判断结果输出至校正选择部122,该判断结果许可将基于从第1预测部121A及第2预测部121B之中的信赖度更高的预测部输出的预测状态量而校正后的候选指令值输出至伺服放大器11。
在第2情况下,判断部13将判断结果输出至校正选择部122,该判断结果许可将基于从满足信赖度的任一者的预测部输出的预测状态量而校正后的候选指令值输出至伺服放大器11。
在第3情况下,将不许可将第1预测状态量及第2预测状态量都用于校正的判断结果输出至校正选择部122。
校正选择部122关于从第1预测部121A输出的第1预测状态量,以第1预测状态量与指令值一致的方式对校正量进行计算,对指令值进行校正而生成候选指令值。另外,校正选择部122关于从第2预测部121B输出的第2预测状态量,以第2预测状态量与指令值一致的方式对校正量进行计算,对指令值进行校正而生成候选指令值。
而且,校正选择部122基于从判断部13输出的判断结果对是否向伺服放大器11输出候选指令值进行控制。在第1情况下,校正选择部122将基于从第1预测部121A及第2预测部121B之中的信赖度更高的预测部输出的预测状态量而校正后的候选指令值作为校正后指令值而输出至伺服放大器11。第2情况下,校正选择部122将基于从满足信赖度的任一者的预测部输出的预测状态量而校正后的候选指令值作为校正后指令值而输出至伺服放大器11。在第3情况下,校正选择部122将其他值作为校正后指令值而输出。其他值的一个例子是前1个周期的校正后指令值、从指令值生成部2输出的指令值即没有进行校正的指令值,或者预先指定出的值。但是,其他值并不限定于这些值。
即,校正选择部122在基于由多个预测部121A、121B决定出的信赖度指标的判断结果之中的至少1个为许可的情况下,将判断结果成为许可的预测部所涉及的候选指令值之中的信赖度指标最好的候选指令值决定为校正后指令值。另外,校正选择部122在基于由多个预测部121A、121B决定出的信赖度指标的判断结果全部不许可的情况下,将决定候选指令值的时刻的紧之前的校正后指令值、决定候选指令值的时刻的指令值或者预先设定出的值决定为校正后指令值。
在实施方式3中,伺服控制装置1B具有多个预测部121A、121B,各个预测部121A、121B所使用的预测模型不同。由此,从各个预测部121A、121B对不同的预测状态量和信赖度指标进行计算。判断部13基于从多个预测部121A、121B输出的信赖度指标进行向伺服放大器11输出的候选指令值的选择。即,将信赖度指标满足阈值的候选指令值之中的基于从信赖度更高的预测部输出的预测状态量而校正后的候选指令值选择为校正后指令值,在信赖度指标不满足全部阈值的情况下将其他值选择为校正后指令值。如上所述,从多个预测模型中对信赖度指标进行比较,对最可靠的校正量进行选择,由此能够提高校正的精度。另外,针对向控制对象或者多个预测部121A、121B的输入的变化,通过与控制对象或者数据相应地使用更适合的预测模型,从而也能够基于信赖度指标进行更可靠的校正。其结果,能够防止通过不适当的校正使加工精度恶化。
此外,也可以将实施方式2的结构应用于实施方式3的结构。由此,能够使用在通过判断部13得到的判定结果中判定为信赖度不足的情况下的输入输出数据而逐次对多个预测部121A、121B中的预测模型进行更新。即,使用信赖度低时的数据,再次对多个预测部121A、121B中的预测模型或者模型参数或者超参数进行更新,由此能够使预测模型的预测精度提高。
接下来,对实现各实施方式中说明的伺服控制装置1、1A、1B的校正部12、判断部13、累积部14及模型信息更新部15的硬件的结构进行说明。图7是示意地表示实现实施方式1、2、3所涉及的伺服控制装置的硬件结构的一个例子的图。实施方式1、2、3中说明的校正部12、判断部13、累积部14及模型信息更新部15能够通过图7所示的处理电路100实现。
处理电路100具有处理器101、存储器102、输入电路103及输出电路104。处理器101是CPU(也称为Central Processing Unit、中央处理装置、处理装置、运算装置、微处理器、微型计算机、处理器、DSP)、系统LSI(Large Scale Integration)等。存储器102是RAM(Random Access Memory)、ROM(Read Only Memory)、闪存、EPROM(Erasable ProgrammableRead Only Memory)、EEPROM(注册商标)(Electrically Erasable Programmable Read-Only Memory)等非易失性或者易失性的半导体存储器、磁盘、软盘、光盘、压缩盘、迷你盘或者DVD(Digital Versatile Disc)等。
校正部12、判断部13、累积部14及模型信息更新部15是从存储器102读出与各自相对应的程序而由处理器101执行,由此能够实现。输入电路103在从外部对由处理器101处理的信息、存储器102所存储的信息等进行接收时使用,输出电路104在将由处理器101生成的信息、存储器102所存储的信息向外部输出时使用。
此外,伺服放大器11是通过专用的电路而实现的,该专用的电路包含对从外部供给的电压进行变换而生成施加至伺服电动机3的电压的变换电路、对变换电路进行控制的控制电路等。
以上的实施方式所示的结构表示一个例子,也能够与其他公知技术组合,也能够将实施方式彼此组合,在不脱离主旨的范围也能够将结构的一部分省略、变更。
标号的说明
1、1A、1B伺服控制装置,2指令值生成部,3伺服电动机,11伺服放大器,12校正部,13判断部,14累积部,15模型信息更新部,121预测部,121A第1预测部,121B第2预测部,122校正选择部,151状态观测部,152学习部,153训练好的模型存储部,154输出部。
Claims (7)
1.一种伺服控制装置,其基于周期性地输入的对伺服电动机的动作进行指示的指令值,对伺服电动机的动作进行控制,
该伺服控制装置的特征在于,具有:
校正部,其基于所述指令值和所述伺服电动机的动作的实测结果,决定对所述指令值进行校正后的指令值即候选指令值、和对所述候选指令值的信赖度进行评价的指标即信赖度指标,将用于对所述伺服电动机进行控制的校正后的指令值即校正后指令值进行输出;
判断部,其基于所述信赖度指标而判断许可或者不许可所述候选指令值向所述伺服电动机的控制的应用,将判断结果输出至所述校正部;以及
伺服放大器,其基于所述校正后指令值对所述伺服电动机进行控制,
所述校正部基于所述判断结果,将所述候选指令值作为所述校正后指令值而输出至所述伺服放大器。
2.根据权利要求1所述的伺服控制装置,其特征在于,
所述校正部具有:
预测部,其使用对当前或者未来的所述伺服电动机的动作的状态量进行预测的预测模型,将所述指令值和所述伺服电动机的动作的实测结果作为输入,对预测出决定所述候选指令值的时刻以后的时刻的所述伺服电动机的动作的状态量的预测状态量进行预测,对所述预测状态量的信赖度进行评价;以及
校正选择部,其基于所述预测状态量而决定所述候选指令值,
所述预测部将所述预测状态量的信赖度作为所述信赖度指标。
3.根据权利要求2所述的伺服控制装置,其特征在于,
还具有:
累积部,其使所述指令值和所述伺服电动机的动作的实测结果对应而存储为累积信息;以及
模型信息更新部,其在所述判断结果为不许可的情况下,使用所述累积信息,对所述预测模型或者包含所述预测模型的模型参数或者超参数在内的模型信息进行更新,使更新后的所述模型信息反映于所述预测部的所述预测模型。
4.根据权利要求3所述的伺服控制装置,其特征在于,
所述模型信息更新部具有:
状态观测部,其对至少包含所述累积信息的与所述伺服电动机或者所述伺服控制装置相关的状态变量进行观测;
学习部,其按照基于所述状态变量而创建的训练数据集,对所述模型信息进行学习;
训练好的模型存储部,其对通过所述学习部学习到的训练好的所述模型信息进行存储;以及
输出部,其使训练好的所述模型信息反映于所述预测部的所述预测模型。
5.根据权利要求2至4中任一项所述的伺服控制装置,其特征在于,
所述预测部基于使用所述预测模型而预测出的所述伺服电动机的状态量的波动,决定所述信赖度指标,
所述判断部对从所述预测模型输出的所述信赖度指标和预先确定的基准值进行比较,基于比较的结果,决定所述判断结果。
6.根据权利要求2至5中任一项所述的伺服控制装置,其特征在于,
所述校正选择部在所述判断结果为许可的情况下,将所述候选指令值作为所述校正后指令值进行输出,在所述判断结果为不许可的情况下,将决定所述候选指令值的时刻的紧之前的所述校正后指令值、决定所述候选指令值的时刻的所述指令值或者预先指定出的值作为所述校正后指令值进行输出。
7.根据权利要求2至5中任一项所述的伺服控制装置,其特征在于,
所述校正部具有多个所述预测部,
所述校正选择部在基于由多个所述预测部决定出的所述信赖度指标的所述判断结果之中的至少1个为许可的情况下,将所述判断结果成为许可的所述预测部所涉及的所述候选指令值之中的所述信赖度指标最好的所述候选指令值决定为所述校正后指令值,在基于由多个所述预测部决定出的所述信赖度指标的所述判断结果全部不许可的情况下,将决定所述候选指令值的时刻的紧之前的所述校正后指令值、决定所述候选指令值的时刻的所述指令值或者预先设定出的值决定为所述校正后指令值。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/022343 WO2021245916A1 (ja) | 2020-06-05 | 2020-06-05 | サーボ制御装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115917445A true CN115917445A (zh) | 2023-04-04 |
Family
ID=78830759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080101273.9A Pending CN115917445A (zh) | 2020-06-05 | 2020-06-05 | 伺服控制装置 |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP7275389B2 (zh) |
CN (1) | CN115917445A (zh) |
DE (1) | DE112020007299T5 (zh) |
WO (1) | WO2021245916A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6392825B2 (ja) * | 2016-11-01 | 2018-09-19 | ファナック株式会社 | 学習制御機能を備えたロボット制御装置 |
JP6536978B1 (ja) | 2018-03-15 | 2019-07-03 | オムロン株式会社 | 学習装置、学習方法、及びそのプログラム |
JP6888577B2 (ja) | 2018-03-30 | 2021-06-16 | オムロン株式会社 | 制御装置、制御方法、及び制御プログラム |
JP7151546B2 (ja) | 2019-02-25 | 2022-10-12 | オムロン株式会社 | 制御装置、制御方法、及び制御プログラム |
-
2020
- 2020-06-05 DE DE112020007299.1T patent/DE112020007299T5/de active Pending
- 2020-06-05 CN CN202080101273.9A patent/CN115917445A/zh active Pending
- 2020-06-05 WO PCT/JP2020/022343 patent/WO2021245916A1/ja active Application Filing
- 2020-06-05 JP JP2022528376A patent/JP7275389B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2021245916A1 (ja) | 2021-12-09 |
JP7275389B2 (ja) | 2023-05-17 |
DE112020007299T5 (de) | 2023-04-20 |
JPWO2021245916A1 (zh) | 2021-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190265657A1 (en) | Machine learning method and machine learning device for learning fault conditions, and fault prediction device and fault prediction system including the machine learning device | |
JP6232258B2 (ja) | 予測装置、予測方法、及びプログラム | |
Jafferjee et al. | Hallucinating value: A pitfall of dyna-style planning with imperfect environment models | |
CN113748597B (zh) | 电动机控制装置 | |
CN110471276A (zh) | 用于为物理系统创建模型函数的装置 | |
US20190317472A1 (en) | Controller and control method | |
Zhou et al. | An inversion-based learning approach for improving impromptu trajectory tracking of robots with non-minimum phase dynamics | |
CN110023857B (zh) | 伺服控制装置 | |
CN111949013A (zh) | 控制载具的方法和用于控制载具的装置 | |
Diederichs | Reinforcement learning-a technical introduction | |
CN115917445A (zh) | 伺服控制装置 | |
CN116635802A (zh) | 数控装置 | |
US11651282B2 (en) | Learning method for learning action of agent using model-based reinforcement learning | |
CN112526962A (zh) | 用于工艺技术设施的诊断方法和诊断系统以及训练方法 | |
JP7505695B2 (ja) | モータ制御装置 | |
JP6848710B2 (ja) | プラント制御調整装置及び方法 | |
Maiworm et al. | Online Gaussian process learning-based model predictive control with stability guarantees | |
JP2023139729A (ja) | サーボ制御装置、サーボシステムおよびサーボ制御方法 | |
KR20230077280A (ko) | 시계열 데이터 회귀 예측을 위한 예측 모델의 학습 방법 및 예측 모델을 이용한 예측 방법 | |
Hartwich et al. | Adaptive control vector parameterization for nonlinear model‐predictive control | |
JP6962031B2 (ja) | 操業実績データ調査ツール | |
JP7327623B1 (ja) | 予測装置、予測方法及びプログラム | |
WO1996019758A1 (en) | Polynomial controller for nonlinear systems and method of use thereof | |
JP7421391B2 (ja) | 学習方法、および、プログラム | |
CN115085614B (zh) | 一种基于高斯过程的永磁同步电机模型预测控制系统、控制方法及永磁同步电机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |