CN114815878B - 基于实时优化和深度学习的高超声速飞行器协同制导方法 - Google Patents
基于实时优化和深度学习的高超声速飞行器协同制导方法 Download PDFInfo
- Publication number
- CN114815878B CN114815878B CN202210320924.4A CN202210320924A CN114815878B CN 114815878 B CN114815878 B CN 114815878B CN 202210320924 A CN202210320924 A CN 202210320924A CN 114815878 B CN114815878 B CN 114815878B
- Authority
- CN
- China
- Prior art keywords
- aircraft
- time
- guidance
- minimum
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000005457 optimization Methods 0.000 title claims abstract description 54
- 238000013135 deep learning Methods 0.000 title claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims abstract description 30
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000001133 acceleration Effects 0.000 claims description 11
- 238000012549 training Methods 0.000 claims description 9
- 206010048669 Terminal state Diseases 0.000 claims description 8
- 230000000007 visual effect Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 238000011217 control strategy Methods 0.000 claims description 3
- 238000011438 discrete method Methods 0.000 claims description 3
- 230000002040 relaxant effect Effects 0.000 claims description 3
- 230000002195 synergetic effect Effects 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 230000002265 prevention Effects 0.000 abstract description 5
- 101100017000 Halocynthia roretzi HGV2 gene Proteins 0.000 description 3
- 238000009795 derivation Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/107—Simultaneous control of position or course in three dimensions specially adapted for missiles
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法,属于飞行器制导技术领域。本发明实现方法为:根据高超声速飞行器飞行力学特征和协同攻击任务特点建立最优制导问题;选取合适的控制变量构造控制仿射系统,进而线性化该系统得到线性系统动力学;采用松弛技术将非凸控制约束转化为二阶锥约束;设计序列二阶锥优化算法得到原始最优制导问题的解。此外通过求解时间自由的最优制导问题获得样本集,设计和训练用于确定最小命中时间的神经网络,从而计算最优协同攻击时间。本发明公开的协同制导方法能够实现在考虑非线性系统动力学、空气动力和复杂任务约束条件情况下的最优协同制导,有效提升高超声速飞行器的突防能力和毁伤效果。
Description
技术领域
本发明属于飞行器制导技术领域,涉及高超声速飞行器协同制导方法,尤其涉及一种基于实时优化和深度学习的高超声速飞行器协同制导方法。
背景技术
近年来,世界军事科技发展的战略目标是提升远程快速精确打击能力。高超声速飞行器作为有效实施快速全球打击的理想武器装备,受到了全球的广泛关注。高超声速飞行器具有有效射程远、飞行速度快、命中精度高、弹道难以预测的优点。然而随着先进反导系统的快速发展,单一高超声速飞行器的作战效果被严重削弱。为了进一步提升高超声速飞行器的突防能力和毁伤效果,针对性地研究高超声速飞行器协同制导方法具有现实意义。
最优协同制导的目标是协调多个飞行器同时命中预定目标。为了实现这一目的,在过去的数十年间,许多基于解析推导或数值优化的协同制导方法被研究和开发出来。然而不同于常规导弹,高超声速飞行器具有强非线性的系统动力学和复杂的任务约束条件,因此现有方法(基于简化系统动力学和理想假设条件推导的解析协同制导律等方法)难以充分发挥高超声速飞行器的最优攻击性能。
发明内容
本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法要解决的技术问题是:实现高超声速飞行器在考虑非线性系统动力学、空气动力和复杂任务约束条件情况下的最优协同制导。本方法能够有效提升高超声速飞行器的突防能力和毁伤效果。
本发明的目的是通过下述技术方案实现的。
本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法描述如下:首先根据高超声速飞行器的飞行力学特征和协同攻击的任务特点,建立最优制导问题;然后通过选取合适的控制变量构造控制仿射系统,进而部分线性化该系统得到线性系统动力学;注意到该处理引入了非凸的控制约束,采用松弛技术将该非凸约束转化为二阶锥约束;最后设计迭代算法序列求解推导得到的二阶锥优化问题获得原始最优制导问题的解。此外本发明给出了基于深度学习确定最优协同攻击时间的方法,即通过求解时间自由的最优制导问题获得样本集,设计和训练用于确定最小命中时间的神经网络,从而计算最优协同攻击时间。综合上述内容,本发明给出了实现高超声速飞行器协同攻击的协同制导方法。
本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法包括如下步骤:
步骤一:根据高超声速飞行器飞行力学特征和协同攻击任务特点,建立最优制导问题P0。
步骤一的实现方法为:
高超声速飞行器的系统动力学定义在如图1所示的参考坐标系中,具体表示为
式中,下标i表示第i个高超声速飞行器,xi,yi和zi为飞行器位置坐标,vi为飞行速度,γi和ψi为航迹角和航向角,g为重力加速度,σi为倾侧角,Li和Di为升力加速度和阻力加速度,定义如下:
式中,ρi为随高度变化的大气密度,Si为参考面积,mi为飞行器质量。CL,i和CD,i为升力系数和阻力系数,它们的取值由攻角αi和马赫数Mai确定。
下面给出实现协同攻击任务所必要的约束条件:
(1)初始状态约束:各飞行器的初始状态约束可以表示如下:
式中,t0,i为协同攻击的初始时刻,x0,i,y0,i,z0,i,v0,i,γ0,i和ψ0,i分别为各飞行器的初始飞行状态。
(2)终端状态约束:各飞行器的终端状态约束可以表示如下:
式中,tf,i为命中时间,xf,i,yf,i和zf,i为目标点位置坐标,γf,i和ψf,i为命中角度。
(3)控制约束:受限于飞行器的控制能力,各控制变量应满足如下约束条件:
αmin≤αi(t)≤αmax (6)
σmin≤σi(t)≤σmax (7)
式中,下标“max”和“min”表示各控制变量的最大和最小许用边界。
(4)时间协同约束:为了实现协同攻击,各飞行器的命中时间约束如下:
tf,1=tf,2=…=tf,n=tf (8)
式中,tf是协同攻击时间。
最优制导问题的优化目标是提升命中速度,即
Ji=-vi(tf,i) (9)
综上所述,建立最优制导问题P0:
P0:minimum (9)
subject to (1),(4)-(8)
需要指出的是,最优制导问题将以分布式体系求解,即每个参与协同攻击的飞行器以协同攻击时间(计算方法参考步骤七)作为命中时间独立求解问题P0,如此时间协同约束将自动满足。为了简化书写,下文省略下标“i”。
步骤二:选取合适的控制变量构造控制仿射系统,进而部分线性化该系统得到线性系统动力学,建立非凸最优制导问题P1。
步骤二的实现方法为:
根据式(2),升力系数可以表示为
注意到高超声速飞行器的阻力系数和升力系数存在如下关系:
式中,c0是零升阻力系数,c1是诱导阻力系数。
于是阻力加速度可以表示为
根据式(12),式(1)表示的系统动力学可以改写为
式中,
为了构造控制仿射系统,定义3个新的控制变量如下:
u1=Lcosσ,u2=Lsinσ,u3=L2 (14)
设x=[x,y,z,v,γ,ψ]T为状态向量,u=[u1,u2,u3]T为控制向量,则式(13)表示的系统动力学可以改写为如下控制仿射系统:
式中,
上述控制仿射系统可以部分线性化为
式中,
B(x(k))=f(x(k))-A(x(k))x(k)
为了保证上述线性化过程的有效性,引入信赖域约束:
|x-x(k)|≤δ (17)
需要指出的是,新的控制变量应当满足如下关系:
考虑到高超声速飞行器在末制导段通常采用BTT180控制策略,式(6)和式(7)表示的控制约束可以写为
根据以上讨论,建立非凸最优制导问题P1:
P1:minimum (9)
subject to (4),(5),(16)-(19)
步骤三:凸化非凸控制约束,建立凸最优制导问题P2。
步骤三的实现方法为:
如图2所示,式(18)表示的控制约束的可行域是一个曲面,该约束是一个非凸约束,因此将其松弛为
式(20)的可行域如图3所示,该可行域是原始非凸可行域的凸包。需要指出的是,松弛处理扩展了原始优化问题的可行域,当且仅当约束(20)活跃时,约束(20)和约束(18)才是等价的。
式(18)表示的非凸控制约束松弛后,建立凸最优制导问题P2:
P2:minimum (9)
subject to (4),(5),(16),(17),(19),(20)
步骤四:将步骤三建立的凸最优制导问题P2以时间为自由变量均匀离散,建立二阶锥优化问题P3。
步骤四的实现方法为:
以时间t为自由变量,将[t0,tf]均分成N个子区间,进而产生N+1个离散点,离散步长为Δt=(tf-t0)/N,各离散点的状态变量和控制变量分别表示为xi=x(ti)和ui=u(ti)。
采用梯形离散法将式(16)表示的系统动力学转化为线性等式约束如下:
式中,
同时优化目标和约束条件表示为
J=-v(tN) (22)
[u1(ti)]2+[u2(ti)]2≤u3(ti) (25)
|x(ti)-x(k)(ti)|≤δ (27)经过离散化过程,建立二阶锥优化问题P3:
P3:minimum (22)
subject to (21),(23)-(27)
步骤五:设计迭代算法序列求解步骤四得到的二阶锥优化问题P3,从而获得原始最优制导问题P0的解。
步骤五的实现方法为:
步骤5.1:设置k=0,给定初始状态剖面x(0)和命中时间tf。
步骤5.2:在第k+1次迭代,求解二阶锥优化问题P3得到解{x(k+1),u(k+1)}。
步骤5.3:检查收敛条件:
max|x(k+1)-x(k)|≤∈ (28)
式中,∈是给定的足够小的常数。如果式(28)满足,执行步骤5.4,否则令k=k+1,更新状态剖面x(k),执行步骤5.2。
步骤5.4:迭代算法终止,原始最优制导问题P0的解为{x(k+1),u(k+1)}。
步骤六:以飞行高度为自由变量,将步骤一建立的最优制导问题P0重构为时间自由的最优制导问题P4,然后按照步骤二、步骤三和步骤四的思路转化为二阶锥优化问题,并按照步骤五的思路设计迭代算法,进而计算飞行器的最小命中时间。
步骤六的实现方法为:
对于高超声速飞行器来说,较大的命中时间会严重消耗飞行器的能量,而较小的命中时间则导致任务不可行,因此本步骤旨在寻找能够保证任务可行的最小命中时间。考虑到最小命中时间情况下飞行器的飞行高度是单调下降的,选择飞行高度z作为自由变量,则相应的系统动力学改写为
约束条件改写为
αmin≤α(z)≤αmax (32)
σmin≤σ(z)≤σmax (33)
优化目标设置为最小命中时间,即
综上所述,建立时间自由的最优制导问题P4:
P4:minimum (34)
subject to (29)-(33)
按照步骤二、步骤三和步骤四的思路将该问题转化为一个新的二阶锥优化问题,并按照步骤五的思路设计迭代算法序列求解。该过程的技术细节可以参考步骤二到步骤五,这里不再赘述。
根据求解时间自由的最优制导问题P4得到的结果,可以计算最小命中时间:
步骤七:采用步骤六的方法获取训练样本集,设计和训练用于确定最小命中时间的神经网络,进而给出协同攻击时间。
步骤七的实现方法为:
尽管通过步骤六所述的数值计算方法可以有效计算最小命中时间,但是需要很高的计算成本。因此本步骤通过设计和训练用于确定最小命中时间的神经网络,以降低计算成本,提升计算效率。考虑到飞行器和目标复杂的相对关系,本步骤不直接使用飞行器的初始状态和终端状态作为输入,而是选择如图4所示的飞行高度z,飞行器与目标的水平距离d、飞行速度v、航迹角γ、终端航迹角γf、视角ε和终端视角εf等7个特征参数作为输入。选择最小命中时间tf作为输出。输入和输出之间的映射关系通过多层神经网络实现。
设计好神经网络后,只需采用步骤六所述的数值计算方法获取足够的输入输出对组成样本集,进而使用深度学习算法训练神经网络。训练好的神经网络将根据任务条件直接确定最小命中时间,而不依赖复杂的数值计算方法。
使用神经网络确定好每个参与协同攻击的飞行器的最小命中时间,进而根据下式给出协同攻击时间:
tf=max(tf,1,tf,2,…,tf,n) (36)
式中,tf,i是第i个飞行器的最小命中时间。
步骤八:综合上述所有步骤,应用本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法。
步骤八的实现方法为:
如图5所示为本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法,该方法可分为离线和在线两个部分。
离线部分:首先采用步骤六所述的方法离线获取样本集;然后采用步骤七所述的方法设计和训练用于确定最小命中时间的神经网络。
在线部分:每个制导周期内,首先使用离线训练好的神经网络确定每个参与协同攻击的飞行器的最小命中时间;然后根据式(36)确定协同攻击时间;接下来每个飞行器以协同攻击时间作为命中时间,采用步骤五所述的方法求解最优制导问题;最后根据优化结果更新制导指令,直至命中目标。
有益效果
1.本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法,将考虑非线性系统动力学、空气动力和复杂任务约束条件的多约束非线性最优协同制导问题转化为二阶锥优化问题,进而设计迭代算法序列求解。该方法能够获得满足复杂任务约束条件且终端速度最优的飞行轨迹和相应的制导指令。相比于传统的非线性优化方法,该方法具有可靠性强、计算效率高的优点,具备在机载计算机上实时计算的能力。
2.本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法,通过求解时间自由的最优制导问题获得样本集,设计和训练用于确定最小命中时间的神经网络,进而给出协同攻击时间。该方法具有良好的实时性和最优性。一方面,神经网络给出最小命中时间仅需要少量的基础运算,因此可以实时计算;另一方面,得到的协同攻击时间可以认为是最优的,因为更小的时间将导致协同攻击任务不可行,而更大的时间会降低飞行器的命中速度。
3.本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法,相比于基于简化系统动力学和理想假设条件推导的解析协同制导律等方法,能够有效提高命中动能,降低控制能量,进而有效提升高超声速飞行器的突防能力和毁伤效果。
附图说明
图1是本发明步骤一定义系统动力学的参考坐标系的示意图;
图2是本发明步骤三原始非凸约束所代表的可行域的示意图;
图3是本发明步骤三松弛约束所代表的可行域的示意图;
图4是本发明步骤七神经网络输入参数的示意图;
图5是本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法流程图;
图6是本发明实例中飞行轨迹图;
图7是本发明实例中航迹角和航向角变化图;
图8是本发明实例中攻角和倾侧角变化图;
图9是本发明实例中速度变化图;
图10是本发明实例中法向加速度变化图。
具体实施方式
为了更好地说明本发明的目的和优点,下面结合附图和实例对发明内容做进一步说明。
选择两个高超声速飞行器协同攻击位于参考坐标系原点的固定目标的任务实例验证本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法。
详细步骤如下:
步骤一:根据高超声速飞行器飞行力学特征和协同攻击任务特点,建立最优制导问题P0。
高超声速飞行器的系统动力学表示为
式中,下标i=1,2分别表示代号为HGV1和HGV2的两个高超声速飞行器,xi,yi和zi为飞行器位置坐标,vi为飞行速度,γi和ψi为航迹角和航向角,g=9.81m/s2为重力加速度,σi为倾侧角,Li和Di为升力加速度和阻力加速度,定义如下:
式中,ρi为随高度变化的大气密度,Si=0.4026m2为参考面积,mi=750kg为飞行器质量。CL,i和CD,i为升力系数和阻力系数,它们的取值由攻角αi和马赫数Mai确定。
给出实现协同攻击任务所必要的约束条件:
(1)初始状态约束:飞行器的初始状态约束可以表示如下:
式中,t0,i为协同攻击的初始时刻,x0,i,y0,i,z0,i,v0,i,γ0,i和ψ0,i分别为各飞行器的初始飞行状态。
(2)终端状态约束:飞行器的终端状态约束可以表示如下:
式中,tf,i为命中时间,xf,i,yf,i和zf,i为目标点位置坐标,γf,i和ψf,i为命中角度。
(3)控制约束:受限于飞行器的控制能力,各控制变量应满足如下约束条件:
αmin≤αi(t)≤αmax (42)
σmin≤σi(t)≤σmax (43)
式中,αmin=0deg,αmax=20deg,σmin=-180deg,σmax=180deg。
(4)时间协同约束:为了实现协同攻击,各飞行器的命中时间约束如下:
tf,1=tf,2=tf (44)
式中,tf是协同攻击时间。
最优制导问题的优化目标是提升命中速度,即
J=-vi(tf) (45)
综上所述,建立最优制导问题P0:
P0:minimum (45)
subject to (37),(40)-(44)
需要指出的是,最优制导问题将以分布式体系求解,即每个参与协同攻击的飞行器以协同攻击时间(计算方法参考步骤七)作为命中时间独立求解问题P0,如此时间协同约束将自动满足。为了简化书写,下文省略下标“i”。
步骤二:选取合适的控制变量构造控制仿射系统,进而部分线性化该系统得到线性系统动力学,建立非凸最优制导问题P1。
根据式(38),升力系数可以表示为
注意到高超声速飞行器的阻力系数和升力系数存在如下关系:
式中,c0是零升阻力系数,c1是诱导阻力系数。
于是阻力加速度可以表示为
根据式(48),式(37)表示的系统动力学可以改写为
式中,
为了构造控制仿射系统,定义新的控制变量如下:
u1=Lcosσ,u2=Lsinσ,u3=L2 (50)
设x=[x,y,z,v,γ,ψ]T为状态向量,u=[u1,u2,u3]T为控制向量,则式(49)表示的系统动力学可以改写为如下控制仿射系统:
式中,
上述控制仿射系统可以部分线性化为
式中,
B(x(k))=f(x(k))-A(x(k))x(k)
为了保证上述线性化过程的有效性,引入信赖域约束:
|x-x(k)|≤δ (53)
式中,δ=[5000,5000,5000,300,30π/180,30π/180]T
新的控制变量应当满足如下关系:
考虑到高超声速飞行器在末制导段通常采用BTT180控制策略,式(42)和式(43)表示的控制约束可以写为
根据以上讨论,建立非凸最优制导问题P1:
P1:minimum (45)
subject to (40),(41),(52)-(55)
步骤三:凸化非凸控制约束,建立凸最优制导问题P2。
式(54)表示的控制约束的可行域是一个曲面,该约束是一个非凸约束,因此将其松弛为
式(56)的可行域是原始非凸可行域的凸包。需要指出的是,松弛处理扩展了原始优化问题的可行域,当且仅当约束(56)活跃时,约束(56)和约束(54)才是等价的。
式(54)表示的非凸控制约束松弛后,建立凸最优制导问题P2:
P2:minimum (46)
subject to (41),(42),(53),(54),(56),(57)
步骤四:将步骤三建立的凸最优制导问题P2以时间为自由变量均匀离散,建立二阶锥优化问题P3。
以时间t为自由变量,将[t0,tf]均分成N=100个子区间,进而产生N+1个离散点,离散步长为Δt=(tf-t0)/N,各离散点的状态变量和控制变量分别表示为xi=x(ti)和ui=u(ti)。
采用梯形离散法将式(52)表示的系统动力学转化为线性等式约束如下:
式中,
同时优化目标和约束条件表示为
J=-v(tN) (58)
[u1(ti)]2+[u2(ti)]2≤u3(ti) (61)
|x(ti)-x(k)(ti)|≤δ (63)
经过离散化过程,建立二阶锥优化问题P3:
P3:minimum (58)
subject to (57),(59)-(63)
步骤五:设计迭代算法序列求解步骤四得到的二阶锥优化问题P3,从而获得原始最优制导问题P0的解。
步骤5.1:设置k=0,给定初始状态剖面x(0)和命中时间tf。
步骤5.2:在第k+1次迭代,求解二阶锥优化问题P3得到解{x(k+1),u(k+1)}。
步骤5.3:检查收敛条件:
max|x(k+1)-x(k)|≤∈ (64)
式中,∈=[10,10,10,1,0.1π/180,0.1π/180]T。如果式(64)满足,执行步骤5.4,否则令k=k+1,更新状态剖面x(k),执行步骤5.2。
步骤5.4:迭代算法终止,原始最优制导问题P0的解为{x(k+1),u(k+1)}。
步骤六:以飞行高度为自由变量,将步骤一建立的最优制导问题P0重构为时间自由的最优制导问题P4,然后按照步骤二、步骤三和步骤四的思路转化为二阶锥优化问题,并按照步骤五的思路设计迭代算法,进而计算飞行器的最小命中时间。
选择飞行高度z作为自由变量,则相应的系统动力学改写为
约束条件改写为
αmin≤α(z)≤αmax (68)
σmin≤σ(z)≤σmax (69)
优化目标设置为最小命中时间,即
综上所述,建立时间自由的最优制导问题P4:
P4:minimum (70)
subject to (65)-(69)
按照步骤二、步骤三和步骤四的思路将该问题转化为一个新的二阶锥优化问题,并按照步骤五的思路设计迭代算法序列求解。
根据求解时间自由的最优制导问题P4得到的结果,可以计算最小命中时间:
步骤七:采用步骤六的方法获取训练样本集,设计和训练用于确定最小命中时间的神经网络,进而给出协同攻击时间。
选择飞行高度z,飞行器与目标的水平距离d、飞行速度v、航迹角γ、终端航迹角γf、视角ε和终端视角εf等7个特征参数作为输入,选择最小命中时间tf作为输出。随机选取2000组具有不同任务条件(选取范围如表1所示)的时间自由的最优制导问题P4,并采用迭代算法序列求解,每个解的前100个离散点上的输入输出对组成样本集,即样本集包含200000组输入输出对。
表1任务条件选取范围
使用Matlab Neural Network Toolbox设计和训练用于确定最小命中时间的深度神经网络,该神经网络包含1个输入层、2个隐层和1个输出层,其中隐层函数设置为“tansig”,隐层节点数分别设置为“32”和“20”。采用Levenberg-Marquardt MinimizationAlgorithm训练该神经网络。经历327次迭代后,交叉验证指标为5.85e-9,训练过程收敛,神经网络能够根据任务条件以极高的精度确定飞行器的最小命中时间。
使用训练好的神经网络分别确定好HGV1和HGV2的最小命中时间,进而根据下式给出协同攻击时间:
tf=max(tf,1,tf,2) (72)
步骤八:综合上述所有步骤,应用本发明所公开的基于实时优化和深度学习的高超声速飞行器协同制导方法。
给定协同攻击任务案例的飞行器初始状态和期望命中角度如表2所示。
表2飞行器初始状态和期望命中角度
设置制导周期为T=1s。在第一个制导周期,神经网络给出的HGV1和HGV2的最小命中时间分别为27.49s和29.79s,选择其中最大的命中时间作为协同攻击时间,即tf=29.79s,然后各飞行器将协同攻击时间作为命中时间,分别采用步骤五所述的方法求解最优制导问题,根据优化结果产生制导指令。之后的每个制导周期按相同的步骤更新制导指令,直至飞行器命中目标时终止。
数值仿真结果如图6-8所示。图6给出了飞行轨迹,可以看出各飞行器均能精确命中目标。图7给出了航迹角和航向角曲线,各飞行器能够按照预定的命中角度同时命中目标。图8给出了攻角和倾侧角曲线,各飞行器的控制量全程严格满足约束条件。
为了进一步说明本发明公开的协同制导方法(OCG)的优点,选择经典的协同比例导引制导律(CPNG)作为对比,该制导律具有如下形式:
式中,r为弹目相对距离,λv和λh分别为铅锤面和水平面内的弹目视线角,tgo是预测飞行时间,是协同攻击时间。
对比结果如图9-10所示。图9给出了2种方法得到的飞行速度曲线,可以看出本方法能够导引飞行器以更短的时间(29.80s vs 31.35s)完成协同攻击任务,并且命中动能有显著提升,对于HGV1提升了9.90%,对于HGV2提升了11.30%。图10给出了2种方法得到的法向加速度曲线,相比于协同比例导引制导律,本发明的方法能够有效节约控制能量,对于HGV1节约了17.79%,对于HGV2节约了5.75%。综上所述,本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法能够有效提高命中动能,降低控制能量,进而有效提升高超声速飞行器的突防能力和毁伤效果。
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (1)
1.基于实时优化和深度学习的高超声速飞行器协同制导方法,其特征在于,包括如下步骤,
步骤一:根据高超声速飞行器飞行力学特征和协同攻击任务特点,建立最优制导问题P0;
步骤一的实现方法为:
高超声速飞行器的系统动力学表示为
式中,下标i表示第i个高超声速飞行器,xi,yi和zi为飞行器位置坐标,vi为飞行速度,γi和ψi为航迹角和航向角,g为重力加速度,σi为倾侧角,Li和Di为升力加速度和阻力加速度,定义如下:
式中,ρi为随高度变化的大气密度,Si为参考面积,mi为飞行器质量;CL,i和CD,i为升力系数和阻力系数,它们的取值由攻角αi和马赫数Mai确定;
下面给出实现协同攻击任务所必要的约束条件:
(1)初始状态约束:各飞行器的初始状态约束可以表示如下:
式中,t0,i为协同攻击的初始时刻,x0,i,y0,i,z0,i,v0,i,γ0,i和ψ0,i分别为各飞行器的初始飞行状态;
(2)终端状态约束:各飞行器的终端状态约束可以表示如下:
式中,tf,i为命中时间,xf,i,yf,i和zf,i为目标点位置坐标,γf,i和ψf,i为命中角度;
(3)控制约束:受限于飞行器的控制能力,各控制变量应满足如下约束条件:
αmin≤αi(t)≤αmax (6)
σmin≤σi(t)≤σmax (7)
式中,下标“max”和“min”表示各控制变量的最大和最小许用边界;
(4)时间协同约束:为了实现协同攻击,各飞行器的命中时间约束如下:
tf,1=tf,2=…=tf,n=tf (8)
式中,tf是协同攻击时间;
最优制导问题的优化目标是提升命中速度,即
Ji=-vi(tf,i) (9)
综上所述,建立最优制导问题P0:
P0:minimum (9)
subject to(1),(4)-(8)
需要指出的是,最优制导问题将以分布式体系求解,即每个参与协同攻击的飞行器以协同攻击时间(计算方法参考步骤七)作为命中时间独立求解问题P0,如此时间协同约束将自动满足;为了简化书写,下文省略下标“i”;
步骤二:选取合适的控制变量构造控制仿射系统,进而部分线性化该系统得到线性系统动力学,建立非凸最优制导问题P1;
步骤二的实现方法为:
根据式(2),升力系数可以表示为
注意到高超声速飞行器的阻力系数和升力系数存在如下关系:
式中,c0是零升阻力系数,c1是诱导阻力系数;
于是阻力加速度可以表示为
根据式(12),式(1)表示的系统动力学可以改写为
式中,
为了构造控制仿射系统,定义3个新的控制变量如下:
u1=Lcosσ,u2=Lsinσ,u3=L2 (14)
设x=[x,y,z,v,γ,ψ]T为状态向量,u=[u1,u2,u3]T为控制向量,则式(13)表示的系统动力学可以改写为如下控制仿射系统:
式中,
上述控制仿射系统可以部分线性化为
式中,
B(x(k))=f(x(k))-A(x(k))x(k)
为了保证上述线性化过程的有效性,引入信赖域约束:
|x-x(k)|≤δ (17)
需要指出的是,新的控制变量应当满足如下关系:
考虑到高超声速飞行器在末制导段通常采用BTT180控制策略,式(6)和式(7)表示的控制约束可以写为
根据以上讨论,建立非凸最优制导问题P1:
P1:minimum (9)
subject to(4),(5),(16)-(19)
步骤三:凸化非凸控制约束,建立凸最优制导问题P2;
步骤三的实现方法为:
式(18)表示的控制约束的可行域是一个曲面,该约束是一个非凸约束,因此将其松弛为
式(20)的可行域是原始非凸可行域的凸包;需要指出的是,松弛处理扩展了原始优化问题的可行域,当且仅当约束(20)活跃时,约束(20)和约束(18)才是等价的;
式(18)表示的非凸控制约束松弛后,建立凸最优制导问题P2:
P2:minimum (9)
subject to(4),(5),(16),(17),(19),(20)
步骤四:将步骤三建立的凸最优制导问题P2以时间为自由变量均匀离散,建立二阶锥优化问题P3;
步骤四的实现方法为:
以时间t为自由变量,将[t0,tf]均分成N个子区间,进而产生N+1个离散点,离散步长为Δt=(tf-t0)/N,各离散点的状态变量和控制变量分别表示为xi=x(ti)和ui=u(ti);
采用梯形离散法将式(16)表示的系统动力学转化为线性等式约束如下:
式中,
同时优化目标和约束条件表示为
J=-v(tN) (22)
[u1(ti)]2+[u2(ti)]2≤u3(ti) (25)
|x(ti)-x(k)(ti)|≤δ (27)
经过离散化过程,建立二阶锥优化问题P3:
P3:minimum (22)
subject to(21),(23)-(27)
步骤五:设计迭代算法序列求解步骤四得到的二阶锥优化问题P3,从而获得原始最优制导问题P0的解;
步骤五的实现方法为:
步骤5.1:设置k=0,给定初始状态剖面x(0)和命中时间tf;
步骤5.2:在第k+1次迭代,求解二阶锥优化问题P3得到解{x(k+1),u(k+1)};
步骤5.3:检查收敛条件:
max|x(k+1)-x(k)|≤∈ (28)式中,∈是给定的足够小的常数;如果式(28)满足,执行步骤5.4,否则令k=k+1,更新状态剖面x(k),执行步骤5.2;
步骤5.4:迭代算法终止,原始最优制导问题P0的解为{x(k+1),u(k+1)};
步骤六:以飞行高度为自由变量,将步骤一建立的最优制导问题P0重构为时间自由的最优制导问题P4,然后按照步骤二、步骤三和步骤四的思路转化为二阶锥优化问题,并按照步骤五的思路设计迭代算法,进而计算飞行器的最小命中时间;
步骤六的实现方法为:
考虑到最小命中时间情况下高超声速飞行器的飞行高度是单调下降的,选择飞行高度z作为自由变量,则相应的系统动力学改写为
约束条件改写为
αmin≤α(z)≤αmax (32)
σmin≤σ(z)≤σmax (33)
优化目标设置为最小命中时间,即
综上所述,建立时间自由的最优制导问题P4:
P4:minimum (34)
subject to(29)-(33)
按照步骤二、步骤三和步骤四的思路将该问题转化为一个新的二阶锥优化问题,并按照步骤五的思路设计迭代算法序列求解;该过程的技术细节可以参考步骤二到步骤五,这里不再赘述;
根据求解时间自由的最优制导问题P4得到的结果,可以计算最小命中时间:
步骤七:采用步骤六的方法获取训练样本集,设计和训练用于确定最小命中时间的神经网络,进而给出协同攻击时间;
步骤七的实现方法为:
尽管通过步骤六所述的数值计算方法可以有效计算最小命中时间,但是需要很高的计算成本,因此本步骤通过设计和训练用于确定最小命中时间的神经网络,以降低计算成本,提升计算效率;考虑到飞行器和目标复杂的相对关系,本步骤不直接使用飞行器的当前飞行状态和终端状态作为输入,而是选择飞行高度z,飞行器与目标的水平距离d、飞行速度v、航迹角γ、终端航迹角γf、视角ε和终端视角εf等7个特征参数作为输入;选择最小命中时间tf作为输出;输入和输出之间的映射关系通过多层神经网络实现;
设计好神经网络后,只需采用步骤六所述的数值计算方法获取足够的输入输出对组成样本集,进而使用深度学习算法训练神经网络;训练好的神经网络将根据任务条件直接确定最小命中时间,而不依赖复杂的数值计算方法;
使用神经网络确定好每个参与协同攻击的飞行器的最小命中时间,进而根据下式给出协同攻击时间:
tf=max(tf,1,tf,2,...,tf,n) (36)
式中,tf,i是第i个飞行器的最小命中时间;
步骤八:综合上述所有步骤,应用本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法;
步骤八的实现方法为:
本发明公开的基于实时优化和深度学习的高超声速飞行器协同制导方法可细分为离线和在线两个部分;
离线部分:首先采用步骤六所述的方法离线获取样本集;然后采用步骤七所述的方法设计和训练用于确定最小命中时间的神经网络;
在线部分:每个制导周期内,首先使用离线训练好的神经网络确定每个参与协同攻击的飞行器的最小命中时间;然后根据式(36)确定协同攻击时间;接下来每个飞行器以协同攻击时间作为命中时间,采用步骤五所述的方法求解最优制导问题;最后根据优化结果更新制导指令,直至命中目标。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210320924.4A CN114815878B (zh) | 2022-03-23 | 2022-03-23 | 基于实时优化和深度学习的高超声速飞行器协同制导方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210320924.4A CN114815878B (zh) | 2022-03-23 | 2022-03-23 | 基于实时优化和深度学习的高超声速飞行器协同制导方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114815878A CN114815878A (zh) | 2022-07-29 |
CN114815878B true CN114815878B (zh) | 2024-05-10 |
Family
ID=82531312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210320924.4A Active CN114815878B (zh) | 2022-03-23 | 2022-03-23 | 基于实时优化和深度学习的高超声速飞行器协同制导方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114815878B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115981149B (zh) * | 2022-12-09 | 2024-01-09 | 中国矿业大学 | 基于安全强化学习的高超声速飞行器最优控制方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413000A (zh) * | 2019-05-28 | 2019-11-05 | 北京航空航天大学 | 一种基于深度学习的高超声速飞行器再入预测校正容错制导方法 |
CN111881518A (zh) * | 2020-07-30 | 2020-11-03 | 中国人民解放军火箭军工程大学 | 一种智能的高超声速飞行器再入机动制导方法及系统 |
CN112947573A (zh) * | 2021-03-12 | 2021-06-11 | 北京理工大学 | 终端时间约束下的高超声速飞行器再入制导方法 |
CN113126643A (zh) * | 2021-04-28 | 2021-07-16 | 西安电子科技大学 | 一种高超声速飞行器智能鲁棒再入制导方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019035997A1 (en) * | 2017-08-17 | 2019-02-21 | Sri International | ADVANCED CONTROL SYSTEM HAVING MULTIPLE CONTROL PARADIGMS |
-
2022
- 2022-03-23 CN CN202210320924.4A patent/CN114815878B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413000A (zh) * | 2019-05-28 | 2019-11-05 | 北京航空航天大学 | 一种基于深度学习的高超声速飞行器再入预测校正容错制导方法 |
CN111881518A (zh) * | 2020-07-30 | 2020-11-03 | 中国人民解放军火箭军工程大学 | 一种智能的高超声速飞行器再入机动制导方法及系统 |
CN112947573A (zh) * | 2021-03-12 | 2021-06-11 | 北京理工大学 | 终端时间约束下的高超声速飞行器再入制导方法 |
CN113126643A (zh) * | 2021-04-28 | 2021-07-16 | 西安电子科技大学 | 一种高超声速飞行器智能鲁棒再入制导方法及系统 |
Non-Patent Citations (1)
Title |
---|
高超声速飞行器滑模自适应迭代学习控制系统设计;卢晓东;张豪;郭建国;周军;;西北工业大学学报;20191215(第06期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114815878A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101937233B (zh) | 近空间高超声速飞行器非线性自适应控制方法 | |
Han et al. | Online policy iteration ADP-based attitude-tracking control for hypersonic vehicles | |
CN109782795B (zh) | 一种利用耦合的面对称高超声速飞行器横侧向控制方法及控制系统 | |
CN110908281A (zh) | 无人直升机姿态运动有限时间收敛强化学习控制方法 | |
CN105629734B (zh) | 一种近空间飞行器的轨迹跟踪控制方法 | |
CN105182742A (zh) | 一种弹性体飞行器自适应受限跟踪控制间接法 | |
CN111290278B (zh) | 一种基于预测滑模的高超声速飞行器鲁棒姿态控制方法 | |
CN111898201B (zh) | 一种空战模拟环境中的战斗机高精度自主攻击引导方法 | |
CN111367182A (zh) | 考虑输入受限的高超声速飞行器抗干扰反步控制方法 | |
CN105222648A (zh) | 一种线性伪谱广义标控脱靶量制导控制方法 | |
CN111506113A (zh) | 飞行器制导指令计算方法、侧滑角计算方法及制导方法 | |
CN113377121A (zh) | 一种基于深度强化学习的飞行器智能抗扰动控制方法 | |
CN109703769B (zh) | 一种基于预瞄策略的空中加油对接控制方法 | |
CN112560343B (zh) | 基于深度神经网络与打靶算法的J2摄动Lambert问题求解方法 | |
CN112327926B (zh) | 一种无人机编队的自适应滑模控制方法 | |
CN111240204B (zh) | 一种基于模型参考滑模变结构控制的巡飞弹控制方法 | |
CN114815878B (zh) | 基于实时优化和深度学习的高超声速飞行器协同制导方法 | |
CN104991446B (zh) | 一种基于大脑情感学习的无人机推力变向智能控制方法 | |
CN114721266B (zh) | 飞机舵面结构性缺失故障情况下的自适应重构控制方法 | |
CN114637312B (zh) | 一种基于智能变形决策的无人机节能飞行控制方法及系统 | |
CN114003052B (zh) | 一种基于动态补偿系统的固定翼无人机纵向运动鲁棒自适应控制方法 | |
CN114912202A (zh) | 宽速域吸气式动力飞行器机体推进一体化耦合控制方法 | |
Enjiao et al. | An adaptive parameter cooperative guidance law for multiple flight vehicles | |
CN116360258A (zh) | 基于固定时间收敛的高超声速变形飞行器抗干扰控制方法 | |
CN114580138B (zh) | 一种基于贝塞尔牛顿的导弹多约束末制导律设计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |