[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN103499974A - 一种双机协同被动雷达探测路径规划方法 - Google Patents

一种双机协同被动雷达探测路径规划方法 Download PDF

Info

Publication number
CN103499974A
CN103499974A CN201310454979.5A CN201310454979A CN103499974A CN 103499974 A CN103499974 A CN 103499974A CN 201310454979 A CN201310454979 A CN 201310454979A CN 103499974 A CN103499974 A CN 103499974A
Authority
CN
China
Prior art keywords
target
prime
state
task engine
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310454979.5A
Other languages
English (en)
Other versions
CN103499974B (zh
Inventor
方洋旺
高翔
伍友利
张磊
刁兴华
毛东辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Air Force Engineering University of PLA
Original Assignee
Air Force Engineering University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Air Force Engineering University of PLA filed Critical Air Force Engineering University of PLA
Priority to CN201310454979.5A priority Critical patent/CN103499974B/zh
Publication of CN103499974A publication Critical patent/CN103499974A/zh
Application granted granted Critical
Publication of CN103499974B publication Critical patent/CN103499974B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明公开了一种双机协同被动雷达探测路径规划方法,在分析目标主动雷达辐射区域的基础上建立了双机协同被动探测的任务模型。运用模糊理论对问题状态空间进行了泛化,针对不同的探测阶段给出了目标转移函数的不同形式,通过合理定义动作空间和奖励函数将问题描述为Markov决策过程,并给出了双机协同被动雷达探测的模糊Q学习路径规划方法。解决了现有基于模型的路径规划方法无法应对环境改变的问题,适合于非机动和机动辐射源的定位。

Description

一种双机协同被动雷达探测路径规划方法
技术领域
本发明属于信息技术领域,涉及一种双机协同被动雷达探测路径规划方法。
背景技术
隐身目标的出现使得目前广泛使用的主动雷达传感器的探测距离和探测精度大幅下降,依靠主动雷达获取目标信息的精确制导武器在应对隐身目标时也显得无能为力。主动雷达失效使得人们把目光重新投向传统的被动雷达传感器,研究通过获取目标主动雷达辐射的信号对其进行定位已成为目前反隐身领域的研究热点。
采用运动可控平台对辐射源进行定位是被动探测体制经常采用方法,由于单个平台只能报告其接收到信号的到达方位和到达时间,所以通常采用多平台协同的方式利用三角定位法对目标进行定位。实现被动探测的一个基本前提是必须使载机传感器位于目标的辐射范围内,但这就造成一个问题,即有可能使载机暴露在目标的攻击范围内,遭到目标机载武器的攻击。如何在保证载机安全的情况下实现对目标的定位是实现被动探测必须解决的问题。此外,双机组成的被动探测系统还受到通信距离、目标辐射控制等因素的限制和影响,所以,寻找合适的策略以规划载机的飞行路径对实现双机协同被动目标探测十分重要。
目前,用于飞行路径规划的方法主要是基于模型的优化方法,该方法通过建立载机、传感器、目标等的数学模型,定义相关的优化指标,采用最优化理论和算法对载机的飞行路径进行规划。基于模型的飞行路径规划优化方法存在一个问题,那就是其效果在很大程度上依赖于所建立模型的精确程度。一旦模型建立,载机的飞行路径规划策略基本固定不变,这在外界环境基本保持不变时可以获得令人满意的规划效果,但是当外界环境变化明显、事先建立的模型无法准确描述实际情况时,效果不佳。
发明内容
为了克服现有技术中的缺陷,本发明提供一种双机协同被动雷达探测路径规划方法,用以解决主动雷达辐射源的定位问题,通过引入多智能体理论中的强化学习方法,结合被动雷达探测的特点,通过合理的状态空间描述及动作空间定义将问题近似成离散的马尔科夫决策过程(MDP),并利用模糊Q学习算法对飞行策略进行在线寻优,只要值函数的估计保证渐近无偏,则Q学习算法能够收敛到一个准最优策略。
其技术方案如下:
一种双机协同被动雷达探测路径规划方法,包括以下步骤:
步骤1)建立双机协同被动雷达探测任务模型及约束条件;
步骤2)建立双机协同被动雷达探测的Markov决策过程模型;
步骤3)双机协同被动雷达探测路径的模糊Q学习规划步骤;
进一步优选,所述步骤1)具体包括以下两个步骤:
(1)目标辐射区域划分
考虑二维平面内情形,假设主动雷达安装在目标的头部,则以目标为中心可以将目标的周围区域划分为四个部分:主动雷达动态照射区、主动雷达主瓣照射区、武器威胁区与被动雷达失效区,它们之间存在相互重叠的区域,主动雷达动态照射区:该区域大小是由目标主动雷达的最大动态视场角
Figure BDA0000389193800000021
和雷达波的最大传播距离Dd决定,装备被动雷达的载机只有进入该区域,才有可能发现目标,主动雷达主瓣照射区:该区域大小由主瓣宽度
Figure BDA0000389193800000022
和Dd决定,通常以一定的周期Tm进行扫描,该区域内雷达波信号最强,为被动雷达的最佳接收区域,执行被动雷达探测任务的载机在进入动态照射区后,应控制自身进入该区域,武器威胁区:该区域由目标机载武器的最大离轴发射角
Figure BDA0000389193800000023
和射程Dw(Dw<Dd)决定,为简化问题,假设
Figure BDA0000389193800000024
执行被动探测任务的载机应避免进入该区域,以保证自身的安全,被动雷达失效区:通常情况下,该区域内由于没有可用的雷达辐射信号,所以被动雷达在该区域内将失效;
(2)任务模型及约束条件建立
假设执行被动探测任务的载机天线指向与其航向相同,被动雷达的最大搜索方位角为最大探测距离为Dp。首先给出以下定义:
目标视线(FiFT):执行被动探测任务的载机Fi(i=1,2)与目标FT的连线,其长度为Ri
目标方位角(qi):任务机航向与目标视线FiFT的夹角;
目标进入角(θi):目标航向与目标视线FiFT的夹角;
目标天线角(φi):目标天线指向与目标视线FiFT的夹角;
任务机方位角(βi):任务机航向与参考方向的夹角;
目标方位角与进入角的正方向规定为:任务机飞行员沿着飞机速度方向看去,以目标视线FiFT为起始基准,速度方向若右偏为正,左偏为负,则0≤|qi|≤180°,0≤|θi|≤180°;
任务机在探测过程中的任务分为两个阶段来实施:一是搜索阶段,主要解决如何发现目标的问题;二是定位阶段,该阶段主要解决如何提高探测精度的问题。对于搜索阶段,应满足
Figure BDA0000389193800000031
对于定位阶段,任务机进入目标主动雷达主瓣照射区接收信号应满足的条件为
Figure BDA0000389193800000032
为降低测向误差对定位精度的影响应满足的条件为
R &CenterDot; i < 0 , when R i &GreaterEqual; D w - - - ( 3 )
y 2 - y 1 x 2 - x 1 &NotEqual; y T - y 1 x T - x 1 &NotEqual; y T - y 2 x T - x 2 - - - ( 4 )
式中(x1,y1)、(x2,y2)、(xT,yT)分别记为
Figure BDA0000389193800000035
xT表示任务机1、任务机2及目标的位置状态;
应满足一个约束条件为任务机之间的距离应不超过载机间数据通信的最大距离Dc,且不能小于载机间安全距离Df,即
Df≤|F1F2|≤Dc      (5)。
进一步优选,所述步骤2)具体包括以下四个步骤:
(1)状态空间的划分与模糊泛化
双机协同被动雷达探测问题的状态空间包括任务机的状态空间
Figure BDA0000389193800000042
与目标的状态空间xT两部分,通过
Figure BDA0000389193800000043
和xT计算出目标的相对态势关系(Rii,qii),记为xi,将原状态空间按任务机与目标相对态势划分统一的状态空间S:
Figure BDA0000389193800000041
其中s1、s2、s3、s4、s5为状态空间S中的状态元素。
进一步采用隶属度函数表示原状态空间到新状态空间的映射,则状态分量Ri、θi、qi、φi的隶属度函数分别为
&xi; 1,1 ( R i ) = max ( 0 , R w - R i R w ) &xi; 1,2 ( R i ) = max ( 0 , min ( R i R w , R d - R i R d - R w ) ) &xi; 1,3 ( R i ) = max ( 0 , min ( R i - R w R d - R w , R &infin; - R i R &infin; - R d ) ) &xi; 1,4 ( R i ) = max ( 0 , R i - R d R &infin; - R d ) - - - ( 7 )
Figure BDA0000389193800000052
Figure BDA0000389193800000053
Figure BDA0000389193800000054
其中ξp,q为原状态分量p隶属于新状态q的隶属度值,R为一大正数;
得到各状态分量的隶属度函数后,通过乘积推理就能得到状态变量xi的4维隶属度函数
μn(xi)=ξ(Ri)·ξ(θi)·ξ(|qi|)·ξ(|φi|)      (11)
(2)动作空间定义
假设任务机速度大小不变为V,只进行航向控制,则任务机Fi的运动模型为
x i [ k + 1 ] = x i [ k ] + V cos ( &beta; i [ k ] ) T y i [ k + 1 ] = y i [ k ] + V sin ( &beta; i [ k ] ) T - - - ( 12 )
其中(xi[k],yi[k])为任务机Fi在k时刻的位置,任务机航向的控制方程为
βi[k+1]=βi[k]+Δβi      (13)
其中 &Delta; &beta; i &Element; U i = { u 1 i , . . . , u M i | | u m i | &le; &Delta; &beta; max , m = 1 , . . . , M } , Ui为任务机Fi的动作空间,
Figure BDA0000389193800000063
为动作。规定逆时针方向旋转为正,则当Δβi为正时表示任务机逆时针旋转,为负时则为顺时针旋转,为0时表示其保持原来航向,Δβmax为任务机的最大旋转角度,它受自身可用过载的限制;
(3)转移函数定义
对于任务机i与目标组成的系统在状态sj时采用动作
Figure BDA0000389193800000064
和u转移到状态sj′的转移函数可以定义为
p i ( s j &prime; | s j , u m i , u ) = P ( s ( k + 1 ) = s j &prime; | s ( k ) = s j , u i ( k ) = u m i , u T ( k ) = u ) - - - ( 14 )
其中sj,sj′∈S,
Figure BDA0000389193800000066
u为目标动作。
假设任务机的状态转移与目标是独立的,
Figure BDA0000389193800000067
可以进一步表示为
p i ( s j &prime; | s j , u m i , u ) = p i ( s j &prime; | s j , u m i ) p i ( s j &prime; | s j , u ) - - - ( 15 )
式(15)中
Figure BDA0000389193800000069
为已知量,pi(sj′|sj,u)的值与目标的策略有关,根据不同的任务阶段进行定义。当处于搜索阶段时,定义为
p i ( s j &prime; | s j , u ) = &Integral; - &infin; s T &prime; 1 2 &pi; &sigma; C exp [ - ( s T &prime; - C &OverBar; ) 2 2 &sigma; C 2 ] d s T &prime; - - - ( 16 )
其中s′T为目标下一时刻的状态,它服从以
Figure BDA0000389193800000072
为中心、σC为强度的正态分布,强度σC通常根据搜索区域的大小选取,区域越大,该值越大。当处于定位阶段时,定义为
p i ( s j &prime; | s j , u ) = &Integral; - &infin; s T &prime; 1 2 &pi; &sigma; T exp [ - ( s T &prime; - s T ) 2 2 &sigma; T 2 ] d s T &prime; - - - ( 17 )
其中sT为目标当前时刻的状态,目标下一时刻的状态服从当前状态sT为中心,σT为强度的正态分布,强度σT通常根据目标的速度大小选取,目标速度越大,该值越大,
(4)奖惩函数定义
系统的奖励函数采用下列确定形式
&rho; i ( s , u m i , u T , s &prime; ) = - 1 s &prime; = s 1 - 5 s &prime; = s 5 1 s &prime; = s 2 or s 3 5 s &prime; = s 4 - - - ( 18 ) .
进一步优选,所述步骤3)具体包括以下六个步骤:
(1)初始化:分别对状态
Figure BDA00003891938000000710
和xT、迭代参数Ω[n,m]、折扣因子γ进行初始化;
(2)从离散动作集中分别为双机选取k时刻的动作
Figure BDA0000389193800000075
(3)将
Figure BDA0000389193800000076
带入双机状态方程计算双机状态,并判断双机状态是否满足约束条件式(3-5),若满足,则进行下一步,若不满足,则转步骤(2);
(4)执行动作
Figure BDA0000389193800000077
分别记录双机下一时刻状态和即时奖励值
Figure BDA0000389193800000078
(5)利用式 &Omega; k + 1 , [ n , m ] i &rho; i ( x n i , u m i ) + &gamma; max u m &prime; &prime; i &Element; U i &Sigma; n &prime; = 1 N &psi; n &prime; ( x n &prime; i ) &Omega; k , [ n &prime; , m &prime; ] i 更新双机的值函数;
(6)判断||Ωk+1k||≤ζ,若满足,则停止迭代输出规划策略,若不满足,则转步骤(2)。
本发明的有益效果:
本发明通过抽象出相对态势表示任务机和目标组成系统的状态,在合理定义模糊隶属度函数的情况下实现了状态空间的高度泛化;通过定义状态空间、动作空间、转移函数及奖励函数将问题描述成一个马尔科夫决策过程,并给出双机协同被动探测路径模糊Q学习规划算法实时更新双机路径规划策略,可以有效提高双机应对环境变化的能力。
附图说明
图1是目标辐射区域划分示意;
图2是双机协同被动探测态势;
图3是目标无机动时的双机协同被动探测规划路径,图3a是目标无机动时双机飞行路径,图3b是双机飞行路径的局部放大;
图4是目标无机动时的目标定位精度变化曲线及双机奖惩值变化曲线,图4a是目标无机动时的定位精度值,图4b是目标无机动时的双机奖惩值;
图5是目标机动时的双机协同被动探测规划路径,图5a是目标机动时双机飞行路径,图5b是双机飞行路径的局部放大;
图6是目标机动时的目标定位精度变化曲线及双机奖惩值变化曲线,图6a是目标机动时的定位精度值;图6b是目标机动时的双机奖惩值。
具体实施方式
下面结合附图和具体实施方式对本发明的技术方案作进一步详细地说明。
设双机与目标的飞行区域为欧式空间中的矩形区域,坐标范围0≤X≤200km,-10km≤Y≤10km。
步骤1建立双机协同被动雷达探测任务模型及约束条件:
设任务机被动雷达的有效探测距离Dp=200km,最大搜索方位角为
Figure BDA0000389193800000081
目标主动雷达的最大作用距离为Dd=100km,最大动态视场角
Figure BDA0000389193800000082
主瓣宽度扫描周期Tm=5s。目标武器的射程Dw=60km,最大离轴发射角
Figure BDA0000389193800000091
利用以上参数根据式(1-5)可以建立双机协同被动雷达探测任务模型及约束条件。
步骤2建立双机协同被动雷达探测的MDP模型:
任务机与目标速度大小均为200ms,任务机与目标的初始态势按照(X坐标,Y坐标,航向)格式设为两组,分别为(i):F1(0,-2.5km,0)、F2(0,2.5km,0)、FT(150km,0,180°);(ii):F1(0,-2.5km,0)、F2(0,2.5km,0)、FT(150km,6km,180°)。组(i)和组(ii)分别为用以测试所提方法在应对非机动目标和机动目标时的路径规划能力。利用以上参数,根据式(6-10)可以完成状态空间的划分与模糊泛化,其中对于组(ii)目标机动情形,设目标的机动过载为4g(g=9.8m2/s为重力加速度)。
定义任务机F1、F2具有相同的离散化动作空间,共包含5个动作,为U1=U2={-3°,-1.5°,0,1.5°,3°}。
Figure BDA0000389193800000092
为目标的初始坐标,σC取104,σT取200,根据式(15-17)完成转移函数的定义。
奖惩函数按照式(18)定义。
步骤3双机协同被动雷达探测路径的模糊Q学习规划步骤:
分别针对组(i)和组(ii)按照步骤(1-6)进行计算机仿真,得到的结果如附图3-附图6所示。为了清晰显示定位精度变化附图3和图5中给出了任务机1与任务机2间距误差为50m,测角误差为0.2865°时计算得到的双机在初始位置时的目标定位几何精度因子(GDOP)分布。等高线上的数值为定位的几何精度,其值越大表明对该等高线上的目标定位精度越低。
图3b为图3a的放大,可以看出,按照所提方法,双机对无机动目标的被动定位可以分搜索、跟踪定位及逃离三个阶段。在搜索阶段,双机在每一时刻的运动方向相反,即双机分别对不同的区域进行搜索,这样提高了发现目标的概率。跟踪定位阶段的仿真曲线表明双机能够稳定地跟踪目标主动雷达的主瓣照射区,实现对目标的有效定位,图4的GDOP变化曲线的实线部分(虚线为按照仿真中双机和目标位置计算出的GDOP值,实际过程中由于无法获得目标辐射信号而无法计算,故用虚线表示)表明按照规划路径,双机对目标的定位误差持续下降,最终保持在3.03左右直至进入目标武器威胁区后受到惩罚而逃离。图4的双机的奖励函数变化曲线也反映了该过程,即搜索阶段由于无目标信号奖励一直为负,而后从进入目标主动雷达动态照射区到主瓣照射区奖励逐渐增加,当进入目标威胁区后再次下降,它表明文中定义的奖励函数能够有效反映双机被动雷达的探测任务。
从图5可以看出存在目标机动时的双机路径规划要比目标无机动时复杂,整个过程大致可以分为搜索、跟踪定位、再搜索、再跟踪定位及逃离五个阶段。当目标机动时,双机组成的被动探测系统能够适应目标的变化,经过在搜索后仍然能够实现对目标的有效跟踪定位。图6的GDOP变化曲线反映出定位精度在经过变化后最终下降到9.66左右。图6的双机奖励函数变化曲线表明文中定义的奖励函数对跟踪机动目标同样具有适用性。
综上所述,所提双机协同被动探测路径规划方法能够实现对目标的有效跟踪定位,当目标机动时,算法能够保证任务机对环境改变的良好适应性。
以上所述,仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换均落入本发明的保护范围内。

Claims (4)

1.一种双机协同被动雷达探测路径规划方法,其特征在于,包括以下步骤:
步骤1)建立双机协同被动雷达探测任务模型及约束条件;
步骤2)建立双机协同被动雷达探测的Markov决策过程模型;
步骤3)双机协同被动雷达探测路径的模糊Q学习规划步骤。
2.根据权利要求1所述双机协同被动雷达探测路径规划方法,其特征在于,所述步骤1)具体包括以下两个步骤:
(1)目标辐射区域划分
考虑二维平面内情形,假设主动雷达安装在目标的头部,则以目标为中心可以将目标的周围区域划分为四个部分:主动雷达动态照射区、主动雷达主瓣照射区、武器威胁区与被动雷达失效区,它们之间存在相互重叠的区域,主动雷达动态照射区:该区域大小是由目标主动雷达的最大动态视场角
Figure FDA0000389193790000011
和雷达波的最大传播距离Dd决定,主动雷达主瓣照射区:该区域大小由主瓣宽度
Figure FDA0000389193790000012
和Dd决定,以一定的周期Tm进行扫描,该区域内雷达波信号最强,为被动雷达的最佳接收区域,执行被动雷达探测任务的载机在进入动态照射区后,应控制自身进入该区域,武器威胁区:该区域由目标机载武器的最大离轴发射角
Figure FDA0000389193790000013
和射程Dw决定,假设
Figure FDA0000389193790000014
执行被动探测任务的载机应避免进入该区域,被动雷达失效区:该区域内没有可用的雷达辐射信号,被动雷达在该区域内将失效;
(2)任务模型及约束条件建立
假设执行被动探测任务的载机天线指向与其航向相同,被动雷达的最大搜索方位角为最大探测距离为Dp,首先给出以下定义:
目标视线FiFT:执行被动探测任务的载机Fi(i=1,2)与目标FT的连线,其长度为Ri
目标方位角qi:任务机航向与目标视线FiFT的夹角;
目标进入角θi:目标航向与目标视线FiFT的夹角;
目标天线角φi:目标天线指向与目标视线FiFT的夹角;
任务机方位角βi:任务机航向与参考方向的夹角;
目标方位角与进入角的正方向规定为:任务机飞行员沿着飞机速度方向看去,以目标视线FiFT为起始基准,速度方向若右偏为正,左偏为负,则0≤|qi|≤180°,0≤|θi|≤180°;
任务机在探测过程中的任务分为两个阶段来实施:一是搜索阶段,主要解决如何发现目标的问题;二是定位阶段,对于搜索阶段,应满足
对于定位阶段,任务机进入目标主动雷达主瓣照射区接收信号应满足的条件为
Figure FDA0000389193790000022
为降低测向误差对定位精度的影响应满足的条件为
R &CenterDot; i < 0 , when R i &GreaterEqual; D w - - - ( 3 )
y 2 - y 1 x 2 - x 1 &NotEqual; y T - y 1 x T - x 1 &NotEqual; y T - y 2 x T - x 2 - - - ( 4 )
式中(x1,y1)、(x2,y2)、(xT,yT)分别记为
Figure FDA0000389193790000025
xT表示任务机1、任务机2及目标的位置状态;
应满足一个约束条件为任务机之间的距离应不超过载机间数据通信的最大距离Dc,且不能小于载机间安全距离Df,即
Df≤|F1F2|≤Dc      (5)。
3.根据权利要求1所述的双机协同被动雷达探测路径规划方法,其特征在于,所述步骤2)具体包括以下四个步骤:
(1)状态空间的划分与模糊泛化
双机协同被动雷达探测问题的状态空间包括任务机的状态空间
Figure FDA0000389193790000033
与目标的状态空间xT两部分,通过
Figure FDA0000389193790000034
和xT计算出目标的相对态势关系,记为xi,将原状态空间按任务机与目标相对态势划分统一的状态空间S:
Figure FDA0000389193790000031
其中s1、s2、s3、s4、s5为状态空间S中的状态元素;
进一步采用隶属度函数表示原状态空间到新状态空间的映射,则状态分量Ri、θi、qi、φi的隶属度函数分别为
&xi; 1,1 ( R i ) = max ( 0 , R w - R i R w ) &xi; 1,2 ( R i ) = max ( 0 , min ( R i R w , R d - R i R d - R w ) ) &xi; 1,3 ( R i ) = max ( 0 , min ( R i - R w R d - R w , R &infin; - R i R &infin; - R d ) ) &xi; 1,4 ( R i ) = max ( 0 , R i - R d R &infin; - R d ) - - - ( 7 )
Figure FDA0000389193790000041
Figure FDA0000389193790000043
其中ξp,q为原状态分量p隶属于新状态q的隶属度值,R为一大正数;
得到各状态分量的隶属度函数后,通过乘积推理就能得到状态变量xi的4维隶属度函数
μn(xi)=ξ(Ri)·ξ(θi)·ξ(|qi|)·ξ(|φi|)      (11)
(2)动作空间定义
假设任务机速度大小不变为V,只进行航向控制,则任务机Fi的运动模型为
x i [ k + 1 ] = x i [ k ] + V cos ( &beta; i [ k ] ) T y i [ k + 1 ] = y i [ k ] + V sin ( &beta; i [ k ] ) T - - - ( 12 )
其中(xi[k],yi[k])为任务机Fi在k时刻的位置,任务机航向的控制方程为
βi[k+1]=βi[k]+Δβi      (13)
其中 &Delta; &beta; i &Element; U i = { u 1 i , . . . , u M i | | u m i | &le; &Delta; &beta; max , m = 1 , . . . , M } , Ui为任务机Fi的动作空间,
Figure FDA0000389193790000053
为动作,规定逆时针方向旋转为正,则当Δβi为正时表示任务机逆时针旋转,为负时则为顺时针旋转,为0时表示其保持原来航向,Δβmax为任务机的最大旋转角度,它受自身可用过载的限制;
(3)转移函数定义
对于任务机i与目标组成的系统在状态sj时采用动作
Figure FDA0000389193790000054
和u转移到状态sj′的转移函数可以定义为
p i ( s j &prime; | s j , u m i , u ) = P ( s ( k + 1 ) = s j &prime; | s ( k ) = s j , u i ( k ) = u m i , u T ( k ) = u ) - - - ( 14 )
其中sj,sj′∈S,
Figure FDA0000389193790000056
u为目标动作;
假设任务机的状态转移与目标是独立的,
Figure FDA0000389193790000057
可以进一步表示为
p i ( s j &prime; | s j , u m i , u ) = p i ( s j &prime; | s j , u m i ) p i ( s j &prime; | s j , u ) - - - ( 15 )
式(15)中为已知量,pi(sj′|sj,u)的值与目标的策略有关,根据不同的任务阶段进行定义,当处于搜索阶段时,定义为
p i ( s j &prime; | s j , u ) = &Integral; - &infin; s T &prime; 1 2 &pi; &sigma; C exp [ - ( s T &prime; - C &OverBar; ) 2 2 &sigma; C 2 ] d s T &prime; - - - ( 16 )
其中s′T为目标下一时刻的状态,它服从以为中心、σC为强度的正态分布,强度σC通常根据搜索区域的大小选取,区域越大,该值越大,当处于定位阶段时,定义为
p i ( s j &prime; | s j , u ) = &Integral; - &infin; s T &prime; 1 2 &pi; &sigma; T exp [ - ( s T &prime; - s T ) 2 2 &sigma; T 2 ] d s T &prime; - - - ( 17 )
其中sT为目标当前时刻的状态,目标下一时刻的状态服从当前状态sT为中心,σT为强度的正态分布,强度σT通常根据目标的速度大小选取,目标速度越大,该值越大,
(4)奖惩函数定义
系统的奖励函数采用下列确定形式
&rho; i ( s , u m i , u T , s &prime; ) = - 1 s &prime; = s 1 - 5 s &prime; = s 5 1 s &prime; = s 2 or s 3 5 s &prime; = s 4 - - - ( 18 ) .
4.根据权利要求1所述的双机协同被动雷达探测路径规划方法,其特征在于,所述步骤3)具体包括以下六个步骤:
(1)初始化:分别对状态
Figure FDA0000389193790000067
和xT、迭代参数Ω[n,m]、折扣因子γ进行初始化;
(2)从离散动作集中分别为双机选取k时刻的动作
Figure FDA0000389193790000062
(3)将
Figure FDA0000389193790000063
带入双机状态方程计算双机状态,并判断双机状态是否满足约束条件式(3-5),若满足,则进行下一步,若不满足,则转步骤(2);
(4)执行动作
Figure FDA0000389193790000064
分别记录双机下一时刻状态和即时奖励值
Figure FDA0000389193790000065
(5)利用式 &Omega; k + 1 , [ n , m ] i &rho; i ( x n i , u m i ) + &gamma; max u m &prime; &prime; i &Element; U i &Sigma; n &prime; = 1 N &psi; n &prime; ( x n &prime; i ) &Omega; k , [ n &prime; , m &prime; ] i 更新双机的值函数;
(6)判断||Ωk+1k||≤ζ,若满足,则停止迭代输出规划策略,若不满足,则转步骤(2)。
CN201310454979.5A 2013-09-27 2013-09-27 一种双机协同被动雷达探测路径规划方法 Expired - Fee Related CN103499974B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310454979.5A CN103499974B (zh) 2013-09-27 2013-09-27 一种双机协同被动雷达探测路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310454979.5A CN103499974B (zh) 2013-09-27 2013-09-27 一种双机协同被动雷达探测路径规划方法

Publications (2)

Publication Number Publication Date
CN103499974A true CN103499974A (zh) 2014-01-08
CN103499974B CN103499974B (zh) 2016-08-17

Family

ID=49865194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310454979.5A Expired - Fee Related CN103499974B (zh) 2013-09-27 2013-09-27 一种双机协同被动雷达探测路径规划方法

Country Status (1)

Country Link
CN (1) CN103499974B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106352738A (zh) * 2016-06-08 2017-01-25 北京理工大学 基于输出一致性的多弹协同制导方法
CN106932759A (zh) * 2017-01-17 2017-07-07 电子科技大学 一种用于主被动雷达的协同定位方法
CN106996789A (zh) * 2017-03-24 2017-08-01 西安电子科技大学 一种多机载雷达协同探测的航路规划方法
CN107562053A (zh) * 2017-08-30 2018-01-09 南京大学 一种基于模糊q学习的六足机器人避障方法
CN108037773A (zh) * 2017-12-13 2018-05-15 王俊梅 一种微型无人机低空隐匿飞行方法
CN108037767A (zh) * 2017-12-13 2018-05-15 王俊梅 一种无人机视线死角转向逃逸飞行系统
CN108333586A (zh) * 2018-02-09 2018-07-27 周口师范学院 基于双接收机垂直交叉扫描的无源雷达测向方法及系统
CN108387866A (zh) * 2018-01-16 2018-08-10 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN109324505A (zh) * 2018-06-22 2019-02-12 中国人民解放军海军航空大学青岛校区 一种基于机器学习的协同探测控制方法
CN115643533A (zh) * 2022-12-22 2023-01-24 成都安则科技有限公司 一种无线电导航用接收站位确定的方法及系统
CN116819976A (zh) * 2023-08-31 2023-09-29 中国人民解放军空军工程大学 控制输入受约束动力学系统的预定时间容错控制设计方法
CN117406765A (zh) * 2023-09-05 2024-01-16 南京航空航天大学 随机和自适应航迹规划的动态波束辐射源搜索方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105528A (zh) * 2007-07-06 2008-01-16 哈尔滨工程大学 利用高频fyas对隐形飞行器定位的方法
CN101465071A (zh) * 2009-01-08 2009-06-24 上海交通大学 多平台目标跟踪与分布交互仿真系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101105528A (zh) * 2007-07-06 2008-01-16 哈尔滨工程大学 利用高频fyas对隐形飞行器定位的方法
CN101465071A (zh) * 2009-01-08 2009-06-24 上海交通大学 多平台目标跟踪与分布交互仿真系统

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
刘久富等: "基于Markov对策的码垛机器人三维路径规划", 《中国机械工程》 *
刘少华等: "基于PSO的多观测器轨迹优化研究", 《飞行力学》 *
张平等: "基于UKF算法的双机协同无源跟踪", 《电光与控制》 *
顾晓婕等: "基于多模型切换的多观测器轨迹优化研究", 《控制与决策》 *
顾晓婕等: "机载雷达组网多站测角被动跟踪轨迹优化研究", 《计算机仿真》 *
高翔等: "双机协作无源定位测角精确度计算", 《空军工程大学学报(自然科学版)》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106352738A (zh) * 2016-06-08 2017-01-25 北京理工大学 基于输出一致性的多弹协同制导方法
CN106932759A (zh) * 2017-01-17 2017-07-07 电子科技大学 一种用于主被动雷达的协同定位方法
CN106996789A (zh) * 2017-03-24 2017-08-01 西安电子科技大学 一种多机载雷达协同探测的航路规划方法
CN106996789B (zh) * 2017-03-24 2020-05-05 西安电子科技大学 一种多机载雷达协同探测的航路规划方法
CN107562053A (zh) * 2017-08-30 2018-01-09 南京大学 一种基于模糊q学习的六足机器人避障方法
CN108037773A (zh) * 2017-12-13 2018-05-15 王俊梅 一种微型无人机低空隐匿飞行方法
CN108037767A (zh) * 2017-12-13 2018-05-15 王俊梅 一种无人机视线死角转向逃逸飞行系统
CN108387866B (zh) * 2018-01-16 2021-08-31 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN108387866A (zh) * 2018-01-16 2018-08-10 南京航空航天大学 一种基于强化学习的无人机查找非法广播电台方法
CN108333586A (zh) * 2018-02-09 2018-07-27 周口师范学院 基于双接收机垂直交叉扫描的无源雷达测向方法及系统
CN109324505A (zh) * 2018-06-22 2019-02-12 中国人民解放军海军航空大学青岛校区 一种基于机器学习的协同探测控制方法
CN115643533A (zh) * 2022-12-22 2023-01-24 成都安则科技有限公司 一种无线电导航用接收站位确定的方法及系统
CN116819976A (zh) * 2023-08-31 2023-09-29 中国人民解放军空军工程大学 控制输入受约束动力学系统的预定时间容错控制设计方法
CN116819976B (zh) * 2023-08-31 2023-11-10 中国人民解放军空军工程大学 控制输入受约束动力学系统的预定时间容错控制设计方法
CN117406765A (zh) * 2023-09-05 2024-01-16 南京航空航天大学 随机和自适应航迹规划的动态波束辐射源搜索方法和系统
CN117406765B (zh) * 2023-09-05 2024-06-14 南京航空航天大学 随机和自适应航迹规划的动态波束辐射源搜索方法和系统

Also Published As

Publication number Publication date
CN103499974B (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN103499974A (zh) 一种双机协同被动雷达探测路径规划方法
CN103365299B (zh) 一种无人机的避障方法及其装置
CN102506892B (zh) 一种光流多传感器和惯导器件信息融合配置方法
CN103914068A (zh) 一种基于栅格地图的服务机器人自主导航方法
CN110908395A (zh) 改进的无人机航迹实时规划方法
CN113204015B (zh) 用于分布式雷达目标模拟的多无人机航迹规划方法及系统
CN104833949A (zh) 一种基于改进距离参数化的多无人机协同无源定位方法
CN103152826A (zh) 一种基于nlos状态检测补偿的移动目标追踪方法
CN104535993B (zh) 一种机载多主动雷达测距的地面物体高精度定位方法
Liu et al. Formation control of nonholonomic unmanned ground vehicles via unscented Kalman filter-based sensor fusion approach
CN115167440A (zh) 一种基于虚拟领航-领航-跟随的多机器人编队控制方法
Lu et al. Robot indoor location modeling and simulation based on Kalman filtering
CN103499809B (zh) 一种纯方位双机协同目标跟踪定位路径规划方法
Ren et al. Improved extended kalman filter based on fuzzy adaptation for slam in underground tunnels
Wang Automatic control of mobile robot based on autonomous navigation algorithm
Yu et al. AI based location tracking in WiFi indoor positioning application
CN105182326A (zh) 一种利用方位信息的目标跟踪快速方法及装置
CN109976189A (zh) 一种智能舰艇自动巡航模拟仿真方法
Lee et al. UWB-based multiple UAV control system for indoor ground vehicle tracking
CN114840003B (zh) 一种单领航多auv协同定位及轨迹跟踪控制方法
Xu et al. Research on precise route control of unmanned aerial vehicles based on physical simulation systems
Liu et al. Autonomous vehicle self-localization in urban environments based on 3D curvature feature points–Monte Carlo localization
Shen et al. Research on real-time flight path planning of UAV based on grey prediction
CN116719239A (zh) 一种迹向欠驱动卫星不完全信息追逃博弈控制方法
CN116626608A (zh) 一种面向组网雷达假航迹的无人干扰机控制策略生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160817

Termination date: 20170927

CF01 Termination of patent right due to non-payment of annual fee