[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN114043476A - 一种拒止环境下基于粒子群算法的群体机器人控制方法 - Google Patents

一种拒止环境下基于粒子群算法的群体机器人控制方法 Download PDF

Info

Publication number
CN114043476A
CN114043476A CN202111301771.0A CN202111301771A CN114043476A CN 114043476 A CN114043476 A CN 114043476A CN 202111301771 A CN202111301771 A CN 202111301771A CN 114043476 A CN114043476 A CN 114043476A
Authority
CN
China
Prior art keywords
robot
attacking
enemy
attack
environment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111301771.0A
Other languages
English (en)
Other versions
CN114043476B (zh
Inventor
张军旗
刘欢
王成
臧笛
刘春梅
康琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202111301771.0A priority Critical patent/CN114043476B/zh
Publication of CN114043476A publication Critical patent/CN114043476A/zh
Application granted granted Critical
Publication of CN114043476B publication Critical patent/CN114043476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1679Programme controls characterised by the tasks executed
    • B25J9/1682Dual arm manipulator; Coordination of several manipulators

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)

Abstract

本发明涉及一种拒止环境下基于粒子群算法的群体机器人控制方法,包括:步骤1、建立拒止环境下的攻防对抗场景,并初始化粒子群算法的参数;步骤2、进攻机器人通过传感器探测周围环境信息,获取友方和敌方机器人的态势信息,并利用惯性导航技术实时计算敌方领土位置;步骤3、所述进攻机器人构建适应度函数;步骤4、利用粒子群算法优化适应度函数,得到进攻机器人的最优占位;步骤5、进攻机器人进行移动与攻击操作;步骤6、若任一进攻机器人进入敌方领土,则任务完成;否则判断是否达到最大运行时间,若是,则任务失败;否则转到步骤2进行下一时间片的迭代。与现有技术相比,本发明避免了全局定位,控制无需预训练,解决了维数灾难的问题。

Description

一种拒止环境下基于粒子群算法的群体机器人控制方法
技术领域
本发明涉及多智能体集群间的协同与博弈对抗控制领域,尤其是涉及一种拒止环境下基于粒子群算法的群体机器人控制方法。
背景技术
随着智能无人技术的快速发展和成熟应用,无人设备间的协同作战已经成为可能,无人集群间的协同攻防对抗逐渐成为未来战争的重要模态。作为多智能体技术的应用载体,无人集群通过感知环境,判断周围态势,依据一定的攻防策略,采取集火攻击、伤兵回撤、障碍避让、群体避碰、分散、集中、协作、援助等行为,实现攻防对抗。
群体机器人的协同攻防对抗可以描述为复杂多约束条件下的最优决策问题,最经典的是疆土守卫问题。在此问题中,对抗环境由入侵方和防守方两个多智能群体组成。其中,入侵方目的是试图尽可能的靠近并进入某一领土,防守方的目的是拦截入侵方使其尽可能的远离该领土。对抗环境下态势的优劣取决于入侵者、防守者和领土三者之间的关系,由于多智能体攻防对抗任务状态空间维数高,策略求解空间随实体对象规模的增加呈指数级增大,态势复杂且变化快,攻防策略多样,导致求解的难度大,需要高效的决策算法。
目前最流行的群体对抗方法是多智能体深度强化学习方法。然而此类算法需要大量的预训练、受限于维数灾难问题,且依赖精确的全球定位和通信,无法在拒止环境中实现有效协作和对抗。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种拒止环境下基于粒子群算法的群体机器人控制方法,该控制方法弥补了当前大多数多智能体算法以来全局定位和通信,受限于维数灾难的瓶颈问题。
本发明的目的可以通过以下技术方案来实现:
本发明提供了一种拒止环境下基于粒子群算法的群体机器人控制方法,该方法包括以下步骤:
步骤1、建立拒止环境下的攻防对抗场景,并初始化粒子群算法的参数;
步骤2、进攻机器人通过传感器探测周围环境信息,获取友方机器人和敌方机器人的态势信息,并利用惯性导航技术实时计算敌方领土的位置
Figure BDA0003338687100000021
步骤3、所述进攻机器人利用探测到的周围环境信息构建包含敌军机器人状态信息、友军机器人状态信息和敌方领土信息的适应度函数;
步骤4、利用粒子群算法优化所述适应度函数,得到所述进攻机器人的最优占位,并指导所述进攻机器人在下一时间片的移动与攻击;
步骤5、所述进攻机器人进行移动与攻击操作;
步骤6、如果存在一个进攻机器人进入敌方领土,则任务完成;否则判断是否达到最大运行时间,如果是,则任务失败;否则转到步骤2进行下一时间片的迭代。
优选地,所述步骤1中建立拒止环境下的攻防对抗场景,并初始化粒子群算法的参数,具体为:初始化N个进攻机器人的位置、M个防守机器人的位置以及敌方领土的GPS定位坐标U;初始化粒子群算法中的粒子初始个数
Figure BDA0003338687100000022
加速因子c1与c2,惯性权重w和问题的维度D;
所有机器人的属性相同,均具备P点血量,当机器人受到攻击时血量减p,当机器人血量小于等于0时,即该机器人被消灭。
优选地,所述步骤2具体为:每个进攻机器人根据自己的位置和移动方向构建坐标系;通过传感器探测周围环境信息,获取友方机器人和敌方机器人的坐标,并利用惯性导航技术实时计算敌方领土的位置
Figure BDA0003338687100000023
优选地,所述步骤3中所述进攻机器人利用探测到的周围环境信息构建进攻机器人的适应度函数,具体为:进攻机器人Ai根据敌军机器人状态信息、友军机器人状态信息和敌方领土信息构建适应度函数Fi,其表达式为:
Fi=f1+f2+f3
其中,f1是根据敌军机器人状态信息构建的对抗适应度,f2是根据友军机器人状态信息构建的协作适应度,f3是敌方领土适应度。
优选地,所述对抗适应度函f1的表达式为:
Figure BDA0003338687100000031
其中Ψ是攻击机器人Ai邻域范围R1内所有敌方机器人的索引,
Figure BDA0003338687100000032
是根据第k个敌方机器人状态信息生成的子适应度函数;
Figure BDA0003338687100000033
是第k个敌方机器人的坐标;x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ1和w1分别定义了类高斯模型的宽度和幅度;S(i,k)是衡量第i个攻击机器人Ai的态势是否优于敌方机器人Bk的指标,决定了攻击机器人Ai是向敌方机器人Bk移动还是后退,其表达式为:
Figure BDA0003338687100000034
所述机器人的态势信息是根据友方机器人的数量和总血量计算得到,其中“-1”和“1”分别代表攻击机器人Ai处于不利和有利态势;Ni
Figure BDA0003338687100000035
分别表示攻击机器人Ai攻击范围R0内的所有友方机器人的数量和总血量值;Mk
Figure BDA0003338687100000036
分别是敌方机器人Bk攻击范围R0内的所有敌方机器人数量和总血量值;
当S(i,k)=-1时,fBk是一个山谷形函数,表示攻击机器人Ai离敌方机器人Bk越远,攻击机器人Ai的适应度越高;
当S(i,k)=1时,fBk是一个山峰形函数,表示攻击机器人Ai与敌方机器人Bk越接近,攻击机器人Ai的适应度越高。
优选地,所述进攻机器人Ai的协作适应度函数f2的表达式为:
Figure BDA0003338687100000037
其中Φ是攻击机器人Ai邻域范围R1内中所有友军的索引;fAk是根据第k个进攻机器人状态信息生成的子适应度函数,其中
Figure BDA0003338687100000038
是第k个攻击者的坐标;x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ2和w2分别定义了类高斯模型的宽度和幅度;
如果进攻机器人Ai在τ个时间片内,面对周围的敌方机器人一直处于劣势,则进攻机器人Ai需要摆脱其同伴的约束并退出群体,此时将协作适应度函数f2设置为0,进攻机器人Ai独立行动来搜索更好的攻击位置;
当Ai与其友军Ak之间的距离小于预设阈值Δ=10|Ψ|时,fAk设置为0,以避免两个进攻机器人发生碰撞。
优选地,所述攻机器人Ai的敌方领土适应度f3表达式为:
Figure BDA0003338687100000041
其中U=(U1,U2)是敌方领土中心位置的坐标,x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ3和w3分别定义了类高斯模型的宽度和幅度。
优选地,所述步骤4具体为:在每个时间片中,执行粒子群算法优化所述适应度函数,得到进攻机器人Ai在其当前情况下的最佳位置pg;所述粒子群算法的搜索空间为以进攻机器人Ai的坐标为中心,R1为半径的圆形区域内。
优选地,所述适应度函数的速度和位置更新表达式为:
Figure BDA0003338687100000042
Figure BDA0003338687100000043
其中,c1,c2是常数加速因子,w是惯性权重,
Figure BDA0003338687100000044
表示第i个粒子在第d维的速度,d∈[1,...,D],
Figure BDA0003338687100000045
表示第i个粒子在第d维的位置,
Figure BDA0003338687100000046
Figure BDA0003338687100000047
是随机数向量;D是环境的维度,对于二维对抗环境D=2,三维对抗环境D=3。
优选地,所述步骤4具体为:
每个攻击机器人向计算得到的最优位置pg方向移动,如果该机器人与最优位置pg的距离小于一个时间片内攻击机器人移动的最大距离
Figure BDA0003338687100000048
则攻击机器人移动到最优位置pg;否则,向最优位置pg方向移动
Figure BDA0003338687100000049
距离;在机器人移动过程中,如果其下一时间片所处位置的警戒区域中存在其它机器人则将其移动方向逆时针旋转a度,当旋转次数超过预设次数之后,如果机器人仍然无法找到合适的无碰撞路径,则停留在当前位置,直到下一个时间片;
如果攻击机器人在移动过程中有敌军进入其攻击范围,则选择距离其最近的敌军攻击;如果攻击机器人的态势优于敌方机器人,其会向敌方机器人移动并发起攻击,即攻击机器人离敌方机器人越近,其适应度越高;相反,如果攻击机器人的态势劣于敌方机器人,则其距离敌方机器人越近,其适应度越低;
进攻机器人和其友军处于协作关系并组成一个小组来攻击敌方机器人群,进攻机器人距离其友军越近,其适应度就越高。
与现有技术相比,本发明具有以下优点:
1)本发明中群体机器人利用自身携带的传感器感知周围环境来自身的运动,不依赖全局导航系统;每个机器人构建各自的坐标系,通过获取周围智能体的相对坐标实现协同与对抗,不依赖全局定位系统;
2)本发明中机器人的适应度函数融合了友方、敌方和敌方领土的信息,实现了机器人在协同与对抗环境的控制;
3)与强化学习方法相比,本发明采用的基于粒子群算法的群体机器人分布式控制具备无需预训练、可扩展性强的优势。
附图说明
图1为拒止环境下基于粒子群算法的群体机器人控制方法流程图。
图2为进攻机器人的直角坐标系示例图;
图3为进攻机器人A1的适应度模型示例;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本实施例提供了一种拒止环境下基于粒子群算法的群体机器人进攻方法,如图1所示,包括以下步骤:
步骤1、建立拒止环境下的攻防对抗场景,设置N个进攻群体机器人的位置、M个防守群体机器人的位置、敌方领土的位置坐标,设所有机器人属性相同,具备10点血量,当机器人受到攻击时血量减1,当机器人血量小于等于0时,即该机器人被消灭;初始化粒子群算法的粒子初始个数
Figure BDA0003338687100000051
加速因子c1与c2,惯性权重w以及问题的维度D;所有机器人的属性相同,均具备10点血量,当机器人受到攻击时血量减1,当机器人血量小于等于0时,即该机器人被消灭。
步骤2、进攻机器人通过传感器探测周围环境,获取友方机器人和敌方机器人的态势信息,并利用惯性导航技术实时计算敌方领土的位置
Figure BDA0003338687100000052
步骤3、所述进攻机器人利用探测到的周围环境信息构建包含敌军机器人状态信息、友军机器人状态信息和敌方领土信息的适应度函数;
如图2所示,每个进攻机器人Ai以自己的位置为坐标原点,以移动方向为横轴的正方向,构建自己的直角坐标系;其中Qj、Pk和U分别是第j个防御者、第k个攻击者和领土的坐标,进攻机器人Ai通过使用其传感器感知环境来获得Qj和Pk
每个进攻机器人在初始化位置时已知敌方领土的坐标U,在机器人移动过程中应用惯性导航技术实时计算敌方领土的大致坐标
Figure BDA0003338687100000066
对于每个进攻机器人,其适应度函数包括三部分信息:敌军机器人的状态信息、友军机器人的状态信息和敌方领土信息;
所述进攻机器人Ai的适应度函数Fi的计算公式为:
Fi=f1+f2+f3
其中,f1是根据敌军机器人状态信息构建的对抗适应度,f2是根据友军机器人状态信息构建的协作适应度,f3是敌方领土适应度。
1)构建攻击机器人的对抗适应度函数f1
如果攻击机器人的态势优于敌方机器人,其会向敌方机器人移动并发起攻击。将这种情况映射到适应度函数模型中,即攻击机器人离敌方机器人越近,其适应度越高。相反,如果攻击机器人的态势劣于敌方机器人,则其距离敌方机器人越近,其适应度越低。利用类高斯分布来构建此对抗适应度函数模型。攻击机器人的对抗适应度函数f1为:
Figure BDA0003338687100000061
其中Ψ是攻击机器人Ai邻域范围R1内所有敌方机器人的索引fBk是根据第k个敌方机器人状态信息生成的子适应度函数。
Figure BDA0003338687100000062
是第k个敌方机器人的坐标;x=(x1,x2)是自变量,表示直角坐标系中某个位置的坐标;σ1和w1分别定义了类高斯模型的宽度和幅度。
Figure BDA0003338687100000063
S(i,k)是衡量第i个攻击机器人Ai的态势是否优于敌方机器人Bk的指标。机器人的态势是根据其友军的数量和总血量计算得到,其中“-1”和“1”分别代表Ai处于不利和有利态势;Ni
Figure BDA0003338687100000064
是Ai攻击范围R0内的攻击机器人(包括攻击者Ai)的数量和总血量值;Mk
Figure BDA0003338687100000065
分别是Bk攻击范围R0内的敌方机器人数量和总血量值。当S(i,k)=-1时,fBk是一个山谷形函数。这意味着Ai离Bk越远,Ai的适应度越高。当S(i,k)=1时,fBk是一个山峰形函数。这意味着Ai与Bk越接近,Ai的适应度越高。S(i,k)决定了Ai是向Bk移动还是后退。
2)构建进攻机器人Ai的协作适应度函数f2
进攻机器人和其友军处于协作关系并组成一个小组来攻击敌方机器人群。将这种情况映射到适应度函数模型中,即进攻机器人距离其友军越近,它的适应度就越高。进攻机器人Ai的协作适应度函数f2为:
Figure BDA0003338687100000071
其中Φ是Ai邻域范围R1内中所有友军的索引。fAk是根据第k个进攻机器人状态信息生成的子适应度函数,其中
Figure BDA0003338687100000072
是第k个攻击者的坐标。值得注意的是,根据f2,攻击机器人群体会动态地形成小组。如果Ai在τ个时间片内,面对周围的敌方机器人一直处于劣势,则Ai需要摆脱其同伴的约束并退出群体,此时将f2设置为0,Ai独立行动来搜索更好的攻击位置。当Ai与其友军Ak之间的距离小于阈值Δ=10|Ψ|时,fAk设置为0以避免两个进攻机器人发生碰撞。
3)根据敌方领土的位置信息构建适应度函数f3
由于进攻机器人的目标是进入敌方领土,其距离敌方领土越近,适应度越高。因此,适应度函数f3为:
Figure BDA0003338687100000073
其中U=(U1,U2)是敌方领土中心位置的坐标。
图3是进攻机器人A1的适应度模型示例,其中两个菱形表示A1和A2,三个三角形是敌方机器人B1、B2和B3,星型是敌方领土T。其中A1和A2之间是合作关系,A1和B1、B2和B3之间的关系是对抗性关系。该适应度模型应用到粒子群算法中优化得到拒止环境下的群体机器人攻击策略,以指导进攻机器人的移动与攻击。
步骤4、利用粒子群算法优化所述适应度函数,得到该进攻机器人的最优占位,并指导该进攻机器人在下一时间片的移动与攻击;
在每个时间片中,执行粒子群算法PSO优化进攻机器人Ai在其当前情况下的最佳位置pg。由于攻击者的移动距离在一个时间片内是有限的,而且环境是动态变化的,所以它只需要在其邻域R1内找到适应度最好的位置。
因此,粒子群算法PSO的搜索空间被约束在以进攻机器人Ai的坐标为中心,R1为半径的圆形区域内。
优化适应度函数的速度和位置更新公式如下:
Figure BDA0003338687100000074
Figure BDA0003338687100000081
其中,c1,c2是常数加速因子,w是惯性权重,
Figure BDA0003338687100000082
表示第i个粒子在第d维的速度,d∈[1,...,D],
Figure BDA0003338687100000083
表示第i个粒子在第d维的位置,
Figure BDA0003338687100000084
Figure BDA0003338687100000085
是随机数向量;D是环境的维度,对于二维对抗环境D=2,三维对抗环境D=3;
步骤5、进攻机器人进行移动与攻击操作;
每个机器人向计算得到的最优位置pg方向移动,如果该机器人与最优位置pg的距离小于一个时间片内机器人移动的最大距离
Figure BDA0003338687100000086
则机器人移动到最优位置pg;否则向pg方向移动
Figure BDA0003338687100000087
距离。
在移动过程中,如果机器人在移动过程中有敌军进入其攻击范围,则选择距离其最近的敌军攻击。在机器人移动过程中如果其下一时间片所处位置的警戒区域中存在其它机器人则将其移动方向逆时针旋转15度,在一系列的旋转之后(23次)如果机器人仍然无法找到合适的无碰撞路径,则停留在当前位置,直到下一个时间片。
步骤6、如果存在一个进攻机器人进入敌方领土,则任务完成;否则判断是否达到最大运行时间,如果是,则任务失败;否则转到步骤2进行下一时间片的迭代。
为了更直观的验证本发明在群体机器人领土入侵问题中的性能,与以下三个应用于敌方机器人群体的算法进行了对抗实验:
(1)基于规则的算法,敌方机器人总是向领土和距离自己最近的进攻机器人的中点位置移动,对进攻机器人进行拦截。
(2)DPSO攻击任务分配算法,“Cooperative multi-task assignment formultiple UAVs,”Electronics Optics&Control,vol.24,no.1,pp.46-50,2017.
(3)SDPSO攻击任务分配算法,“UAV cooperation multi-task assignment basedon discrete particle swarm optimization algorithm,”Computer Simulation,vol.35,no.2,pp.22-28,2018.
算法的对抗结果如表1所示。
表1
Figure BDA0003338687100000088
Figure BDA0003338687100000091
很明显,当进攻机器人群体和敌方机器人群体的数量相同时,应用PSO-AS方法的进攻机器人群体获胜率为100%。当进攻机器人群体的数量只有敌方机器人群体的75%时,所提出的方法仍然具有大于50%的获胜成功率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,该方法包括以下步骤:
步骤1、建立拒止环境下的攻防对抗场景,并初始化粒子群算法的参数;
步骤2、进攻机器人通过传感器探测周围环境信息,获取友方机器人和敌方机器人的态势信息,并利用惯性导航技术实时计算敌方领土的位置
Figure FDA0003338687090000011
步骤3、所述进攻机器人利用探测到的周围环境信息构建包含敌军机器人状态信息、友军机器人状态信息和敌方领土信息的适应度函数;
步骤4、利用粒子群算法优化所述适应度函数,得到所述进攻机器人的最优占位,并指导所述进攻机器人在下一时间片的移动与攻击;
步骤5、所述进攻机器人进行移动与攻击操作;
步骤6、如果存在一个进攻机器人进入敌方领土,则任务完成;否则判断是否达到最大运行时间,如果是,则任务失败;否则转到步骤2进行下一时间片的迭代。
2.根据权利要求1所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述步骤1中建立拒止环境下的攻防对抗场景,并初始化粒子群算法的参数,具体为:初始化N个进攻机器人的位置、M个防守机器人的位置以及敌方领土的GPS定位坐标U;初始化粒子群算法中的粒子初始个数
Figure FDA0003338687090000013
加速因子c1与c2,惯性权重w和问题的维度D;
所有机器人的属性相同,均具备P点血量,当机器人受到攻击时血量减p,当机器人血量小于等于0时,即该机器人被消灭。
3.根据权利要求1所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述步骤2具体为:每个进攻机器人根据自己的位置和移动方向构建坐标系;通过传感器探测周围环境信息,获取友方机器人和敌方机器人的坐标,并利用惯性导航技术实时计算敌方领土的位置
Figure FDA0003338687090000012
4.根据权利要求1所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述步骤3中所述进攻机器人利用探测到的周围环境信息构建进攻机器人的适应度函数,具体为:进攻机器人Ai根据敌军机器人状态信息、友军机器人状态信息和敌方领土信息构建适应度函数Fi,其表达式为:
Fi=f1+f2+f3
其中,f1是根据敌军机器人状态信息构建的对抗适应度,f2是根据友军机器人状态信息构建的协作适应度,f3是敌方领土适应度。
5.根据权利要求4所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述对抗适应度函f1的表达式为:
Figure FDA0003338687090000021
其中Ψ是攻击机器人Ai邻域范围R1内所有敌方机器人的索引,
Figure FDA0003338687090000022
是根据第k个敌方机器人状态信息生成的子适应度函数;
Figure FDA0003338687090000023
是第k个敌方机器人的坐标;x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ1和w1分别定义了类高斯模型的宽度和幅度;S(i,k)是衡量第i个攻击机器人Ai的态势是否优于敌方机器人Bk的指标,决定了攻击机器人Ai是向敌方机器人Bk移动还是后退,其表达式为:
Figure FDA0003338687090000024
所述机器人的态势信息是根据友方机器人的数量和总血量计算得到,其中“-1”和“1”分别代表攻击机器人Ai处于不利和有利态势;Ni
Figure FDA0003338687090000025
分别表示攻击机器人Ai攻击范围R0内的所有友方机器人的数量和总血量值;Mk
Figure FDA0003338687090000026
分别是敌方机器人Bk攻击范围R0内的所有敌方机器人数量和总血量值;
当S(i,k)=-1时,fBk是一个山谷形函数,表示攻击机器人Ai离敌方机器人Bk越远,攻击机器人Ai的适应度越高;
当S(i,k)=1时,fBk是一个山峰形函数,表示攻击机器人Ai与敌方机器人Bk越接近,攻击机器人Ai的适应度越高。
6.根据权利要求4所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述进攻机器人Ai的协作适应度函数f2的表达式为:
Figure FDA0003338687090000027
其中Φ是攻击机器人Ai邻域范围R1内中所有友军的索引;fAk是根据第k个进攻机器人状态信息生成的子适应度函数,其中
Figure FDA0003338687090000028
是第k个攻击者的坐标;x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ2和w2分别定义了类高斯模型的宽度和幅度;
如果进攻机器人Ai在τ个时间片内,面对周围的敌方机器人一直处于劣势,则进攻机器人Ai需要摆脱其同伴的约束并退出群体,此时将协作适应度函数f2设置为0,进攻机器人Ai独立行动来搜索更好的攻击位置;
当Ai与其友军Ak之间的距离小于预设阈值Δ=10|Ψ|时,fAk设置为0,以避免两个进攻机器人发生碰撞。
7.根据权利要求4所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述攻机器人Ai的敌方领土适应度f3表达式为:
Figure FDA0003338687090000031
其中U=(U1,U2)是敌方领土中心位置的坐标,x=(x1,x2)是自变量,表示进攻机器人的直角坐标系中某个位置的坐标;σ3和w3分别定义了类高斯模型的宽度和幅度。
8.根据权利要求1所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述步骤4具体为:在每个时间片中,执行粒子群算法优化所述适应度函数,得到进攻机器人Ai在其当前情况下的最佳位置pg;所述粒子群算法的搜索空间为以进攻机器人Ai的坐标为中心,R1为半径的圆形区域内。
9.根据权利要求8所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述适应度函数的速度和位置更新表达式为:
Figure FDA0003338687090000032
Figure FDA0003338687090000033
其中,c1,c2是常数加速因子,w是惯性权重,
Figure FDA0003338687090000034
表示第i个粒子在第d维的速度,d∈[1,...,D],
Figure FDA0003338687090000035
表示第i个粒子在第d维的位置,
Figure FDA0003338687090000036
Figure FDA0003338687090000037
是随机数向量;D是环境的维度,对于二维对抗环境D=2,三维对抗环境D=3。
10.根据权利要求8所述的一种拒止环境下基于粒子群算法的群体机器人控制方法,其特征在于,所述步骤4具体为:
每个攻击机器人向计算得到的最优位置pg方向移动,如果该机器人与最优位置pg的距离小于一个时间片内攻击机器人移动的最大距离
Figure FDA0003338687090000038
则攻击机器人移动到最优位置pg;否则,向最优位置pg方向移动
Figure FDA0003338687090000039
距离;在机器人移动过程中,如果其下一时间片所处位置的警戒区域中存在其它机器人则将其移动方向逆时针旋转a度,当旋转次数超过预设次数之后,如果机器人仍然无法找到合适的无碰撞路径,则停留在当前位置,直到下一个时间片;
如果攻击机器人在移动过程中有敌军进入其攻击范围,则选择距离其最近的敌军攻击;如果攻击机器人的态势优于敌方机器人,其会向敌方机器人移动并发起攻击,即攻击机器人离敌方机器人越近,其适应度越高;相反,如果攻击机器人的态势劣于敌方机器人,则其距离敌方机器人越近,其适应度越低;
进攻机器人和其友军处于协作关系并组成一个小组来攻击敌方机器人群,进攻机器人距离其友军越近,其适应度就越高。
CN202111301771.0A 2021-11-04 2021-11-04 一种拒止环境下基于粒子群算法的群体机器人控制方法 Active CN114043476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111301771.0A CN114043476B (zh) 2021-11-04 2021-11-04 一种拒止环境下基于粒子群算法的群体机器人控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111301771.0A CN114043476B (zh) 2021-11-04 2021-11-04 一种拒止环境下基于粒子群算法的群体机器人控制方法

Publications (2)

Publication Number Publication Date
CN114043476A true CN114043476A (zh) 2022-02-15
CN114043476B CN114043476B (zh) 2023-03-31

Family

ID=80207292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111301771.0A Active CN114043476B (zh) 2021-11-04 2021-11-04 一种拒止环境下基于粒子群算法的群体机器人控制方法

Country Status (1)

Country Link
CN (1) CN114043476B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080584A2 (en) * 2006-01-11 2007-07-19 Carmel-Haifa University Economic Corp. Ltd. Uav decision and control system
CN101908097A (zh) * 2010-07-13 2010-12-08 北京航空航天大学 一种空战决策的粒子群优化方法
CN111176309A (zh) * 2019-12-31 2020-05-19 北京理工大学 一种基于球面成像的多无人机自组群互感理解方法
CN113052289A (zh) * 2021-03-16 2021-06-29 东南大学 一种基于博弈论的无人艇集群打击位置的选取方法
CN113378988A (zh) * 2021-07-06 2021-09-10 浙江工业大学 基于粒子群算法的深度学习系统鲁棒性增强方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080584A2 (en) * 2006-01-11 2007-07-19 Carmel-Haifa University Economic Corp. Ltd. Uav decision and control system
CN101908097A (zh) * 2010-07-13 2010-12-08 北京航空航天大学 一种空战决策的粒子群优化方法
CN111176309A (zh) * 2019-12-31 2020-05-19 北京理工大学 一种基于球面成像的多无人机自组群互感理解方法
CN113052289A (zh) * 2021-03-16 2021-06-29 东南大学 一种基于博弈论的无人艇集群打击位置的选取方法
CN113378988A (zh) * 2021-07-06 2021-09-10 浙江工业大学 基于粒子群算法的深度学习系统鲁棒性增强方法及装置

Also Published As

Publication number Publication date
CN114043476B (zh) 2023-03-31

Similar Documents

Publication Publication Date Title
CN112880688B (zh) 基于混沌自适应麻雀搜索算法的无人机三维航迹规划方法
De Souza et al. Decentralized multi-agent pursuit using deep reinforcement learning
CN110926477B (zh) 一种无人机航路规划及避障方法
Goldhoorn et al. Searching and tracking people with cooperative mobile robots
CN110069075B (zh) 一种仿鸽群应急避障机制的集群超机动避障方法
CN114413906A (zh) 一种基于改进粒子群优化算法的三维轨迹规划方法
CN113268076A (zh) 一种多无人机集群编队协同控制算法
CN112633415B (zh) 基于规则约束训练的无人机集群智能任务执行方法和装置
WO2007126458A2 (en) Method and system for autonomous tracking of a mobile target by an unmanned aerial vehicle
CN116225066A (zh) 一种基于混沌映射鹈鹕优化算法的无人机路径优化方法
CN114492805A (zh) 一种基于模糊推理的空战机动决策设计方法
CN117313561B (zh) 无人机智能决策模型训练方法及无人机智能决策方法
CN116360503A (zh) 一种无人机博弈对抗策略生成方法、系统及电子设备
Sabzekar et al. A deep reinforcement learning approach for uav path planning incorporating vehicle dynamics with acceleration control
CN112925317A (zh) 一种基于改进型头脑风暴优化算法的auv路径规划方法
CN116520852A (zh) 一种局部信息下的群机器人围捕多目标方法、装置及设备
CN112651486A (zh) 一种提高maddpg算法收敛速度的方法及其应用
Liu et al. Discrete pigeon-inspired optimization-simulated annealing algorithm and optimal reciprocal collision avoidance scheme for fixed-wing UAV formation assembly
Farid et al. Effective UAV patrolling for swarm of intruders with heterogeneous behavior
CN111258332A (zh) 一种无人机群编队方法
CN118113068B (zh) 一种基于改进粒子群算法的无人集群航路规划方法及系统
CN114043476A (zh) 一种拒止环境下基于粒子群算法的群体机器人控制方法
CN115686075B (zh) 一种基于粒子群和人工势场结合的无人机集群多目标协同搜索算法
Ranade et al. Quadcopter obstacle avoidance and path planning using flood fill method
CN115328190B (zh) 一种基于自适应动态规划的无人机三维动态路径规划方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant