[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111780777A - 一种基于改进a*算法和深度强化学习的无人车路径规划方法 - Google Patents

一种基于改进a*算法和深度强化学习的无人车路径规划方法 Download PDF

Info

Publication number
CN111780777A
CN111780777A CN202010670465.3A CN202010670465A CN111780777A CN 111780777 A CN111780777 A CN 111780777A CN 202010670465 A CN202010670465 A CN 202010670465A CN 111780777 A CN111780777 A CN 111780777A
Authority
CN
China
Prior art keywords
unmanned vehicle
planning
network
obstacle
cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010670465.3A
Other languages
English (en)
Other versions
CN111780777B (zh
Inventor
丘腾海
蒲志强
刘振
易建强
常红星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Taizhou Port Core Port Investment Co ltd
Original Assignee
Jiangsu Zhongke Intelligent Manufacturing Research Institute Co ltd
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhongke Intelligent Manufacturing Research Institute Co ltd, Institute of Automation of Chinese Academy of Science filed Critical Jiangsu Zhongke Intelligent Manufacturing Research Institute Co ltd
Priority to CN202010670465.3A priority Critical patent/CN111780777B/zh
Publication of CN111780777A publication Critical patent/CN111780777A/zh
Application granted granted Critical
Publication of CN111780777B publication Critical patent/CN111780777B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/3446Details of route searching algorithms, e.g. Dijkstra, A*, arc-flags, using precalculated routes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Automation & Control Theory (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

本发明属于无人车导航技术领域,具体涉及一种基于改进A*算法和深度强化学习的无人车路径规划方法,旨在充分发挥全局路径规划全局最优和局部规划实时避障的优势,以及改进A*算法的快速实时性和深度强化学习算法的复杂环境适应性,快速规划出无人车从起始点到目标点的无碰撞最优路径。本发明的规划方法包括:根据环境信息,建立初始化栅格代价地图;利用改进的A*算法规划全局路径;基于全局路径和激光雷达传感器性能,设计滑动窗口,将窗口探测的信息作为网络的状态输入;基于深度强化学习方法,采用Actor‑Critic架构,设计局部规划网络,本发明将知识和数据方法相结合,能够快速规划得到最优路径,使得无人车拥有更高的自主性。

Description

一种基于改进A*算法和深度强化学习的无人车路径规划方法
技术领域
本发明涉及无人车导航技术领域,具体为一种基于改进A*算法和深度强化学习的无人车路径规划方法。
背景技术
现如今无人车的应用场景呈现形态多样化、应用多元化和环境复杂化的趋势,比如京东仓储物流车、服务机器人、工厂安防巡逻无人车、菜鸟物流无人车等。未来这种自动化、智能化的无人系统会越来越普及。其中无人车路径规划是支撑无人车自主机动能力的核心算法之一,是解决无人车如何从起始点到目标点,使得路径最优的问题。通常情况下,要求在保证无人车自身安全的前提下,躲避障碍物,寻找一条路程最短或安全度最高的路径。路径规划问题可以分为全局路径规划和局部路径规划。前者是指基于全局地图信息,规划出一条全局最优的无碰撞路径。后者是指基于全局规划路径,解决无人车行进过程中碰到的部分未知区域或突发状态,使得无人车依然能够快速、及时、安全的到达目标点。
目前为止,国内外学者已提出很多无人车路径规划算法,全局路径规划包括A*算法、Dijkstra算法、遗传算法等。其中A*算法利用启发式信息避免Dijkstra算法的盲目性,减小了大量冗余的搜索空间,其问题在于得到的路径未考虑无人车的连续性机动减速,与障碍物距离过近,无法及时避免潜在风险,且存在路径不平滑的缺点。另外,全局路径规划依赖全局环境信息,其数据存储量和计算量较大,应用场景有限。而人工势场法、DWA算法等局部路径规划的常用算法,具有较好的实时性,但存在容易陷入局部最优的问题,且由于全局信息未知,可能丢失目标,陷入局部振荡的状态,因此,本发明设计一种基于改进A*算法和深度强化学习的无人车路径规划方法以解决现有技术中存在的问题。
发明内容
为解决现有无人车导航技术中的上述问题,本发明提出一种基于改进A*算法和深度强化学习的无人车路径规划方法,所述方法将全局路径规划与局部路径规划相结合,充分发挥全局路径规划全局最优和局部规划实时避障的优势,以及改进A*算法的快速实时性和深度强化学习算法的复杂环境适应性,在环境信息部分未知或遇见突发情况下,依然能够快速规划求解出无人车从起始点到目标点的无碰撞最优路径。本发明所采取的技术方案为:
一种基于改进A*算法和深度强化学习的无人车路径规划方法,包括以下步骤:
(1)根据环境信息,建立初始化栅格代价地图。利用SALM技术对环境进行地图建模,提取障碍物信息,标定障碍物类型,通过代价模型对障碍物周围栅格的威胁进行评估。
(2)利用改进的A*算法规划全局路径。考虑障碍物代价和路径转折点过多的问题,引入启发式信息,改进A*算法模型,优化全局规划结果;
(3)基于全局路径和激光雷达传感器性能,设计滑动窗口,将窗口探测的信息作为网络的状态输入,进行局部规划。具体步骤为:
1)根据激光雷达探测距离初始化滑动窗口大小为W,W是奇数;
2)以无人车起始位置作为滑动窗口的中心原点Ow
3)将全局规划路径序列在滑动窗口内路径段的最后一个点作为临时目标点Tw
4)当无人车到达临时目标点后,将该时刻的临时目标点作为起始点,切换滑动窗口。
(4)基于深度强化学习方法,采用Actor-Critic架构,设计局部规划网络。具体步骤如下:
1)设计局部规划网络的状态输入空间。将栅格全局坐标系下的障碍物、目标、无人车位置等信息转换到以滑动窗口中心为原点的局部坐标系下,并将其作为局部规划网络的状态输入s,表达式如下所示,组成状态空间S:
Figure BDA0002582097620000031
其中,sl表示激光雷达传感器所有探针测得的障碍物距离向量,sl={l1,l1,…lN},l1…lN表示探针测得的距离,N表示激光雷达传感器的探针数量,
Figure BDA0002582097620000032
分别表示滑动窗口局部坐标系下临时目标点的坐标,px、,py分别表示无人车在局部坐标系下的x、y轴坐标,vx、vy分别表示无人车在局部坐标系下的x、y轴的速度分量。
2)设计无人车在局部规划网络的决策动作空间。在滑动窗口局部坐标系下,将无人车机动方向动作分为前、后、左、右、左前、左后、右前、右后等八个候选动作
Figure BDA0002582097620000033
无人车机动速率动作分为
Figure BDA0002582097620000034
五个离散候选速率动作,于是无人车决策动作表达式如下,组成动作空间A:
a={ad,av}
3)结合栅格代价地图,设计局部规划网络的回报函数r。具体表达式如下所示:
Figure BDA0002582097620000041
其中,dt、dt-1分别表示当前时刻与前一时刻无人车与临时目标点的距离,v表示无人车在滑动窗口的机动速度,
Figure BDA0002582097620000042
dt表示时间间隔,λ1、λ2表示奖惩系数,
Figure BDA0002582097620000043
表示当无人车与滑动窗口临时目标点的距离随时间变大时,给予无人车负的惩罚;
Figure BDA0002582097620000044
表示当无人车与滑动窗口临时目标点的距离随时间变小时,给予无人车正的奖励;rs表示无人车每走一步,根据栅格代价地图得到的惩罚;rc表示碰到障碍物时的惩罚;ra表示到达临时目标点时的惩罚。
4)采用Actor-Critic架构,设计局部规划网络,并训练网络模型。将网络结构分为策略网络和价值网络。所述策略网络用于预测无人车的下一步动作,包括障碍物第一特征提取模块、目标引导模块和第一全连接层模块;所述价值网络用于对策略网络选择的动作评分,通过第二特征提取模块提取无人车状态和动作,再由第二全连接层模块计算综合价值,评估动作的好坏程度,反馈给策略网络。采用课程训练的方式,逐步增加训练环境的复杂程度,直至训练误差小于ε,结束网络模型的训练。
(5)结合全局规划路径,将训练好的局部规划网络模型应用于无人车导航。
优选地,“根据环境信息,建立初始化栅格代价地图”,其方法为:利用SALM技术对环境进行地图建模,提取障碍物信息,标定障碍物类型,通过代价模型对障碍物周围栅格的威胁进行评估。具体包括如下:
1)定义全局坐标系,通过SLAM技术提取环境障碍信息、目标信息和无人车自身信息,并将其转换到统一的全局坐标系,根据环境对象的尺寸比例进行栅格地图建模;
2)标定障碍物类型,设计障碍物威胁评估模型,初始化栅格代价地图,当前节点n的综合代价表达式具体如下:
r:
其中,rB(n)表示无人车与障碍物碰撞的威胁代价,保证栅格距离障碍物越近,需要的成本代价越高;rE(n)表示无人车机动的能耗代价,行进的距离越长,消耗的能力越大;对于松软或者坎坷的路面,无人车需要更大的能量输出,具体如下所示:
Figure BDA0002582097620000051
rE(r
其中C为障碍物致命区代价,l(n)表示在当前节点n无人车与障碍物的距离,μ表示障碍物威胁系数,当距离超过L3时为安全区域;Cn,n+1表示从栅格n到栅格n+1路面的坎坷程度,dn,n+1为移动栅格之间的距离,wk、wv分别为两部分所占的权重。
优选地,所述“利用改进的A*算法规划全局路径”,其方法为:
所述改进的A*算法路径评价公式为F(n)=G(n)+H(n)+T(n),其中G(n)表示在栅格代价地图下无人车从起始节点到当前节点n的实际代价,
Figure BDA0002582097620000061
H(n)表示在栅格代价地图下无人车从当前节点到目标点的估计代价,可采用曼哈顿距离计算,T(n)表示从起始点到当前节点的转弯代价:
Figure BDA0002582097620000062
在栅格代价地图上,通过改进的A*算法规划全局路径,。
附图说明
图1是本发明一种基于改进A*算法和深度强化学习的无人车路径规划方法的流程图;
图2是基于传统A*算法的无人车路径规划结果;
图3是本发明一种基于改进A*算法和深度强化学习的无人车路径规划方法的策略网络结构图;
图4是本发明一种基于改进A*算法和深度强化学习的无人车路径规划方法的价值网络结构图;
图5是本发明栅格代价地图与基于改进A*算法和深度强化学习的无人车路径规划方法的规划结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了更加清晰地对本发明一种基于改进A*算法和深度强化学习的无人车路径规划方法进行说明,下面结合附图1对本发明方法一种实施例中各步骤进行详述。包括以下步骤:
(1)根据环境信息,建立初始化栅格代价地图。利用SALM技术对环境进行地图建模,提取障碍物信息,标定障碍物类型,通过代价模型对障碍物周围栅格的威胁进行评估。具体地,具体包括如下:
1)定义全局坐标系,通过SLAM技术提取环境障碍信息、目标信息和无人车自身信息,并将其转换到统一的全局坐标系,根据环境对象的尺寸比例进行栅格地图建模;
S11:假定选择商业级激光雷达A0602,角度分辨率为0.5°,计算无人车姿态与第i个探针的夹角为
Figure BDA0002582097620000071
探针探测到的障碍物距离为li
S12:探测到的障碍物点转化到全局坐标系的表达式为:
Figure BDA0002582097620000072
其中,θU表示无人车在全局坐标系上的前进方向,
(xU,yU)是指无人车在全局坐标系上的坐标,(xi,yi)表示尚未考虑障碍物尺寸的全局坐标。
S13:将障碍物点坐标转化成实际尺寸分辨率的栅格化地图坐标:
Figure BDA0002582097620000081
其中,w=4表示栅格地图分辨率,与无人车物理尺寸和实际环境有关,(Xi,Yi)表示障碍物在栅格地图的坐标。
2)标定障碍物类型,设计障碍物威胁评估模型,初始化栅格代价地图,当前节点n的综合代价表达式具体如下:
r:
其中,α1=0.8、α2=0.2表示障碍物碰撞代价与能耗代价的权重,rB(n)表示无人车与障碍物碰撞的威胁代价,保证栅格距离障碍物越近,需要的成本代价越高;rE(n)表示无人车机动的能耗代价,行进的距离越长,消耗的能力越大;对于松软或者坎坷的路面,无人车需要更大的能量输出,具体如下所示:
Figure BDA0002582097620000082
rE(r
其中C为障碍物致命区代价,l(n)表示在当前节点n无人车与障碍物的距离,μ表示障碍物威胁系数,与障碍物类型有关,当距离超过
L3时为安全区域;Cn,n+1表示从栅格n到栅格n+1路面的坎坷程度,dn,n+1为移动栅格之间的距离,wk、wk分别为两部分所占的权重。
(2)利用改进的A*算法规划全局路径。考虑障碍物代价和路径转折点过多的问题,引入启发式信息,改进A*算法模型,优化全局规划结果。具体步骤如下:
所述改进的A*算法路径评价公式为F(n)=G(n)+H(n)+T(n),其中G(n)表示在栅格代价地图下无人车从起始节点到当前节点n的实际代价,
Figure BDA0002582097620000091
H(n)表示在栅格代价地图下无人车从当前节点到目标点的估计代价,可采用曼哈顿距离计算,T(n)表示从起始点到当前节点的转弯代价:
Figure BDA0002582097620000092
在栅格代价地图上,通过改进的A*算法规划全局路径。
S21:读取无人车起始点ns和目标点ng,创建两个空的链表集合:OPEN表和CLOSED表。并将起始点ns加入到链表OPEN表,基于上文模型,初始化栅格地图代价;
S22:判断链表OPEN表是否为空,若为空,则停止搜索,否则继续执行;
S23:计算链表OPEN中所有节点的F(n),并将值最小的节点n作为当前节点,加入到链表CLOSED表中,并判断当前节点n是否为目标点ng,如果满足条件,则表示搜索成功,反向输出路径节点;否则,继续如下步骤;
S24:将当前节点n周围的节点扩展为子节点,如果子节点m不在OPEN表中,则将节点m加入到OPEN表,并将当前节点n作为节点m的父节点,当扩展到目标点ng时,根据各节点的父节点反向遍历找到起始点ns,得到最优路径;如果子节点在OPEN表中,则计算G(m),与OPEN表中的旧值进行比较,如果小于旧值,则将当前节点设置为该节点的父节点;如果子节点在CLOSED表中,则跳过该节点,继续搜索其余节点;
S25:跳转到步骤S22继续执行,直到寻找到目标点ng或OPEN表为空,结束搜索。
(3)基于全局路径和激光雷达传感器性能,设计滑动窗口,将窗口探测的信息作为网络的状态输入,进行局部规划。具体步骤为:
S31:根据激光雷达探测距离初始化滑动窗口大小。假定选择商业级激光雷达A0602,其最大扫描距离为8米,角度分辨率为0.5°,则滑动窗口大小为7×7,且激光雷达与无人车中心重合,每个扫描周期接收周围最多约700组数据;
S32:以无人车起始位置作为滑动窗口的中心原点Ow
S33:将全局规划得到的路径序列与滑动窗口相交的第一个节点作为局部路径规划网络的临时目标点Tw和状态输入量;
S34:当无人车到达临时目标点后,将该时刻的临时目标点作为起始点,切换滑动窗口,直至到达目标点ng
(4)基于深度强化学习方法,采用Actor-Critic架构,设计局部规划网络。具体步骤如下:
1)设计局部规划网络的状态输入空间。将栅格全局坐标系下的障碍物、目标、无人车位置等信息转换到以滑动窗口中心为原点的局部坐标系下,并将其作为局部规划网络的状态输入s,表达式如下所示,组成状态空间S:
Figure BDA0002582097620000111
其中,sl表示激光雷达传感器所有探针测得的障碍物距离向量,sl={l1,l1,…lN},l1…lN表示探针测得的距离,N表示激光雷达传感器的探针数量,假定N=700,
Figure BDA0002582097620000112
分别表示滑动窗口局部坐标系下临时目标点的坐标,如图5所示中的①②③④表示临时目标点,px、,py分别表示无人车在局部坐标系下的x、y轴坐标,vx、vy分别表示表示无人车在局部坐标系下的x、y轴的速度分量。
2)设计无人车在局部规划网络的决策动作空间。在滑动窗口局部坐标系下,将无人车机动方向动作分为前、后、左、右、左前、左后、右前、右后等八个候选机动动作
Figure BDA0002582097620000113
无人车机动速率动作分为
Figure BDA0002582097620000114
五个离散候选速率动作,于是无人车决策动作表达式a如下所示,所有动作组成动作空间A:
a={ad,av}
3)结合栅格代价地图,设计局部规划网络的回报函数r。深度强化学习中回报函数设计的好坏对学习系统性能有着重要作用,它决定强化学习算法的收敛速度和程度。具体表达式如下所示:
Figure BDA0002582097620000121
其中,dt、dt-1分别表示当前时刻与前一时刻无人车与临时目标点的距离,v表示无人车在滑动窗口的机动速度,
Figure BDA0002582097620000122
dt表示时间间隔,λ1=0.5、λ2=0.5表示奖惩系数,
Figure BDA0002582097620000123
表示当无人车与滑动窗口临时目标点的距离随时间变大时,给予无人车负的惩罚;
Figure BDA0002582097620000124
表示当无人车与滑动窗口临时目标点的距离随时间变小时,给予无人车正的奖励;rs表示无人车每走一步,根据栅格代价地图得到的惩罚,包括障碍物的威胁代价和无人车机动的能耗代价;rc=-2表示无人车碰到障碍物时的惩罚;ra=5表示无人车到达临时目标点时的奖励。
4)采用Actor-Critic架构,设计局部规划网络,并训练网络模型。
将网络结构分为策略网络和价值网络,如图3和图4所示。所述策略网络用于预测无人车的下一步动作,包括障碍物第一特征提取模块41、目标引导模块42和第一全连接层模块43。其中第一特征提取模块41包括三个全连接层,激活函数为ReLu,神经元个数分别为350、200、200,输入为激光雷达探测信息sl以及无人车当前位姿信息so;目标引导模块42包括三个全连接层,激活函数都为ReLu,神经元个数分别为250、200、200,输入为无人车当前位姿信息so以及临时目标点信息sT;第一全连接层模块包括一个LSTM层,三个全连接层,结合前面两个模块提取的特征信息,预测无人车下一个动作。
所述价值网络用于对策略网络选择的动作评分,通过第二特征提取模块44提取无人车状态和动作特征,再由第二全连接层模块45计算综合价值,评估动作的好坏程度,反馈给策略网络。其中第二特征提取模块44输入为激光雷达探测信息、无人车当前位姿和临时目标点信息组成的状态s、策略网络预测的无人车下一个动作an以及网络偏移量b,模块包括两个卷积层,激活函数是ReLu,一个LSTM层,用于增强网络的记忆能力,第二全连接层模块包括3个全连接网络,用于计算动作的评价值。
局部路径规划网络模型的训练采用异步执行多个无人车仿真智能体,通过并行训练的方式经历不同状态,去除训练过程中产生的状态转移样本之间的关联性,主网络负责存储训练参数,子网络是主网络的副本,结构与主网络一致,负责网络模型的训练。优化算法采用Adam算法,基于训练数据迭代地更新神经网络权重。同时,通过课程训练的方式,逐步增加训练环境的复杂程度,直至训练误差小于ε=0.01,结束网络模型的训练。
(5)结合全局规划路径,将训练好的局部规划网络模型应用于无人车导航。具体步骤如下:
S51:根据环境信息,通过SLAM技术提取障碍物信息,并基于障碍物威胁代价模型及能耗代价模型,建立栅格化代价地图;
S52:利用改进的A*算法,考虑栅格代价和转弯代价,规划出全局最优路径;
S53:以无人车起始位置为原点,设计滑动窗口,将滑动窗口与全局最优路径的相交点作为局部路径规划网络的临时目标点;
S54:将激光雷达探测的状态信息输入到训练好的基于改进A*算法和深度强化学习的局部规划网络规划局部路径,输出最终的最优路径。
综上所述,本发明提出一种基于改进A*算法和深度强化学习的无人车路径规划方法,利用SLAM技术提取环境信息,通过障碍物威胁代价模型和能耗代价模型,建立栅格代价地图,并结合改进的A*算法规划出全局最优路径,同时考虑到栅格地图部分未知或突发状态,引入滑动窗口的思路,提出基于改进A*算法和深度强化学习的局部路径规划网络,通过数据驱动的规划方法,快速规划求解出无人车从起始点到目标点的无碰撞最优路。
需要说明的是,本发明的上述实施例仅仅是为了方便说明解释本发明的方法模型和算法流程,而并非是对本发明实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或改动,这里无法对所有实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进,均属于本发明权利要求的保护范围之内。

Claims (3)

1.一种基于改进A*算法和深度强化学习的无人车路径规划方法,其特征在于,包括以下步骤:
(1)根据环境信息,建立初始化栅格代价地图,利用SALM技术对环境进行地图建模,提取障碍物信息,标定障碍物类型,通过代价模型对障碍物周围栅格的威胁进行评估;
(2)利用改进的A*算法规划全局路径,考虑障碍物代价和路径转折点过多的问题,引入启发式信息,改进A*算法模型,优化全局规划结果;
(3)基于全局路径和激光雷达传感器性能,设计滑动窗口,将窗口探测的信息作为网络的状态输入,进行局部规划,具体步骤为:
1)根据激光雷达探测距离初始化滑动窗口大小为W,W是奇数;
2)以无人车起始位置作为滑动窗口的中心原点Ow
3)将全局规划得到的路径序列与滑动窗口相交的第一个节点作为局部路径规划网络的临时目标点Tw和状态输入量;
4)当无人车到达临时目标点后,将该时刻的临时目标点作为起始点,切换滑动窗口;
(4)基于深度强化学习方法,采用Actor-Critic架构,设计局部规划网络,具体步骤如下:
1)设计局部规划网络的状态输入空间,将栅格全局坐标系下的障碍物、目标、无人车位置等信息转换到以滑动窗口中心为原点的局部坐标系下,并将其作为局部规划网络的状态输入s,表达式如下所示,组成状态空间S:
Figure FDA0002582097610000011
其中,sl表示激光雷达传感器所有探针测得的障碍物距离向量,sl={l1,l1,…lN},l1…lN表示探针测得的距离,N表示激光雷达传感器的探针数量,
Figure FDA0002582097610000021
分别表示滑动窗口局部坐标系下临时目标点的坐标,px、,py分别表示无人车在局部坐标系下的x、y轴坐标,vx、vy分别表示表示无人车在局部坐标系下的x、y轴的速度分量;
2)设计无人车在局部规划网络的决策动作空间,在滑动窗口局部坐标系下,将无人车机动方向动作分为前、后、左、右、左前、左后、右前、右后等八个候选动作
Figure FDA0002582097610000022
无人车机动速率动作分为
Figure FDA0002582097610000023
五个离散候选速率动作,于是无人车决策动作表达式如下,组成动作空间A:
a={ad,av}
3)结合栅格代价地图,设计局部规划网络的回报函数r,具体表达式如下所示:
Figure FDA0002582097610000024
其中,dt、dt-1分别表示当前时刻与前一时刻无人车与临时目标点的距离,v表示无人车在滑动窗口的机动速度,
Figure FDA0002582097610000025
dt表示时间间隔,λ1、λ2表示奖惩系数,
Figure FDA0002582097610000031
表示当无人车与滑动窗口临时目标点的距离随时间变大时,给予无人车负的惩罚;
Figure FDA0002582097610000032
表示当无人车与滑动窗口临时目标点的距离随时间变小时,给予无人车正的奖励;rs表示无人车每走一步,根据栅格代价地图得到的惩罚;
rc表示碰到障碍物时的惩罚;ra表示到达临时目标点时的惩罚;
4)采用Actor-Critic架构,设计局部规划网络,并训练网络模型,将网络结构分为策略网络和价值网络,所述策略网络用于预测无人车的下一步动作,包括障碍物第一特征提取模块、目标引导模块和第一全连接层模块;所述价值网络用于对策略网络选择的动作评分,通过第二特征提取模块提取无人车状态和动作,再由第二全连接层模块计算综合价值,评估动作的好坏程度,反馈给策略网络,采用课程训练的方式,逐步增加训练环境的复杂程度,直至训练误差小于ε,结束网络模型的训练;
(5)结合全局规划路径,将训练好的局部规划网络模型应用于无人车导航。
2.根据权利要求书1所述一种基于改进A*算法和深度强化学习的无人车路径规划方法,其特征在于,“根据环境信息,建立初始化栅格代价地图”,其方法为:利用SALM技术对环境进行地图建模,提取障碍物信息,标定障碍物类型,通过代价模型对障碍物周围栅格的威胁进行评估;
1)定义全局坐标系,通过SLAM技术提取环境障碍信息、目标信息和无人车自身信息,并将其转换到统一的全局坐标系,根据环境对象的尺寸比例进行栅格地图建模;
2)标定障碍物类型,设计障碍物威胁评估模型,初始化栅格代价地图,当前节点n的综合代价表达式具体如下:
ri
其中,rB(n)表示无人车与障碍物碰撞的威胁代价,保证栅格距离障碍物越近,需要的成本代价越高;rE(n)表示无人车机动的能耗代价,行进的距离越长,消耗的能力越大;对于松软或者坎坷的路面,无人车需要更大的能量输出,具体如下所示:
Figure FDA0002582097610000041
rE(r
其中C为障碍物致命区代价,l(n)表示在当前节点n无人车与障碍物的距离,μ表示障碍物威胁系数,当距离超过L3时为安全区域;
Cn,n+1表示从栅格n到栅格n+1路面的坎坷程度,dn,n+1为移动栅格之间的距离,wk、wv分别为两部分所占的权重。
3.根据权利要求书1所述一种基于改进A*算法和深度强化学习的无人车路径规划方法,其特征在于,所述“利用改进的A*算法规划全局路径”,其方法为:所述改进的A*算法路径评价公式为F(n)=G(n)+H(n)+T(n),其中G(n)表示在栅格代价地图下无人车从起始节点到当前节点n的实际代价,
Figure FDA0002582097610000051
H(n)表示在栅格代价地图下无人车从当前节点到目标点的估计代价,可采用曼哈顿距离计算,T(n)表示从起始点到当前节点的转弯代价:
Figure FDA0002582097610000052
在栅格代价地图上,通过改进的A*算法规划全局路径。
CN202010670465.3A 2020-07-13 2020-07-13 一种基于改进a*算法和深度强化学习的无人车路径规划方法 Active CN111780777B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010670465.3A CN111780777B (zh) 2020-07-13 2020-07-13 一种基于改进a*算法和深度强化学习的无人车路径规划方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010670465.3A CN111780777B (zh) 2020-07-13 2020-07-13 一种基于改进a*算法和深度强化学习的无人车路径规划方法

Publications (2)

Publication Number Publication Date
CN111780777A true CN111780777A (zh) 2020-10-16
CN111780777B CN111780777B (zh) 2022-10-21

Family

ID=72768896

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010670465.3A Active CN111780777B (zh) 2020-07-13 2020-07-13 一种基于改进a*算法和深度强化学习的无人车路径规划方法

Country Status (1)

Country Link
CN (1) CN111780777B (zh)

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270306A (zh) * 2020-11-17 2021-01-26 中国人民解放军军事科学院国防科技创新研究院 一种基于拓扑路网的无人车轨迹预测与导航方法
CN112304318A (zh) * 2020-11-10 2021-02-02 河北工业大学 一种虚实耦合约束环境下的机器人自主导航方法
CN112362066A (zh) * 2020-11-20 2021-02-12 西北工业大学 一种基于改进的深度强化学习的路径规划方法
CN112378408A (zh) * 2020-11-26 2021-02-19 重庆大学 一种实现轮式移动机器人实时避障的路径规划方法
CN112631304A (zh) * 2020-12-24 2021-04-09 的卢技术有限公司 车辆轨迹规划方法、系统、电子设备和计算机可读存储介质
CN112633590A (zh) * 2020-12-30 2021-04-09 江苏智库智能科技有限公司 一种用于四向穿梭车的智能入库方法及系统
CN112857373A (zh) * 2021-02-26 2021-05-28 哈尔滨工业大学 一种最小化无用动作的节能性无人车路径导航方法
CN112882469A (zh) * 2021-01-14 2021-06-01 浙江大学 一种融合全局训练的深度强化学习避障导航方法
CN112906542A (zh) * 2021-02-08 2021-06-04 北京理工大学 一种基于强化学习的无人车避障方法及装置
CN112947484A (zh) * 2021-03-31 2021-06-11 哈尔滨工业大学(深圳) 一种密集行人环境下移动机器人的视觉导航方法及装置
CN113064424A (zh) * 2021-03-17 2021-07-02 西安工业大学 一种改进ddpg算法的无人车路径规划方法
CN113110509A (zh) * 2021-05-17 2021-07-13 哈尔滨工业大学(深圳) 一种基于深度强化学习的仓储系统多机器人路径规划方法
CN113108796A (zh) * 2021-04-19 2021-07-13 北京有竹居网络技术有限公司 导航方法、装置、存储介质及设备
CN113139644A (zh) * 2021-03-24 2021-07-20 北京科技大学顺德研究生院 一种基于深度蒙特卡洛树搜索的信源导航方法及装置
CN113177664A (zh) * 2021-05-20 2021-07-27 的卢技术有限公司 一种以安全性、距离代价为约束的自学习路径规划方法
CN113218400A (zh) * 2021-05-17 2021-08-06 太原科技大学 一种基于深度强化学习的多智能体导航算法
CN113378390A (zh) * 2021-06-15 2021-09-10 浙江大学 一种基于深度学习的地外星表通行性分析方法及系统
CN113433937A (zh) * 2021-06-08 2021-09-24 杭州未名信科科技有限公司 基于启发式探索的分层导航避障系统、分层导航避障方法
CN113778097A (zh) * 2021-09-15 2021-12-10 龙岩学院 L型路径趋势改进a-star算法的智能仓储物流机器人路径规划方法
CN113791627A (zh) * 2021-11-16 2021-12-14 中国科学院自动化研究所 一种机器人导航方法、设备、介质和产品
CN113819917A (zh) * 2021-09-16 2021-12-21 广西综合交通大数据研究院 自动驾驶路径规划方法、装置、设备及存储介质
CN113867334A (zh) * 2021-09-07 2021-12-31 华侨大学 一种移动机械无人驾驶的路径规划方法和系统
CN114169628A (zh) * 2021-12-14 2022-03-11 西南交通大学 基于a*算法和遗传算法的舰载机调度优化方法及系统
CN114200830A (zh) * 2021-11-11 2022-03-18 辽宁石油化工大学 一种多智能体一致性强化学习控制方法
CN114281084A (zh) * 2021-12-28 2022-04-05 太原市威格传世汽车科技有限责任公司 一种基于改进a*算法的智能车全局路径规划方法
CN114326744A (zh) * 2021-12-31 2022-04-12 安徽海博智能科技有限责任公司 一种基于全局地图更新的矿山卡车路径规划方法
CN114442674A (zh) * 2020-11-04 2022-05-06 北京猎户星空科技有限公司 目标跟踪方法、装置、电子设备和计算机可读存储介质
CN114442633A (zh) * 2022-01-28 2022-05-06 天津优控智行科技有限公司 一种无人驾驶园区物流车局部路径规划方法
CN114611382A (zh) * 2022-02-23 2022-06-10 西北大学 一种无人车避障导航全局局部路线的选择算法
CN114706400A (zh) * 2022-04-12 2022-07-05 重庆文理学院 一种越野环境下基于改进的a*算法的路径规划方法
CN114723154A (zh) * 2022-04-18 2022-07-08 淮阴工学院 一种智慧超市
CN114812581A (zh) * 2022-06-23 2022-07-29 中国科学院合肥物质科学研究院 一种基于多传感器融合的越野环境导航方法
CN114815828A (zh) * 2022-04-25 2022-07-29 复旦大学 一种强化学习结合循环网络的机器人路径规划及控制方法
CN115167478A (zh) * 2022-08-23 2022-10-11 山东大学 基于深度强化学习的机器人无地图路径规划方法及系统
CN115268467A (zh) * 2022-09-26 2022-11-01 江苏天一航空工业股份有限公司 一种行李车的导航控制系统及控制方法
CN115309163A (zh) * 2022-08-26 2022-11-08 南京理工大学 基于改进方向评价函数dwa算法的局部路径规划方法
CN115328195A (zh) * 2022-07-24 2022-11-11 哈尔滨工业大学(威海) 不确定环境下无人机与无人车双层路径规划算法
CN115562290A (zh) * 2022-10-20 2023-01-03 南京航空航天大学 一种基于a星惩罚控制优化算法的机器人路径规划方法
WO2023024542A1 (zh) * 2021-08-25 2023-03-02 驭势科技(北京)有限公司 车辆决策规划方法、装置、设备及介质
CN115752490A (zh) * 2022-09-29 2023-03-07 太原理工大学 基于大数据和定位技术的安全出行路径优化方法及系统
CN115782867A (zh) * 2022-11-17 2023-03-14 上海西井信息科技有限公司 轨迹碰撞风险评估方法、装置、电子设备和存储介质
CN115824216A (zh) * 2022-11-22 2023-03-21 苏州数智赋农信息科技有限公司 一种养猪场喂食车自适应控制方法及系统
CN116069023A (zh) * 2022-12-20 2023-05-05 南京航空航天大学 一种基于深度强化学习的多无人车编队控制方法和系统
CN117685994A (zh) * 2024-02-04 2024-03-12 北京航空航天大学 一种空地协同的无人车路径规划方法
CN118494468A (zh) * 2024-07-17 2024-08-16 罗普特科技集团股份有限公司 基于人工智能的车辆控制方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040239756A1 (en) * 2003-05-30 2004-12-02 Aliaga Daniel G. Method and apparatus for computing error-bounded position and orientation of panoramic cameras in real-world environments
CN103365299A (zh) * 2013-08-02 2013-10-23 中国科学院自动化研究所 一种无人机的避障方法及其装置
CN108444482A (zh) * 2018-06-15 2018-08-24 东北大学 一种无人机自主寻路避障方法及系统
CN108803615A (zh) * 2018-07-03 2018-11-13 东南大学 一种基于深度强化学习的虚拟人未知环境导航算法
CN109945873A (zh) * 2019-04-04 2019-06-28 东南大学 一种用于室内移动机器人运动控制的混合路径规划方法
CN110083165A (zh) * 2019-05-21 2019-08-02 大连大学 一种机器人在复杂狭窄环境下路径规划方法
CN111061277A (zh) * 2019-12-31 2020-04-24 歌尔股份有限公司 一种无人车全局路径规划方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040239756A1 (en) * 2003-05-30 2004-12-02 Aliaga Daniel G. Method and apparatus for computing error-bounded position and orientation of panoramic cameras in real-world environments
CN103365299A (zh) * 2013-08-02 2013-10-23 中国科学院自动化研究所 一种无人机的避障方法及其装置
CN108444482A (zh) * 2018-06-15 2018-08-24 东北大学 一种无人机自主寻路避障方法及系统
CN108803615A (zh) * 2018-07-03 2018-11-13 东南大学 一种基于深度强化学习的虚拟人未知环境导航算法
CN109945873A (zh) * 2019-04-04 2019-06-28 东南大学 一种用于室内移动机器人运动控制的混合路径规划方法
CN110083165A (zh) * 2019-05-21 2019-08-02 大连大学 一种机器人在复杂狭窄环境下路径规划方法
CN111061277A (zh) * 2019-12-31 2020-04-24 歌尔股份有限公司 一种无人车全局路径规划方法和装置

Cited By (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114442674A (zh) * 2020-11-04 2022-05-06 北京猎户星空科技有限公司 目标跟踪方法、装置、电子设备和计算机可读存储介质
CN112304318A (zh) * 2020-11-10 2021-02-02 河北工业大学 一种虚实耦合约束环境下的机器人自主导航方法
CN112270306A (zh) * 2020-11-17 2021-01-26 中国人民解放军军事科学院国防科技创新研究院 一种基于拓扑路网的无人车轨迹预测与导航方法
CN112270306B (zh) * 2020-11-17 2022-09-30 中国人民解放军军事科学院国防科技创新研究院 一种基于拓扑路网的无人车轨迹预测与导航方法
CN112362066A (zh) * 2020-11-20 2021-02-12 西北工业大学 一种基于改进的深度强化学习的路径规划方法
CN112378408A (zh) * 2020-11-26 2021-02-19 重庆大学 一种实现轮式移动机器人实时避障的路径规划方法
CN112631304A (zh) * 2020-12-24 2021-04-09 的卢技术有限公司 车辆轨迹规划方法、系统、电子设备和计算机可读存储介质
CN112633590A (zh) * 2020-12-30 2021-04-09 江苏智库智能科技有限公司 一种用于四向穿梭车的智能入库方法及系统
CN112633590B (zh) * 2020-12-30 2024-04-30 江苏智库智能科技有限公司 一种用于四向穿梭车的智能入库方法及系统
CN112882469A (zh) * 2021-01-14 2021-06-01 浙江大学 一种融合全局训练的深度强化学习避障导航方法
CN112882469B (zh) * 2021-01-14 2022-04-08 浙江大学 一种融合全局训练的深度强化学习避障导航方法
CN112906542B (zh) * 2021-02-08 2023-11-24 北京理工大学 一种基于强化学习的无人车避障方法及装置
CN112906542A (zh) * 2021-02-08 2021-06-04 北京理工大学 一种基于强化学习的无人车避障方法及装置
CN112857373A (zh) * 2021-02-26 2021-05-28 哈尔滨工业大学 一种最小化无用动作的节能性无人车路径导航方法
CN112857373B (zh) * 2021-02-26 2024-02-20 哈尔滨工业大学 一种最小化无用动作的节能性无人车路径导航方法
CN113064424A (zh) * 2021-03-17 2021-07-02 西安工业大学 一种改进ddpg算法的无人车路径规划方法
CN113139644A (zh) * 2021-03-24 2021-07-20 北京科技大学顺德研究生院 一种基于深度蒙特卡洛树搜索的信源导航方法及装置
CN113139644B (zh) * 2021-03-24 2024-02-09 北京科技大学顺德研究生院 一种基于深度蒙特卡洛树搜索的信源导航方法及装置
CN112947484A (zh) * 2021-03-31 2021-06-11 哈尔滨工业大学(深圳) 一种密集行人环境下移动机器人的视觉导航方法及装置
WO2022222718A1 (zh) * 2021-04-19 2022-10-27 北京有竹居网络技术有限公司 导航方法、装置、存储介质及设备
CN113108796A (zh) * 2021-04-19 2021-07-13 北京有竹居网络技术有限公司 导航方法、装置、存储介质及设备
CN113108796B (zh) * 2021-04-19 2023-10-20 北京有竹居网络技术有限公司 导航方法、装置、存储介质及设备
CN113110509B (zh) * 2021-05-17 2023-02-28 哈尔滨工业大学(深圳) 一种基于深度强化学习的仓储系统多机器人路径规划方法
CN113110509A (zh) * 2021-05-17 2021-07-13 哈尔滨工业大学(深圳) 一种基于深度强化学习的仓储系统多机器人路径规划方法
CN113218400B (zh) * 2021-05-17 2022-04-19 太原科技大学 一种基于深度强化学习的多智能体导航算法
CN113218400A (zh) * 2021-05-17 2021-08-06 太原科技大学 一种基于深度强化学习的多智能体导航算法
CN113177664B (zh) * 2021-05-20 2024-03-19 的卢技术有限公司 一种以安全性、距离代价为约束的自学习路径规划方法
CN113177664A (zh) * 2021-05-20 2021-07-27 的卢技术有限公司 一种以安全性、距离代价为约束的自学习路径规划方法
CN113433937A (zh) * 2021-06-08 2021-09-24 杭州未名信科科技有限公司 基于启发式探索的分层导航避障系统、分层导航避障方法
CN113433937B (zh) * 2021-06-08 2023-05-16 杭州未名信科科技有限公司 基于启发式探索的分层导航避障系统、分层导航避障方法
CN113378390A (zh) * 2021-06-15 2021-09-10 浙江大学 一种基于深度学习的地外星表通行性分析方法及系统
WO2023024542A1 (zh) * 2021-08-25 2023-03-02 驭势科技(北京)有限公司 车辆决策规划方法、装置、设备及介质
CN113867334B (zh) * 2021-09-07 2023-05-05 华侨大学 一种移动机械无人驾驶的路径规划方法和系统
CN113867334A (zh) * 2021-09-07 2021-12-31 华侨大学 一种移动机械无人驾驶的路径规划方法和系统
CN113778097A (zh) * 2021-09-15 2021-12-10 龙岩学院 L型路径趋势改进a-star算法的智能仓储物流机器人路径规划方法
CN113778097B (zh) * 2021-09-15 2023-05-19 龙岩学院 L型路径趋势改进a-star算法的智能仓储物流机器人路径规划方法
CN113819917A (zh) * 2021-09-16 2021-12-21 广西综合交通大数据研究院 自动驾驶路径规划方法、装置、设备及存储介质
CN114200830A (zh) * 2021-11-11 2022-03-18 辽宁石油化工大学 一种多智能体一致性强化学习控制方法
CN114200830B (zh) * 2021-11-11 2023-09-22 辽宁石油化工大学 一种多智能体一致性强化学习控制方法
CN113791627A (zh) * 2021-11-16 2021-12-14 中国科学院自动化研究所 一种机器人导航方法、设备、介质和产品
CN113791627B (zh) * 2021-11-16 2022-02-11 中国科学院自动化研究所 一种机器人导航方法、设备、介质和产品
CN114169628B (zh) * 2021-12-14 2023-04-07 西南交通大学 基于a*算法和遗传算法的舰载机调度优化方法及系统
CN114169628A (zh) * 2021-12-14 2022-03-11 西南交通大学 基于a*算法和遗传算法的舰载机调度优化方法及系统
CN114281084A (zh) * 2021-12-28 2022-04-05 太原市威格传世汽车科技有限责任公司 一种基于改进a*算法的智能车全局路径规划方法
CN114281084B (zh) * 2021-12-28 2023-02-21 太原市威格传世汽车科技有限责任公司 一种基于改进a*算法的智能车全局路径规划方法
CN114326744A (zh) * 2021-12-31 2022-04-12 安徽海博智能科技有限责任公司 一种基于全局地图更新的矿山卡车路径规划方法
CN114442633A (zh) * 2022-01-28 2022-05-06 天津优控智行科技有限公司 一种无人驾驶园区物流车局部路径规划方法
CN114611382A (zh) * 2022-02-23 2022-06-10 西北大学 一种无人车避障导航全局局部路线的选择算法
CN114706400A (zh) * 2022-04-12 2022-07-05 重庆文理学院 一种越野环境下基于改进的a*算法的路径规划方法
CN114723154B (zh) * 2022-04-18 2024-05-28 淮阴工学院 一种智慧超市
CN114723154A (zh) * 2022-04-18 2022-07-08 淮阴工学院 一种智慧超市
CN114815828A (zh) * 2022-04-25 2022-07-29 复旦大学 一种强化学习结合循环网络的机器人路径规划及控制方法
CN114812581B (zh) * 2022-06-23 2022-09-16 中国科学院合肥物质科学研究院 一种基于多传感器融合的越野环境导航方法
CN114812581A (zh) * 2022-06-23 2022-07-29 中国科学院合肥物质科学研究院 一种基于多传感器融合的越野环境导航方法
CN115328195A (zh) * 2022-07-24 2022-11-11 哈尔滨工业大学(威海) 不确定环境下无人机与无人车双层路径规划算法
CN115167478B (zh) * 2022-08-23 2024-04-26 山东大学 基于深度强化学习的机器人无地图路径规划方法及系统
CN115167478A (zh) * 2022-08-23 2022-10-11 山东大学 基于深度强化学习的机器人无地图路径规划方法及系统
CN115309163A (zh) * 2022-08-26 2022-11-08 南京理工大学 基于改进方向评价函数dwa算法的局部路径规划方法
CN115309163B (zh) * 2022-08-26 2024-01-26 南京理工大学 基于改进方向评价函数dwa算法的局部路径规划方法
CN115268467A (zh) * 2022-09-26 2022-11-01 江苏天一航空工业股份有限公司 一种行李车的导航控制系统及控制方法
CN115268467B (zh) * 2022-09-26 2023-01-10 江苏天一航空工业股份有限公司 一种行李车的导航控制系统及控制方法
CN115752490A (zh) * 2022-09-29 2023-03-07 太原理工大学 基于大数据和定位技术的安全出行路径优化方法及系统
CN115752490B (zh) * 2022-09-29 2023-10-27 太原理工大学 基于大数据和定位技术的安全出行路径优化方法及系统
CN115562290A (zh) * 2022-10-20 2023-01-03 南京航空航天大学 一种基于a星惩罚控制优化算法的机器人路径规划方法
CN115782867B (zh) * 2022-11-17 2024-01-30 上海西井科技股份有限公司 轨迹碰撞风险评估方法、装置、电子设备和存储介质
CN115782867A (zh) * 2022-11-17 2023-03-14 上海西井信息科技有限公司 轨迹碰撞风险评估方法、装置、电子设备和存储介质
CN115824216A (zh) * 2022-11-22 2023-03-21 苏州数智赋农信息科技有限公司 一种养猪场喂食车自适应控制方法及系统
CN116069023A (zh) * 2022-12-20 2023-05-05 南京航空航天大学 一种基于深度强化学习的多无人车编队控制方法和系统
CN116069023B (zh) * 2022-12-20 2024-02-23 南京航空航天大学 一种基于深度强化学习的多无人车编队控制方法和系统
CN117685994A (zh) * 2024-02-04 2024-03-12 北京航空航天大学 一种空地协同的无人车路径规划方法
CN117685994B (zh) * 2024-02-04 2024-05-17 北京航空航天大学 一种空地协同的无人车路径规划方法
CN118494468A (zh) * 2024-07-17 2024-08-16 罗普特科技集团股份有限公司 基于人工智能的车辆控制方法及系统
CN118494468B (zh) * 2024-07-17 2024-11-08 罗普特科技集团股份有限公司 基于人工智能的车辆控制方法及系统

Also Published As

Publication number Publication date
CN111780777B (zh) 2022-10-21

Similar Documents

Publication Publication Date Title
CN111780777B (zh) 一种基于改进a*算法和深度强化学习的无人车路径规划方法
Faust et al. Prm-rl: Long-range robotic navigation tasks by combining reinforcement learning and sampling-based planning
US11900797B2 (en) Autonomous vehicle planning
Wang et al. A multilayer path planner for a USV under complex marine environments
WO2022052406A1 (zh) 一种自动驾驶训练方法、装置、设备及介质
Wu Coordinated path planning for an unmanned aerial-aquatic vehicle (UAAV) and an autonomous underwater vehicle (AUV) in an underwater target strike mission
Zhao et al. The experience-memory Q-learning algorithm for robot path planning in unknown environment
CN107063280A (zh) 一种基于控制采样的智能车辆路径规划系统及方法
Chen et al. Autonomous port management based AGV path planning and optimization via an ensemble reinforcement learning framework
Botteghi et al. On reward shaping for mobile robot navigation: A reinforcement learning and SLAM based approach
CN113848974B (zh) 一种基于深度强化学习的飞行器轨迹规划方法及系统
Wu et al. An adaptive conversion speed Q-learning algorithm for search and rescue UAV path planning in unknown environments
Li et al. Navigation of mobile robots based on deep reinforcement learning: Reward function optimization and knowledge transfer
Xue et al. Multi-agent deep reinforcement learning for UAVs navigation in unknown complex environment
CN116804879A (zh) 一种改进蜣螂算法融合dwa算法的机器人路径规划框架方法
Du et al. An optimized path planning method for coastal ships based on improved DDPG and DP
Sundarraj et al. Route planning for an autonomous robotic vehicle employing a weight-controlled particle swarm-optimized Dijkstra algorithm
Zhang et al. Intelligent vector field histogram based collision avoidance method for auv
Lodhi et al. Autonomous vehicular overtaking maneuver: A survey and taxonomy
Yang et al. Improved reinforcement learning for collision-free local path planning of dynamic obstacle
CN113311828A (zh) 一种无人车局部路径规划方法、装置、设备及存储介质
CN113959446B (zh) 一种基于神经网络的机器人自主物流运输导航方法
CN116069023A (zh) 一种基于深度强化学习的多无人车编队控制方法和系统
Elallid et al. Deep Reinforcement Learning for Autonomous Vehicle Intersection Navigation
Chen et al. Framework of active obstacle avoidance for autonomous vehicle based on hybrid soft actor-critic algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230726

Address after: 366 Mingzhu Avenue, Yong'anzhou Town, Gaogang District, Taizhou City, Jiangsu Province 225300

Patentee after: Jiangsu Taizhou Port Core Port Investment Co.,Ltd.

Address before: 225300 Yongcheng Science and Technology Incubation Industrial Park, Gaogang District, Taizhou City, Jiangsu Province

Patentee before: Jiangsu Zhongke Intelligent Manufacturing Research Institute Co.,Ltd.

Patentee before: INSTITUTE OF AUTOMATION, CHINESE ACADEMY OF SCIENCES

TR01 Transfer of patent right