CN105138779A - 车载gps时空轨迹大数据优选方法及系统 - Google Patents
车载gps时空轨迹大数据优选方法及系统 Download PDFInfo
- Publication number
- CN105138779A CN105138779A CN201510549494.3A CN201510549494A CN105138779A CN 105138779 A CN105138779 A CN 105138779A CN 201510549494 A CN201510549494 A CN 201510549494A CN 105138779 A CN105138779 A CN 105138779A
- Authority
- CN
- China
- Prior art keywords
- optimization
- track
- density
- trajectory
- gps
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005457 optimization Methods 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 238000013210 evaluation model Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 54
- 238000010586 diagram Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000029305 taxis Effects 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
Landscapes
- Navigation (AREA)
- Traffic Control Systems (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
Abstract
一种车载GPS时空轨迹大数据优选方法及系统,包括根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段;根据GPS轨迹误差分布规律,确定初始优选率;基于密度进行初步优选,包括按照密度评价模型和初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;基于角度相似性进行二次优选,包括利用角度相似性评价模型对初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。本发明提高了基于低精度车载GPS轨迹数据的整体定位精度,且优选方法简单、容易实现。
Description
技术领域
本发明涉及一种车载GPS时空轨迹大数据优选技术方案,属于地理信息系统与智能交通研究领域。
背景技术
车载GPS时空轨迹大数据是目前城市计算、交通动态信息获取、人类行为模式探测的重要数据源。通常大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,与计算机处理能力成正比,计算机处理能力越强,定义大数据边界值也即数据量越大。目前车载GPS时空轨迹大数据主来来自安装有GPS定位装置和无线电通信系统的城市出租车,其采集结果归属于单点定位技术(SPP/GPS)。同时因为其采集设备、目的和复杂城市环境所影响,采集的GPS轨迹数据的定位精度一般为15m-20m左右并掺杂有大量异常值,在城市遮挡严重的地方甚至会出现错误定位。相比于采用专业设备采集的高精度GPS轨迹数据(搭载IMU/INS装备的采集车,采用松组合获取的差分GPS轨迹数据,IMU/DGPS,定位精度通常在0.5m左右),这种由出租车采集的GPS轨迹数据是一种低精度的GPS轨迹数据。但是由于其采集成本低、采集周期短、覆盖面广,被广泛应用于城市相关信息的提取。这些应用包括:1、城市计算,例如:城市热点分析、城市空间结构变化;2、交通动态信息获取,例如:城市交通路网生成、交通流量监控、交叉口探测及交通规则;3、人类行为模式探测,例如:城市人群移动模式分析、驾驶员驾驶行为探测等。同时为了克服其数据质量问题,很多学者提出了相应的数据优化方法,包括:数据压缩(减少海量数据的存储量,加快数据传输、处理、分析速度),地图匹配(弱化低质GPS轨迹数据定位精度低的劣势,强化GPS轨迹数据在空间信息方面的优点),聚类方法去除原始GPS轨迹数据内的异常值(去除外部漂移点)等。虽然,这些方法在一定程度上为不同研究目的的课题提供了满足相应精度要求的数据源,但是仍然无法实现GPS轨迹数据质量的真正优化。另外,上述数据优化的方法也无法为未来城市精细信息获取提供优质的数据源。
发明内容
本发明在以上研究的基础上,提出了顾忌GPS轨迹向量距离和角度的二次优选技术方案,从海量低质车载GPS轨迹数据中优选出精度相对较高的优质GPS轨迹数据。
本发明提供一种车载GPS时空轨迹大数据优选方法,其特征在于:包括以下步骤,
步骤1,根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;
步骤2,根据GPS轨迹误差分布规律,确定初始优选率;
步骤3,基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照步骤2所述初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;
所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,
r=mL+vaL
其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;
步骤4,基于角度相似性进行二次优选,包括利用角度相似性评价模型,对步骤3初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。
而且,步骤1中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的路段ID,所述路段ID为路段的编号。
而且,步骤2中,当定位精度为15m时,将68.2%作为初步优选比例。
而且,步骤4中,进行聚类处理时,以角度差异1°时所对应的相似度值作为聚类阈值进行聚类。
而且,设步骤3基于密度进行初步优选后得到初步优选集T,
设初步优选集T内有s个轨迹点,构成s-1个轨迹向量,记为 其中,表示第k个轨迹向量,k=1,2,…,s-1,(xk,yk)表示的起点坐标,(xk+1,yk+1)表示的终点坐标,
计算任意两个轨迹向量之间的相似度如下,
其中表示初步优选结果内,任意两个轨迹向量间的相似度;则表示轨迹向量与角度差异的余弦值,其中k=1,2,…,s-1,t=1,2,…,s-1。
本发明提供一种车载GPS时空轨迹大数据优选系统,包括以下模块,
初始匹配模块,用于根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;
初始优选率设定模块,用于根据GPS轨迹误差分布规律,确定初始优选率;
初选模块,用于基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;
所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,
r=mL+vaL
其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;
终选模块,用于基于角度相似性进行二次优选,包括利用角度相似性评价模型,对初选模块初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。
而且,初始匹配模块中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的路段ID,所述路段ID为路段的编号。
而且,初始优选率设定模块中,当定位精度为15m时,将68.2%作为初步优选比例。
而且,终选模块中,进行聚类处理时,以角度差异1°时所对应的相似度值作为聚类阈值进行聚类。
而且,设初选模块基于密度进行初步优选后得到初步优选集T,
设初步优选集T内有s个轨迹点,构成s-1个轨迹向量,记为 其中,表示第k个轨迹向量,k=1,2,…,s-1,(xk,yk)表示的起点坐标,(xk+1,yk+1)表示的终点坐标,
计算任意两个轨迹向量之间的相似度如下,
其中表示初步优选结果内,任意两个轨迹向量间的相似度;则表示轨迹向量与角度差异的余弦值,其中k=1,2,…,s-1,t=1,2,…,s-1。
本发明构筑了一种从低精度车载GPS轨迹数据中优选出精度相对较高的优质数据技术方案,提高了低精度车载GPS轨迹数据的整体定位精度,且优选方法简单、容易实现。本发明首先通过分析GPS误差分布规律,将优质数据被选率定位在68.2%以内;然后利用密度评估模型,计算GPS轨迹数据平面分布密度值,并将被选目标的所有密度值进行降序排列,选出68.2%的高密度数据作为初步优选结果;最后通过对高精度轨迹数据的角度变化差异特征的分析,采用角度相似性评价方法,对初步优选结果进行聚类,最终从聚类结果中二次优选出少量定位精度较高的优质GPS轨迹数据。实验结果表明,根据本技术方案优选的数据占总体数据比例不超过50%,且被选取数据在城市遮挡路段的精度为6m,半遮挡及开阔路段的精度为3m,比较原始GPS轨迹数据15m-20m的定位精度,有非常大的提高。
附图说明:
图1是本发明实施例的方法流程图;
图2是本发明实施例的地图匹配结果图,其中图2a为基础路网匹配结果示意图,图2b中为某路段匹配结果示意图;
图3是本发明实施例的GPS误差分布规律分析图;
图4是本发明实施例的GPS轨迹初步优选原理图,其中图4a为轨道分布真实区域横截面示意图,图4b为相应的密度分析示意图;
图5是本发明实施例的GPS轨迹二次优选原理图;
图6是本发明实施例基于角度相似性模型最终的聚类结果;
图7是本发明实施例基于两次优选后得到的实验对比图,其中图7a为原始的GPS轨迹数据示意图,图7b为被选优质GPS轨迹数据示意图。
具体实施方式
以下结合实施例和附图详细说明本发明技术方案。
本发明方法技术方案可采用计算机软件方式支持自动运行流程。参见图1,本发明实施例提供的一种从低精度海量车载GPS轨迹数据中优选出定位精度较高数据的方法,包括如下步骤:
1)基于原始车载GPS轨迹大数据和道路级交通路网,对原始GPS轨迹进行地图匹配处理,确定每一个轨迹点所对应的路段,然后不改变其原始空间位置,以每一条路段上所对应的GPS轨迹数据作为优化目标,即可得到以路段为单位的优选数据集,完成数据准备;然后进入2)根据GPS轨迹误差分布规律,确定被优选数据占总体数据的比例,一般情况,对于优选精度相对较高的数据而言,68.2%的优选率至少可以满足精度在1σ以内,因此本发明将初次优选的数据比例定位68.2%;进入3)基于密度进行初步优选,按照密度评价模型,对优选目标内的所有数据进行密度分布计算,并进行降序排列,按照2)的优选率进行初步优选,从而使得那些聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;进入4)基于角度相似性进行二次优选,利用角度相似性评价模型,对初步优选出的结果进行相似度值计算,并进行聚类处理,以角度差异1°时所对应的相似度值作为聚类间隔进行聚类,然后选取聚类类别内轨迹向量占总体待选轨迹数量比例最高的一类作为最终优选结果,即数据优选所得被选优质数据。
具体来说,实施例所提供一种从海量车载GPS轨迹数据中优选出定位精度相对较高的优质数据的新方法,具体流程实现如下:
步骤1,根据地图匹配方法将原始的GPS轨迹数据与现有道路级别的路网进行叠加,寻找出原始GPS轨迹数据所对应的道路中路段ID。
实施例具体实现如下,
将没有经过任何处理的原始GPS轨迹按照其行驶方向和位置分别与基础路网匹配(匹配过程中采用的基础路网是由拓扑点和线条表示的已知道路网络图,是道路级别而不是车道级别路网,而路段就是路网中两个拓扑点之间的线段,路段ID就是用于描述记录这些路段的编号),确定每一个轨迹点所对应的路段ID,如何实现匹配目前已经有很多方法,具体实施时本领域技术人员可自行选择,此处不再赘述;然后将每一个路段ID下对应的所有原始GPS轨迹点作为优选目标,进行优选处理。如图2a所示,地图中的线化图为道路级交通路网(基础路网),点状数据则为一部分低精度车载GPS轨迹数据,图2b中为某一条路段所对应的GPS轨迹点。
步骤2,数据初始优选率确定:按照GPS误差分布规律原理,如图3所示,GPS水平误差分布遵从高斯分布且均值μ=0,大部分采用单点定位技术获取的GPS数据(例如本发明实施例所针对的低精度GPS轨迹数据即为利用单点定位技术获取),其定位精度σ=15m,城区遮挡严重的区域定位精度比较低,相应定位精度σ>15m。
根据GPS轨迹误差分布原理,GPS轨迹误差分布遵照高斯分布,其概率密度函数f(error)为:
其中,f(error)表示任意一个轨迹点p(x,y),与其真实测量值p′(x′,y′)之间的平面误差error随高斯分布的概率密度函数值,σ为对现有大量GPS轨迹数据测量值与其真实值误差error进行评估后获取的标准差,即对应目前对GPS定位精度描述的值。在进行数据优选前,原始车载GPS轨迹数据的GPS误差标准差(σ)为已知结果。
不同置信区间作用范围内,采用积分方法,对GPS水平误差分布概率密度函数进行积分即可得到置信区间内数据占总体数据的比例。
当置信区间取[-1σ,1σ](即[-σ,σ])时,表明数据集内数据定位精度在[-15m,15m]的数据占总体的比例为68.2%,当置信区间取[-2σ,2σ]时,表明整个数据集内水平定位精度在[-30m,30m]的数据占总体的比例为95.4%,同样当置信区间取[-3σ,3σ]时,表明整个数据集内水平定位精度在[-45m,45m]的数据占总体的比例为99.7%。这样的选取比例表明,对于整体数据中精度能达到15m以内的数据占总体数据的比例仅为68.2%。因此,为了满足选取优质数据的最终需求,将68.2%作为初步优选比例。具体实施时,比例的设定可以按照精度需求进行预先设定,对于定位精度高于15m以内的数据(如1m定位精度),初步优选比例可以按照优选精度需求及硬件存储能力进行设置,例如:设定为95.4%,但是对于定位精度比15m还要差的数据,初步优选比例只能小于68.2%。
步骤3,基于密度的初步优选
原始GPS轨迹数据中包含很多噪音信息,为提取城市精细信息带来了极大的干扰。根据GPS轨迹数据在道路横截面的分布特征,大部分GPS轨迹数据都会处于道路中心线两侧,而分布在路面以外区域的GPS轨迹则越来越少,如图4所示:图4a的轨道分布真实区域横截面表明每一个GPS轨迹点由于来自于采集车辆,所以正常情况下都会位于路面上,而其空间位置也会处于正常的精度范围内(如图4虚线圈所表示,例如GPS定位精度为10m,测量值则应处于真值的10m半径领域内),GPS轨迹点测量值叠加区域的范围大小同时反映轨迹所处路面宽度;当大量的GPS轨迹点聚集在道路上时,就会出现如图4b所示的情况,路面上数据密度越来越高(如图中HighDensity),而两侧非路面的位置会因为GPS轨迹数据漂移问题存在一些低密度的数据点(如图中LowDensity),也即位于路面上的数据的密度要高于漂移到路面两侧的数据。根据GPS轨迹数据这一空间分布特征,采用密度评价模型计算优选目标内每一个GPS轨迹点的平面密度,然后按照降序排列,选取前68.2%的数据作为初步优选结果,其余数据则被作为漂移数据被弃选。并将初步优选的结果作为二次优选的目标,进入步骤4)实施二次优选。
计算各个轨迹点的具体密度值可以如下所示:
r=mL+vaL(1)
其中r为轨迹点的邻域半径,即以每一个GPS轨迹点为中心,构成以r为半径的圆形区域;mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,也即:对优化目标内(实际操作时,可以以一个路段为优化路标,也可以针对路段长度进行等量划分,划分的长度需要看数据采样间隔,数据采样间隔1-10s内轨迹,建议划分间隔取50m,超过10s采样间隔的数据,可以以路段为优化目标)所有轨迹点进行Delaunay三角网构网,得到若干个三角网,然后通过计算所有三角网的边长及其边长的均值和标准差得到mL和varL;Densityi表示任意一个轨迹点pi的平面密度,mi则表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数,N则为优化目标内所有GPS轨迹点的个数。
步骤4,基于角度相似性聚类的二次优选
通过探究高精度GPS轨迹点的行为特征发现,高质量的GPS轨迹往往会与移动载体的移动趋势高度对应,如图5中OPT1轨迹所示(OPT1轨迹表示定位精度较高的轨迹,例如:定位精度为5m),其中包括轨迹点opt1,opt2,opt3,…,opth,…,optq-1,optq但是低精度的GPS轨迹则会因为定位精度低的原因,导致轨迹特征并没有与移动载体高度一致,所以会出现如T1轨迹(其中包括轨迹点pt1,pt2,pt3,…,pth,…,ptq-1,ptq)所示的异常点(pt3)(T1表示定位精度较低的轨迹,例如:定位精度仅为15m)。这种异常值采用初步优选往往无法消除,但是利用角度变化却可以将其剔除。而角度相似性评价模型的构建就是建立在这样一个推理基础之上。将步骤3获取初步优选结果作为二次优选的原始数据,然后利用角度相似性评价模型对数据集内所有轨迹向量进行相似度值计算。
设步骤3基于密度进行初步优选后得到初步优选集T,设初步优选集T内有s个轨迹点,具体实施时,可以按照每一个轨迹内包含的采集车辆ID号以及采集时间,将这些轨迹点串连得到轨迹线,轨迹线中的每一个点(第1、2…s-1个点)和后一个点就可以构成轨迹向量。假设有s-1个轨迹向量,也即初步优选集T={p1,p2,…pk,…,ps},pk=(xk,yk,tk,IDk),其轨迹向量可以描述为:根据角度相似性计算公式,即可得到每一个轨迹向量与其他s-2个轨迹向量的相似性度量值。其中,表示第k个轨迹向量,k=1,2,…,s-1,(xk,yk)表示的起点坐标,(xk+1,yk+1)表示的终点坐标。
计算初次优选后轨迹向量之间的相似度计算公式如下:
其中表示初步优选结果内,任意两个轨迹向量间的相似度;则表示轨迹向量与角度差异的余弦值,其中k=1,2,…,s-1,t=1,2,…,s-1。夹角余弦的几何意义是表示两个向量之间夹角的余弦值,由于同一条路段、同一种行驶方向的轨迹之间夹角在(0°~90°)之间,所以夹角余弦的取值范围为[0,1],且其相似度的取值也在[0,1],取值越大表明向量间相似度越高,值为1时,表示两向量完全相同。
本实施例在聚类过程中,采用层次聚类方法中凝聚层次聚类方法进行聚类,也即将每一个轨迹向量作为单独类,通过计算两两之间的相似度,符合聚类阈值即可合并为同一类,不停迭代,直到聚类类别不再发生变化为止,具体如何实现凝聚层次聚类前已经有很多开源代码,实施时本领域技术人员可自行选择,此处不再赘述,最后选取聚类类别中轨迹向量所占比例最大的类别作为最终优选结果,具体步骤如下所示:
首先,随机选取一个轨迹向量作为初始聚类中心,然后计算该轨迹向量与其他轨迹向量之间的相似度值;
其次,计算该轨迹向量与其他轨迹向量的相似度值,如果当前轨迹与某一个轨迹向量的相似度值满足聚类阈值(以角度差异1°时所对应的相似度值作为聚类阈值进行聚类),那么就将该轨迹向量与当前轨迹聚为一类,并继续计算剩余其他轨迹;
然后,找出与当前轨迹不能聚为一类的轨迹向量,并随机选取其中一个轨迹向量作为另一类的类中心重复前面两步,直到所有轨迹向量都寻找到与其对应的聚类类别。
最后,对每一个聚类类别内所有轨迹向量所占比例进行评估(该比例为聚类类别内轨迹向量个数与优选目标内所有轨迹向量个数的比值),选取比值最大的一类作为优质数据。
如图6所示,可见不同的聚类结果,同时也反映了不同类别轨迹向量之间的角度差异。由于目前针对聚类的方法已经非常成熟,此处具体的聚类方法不再赘述。图7则为最终优选结果与其同步高精度数据对比图(其中:图7a中为原始的GPS轨迹数据;图7b则是被选优质GPS轨迹数据)。
具体实施时,还可采用模块化方式提供相应系统。本发明实施例提供一种车载GPS时空轨迹大数据优选系统,包括以下模块,
初始匹配模块,用于根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;
初始优选率设定模块,用于根据GPS轨迹误差分布规律,确定初始优选率;
初选模块,用于基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;
所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,
r=mL+vaL
其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;
终选模块,用于基于角度相似性进行二次优选,包括利用角度相似性评价模型,对初选模块初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。
基于本发明,可以方便地从海量车载GPS轨迹数据中选取定位精度相对较高的优质GPS轨迹数据,实现自动去除干扰噪音,提高车载GPS轨迹数据整体定位精度,减少数据存储量,加快未来信息提取处理速度。
本文中所描述的具体实施例仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例作各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或超越所附权利要求书所定义的范围。
Claims (10)
1.一种车载GPS时空轨迹大数据优选方法,其特征在于:包括以下步骤,
步骤1,根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;
步骤2,根据GPS轨迹误差分布规律,确定初始优选率;
步骤3,基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照步骤2所述初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;
所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,
r=mL+vaL
其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;
步骤4,基于角度相似性进行二次优选,包括利用角度相似性评价模型,对步骤3初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。
2.根据权利要求1所述车载GPS时空轨迹大数据优选方法,其特征在于:步骤1中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的路段ID,所述路段ID为路段的编号。
3.根据权利要求1所述车载GPS时空轨迹大数据优选方法,其特征在于:步骤2中,当定位精度为15m时,将68.2%作为初步优选比例。
4.根据权利要求1或2或3所述车载GPS时空轨迹大数据优选方法,其特征在于:步骤4中,进行聚类处理时,以角度差异1°时所对应的相似度值作为聚类阈值进行聚类。
5.根据权利要求4所述车载GPS时空轨迹大数据优选方法,其特征在于:设步骤3基于密度进行初步优选后得到初步优选集T,
设初步优选集T内有s个轨迹点,构成s-1个轨迹向量,记为 其中,表示第k个轨迹向量,k=1,2,…,s-1,(xk,yk)表示的起点坐标,(xk+1,yk+1)表示的终点坐标,
计算任意两个轨迹向量之间的相似度如下,
其中表示初步优选结果内,任意两个轨迹向量间的相似度;则表示轨迹向量与角度差异的余弦值,其中k=1,2,…,s-1,t=1,2,…,s-1。
6.一种车载GPS时空轨迹大数据优选系统,其特征在于:包括以下模块,
初始匹配模块,用于根据原始的GPS轨迹数据和道路级的交通路网进行地图匹配处理,确定每一个轨迹点所对应的路段,然后以每一条路段上所对应的轨迹点作为优化目标;
初始优选率设定模块,用于根据GPS轨迹误差分布规律,确定初始优选率;
初选模块,用于基于密度进行初步优选,包括按照密度评价模型,对优选目标内的所有轨迹点进行密度分布计算,并进行降序排列,按照初始优选率进行初步优选,使得聚集在道路面上的轨迹点被选取,而远离道路面的点则被作为漂移点被弃选;
所述对优选目标内的所有轨迹点进行密度分布计算,包括根据以下密度评价模型对各个轨迹点的密度值进行计算,
r=mL+vaL
其中,r为轨迹点的邻域半径,mL和varL分别表示优化目标内所有GPS轨迹点构成三角网的所有边长的均值和标准差,Densityi表示任意一个轨迹点pi的平面密度;mi表示以轨迹点pi为中心以r为半径的邻域内,包含其他轨迹点的个数;N表示优化目标内所有轨迹点的个数;
终选模块,用于基于角度相似性进行二次优选,包括利用角度相似性评价模型,对初选模块初步优选出的结果进行相似度值计算,并进行聚类处理,然后选取聚类类别中相似度值最高的一类作为最终优选结果,得到被选优质数据。
7.根据权利要求6所述车载GPS时空轨迹大数据优选系统,其特征在于:初始匹配模块中,确定每一个轨迹点所对应的路段,包括确定轨迹点对应的路段ID,所述路段ID为路段的编号。
8.根据权利要求6所述车载GPS时空轨迹大数据优选系统,其特征在于:初始优选率设定模块中,当定位精度为15m时,将68.2%作为初步优选比例。
9.根据权利要求6或7或8所述车载GPS时空轨迹大数据优选系统,其特征在于:终选模块中,进行聚类处理时,以角度差异1°时所对应的相似度值作为聚类阈值进行聚类。
10.根据权利要求9所述车载GPS时空轨迹大数据优选系统,其特征在于:设初选模块基于密度进行初步优选后得到初步优选集T,
设初步优选集T内有s个轨迹点,构成s-1个轨迹向量,记为 其中,表示第k个轨迹向量,k=1,2,…,s-1,(xk,yk)表示的起点坐标,(xk+1,yk+1)表示的终点坐标,
计算任意两个轨迹向量之间的相似度如下,
其中表示初步优选结果内,任意两个轨迹向量间的相似度;则表示轨迹向量与角度差异的余弦值,其中k=1,2,…,s-1,t=1,2,…,s-1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510549494.3A CN105138779B (zh) | 2015-08-31 | 2015-08-31 | 车载gps时空轨迹大数据优选方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510549494.3A CN105138779B (zh) | 2015-08-31 | 2015-08-31 | 车载gps时空轨迹大数据优选方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105138779A true CN105138779A (zh) | 2015-12-09 |
CN105138779B CN105138779B (zh) | 2018-03-27 |
Family
ID=54724126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510549494.3A Active CN105138779B (zh) | 2015-08-31 | 2015-08-31 | 车载gps时空轨迹大数据优选方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105138779B (zh) |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105788273A (zh) * | 2016-05-18 | 2016-07-20 | 武汉大学 | 基于低精度时空轨迹数据的城市交叉口自动识别的方法 |
CN105957342A (zh) * | 2016-05-30 | 2016-09-21 | 武汉大学 | 基于众包时空大数据的车道级道路测图方法及系统 |
CN106840176A (zh) * | 2016-12-28 | 2017-06-13 | 济宁中科先进技术研究院有限公司 | Gps时空数据增量路网实时更新和轨迹匹配系统 |
CN107037452A (zh) * | 2017-04-27 | 2017-08-11 | 成都新橙北斗智联有限公司 | 一种基于北斗或gps设备定位轨迹的去噪声方法 |
CN107255826A (zh) * | 2017-04-26 | 2017-10-17 | 国家电网公司 | 基于大数据下的物流货车修正gps定位分析方法 |
CN108680174A (zh) * | 2018-05-10 | 2018-10-19 | 长安大学 | 一种基于机器学习算法改进地图匹配异常点的方法 |
WO2018197766A1 (fr) | 2017-04-27 | 2018-11-01 | Psa Automobiles Sa | Procédé et dispositif de contrôle de la transmission de données d'un véhicule à un équipement de communication |
CN108731691A (zh) * | 2017-04-19 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 导航设备的偏航点的确定方法和装置 |
CN108804562A (zh) * | 2018-05-22 | 2018-11-13 | 深圳市数字城市工程研究中心 | 一种保持速度特征的道路网约束轨迹线化简方法 |
CN109033011A (zh) * | 2018-06-19 | 2018-12-18 | 东软集团股份有限公司 | 计算轨迹频繁度的方法、装置、存储介质及电子设备 |
CN109154502A (zh) * | 2016-02-19 | 2019-01-04 | 俄亥俄州创新基金会 | 用于地理定位的系统、方法和设备 |
CN109459770A (zh) * | 2018-09-14 | 2019-03-12 | 咪咕互动娱乐有限公司 | 一种运动轨迹的生成方法、装置及存储介质 |
CN109816982A (zh) * | 2019-02-25 | 2019-05-28 | 东南大学 | 基于共享单车轨迹的虚拟路网非机动车道属性修正方法 |
CN110046209A (zh) * | 2019-03-26 | 2019-07-23 | 太原科技大学 | 一种基于高斯模型的轨迹停止点提取方法 |
CN110109152A (zh) * | 2019-04-12 | 2019-08-09 | 中国科学院光电研究院 | 一种gnss局地定位误差空间建模方法 |
CN110450168A (zh) * | 2019-08-28 | 2019-11-15 | 佛山市兴颂机器人科技有限公司 | 一种机器人及其自主导航方法、装置、存储介质 |
CN110471999A (zh) * | 2019-08-05 | 2019-11-19 | 北京百度网讯科技有限公司 | 轨迹处理方法、装置、设备和介质 |
CN110889963A (zh) * | 2018-09-11 | 2020-03-17 | 深圳云天励飞技术有限公司 | 一种道路监控方法、装置及存储介质 |
CN111274475A (zh) * | 2020-01-16 | 2020-06-12 | 深圳市前海随手数据服务有限公司 | 轨迹特征的提取方法、装置、存储介质及终端 |
CN111307164A (zh) * | 2020-02-25 | 2020-06-19 | 西北大学 | 一种低采样率轨迹地图匹配方法 |
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN112233413A (zh) * | 2020-07-20 | 2021-01-15 | 北方工业大学 | 一种面向智能网联车辆的多车道时空轨迹优化方法 |
CN112328728A (zh) * | 2020-11-30 | 2021-02-05 | 浙江师范大学 | 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质 |
CN112462400A (zh) * | 2020-10-26 | 2021-03-09 | 华东师范大学 | 一种移动轨迹数据的漂移点处理方法 |
CN114126040A (zh) * | 2021-11-08 | 2022-03-01 | 江西省方众物流科技有限公司 | 车辆轨迹优化方法、车辆轨迹定位方法、车辆定位系统 |
CN114328791A (zh) * | 2021-12-30 | 2022-04-12 | 重庆大学 | 一种基于深度学习的地图匹配算法 |
CN114625823A (zh) * | 2022-03-02 | 2022-06-14 | 阿波罗智联(北京)科技有限公司 | 车道线数据处理方法、装置、设备及存储介质 |
CN117706478A (zh) * | 2024-02-02 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 定位漂移的识别方法、装置、设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035783B (zh) * | 2018-09-17 | 2021-06-11 | 东南大学 | 一种基于公交gps轨迹的虚拟路网缺失路段自动识别方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853725A (zh) * | 2012-11-29 | 2014-06-11 | 深圳先进技术研究院 | 一种交通轨迹数据降噪方法及系统 |
US20140218523A1 (en) * | 2013-02-06 | 2014-08-07 | Ta-Tsun Su | Burglarproof device |
WO2015030279A1 (ko) * | 2013-08-26 | 2015-03-05 | Jo Sung Hoon | 지피에스 기능을 가진 스마트 디바이스를 활용한 p2p 기반 실시간 범인추적방법 |
CN104467866A (zh) * | 2014-10-14 | 2015-03-25 | 福建师范大学 | 一种基于角度的轨迹数据压缩方法及装置 |
US9008890B1 (en) * | 2013-03-15 | 2015-04-14 | Google Inc. | Augmented trajectories for autonomous vehicles |
CN104573116A (zh) * | 2015-02-05 | 2015-04-29 | 哈尔滨工业大学 | 基于出租车gps数据挖掘的交通异常识别方法 |
CN104700617A (zh) * | 2015-04-02 | 2015-06-10 | 武汉大学 | 基于低精度gps轨迹数据的高精度车道信息提取方法 |
CN104866670A (zh) * | 2015-05-25 | 2015-08-26 | 武汉大学 | 基于gps时空轨迹的路网拓扑变化自动检测方法及系统 |
-
2015
- 2015-08-31 CN CN201510549494.3A patent/CN105138779B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103853725A (zh) * | 2012-11-29 | 2014-06-11 | 深圳先进技术研究院 | 一种交通轨迹数据降噪方法及系统 |
US20140218523A1 (en) * | 2013-02-06 | 2014-08-07 | Ta-Tsun Su | Burglarproof device |
US9008890B1 (en) * | 2013-03-15 | 2015-04-14 | Google Inc. | Augmented trajectories for autonomous vehicles |
WO2015030279A1 (ko) * | 2013-08-26 | 2015-03-05 | Jo Sung Hoon | 지피에스 기능을 가진 스마트 디바이스를 활용한 p2p 기반 실시간 범인추적방법 |
CN104467866A (zh) * | 2014-10-14 | 2015-03-25 | 福建师范大学 | 一种基于角度的轨迹数据压缩方法及装置 |
CN104573116A (zh) * | 2015-02-05 | 2015-04-29 | 哈尔滨工业大学 | 基于出租车gps数据挖掘的交通异常识别方法 |
CN104700617A (zh) * | 2015-04-02 | 2015-06-10 | 武汉大学 | 基于低精度gps轨迹数据的高精度车道信息提取方法 |
CN104866670A (zh) * | 2015-05-25 | 2015-08-26 | 武汉大学 | 基于gps时空轨迹的路网拓扑变化自动检测方法及系统 |
Non-Patent Citations (1)
Title |
---|
李清泉等: ""基于GPS轨迹数据的地图匹配算法"", 《测绘学报》 * |
Cited By (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109154502A (zh) * | 2016-02-19 | 2019-01-04 | 俄亥俄州创新基金会 | 用于地理定位的系统、方法和设备 |
CN105788273A (zh) * | 2016-05-18 | 2016-07-20 | 武汉大学 | 基于低精度时空轨迹数据的城市交叉口自动识别的方法 |
CN105957342A (zh) * | 2016-05-30 | 2016-09-21 | 武汉大学 | 基于众包时空大数据的车道级道路测图方法及系统 |
CN106840176A (zh) * | 2016-12-28 | 2017-06-13 | 济宁中科先进技术研究院有限公司 | Gps时空数据增量路网实时更新和轨迹匹配系统 |
CN106840176B (zh) * | 2016-12-28 | 2020-01-31 | 济宁中科先进技术研究院有限公司 | Gps时空数据增量路网实时更新和轨迹匹配系统 |
CN108731691A (zh) * | 2017-04-19 | 2018-11-02 | 腾讯科技(深圳)有限公司 | 导航设备的偏航点的确定方法和装置 |
CN107255826A (zh) * | 2017-04-26 | 2017-10-17 | 国家电网公司 | 基于大数据下的物流货车修正gps定位分析方法 |
CN107037452A (zh) * | 2017-04-27 | 2017-08-11 | 成都新橙北斗智联有限公司 | 一种基于北斗或gps设备定位轨迹的去噪声方法 |
WO2018197766A1 (fr) | 2017-04-27 | 2018-11-01 | Psa Automobiles Sa | Procédé et dispositif de contrôle de la transmission de données d'un véhicule à un équipement de communication |
US10989557B2 (en) | 2017-04-27 | 2021-04-27 | Psa Automobiles Sa | Method and device for controlling the transmission of data from a vehicle to communication equipment |
CN108680174A (zh) * | 2018-05-10 | 2018-10-19 | 长安大学 | 一种基于机器学习算法改进地图匹配异常点的方法 |
CN108680174B (zh) * | 2018-05-10 | 2019-05-10 | 长安大学 | 一种基于机器学习算法改进地图匹配异常点的方法 |
CN108804562B (zh) * | 2018-05-22 | 2022-04-29 | 深圳市数字城市工程研究中心 | 一种保持速度特征的道路网约束轨迹线化简方法 |
CN108804562A (zh) * | 2018-05-22 | 2018-11-13 | 深圳市数字城市工程研究中心 | 一种保持速度特征的道路网约束轨迹线化简方法 |
CN109033011A (zh) * | 2018-06-19 | 2018-12-18 | 东软集团股份有限公司 | 计算轨迹频繁度的方法、装置、存储介质及电子设备 |
CN109033011B (zh) * | 2018-06-19 | 2022-06-21 | 东软集团股份有限公司 | 计算轨迹频繁度的方法、装置、存储介质及电子设备 |
CN110889963A (zh) * | 2018-09-11 | 2020-03-17 | 深圳云天励飞技术有限公司 | 一种道路监控方法、装置及存储介质 |
CN109459770A (zh) * | 2018-09-14 | 2019-03-12 | 咪咕互动娱乐有限公司 | 一种运动轨迹的生成方法、装置及存储介质 |
CN109816982A (zh) * | 2019-02-25 | 2019-05-28 | 东南大学 | 基于共享单车轨迹的虚拟路网非机动车道属性修正方法 |
CN109816982B (zh) * | 2019-02-25 | 2021-05-11 | 东南大学 | 基于共享单车轨迹的虚拟路网非机动车道属性修正方法 |
CN110046209A (zh) * | 2019-03-26 | 2019-07-23 | 太原科技大学 | 一种基于高斯模型的轨迹停止点提取方法 |
CN110046209B (zh) * | 2019-03-26 | 2022-08-09 | 太原科技大学 | 一种基于高斯模型的轨迹停止点提取方法 |
CN110109152B (zh) * | 2019-04-12 | 2021-05-07 | 中国科学院光电研究院 | 一种gnss局地定位误差空间建模方法 |
CN110109152A (zh) * | 2019-04-12 | 2019-08-09 | 中国科学院光电研究院 | 一种gnss局地定位误差空间建模方法 |
CN111831760B (zh) * | 2019-04-23 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN110471999A (zh) * | 2019-08-05 | 2019-11-19 | 北京百度网讯科技有限公司 | 轨迹处理方法、装置、设备和介质 |
CN110450168B (zh) * | 2019-08-28 | 2022-08-12 | 佛山市兴颂机器人科技有限公司 | 一种机器人及其自主导航方法、装置、存储介质 |
CN110450168A (zh) * | 2019-08-28 | 2019-11-15 | 佛山市兴颂机器人科技有限公司 | 一种机器人及其自主导航方法、装置、存储介质 |
CN111274475A (zh) * | 2020-01-16 | 2020-06-12 | 深圳市前海随手数据服务有限公司 | 轨迹特征的提取方法、装置、存储介质及终端 |
CN111307164B (zh) * | 2020-02-25 | 2022-12-02 | 西北大学 | 一种低采样率轨迹地图匹配方法 |
CN111307164A (zh) * | 2020-02-25 | 2020-06-19 | 西北大学 | 一种低采样率轨迹地图匹配方法 |
CN112233413B (zh) * | 2020-07-20 | 2022-03-29 | 北方工业大学 | 一种面向智能网联车辆的多车道时空轨迹优化方法 |
CN112233413A (zh) * | 2020-07-20 | 2021-01-15 | 北方工业大学 | 一种面向智能网联车辆的多车道时空轨迹优化方法 |
CN112462400A (zh) * | 2020-10-26 | 2021-03-09 | 华东师范大学 | 一种移动轨迹数据的漂移点处理方法 |
CN112328728A (zh) * | 2020-11-30 | 2021-02-05 | 浙江师范大学 | 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质 |
CN114126040A (zh) * | 2021-11-08 | 2022-03-01 | 江西省方众物流科技有限公司 | 车辆轨迹优化方法、车辆轨迹定位方法、车辆定位系统 |
CN114328791A (zh) * | 2021-12-30 | 2022-04-12 | 重庆大学 | 一种基于深度学习的地图匹配算法 |
CN114625823A (zh) * | 2022-03-02 | 2022-06-14 | 阿波罗智联(北京)科技有限公司 | 车道线数据处理方法、装置、设备及存储介质 |
CN117706478A (zh) * | 2024-02-02 | 2024-03-15 | 腾讯科技(深圳)有限公司 | 定位漂移的识别方法、装置、设备及存储介质 |
CN117706478B (zh) * | 2024-02-02 | 2024-05-03 | 腾讯科技(深圳)有限公司 | 定位漂移的识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105138779B (zh) | 2018-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105138779B (zh) | 车载gps时空轨迹大数据优选方法及系统 | |
CN111862659B (zh) | 一种gps轨迹数据匹配和补全的方法 | |
CN106912018B (zh) | 基于信令轨迹的地图匹配方法及系统 | |
CN104700617B (zh) | 基于低精度gps轨迹数据的高精度车道信息提取方法 | |
CN111045008B (zh) | 基于展宽计算的车载毫米波雷达目标识别方法 | |
CN108170793A (zh) | 基于车辆语义轨迹数据的停留点分析方法及其系统 | |
CN105718465A (zh) | 地理围栏生成方法及装置 | |
CN108253976B (zh) | 一种充分借助车辆航向的三阶段在线地图匹配算法 | |
CN105608505A (zh) | 一种基于手机信令数据的居民轨道交通出行方式识别方法 | |
EP2906999A1 (en) | System and method in connection with occurrence of platoons | |
CN105910612A (zh) | 一种个性化导航的方法及系统 | |
CN106781478A (zh) | 一种基于lte信令数据的轨迹跟踪方法 | |
Li et al. | Automatic generation and validation of road maps from GPS trajectory data sets | |
CN105806351A (zh) | 一种道路信息推测方法及装置 | |
CN111983655B (zh) | 城市峡谷区域的确定方法、装置、电子设备及存储介质 | |
CN105629198A (zh) | 基于密度的快速搜索聚类算法的室内多目标追踪方法 | |
JP2017003728A (ja) | 地図生成システム、方法、及びプログラム | |
CN104507097A (zh) | 一种基于WiFi位置指纹的半监督训练方法 | |
CN113259900B (zh) | 一种分布式多源异构交通数据融合方法及装置 | |
CN112462401B (zh) | 基于浮动车轨迹数据的城市峡谷快速探测方法及装置 | |
Zhao et al. | A hierarchical scheme of road unevenness perception with lidar for autonomous driving comfort | |
CN110830915B (zh) | 一种确定起点位置的方法及装置 | |
CN116698054B (zh) | 道路匹配方法、装置、电子设备及存储介质 | |
US12044784B2 (en) | Device and method for autonomously locating a mobile vehicle on a railway track | |
US20190197038A1 (en) | Feature data storage apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |