CN111653094B - 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 - Google Patents
一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 Download PDFInfo
- Publication number
- CN111653094B CN111653094B CN202010475926.1A CN202010475926A CN111653094B CN 111653094 B CN111653094 B CN 111653094B CN 202010475926 A CN202010475926 A CN 202010475926A CN 111653094 B CN111653094 B CN 111653094B
- Authority
- CN
- China
- Prior art keywords
- travel
- road
- mode
- time
- road section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/024—Guidance services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/42—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for mass transport vehicles, e.g. buses, trains or aircraft
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Remote Sensing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Aviation & Aerospace Engineering (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于手机信令数据且含路网修正的城市出行方式综合识别方法,针对目标城市全天产生的手机信令数据,识别出每个人的停驻点及全天出行OD,首先通过地铁专用基站精准识别出所有地下轨道交通出行方式,然后在提取手机数据特征参数的基础上与高德GPS真实导航数据相比较,利用无监督的机器学习算法识别居民出行的交通方式。为了更进一步的提高方式划分结果的准确性及合理性,结合目标城市公交线网设计与真实道路的设置及管控情况对结果进行进一步的修正。本发明充分考虑了供给侧不同城市道路中不同等级道路的设置、当地特有的不同路段的管控规定以及真实的公交线网布置情况对出行方式的影响,并以此对交通方式的识别结果进行修正。
Description
技术领域
本发明涉及交通规划领域,具体是交通需求预测领域。
背景技术
交通需求预测是城市交通规划的基础,能够准确地预测城市交通需求对合理管理和控制城市交通系统具有重要意义。在现有的交通需求预测方法(例如交通分配模型)中都高度依赖于不同出行方式下的出行需求估计。然而,鉴于其高度复杂的性质,准确预测不同方式的需求具有一定的难度。这是由于运输系统的运行和交通流的时间/空间波动是不可检测的,因此,有效识别交通方式是当前技术的关键。
以往通过传统调查手段获取出行方式等交通信息的方法存在许多缺陷,如调查成本高,抽样率低等,近年来移动智能设备迅速发展,如何从包含有居民移动位置信息的轨迹数据比如GPS数据、手机信令数据中获取出行方式成为了交通领域关注的热点。
目前现有技术中,张锦等人公开了一种基于手机信令数据的居民出行方式综合判别的方法(CN201510452430.1),采用了出行方式子链与GIS线网匹配结合构建先验概率的方法,将属于机动车出行方式的子链分别与GIS的轨道交通线网、公交线网进行匹配来判别轨道交通出行与常规公交出行,后通过平均速度、最大速度与出行时长三个属性,对剩下可能的出行方式构建先验概率进行判别。该方法采用的GIS线网匹配判断轨道交通出行和公交出行的方法忽略了与轨道线网和公交线网相重叠的小汽车出行的情况,容易造成误判;以及后续构建先验概率的过程中,仅考虑了平均速度、最大速度与出行时长三个属性,由于手机信令数据的位置更新是以基站为单位,得到的出行特征与实际情况都存在一定误差,所以仅考虑这三个属性容易造成误判。
张锦等人还公开了一种基于手机信令数据的半监督SVM的交通方式判别方法(CN201910076104.3),通过人工识别流程对部分出行进行方式识别后,将已标记的样本和未标记的样本一起训练半监督SVM分类器。该方法由于采用了部分人工判别流程,在实际操作中专家的选取与工人标记的组织都有一定困难,耗时长且结果受主观因素影响。
杨继伟等人公开了一种基于大数据机器学习的出行方式辨识方法(CN201710693960.4),通过采集训练样本调查对象的手机信令数据和加速度检测设备数据,分析数据波动特征,获取速度加速度波动特征数据作为预测输入值,出行方式作为输出值,训练机器学习算法,最终选取精度高的算法进行出行方式划分。该方法需要调查对象配合采集加速度检测设备数据,此过程受人力物力等多重因素影响实施难度大,不仅样本数量受到限制,而且数据质量受加速度检测设备质量以及调查对象使用程度影响,且将一次调查采集的数据训练得到的算法模型运用于此后所有出行数据的方式识别并不合理。
发明内容
针对背景技术中存在的问题,本发明提出了一种基于手机信令数据的城市出行方式综合识别方法。
技术方案:
一种基于手机信令数据且含路网修正的城市出行方式综合识别方法,具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分;
S7、根据城市道路与公交线网对部分误判出行方式进行修正,包括:
S71、建立手机4G基站服务范围与城市道路网的对应关系;
S72、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S73、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;
S74、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道等仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S75、基于出行时刻及城市公交线网对公交出行方式进行修正,具体为:
S751、将城市公交线网与城市道路网相匹配,形成每条公交线路相应的道路节点序列,并将该线路的运营时间存储在属性信息里;
S752、针对出行方式识别为公交出行的OD,若其对应路径经过路段无公交线路,则将交通方式修正为小汽车;
S753、针对出行方式识别为公交出行的OD,若其出发时间start_time不在对应公交线路运营时段内,则将交通方式修正为小汽车;
S76、基于当前城市道路管控规定对出行方式识别结果进行修正,具体为:
S761、针对S73中得到的每条出行OD所匹配的出行路径,遍历其经过的每条路段对应的管控规则rule和限制车辆limitation信息;
S762、若经过路段为公交专用道,则将交通方式修正为公交车;
S763、若经过路段为单行道,或经过路口禁止车辆左/右转而对应轨迹仍然左/右转,且识别出的出行方式为机动车出行,则将交通方式修正为电动车;
S764、若经过路段为某种交通方式特别禁行的管控路段,且识别出的出行方式为该种交通方式,则将交通方式修正为当前城市该路段允许通行的交通方式。
优选的,步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。实施中,radius_range可取800m~1500m,min_stay_time取40min。
优选的,步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。
优选的,步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。
实施中,long_dis可取30km~100km,walk_speed选取8km/h,walk_dis选取3km。
优选的,步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。
实施中,α可取0.6~0.9,walk_dis选取3km,max_diff可取0.05~0.15。
本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的预划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K-means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。
优选的,步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
优选的,步骤S71中,具体为:
S711、将城市真实道路网以节点、路段及路段属性的格式生成一张无向图,将路段编号roadID、路段名称roadName、路段类型roadType、路段长度length、管控规则rule、限制车辆limitation等信息存储在路段属性里;
S712、以每个基站为中心建立服务范围缓冲区,与服务范围内的道路节点建立映射关系,计算基站到每个节点的距离作为权重weightNode;
S713、以每个基站为中心建立服务范围缓冲区,与服务范围内的路段建立映射关系,计算基站到每个路段的垂直距离作为权重weightEdge。
优选的,步骤S72中,具体为:
S721、针对每条出行OD基站轨迹序列,按照出发时间start_time进行排序;
S722、根据S71中得到的基站路段对应关系,统计该条出行OD覆盖所有路段的累积频次roadFreq及累积权重roadWeight,并从高到低进行排序;
S723、依次针对出行OD轨迹序列中的每个基站,根据S71中得到的基站道路节点对应关系得到该基站对应所有的道路节点及权重weightNode,针对每个节点根据其对应路段及属性信息与S722所得路段频次roadFreq与权重roadWeight相对应,按照路段频次roadFreq、路段权重roadWeight、节点权重weightNode的顺序对所有节点进行排序,将优先级第一的道路节点标记为该基站的对应道路节点;
S724、将轨迹序列中的所有基站循环匹配得到道路节点的序列,根据S71中生成的路网无向图将节点依次连结,针对不相邻的节点,调用最短路函数补充缺失路段,最终得到路网上一条完整的出行路径。
优选的,步骤S73中,具体为:
S731、根据路段类型roadType筛选出高架、高速、隧道等特殊路段,根据S71中得到的基站路段对应关系分别得到每一个高架、高速、隧道的对应基站序列;
S732、筛选出匹配结果路径中含有高架、高速、隧道与地面重合部分路段的路径,计算出行OD在相应道路上的平均出行速度;
S733、计算出行OD基站轨迹与相应高架、高速、隧道的最长相似子序列,标记该最长相似子序列的基站个数与相应高架、高速、隧道的对应基站序列总基站个数的比值为特殊路段相似度similarity;
S734、若出行OD在相应道路上的平均出行速度大于对应特殊路段速度阈值,且其特殊路段相似度similarity大于相似度阈值,则判断该段出行路径为高架、高速、隧道,反之,则判断该段出行路径为地面路段。
本发明的有益效果
本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K-means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。
本发明充分考虑了供给侧不同城市道路中不同等级道路的设置、当地特有的不同路段的管控规定以及真实的公交线网布置情况对出行方式的影响,并以此对交通方式的识别结果进行修正。
附图说明
图1为本发明的城市出行方式综合识别方法的流程图
图2为实施例中城市真实道路网示例图
图3为基于图2建立的无向图及与基站对应关系示例图
图4为实施例中出行OD轨迹在城市路网上的匹配路径示例图
图5为实施例中城市公交线网示例图
图6为实施例中实际调查获得的居民出行方式比例结构图
图7为实施例中未修正的方式识别结果图
图8为实施例中本发明修正后的方式识别结果图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
手机信令数据是指移动通信网络主动或被动、定期或不定期的为与手机用户的移动终端保持联系所产生的一系列控制指令,包括了手机识别码、时间戳、事件类型、基站编号、基站经纬度、号码归属地等字段,包含了每个用户全天运行轨迹的时空信息,如下表所示:
dt | msid | start_time | start_ci | start_lng | start_lat | end_time | end_ci | end_lng | end_lat |
20190522 | 1 | 20190522000000 | 85132041 | 120.9892 | 31.4025 | 20190522000001 | 85132057 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000001 | 85132057 | 120.9892 | 31.4025 | 20190522000037 | 85132032 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000037 | 85132032 | 120.9892 | 31.4025 | 20190522000055 | 2.33E+08 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000055 | 85132032 | 120.9892 | 31.4025 | 20190522000143 | 85132057 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000143 | 85132057 | 120.9892 | 31.4025 | 20190522000244 | 85132032 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000244 | 85132032 | 120.9892 | 31.4025 | 20190522000246 | 85221124 | 120.9844 | 31.40311 |
表1手机信令数据示例
以江苏省昆山市5月的手机信令数据为例,本发明公开的一种基于手机信令数据且含路网修正的城市出行方式综合识别方法的具体步骤参照图1及技术方案内容,此处不再赘述。步骤S1至步骤S6识别每天每条出行OD的出行方式,结果如下表所示:
id | o_lng | o_lat | d_lng | d_lat | start_time | distance | move_time | speed | 85v | cv | type |
1 | 120.9753 | 31.4095 | 121.0109 | 31.31549 | 20190522062800 | 15.473 | 28.3167 | 32.78556 | 144 | 1.0856 | 小汽车 |
2 | 121.0227 | 31.30474 | 121.037 | 31.31561 | 20190522141700 | 2.684 | 6.5333 | 24.64884 | 75.6 | 0.5736 | 公交车 |
3 | 120.9568 | 31.26589 | 120.9472 | 31.23722 | 20190522102800 | 0.4 | 14.0833 | 1.70424 | 14.4 | 0.3857 | 删除 |
4 | 121.0227 | 31.30474 | 121.0304 | 31.31822 | 20190522110300 | 1.824 | 11.4167 | 9.58608 | 21.6 | 0.0463 | 电动车 |
5 | 121.0304 | 31.31822 | 121.0227 | 31.30474 | 20190522114600 | 1.824 | 9.2333 | 11.85264 | 28.8 | 1.1735 | 电动车 |
表2出行OD方式划分结果示例
步骤S71建立手机4G基站服务范围与城市道路网的对应关系;优选的,具体为:
S711、结合图2-图3,将城市真实道路网(参照图2)以节点、路段及路段属性的格式生成一张无向图(参照图3),将路段编号roadID、路段名称roadName、路段类型roadType、路段长度length、管控规则rule、限制车辆limitation等信息存储在路段属性里;
S712、以每个基站为中心建立服务范围缓冲区,与服务范围内的道路节点建立映射关系,计算基站到每个节点的距离作为权重weightNode;
S713、以每个基站为中心建立服务范围缓冲区,与服务范围内的路段建立映射关系,计算基站到每个路段的垂直距离作为权重weightEdge。
步骤S72将手机信令数据出行OD与城市路网相匹配,得到该次出行的实际出行路径以及所有途径路段的路段属性;优选的,具体为:
S721、针对每条出行OD基站轨迹序列,按照出发时间start_time进行排序;
S722、根据S71中得到的基站路段对应关系,统计该条出行OD覆盖所有路段的累积频次roadFreq及累积权重roadWeight,并从高到低进行排序;
S723、依次针对出行OD轨迹序列中的每个基站,根据S71中得到的基站道路节点对应关系得到该基站对应所有的道路节点及权重weightNode,针对每个节点根据其对应路段及属性信息与S722所得路段频次roadFreq与权重roadWeight相对应,按照路段频次roadFreq、路段权重roadWeight、节点权重weightNode的顺序对所有节点进行排序,将优先级第一的道路节点标记为该基站的对应道路节点;
S724、将轨迹序列中的所有基站循环匹配得到道路节点的序列,根据S71中生成的路网无向图将节点依次连结,针对不相邻的节点,调用最短路函数补充缺失路段,最终得到路网上一条完整的出行路径。
OD基站轨迹序列与匹配结果路径示例如图4所示。
步骤S73、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;优选的,具体为:
S731、根据路段类型roadType筛选出高架、高速、隧道等特殊路段,根据S71中得到的基站路段对应关系分别得到每一个高架、高速、隧道的对应基站序列;
S732、筛选出匹配结果路径中含有高架、高速、隧道与地面重合部分路段的路径,计算出行OD在相应道路上的平均出行速度;
S733、计算出行OD基站轨迹与相应高架、高速、隧道的最长相似子序列,标记该最长相似子序列的基站个数与相应高架、高速、隧道的对应基站序列总基站个数的比值为特殊路段相似度similarity;
S734、若出行OD在相应道路上的平均出行速度大于对应特殊路段速度阈值,且其特殊路段相似度similarity大于相似度阈值,则判断该段出行路径为高架、高速、隧道,反之,则判断该段出行路径为地面路段。
步骤S74、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道等仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车。
步骤S75基于出行时刻及城市公交线网对公交出行方式进行修正,具体为:
S751、将城市公交线网与城市道路网相匹配如图5所示,形成每条公交线路相应的道路节点序列,并将该线路的运营时间存储在属性信息里,如下表所示:
表3公交线网与城市道路网匹配结果示例
S752、针对出行方式识别为公交出行的OD,若其对应路径经过路段无公交线路,则将交通方式修正为小汽车;
S753、针对出行方式识别为公交出行的OD,若其出发时间start_time不在对应公交线路运营时段内,则将交通方式修正为小汽车;
步骤S76基于当前城市道路管控规定对出行方式识别结果进行修正,具体为:
S761、针对S73中得到的每条出行OD所匹配的出行路径,遍历其经过的每条路段对应的管控规则rule和限制车辆limitation信息;
S762、若经过路段为公交专用道,则将交通方式修正为公交车;
S763、若经过路段为单行道,或经过路口禁止车辆左/右转而对应轨迹仍然左/右转,且识别出的出行方式为机动车出行,则将交通方式修正为电动车;
S764、若经过路段为某种交通方式特别禁行的管控路段,且识别出的出行方式为该种交通方式,则将交通方式修正为当前城市该路段允许通行的交通方式。
分别进行无修正的出行方式识别(结果见图7)、含路网修正的出行方式识别(结果见图8),并与居民调查数据实际数据(比例结构见图6)进行比对,相比较未经修正的识别结果,精度提高了约9.6%。
本发明充分考虑了供给侧不同城市道路中不同等级道路的设置、当地特有的不同路段的管控规定以及真实的公交线网布置情况对出行方式的影响,并以此对交通方式的识别结果进行修正。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (6)
1.一种基于手机信令数据且含路网修正的城市出行方式综合识别方法,其特征在于具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4种 交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分;具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行;
S7、根据城市道路与公交线网对部分误判出行方式进行修正,包括:
S71、建立手机4G基站服务范围与城市道路网的对应关系;
S72、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S73、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;具体为:
S731、根据路段类型roadType筛选出高架、高速、隧道特殊路段,根据S71中得到的基站路段对应关系分别得到每一个高架、高速、隧道的对应基站序列;
S732、筛选出匹配结果路径中含有高架、高速、隧道与地面重合部分路段的路径,计算出行OD在相应道路上的平均出行速度;
S733、计算出行OD基站轨迹与相应高架、高速、隧道的最长相似子序列,标记该最长相似子序列的基站个数与相应高架、高速、隧道的对应基站序列总基站个数的比值为特殊路段相似度similarity;
S734、若出行OD在相应道路上的平均出行速度大于对应特殊路段速度阈值,且其特殊路段相似度similarity大于相似度阈值,则判断该段出行路径为高架、高速、隧道,反之,则判断该段出行路径为地面路段;
S74、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S75、基于出行时刻及城市公交线网对公交出行方式进行修正,具体为:
S751、将城市公交线网与城市道路网相匹配,形成每条公交线路相应的道路节点序列,并将该线路的运营时间存储在属性信息里;
S752、针对出行方式识别为公交出行的OD,若其对应路径经过路段无公交线路,则将交通方式修正为小汽车;
S753、针对出行方式识别为公交出行的OD,若其出发时间start_time不在对应公交线路运营时段内,则将交通方式修正为小汽车;
S76、基于当前城市道路管控规定对出行方式识别结果进行修正,具体为:
S761、针对S73中得到的每条出行OD所匹配的出行路径,遍历其经过的每条路段对应的管控规则rule和限制车辆limitation信息;
S762、若经过路段为公交专用道,则将交通方式修正为公交车;
S763、若经过路段为单行道,或经过路口禁止车辆左/右转而对应轨迹仍然左/右转,且识别出的出行方式为机动车出行,则将交通方式修正为电动车;
S764、若经过路段为某种交通方式特别禁行的管控路段,且识别出的出行方式为该种交通方式,则将交通方式修正为当前城市该路段允许通行的交通方式。
2.根据权利要求1所述的方法,其特征在于步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。
3.根据权利要求1所述的方法,其特征在于步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。
4.根据权利要求1所述的方法,其特征在于步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。
5.根据权利要求1所述的方法,其特征在于步骤S71中,具体为:
S711、将城市真实道路网以节点、路段及路段属性的格式生成一张无向图,将路段编号roadID、路段名称roadName、路段类型roadType、路段长度length、管控规则rule、限制车辆limitation信息存储在路段属性里;
S712、以每个基站为中心建立服务范围缓冲区,与服务范围内的道路节点建立映射关系,计算基站到每个节点的距离作为权重weightNode;
S713、以每个基站为中心建立服务范围缓冲区,与服务范围内的路段建立映射关系,计算基站到每个路段的垂直距离作为权重weightEdge。
6.根据权利要求5所述的方法,其特征在于步骤S72中,具体为:
S721、针对每条出行OD基站轨迹序列,按照出发时间start_time进行排序;
S722、根据S71中得到的基站路段对应关系,统计该条出行OD覆盖所有路段的累积频次roadFreq及累积权重roadWeight,并从高到低进行排序;
S723、依次针对出行OD轨迹序列中的每个基站,根据S71中得到的基站道路节点对应关系得到该基站对应所有的道路节点及权重weightNode,针对每个节点根据其对应路段及属性信息与S722所得路段频次roadFreq与权重roadWeight相对应,按照路段频次roadFreq、路段权重roadWeight、节点权重weightNode的顺序对所有节点进行排序,将优先级第一的道路节点标记为该基站的对应道路节点;
S724、将轨迹序列中的所有基站循环匹配得到道路节点的序列,根据S71中生成的路网无向图将节点依次连结,针对不相邻的节点,调用最短路函数补充缺失路段,最终得到路网上一条完整的出行路径。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475926.1A CN111653094B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475926.1A CN111653094B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111653094A CN111653094A (zh) | 2020-09-11 |
CN111653094B true CN111653094B (zh) | 2022-11-15 |
Family
ID=72343351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010475926.1A Active CN111653094B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111653094B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814914A (zh) * | 2020-08-26 | 2020-10-23 | 珠海大横琴科技发展有限公司 | 一种目标对象识别方法及装置 |
CN112511971B (zh) * | 2020-11-26 | 2022-08-16 | 西安建筑科技大学 | 一种基于手机信令数据的出行方式识别方法 |
CN112542045B (zh) * | 2020-12-01 | 2021-09-24 | 江苏欣网视讯软件技术有限公司 | 基于手机信令识别交通出行方式的方法与系统 |
CN112542043B (zh) * | 2020-12-01 | 2021-10-26 | 江苏欣网视讯软件技术有限公司 | 基于手机信令以及大数据分析识别公交线网覆盖盲区的方法与系统 |
CN114598733A (zh) * | 2020-12-02 | 2022-06-07 | 四川交通职业技术学院 | 基于手机信令数据的居民出行量分布计算方法及系统 |
CN113806413B (zh) * | 2021-11-22 | 2022-02-15 | 江苏货斯基网络科技有限公司 | 一种轨迹筛选分类方法、装置、计算机设备和存储介质 |
CN114245329B (zh) * | 2021-12-21 | 2023-04-07 | 北京红山信息科技研究院有限公司 | 通行方式识别方法、装置、设备及存储介质 |
CN115206104B (zh) * | 2022-07-25 | 2024-04-23 | 南京师范大学 | 一种基于手机信令数据的城市居民交通出行方式识别方法 |
CN116052436B (zh) * | 2023-04-03 | 2023-08-01 | 深圳市城市交通规划设计研究中心股份有限公司 | 一种跨城出行方式识别方法、电子设备及存储介质 |
CN118470978B (zh) * | 2024-07-11 | 2024-09-24 | 河北远东通信系统工程有限公司 | 城市路网和移动通信网融合的治安风险预警方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105117789A (zh) * | 2015-07-29 | 2015-12-02 | 西南交通大学 | 基于手机信令数据的居民出行方式综合判别的方法 |
CN105513348B (zh) * | 2015-11-27 | 2018-04-24 | 西南交通大学 | 基于手机信令出行链的od矩阵获取方法 |
CN107705555A (zh) * | 2017-08-28 | 2018-02-16 | 中兴捷维通讯技术有限责任公司 | 基于手机信令采集和分析的交通流量告警系统 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN110310477B (zh) * | 2019-05-14 | 2021-11-02 | 浙江工业大学之江学院 | 基于公交gps与手机信令数据的公交客流检测方法 |
CN111091720B (zh) * | 2020-03-23 | 2020-08-25 | 北京交研智慧科技有限公司 | 基于信令数据和浮动车数据的拥堵路段识别方法及装置 |
-
2020
- 2020-05-29 CN CN202010475926.1A patent/CN111653094B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111653094A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111653094B (zh) | 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 | |
CN111653097B (zh) | 一种基于手机信令数据且含个人属性修正的城市出行方式综合识别方法 | |
CN111653096B (zh) | 一种基于手机信令数据的城市出行方式识别方法 | |
CN111653093B (zh) | 一种基于手机信令数据的城市出行方式综合识别方法 | |
Veloso et al. | Sensing urban mobility with taxi flow | |
CN103646560B (zh) | 出租车行车轨迹经验知识路径的提取方法 | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN114964272B (zh) | 一种融合车载图像语义的车辆轨迹地图匹配方法 | |
CN108765922B (zh) | 一种公交车辆行驶轨迹的分段方法 | |
CN113435777B (zh) | 一种电动运营车辆充电站规划方法及系统 | |
CN112784000B (zh) | 基于出租车轨迹数据的寻客方法 | |
CN102693642B (zh) | 可变信息标志应用系统以及电子导航方法和装置 | |
CN112530158B (zh) | 一种基于历史轨迹的路网补充方法 | |
WO2023014311A1 (en) | Traffic density estimation system and a method thereof | |
CN113569977B (zh) | 一种基于手机信令数据的出行目的识别方法 | |
CN113259900B (zh) | 一种分布式多源异构交通数据融合方法及装置 | |
CN114446048A (zh) | 基于手机信令数据的轨道交通出行者全出行链分析方法 | |
CN113079463A (zh) | 一种基于手机信令数据的旅游景点游客出行活动识别方法 | |
CN115423841B (zh) | 一种面向大宗物流的运输终点校准方法及系统 | |
CN111862662A (zh) | 一种基于公交运行数据的公交线路调整监测方法 | |
CN108303112A (zh) | 一个基于出租车群的城市包裹递送路线规划系统 | |
CN115714957A (zh) | 基于手机信令的地铁出行识别方法、装置、设备及介质 | |
CN115662124A (zh) | 一种基于网络编码的gps轨迹数据路段流量匹配方法 | |
CN113408833A (zh) | 一种公共交通重点区域识别方法、装置及电子设备 | |
CN115630056B (zh) | 一种基于gps轨迹定位的道路巡查量化考核系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |