CN111653093B - 一种基于手机信令数据的城市出行方式综合识别方法 - Google Patents
一种基于手机信令数据的城市出行方式综合识别方法 Download PDFInfo
- Publication number
- CN111653093B CN111653093B CN202010475924.2A CN202010475924A CN111653093B CN 111653093 B CN111653093 B CN 111653093B CN 202010475924 A CN202010475924 A CN 202010475924A CN 111653093 B CN111653093 B CN 111653093B
- Authority
- CN
- China
- Prior art keywords
- travel
- mode
- time
- trip
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0137—Measuring and analyzing of parameters relative to traffic conditions for specific applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/024—Guidance services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/20—Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/30—Services specially adapted for particular environments, situations or purposes
- H04W4/40—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P]
- H04W4/42—Services specially adapted for particular environments, situations or purposes for vehicles, e.g. vehicle-to-pedestrians [V2P] for mass transport vehicles, e.g. buses, trains or aircraft
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Evolutionary Biology (AREA)
- Aviation & Aerospace Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于手机信令数据的城市出行方式综合识别方法,针对目标城市全天产生的手机信令数据,识别出每个人的停驻点及全天出行OD,首先通过地铁专用基站精准识别出所有地下轨道交通出行方式,然后在提取手机数据特征参数的基础上与高德GPS真实导航数据相比较,利用无监督的机器学习算法识别居民出行的交通方式。本发明为提高识别的准确性,采取三种修正方式分别对识别结果进行修正(路网修正、用户个人属性修正、路网和用户个人属性结合修正),并提出优化算法,将三种修正方式进行比对,获得最优的修正结果。
Description
技术领域
本发明涉及交通规划领域,具体是交通需求预测领域。
背景技术
交通需求预测是城市交通规划的基础,能够准确地预测城市交通需求对合理管理和控制城市交通系统具有重要意义。在现有的交通需求预测方法(例如交通分配模型)中都高度依赖于不同出行方式下的出行需求估计。然而,鉴于其高度复杂的性质,准确预测不同方式的需求具有一定的难度。这是由于运输系统的运行和交通流的时间/空间波动是不可检测的,因此,有效识别交通方式是当前技术的关键。
以往通过传统调查手段获取出行方式等交通信息的方法存在许多缺陷,如调查成本高,抽样率低等,近年来移动智能设备迅速发展,如何从包含有居民移动位置信息的轨迹数据比如GPS数据、手机信令数据中获取出行方式成为了交通领域关注的热点。
目前现有技术中,张锦等人公开了一种基于手机信令数据的居民出行方式综合判别的方法(CN201510452430.1),采用了出行方式子链与GIS线网匹配结合构建先验概率的方法,将属于机动车出行方式的子链分别与GIS的轨道交通线网、公交线网进行匹配来判别轨道交通出行与常规公交出行,后通过平均速度、最大速度与出行时长三个属性,对剩下可能的出行方式构建先验概率进行判别。该方法采用的GIS线网匹配判断轨道交通出行和公交出行的方法忽略了与轨道线网和公交线网相重叠的小汽车出行的情况,容易造成误判;以及后续构建先验概率的过程中,仅考虑了平均速度、最大速度与出行时长三个属性,由于手机信令数据的位置更新是以基站为单位,得到的出行特征与实际情况都存在一定误差,所以仅考虑这三个属性容易造成误判。
张锦等人还公开了一种基于手机信令数据的半监督SVM的交通方式判别方法(CN201910076104.3),通过人工识别流程对部分出行进行方式识别后,将已标记的样本和未标记的样本一起训练半监督SVM分类器。该方法由于采用了部分人工判别流程,在实际操作中专家的选取与工人标记的组织都有一定困难,耗时长且结果受主观因素影响。
杨继伟等人公开了一种基于大数据机器学习的出行方式辨识方法(CN201710693960.4),通过采集训练样本调查对象的手机信令数据和加速度检测设备数据,分析数据波动特征,获取速度加速度波动特征数据作为预测输入值,出行方式作为输出值,训练机器学习算法,最终选取精度高的算法进行出行方式划分。该方法需要调查对象配合采集加速度检测设备数据,此过程受人力物力等多重因素影响实施难度大,不仅样本数量受到限制,而且数据质量受加速度检测设备质量以及调查对象使用程度影响,且将一次调查采集的数据训练得到的算法模型运用于此后所有出行数据的方式识别并不合理。
发明内容
针对背景技术中存在的问题,本发明提出了一种基于手机信令数据的城市出行方式综合识别方法。
技术方案:
一种基于手机信令数据的城市出行方式综合识别方法,具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分;
S7、根据城市道路与公交线网对部分误判出行方式进行修正,包括:
S71、建立手机4G基站服务范围与城市道路网的对应关系;
S72、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S73、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;
S74、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道等仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S75、将上述划分结果作为初始数据,对初始数据分别进行三种修正:
修正1:基于出行时刻及城市公交线网对公交出行方式进行修正;该方案充分考虑了供给侧不同城市道路中不同等级道路的设置、当地特有的不同路段的管控规定以及真实的公交线网布置情况对出行方式的影响,并以此对交通方式的识别结果进行修正。
修正2:基于个人属性及个人出行行为特性对出行方式进行修正;该方案基于用户人口类型、私人交通工具出行链闭合原则及用户出行行为特征对识别的出行OD交通方式进行进一步的修正,提高了方式划分结果的准确性。
修正3:顺序使用基于出行时刻及城市公交线网对公交出行方式、基于个人属性及个人出行行为特性对出行方式进行修正。
对于每个修正方案的划分结果,将采用相同出行方式的OD分为一组,共计k组,标记每组数据的集合为Ci,i=1,2,…,k;计算每个出行OD的出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv作为每条OD的特征参数,分别计算三个方案划分结果的DVI 指数:
其中,k指代方式划分结果类别数量,Ci(i=1,2,…,k)表示相同方式OD数据的集合, xi/xj为每条OD数据由上述6个特征参数构成的六维特征向量;
选择DVI指数较大的结果对应的方案作为最终修正结果。
本发明为提高识别的准确性,采取三种修正方式分别对识别结果进行修正(路网修正、用户个人属性修正、路网和用户个人属性结合修正),并提出优化算法,将三种修正方式进行比对,获得最优的修正结果。
优选的,步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。实施中,radius_range可取800m~1500m,min_stay_time取40min。
优选的,步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗 move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。实施中,min_dis选取1km,min_time选取5min, max_speed选取120km/h。
优选的,步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance 小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。
实施中,long_dis可取30km~100km,walk_speed选取8km/h,walk_dis选取3km。
优选的,步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4中交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度 GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
实施中,α可取0.6~0.9,walk_dis选取3km,max_diff可取0.05~0.15。
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance <步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。
优选的,步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
优选的,步骤S75中,基于出行时刻及城市公交线网对公交出行方式进行修正包括:
S711、建立手机4G基站服务范围与城市道路网的对应关系;
S712、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S713、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;
S714、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道等仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S715、基于出行时刻及城市公交线网对公交出行方式进行修正,具体为:
S7151、将城市公交线网与城市道路网相匹配,形成每条公交线路相应的道路节点序列,并将该线路的运营时间存储在属性信息里;
S7152、针对出行方式识别为公交出行的OD,若其对应路径经过路段无公交线路则将交通方式修正为小汽车;
S7153、针对出行方式识别为公交出行的OD,若其出发时间start_time不在对应公交线路运营时段内,则将交通方式修正为小汽车;
S716、基于当前城市道路管控规定对出行方式识别结果进行修正,具体为:
S7161、针对S73中得到的每条出行OD所匹配的出行路径,遍历其经过的每条路段对应的管控规则rule和限制车辆limitation信息;
S7162、若经过路段为公交专用道,则将交通方式修正为公交车;
S7163、若经过路段为单行道,或经过路口禁止车辆左/右转而对应轨迹仍然左/右转,且识别出的出行方式为机动车出行,则将交通方式修正为电动车;
S7164、若经过路段为某种交通方式特别禁行的管控路段,且识别出的出行方式为该种交通方式,则将交通方式修正为当前城市该路段允许通行的交通方式。
其中,步骤S711中,具体为:
S7111、将城市真实道路网以节点、路段及路段属性的格式生成一张无向图,将路段编号roadID、路段名称roadName、路段类型roadType、路段长度length、管控规则rule、限制车辆limitation等信息存储在路段属性里;
S7112、以每个基站为中心建立服务范围缓冲区,与服务范围内的道路节点建立映射关系,计算基站到每个节点的距离作为权重weightNode;
S7113、以每个基站为中心建立服务范围缓冲区,与服务范围内的路段建立映射关系,计算基站到每个路段的垂直距离作为权重weightEdge。
步骤S712中,具体为:
S7121、针对每条出行OD基站轨迹序列,按照出发时间start_time进行排序;
S7122、根据S71中得到的基站路段对应关系,统计该条出行OD覆盖所有路段的累积频次roadFreq及累积权重roadWeight,并从高到低进行排序;
S7123、依次针对出行OD轨迹序列中的每个基站,根据S711中得到的基站道路节点对应关系得到该基站对应所有的道路节点及权重weightNode,针对每个节点根据其对应路段及属性信息与S722所得路段频次roadFreq与权重roadWeight相对应,按照路段频次roadFreq、路段权重roadWeight、节点权重weightNode的顺序对所有节点进行排序,将优先级第一的道路节点标记为该基站的对应道路节点;
S7124、将轨迹序列中的所有基站循环匹配得到道路节点的序列,根据S711中生成的路网无向图将节点依次连结,针对不相邻的节点,调用最短路函数补充缺失路段,最终得到路网上一条完整的出行路径。
步骤S713中,具体为:
S7131、根据路段类型roadType筛选出高架、高速、隧道等特殊路段,根据S711中得到的基站路段对应关系分别得到每一个高架、高速、隧道的对应基站序列;
S7132、筛选出匹配结果路径中含有高架、高速、隧道与地面重合部分路段的路径,计算出行OD在相应道路上的平均出行速度;
S7133、计算出行OD基站轨迹与相应高架、高速、隧道的最长相似子序列,标记该最长相似子序列的基站个数与相应高架、高速、隧道的对应基站序列总基站个数的比值为特殊路段相似度similarity;
S7134、若出行OD在相应道路上的平均出行速度大于对应特殊路段速度阈值,且其特殊路段相似度similarity大于相似度阈值,则判断该段出行路径为高架、高速、隧道,反之,则判断该段出行路径为地面路段。
优选的,步骤S75中,基于个人属性及个人出行行为特性对出行方式进行修正包括:
S721、获得目标城市连续一个月的手机信令数据,并根据上述步骤识别每天每条出行 OD的出行方式;
S722、统计用户居住时段在目标城市停留的天数并根据停留时间识别居住地;
S723、根据用户一月中在目标城市的活动情况判断用户人口类型;
S724、基于用户的人口类型对其出行OD的方式划分进行修正,具体的:
S7241、针对人口类型为过境人口的用户,若其有识别为除小汽车出行以外方式的出行OD,则将交通方式修正为小汽车;
S7242、针对人口类型为短期商旅人口的用户,若其有出行方式识别为电动车出行的OD,则将交通方式修正为小汽车;
S725、基于私人交通工具出行链闭合原则对出行方式进行修正,具体的:
S7251、针对用户每天的出行OD,若出行的起点或终点为步骤S72中识别出的该用户的居住地,则判断该次出行的类型为基于家的出行;
S752、若用户识别出的成对的基于家的出行OD中,其中一条出行方式为私人交通工具,则将另一条基于家的出行OD的交通方式修正为相同私人交通工具;
S726、针对用户一个月的出行模式对机动化交通方式常用用户进行判断;
S727、基于用户出行行为特性对其日常出行的方式划分进行修正,具体为:
S7271、针对每个用户的出行OD基于单位日进行聚类;
S7272、针对电动车常用用户,若当天所有出行OD中出现电动车出行,则当天所有出行距离distance小于电动车出行距离阈值ebike_distance的OD出行方式修正为电动车;
S737、针对小汽车常用用户,若当天基于家的出行方式为小汽车,则当天所有除步行出行以外的出行OD方式都修正为小汽车。
其中,步骤S722具体为:
S7221、针对全样本一个月手机信令时空数据,筛选居住时段出现的数据,并对每个用户基于停留基站进行聚类;
S7222、统计用户居住时段在每个基站的停留的总时间live_stay_time以及该基站在样本数据中居住时段出现的天数live_days;
S7223、计算用户居住时段在每个基站的平均停留时长avg_live_stay;
S7224、识别用户居住时段停留总时间live_stay_time最长且平均停留时长avg_live_stay 大于居住停留时间阈值min_live_time的基站为用户居住基站。
步骤S723具体为:
S7231、统计用户每天在目标城市的平均逗留时长avg_stay及总逗留天数stay_days;
S7232、若用户平均逗留时长avg_stay小于城市停留时间阈值stay_time_min,则判断用户为过境人口;
S7233、若用户平均逗留时长avg_stay大于城市停留时间阈值stay_time_min,且总逗留天数stay_days小于城市停留天数阈值stay_days_min,则判断用户为短期商旅人口。
实施中,城市停留时间阈值stay_time_min可取2hr~5hr,城市停留天数阈值stay_days_min可取7~15天。
步骤S726具体为:
S7261、统计用户一月中所有出行OD中小汽车出行的次数、公交车出行的次数、电动车出行的次数以及机动化出行的总次数;
S7262、分别计算小汽车、公交车、电动车出行在机动化出行中所占比例;
S7263、若其中一种方式所占比例高于机动车出行阈值,则定义用户为该机动化方式的常用用户。
实施中,机动车出行阈值可取70%~90%。
本发明的有益效果
本发明基于手机信令数据在利用地铁专用基站判断地下轨道交通出行的基础上,结合显著出行特征的划分、高德GPS导航规划不同方式的出行路径特征偏移度判断、无监督的模糊K-means聚类机器学习算法,对目标城市一天产生的全样本出行的交通方式进行识别。
本发明为提高识别的准确性,采取三种修正方式分别对识别结果进行修正(路网修正、用户个人属性修正、路网和用户个人属性结合修正),并提出优化算法,将三种修正方式进行比对,获得最优的修正结果。
附图说明
图1为本发明的城市出行方式综合识别方法的流程图
图2为实施例中实际调查获得的居民出行方式比例结构图
图3为实施例中基于修正1方案修正后结果图
图4为实施例中基于修正2方案修正后结果图
图5为实施例中基于修正3方案修正后结果图
图6为修正3的结果中不同交通方式的出行距离分布图
图7为修正3的结果中不同交通方式的出行速度分布图
图8为修正3的结果中小汽车出行全天流量分布图
具体实施方式
下面结合实施例对本发明作进一步说明,但本发明的保护范围不限于此:
手机信令数据是指移动通信网络主动或被动、定期或不定期的为与手机用户的移动终端保持联系所产生的一系列控制指令,包括了手机识别码、时间戳、事件类型、基站编号、基站经纬度、号码归属地等字段,包含了每个用户全天运行轨迹的时空信息,如下表所示:
dt | msid | start_time | start_ci | start_lng | start_lat | end_time | end_ci | end_lng | end_lat |
20190522 | 1 | 20190522000000 | 85132041 | 120.9892 | 31.4025 | 20190522000001 | 85132057 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000001 | 85132057 | 120.9892 | 31.4025 | 20190522000037 | 85132032 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000037 | 85132032 | 120.9892 | 31.4025 | 20190522000055 | 2.33E+08 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000055 | 85132032 | 120.9892 | 31.4025 | 20190522000143 | 85132057 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000143 | 85132057 | 120.9892 | 31.4025 | 20190522000244 | 85132032 | 120.9892 | 31.4025 |
20190522 | 1 | 20190522000244 | 85132032 | 120.9892 | 31.4025 | 20190522000246 | 85221124 | 120.9844 | 31.40311 |
表1手机信令数据示例
以江苏省昆山市5月的手机信令数据为例,步骤S1至步骤S6识别每天每条出行OD的出行方式,结果如下表所示:
表2出行OD方式划分结果示例
步骤S75、将上述划分结果作为初始数据,对初始数据分别进行三种修正:
修正1:基于出行时刻及城市公交线网对公交出行方式进行修正;该方案充分考虑了供给侧不同城市道路中不同等级道路的设置、当地特有的不同路段的管控规定以及真实的公交线网布置情况对出行方式的影响,并以此对交通方式的识别结果进行修正。
修正2:基于个人属性及个人出行行为特性对出行方式进行修正;该方案基于用户人口类型、私人交通工具出行链闭合原则及用户出行行为特征对识别的出行OD交通方式进行进一步的修正,提高了方式划分结果的准确性。
修正3:顺序使用基于出行时刻及城市公交线网对公交出行方式、基于个人属性及个人出行行为特性对出行方式进行修正。
对于每个修正方案的划分结果,将采用相同出行方式的OD分为一组,共计k组,标记每组数据的集合为Ci,i=1,2,...,k;计算每个出行OD的出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv作为每条OD的特征参数,分别计算三个方案划分结果的DVI 指数:
其中,k指代方式划分结果类别数量,Ci(i=1,2,...,k)表示相同方式OD数据的集合,xi/xj为每条OD数据由上述6个特征参数构成的六维特征向量;
选择DVI指数较大的结果对应的方案作为最终修正结果。
结果示例如下表所示:
表3DVI指数评估结果示例
根据DVI指数,修正3方案的修正结果最优,根据图2-图5所示的三种修正方案结果比较(图2为实施例中实际调查获得的居民出行方式比例结构图,作为标准;图3为实施例中基于修正1方案修正后结果图;图4为实施例中基于修正2方案修正后结果图;图5为实施例中基于修正3方案修正后结果图),分析得知修正3方案的结果精度最高。图6-图8则分别以“不同交通方式的出行距离分布”、“不同交通方式的出行速度分布”、“小汽车出行全天流量分布”三个出行指标进行分析,得知修正3方案的各出行方式的出行指标均较为合理。
故选取修正3作为最终的识别方案。
本文中所描述的具体实施例仅仅是对本发明精神做举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (8)
1.一种基于手机信令数据的城市出行方式综合识别方法,其特征在于具体步骤为:
S1、根据手机信令数据识别用户停驻点,得到出行OD;
S2、对出行OD进行预处理,提取出行特征参数,并删除无效OD;
S3、根据地铁专用基站信息识别地铁出行OD;
S4、根据出行距离与出行平均速度对步行及远距离小汽车出行OD进行划分,获得特征显著的出行OD划分结果,剩余未识别的出行OD进行S5;
S5、根据出行起讫点的坐标爬取高德导航规划路径API中的步行、自行车、公交、小汽车这四类交通方式规划路径的出行距离与出行时耗,根据手机数据与高德数据的偏移度值识别OD出行方式,剩余未识别的出行OD进行S6;
S6、使用模糊K-means聚类算法对剩余未识别的出行OD进行方式划分;
S7、根据城市道路与公交线网对部分误判出行方式进行修正,包括:
S71、建立手机4G基站服务范围与城市道路网的对应关系;
S72、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S73、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;
S74、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S75、将上述划分结果作为初始数据,对初始数据分别进行三种修正:
修正1:基于出行时刻及城市公交线网对公交出行方式进行修正;
修正2:基于个人属性及个人出行行为特性对出行方式进行修正;
修正3:顺序使用基于出行时刻及城市公交线网对公交出行方式、基于个人属性及个人出行行为特性对出行方式进行修正;
对于每个修正方案的划分结果,将采用相同出行方式的OD分为一组,共计k组,标记每组数据的集合为Ci,i=1,2,…,k;计算每个出行OD的出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv作为每条OD的特征参数,分别计算三个方案划分结果的DVI指数:
其中,k指代方式划分结果类别数量,Ci表示相同方式OD数据的集合,i=1,2,…,k,xi/xj为每条OD数据由上述6个特征参数构成的六维特征向量;
选择DVI指数较大的结果对应的方案作为最终修正结果。
2.根据权利要求1所述的方法,其特征在于步骤S1对获得的手机信令数据进行清洗后,基于基站停留时间和服务半径识别用户停驻点,当用户以某一基站为中心在服务半径阈值radius_range范围内停留时长超过停驻时间阈值min_stay_time,则将该基站作为用户的停驻点,进而根据出行停驻点得到出行OD。
3.根据权利要求1所述的方法,其特征在于步骤S2针对得到的每条出行OD,提取其出行特征,包括:起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time、出行距离distance、出行时耗move_time、出行平均速度speed、出行全程速度的85分位数speed_85、出行全程速度的变异系数cv;筛选出行距离distance小于有效出行距离阈值min_dis、出行时间move_time小于有效出行时间阈值min_time、出行平均速度speed大于城市交通工具的平均出行速度最大值max_speed的无效OD并删除。
4.根据权利要求1所述的方法,其特征在于步骤S4根据出行OD的出行距离distance与出行平均速度speed对方式进行划分,具体步骤如下:
S41、若出行距离distance超过城市长距离出行阈值long_dis的长距离出行OD,划分为小汽车方式出行;
S42、若平均出行速度speed小于等于步行速度阈值walk_speed同时出行距离distance小于等于步行出行距离阈值walk_dis的出行OD,划分为步行方式出行。
5.根据权利要求1所述的方法,其特征在于步骤S5通过比较OD的出行特征与爬取高德不同方式规划出行的特征相似度识别OD出行方式,具体步骤如下:
S51、针对每条未识别的出行OD,以出行特征起点经度lng、起点纬度lat、终点经度lng、终点纬度lat、出发时间start_time为参数分别爬取高德步行、自行车、公交、小汽车方式规划路径的出行距离GD_dis与出行时耗GD_time;
S52、计算每条出行OD与上述4种交通方式高德规划的总偏移度GD_diff:
i)与高德某交通方式规划时间偏移度GD_time_diff=Math.abs(出行时耗move_time–高德规划时间GD_time)/出行时耗move_time
ii)与高德某交通方式规划距离偏移度GD_dis_diff=Math.abs(出行距离distance–高德规划距离GD_dis)/出行距离distance
iii)与高德某交通方式规划的总偏移度GD_diff=与高德某交通方式规划时间偏移度GD_time_diff*α+与高德某交通方式规划距离偏移度GD_dis_diff*(1–α),其中α为高德规划出行时耗权重;
S53、比较并判断每条OD偏移度GD_diff最低的交通方式;
S54、若步行方式偏移度GD_diff最低且小于偏移度阈值max_diff,且出行距离distance<步行出行距离阈值walk_dis,判断为步行;
S55、若骑行方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为自行车;
S56、若小汽车方式偏移度GD_diff最低且小于偏移度阈值max_diff,判断为小汽车。
6.根据权利要求1所述的方法,其特征在于步骤S6对剩余待识别的OD用模糊K-means机器学习算法进行划分,具体步骤如下:
S61、随机选取10000样本使用模糊K-means算法基于目标函数J(U,C)、模糊化程度m、簇数K进行训练,得到聚类中心C={c1,c2,…,cK};
S62、针对剩余样本计算与每个中心的距离,得到隶属度矩阵Ui={ui1,ui2,…,uiK};
S63、根据每个聚类中心的出行平均速度参数speed大小依次定义每个簇所属交通方式,速度从大到小依次为小汽车、公交车、电动车、自行车、步行。
7.根据权利要求1所述的方法,其特征在于步骤S75中,基于出行时刻及城市公交线网对公交出行方式进行修正包括:
S711、建立手机4G基站服务范围与城市道路网的对应关系;
S712、将手机信令数据出行OD与城市路网相匹配,得到该次出行中包含的所有路段及路段属性;
S713、根据出行特征修正高架、高速、隧道与地面重合部分路段与OD的匹配结果;
S714、基于不同道路类别设置对非机动车出行方式进行修正;
针对经过上述步骤后得到的出行路径中含有高速、高架、隧道仅允许机动车出行的路段的OD,若识别出的出行方式为非机动车,则将交通方式修正为小汽车;
S715、基于出行时刻及城市公交线网对公交出行方式进行修正,具体为:
S7151、将城市公交线网与城市道路网相匹配,形成每条公交线路相应的道路节点序列,并将该线路的运营时间存储在属性信息里;
S7152、针对出行方式识别为公交出行的OD,若其对应路径经过路段无公交线路,则将交通方式修正为小汽车;
S7153、针对出行方式识别为公交出行的OD,若其出发时间start_time不在对应公交线路运营时段内,则将交通方式修正为小汽车;
S716、基于当前城市道路管控规定对出行方式识别结果进行修正,具体为:
S7161、针对S73中得到的每条出行OD所匹配的出行路径,遍历其经过的每条路段对应的管控规则rule和限制车辆limitation信息;
S7162、若经过路段为公交专用道,则将交通方式修正为公交车;
S7163、若经过路段为单行道,或经过路口禁止车辆左/右转而对应轨迹仍然左/右转,且识别出的出行方式为机动车出行,则将交通方式修正为电动车;
S7164、若经过路段为某种交通方式特别禁行的管控路段,且识别出的出行方式为该种交通方式,则将交通方式修正为当前城市该路段允许通行的交通方式。
8.根据权利要求1所述的方法,其特征在于步骤S75中,基于个人属性及个人出行行为特性对出行方式进行修正包括:
S721、获得目标城市连续一个月的手机信令数据,并根据上述步骤识别每天每条出行OD的出行方式;
S722、统计用户居住时段在目标城市停留的天数并根据停留时间识别居住地;
S723、根据用户一月中在目标城市的活动情况判断用户人口类型;
S724、基于用户的人口类型对其出行OD的方式划分进行修正,具体的:
S7241、针对人口类型为过境人口的用户,若其有识别为除小汽车出行以外方式的出行OD,则将交通方式修正为小汽车;
S7242、针对人口类型为短期商旅人口的用户,若其有出行方式识别为电动车出行的OD,则将交通方式修正为小汽车;
S725、基于私人交通工具出行链闭合原则对出行方式进行修正,具体的:
S7251、针对用户每天的出行OD,若出行的起点或终点为步骤S72中识别出的该用户的居住地,则判断该次出行的类型为基于家的出行;
S752、若用户识别出的成对的基于家的出行OD中,其中一条出行方式为私人交通工具,则将另一条基于家的出行OD的交通方式修正为相同私人交通工具;
S726、针对用户一个月的出行模式对机动化交通方式常用用户进行判断;
S727、基于用户出行行为特性对其日常出行的方式划分进行修正,具体为:
S7271、针对每个用户的出行OD基于单位日进行聚类;
S7272、针对电动车常用用户,若当天所有出行OD中出现电动车出行,则当天所有出行距离distance小于电动车出行距离阈值ebike_distance的OD出行方式修正为电动车;
S737、针对小汽车常用用户,若当天基于家的出行方式为小汽车,则当天所有除步行出行以外的出行OD方式都修正为小汽车。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475924.2A CN111653093B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据的城市出行方式综合识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475924.2A CN111653093B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据的城市出行方式综合识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111653093A CN111653093A (zh) | 2020-09-11 |
CN111653093B true CN111653093B (zh) | 2022-06-17 |
Family
ID=72352727
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010475924.2A Active CN111653093B (zh) | 2020-05-29 | 2020-05-29 | 一种基于手机信令数据的城市出行方式综合识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111653093B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112542045B (zh) * | 2020-12-01 | 2021-09-24 | 江苏欣网视讯软件技术有限公司 | 基于手机信令识别交通出行方式的方法与系统 |
CN112801181B (zh) * | 2021-01-27 | 2022-08-05 | 南京邮电大学 | 城市信令交通流用户分类、预测方法、存储介质及系统 |
CN113407906B (zh) * | 2021-05-13 | 2024-02-02 | 东南大学 | 一种基于手机信令数据的交通出行分布阻抗函数的确定方法 |
CN113256987B (zh) * | 2021-06-30 | 2021-10-29 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于多源数据融合的居民出行链生成方法及共乘查询方法 |
CN114141008B (zh) * | 2021-10-29 | 2023-05-12 | 东南大学 | 一种基于手机信令数据的共享公共交通服务区域选取方法 |
CN117292546B (zh) * | 2023-10-23 | 2024-05-07 | 重庆交通大学 | 一种基于手机gps数据的交通出行方式od计算方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030089059A (ko) * | 2002-05-16 | 2003-11-21 | 에스케이 텔레콤주식회사 | 휴대폰을 이용한 차량의 주행 또는 보행 네비게이션 장치및 그의 서비스 방법 |
JP2008146249A (ja) * | 2006-12-07 | 2008-06-26 | Nippon Telegraph & Telephone West Corp | プローブデータ解析システム |
CN102799897A (zh) * | 2012-07-02 | 2012-11-28 | 杨飞 | 基于gps定位的交通方式组合出行的计算机识别方法 |
CN103606279A (zh) * | 2013-11-27 | 2014-02-26 | 中国航天系统工程有限公司 | 一种基于智能手机的道路出行方式判别方法及系统 |
CN104751631A (zh) * | 2015-03-13 | 2015-07-01 | 同济大学 | 基于gps定位和模糊理论判断出行链交通方式的方法 |
CN105101092A (zh) * | 2015-09-01 | 2015-11-25 | 上海美慧软件有限公司 | 一种基于c4.5决策树的手机用户出行方式识别方法 |
CN106327000A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 识别出行方式的方法及系统 |
CN106448173A (zh) * | 2016-11-28 | 2017-02-22 | 东南大学 | 一种基于手机数据的长距离出行交通方式划分方法 |
CN108171974A (zh) * | 2017-12-27 | 2018-06-15 | 东南大学 | 一种基于手机三角定位数据的交通出行模式判别方法 |
CN109272032A (zh) * | 2018-09-05 | 2019-01-25 | 广州视源电子科技股份有限公司 | 出行方式识别方法、装置、计算机设备和存储介质 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109727452A (zh) * | 2019-01-08 | 2019-05-07 | 江苏交科能源科技发展有限公司 | 基于手机信令数据的出行比例核算方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3091498A1 (en) * | 2015-05-07 | 2016-11-09 | TrueMotion, Inc. | Motion detection system for transportation mode analysis |
-
2020
- 2020-05-29 CN CN202010475924.2A patent/CN111653093B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030089059A (ko) * | 2002-05-16 | 2003-11-21 | 에스케이 텔레콤주식회사 | 휴대폰을 이용한 차량의 주행 또는 보행 네비게이션 장치및 그의 서비스 방법 |
JP2008146249A (ja) * | 2006-12-07 | 2008-06-26 | Nippon Telegraph & Telephone West Corp | プローブデータ解析システム |
CN102799897A (zh) * | 2012-07-02 | 2012-11-28 | 杨飞 | 基于gps定位的交通方式组合出行的计算机识别方法 |
CN103606279A (zh) * | 2013-11-27 | 2014-02-26 | 中国航天系统工程有限公司 | 一种基于智能手机的道路出行方式判别方法及系统 |
CN104751631A (zh) * | 2015-03-13 | 2015-07-01 | 同济大学 | 基于gps定位和模糊理论判断出行链交通方式的方法 |
CN106327000A (zh) * | 2015-06-30 | 2017-01-11 | 阿里巴巴集团控股有限公司 | 识别出行方式的方法及系统 |
CN105101092A (zh) * | 2015-09-01 | 2015-11-25 | 上海美慧软件有限公司 | 一种基于c4.5决策树的手机用户出行方式识别方法 |
CN106448173A (zh) * | 2016-11-28 | 2017-02-22 | 东南大学 | 一种基于手机数据的长距离出行交通方式划分方法 |
CN108171974A (zh) * | 2017-12-27 | 2018-06-15 | 东南大学 | 一种基于手机三角定位数据的交通出行模式判别方法 |
CN109272032A (zh) * | 2018-09-05 | 2019-01-25 | 广州视源电子科技股份有限公司 | 出行方式识别方法、装置、计算机设备和存储介质 |
CN109561386A (zh) * | 2018-11-23 | 2019-04-02 | 东南大学 | 一种基于多源定位数据的城市居民出行活动模式获取方法 |
CN109727452A (zh) * | 2019-01-08 | 2019-05-07 | 江苏交科能源科技发展有限公司 | 基于手机信令数据的出行比例核算方法 |
Non-Patent Citations (1)
Title |
---|
基于手机信令和导航数据的出行方式识别方法;杜亚朋 等;《计算机应用研究》;20180831;第35卷(第8期);第2311-2314页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111653093A (zh) | 2020-09-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111653097B (zh) | 一种基于手机信令数据且含个人属性修正的城市出行方式综合识别方法 | |
CN111653093B (zh) | 一种基于手机信令数据的城市出行方式综合识别方法 | |
CN111653094B (zh) | 一种基于手机信令数据且含路网修正的城市出行方式综合识别方法 | |
CN111653096B (zh) | 一种基于手机信令数据的城市出行方式识别方法 | |
CN109145954B (zh) | 一种基于多源时空数据的网约车出行安全评价方法及系统 | |
CN112133090A (zh) | 一种基于手机信令数据的多方式交通分布模型构建方法 | |
CN108761509B (zh) | 一种基于历史数据的汽车行驶轨迹及里程预测方法 | |
CN103646560B (zh) | 出租车行车轨迹经验知识路径的提取方法 | |
CN111862606B (zh) | 一种基于多源数据的非法营运车辆识别方法 | |
Veloso et al. | Sensing urban mobility with taxi flow | |
CN110704993A (zh) | 一种疏解地铁客流压力的定制公交线路设计方法 | |
CN112036757B (zh) | 基于手机信令和浮动车数据的停车换乘停车场的选址方法 | |
CN110836675B (zh) | 一种基于决策树的自动驾驶搜索决策方法 | |
CN103680130B (zh) | 一种基于浮动车技术获得区域带路专家的方法 | |
CN112784000A (zh) | 基于出租车轨迹数据的寻客方法 | |
CN111222381A (zh) | 用户出行方式识别方法、装置、电子设备及存储介质 | |
CN110909434A (zh) | 一种低碳导向下的城市公共交通干线网络设计方法 | |
CN116017407A (zh) | 一种手机信令数据驱动的居民出行方式可靠辨识方法 | |
CN113569977A (zh) | 一种基于手机信令数据的出行目的识别方法 | |
CN116862325A (zh) | 一种城市轨道交通乘客出行链推断方法及系统 | |
CN109489679A (zh) | 一种导航路径中的到达时间计算方法 | |
CN113408833A (zh) | 一种公共交通重点区域识别方法、装置及电子设备 | |
CN117496695A (zh) | 一种基于ic卡数据的乘客换乘站点识别及出行链重构方法 | |
ZHAO et al. | Big data-driven residents’ travel mode choice: a research overview | |
CN115630056B (zh) | 一种基于gps轨迹定位的道路巡查量化考核系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |