CN114118766A - 一种基于公交乘客出行多重匹配的客流od算法 - Google Patents
一种基于公交乘客出行多重匹配的客流od算法 Download PDFInfo
- Publication number
- CN114118766A CN114118766A CN202111394078.2A CN202111394078A CN114118766A CN 114118766 A CN114118766 A CN 114118766A CN 202111394078 A CN202111394078 A CN 202111394078A CN 114118766 A CN114118766 A CN 114118766A
- Authority
- CN
- China
- Prior art keywords
- data
- station
- passenger
- time
- card swiping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 29
- 238000005206 flow analysis Methods 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000013075 data extraction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/123—Traffic control systems for road vehicles indicating the position of vehicles, e.g. scheduled vehicles; Managing passenger vehicles circulating according to a fixed timetable, e.g. buses, trains, trams
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Educational Administration (AREA)
- Evolutionary Biology (AREA)
- Game Theory and Decision Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Radar, Positioning & Navigation (AREA)
- Artificial Intelligence (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于公交乘客出行多重匹配的客流OD算法,其特征在于将公交初始刷卡数据与历史刷卡数据相结合,在线路、站台的基础上考虑时间、距离与出行规律等因素,为公交初始刷卡数据分别匹配上车站点与下车站点。基于这些完成上车站点与下车站点匹配的数据,即可以得到不同时间、不同线路、不同站点的客流OD数据。本发明可以获得不同时间段、不同线路、不同站台的客流OD数据,基于各种因素的分析方法也可以实现对于数据的快速分析,提高公交车刷卡数据的利用率,方便结合营运信息对于公交实际线路、站台、场站等因素进行规划调整。
Description
技术领域
本发明涉及公交客流分析技术领域,具体是一种基于公交乘客出行多重匹配的客流OD算法。
背景技术
地面公共交通是城市交通系统的重要组成部分,准确、定量化地评价地面公共交通运行状态是城市交通规划、组织和管理的迫切现实需求,也是实现面向公众提供公共交通信息服务的基础。而客流OD数据的获取可以在很大程度上降低客流数据整体分析的难度以及提高对于客流数据整体评价的准确度,为地面公共交通营运的分析与完善提供数据基础。传统的客流OD数据计算方法存在准确度不高的问题。
发明内容
本发明的目的在于提供一种基于公交乘客出行多重匹配的客流OD算法,将公交初始刷卡数据与历史刷卡数据相结合,在线路、站台的基础上考虑时间、距离与出行规律等因素,为公交初始刷卡数据分别匹配上车站点与下车站点。基于这些完成上车站点与下车站点匹配的数据,即可以得到不同时间、不同线路、不同站点的客流OD数据,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于公交乘客出行多重匹配的客流OD算法,包括公交刷卡数据匹配上车站点和公交刷卡数据匹配下车站点。
1.公交刷卡数据匹配上车站点
将车辆GPS数据与实际站台数据相结合,当车辆GPS数据与实际站台数据差值在一定范围内时视为车辆在站台停靠,于是可以得到车辆的进站时间以及出站时间,这些数据作为对比数据参与上车站点的匹配。
初始刷卡数据:由IC卡刷卡原始数据可以得到IC卡id编号、刷卡时间、线路标识符与车辆标识符,这些数据作为基础数据参与上车站点的匹配。
站台GPS数据:根据公交的实际运营情况,可以得到不同线路轨迹与不同站台的GPS数据,这些数据作为对比数据参与上车站点的匹配。
车辆GPS数据:根据公交的实际运营情况,可以得到不同线路不同车辆的GPS数据,这些数据作为对比数据参与上车站点的匹配。
公交刷卡数据匹配上车站点流程如下:
(3)数据预处理
d.数据提取:将现有数据提取出来分别放到指定容器中,如初始刷卡数据应从IC卡刷卡原始数据中提取,站台GPS数据应从公交运营数据中提取等,提取出来的数据放在指定的容器中等待后续的使用。
e.数据标准化:将提取出来并放到指定容器中的数据进行标准化,如统一初始刷卡数据、站台GPS数据以及车辆进出站时间数据中线路标识符的形式与意义,为了方便展示也可以另外建立表格指定线路标识符与线路名称的对应关系。
f.数据清洗:由于公交硬件以及实际运营环境的影响,IC卡初始刷卡数据中可能会存在错误数据以及冗余数据,这些数据对于客流OD数据获取与分析的准确性是有较大影响的,因此在数据使用之前需要对数据进行清洗,将错误数据以及冗余数据排除在实际分析数据之外;这些错误数据或冗余数据有较多类型,需要根据公交实际运营情况进行分析。如由于刷卡环境或者刷卡设备的影响,部分刷卡数据关键字是有缺失的,这些数据往往无法通过对比匹配到上下车站点,因此往往不作OD匹配,但由于这些数据真实存在,因此数据计入客流统计中。
(4)上车站点匹配
在进行上车站点的匹配时,需要利用初始刷卡数据,站台GPS数据以及车辆进出站时间数据,一般情况下按照分别按照刷卡时间与车辆进站时间分别对于初始刷卡数据以及车辆进出站时间数据进行排序,在匹配时根据线路标识符、站台标识符、车辆标识符等信息进行分类对比。
2.公交刷卡数据匹配下车站点
基于乘客实际乘坐公交的情况,将乘客的出行分为四种情景,第一种乘客上车站点为其所在线路的倒数第二站;第二种刷卡数据是乘客当天的最后一次出行,且乘客当天出行次数不唯一;第三种刷卡数据是乘客当天非最后一次出行;第四种刷卡数据是乘客当天唯一一次出行数据。
利用前面基于初始刷卡数据、站台GPS数据、车辆进出站时间数据匹配到的上车站点以及下车站点,可以得到新的整合数据。利用这些整合数据,结合具体的需求可以对于不同时间、不同线路、不同站点的数据进行分析。
与现有技术相比,本发明可以获得不同时间段、不同线路、不同站台的客流OD数据,基于各种因素的分析方法也可以实现对于数据的快速分析,提高公交车刷卡数据的利用率,方便结合营运信息对于公交实际线路、站台、场站等因素进行规划调整。
附图说明
图1为一种基于公交乘客出行多重匹配的客流OD算法中上车站点匹配流程图。
图2为一种基于公交乘客出行多重匹配的客流OD算法中下车站点匹配流程图。
图3为客流OD数据的应用示意图。
图4为本发明多重匹配的客流OD算法的原理框图。
图5为本发明实施例中乘客上车站点为其所在线路的倒数第二站的示意图。
图6为本发明实施例中出行线路相反或为循环线路的示意图。
图7为本发明实施例中出行线路后续站台距离符合要求的示意图。
图8为本发明实施例中当日最后一次出行与次日首次出行进行对比的示意图。
图9为本发明实施例中连续两次出行线路相同且方向相同的示意图。
图10为本发明实施例中连续两次出行线路相同且方向相反的示意图。
图11为本发明实施例中连续两次出行的线路不一致的示意图。
具体实施方式
下面结合具体实施方式对本专利的技术方案作进一步详细地说明。
参阅图4,一种基于公交乘客出行多重匹配的客流OD算法,基于已有的公交刷卡数据,将当前刷卡数据与历史刷卡数据相结合,分别为当前刷卡数据匹配对应的上车站点与下车站点。当前刷卡数据的上车站点匹配利用了IC卡刷卡数据中的GPS、线路等信息,与实际站台信息进行对比分析完成匹配;当前刷卡数据的下车站点匹配充分考虑了不同情况下的乘客下车情况与出行规律,将当前刷卡数据与历史数据进行对比分析完成了匹配。基于这些匹配到上车站点与下车站点的刷卡数据即可以得到客流OD数据,针对不同的因素对于客流OD数据进行分析可以实现客流OD数据的快速应用。
一种基于公交乘客出行多重匹配的客流OD算法,包括公交刷卡数据匹配上车站点和公交刷卡数据匹配下车站点。
1.公交刷卡数据匹配上车站点
初始刷卡数据:由IC卡刷卡原始数据可以得到IC卡id编号、刷卡时间、线路标识符与车辆标识符,这些数据作为基础数据参与上车站点的匹配。其数据格式如表1所示。
表1初始刷卡数据
站台GPS数据:根据公交的实际运营情况,可以得到不同线路轨迹与不同站台的GPS数据,这些数据作为对比数据参与上车站点的匹配。其数据格式如表2所示。
表2站台GPS数据
车辆GPS数据:根据公交的实际运营情况,可以得到不同线路不同车辆的GPS数据,这些数据作为对比数据参与上车站点的匹配。其数据格式如表3所示。
表3车辆GPS数据
将车辆GPS数据与实际站台数据相结合,当车辆GPS数据与实际站台数据差值在一定范围内时视为车辆在站台停靠,于是可以得到车辆的进站时间以及出站时间,这些数据作为对比数据参与上车站点的匹配。车辆进出站时间数据如下表4所示:
表4车辆进出站时间数据
如图1所示,公交刷卡数据匹配上车站点流程如下:
(1)数据预处理
1)数据提取:将现有数据提取出来分别放到指定容器中,如初始刷卡数据应从IC卡刷卡原始数据中提取,站台GPS数据应从公交运营数据中提取等,提取出来的数据放在指定的容器中等待后续的使用。
2)数据标准化:将提取出来并放到指定容器中的数据进行标准化,如统一初始刷卡数据、站台GPS数据以及车辆进出站时间数据中线路标识符的形式与意义,为了方便展示也可以另外建立表格指定线路标识符与线路名称的对应关系。而且在初始刷卡数据中,由于公交IC卡类型繁多,如有普通卡、学生卡、老年卡、爱心卡等,而且IC卡的id编号也有卡内id编号与卡面id编号之分,因此需要在使用数据之前规范数据,确定IC卡id编号的获取逻辑,统一IC卡id编号的类型。
3)数据清洗:由于公交硬件以及实际运营环境的影响,IC卡初始刷卡数据中可能会存在错误数据以及冗余数据,这些数据对于客流OD数据获取与分析的准确性是有较大影响的,因此在数据使用之前需要对数据进行清洗,将错误数据以及冗余数据排除在实际分析数据之外。这些错误数据或冗余数据有较多类型,需要根据公交实际运营情况进行分析。如由于刷卡环境或者刷卡设备的影响,部分刷卡数据关键字是有缺失的,这些数据往往无法通过对比匹配到上下车站点,因此往往不作OD匹配,但由于这些数据真实存在,因此数据计入客流统计中。
(2)上车站点匹配
在进行上车站点的匹配时,需要利用初始刷卡数据,站台GPS数据以及车辆进出站时间数据,一般情况下按照分别按照刷卡时间与车辆进站时间分别对于初始刷卡数据以及车辆进出站时间数据进行排序,在匹配时根据线路标识符、站台标识符、车辆标识符等信息进行分类对比。具体的匹配分为以下几种情况:
1)车辆当日首次发车
对于当日首次发车车辆,若初始刷卡数据中部分数据的刷卡时间T早于该车辆进入始发站的时间ts,即
T<ts,
则这些初始刷卡数据的上车站点即为该条线路的首发站。
需要注意的是在数据预处理时需要设定一个时间阈值ty,若有该车辆进入始发站的时间ts与刷卡时间T的时间差大于ty,即
ts-T>ty,
则该数据在数据清洗中需要被排除在实际分析数据之外。
2)站间刷卡
在初始刷卡数据中,对于已知车辆标识符的刷卡时间T,在已完成按时间排序的车辆进出站时间数据中有该车辆的一个进站时间区间(ts1,ts2),其中ts1与ts2为紧邻的两个站台的进站时间,若有
ts1≤T<ts2,
则ts1对应的站点即为这些刷卡数据的上车站点。
3)跨线刷卡
在车辆到达末站之后,按照出行规律乘客会全部下车,此时不应该有上车数据,即末站刷卡上车数据应当为0。若在初始刷卡数据中,对于已知车辆标识符的刷卡时间T,在已完成按时间排序的车辆进出站时间数据中有该车辆的一个进站时间区间(ts1,ts2),其中ts1与ts2分别为车辆到达末站的时间以及车辆重新出发进入首站的时间,若有
ts1≤T<ts2,
则这些初始刷卡数据的上车站点即为该车辆重新出发的线路首发站,即ts2对应的站点。
需要注意的是在数据预处理时需要确定该车辆到达末站之后是否有下一班次,若该车辆到达末站后当天不再行驶,则对于刷卡时间T,若有
T>ts1,
则该数据在数据清洗中需要被排除在实际分析数据之外。
2.公交刷卡数据匹配下车站点
如图2所示,基于乘客实际乘坐公交的情况,将乘客的出行分为四种情景,第一种乘客上车站点为其所在线路的倒数第二站;第二种刷卡数据是乘客当天的最后一次出行,且乘客当天出行次数不唯一;第三种刷卡数据是乘客当天非最后一次出行;第四种刷卡数据是乘客当天唯一一次出行数据。下面对于乘客的四种出行情况分别进行分析:
(1)乘客上车站点为其所在线路的倒数第二站
如图5所示,当乘客上车站点为其所在线路的倒数第二站时,对于该条刷卡数据,直接匹配下车站点为该线路的末站。
(2)乘客当天的最后一次出行,且乘客当天出行次数不唯一
1)如图6所示,已知乘客当天最后一次出行乘坐的车辆所属线路,假设为线路A。若乘客当天其它出行线路也有线路A,且其它出行线路与最后一次出行线路方向相反或者线路A为循环线路,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离最后一次出行时间最近的出行上车站点对应的站点。
需要注意的是由于当前数据与对比数据的出发地与目的地方向相反,所以当最后一次出行线路与满足条件的其它出行线路均为循环线路时,上车站点对应的站点即为上车站点本身;当最后一次出行线路与满足条件的其它出行线路方向相反时,上车站点对应的站点即为上车站点的对向站点,下面均是如此。
2)如图7所示,已知乘客当天最后一次出行乘坐的车辆所属线路,假设为线路B。若乘客当天其它出行线路没有线路B,但是从乘客的上车站点开始计算,根据出行规律设置一个距离阈值dy,在线路B的后续站点中,有站点距离乘客其它出行的上车站点距离为D,若有
D<dy,
则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离最后一次出行时间最近的出行刷卡数据上车站点。
需要注意的是这里的距离阈值dy需要根据乘客一般出行规律进行设置,dy的设置和下车站点匹配的精准度有较大关系,初始可以设置dy=800m。
3)若1)、2)条件均不满足,则考虑该乘客的历史刷卡数据。若前一天或前几天内的刷卡数据中含有相同线路,相同方向的刷卡数据匹配到了下车站点,且出行时间段类似,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离该出行时间最近出行的下车站点。
4)如图8所示,若1)、2)、3)条件均不满足,则考虑次日该乘客的出行数据。若该乘客次日的首次出行线路与当日最后一次出行线路相同、方向相反或者为同一条循环线路,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点;若从该乘客刷卡上车开始考虑,当日最后一次出行线路的后续站点中如果存在某个站点与该乘客次日首次出行上车站点的距离D满足
D<dy,
则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点。
(3)乘客当天非最后一次出行
根据初始刷卡数据,乘客每次出行的上车站点可以确定,于是可以考虑乘客连续两次出行是否是同一线路,如果是同一线路的话连续两次出行是否为同一方向进行乘客下车站点的分析,具体流程如下:
1)如果乘客连续两次出行的线路一致,此时可以分为两种情况分别进行讨论:
a.如图9所示,如果乘客连续两次出行的方向相同,设第一次出行上车站点为a1,第二次出行上车站点为a2,且满足在线路的该方向上,a2在a1之后,则a2即为第一次出行的下车站点。
b.如图10所示,如果乘客连续两次出行的方向相反,设第一次上车站点为b1,第二次上车站点为b2,则第一次出行的下车站点即为b2的对向站点。
2)如图11所示,如果乘客连续两次出行的线路不一致,假设乘客第一次出行线路为A,刷卡上车站点为a,第二次出行线路为B,刷卡上车站点为b。若线路A从站点a开始后续的站点中存在站台a1与站点b之间的距离D小于设定的距离阈值dy,则a1即为乘客第一次出行的下车站点。
(4)乘客当天唯一一次出行
1)考虑该乘客的历史刷卡数据。若前一天或前几天内的刷卡数据中含有相同线路,相同方向的刷卡数据匹配到了下车站点,且出行时间段类似,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离该出行时间最近出行的下车站点。
2)考虑次日该乘客的出行数据。若该乘客次日的首次出行线路与当日最后一次出行线路相同、方向相反或者为同一条循环线路,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点;若从该乘客刷卡上车开始考虑,当日最后一次出行线路的后续站点中如果存在某个站点与该乘客次日首次出行上车站点的距离D满足
D<dy,
则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点。
具体的匹配流程示意图见图2。
3.客流OD数据的一些使用
利用前面基于初始刷卡数据、站台GPS数据、车辆进出站时间数据匹配到的上车站点以及下车站点,可以得到新的整合数据。利用这些整合数据,结合具体的需求可以对于不同时间、不同线路、不同站点的数据进行分析。整合数据如下表5所示:
表5基于初始数据与上下站点匹配的整合数据
(1)线路客流分析
对于线路的客流进行分析,首先确定分析的时间段。根据出行特征规律可知,大部分上班、上学等时间集中在早上一段时间与晚上一段时间范围之内,这些时间内客流出行量占全天的比例较大,这也就是常说的早高峰与晚高峰。通过将每天时间划分为早高峰、晚高峰与全天可以更加清晰地分析不同时间段的出行规律。这里根据出行规律将早高峰设为07:00-09:00,晚高峰设为17:00-19:00。
在划分不同时间段的基础之上,可以根据线路对于数据进行聚合,分别获得不同线路的完整刷卡数据与客流OD数据,分析每条线路的客流量;也可以基于客流OD数据,获得每一站的上车数据与下车数据,根据上下车的客流量来确定线路站点的设置是否合理;在此基础之上,也可以分析每一站台在其它站台的下车客流,对于客流量较大的两个站台考虑是否要在站台之间增加线路,对于客流量较小的站台考虑是否可以去掉两站台之间的重复线路。
(2)断面客流分析
对于断面的客流分析,首先确定进行断面划分的时间单元。时间单元不宜过大或过小,时间单元过大会导致对于不同时间段的分析不够明确,无法精确到所需要的时间段;时间单元过小会导致在时间单元内的客流量较小,难以起到数据分析的作用。对于公交客流的分析,将时间单元划分为半个小时或者一个小时为宜。
在时间单元划分完成的基础之上,可以考虑不同线路、不同时间段内的OD客流量。根据表5中的刷卡时间与下车时间,可以得到不同线路、不同时间段内的上车客流与下车客流,通过与该线路不同时间段内客流数据的相互对比,可以对线路一定时间段内的发车班次进行分析,考虑在特定时间段内是否需要增加车辆班次或者减少车辆班次。
(3)站点客流分析
对于站点的客流分析,首先也考虑将分析的时间段划分为早高峰、晚高峰与全天。分别对于不同时间段的客流OD数据进行聚合,可以得到不同时间段某站台的上车客流与下车客流数据,结合线路可以分析站台设置的合理性;进一步地可以将不同的站台根据地理特征划分为不同的区域,可以对于不同区域之间的客流OD数据进行分析,研究不同区域的不同时间段的客流流动趋势可以对于不同区域的线路站台进行规划调整。
需要注意的是这里只是客流OD数据的一部分应用方式,根据实际情况可以选择其它应用方法。
上面对本专利的较佳实施方式作了详细说明,但是本专利并不限于上述实施方式,在本领域的普通技术人员所具备的知识范围内,还可以在不脱离本专利宗旨的前提下作出各种变化。
Claims (10)
1.一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,将公交初始刷卡数据与历史刷卡数据相结合,在线路、站台的基础上考虑时间、距离与出行规律因素,为公交初始刷卡数据分别匹配上车站点与下车站点;基于这些完成上车站点与下车站点匹配的数据,即能够得到不同时间、不同线路、不同站点的客流OD数据。
2.根据权利要求1所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,包括公交刷卡数据匹配上车站点和公交刷卡数据匹配下车站点;
(1)公交刷卡数据匹配上车站点
将车辆GPS数据与实际站台数据相结合,当车辆GPS数据与实际站台数据差值在一定范围内时视为车辆在站台停靠,于是能够得到车辆的进站时间以及出站时间,这些数据作为对比数据参与上车站点的匹配;
(2)公交刷卡数据匹配下车站点
基于乘客实际乘坐公交的情况,将乘客的出行分为四种情景,第一种乘客上车站点为其所在线路的倒数第二站;第二种刷卡数据是乘客当天的最后一次出行,且乘客当天出行次数不唯一;第三种刷卡数据是乘客当天非最后一次出行;第四种刷卡数据是乘客当天唯一一次出行数据。
3.根据权利要求2所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,公交刷卡数据匹配上车站点流程如下:
(1)数据预处理
a.数据提取:将现有数据提取出来分别放到指定容器中等待后续的使用;
b.数据标准化:将提取出来并放到指定容器中的数据进行标准化;
c.数据清洗:由于公交硬件以及实际运营环境的影响,IC卡初始刷卡数据中可能会存在错误数据以及冗余数据,这些数据对于客流OD数据获取与分析的准确性是有较大影响的,因此在数据使用之前需要对数据进行清洗,将错误数据以及冗余数据排除在实际分析数据之外;这些错误数据或冗余数据有较多类型,需要根据公交实际运营情况进行分析;
(2)上车站点匹配
在进行上车站点的匹配时,需要利用初始刷卡数据,站台GPS数据以及车辆进出站时间数据,一般情况下按照分别按照刷卡时间与车辆进站时间分别对于初始刷卡数据以及车辆进出站时间数据进行排序,在匹配时根据线路标识符、站台标识符、车辆标识符信息进行分类对比。
4.根据权利要求3所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,上车站点匹配分为以下几种情况
(1)车辆当日首次发车
对于当日首次发车车辆,若初始刷卡数据中部分数据的刷卡时间T早于该车辆进入始发站的时间ts,即T<ts,则这些初始刷卡数据的上车站点即为该条线路的首发站;
需要注意的是在数据预处理时需要设定一个时间阈值ty,若有该车辆进入始发站的时间ts与刷卡时间T的时间差大于ty,即ts-T>ty,则该数据在数据清洗中需要被排除在实际分析数据之外;
(2)站间刷卡
在初始刷卡数据中,对于已知车辆标识符的刷卡时间T,在已完成按时间排序的车辆进出站时间数据中有该车辆的一个进站时间区间(ts1,ts2),其中ts1与ts2为紧邻的两个站台的进站时间,若有ts1≤T<ts2,则ts1对应的站点即为这些刷卡数据的上车站点;
(3)跨线刷卡
在车辆到达末站之后,按照出行规律乘客会全部下车,此时不应该有上车数据,即末站刷卡上车数据应当为0;若在初始刷卡数据中,对于已知车辆标识符的刷卡时间T,在已完成按时间排序的车辆进出站时间数据中有该车辆的一个进站时间区间(ts1,ts2),其中ts1与ts2分别为车辆到达末站的时间以及车辆重新出发进入首站的时间,若有ts1≤T<ts2,则这些初始刷卡数据的上车站点即为该车辆重新出发的线路首发站,即ts2对应的站点;
需要注意的是在数据预处理时需要确定该车辆到达末站之后是否有下一班次,若该车辆到达末站后当天不再行驶,则对于刷卡时间T,若有T>ts1,则该数据在数据清洗中需要被排除在实际分析数据之外。
5.根据权利要求2所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,当乘客上车站点为其所在线路的倒数第二站时:
对于该条刷卡数据,直接匹配下车站点为该线路的末站。
6.根据权利要求2所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,当乘客当天的最后一次出行,且乘客当天出行次数不唯一时:
(1)已知乘客当天最后一次出行乘坐的车辆所属线路,若乘客当天其它出行线路也有该线路,且其它出行线路与最后一次出行线路方向相反或者该线路为循环线路,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离最后一次出行时间最近的出行上车站点对应的站点;
由于当前数据与对比数据的出发地与目的地方向相反,所以当最后一次出行线路与满足条件的其它出行线路均为循环线路时,上车站点对应的站点即为上车站点本身;当最后一次出行线路与满足条件的其它出行线路方向相反时,上车站点对应的站点即为上车站点的对向站点;
(2)已知乘客当天最后一次出行乘坐的车辆所属线路,若乘客当天其它出行线路没有该线路,但是从乘客的上车站点开始计算,根据出行规律设置一个距离阈值dy,在该线路的后续站点中,有站点距离乘客其它出行的上车站点距离为D,若有D<dy,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离最后一次出行时间最近的出行刷卡数据上车站点;这里的距离阈值dy需要根据乘客一般出行规律进行设置,dy的设置和下车站点匹配的精准度有较大关系;
(3)若(1)、(2)条件均不满足,则考虑该乘客的历史刷卡数据;若前一天或前几天内的刷卡数据中含有相同线路,相同方向的刷卡数据匹配到了下车站点,且出行时间段类似,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离该出行时间最近出行的下车站点
(4)若(1)、(2)、(3)条件均不满足,则考虑次日该乘客的出行数据;若该乘客次日的首次出行线路与当日最后一次出行线路相同、方向相反或者为同一条循环线路,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点;若从该乘客刷卡上车开始考虑,当日最后一次出行线路的后续站点中如果存在某个站点与该乘客次日首次出行上车站点的距离D满足D<dy,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点。
7.根据权利要求2所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,当乘客当天非最后一次出行时:
根据初始刷卡数据,乘客每次出行的上车站点能够确定,于是能够考虑乘客连续两次出行是否是同一线路,如果是同一线路的话连续两次出行是否为同一方向进行乘客下车站点的分析。
8.根据权利要求2所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,当乘客当天唯一一次出行时:
(1)考虑该乘客的历史刷卡数据;若前一天或前几天内的刷卡数据中含有相同线路,相同方向的刷卡数据匹配到了下车站点,且出行时间段类似,则乘客当天最后一次出行刷卡数据的下车站点即为满足条件的距离该出行时间最近出行的下车站点;
(2)考虑次日该乘客的出行数据;若该乘客次日的首次出行线路与当日最后一次出行线路相同、方向相反或者为同一条循环线路,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点;若从该乘客刷卡上车开始考虑,当日最后一次出行线路的后续站点中如果存在某个站点与该乘客次日首次出行上车站点的距离D满足D<dy,则该乘客当天的最后一次出行刷卡数据的下车站点即为次日首次出行上车站点的对应站点。
9.根据权利要求2-8任一所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,利用前面基于初始刷卡数据、站台GPS数据、车辆进出站时间数据匹配到的上车站点以及下车站点,能够得到新的整合数据;利用这些整合数据,结合具体的需求能够对于不同时间、不同线路、不同站点的数据进行分析;分析包括但不限于线路客流分析、断面客流分析、站点客流分析。
10.根据权利要求9所述的一种基于公交乘客出行多重匹配的客流OD算法,其特征在于,线路客流分析、断面客流分析、站点客流分析的具体流程如下:
(1)线路客流分析
对于线路的客流进行分析,首先确定分析的时间段;在划分不同时间段的基础之上,能够根据线路对于数据进行聚合,分别获得不同线路的完整刷卡数据与客流OD数据,分析每条线路的客流量;也能够基于客流OD数据,获得每一站的上车数据与下车数据,根据上下车的客流量来确定线路站点的设置是否合理;在此基础之上,也能够分析每一站台在其它站台的下车客流,对于客流量较大的两个站台考虑是否要在站台之间增加线路,对于客流量较小的站台考虑是否能够去掉两站台之间的重复线路;
(2)断面客流分析
对于断面的客流分析,首先确定进行断面划分的时间单元;在时间单元划分完成的基础之上,能够考虑不同线路、不同时间段内的OD客流量;根据刷卡时间与下车时间,能够得到不同线路、不同时间段内的上车客流与下车客流,通过与该线路不同时间段内客流数据的相互对比,能够对线路一定时间段内的发车班次进行分析,考虑在特定时间段内是否需要增加车辆班次或者减少车辆班次;
(3)站点客流分析
对于站点的客流分析,首先也考虑将分析的时间段划分为早高峰、晚高峰与全天;分别对于不同时间段的客流OD数据进行聚合,能够得到不同时间段某站台的上车客流与下车客流数据,结合线路能够分析站台设置的合理性;进一步地能够将不同的站台根据地理特征划分为不同的区域,能够对于不同区域之间的客流OD数据进行分析,研究不同区域的不同时间段的客流流动趋势能够对于不同区域的线路站台进行规划调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111394078.2A CN114118766A (zh) | 2021-11-23 | 2021-11-23 | 一种基于公交乘客出行多重匹配的客流od算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111394078.2A CN114118766A (zh) | 2021-11-23 | 2021-11-23 | 一种基于公交乘客出行多重匹配的客流od算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114118766A true CN114118766A (zh) | 2022-03-01 |
Family
ID=80440117
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111394078.2A Pending CN114118766A (zh) | 2021-11-23 | 2021-11-23 | 一种基于公交乘客出行多重匹配的客流od算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114118766A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971229A (zh) * | 2022-05-10 | 2022-08-30 | 东南大学 | 基于刷卡与定位数据的轨道交通线路客流车次匹配方法 |
CN116994435A (zh) * | 2023-08-09 | 2023-11-03 | 广州地铁设计研究院股份有限公司 | 一种公交od采集方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105788260A (zh) * | 2016-04-13 | 2016-07-20 | 西南交通大学 | 一种基于智能公交系统数据的公交乘客od推算方法 |
WO2017045294A1 (zh) * | 2015-09-17 | 2017-03-23 | 华南理工大学 | 一种城市常规公交线网设计方法 |
CN110084442A (zh) * | 2019-05-16 | 2019-08-02 | 重庆大学 | 一种联合公交和轨道交通刷卡数据进行客流od计算的方法 |
CN110390349A (zh) * | 2019-06-20 | 2019-10-29 | 浙江大学 | 基于XGBoost模型的公交车客流量预测建模方法 |
-
2021
- 2021-11-23 CN CN202111394078.2A patent/CN114118766A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017045294A1 (zh) * | 2015-09-17 | 2017-03-23 | 华南理工大学 | 一种城市常规公交线网设计方法 |
CN105788260A (zh) * | 2016-04-13 | 2016-07-20 | 西南交通大学 | 一种基于智能公交系统数据的公交乘客od推算方法 |
CN110084442A (zh) * | 2019-05-16 | 2019-08-02 | 重庆大学 | 一种联合公交和轨道交通刷卡数据进行客流od计算的方法 |
CN110390349A (zh) * | 2019-06-20 | 2019-10-29 | 浙江大学 | 基于XGBoost模型的公交车客流量预测建模方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114971229A (zh) * | 2022-05-10 | 2022-08-30 | 东南大学 | 基于刷卡与定位数据的轨道交通线路客流车次匹配方法 |
CN114971229B (zh) * | 2022-05-10 | 2024-06-11 | 东南大学 | 基于刷卡与定位数据的轨道交通线路客流车次匹配方法 |
CN116994435A (zh) * | 2023-08-09 | 2023-11-03 | 广州地铁设计研究院股份有限公司 | 一种公交od采集方法和装置 |
CN116994435B (zh) * | 2023-08-09 | 2024-05-03 | 广州地铁设计研究院股份有限公司 | 一种公交od采集方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109308546B (zh) | 乘客公交出行下车站点预测方法及系统 | |
CN105788260B (zh) | 一种基于智能公交系统数据的公交乘客od推算方法 | |
CN109886491A (zh) | 一种海量运行数据驱动的地面公交两阶段优化调度方法 | |
CN109034566B (zh) | 一种基于公交站点上下客流的智能调度方法及装置 | |
Cortés et al. | Commercial bus speed diagnosis based on GPS-monitored data | |
CN102324128A (zh) | 基于ic卡记录的公交站间od客流预测方法及装置 | |
CN103440768B (zh) | 一种基于动态修正的公交车到达时间实时预测方法 | |
CN109637134B (zh) | 一种公交设备匹配方法 | |
CN107919014B (zh) | 面向多载客里程的出租车运行线路优化方法 | |
CN110298516B (zh) | 一种基于客流od数据的拆分过长公交线路的方法、装置、移动端设备及服务器 | |
CN111932925A (zh) | 一种公共交通站点的出行客流的确定方法、装置及系统 | |
CN107564270A (zh) | 一种智能公交调度运营方法 | |
CN107545730B (zh) | 一种基于公交ic卡数据的站点上下车乘客数估计方法 | |
CN111191816B (zh) | 城市轨道交通乘客出行时间链辨识系统 | |
CN104064028A (zh) | 基于多元信息数据的公交到站时间预测方法及系统 | |
CN114331234B (zh) | 基于乘客出行信息的轨道交通客流预测方法和系统 | |
CN109903555B (zh) | 一种基于大数据的公交乘客下车数据预测方法及系统 | |
CN108364464B (zh) | 一种基于概率模型的公交车辆旅行时间建模方法 | |
CN112418562A (zh) | 一种城市轨道交通网络乘客出行方案推定方法 | |
CN105390013A (zh) | 一种利用公交ic卡预测公交到站时间的方法 | |
CN114118766A (zh) | 一种基于公交乘客出行多重匹配的客流od算法 | |
CN114358808A (zh) | 基于多源数据融合的公交od估计及分配方法 | |
CN110309962A (zh) | 基于时间扩展模型的铁路行程路线规划方法及装置 | |
CN106651728A (zh) | 一种综合运输体系客运方式优势运距的确定方法 | |
CN109308539A (zh) | 实时估算轨道交通线网中换乘站的乘客滞留状态的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |