CN116739376A - 一种基于数据挖掘的公路路面预防性养护决策方法 - Google Patents
一种基于数据挖掘的公路路面预防性养护决策方法 Download PDFInfo
- Publication number
- CN116739376A CN116739376A CN202310691169.5A CN202310691169A CN116739376A CN 116739376 A CN116739376 A CN 116739376A CN 202310691169 A CN202310691169 A CN 202310691169A CN 116739376 A CN116739376 A CN 116739376A
- Authority
- CN
- China
- Prior art keywords
- road
- pavement
- road surface
- performance
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000007418 data mining Methods 0.000 title claims abstract description 51
- 230000003449 preventive effect Effects 0.000 title claims abstract description 47
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 38
- 238000001514 detection method Methods 0.000 claims abstract description 38
- 230000002159 abnormal effect Effects 0.000 claims abstract description 32
- 238000004458 analytical method Methods 0.000 claims abstract description 26
- 230000005856 abnormality Effects 0.000 claims abstract description 19
- 210000004884 grey matter Anatomy 0.000 claims abstract description 17
- 230000002829 reductive effect Effects 0.000 claims abstract description 15
- 238000012098 association analyses Methods 0.000 claims abstract description 14
- 238000000611 regression analysis Methods 0.000 claims abstract description 10
- 238000012163 sequencing technique Methods 0.000 claims abstract description 5
- 238000000556 factor analysis Methods 0.000 claims abstract description 4
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000011156 evaluation Methods 0.000 claims description 24
- 238000010276 construction Methods 0.000 claims description 16
- 239000002131 composite material Substances 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000012549 training Methods 0.000 claims description 7
- 230000009467 reduction Effects 0.000 claims description 5
- 238000006467 substitution reaction Methods 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 230000002087 whitening effect Effects 0.000 claims description 3
- 230000002035 prolonged effect Effects 0.000 abstract description 2
- 239000010426 asphalt Substances 0.000 description 11
- 238000005065 mining Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 239000004568 cement Substances 0.000 description 10
- 238000005457 optimization Methods 0.000 description 7
- 238000013499 data model Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000005192 partition Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 238000003064 k means clustering Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000288113 Gallirallus australis Species 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000004567 concrete Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013433 optimization analysis Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- General Health & Medical Sciences (AREA)
- Fuzzy Systems (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于数据挖掘的公路路面预防性养护决策方法,属于道路养护相关数据分析技术领域,包括:使用数据挖掘异常检测算法对公路养护路面技术状况记录数据进行预处理,对异常检测结果进行标记;采用回归分析预测算法和灰色系统预测算法对异常检测结果进行组合预测,同时采用路面性能衰减因素分析规则和重载车比例影响分析规则对异常检测结果进行关联分析;建立灰色物元分析算法,结合组合预测结果判断待养护路段和养护优先级,对待养护路段的养护顺序进行辅助排序,再与关联分析结果进行整合,辅助养护职能部门进行养护决策。提高了公路路面养护工作效率,延长路面使用寿命、节省维修费用,降低养护成本,最终提升设备维护管理水平。
Description
技术领域
本发明涉及道路养护相关数据分析技术领域,一种基于数据挖掘的公路路面预防性养护决策方法。
背景技术
在智慧交通的发展趋势下,公路建设和养护是公路发展的两大主题,随着我国公路里程的不断增涨,公路交通网规模的持续扩大,大量的养护工作也随之而来。对于公路部门来说,不仅要使公路建设任务保质保量地完成,以提升高等级公路的覆盖程度,还必须要加强对已建成公路的维修养护,保证其优良的路面使用性能,降低养护费用,保障公路畅通。而公路养护是保持公路性能良好、延长公路使用年限,如果公路的养护工作跟不上路面损耗的速度,路面技术状况会迅速下降,道路的服务水平必然会受到影响,公路建设的初衷也就难以实现。这一系列的现实使得我国公路的发展已经开始由原来的“建设为主”逐渐转变为“建设与养护共进”的发展阶段,公路建造、养护、改建和升级维护的工作接踵而来,这些繁重的工作使得公路养护部门对公路路面养护决策的优化提出了更高的要求。然而,目前我国公路的路面养护决策大部分仍然是采用事后的矫正性养护决策方式,即在路面服务能力下降到一定水平后决定修复措施,这是一种被动的养护方式,成本高、工作量大、养护效率低且养护不能及时进行,在路面等待养护期间可能会导致二次损害。
经过近年的信息化建设已经积累了大量的数据,但由于传统的数据分析方法无法充分挖掘数据中的潜在价值,对于养护数据的处理仍然是以传输和存储为核心,应用分析处于初级阶段,大量的养护数据并未对实际的公路养护决策起到有效的指导作用。因此,如何更好地进行路面养护决策以改善公路路面技术状况、增加公路使用年限、提升路面使用性能,保证公路网使用性能的完好以及安全、舒适的公路特性,发挥有限路面养护资金的最大效益,以更好地发挥公路交通网为我国经济建设发展提供优良交通服务的作用,已成为目前公路养护领域所面临的重要研究课题。数据挖掘技术为发现数据中隐含知识而生,数据挖掘技术并将其应用到公路养护决策中,发挥其数据处理能力,充分挖掘公路养护所积累历史数据中的有用信息,以提高公路路面养护工作效率、延长路面使用寿命、降低养护成本,是一件具有重要意义的事情。
发明内容
本发明的目的在于克服现有技术中所存在的目前我国公路的路面养护决策大部分仍然是采用事后的矫正性养护决策方式,即在路面服务能力下降到一定水平后决定修复措施,这是一种被动的养护方式,成本高、工作量大、养护效率低且养护不能及时进行,在路面等待养护期间可能会导致二次损害的不足,本发明提供一种基于数据挖掘的公路路面预防性养护决策方法。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于数据挖掘的公路路面预防性养护决策方法,包括以下步骤:
S1:使用数据挖掘异常检测算法对公路养护路面技术状况记录实时及海量历史数据进行预处理,对异常检测结果进行深入分析及标记;
S2:采用回归分析预测算法和灰色系统预测算法对所述异常检测结果进行组合预测,得到组合预测结果,同时采用路面性能衰减因素分析规则和重载车型比例影响分析规则对所述异常检测结果进行关联分析,得到关联分析结果;
S3:建立灰色物元分析算法,结合所述组合预测结果判断待养护路段和养护优先级,对所述待养护路段的养护顺序及养护类型进行辅助排序,再与所述关联分析结果进行整合,辅助养护职能部门进行养护决策。
采用上述技术方案,将数字挖掘技术应用到公路养护决策中,能够根据当前路面指标衰减的主要因素进行针对性的预防性养护,实现了公路重点机电设备的前瞻性保养和预防性维修,能够获得设备故障预防性分布与变化趋势,准确分析出养护区段,提高了养护的效率,从而降低了道路病害扩散风险,本发明能够辅助公路养护部门提前进行路面预防性养护计划,并做出合理的路段养护决策,发挥其数据处理能力,充分挖掘公路养护所积累历史数据中的有用信息,以提高公路路面养护工作精准性,延长路面使用寿命、节省维修费用,降低养护成本,最终提升养护管理水平。
作为本发明的优选方案,所述步骤S1包括:
S11:从数据库中扫描路面性能数据集合,随机抽取若干个子样本,构建若干个iTree孤立树,完成路面使用性能记录检测模型的构建和训练;
S12:采用所述路面使用性能记录检测模型进行路面使用性能记录的异常评估。
作为本发明的优选方案,所述步骤S11包括:
S111:随机获取若干个子样本;
S112:从路面技术状况数据的路面技术等级、路面使用性能综合指数、路面破损指数、路面行驶质量指数这四个属性随机选择一个属性作为分割属性,从属性取值范围的最大值和最小值区间内选择一个作为分割值,然后根据所述分割值将若干个所述子样本分割到左右子树中;
S113:对所述左右子树的子样本重复步骤S112,直到所述子样本集合中只有一条记录;
S114:重复步骤S111-步骤S113,直到构建足够数量的所述iTree孤立树,组成孤立森林。
作为本发明的优选方案,所述步骤S12包括:获取需要进行异常检测的路面使用性能记录,根据所述路面使用性能记录检测模型求出所述路面使用性能记录在每一棵所述iTree孤立树中的路径长度,再计算所述路面使用性能记录的异常指数,求得所有路面使用性能记录的异常指数后,将所有的异常指数分成两类,其中,聚类中心大的为异常类,相应的路面性能记录被标记为异常;聚类中心小的为正常类,相应的路面性能记录被标记为正常。
作为本发明的优选方案,所述路径长度的计算公式为:
h(x)=L+C(n)
其中,h(x)为路径长度,x为路面使用性能记录,L为路面使用性能记录最终所在叶子节点的二叉树中的高度,C(n)为n个节点的二叉树的平均高度;
其中,h(n)=In(n)+γ(n>1),γ为欧拉常数又称欧拉-马斯克若尼常数,γ的数值定为0.5772156649,H为一条数据记录在二叉树构造中的高度,n为叶子节点包含的记录条数;
所述异常指数的计算公式为:
其中,n为决策树iTree的总节点数φ,计算出异常指数后根据这个异常指数来判断测试数据x是否为异常数据,C(n)为n个节点的二叉树的平均高度,E(h(x))为表示记录x在每棵树的高度均值,h(x)表示叶子节点到根节点的长度路径用来判断一条记录x是否是异常点。
作为本发明的优选方案,所述步骤S2所述的回归分析预测算法的计算公式为:
其中,PPI为路面性能指标,PPI0为路面西能指标的初始值,α为路面的寿命因子,即路面性能衰减到初始值得63.2%时所经过的年限,β为路面性能衰变曲线的形状因子,t为路龄;
对所述回归分析预测算法的计算公式进行变量替换,令Int等于x,β等于a,βlna-1等于等于y,得到变换公式为:
y=ax+b;
采用最小二乘法估计参数a、b的值,计算公式分别为:
其中(xi,yi)根据对应的历史路面性能指标数据PPI和t获得,即xi为当前路面实际性能指标,yi为随着t路龄增长后预测的未来路面性能指标,获得参数a、b的估计值后,根据关系式β=a,βlnα-1=b,求出α和β的值,n为表示观测点组数,即为历史路面性能指标数据组数。
作为本发明的优选方案,所述步骤S2所述的灰色系统预测算法的计算公式为:
x0(k)+mz1(k)=q
其中,m、q为待估计参数,x0(k)为路面性能指标数据在时刻k的实际状态,z1(k)为路面性能指标数据在时刻k的预测状态;
所述灰色系统预测算法的白化公式为:
其中,d为预测误差序列的长度,X1为预测误差序列;
根据最小二乘法得到参数m、q的估计公式分别为:
其中,n为表示观测点组数,即为历史路面性能指标数据组数。
作为本发明的优选方案,所述步骤S2所述的组合预测的计算公式为:
其中,Y(t)为回归分析预测算法的预测值,Y(t)为灰色系统预测算法的预测值,wj为权重参数,w1为回归预测结果的权重,w2为灰色系统预测结果的权重。
作为本发明的优选方案,所述步骤S2所述的关联分析的规则包括:
规则1:公路交通流量中重载车型比例达到30%时,路面使用性能综合指数等级为中的概率0.99;
规则2:当重载车型比例达到40%时,路面使用性能综合指数等级下降到差等级的概率为0.99;
规则3:当重载车型比例达到50%时,PQI等级下降到次等级的概率为0.97;
规则4:当重载车型的比例达到40%时,路面破损指数为差等级的概率为0.96;
规则5:当重载车型的比例达到50时,路面破损指数下降到次的概率为0.95;
规则6:当重载车型比例达到50%,行驶质量指数为差的概率为0.90;
其中,所述规则1、规则2、规则3表示路面使用性能综合指数跟重载车型的比例呈负相关;
所述规则4、规则5表示重载车型比例过大也将会导致路面破损更加严重;
所述规则6表示重载车型过大也是路面行驶质量指数下降的一个重要因素。
作为本发明的优选方案,所述步骤S3所述的建立灰色物元分析算法,结合所述组合预测结果判断待养护路段和养护优先级包括以下步骤:
S31:建立最佳路段事物灰元:
其中,C1为公路整体养护技术状况指数(MQI)、C2为路面使用性能综合指数(PQI)、C3为路段破损状况指数(PCI)、C4为路面行驶质量指数(RQI)、Dn为矩阵的列数即各指标数据个数、an1~an4为指定路面指标对应矩阵列数据;
S32:选择n个路段中该项属性的最大值作为最佳路段灰元该项属性的值,对于组成最佳事物灰元:
S33:根据已有的路段技术状况评价基础数据以及相关的路段评价体系,建立各个路段与最佳路段的关联系数4维复合灰元:
其中,Ln1~Ln4为指定路面指标对应的矩阵列数据;
S34:关联值的计算公式为:
其中,Lij为第j个路段与上述所说的最佳路段的第i项特征参数的关联值,Δij为最佳路段灰元与第j个路段的第i维特征的差值,Δmin为最佳路段与其他所有路段各维特征指数差值的最小值,Δmax为最佳路段与其他所有路段各维特征指数差值的最大值,参数p为分辨系数,通常取所述参数p等于0.5;
S35:将各个离散的关联系数进行整合,得到关联度复合灰元:
其中,L0j是指待评价的各个路段与最佳路段之间的关联性的大小;wi为各特征属性的权重系数;
S36:通过所述关联度复合灰元得出:其中每一个值表示相应路段与最佳路段灰元的相似程度,所以其值越大,表示相应路段的路面使用性能越好,其值越小,表示相应路段的路面使用性能越差,而在进行路段养护时最基本的原则应该是先养护路面使用性能较差的,那么各路段养护的优先级应该是与路段与最佳路段灰元的关联度成反比的,关联度越小的路段养护优先级越高,关联度越大的路段养护优先级越低。
与现有技术相比,本发明的有益效果在于:将数字挖掘技术应用到公路养护决策中,选用公路技术状况评定核心点参数,能够根据当前路面指标衰减的主要因素对道路路面未来一段时间的路面况参数,进行针对性的预防性养护,实现了公路重点机电设备的前瞻性保养和预防性维修,能够获得设备故障预防性分布与变化趋势,提高了养护的效率,从而降低了道路病害扩散风险,本发明能够辅助公路养护部门提前进行路面预防性养护计划,并做出合理的路段养护决策,发挥其数据处理能力,充分挖掘公路养护所积累历史数据中的有用信息,以提高公路路面养护工作效率,延长路面使用寿命、节省维修费用,降低养护成本,最终提升道路养护管理水平。
附图说明
图1为本发明所述的一种基于数据挖掘的公路路面预防性养护决策方法的流程图;
图2为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的基于iForest的路面性能数据异常检测流程图;
图3为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的沥青路面iForest模型属性表;
图4为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的水泥路面iForest模型属性表;
图5为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的水泥路面技术状况数据图;
图6为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的iTree子样本集图;
图7为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的路面技术状况数据iTree的构造流程图;
图8为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的求待检测路面技术状况记录的路径长度流程图;
图9为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的路面使用性能预测整体流程图;
图10为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的PCI回归模型预测值以及与真实值的误差表;
图11为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的回归模型下PCI预测实际值对比以及变化趋势图;
图12为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的GM(1,1)模型下PCI预测值以及与实际值的误差图;
图13为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的GM(1,1)模型下PCI预测实际值对比以及变化趋势图;
图14为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的路面使用性能组合预测结果图;
图15为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的组合预测结果对比图;
图16为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的Apriori算法流程图;
图17为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的路面性能指标内部影响关联规则表;
图18为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的交通流量对于路面使用性能影响的关联规则表;
图19为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的养护决策优化流程图;
图20为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的沥青路面使用性能数据表;
图21为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的灰色物元实际应用的路段基础数据表;
图22为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的典型养护单价表;
图23为本发明实施例2所述的一种基于数据挖掘的公路路面预防性养护决策方法的不同决策方法下的养护资金需求对比表。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
一种基于数据挖掘的公路路面预防性养护决策方法,如图1所示,包括以下步骤:
S1:使用数据挖掘异常检测算法对公路养护路面技术状况记录实时及海量历史数据进行预处理,对异常检测结果进行深入分析及标记;
S2:采用回归分析预测算法和灰色系统预测算法对所述异常检测结果进行组合预测,得到组合预测结果,同时采用路面性能衰减因素分析规则和重载车型比例影响分析规则对所述异常检测结果进行关联分析,得到关联分析结果;
S3:建立灰色物元分析算法,结合所述组合预测结果判断待养护路段和养护优先级,对所述待养护路段的养护顺序及养护类型进行辅助排序,再与所述关联分析结果进行整合,辅助养护职能部门进行养护决策。
iForest算法的核心在于构建由IsolationTree(简称为iTree)组成的随机森林。iForest算法是以节点为单位,而一个节点就相当于数据库中的一条记录,是由不同属性的属性组合而成。采用用d表示一个数据节点;A表示数据节点中的一个属性;Ti表示某一个随机的数据节点集合,称为一个样本集合;D表示所有数据节点的集合即是数据库。根据上面的定义表达式如下:dj={Al,A2,A3,……,An}表示一个节点(记录)以及所包含的属性,A表示属性集合,D={d1,d2,d3,……,dn}是全部数据记录所组成的集合。
(1)IsolationTree
IsolationTree(iTree)是一颗随机二叉树,每个节点要么是叶子节点,要么是包含两个子节点的内部节点,iTree的定义过程如下:
①从数据集合D中随机抽取ψ个数据节点作为iTree的构造样本集合
②从样本的属性集合A中随机选择一个属性Aj作为分割属性,并且从该属性Aj的最大值与最小值之间随机选择一个值p作为分割值;
③对样本集合ψi的每一个数据节点dj,按照属性Ai的值(记为dj(Ai))进行划分。如果dj(Ai)<p,则将数据节点dj放在左子树中集合中;如果dj(Ai)>=p,则将数据节点dj放在右子树集合ψR中。
④按步骤③的方式对左、右子树集合ψL和ψR中的数据进行迭代处理,直到满足下列条件之一a):子树中只有一条数据或者所有数据具有相同的属性;b)二叉树的高度达到指定的高度log2(ψ)。
(2)路径长度h(x)
h(x)的含义是一条数据记录x在一颗iTree二叉树中的高度。其计算方法是使记录x从二叉树的根节点开始,按照二叉树的构造进行遍历,找到x在树中的所处的叶子节点,然后根据路径长度公式(3-1)进行计算。
h(x)=L+C(n) (3-1)
式中L为x最终所在叶子节点在二叉树中的高度,n表示当前叶子节点包含的记录条数,C(n)表示包含n个节点的二叉树的平均高度如式(3-2)所示。
式中,h(n)=In(n)+γ(n>1),γ为欧拉常数又称欧拉-马斯克若尼常数,γ的数值定为0.5772156649,H为一条数据记录在二叉树构造中的高度,n为叶子节点包含的记录条数。
(3)异常指数
异常指数是表示一条记录异常的程度,其计算公式如式(3-3)所示:
式中n为决策树iTree的总节点数当通过公式(3-3)计算出异常指数后就可以根据这个异常指数来判断测试数据x是否为异常数据。
本发明将采用k-均值聚类方法对最后的异常分数进行分类,以此来判断目标记录是否是异常的,基本标准为异常指数接近1的分类为异常分类,异常指数基接近0的分类为正常分类。
基于iForest的路面性能数据异常检测流程大致分为两个阶段,分别为模型构建阶段和异常评估阶段端。模型构建阶段主要工作是通过原始路面性能数据集合,生成足够数量的iTree孤立树,这是一个隐含的抽取数据特征的过程;异常评估阶段是利用生成iTree孤立树,计算待检测路面使用性能记录的异常分数,然后根据异常分数判断其是否异常,具体流程如图2所示;
具体说明如下所示:
(1)从数据库扫描路面性能数据集合,然后随机抽取一定数量的子样本,通过特定的方式开始构建iTree孤立树,如果iTree的数量未到达要求,则重复抽取子样本构建iTree孤立树,如果iTree数量达到要求则模型构建阶段结束,进入路面使用性能记录的异常评估阶段。
(2)获取需要进行异常检测路面性能记录x,根据特定的算法方式求出x在每一棵iTree中的路径长度,然后根据公式(3-3)计算该条记录x的异常指数;待求得所有路面性能记录的异常指数后,对所有的异常指数采用k-均值聚类法将其分成两类。聚类中心大的为异常类,相应的路面性能记录被标记为异常;聚类中心小的为正常类,相应的路面性能记录被标记为正常。
在开展公路路面使用性能记录异常数据挖掘时,首先需合理选择适用属性指标,要求能较好地符合现阶段的公路养护决策所关注的特征;接下来应确定需模型中构造iTree树的子样本大小T,要求在不增大建模难度的条件下,力求最大可能地获取路面使用性能数据的分布特征。
根据某典型公路提供的养护技术状况数据,养护技术状况数据的组成拥有众多的属性,如路线编码、起止点桩号、检测方向、路面类型、路面破损状况指数(PCI)、路面行驶质量指数(RQI)、路面车辙深度指数(RDI)、路基技术状况指数(SCI)、沿线设施技术状况指数(TCI)等大量信息,根据本发明目标,主要研究跟路面使用性能相关的数据属性。而路面使用性能有多个评价属性,具体而言是有综合路面使用性能指数,比如路面使用性能综合指标PQI;也有构成路面使用性能的单个性能指标,如行驶质量指数RQI等。
选取哪些属性指数作为数据挖掘分析属性,不仅受到系统数据的约束,还将直接影响到后续工作的进一步开展。考虑到普通公路路面对于路况检测数据采集的实际情况,本发明针对沥青路面与水泥路面分别选择不同的属性建立模型。具体如下,a.沥青路面模型属性:路面技术等级、路面使用性能综合指数(PQI)、路面破损指数(PCI)、路面行驶质量指数(RQI)、路面车辙指数(RDI),如图3所示;b.水泥路面模型属性:路面技术等级、路面使用性能综合指数(PQI)、路面破损指数(PCI)、路面行驶质量指数(RQI),如图4所示。
由于抗滑性能指数是选择性检测数据,大部分路段此项数据不全,所以不作为本发明研究范围。
由于本发明中具有沥青路面和水泥路面两种不同的路面数据需要挖掘分析,而对于这两种类型数据模型训练的过程大体相同,所以使用水泥路面的iForest模型构建进行模型训练阶段具体处理过程的说明。iForest模型训练阶段最重要的处理过程就是构造足够数量的iTree孤立树。假设从数据库中随机提取到部分水泥路面技术状况记录如图5所示,对于路面技术等级属性(TL)进行数值化映射(“一级”=1,“二级”=2,“高速”=0),并且忽略不作为模型属性的起点桩号以及止点桩号,生成一个标准的构造其中一棵iTree二叉树的子样本集如图6所示,实际应用一般选择的子样本大小T为256,本章为了详细介绍其模型训练建模的过程,使用20条记录的样本作为子样本进行过程说明。
模型训练阶段对于路面技术状况数据的具体处理过程说明如下:
A1:子样本的20条路面技术状况记录为随机获取,并且是不放回抽样,在本次使用这
20条记录构建了iTree后,在后续的iTree构造过程中不再选择这些已经使用过的数据。
A2:从路面技术状况数据的四个属性TL、PQI、PCI、RQI中随机选择一个属性作为当前节点的分割属性,从属性取值范围的最大值和最小值区间内选择一个作为分割值p,然后根据分割属性的值将当前记录分割到左右子树中。在第一步中选择的分割属性为PCI,分割值为92.00,据此分割20条记录,左子树中子样本集合为{13,14,16,19,20},右子树的子样本集合为{1,2,3,……,12,15,17,18}。
A3:对于左右子树的子样本重复A2步骤,直到子样本集合中只有一条记录、所有记录相同或者是达到最大限制高度log2(20)时,本次iTree构造结束。
A4:一直重复A1-A3步,直到构建足够数量的iTree组成孤立森林。
进行路面性能数据的模型评估,首先获取路径长度:
对待检测对象x进行异常评估的核心步骤是遍历每一棵iTree获取对象x在不同树中的所处节点的路径长度。以上述构建的iTree如图7所示,详细说明一条路面技术状况记录求其路径长度h(x)过程。假设需要对如图6中的第1条记录{1,97.13,100,94.86}和第13条记录{1,89.65,88.64,89.07}进行评估,其在iTree中路径长度求取过程如图8所示。
具体说明如下:
(1)使用第1条记录遍历iTree,获得其高度h。最开始使用属性PCI分割,分割值92.00,因为第1条记录的PCI为100,大于92.00,所以进入右子树,此时高度h=1;第二次分割使用属性PQI,分割值为93.87,因为第1条记录的PQI为97.13,大于分割值,所以仍然进入右子树,此时高度h=2;第三次使用分割属性RQI,分割值92.67,因为第1条记录的RQI为94.86,大于分割值,所以进入右子树,此时高度h=3;第四次分割使用属性TL,分割值为1,因为第1条记录TL为1,进入右子树,此时高度h=4;到达iTree的叶子节点,结束遍历。
(2)求最终的路径长度h(x),若最终到达的叶子节点的样本的个数为1,则h(x)等于第1步求得的高度h;若最终到达的叶子节点的样本个数大于1,则根据公式(3-1)计算其路径长度h(x)。
(3)根据以上所述最终第1条记录在图7所示的iTree中的h(x)等于7.17;第13条记录在图7中所示的iTree中的h(x)等于2。
其次进行异常判断,当通过上述步骤在求出带检测记录x在所有iTree中的路径长度后,即可根据公式(3-3)计算该条记录的异常指数s(x,n),当计算出所有待检测记录的异常指数后,根据k-均值聚类将所获得的异常指数分成两类,同时对相应的记录分类结果。
具体的,以2018年某省公路养护统计报表中的路面技术状况数据为例进行异常检测模型效果验证,由于沥青路面与水泥路面采用不同的模型属性,所以对应的原始数据也存在属性上的区别,下文将分别以沥青路面和水泥路面对进行异常检测之前的路面使用性能数据和进行异常检测后的路面性能数据进行对比分析。
一、检测前路面使用性能原始数据
如图9所示,在开始进行路面使用性能预测时,首先获取经过前面的异常检测的正常路面性能记录,然后利用历史数据分别估计回归模型参数和灰色系统参数,通过两个不同的模型度同一路段的未来路面使用性能指标进行预测,然后使用组合预测综合回归预测和灰色系统预测结果,作为最终路面性能指标的预测结果。
通过研究和实际观测表明,路面使用性能的衰减并不是线性的,在公路刚开始投入使用时,其性能下降缓慢,而当性能下降到一定值后将会开始急剧下降。根据这一特性采用式(4-1)所示的非线性回归方程进行预测。
其中PPI表示路面性能指标,PPIO表示路面性能指标的初始值(一般开始为100),α表示路面的寿命因子,既是路面性能衰减到初始值得63.2%时所经过的年限,β表示路面性能衰变曲线的形状因子,t表示路龄(以最佳性能年为0年)。
对公式(4-1)进行等价变换,可化为下式(4-2a):
对式(4-2a)进行变量替换,令lnt等于x,β等于a,βlnα-1等于 等于y,则原式可以变为下式
y=ax+b(4-2b)
对于式(4-2b)采用最小二乘法进行估计参数a、b的值,其公式如下所示。其中(xi,yi)可以根据对应的历史路面性能指标数据PPI和t获得。
其中(xi,yi)根据对应的历史路面性能指标数据PPI和t获得,即xi为当前路面实际性能指标,yi为随着t路龄增长后预测的未来路面性能指标,n为观测点组数,即为历史路面性能指标数据组数。获得参数a、b的估计值后,根据关系式β=a,βlnα-1=b,求出α和β的值。然后根据公式(4-1)对未来某一时间的路面使用性能进行预测。
由于影响路面使用性能的因素众多并且具有不确定性,因此可以采用时间序列预测模型中的灰色理论对其进行预测分析。而数列预测模型GM(1,1)是较常用的时间序列预测模型,其建立模型以及求解参数的过程如下所示。
假设有初始离散数列:Xo={xo(1),xo(2),xo(3,…xo(n))},进行一次累加,生成一个新的数列Xi={x1(1),xi(2),xi(3),…x1(n)},其中然后可以求出X1的紧邻均值生成序列Zi={zi(1),zi(2),…z(n)},其中zi=0.5x1(k)+0.5x1(k-1)。则可以得到GM(1,1)的模型方程如式(4-5)所示:
x0(k)+az1(k)=b (4-5)
同时将公式(4-6)称为上式(4-5)的白化方程。
其中a、b为待估计参数,根据最小二乘法原则,可以得到a、b的估计公式(4-7)和(4-8)如下所示:
求解微分方程式(4-6),并且取xi(1)=xo(1),取t为离散值k+1,得到其X1的预测模型如式(4-9)所示:
根据X1和Xo的关系,将x1(k+1)还原到原始数据xo(k+1),如下式(4-10)所示:
由于路面使用性能的预测结果将会直接影响到养护决策的选择,而为了尽量保证预测结果的准确性,避免使用单一方法导致的不确定性,本发明基于加权平均的思想设计了加权算术平均组合预测模型对上述的回归预测结果与灰色系统预测结果进行组合。为了表述方便首先假设回归预测模型与灰色系统预测模型的结果以Y,(t)与Y(t)来表示,并设W1为回归预测结果的权重,W2为灰色系统预测结果的权重。
加权算术平均组合预测模型具体求解过程如下式(4-11)所示。
其中Y,(t)和Y,(t)是回归模型和灰色系统模型的预测值,因此都是确定的值,因为需要路面使用性能的预测结果来进行养护路段的决策,因此需要采用预测结果与实际值误差尽可能小的原则来建立二次规划模型来确定权重参数w1和w2的值,具体规划方程如下式(4-12)和(4-13)所示。
w1+w2=1 (4-13)
其中,J′(t)表示实际值与预测值的误差平方和,而要使得预测值与实际值越接近,既是使得J′(t)达到最小值。求解过程如下。
首先对式(4-12)分别求w1和w2的偏导,然后令其等于0,结果如式(4-14)和式(4-15)所示。
其中,联合式(4-13)和式(4-14)(或者式4-13和式4-15)可以得到两组对称的w1和w2,取其中使得J′(t)更小的一组作为权值,其计算公式如下所示。
w2=1-w1 (4-17)
其中,估计得到最佳的权重值wi和w2后,即可根据式(4-11)进行组合预测。
以某省某普通干线公路路段为例分别使用回归模型和GM(1,1)模型对其路面使用性能进行预测,该路段2011年至2016年路面使用性能指标数据如表所示:
指标 | 2011年 | 2012年 | 2013年 | 2014年 | 2015年 | 2016年 |
PQI | 95.11 | 94.93 | 93.62 | 89.73 | 85.54 | 82.27 |
PCI | 94.30 | 91.22 | 88.97 | 86.63 | 84.12 | 80.93 |
RQI | 96.38 | 95.29 | 93.55 | 90.61 | 86.86 | 84.17 |
RDI | 95.03 | 94.11 | 93.01 | 90.45 | 85.86 | 82.98 |
表1
根据路段使用性能的各个指标的历史数据,应用回归模型,以路面损坏状况指数(PCI)为例进行论述。
设置PCI指数作为初始值PPIo等于100,以前5年数据预测最后2016年的PCI值,并且与实际值进行对比。根据式(4-2a)的变量替换原则求得相应的(xi,yi)替换变量数值对:{(0.0,-1.052),(0.693,-0.889),(1.098,-0.791),(1.386,-0.699),(1.609,-0.609)};然后根据式(4-3)和式(4-4)计算出a、b的估计值为a≈0.4668,b≈-1.5227。最后根据a、b的值计算得出寿命因子α和形状因子β的估计值,寿命因子α=26.0985,形状因子β=0.2685;然后根据式(4-1)可计算PCI指标的预测值,预测结果如图10所示。
从图10和图11可以看出,采用2011至2015年的路面破损状况指数历史数据为基础建立回归模型时,对于前5年作为模型建模基础的数据,模型实现了较好的拟合,但是对于2016年路面破损指数的预测,由于路面破损受到天气、路段地理环境等其他因素的影响,而在本模型中只用到了历史检测数据进行建模,因此实际值与预测值还是存在一定误差,本例中预测误差为2.46;但是在总体趋势上预测仍然是准确的。在无法获得更多数据的情况,该回归模型参数的调整比较困难,因此需要使用与灰色系统组合来平衡误差,使得预测更加准确。
为了保证预测结果的可信度,再次采用灰色系统GM(1,1)模型对路面性能指标进行预测,平衡回归预测误差。仍然使用图9中PCI指标值为例应用GM(1,1)模型,以前5年数据为基础预测最后2016年PCI的具体数值。
根据如图14中的数据有原始离散数列Xo={94.30,91.22,88.97,86.63,84.12,80.93},对X0进行一次累加,得到其累加生成数列Xi={94.30,185.52,274.49,361.12,445.24,526.17};然后根据X1获得其紧邻均值生成数列Zi={47.15,139.91,230.005,317.805,403.18,485.705};最后根据式(4-7)和式(4-8)计算得出模型参数a≈0.029,b≈95.633;最后根据式(4-9)和式(4-10)可得出PCI指标的预测值,结果如图12所示。
从图12和图13可以看出,由于灰色系统模型适合于进行小样本量的预测,因此基于2011至2015年的路面破损指数为基础建立的GM(1,1)模型与上述回归模型相比对于路面破损指数趋势拟合更好,最后对2016年路面破损指数PCI的预测结果与实际检测值误差为1.05,路面破损状况指数的预测值与实际值更加接近了,但是误差仍然超过1.0的分值,因此在接下来将使用组合预测综合回归预测与灰色系统预测结果,减小误差。
为了避免单一预测结果出现较大误差,可以采用组合预测的方法综合回归预测和灰色系统预测结果,以提高路面使用性能预测的准确性。本发明将基于上述回归预测以及灰色系统预测结果进行组合预测的实现。
1.加权算术平均组合预测权重计算
根据式(4-16)的计算以及比较得出加权算术平均的权重值如下:上述案例中路面破损指数PCI的回归预测权重w1为-0.156087,路面破损指数PCI的灰色系统预测权重w2为1.156087;
2.组合预测结果
根据路面使用性能回归预测结果以及路面使用性能灰色系统预测结果以及式(4-11)进行组合预测,预测结果如下所示。
分析如图14所示的结果,可以看出在单独采用回归预测和灰色系统GM(1,1)预测的情况下,对于2016年路面破损指数PCI的预测结果的误差绝对值分别为2.46和1.05,而在采用组合预测以后各个预测值综合了两种预测的结果,平衡了双方的误差,使得最后的误差下降到了0.53。从图15的预测值趋势对比图可知,组合预测结果跟路面使用性能的实际变化趋势是最贴近的,由此可以说明采用组合预测可以有效避免单一预测结果所带来的误差,使得路面使用性能预测结果更加准确,将更精准的预测结果应用于后文的路面养护决策优化,必定会使决策结果更加科学、合理。
因此本发明提出了使用数据挖掘中的关联规则分析对路面使用性能的四个指标,包括路面综合性能指数、路面破损指数、路面行驶质量指数、路面车辙深度指数,进行关联分析,挖掘其各个性能指标之间的相互影响的关联规则,发现导致最先导致路面使用性能下降的因素,以及将来可能会发生衰减的路面性能指标,以便于养护部门进行预防性养护;另一方面,通过关联分析挖掘交通流量对于路面性能各个指标的影响,以协助相关部门协调交通流量,以更好地保障公路路面使用性能处于优良水平。
以某省公路局发布的2016年普通公路技术状况数据以及交通流量数据为基础,分别建立路面性能指标内部关联数据模型、交通流量对于路面性能指标影响的数据模型并且使用关联规则算法对其进行挖掘分析。但是由于各性能指标都是连续的数值,而关联规则对于连续数值无法进行有效的分析,因此对于性能指标进行了离散化,按照如表2所示的标准:
性能指标 | ≥90 | 80~90 | 70~80 | 60~70 | <60 |
等级 | 优 | 良 | 中 | 差 | 次 |
表2
本发明选择基于Apriori算法的关联规则分析进行路面使用性能指标的衰减因素分析,其挖掘的过程主要分为两步[44]:1.找出大于等于最小支持度的路面性能指标频繁项集,然后根据最小置信度将频繁项集生成强关联规则。算法流程如图16所示。
算法实现具体说明如下:
(1)将需要分析的数据存入路面技术状况关联分析表D中,设置最小支持度为support。将D视为候选1-项集进行遍历,计算项集中所有元素的支持度,找出所有支持度不小于阈值的频繁1-项集,从2阶项集循环执行canditategen(,support)函数获得候选k-项集,直到频繁(k-1)-项集为空则停止循环。对于中任意子集c,计算子集c的支持度,并根据={c≤|c.support≥support}获取所有频繁项集。
(2)挑选任意不完全相同的两组频繁(k-1)-项集的子集,将两个子集项合并在一起,生成候选项c=u,并根据最小支持度的数值,使用infrequentgen(c,)函数去掉不可能生成频繁项集的候选项集组合。
(3)判断是否含有频繁项集的函数infrequentgen(c,)时,获取项集c中的每个项集的任意子集y,如果y属于频繁(k-1)-项集则判断属于频繁项集,反之,不在频繁(k-1)-项集中的子集需要舍弃。
由于普通公路一般分为水泥路面和沥青路面,而这两种路面在性能指标的选择上存在一定的差异,沥青路面有5个性能指标,而水泥路面只有3种,因此为了能够对采集到的数据进行统一的挖掘分析,需要选择它们共同的性能指标进行分析。根据某省公路局提供的数据,选择如下属性作为路面性能指标内部影响数据模型的属性:公路技术等级、路面破损指数(PCI)、行驶质量指数(RQI)、车辙深度指数(RDI)、路面使用性能综合指数(PQI)、路基技术状况指数(SCI)和沿线设施技术状况(TCI)。
使用weka作为关联规则挖掘工具,在设置挖掘参数最小支持度为10%,最小置信度为60%的情况下,采用上述路面性能指标内部影响数据模型对2016年某省公路路面技术状况数据进行关联规则挖掘,结果如图17所示。
规则1表示从当前的数据看公路技术等级为二级的公路,路面的车辙深度指数等级为次的概率约等于100%,由此可知车辙深度指数与公路技术等级有很大的关系,公路等级越高路面车辙深度越小;规则2表示当公路的车辙深度指数和路基技术状况指数都为次时,公路沿线设施的技术状况指数为次的概率为100%,由此可知路面车辙的深度导致车辆行驶状况差从而影响了公路沿线设施的技术状况,并且路基的技术状况也将严重沿线设施技术状况;规则3、4表示当路面破损指数PCI和行驶质量指数同时为次时,路面使用性能综合指数PQI为次的概率为99%,当路面破损指数PCI和行驶质量指数同时为优时,路面使用性能综合指数PQI为优的概率为97%,由此可知PCI和PQI是影响PQI的两个主要指标;规则5表示当RDI为次时,有96%的概率RQI同样为次,可知车辙深度是影响行驶质量指数衰减的一个重要因素;规则6表示当行驶质量指数为差时,路面破损指数为差的概率为83%,而由于行驶质量指数主要衡量的是路面平整度,因此从规则6可知,平整度是导致路面破损指数衰减的一个重要因素。
同上面一样使用weka作为关联规则挖掘工具,在设置挖掘参数最小支持度为10%,最小置信度为60%的情况下,采用某省公路局提供的2016年交调数据以及公路技术状况数据进行关联规则挖掘,结果如图18所示。
规则1、2、3表示:公路交通流量中重载车型比例达到30%时,路面使用性能综合指数等级为中的概率0.99;当重载车型比例达到40%时,PQI等级下降到差等级的概率为0.99;当重载车型比例达到50%时,PQI等级下降到次等级的概率为0.97。由这3条规则可知,路面使用性能综合指数跟重载车型的比例呈负相关。规则4、5表示当重载车型的比例达到40%时,路面破损指数为差等级的概率为0.96;当重载车型的比例达到50时,路面破损指数下降到次的概率为0.95;由这两条规则可知,重载车型比例过大也将会导致路面破损更加严重。规则6表示当重载车型比例达到50%,行驶质量指数为差的概率为0.90,由此可知重载车型过大也是路面行驶质量指数下降,即路面平整度下降的一个重要因素。
由如图19所示可知,进行养护决策优化的基础是在前面所述的路面性能指标预测,利用预测的路面性能指标首先确定路面养护的策略属于哪一个种类;然后对各个分类下的所有待养护路段进行灰色物元法优先级排序,保证最亟需养护或大中修的路段得到及时的处理,保证养护资金的最大效益。
根据上述不同养护策略所针对的不同路段技术状况,然后综合公路养护技术规范,选择采用以下养护策略选择标准,如表3所示:
表3
应用灰色物元分析法对某省普通公路各路段的综合损坏状况进行评价以及养护决策时,以某省公路局提供的数据为基础,从以下4个方面进行带养护路段的优先级排序:公路整体养护技术状况指数(MQI)、路面使用性能综合指数(PQI)、路面破损状况指数(PCI)、路面行驶质量指数(RQI),使用这4个评价指数组成路段养护优先级决策的特征C1,C2,C3,C4,按实际情况给出各个特征相应的特征属性值ai(i=1,2,3,4)。通过这4个特征属性组成一个路段的灰色物元R,包含4维特征属性,形式是一个4行1列的单列矩阵,如式(5-1),当有n段不同的路时就可以把各段路的4维灰色物元放在一起组合成一个4*n的矩阵,如式(5-2)。
根据路面使用性能指数的含义,性能指数越大代表路面使用性能越优越,因此,在建立最佳路段灰元时,对于每一个特征属性都需要采用越大越好的原则进行选择。对于每一个特征属性,都选择n个路段中该项属性的最大值作为最佳路段灰元该项属性的值,对于组成新的灰色物元,叫做最佳事物灰元R0,如式(5-3)。
根据已有的路段技术状况评价基础数据以及相关的路段评价体系,建立各个路段与最佳路段的关联系数4维复合灰元RL,如式(5-4)。
式中:Lij为第j个路段与上述所说的最佳路段的第i项特征参数的关联值,采用下列公式进行计算:
其中:Δij为最佳路段灰元与第j个路段的第i维特征的差值,Δmin为最佳路段与其他所有路段各维特征指数差值的最小值,Δmax为最佳路段与其他所有路段各维特征指数差值的最大值,参数p为分辨系数,通常取其等于0.5。
3)路段综合评价特征指数的权重系数
路段综合评价特征指数的权重系数是指各个特征指数在最终的综合评价中所占的比重,也就是他们各自的重要程度。本发明将根据《评定标准》中对各指数的权重系数来确定该处综合评价的相关权重系数,具体如下:
W=(W1,W2,W3,W4) (5-6)
4)关联度复合灰元
因为式(5-4)中的关联系数是比较各路段灰元与路段最佳灰元之间各个特征指数之间的关联程度,所以一个路段与最佳路段灰元中存在多个关联系数,信息过于离散,无法直观地比较各个路段与最佳路段灰元的关联度哪个最大,哪个最小。因此需要将各个离散的关联系数进行整合,求得关联度的复合灰元RDL。
式中:Loj是指待评价的各个路段与最佳路段之间的关联性的大小;Wi为各特征属性的权重系数。
5)养护路段决策优先级排序
通过前面的关联度复合灰元RDL,其中每一个值表示相应路段与最佳路段灰元的相似程度,所以其值越大,表示相应路段的路面使用性能越好,其值越小,表示相应路段的路面使用性能越差。而在进行路段养护时最基本的原则应该是先养护路面使用性能较差的,那么各路段养护的优先级应该是与路段与最佳路段灰元的关联度成反比的,关联度越小的路段养护优先级越高,关联度越大的路段养护优先级越低。
采用的特征性评价指标包括以下四个:PCI、RQI、PQI以及MQI。各个指标权重系数根据路面类型、路面技术等级的不同而有所不同,本发明选取《评定标准》中沥青路面一级公路权重系数进行灰色物元法的决策优化实际应用,其权重向量W=(0.35,0.40,0.15,0.10)。如图20所示,所呈现的是部分沥青路面的路面使用性能的原始数据,将从中随机选择若干条路段来进行养护决策优化分析。
从中随机选择若干路段进行基于灰色物元法的路面养护决策养护实例分析,所选择路段数据如下所示。
根据图21所示的数据以及式(5-2)建立路段复合灰色物元R6x4如下。
因为路面使用性能是指标越大表示路面使用性能越好,所以这里需要采用越大越优的原则来建立最佳路段灰元R0如下。
然后求出复合灰色物元和最佳路段灰元的差值如下:
根据式(5-10)可以得到:△min=0.00,4na=35.83,取p=0.5,然后根据式(5-5)算出所有路段的关联系数复合灰元RL:
然后根据式(5-7)以及上面的式(5-11)可以计算出所有路段与最佳路段灰元的复合关联度RDL如下。
最后可以根据Loi的大小判断出各路段的路面使用性能的优劣状况,从式(5-12)可以看出路段1的性能最佳,而路段5的性能最差,所有路段优先级排序结果为Ls>L2>L4>L3>L6>L1(Li表示第i条路段)。而公路养护人员在判断哪条道路需要进行养护时,可以根据灰色物元发计算出的路段优劣排序,进行养护决策的优化,按照先劣后优的顺序进行养护。
路面预防性养护辅助决策过程中费用测算依据的是各种典型修方案的养护单价,养护方案的单价是根据某省养护实际调查结果确定的,如图22所示。
对于2016年某省普通国省干线路面技术状况的评定结果,结合本发明所总结的养护决策优化策略以及灰色物元法以及养护优先级的排序分析,对某省2017需要进行的路面养护计划结果进行测算对比,比较在其传统的大规模的定性养护决策以及使用本发明所提出的基于数据挖掘的路面预防性养护决策方法的不同,测算结果如图23所示。
从图23中可以看出采用传统的定性养护决策方式,虽然需要进行养护的路面里程少但是养护资金需求更大;采用基于数据挖掘的辅助决策方式,根据实际情况将路面分成不同养护等级,虽然养护的总里程增加了,但是计划的养护资金需求反而少了,使得有限的养护资金得到了更加有效的利用,发挥了养护资金的最大作用。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,包括以下步骤:
S1:使用数据挖掘异常检测算法对公路养护路面技术状况实时记录数据和历史数据进行预处理,对异常检测结果进行深层分析及标记;
S2:采用回归分析预测算法和灰色系统预测算法对所述异常检测结果进行综合分析及组合预测,得到综合预测结果,同时采用路面性能衰减因素分析规则和重载车型比例影响分析规则对所述异常检测结果进行关联分析,得到关联分析结果;
S3:建立灰色物元分析算法,结合所述组合预测结果判断待养护路段和养护优先级,对所述待养护路段的养护顺序及养护类型进行辅助排序,再与所述关联分析结果进行整合,提供道路分区段预防性养护评价结果,辅助养护职能部门进行养护决策。
2.根据权利要求1所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S1包括:
S11:从数据库中扫描实时及历史路面性能数据集合,随机抽取若干个子样本,构建若干个iTree孤立树,完成路面使用性能记录检测模型的构建和训练;
S12:采用所述路面使用性能记录检测模型进行路面使用性能记录的异常评估。
3.根据权利要求2所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S11包括:
S111:随机获取若干个子样本;
S112:从路面技术状况数据的路面技术等级、路面使用性能综合指数、路面破损指数、路面行驶质量指数这四个属性随机选择一个属性作为分割属性,从属性取值范围的最大值和最小值区间内选择一个作为分割值,然后根据所述分割值将若干个所述子样本分割到左右子树中;
S113:对所述左右子树的子样本重复步骤S112,直到所述子样本集合中只有一条记录;
S114:重复步骤S111-步骤S113,直到构建足够数量的所述iTree孤立树,组成孤立森林。
4.根据权利要求2所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S12包括:获取需要进行异常检测的路面使用性能记录,根据所述路面使用性能记录检测模型求出所述路面使用性能记录在每一棵所述iTree孤立树中的路径长度,再计算所述路面使用性能记录的异常指数,求得所有路面使用性能记录的异常指数后,将所有的异常指数分成两类,其中,聚类中心大的为异常类,相应的路面性能记录被标记为异常;聚类中心小的为正常类,相应的路面性能记录被标记为正常。
5.根据权利要求4所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述路径长度的计算公式为:
h(x)=L+C(n)
其中,h(x)为路径长度,x为路面使用性能记录,L为路面使用性能记录最终所在叶子节点的二叉树中的高度,C(n)为n个节点的二叉树的平均高度;
其中,h(n)=In(n)+γ(n>1),γ为欧拉常数又称欧拉-马斯克若尼常数,γ的数值定为0.5772156649,H为一条数据记录在二叉树构造中的高度,n为叶子节点包含的记录条数;
所述异常指数的计算公式为:
其中,n为决策树iTree的总节点数φ,C(n)为n个节点的二叉树的平均高度,E(h(x))表示记录x在每棵树的高度均值,h(x)表示叶子节点到根节点的长度路径用来判断一条记录x是否是异常点。
6.根据权利要求1所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S2所述的回归分析预测算法的计算公式为:
其中,PPI为路面性能指标,PPI0为路面西能指标的初始值,α为路面的寿命因子,即路面性能衰减到初始值得63.2%时所经过的年限,β为路面性能衰变曲线的形状因子,t为路龄;
对所述回归分析预测算法的计算公式进行变量替换,令lnt等于x,β等于a,βlna-1等于等于y,得到变换公式为:
y=ax+b;
采用最小二乘法估计参数a、b的值,计算公式分别为:
其中(xi,yi)根据对应的历史路面性能指标数据PPI和t获得,即xi为当前路面实际性能指标,yi为随着t路龄增长后预测的未来路面性能指标,获得参数a、b的估计值后,根据关系式β=a,βlnα-1=b,求出α和β的值,n为表示观测点组数,即为历史路面性能指标数据组数。
7.根据权利要求6所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S2所述的灰色系统预测算法的计算公式为:
x0(k)+mz1(k)=q
其中,m、q为待估计参数,x0(k)为路面性能指标数据在时刻k的实际状态,z1(k)为路面性能指标数据在时刻k的预测状态;
所述灰色系统预测算法的白化公式为:
其中,d为预测误差序列的长度,X1为预测误差序列;
根据最小二乘法得到参数m、q的估计公式分别为:
其中,n为表示观测点组数,即为历史路面性能指标数据组数。
8.根据权利要求7所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S2所述的组合预测的计算公式为:
其中,Y(t)为回归分析预测算法的预测值,Y(t)为灰色系统预测算法的预测值,wj为权重参数,w1为回归预测结果的权重,w2为灰色系统预测结果的权重。
9.根据权利要求1所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S2所述的关联分析的规则包括:
规则1:公路交通流量中重载车型比例达到30%时,路面使用性能综合指数等级为中的概率0.99;
规则2:当重载车型比例达到40%时,路面使用性能综合指数等级下降到差等级的概率为0.99;
规则3:当重载车型比例达到50%时,PQI等级下降到次等级的概率为0.97;
规则4:当重载车型的比例达到40%时,路面破损指数为差等级的概率为0.96;
规则5:当重载车型的比例达到50时,路面破损指数下降到次的概率为0.95;
规则6:当重载车型比例达到50%,行驶质量指数为差的概率为0.90;
其中,所述规则1、规则2、规则3表示路面使用性能综合指数跟重载车型的比例呈负相关;
所述规则4、规则5表示重载车型比例过大也将会导致路面破损更加严重;
所述规则6表示重载车型过大也是路面行驶质量指数下降的一个重要因素。
10.根据权利要求1所述的一种基于数据挖掘的公路路面预防性养护决策方法,其特征在于,所述步骤S3所述的建立灰色物元分析算法,结合所述组合预测结果判断待养护路段和养护优先级包括以下步骤:
S31:建立最佳路段事物灰元:
其中,C1为公路整体养护技术状况指数、C2为路面使用性能综合指数、C3为路段破损状况指数、C4为路面行驶质量指数、Dn为矩阵的列数即各指标数据个数、an1~an4为指定路面指标对应矩阵列数据;
S32:选择n个路段中该项属性的最大值作为最佳路段灰元该项属性的值,对于组成最佳事物灰元:
S33:根据已有的路段技术状况评价基础数据以及相关的路段评价体系,建立各个路段与最佳路段的关联系数4维复合灰元:
其中,Ln1~Ln4为指定路面指标对应的矩阵列数据;
S34:关联值的计算公式为:
其中,Lij为第j个路段与上述所说的最佳路段的第i项特征参数的关联值,Δij为最佳路段灰元与第j个路段的第i维特征的差值,Δmin为最佳路段与其他所有路段各维特征指数差值的最小值,Δmax为最佳路段与其他所有路段各维特征指数差值的最大值,参数p为分辨系数,通常取所述参数p等于0.5;
S35:将各个离散的关联系数进行整合,得到关联度复合灰元:
其中,L0j是指待评价的各个路段与最佳路段之间的关联性的大小;wi为各特征属性的权重系数;
S36:通过所述关联度复合灰元得出:其中每一个值表示相应路段与最佳路段灰元的相似程度,所以其值越大,表示相应路段的路面使用性能越好,其值越小,表示相应路段的路面使用性能越差,而在进行路段养护时最基本的原则应该是先养护路面使用性能较差的,那么各路段养护的优先级应该是与路段与最佳路段灰元的关联度成反比的,关联度越小的路段养护优先级越高,关联度越大的路段养护优先级越低。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310691169.5A CN116739376A (zh) | 2023-06-12 | 2023-06-12 | 一种基于数据挖掘的公路路面预防性养护决策方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310691169.5A CN116739376A (zh) | 2023-06-12 | 2023-06-12 | 一种基于数据挖掘的公路路面预防性养护决策方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116739376A true CN116739376A (zh) | 2023-09-12 |
Family
ID=87905661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310691169.5A Pending CN116739376A (zh) | 2023-06-12 | 2023-06-12 | 一种基于数据挖掘的公路路面预防性养护决策方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116739376A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557122A (zh) * | 2024-01-11 | 2024-02-13 | 山东路科公路信息咨询有限公司 | 基于数据关系图谱技术的公路养护决策分析方法及系统 |
CN117726324A (zh) * | 2024-02-07 | 2024-03-19 | 中国水利水电第九工程局有限公司 | 一种基于数据识别的公路交通施工巡检方法及系统 |
-
2023
- 2023-06-12 CN CN202310691169.5A patent/CN116739376A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117557122A (zh) * | 2024-01-11 | 2024-02-13 | 山东路科公路信息咨询有限公司 | 基于数据关系图谱技术的公路养护决策分析方法及系统 |
CN117557122B (zh) * | 2024-01-11 | 2024-03-22 | 山东路科公路信息咨询有限公司 | 基于数据关系图谱技术的公路养护决策分析方法及系统 |
CN117726324A (zh) * | 2024-02-07 | 2024-03-19 | 中国水利水电第九工程局有限公司 | 一种基于数据识别的公路交通施工巡检方法及系统 |
CN117726324B (zh) * | 2024-02-07 | 2024-04-30 | 中国水利水电第九工程局有限公司 | 一种基于数据识别的公路交通施工巡检方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107610469B (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
CN108417033B (zh) | 基于多维因素的高速路交通事故分析预测方法 | |
CN111737916B (zh) | 一种基于大数据的道路桥梁病害分析与养护决策方法 | |
CN116739376A (zh) | 一种基于数据挖掘的公路路面预防性养护决策方法 | |
CN113096388B (zh) | 一种基于梯度提升决策树的短时交通流量预测方法 | |
CN104809877B (zh) | 基于特征参数加权gefcm算法的高速公路地点交通状态估计方法 | |
CN105374209B (zh) | 一种城市区域路网运行状态特征信息提取方法 | |
CN103984994B (zh) | 一种城市轨道交通客流高峰持续时间预测方法 | |
CN111652520B (zh) | 一种基于大数据的路面养护智能决策系统及方法 | |
CN114299742B (zh) | 一种高速公路的限速信息动态识别与更新推荐方法 | |
CN113918538B (zh) | 一种基于人工神经网络的新建道路养护数据迁移系统 | |
CN107273605B (zh) | 基于多重分类器系统的实测轴载谱确定方法 | |
CN112149922A (zh) | 高速公路隧道下行线出入口区域事故严重程度预测方法 | |
CN109544926B (zh) | 一种基于路口相关性的交通流量修复方法 | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及系统 | |
CN116756825A (zh) | 一种中小跨径桥梁的群结构性能预测系统 | |
CN116933946A (zh) | 一种基于客流去向结构的轨道交通od客流预测方法及系统 | |
CN117829370A (zh) | 一种交通事故严重程度预测方法、系统及计算机设备 | |
CN111311905A (zh) | 一种基于粒子群优化小波神经网络的高速公路行程时间预测方法 | |
CN111145535A (zh) | 一种复杂场景下的行程时间可靠性分布预测方法 | |
CN113919729A (zh) | 一种区域三生空间影响与协作水平评估方法及系统 | |
CN113726558A (zh) | 基于随机森林算法的网络设备流量预测系统 | |
CN115438453B (zh) | 一种利用观测数据构建路网设施拓扑结构的方法 | |
CN114626655A (zh) | 一种区域综合能源系统多标准综合评价方法 | |
CN118332441A (zh) | 基于车辙横断面形态特征的道路病害预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |