CN113469240B - 一种基于形状相似性的行驶工况构建方法及存储介质 - Google Patents
一种基于形状相似性的行驶工况构建方法及存储介质 Download PDFInfo
- Publication number
- CN113469240B CN113469240B CN202110730505.3A CN202110730505A CN113469240B CN 113469240 B CN113469240 B CN 113469240B CN 202110730505 A CN202110730505 A CN 202110730505A CN 113469240 B CN113469240 B CN 113469240B
- Authority
- CN
- China
- Prior art keywords
- short
- cluster
- segment
- segments
- run
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010276 construction Methods 0.000 title claims abstract description 20
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 49
- 238000006073 displacement reaction Methods 0.000 claims abstract description 7
- 239000012634 fragment Substances 0.000 claims abstract description 7
- 238000000691 measurement method Methods 0.000 claims abstract description 7
- 238000013519 translation Methods 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims description 18
- 238000009826 distribution Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000002759 z-score normalization Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000005192 partition Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000003775 Density Functional Theory Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 238000005520 cutting process Methods 0.000 claims description 3
- 238000007476 Maximum Likelihood Methods 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 claims description 2
- 230000000284 resting effect Effects 0.000 claims description 2
- 238000000926 separation method Methods 0.000 claims description 2
- -1 substituted- Chemical class 0.000 claims description 2
- 239000013598 vector Substances 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 238000011156 evaluation Methods 0.000 abstract description 3
- MWUXSHHQAYIFBG-UHFFFAOYSA-N Nitric oxide Chemical compound O=[N] MWUXSHHQAYIFBG-UHFFFAOYSA-N 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000004215 Carbon black (E152) Substances 0.000 description 4
- UGFAIRIUMAVXCW-UHFFFAOYSA-N Carbon monoxide Chemical compound [O+]#[C-] UGFAIRIUMAVXCW-UHFFFAOYSA-N 0.000 description 4
- 229910002091 carbon monoxide Inorganic materials 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 229930195733 hydrocarbon Natural products 0.000 description 4
- 150000002430 hydrocarbons Chemical class 0.000 description 4
- 239000013618 particulate matter Substances 0.000 description 4
- 239000003344 environmental pollutant Substances 0.000 description 3
- 231100000719 pollutant Toxicity 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的一种基于形状相似性的行驶工况构建方法及存储介质,首先对车辆OBD数据进行切割,将时间连续的OBD数据切割成不等长的短行程片段库,然后采用一种尺度不变、平移不变、移位不变的互相关距离度量方法来评估不同短行程片段的相似度,给后续不等长片段聚类提供更为精准的相似度评估标准;同时分别优化质心与短行程片段的簇标记,更先进的质心优化方法与样本分配方法,可以带来更好的聚类效果,以便得到簇内样本相似度更高,簇间样本相似度更低的典型工况划分;然后根据最小信息量(AIC)原则,选择使AIC最小的聚类数,最优聚类数的选择,对聚类效果至关重要,最后,本发明选择各簇中更为典型的短行程片段以构建反映整体行驶状况的行驶工况。
Description
技术领域
本发明涉及环境检测技术领域,具体涉及一种基于形状相似性的行驶工况构建方法及存储介质。
背景技术
基于根据生态环境部发布《中国移动源环境管理年报(2020)》指出,移动源污染已成为我国大中城市空气污染的重要来源,是造成细颗粒物、光化学烟雾污染的重要原因,移动源污染防治的紧迫性日益凸显。据《年报》统计,我国机动车保有量持续增长,已连续十一年成为世界机动车产销第一大国。2019年,全国机动车保有量达到3.48亿辆,比2018年增长6.4%。2019年,全国机动车四项污染物排放总量初步核算为1603.8万吨。其中,一氧化碳(CO)、碳氢化合物(HC)、氮氧化物(NOx)、颗粒物(PM)排放量分别为771.6万吨、189.2万吨、635.6万吨、7.4万吨。汽车是污染物排放总量的主要贡献者,其排放的CO、HC、NOx和PM等四项主要污染物均超过90%。柴油车NOx排放量超过汽车排放总量的80%,PM排放量超过90%;汽油车CO排放量超过汽车排放总量的80%,HC排放量超过70%。
移动源污染物排放主要受其行驶状况的影响,如车辆在交通堵塞下的怠速时间较长及加减速频率过高,都会造成较高的尾气排放。行驶工况构建是一种基于典型交通状况的汽车驾驶剖面的构建方法,在汽车排放、经济性和行驶里程的评价中具有重要的作用。
目前行驶工况构建方法主要分为两类:马尔科夫分析法和聚类分析法。马尔可夫分析法将车辆行驶过程的速度和时间关系看作随机过程,利用t时刻的状态只依赖于t-1时刻的状态的特点(即无后效性),将不同模型事件组合在一起形成整个行驶过程。该方法理论复杂,数据划分破坏原始数据的连续性。聚类分析法将所有微行程片段根据其相似程度分成若干类,再依据一定原则从每一类片段库中挑选片段组成最终的工况曲线。相比于马尔科夫分析法,聚类分析法能得到不同类别的工况,更接近实际道路工况,简单易行。
由于城市各区域实际交通状况、道路特性不同,都会对车辆的驾驶循环造成影响,同时新能源汽车的发展,车型数据越来越丰富,传统方法采用的手工设计特征来表示驾驶数据在空间上的速度-时间分布,且驾驶数据被视为静态数据,其固有的动态特性和时间依赖性往往被忽略,导致精度低,鲁棒性不足。
发明内容
本发明提出的一种基于形状相似性的行驶工况构建方法及存储介质,可解决上述技术问题。
为实现上述目的,本发明采用了以下技术方案:
一种基于形状相似性的行驶工况构建方法,包括以下步骤,
步骤一:获取车辆的OBD数据并进行预处理,将其切割为n个不等长的短行程片段,即持续时间不超过180s的怠速段即速度为0与速度不为零的运动段组成,生成输入片段集合X=[x1,x2,…,xn];
步骤二:将步骤一预处理后获取的时间序列集合X=[x1,x2,…,xn],使用z-score归一化保持尺度不变性,使用系数归一化保持平移不变性,保持分布的平均值μ为0,标准差为1以保证移位不变性;
步骤三:使用步骤二的互相关距离,将一簇短行程片段的质心优化为到所有其它短行程片段的互相关距离平方之和的最小值;
步骤四:结合步骤三的质心优化与步骤四的分区聚类方法以完成基于形状的短行程片段聚类,将短行程片段划分为k类典型行驶状况,迭代更新步骤三与步骤四,直至当前质心均未更新,典型行驶状况划分结束;
步骤五:对前述步骤的聚类方法,进一步确定最优聚类数,即k值,提出一种无监督的最优聚类数的挑选方法,根据最小信息量(AIC)原则,选择最优聚类数,即确定典型行驶状况的类别数;
步骤六:采用步骤五确定的k值的聚类结果,根据各簇的时间比例,从各簇中选取质心最近的短行程片段,拼接以构建出满足时间要求的工况曲线,选择各典型行驶状况下的典型短行程片段以便构建更为全面且更能代表整体行驶数据的行驶工况。
另一方面,本发明公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
由上述技术方案可知,本发明的基于形状相似性的行驶工况构建方法,首先对车辆OBD数据进行切割,将时间连续的OBD数据切割成不等长的短行程片段库。采用一种尺度不变、平移不变、移位不变的互相关距离度量方法来评估不同短行程片段的相似度,给后续不等长片段聚类提供更为精准的相似度评估标准;同时提出了一种短行程片段的形状提取方法和基于形状的短行程片段聚类,分别优化质心与短行程片段的簇标记,更先进的质心优化方法与样本分配方法,可以带来更好的聚类效果,以便得到簇内样本相似度更高,簇间样本相似度更低的典型工况划分;然后本发明方法提出一种无监督的最优聚类数的挑选方法,根据最小信息量(AIC)原则,选择使AIC最小的聚类数,最优聚类数的选择,对聚类效果至关重要,从实际行驶数据出发,设计的最优聚类数挑选方法完全不依赖标签。最后,本发明方法提出了一种基于质心最近原则的工况构建方法,选择各簇中更为典型的短行程片段以构建反映整体行驶状况的行驶工况。
总的来说,本发明方法从实际行驶数据出发,针对完全无标签且不等长的行驶数据,设计了更为精准的聚类方法及距离度量标准以提升典型行驶状况的区分精度,同时设计了无监督最优聚类数挑选方法及典型片段的挑选方法,以便构建出的综合行驶工况更加全面反映典型行驶状况。
附图说明
图1是本发明实施例基于形状相似性的工况构建方法的综合行驶工况图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
本发明实施例所述的基于形状相似性的行驶工况构建方法,包括以下步骤:
步骤一:获取车辆的OBD数据并进行预处理,将其切割为n个不等长的短行程片段,即持续时间不超过180s的怠速段即速度为0与速度不为零的运动段组成,生成不等长的时序输入片段集合X=[x1,x2,…,xn];
步骤二:采用一种尺度不变、平移不变、移位不变的互相关距离度量方法,为典型行驶状况划分提供相似度度量标准,将步骤一预处理后获取的时间序列集合X=[x1,x2,…,xn],使用z-score归一化保持尺度不变性,使用系数归一化保持平移不变性,保持分布的平均值μ为0,标准差为1以保证移位不变性;
步骤三:使用步骤二的互相关距离,采用一种短行程片段的形状提取方法,将一簇短行程片段的质心优化为到所有其它短行程片段的互相关距离平方之和的最小值,质心优化为聚类分配中至关重要的环节;
步骤四:提出一种基于形状的短行程片段聚类,该方法是一种基于迭代细化过程的分区聚类方法,此时随机选取聚类数为k,结合步骤三的质心优化与步骤四的分区聚类方法以完成基于形状的短行程片段聚类,将短行程片段划分为k类典型行驶状况,迭代更新步骤三与步骤四,直至当前质心均未更新,典型行驶状况划分结束;
步骤五:对前述步骤的聚类方法,进一步确定最优聚类数,即k值,提出一种无监督的最优聚类数的挑选方法,实际行驶的数据,是没有任何标签的,无法根据标签来挑选最优聚类效果,根据最小信息量(AIC)原则,选择最优聚类数,即确定典型行驶状况的类别数;
步骤六:最后,采用步骤五确定的k值的聚类结果,提出了一种基于质心最近原则的工况构建方法,根据各簇的时间比例,从各簇中选取质心最近的短行程片段,拼接以构建出满足时间要求的工况曲线,选择各典型行驶状况下的典型短行程片段以便构建更为全面且更能代表整体行驶数据的行驶工况。
以下分别具体说明:
步骤一:获取车辆的OBD数据并进行预处理,将其切割为n个不等长的短行程片段,即持续时间不超过180s的怠速段(速度为0)与速度不为零的运动段组成,生成输入片段集合X=[x1,x2,…,xn];
步骤二:提出一种尺度不变、平移不变、移位不变的互相关距离度量方法,将获取的时间序列集合X=[x1,x2,…,xn],使用z-score归一化保持尺度不变性,使用系数归一化保持平移不变性,保持分布的平均值μ为0,标准差为1以保证移位不变性,具体如下:
1.互相关度量计算两个没有正确对齐的序列和/>的相似性,为了实现移位不变性,互相关使/>静止,并在/>上滑动/>以计算/>的每个位移s的内积,记一个序列的移位如下:
当考虑所有可能的位移使s∈[-m,m],得到长度为2m-1的互相关序列
其中,依次计算如下:
计算最大的位置w,基于w的值,那么/>相对于/>的最优位移是/>其中s=w-m。
2.为了后面数据处理的方便,其次是保证程序运行时收敛加快。需要对所有的实际短行程片段进行归一化以归纳统一样本的统计分布性。最常见的归一化是有偏估计量NCCb、无偏估计量NCCu、系数归一化NCCc,定义如下:
除了互相关归一化外,短行程片段是一维时间序列,也需要归一化来消除固有的失真。首先使用z-score归一化来消除振幅的差异,再使用系数归一化时,不需要移动即可对齐两个相同长度的序列。
短行程片段归一化和互相关度量对互相关的序列产生重大影响。进而设计一个基于形状相似性的距离度量方法,根据前面的公式,使用系数归一化,它给出的值在-1和1之间。系数归一化将互相关序列除以单个序列的自相关的几何平均值。对序列进行归一化后,检测到最大化的位置w,并推导出以下距离测量:
它的取值范围在0到2之间,0表示时间序列完全相似。此时已经考虑了位移不变性。
3.为了保持缩放不变性,将转化为/>所以平均值μ为0,其标准差为1。根据卷积定理,两个短行程片段的卷积可以计算为短行程片段的单个傅里叶变换(DFT)的乘积的离散傅里叶反变换(IDFT),其中DFT为:
IDFT为:
其中如果一个短行程片段首先在时间上翻转,则互相关计算为两个短行程片段的卷积,/>这就等于在频域中取复共轭*。因此,对于不同长度序列可以计算出:/>
步骤三:提出一种短行程片段的形状提取方法,将一簇短行程片段的质心优化为到所有其它短行程片段的距离平方之和的最小值,具体如下:
1.使用质心作为一组数据的代表,质心定义为到所有其它数据点的距离平方和最小的数据点,它取决于距离度量的选取,在给定的簇pj中,对应的质心须满足:
2.根据互相关距离度量,可以将计算出来的短行程片段表示为与所有其他短行程片段的平方相似度的最大化结合公式(4)及公式(8),可以得到:
公式(9)要求计算每一个的最优位移,在聚类迭代中,使用前一轮计算出的质心作为参考,并对齐所有短行程片段的参考序列。使用基于形状的距离度量,它为每一个确定一个最优移位。省略公式(9)中的分母,并结合公式(2)、(3),得到:
3.简化优化问题描述,用向量表示这个方程,并假设短行程片段已经经过z-score归一化来消除振幅的差异:
在之前的公式中,仅没有经过z-sore归一化,为了处理质心/>(减去平均值),设置/>其中/>I是单位矩阵,O是一个全为1的矩阵。为使/>具有单位范数,将公式(11)除以/>最后,将S替代/>得到:
其中M=QT·S·Q,通过上述变化,将优化问题简化了描述,这就是众所周知的瑞利熵最大化问题,可以找到最大化的为实对称矩阵M的最大特征值对应的特征向量。
步骤四:提出一种基于形状的短行程片段聚类,该方法是一种基于迭代细化过程的分区聚类方法。具体如下:
1.在分配步骤中,算法通过将每个短行程片段与所有计算出的质心进行比较,并将短行程片段分配给最近质心的簇来更新簇内成员。
2.在细化步骤中,更新聚类质心,以反映上一步聚类成员关系的变化。
3.重复1、2,直到各簇内的短行程片段不发生任何变化或者达到允许的最大迭代次数。
步骤五:提出一种无监督的最优聚类数的挑选方法,实际行驶的数据,是没有任何标签的,无法根据标签来挑选最优聚类效果。具体如下:
1.定义簇Ci内的紧密度度量
其中,|Ci|表示需要将全部短行程片段聚类成簇Ci的数量,度量簇内短行程片段距离簇质心的欧式距离。
2.结合簇内紧密度和簇间分离度的DB指数定义为:
其中,为簇数。
3.根据AIC原则,选择模型使其最小:
根据样本统计量的分布理论,将簇内偏差分布密度表示的最大似然函数(L)的对数定义为:
其中dmax和dmin分别表示簇内短行程片段到其指定的簇形心的最大和最小欧氏距离。
4.根据BIC标准,知道BIC值越高表示模型越好。为了一致性,选择一个最小化的模型
5.聚类数依次从2到10取值,聚类数选择使得minAIC、minBIC、minDB。此时的聚类数即为所求最优聚类数
步骤六:提出了一种基于质心最近原则的工况构建方法,根据各簇的时间比例,从各簇中选取质心最近的短行程片段,拼接以构建出满足时间要求的工况曲线。具体的说根据各典型行驶状况的时间比例,从各典型行驶状况的短行程片段中选取质心最近的短行程片段,即挑选出更能反映该簇行驶状况的平均状态的片段,拼接以构建出满足时间要求的工况曲线。
以下是本发明的具体应用实例:
图1所示是本发明具体基于形状相似性的工况构建方法的综合行驶工况图,本实例设定行驶工况的时间长度为1100-1300s,从各典型行驶状况下取满足时间要求的典型片段拼接后,构成综合行驶工况,用以描述整体行驶数据的行驶状况。
另一方面,本发明公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (5)
1.一种基于形状相似性的行驶工况构建方法,其特征在于,包括以下步骤,
步骤一:获取车辆的OBD数据并进行预处理,将其切割为n个不等长的短行程片段,即持续时间不超过180s的怠速段即速度为0与速度不为零的运动段组成,生成输入片段集合X=[x1,x2,…,xn];
步骤二:将步骤一预处理后获取的时间序列集合X=[x1,x2,…,xn],使用z-score归一化保持尺度不变性,使用系数归一化保持平移不变性,保持分布的平均值μ为0,标准差为1以保证移位不变性;步骤二具体包括,
互相关度量计算两个没有正确对齐的序列和/>的相似性,为了实现移位不变性,互相关使/>静止,并在/>上滑动/>以计算/>的每个位移s的内积,记一个序列的移位如下:
当考虑所有可能的位移使s∈[-m,m],得到长度为2m-1的互相关序列
其中,依次计算如下:
计算最大的位置w,基于w的值,那么/>相对于/>的最优位移是/>其中s=w-m;
对所有的实际短行程片段进行归一化以归纳统一样本的统计分布性,定义如下:
归一化来消除固有的失真,首先使用z-score归一化来消除振幅的差异,再使用系数归一化时,不需要移动即可对齐两个相同长度的序列;
设计一个基于形状相似性的距离度量方法,根据前面的公式,使用系数归一化,它给出的值在-1和1之间;系数归一化将互相关序列除以单个序列的自相关的几何平均值,对序列进行归一化后,检测到最大化的位置w,并推导出以下距离测量:
它的取值范围在0到2之间,0表示时间序列完全相似;
为了保持缩放不变性,将转化为/>所以平均值μ为0,其标准差为1;根据卷积定理,两个短行程片段的卷积可计算为短行程片段的单个傅里叶变换(DFT)的乘积的离散傅里叶反变换(IDFT),其中DFT为:
IDFT为:
其中如果一个短行程片段首先在时间上翻转,则互相关计算为两个短行程片段的卷积,/>这就等于在频域中取复共轭*;因此,对于不同长度序列可计算出:
步骤三:使用步骤二的互相关距离,将一簇短行程片段的质心优化为到所有其它短行程片段的互相关距离平方之和的最小值;步骤三具体步骤如下:
使用质心作为一组数据的代表,质心定义为到所有其它数据点的距离平方和最小的数据点,它取决于距离度量的选取,在给定的簇pj中,对应的质心须满足:
根据互相关距离度量,将计算出来的短行程片段表示为与所有其他短行程片段的平方相似度的最大化结合公式(4)及公式(8),得到:
公式(9)要求计算每一个的最优位移,在聚类迭代中,使用前一轮计算出的质心作为参考,并对齐所有短行程片段的参考序列;使用基于形状的距离度量,它为每一个确定一个最优移位;省略公式(9)中的分母,并结合公式(2)、(3),得到:
用向量表示这个方程,并假设短行程片段已经经过z-score归一化来消除振幅的差异:
在之前的公式中,仅没有经过z-sore归一化,为了处理质心/>即减去平均值,设置其中/>I是单位矩阵,O是一个全为1的矩阵;为使/>具有单位范数,将公式(11)除以/>最后,将S替代/>得到:
其中M=QT·S·Q;
步骤四:结合步骤三的质心优化与步骤四的分区聚类方法以完成基于形状的短行程片段聚类,将短行程片段划分为k类典型行驶状况,迭代更新步骤三与步骤四,直至当前质心均未更新,典型行驶状况划分结束;
步骤五:对前述步骤的聚类方法,进一步确定最优聚类数,即k值,提出一种无监督的最优聚类数的挑选方法,根据最小信息量(AIC)原则,选择最优聚类数,即确定典型行驶状况的类别数;
步骤六:采用步骤五确定的k值的聚类结果,根据各簇的时间比例,从各簇中选取质心最近的短行程片段,拼接以构建出满足时间要求的工况曲线,选择各典型行驶状况下的典型短行程片段以便构建更为全面且更能代表整体行驶数据的行驶工况。
2.根据权利要求1所述的基于形状相似性的行驶工况构建方法,其特征在于:所述步骤四具体包括:
在分配步骤中,算法通过将每个短行程片段与所有计算出的质心进行比较,并将短行程片段分配给最近质心的簇来更新簇内成员;
在细化步骤中,更新聚类质心,以反映上一步聚类成员关系的变化;
重复,直到各簇内的短行程片段不发生任何变化或者达到允许的最大迭代次数。
3.根据权利要求2所述的基于形状相似性的行驶工况构建方法,其特征在于:所述步骤五具体包括:
定义簇Ci内的紧密度度量
其中,|Ci|表示需要将全部短行程片段聚类成簇Ci的数量,度量簇内短行程片段距离簇质心的欧式距离;
结合簇内紧密度和簇间分离度的DB指数定义为:
其中,为簇数;
根据AIC原则,选择模型使其最小:
根据样本统计量的分布理论,将簇内偏差分布密度表示的最大似然函数(L)的对数定义为:
其中dmax和dmin分别表示簇内短行程片段到其指定的簇形心的最大和最小欧氏距离;
为了一致性,选择一个最小化的模型
聚类数依次从2到10取值,聚类数选择使得minAIC、minBIC、minDB,此时的聚类数即为所求最优聚类数。
4.根据权利要求3所述的基于形状相似性的行驶工况构建方法,其特征在于:所述步骤六具体包括:
根据各典型行驶状况的时间比例,从各典型行驶状况的短行程片段中选取质心最近的短行程片段,即挑选出更能反映该簇行驶状况的平均状态的片段,拼接以构建出满足时间要求的工况曲线。
5.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730505.3A CN113469240B (zh) | 2021-06-29 | 2021-06-29 | 一种基于形状相似性的行驶工况构建方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110730505.3A CN113469240B (zh) | 2021-06-29 | 2021-06-29 | 一种基于形状相似性的行驶工况构建方法及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469240A CN113469240A (zh) | 2021-10-01 |
CN113469240B true CN113469240B (zh) | 2024-04-02 |
Family
ID=77873987
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110730505.3A Active CN113469240B (zh) | 2021-06-29 | 2021-06-29 | 一种基于形状相似性的行驶工况构建方法及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469240B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015101570A1 (fr) * | 2014-01-03 | 2015-07-09 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Procede, dispositif et systeme d'estimation de l'etat de sante d'une batterie d'un vehicule electrique ou hybride en condition d'utilisation, et procede de construction d'un modele pour une telle estimation |
CN106297373A (zh) * | 2015-06-09 | 2017-01-04 | 中国科学院深圳先进技术研究院 | 基于互相关和地磁传感器的停车场车辆检测方法 |
CN111126819A (zh) * | 2019-12-18 | 2020-05-08 | 南京理工大学 | 一种城市行驶工况智能分析方法 |
CN112434735A (zh) * | 2020-11-23 | 2021-03-02 | 中国科学技术大学 | 一种动态行驶工况构建方法、系统及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8825586B2 (en) * | 2009-02-24 | 2014-09-02 | International Road Dynamics | Vehicle type recognition at a checkpoint using PCA and BIC |
-
2021
- 2021-06-29 CN CN202110730505.3A patent/CN113469240B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015101570A1 (fr) * | 2014-01-03 | 2015-07-09 | Commissariat A L'energie Atomique Et Aux Energies Alternatives | Procede, dispositif et systeme d'estimation de l'etat de sante d'une batterie d'un vehicule electrique ou hybride en condition d'utilisation, et procede de construction d'un modele pour une telle estimation |
CN106297373A (zh) * | 2015-06-09 | 2017-01-04 | 中国科学院深圳先进技术研究院 | 基于互相关和地磁传感器的停车场车辆检测方法 |
CN111126819A (zh) * | 2019-12-18 | 2020-05-08 | 南京理工大学 | 一种城市行驶工况智能分析方法 |
CN112434735A (zh) * | 2020-11-23 | 2021-03-02 | 中国科学技术大学 | 一种动态行驶工况构建方法、系统及设备 |
Non-Patent Citations (2)
Title |
---|
基于动态时间弯曲距离的快速路入口匝道周围路径分级方法;王文璇;朱晓东;吴兵;;吉林大学学报(工学版)(03);全文 * |
面向昆明的典型城市乘用车行驶工况构建;肖仁鑫;刘宝帅;申江卫;徐月云;;农业装备与车辆工程(07);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113469240A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Chen et al. | BLOCK-DBSCAN: Fast clustering for large scale data | |
Chirigati et al. | Data polygamy: The many-many relationships among urban spatio-temporal data sets | |
CN110188803A (zh) | 基于出租车轨迹数据的出行时空模式识别方法与系统 | |
CN109359135B (zh) | 一种基于分段权重的时间序列相似性搜索方法 | |
CN101957859B (zh) | 基于集成支撑矢量机排序的信息检索方法 | |
CN113297795A (zh) | 一种纯电动汽车行驶工况构建方法 | |
CN114971156A (zh) | 一种基于大数据危险场景的驾驶风格分析方法 | |
CN112434735A (zh) | 一种动态行驶工况构建方法、系统及设备 | |
Puchalski et al. | Driving style analysis and driver classification using OBD data of a hybrid electric vehicle | |
CN112948965A (zh) | 一种基于机器学习和统计验证的汽车行驶工况的构建方法 | |
Vámosi et al. | Development of bus driving cycle for debrecen on the basis of real-traffic data | |
KR101182126B1 (ko) | 단일 차원 군집 분석의 분산처리를 이용한 대용량 데이터의 군집 분석 시스템, 방법 및 이를 위한 기록 매체 | |
CN113469240B (zh) | 一种基于形状相似性的行驶工况构建方法及存储介质 | |
Lv et al. | Research and application of intersection clustering algorithm based on PCA feature extraction and k-means | |
Shum et al. | Large-scale community detection on speaker content graphs | |
Yang et al. | Construction of high-precision driving cycle based on Metropolis-Hastings sampling and genetic algorithm | |
CN105677878A (zh) | 一种基于bi系统的车辆信息多维展示的方法及系统 | |
Guo et al. | Application of PCA-K-means++ combination model to construction of light vehicle driving conditions in intelligent traffic | |
CN114611604A (zh) | 一种基于电驱总成载荷特征融合与聚类的用户筛选方法 | |
Zhang et al. | Trajectory similarity assessment on road networks via embedding learning | |
Yin et al. | Fuel efficiency modeling and prediction for automotive vehicles: A data-driven approach | |
CN114021617B (zh) | 基于短行程特征聚类的移动源行驶工况构建方法及设备 | |
Topić et al. | Synthesis and Validation of Multidimensional Driving Cycles | |
CN116484244A (zh) | 基于聚类模型的自动驾驶事故发生机制分析方法 | |
Nadinta et al. | A clustering-based approach for reorganizing bus route on bus rapid transit system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |