CN114987504A

CN114987504A - 一种基于增量学习的动态驾驶员身份识别方法及系统

Info

Publication number: CN114987504A
Application number: CN202210611924.XA
Authority: CN
Inventors: 刘家佳; 荀毅杰; 郭威
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2022-05-31
Filing date: 2022-05-31
Publication date: 2022-09-02

Abstract

本发明公开了一种基于增量学习的动态驾驶员身份识别方法及系统，收集驾驶过程中产生的CAN总线数据，将CAN总线数据转化为十进制数据，得到含有m个特征的驾驶员行为特征数据；收集传感器在一个时间单元内传输的所有数据，并对收集的数据取均值，将收集到的驾驶员行为特征数据整合为t条数据，得到一个[t×m]的驾驶员特征数据集；驾驶员行为特征数据集中截取连续数据，得到驾驶员行为特征数据片；构建基于增量学习的驾驶员身份识别模型，将驾驶员行为特征数据片输入基于增量学习的驾驶员身份识别模型，对驾驶员进行身份识别。本发明能准确识别驾驶员身份，更快的完成驾驶员身份识别模型重训练过程，提高驾驶员身份识别方案的时间利用率。

Description

一种基于增量学习的动态驾驶员身份识别方法及系统

技术领域

本发明属于身份识别技术领域，具体涉及一种基于增量学习的动态驾驶员身份识别方法及系统。

背景技术

现有的驾驶员身份识别方案大多是基于密钥或驾驶员生物特征的静态单次识别方案，当数据泄露时，容易遭到攻击。一些研究人员已经注意到了这一点并提出了一些基于深度学习的驾驶员身份识别方案。但是，这些已有的方案存在两个缺陷：驾驶员生物特征提取并不明显，并且现有的方案在需要不断加入新驾驶员到识别系统的动态场景下效率不高。在驾驶员特征提取方面，现有的方法使用来自OBD-II接口或者模拟器的数据作为输入，这些数据中包含大量无关字段，不能充分体现驾驶员行为特征。其次，当新的第n个驾驶员需要加入到识别系统中时，已有的方案需要重新训练整个含有n个驾驶员的模型。随着加入的驾驶员数量的增多，识别系统重新训练的时间也逐渐变长，占用的系统资源也越来越多，效率变差，不适合在动态场景中应用。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足，提供一种基于增量学习的动态驾驶员身份识别方法及系统，利用BIR模型，从OBD-II接口中获取CAN总线数据，并对这些数据进行特征提取，实现动态场景下驾驶员的身份识别。

本发明采用以下技术方案：

本发明一种基于增量学习的动态驾驶员身份识别方法，包括以下步骤：

S1、收集驾驶过程中产生的CAN总线数据，将CAN总线数据转化为十进制数据，得到含有m个特征的驾驶员行为特征数据；收集传感器在一个时间单元内传输的所有数据，并对收集的数据取均值，将收集到的驾驶员行为特征数据整合为t条数据，得到一个[t×m]的驾驶员特征数据集；

S2、使用滑动窗口方式，从步骤S1得到的[t×m]大小的驾驶员行为特征数据集中截取一段时间内的连续数据，得到驾驶员行为特征数据片；构建基于增量学习的驾驶员身份识别模型，将驾驶员行为特征数据片输入基于增量学习的驾驶员身份识别模型，对驾驶员进行身份识别。

具体的，步骤S1中，传感器包括刹车踏板、发动机扭矩、转向轮、横向加速度、节流阀、横摆率和油门踏板。

具体的，步骤S2中，驾驶员行为特征数据片大小为[300×m]，滑动窗口滑动的步长为60。

具体的，步骤S2中，对驾驶员进行身份识别具体为：

基于增量学习的驾驶员身份识别模型包括主模型M和生成器模型G；

当新的编号为n的驾驶员拟加入到能够识别n-1位驾驶员的基于增量学习的驾驶员身份识别模型中时，生成器模型G_n-1首先生成原重放数据

接着，生成器模型G_n-1利用原重放数据

和拟加入到识别模型中的编号为n的驾驶员特征数据D_n重新训练生成器模型，获得新生成器模型G_n；

接着，使用新的生成器模型G_n生成新重放数据

这时，使用上下文门限进行选通，根据设定的概率选择部分新重放数据

使用知识蒸馏的方式标记新重放数据

的预测结果，知识蒸馏使用所有类别的预测概率进行标记；使用新重放数据

和拟加入到识别模型中的编号为n的驾驶员特征数据D_n重新训练主模型M_n-1，主模型在重训练过程中进行判定分类结果时，使用知识蒸馏的方式标记结果，最终，得到识别n位驾驶员的新主模型M_n，至此，基于增量学习的驾驶员身份识别模型重训练过程完毕。

进一步的，卷积核中，滤波器的大小为[21×m]，步长大小为1，通道数为256。

进一步的，主模型为具有基本神经网络结构的分类器，主模型的训练结果用损失函数L_total量化表示，损失函数L_total为：

其中，W_n表示标记为n的驾驶员的损失权重，L_current为新的待识别的驾驶员行为特征数据产生的损失，L_replay为重放数据产生的损失。

进一步的，生成器模型使用变分自动编码器网络进行深度学习，并与主模型共享同一卷积层和全连接层。

进一步的，生成器模型中，使用x表示待加入识别模型的驾驶员任务，P(x) 表示驾驶员被正确识别的概率，通过求P(x)的对数确定最大值，logP(x)为：

logP(x)＝L_b+KL(q(z|x)||P(z|x)

其中，z为隐变量，代表生成器模型使用的VAE网络编码器的编码结果， L_b为logP(x)的下限，KL(q(z|x)||P(z|x))为KL散度，q(z|x)代表输入为x时编码器将其输出为z的概率，P(x|z)为输入为z时解码器输出x的概率，P(z)为隐变量z被正确识别的概率。

进一步的，驾驶员n训练期间蒸馏的损失L_D为：

其中，θ指在第n位驾驶员在训练时的超参数，T为温度变量

为知识蒸馏温度设定为T时，主模型正确识别第n位驾驶员的概率，

为主模型预先定义温度为T时的条件概率。

第二方面，本发明实施例提供了一种基于增量学习的动态驾驶员身份识别系统，包括：

数据模块，收集驾驶过程中产生的CAN总线数据，将CAN总线数据转化为十进制数据，得到含有m个特征的驾驶员行为特征数据；收集传感器在一个时间单元内传输的所有数据，并对收集的数据取均值，将收集到的驾驶员行为特征数据整合为t条数据，得到一个[t×m]的驾驶员特征数据集；

识别模块，使用滑动窗口方式，从数据模块得到的[t×m]大小的驾驶员行为特征数据集中截取一段时间内的连续数据，得到驾驶员行为特征数据片；构建基于增量学习的驾驶员身份识别模型，将驾驶员行为特征数据片输入基于增量学习的驾驶员身份识别模型，对驾驶员进行身份识别。

与现有技术相比，本发明至少具有以下有益效果：

一种基于增量学习的动态驾驶员身份识别方法，与现有的驾驶员身份识别方法相比，本方法使用增量学习算法建立开放式驾驶员身份识别模型，由于增量学习算法的开放性，在新的待识别驾驶员不断加入驾驶员身份识别模型的动态场景中，可以使用重放、上下文门限、知识蒸馏的方式调整模型，模型不需要保存已加入到驾驶员身份识别模型内的驾驶员数据，并且在新待识别驾驶员加入驾驶员身份识别模型时，很快的完成驾驶员身份识别模型重训练过程，提高时间和空间利用率。

进一步的，驾驶员行为特征体现在CAN总线数据中，不同传感器对于驾驶员行为体现的权重不同，通过文献和实验，选择了七种体现驾驶员行为特征权重高的传感器数据，收集这些数据来提取驾驶员行为特征，建立驾驶员行为特征数据集，驾驶员身份识别结果更加精确，驾驶员行为特征数据集占用存储空间少，但是更能充分体现驾驶员行为特征。

进一步的，由于驾驶员行为特征的连续性，需要选取一段驾驶员行为特征数据进行特征提取，所以，可以使用滑动窗口的方式，提取驾驶员行为特征数据片，通过实验发现，驾驶员行为特征数据片大小[300×m]，滑动窗口滑动的步长为60，合适的滑动窗口大小，可以充分体现驾驶员行为特征，获得最佳识别效果。

进一步的，基于增量学习的驾驶员身份识别模型分为两部分，第一部分是主模型M，第二部分是生成器模型G；通过重放、上下文门限、知识蒸馏的方式进行基于增量学习的驾驶员身份识别模型重训练，不需要保存已加入到驾驶员身份识别模型内的驾驶员数据，并且在新待识别驾驶员加入驾驶员身份识别模型时，很快的完成驾驶员身份识别模型重训练过程，提高时间和空间利用率。

进一步的，在卷积过程中，需要设置卷积核大小，在驾驶员行为特征数据收集与提取过程中，得到了21列数据作为驾驶员行为特征数据，所以滤波器大小设置为[21×m]，接着，设置步长大小为1、通道数位256，保证驾驶员行为特征的连续性。根据驾驶员行为特征数据结果设置滤波器大小，方便数据预处理。

进一步的，使用不同的权重W_n动态调整损失函数计算结果，可以提高模型识别精确度。

进一步的，VAE网络训练编码器和解码器，可以学习到输入的驾驶员行为特征数据在隐空间中的连续表示，与驾驶员行为的连续性相匹配；主模型和生成器模型共享同一卷积层和全连接层的数据，可以保证使用数据的一致性。

进一步的，在生成器模型中，使用x表示待加入识别模型的驾驶员任务， P(x)表示该驾驶员被生成器模型正确识别的概率，P(x)越大，证明识别结果越好，所以，通过求P(x)的对数来找到其最大值；量化表示驾驶员被生成器模型正确识别的概率。

进一步的，知识蒸馏就是在软目标训练生成标签时乘一个温度变量T，软化目标概率。驾驶员特征数据往往具有一定的相似性，因此预测结果有时几乎没有概率差异。以往的预测方法使用一定的概率值来表示预测结果，这种方式往往被称为硬目标预测。硬目标预测往往只选择概率最大的一个结果，忽略了其余结果造成的影响。因此，可以使用包含所有可能类别的预测概率向量来表示预测结果，这种方式往往被称为软目标预测。

综上所述，本发明使用增量学习算法，可以准确识别驾驶员身份，更快的完成驾驶员身份识别模型重训练过程，提高驾驶员身份识别方案的时间利用率，使用增量学习算法提高驾驶员身份识别方案的空间利用率。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

图1为增量学习流程图；

图2为基于增量学习的动态驾驶员身份识别模型流程图；

图3为基于增量学习的动态驾驶员身份识别模型识别结果混淆矩阵图；

图4为同类增量学习算法对比实验结果图；

图5为与现有驾驶员身份识别方案对比实验结果图，其中，(a)为汽车V1， (b)为汽车V2。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要理解的是，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述预设范围等，但这些预设范围不应限于这些术语。这些术语仅用来将预设范围彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一预设范围也可以被称为第二预设范围，类似地，第二预设范围也可以被称为第一预设范围。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

在附图中示出了根据本发明公开实施例的各种结构示意图。这些图并非是按比例绘制的，其中为了清楚表达的目的，放大了某些细节，并且可能省略了某些细节。图中所示出的各种区域、层的形状及它们之间的相对大小、位置关系仅是示例性的，实际中可能由于制造公差或技术限制而有所偏差，并且本领域技术人员根据实际所需可以另外设计具有不同形状、大小、相对位置的区域 /层。

本发明提供了一种基于增量学习的动态驾驶员身份识别方法，收集驾驶过程中产生的CAN总线数据，将CAN总线数据转化为十进制数据，得到含有m 个特征的驾驶员行为特征数据；收集传感器在一个时间单元内传输的所有数据，并对收集的数据取均值，将收集到的驾驶员行为特征数据整合为t条数据，得到一个[t×m]的驾驶员特征数据集；驾驶员行为特征数据集中截取连续数据，得到驾驶员行为特征数据片；构建基于增量学习的驾驶员身份识别模型，将驾驶员行为特征数据片输入基于增量学习的驾驶员身份识别模型，对驾驶员进行身份识别。本发明能准确识别驾驶员身份，更快的完成驾驶员身份识别模型重训练过程，提高驾驶员身份识别方案的时间利用率。

请参阅图1，本发明一种基于增量学习的动态驾驶员身份识别方法，包括以下步骤：

S1、特征数据的提取和特征数据集生成

S101、提取特征数据

首先，招募n位志愿者作为驾驶员驾驶汽车进行实验，通过OBD接口收集驾驶过程中产生的CAN总线数据，并使用CANalyse汽车分析工具对这些得到的数据进行分析处理，将十六进制的CAN总线数据转化为十进制数据。

表Ⅰ 7种传感器

根据实验和前人的工作，发现不同传感器的数据可用性不同，表Ⅰ列出了可用性最强的7种传感器，每个传感器有独特的ID和频率，数据段长度也不同，根据ID识别并抽取这些充分代表驾驶员行为特征的数据，使输入的数据更能体现驾驶员行为特征。因此，通过这种方式，得到含有m个特征的驾驶员行为特征数据。

S102、生成样本集

从表Ⅰ中发现，选择的7种传感器数据在CAN总线中传输频率不同，例如，刹车踏板的数据传输频率为20ms/次，引擎的数据传输频率为125ms/次。所以，选取0.5秒作为一个时间单元，收集传感器在一个时间单元内传输的所有数据，并对这些数据取均值。使用这种方式，可以将收集到的驾驶员行为特征数据整合为t条数据。最终，可以得到一个[t×m]的驾驶员特征数据集。

S2、构建增量学习模型

S201、基于滑动窗口的数据输入

驾驶员的习惯往往隐藏在连续时间的数据中，单一时间点的数据并不能充分的体现驾驶员的行为习惯，所以，使用滑动窗口的方式，从得到的[t×m]大小的驾驶员行为特征数据集中截取一段时间内的连续数据，得到驾驶员行为特征数据片。接着选取合适的滑动窗口滑动步长，既要保证每个数据片都要包含前一个数据片的数据，使数据变化更具连续性，又要提高识别效率。大量实验表明，当驾驶员行为特征数据片大小为[300×m]，滑动窗口滑动的步长为60时，可以充分体现驾驶员行为特征，获得最佳识别效果。

S202、构建基于增量学习的驾驶员身份识别模型

提出了一种基于增量学习的驾驶员身份识别方案，命名为G-DriverID。与之前的工作相比，G-DriverID更适合需要不断向模型中添加新驾驶员的动态场景。G-DriverID使用知识蒸馏、上下文门限等方法来解决灾难性遗忘问题，提高模型重训练效率。

基于增量学习的驾驶员身份识别模型

请参阅图1，增量学习是一种开放性的机器学习算法。与以往的驾驶员身份识别方案不同，当新的待识别驾驶员需要加入到模型中时，常见的驾驶员身份识别方案往往需要收集所有目标驾驶员数据，使用这些数据重新训练整个模型。增量学习则是使用新加入的驾驶员数据，对已有的驾驶员身份识别模型进行调整，最终使模型可以识别所有驾驶员。

基于增量学习的驾驶员身份识别模型识别流程

请参阅图2，当新的编号为n的驾驶员拟加入到可以识别n-1位驾驶员的基于增量学习的驾驶员身份识别模型中时，主模型M_n-1使用生成器模型生成的新重放数据和编号为n的驾驶员的数据，重新训练得到新的主模型M_n，最终可以识别所有n位驾驶员。具体过程如下：

在输入层，首先将输入的300×m驾驶员特征数据片归一化处理转化为张量；

然后，将这些张量放入卷积层进行卷积运算；卷积核中，滤波器大小为[21×m]，步长大小为1，通道数为256。通过激活函数ReLU(·)进行激活，最终获得一组[280×1]的C1神经元。在全连接层，进一步提取C1神经元的特征，最终得到大小为[128×1]的F2神经元，至此，拟加入到基于增量学习的编号为 n的驾驶员身份识别模型的驾驶员数据D_n准备完毕。

基于增量学习的驾驶员身份识别模型分为两部分，第一部分是主模型M，第二部分是生成器模型G。当新的编号为n的驾驶员拟加入到可以识别n-1位驾驶员的基于增量学习的驾驶员身份识别模型中时，生成器模型G_n--首先生成原重放数据

接着，生成器模型G_n-1利用原重放数据

和拟加入到识别模型中的编号为n的驾驶员特征数据D_n重新训练生成器模型，获得新生成器模型G_n；接着，使用新的生成器模型G_n生成新重放数据

使用这些部分新重放数据

和拟加入到识别模型中的编号为n的驾驶员特征数据D_n重新训练主模型M_n-1，主模型在训练过程中进行判定分类结果时，使用知识蒸馏的方式标记结果，知识蒸馏不会直接根据主模型结果将输入待识别驾驶员直接标记为最大可能性的驾驶员，而是使用所有类别的预测概率，对其进行标记。最终，得到可以识别n位驾驶员的新主模型M_n，至此，基于增量学习的驾驶员身份识别模型重训练过程完毕。

主模型

主模型是一个具有基本神经网络结构的分类器。主模型的训练结果用损失函数L_total量化表示，L_total由两部分组成，其中一部分损失由新的待识别的驾驶员行为特征数据产生，该数据记录为L_current，另一部分损失是由生成的重放数据产生，记为L_replay。这两项损失的权重由输入的任务数决定。

L_total表示为：

其中，W_n表示标记为n的驾驶员的权重。

在主模型中，选择均方误差损失作为损失函数L_current和L_replay中使用的函数，其中，损失函数L可以表示为：

其中，y_i表示第i位驾驶员数据的真实值。y′_i表示第i位驾驶员数据的预测值。

生成器模型

生成器模型使用变分自动编码器(VAE)网络进行深度学习，并与主模型共享同一卷积层和全连接层。生成器模型的损失函数也类似于主模型，即：

VAE网络的理论来源于高斯混合模型，将输入驾驶员行为特征数据定义为 x，z是编码器的输出。

驾驶员的行为特征数据x被VAE网络正确识别的概率为P(x)，其越大，代表识别效果越好，可以通过计算设定的损失函数L来量化计算P(x)，其可以表示为：

P(x)＝∫_zP(z)P(x|z)dz

VAE网络主要包括编码器和解码器两部分，这两部分是完全连接的网络，有两个隐藏层，包含400个非线性单元和ReLU(·)，q(z|x)表示输入为x时编码器输出z的概率，P(x|z)表示输入为z时解码器输出x的概率，编码器输出两组代码μ和σ控制噪声的干扰程度。

公式变形为：

logP(x)＝L_b+KL(q(z|x)||P(z|x)

其中，KL(q(z|x)||P(z|x))为KL散度，用于表示两个概率分布P(z|x)和 q(z|x)的不对称性，KL散度始终大于0。

因此，L_b是logP(x)的下限；从L_b公式可知，通过调整编码器使q(z|x)最小，接着调整解码器使P(x|z)最大，使L_b得到最大值，使预测值最接近真实值。

知识蒸馏

驾驶员特征数据往往具有一定的相似性，因此预测结果有时几乎没有概率差异。以往的预测方法使用一定的概率值来表示预测结果，这种方式往往被称为硬目标预测。硬目标预测往往只选择概率最大的一个结果，忽略了其余结果造成的影响。因此，可以使用包含所有可能类别的预测概率向量来表示预测结果，这种方式往往被称为软目标预测。知识蒸馏就是在软目标训练生成标签时乘一个温度变量T，软化目标概率。在测试时，将温度T变回原值。驾驶员n 训练期间蒸馏的损失L_D表示为：

其中，θ指在第n位驾驶员在训练时的超参数，T为温度变量

为主模型预先定义温度为T时的条件概率。

上下文门限

为了在生成器模型中新重放数据

生成部分实现上下文敏感处理，对于每个待识别的驾驶员，解码器网络中每个隐藏层随机选择一定比例的单元子集实现完全选通。使用一个预设的超级参数，在当执行条件重播并生成重播样本时，根据选定的参数来确定使用哪个类。当没有条件重播时，生成重播样本时使用的类将从迄今为止看到的类中随机选择，最终，得到经过上下文选择后的新重放数据

本发明再一个实施例中，提供一种基于增量学习的动态驾驶员身份识别系统，该系统能够用于实现上述基于增量学习的动态驾驶员身份识别方法，具体的，该基于增量学习的动态驾驶员身份识别系统包括数据模块以及识别模块。

其中，数据模块，收集驾驶过程中产生的CAN总线数据，将CAN总线数据转化为十进制数据，得到含有m个特征的驾驶员行为特征数据；收集传感器在一个时间单元内传输的所有数据，并对收集的数据取均值，将收集到的驾驶员行为特征数据整合为t条数据，得到一个[t×m]的驾驶员特征数据集；

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。通常在此处附图中的描述和所示的本发明实施例的组件可以通过各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实验环境

为了验证G-DriverID的鲁棒性，在两台汽车V1与V2中进行实验研究。除此之外，还招募了15名志愿者驾驶这两辆汽车，收集驾驶时CAN总线数据。这15名志愿者中，有10名男性志愿者和5名女性志愿者，年龄在24岁到50 岁之间，驾龄在两年以上。在驾驶过程中，使用车载诊断工具CANalyse来收集来自OBD-II端口的CAN总线数据并进行分析。

为了减少外部因素对实验结果的干扰，需要制定特定的驾驶路线。制定的路线主要包含三种路况：拥挤路况，弯道路况和直行路况。在具体实验中，设计的路线整体约9公里长，根据道路法规，驾驶速度低于每小时70公里，行驶一周时间大约需20分钟。收集45个晴天的驾驶数据，以防止天气和行人的干扰，在这期间，每位驾驶员每天都需要在指定路线上分别驾驶两辆实验车辆行驶2圈。将收集到的数据存储在数据库中，并使用方案中的方法进行数据处理。最终，提取出能够充分代表驾驶员行为特征的数据，为每个驾驶员建立了包括37500个训练数据和7500个测试数据的驾驶员行为数据集；分别从汽车V1和汽车V2中选取23和27个特征数据。

实验结果

(1)驾驶员身份识别结果

使用基于增量学习的模型来实现驾驶员身份识别。训练数据来源于制作好的驾驶员行为特征数据集。使用滑动窗口的方法提取驾驶员行为特征数据片，将这些数据片转化为张量，对模型进行训练。

首先使用5名待识别驾驶员的驾驶数据来获得初始化模型。

然后向模型中逐个添加新的驾驶员数据。经过训练，得到新模型中每个驾驶员的准确度。随着模型内识别驾驶员数量的增加，驾驶员的平均识别准确度也在变化。

最终，当15位驾驶员数据全部加入模型后，用混淆矩阵的方式表示识别结果，如图3所示，每个空格内上方数字代表车辆V1的识别结果，每个空格内下方数字代表车辆V2的识别结果。其中，T表示测试数据的真实标签，D表示测试数据的预测结，对角线代表准确预测的驾驶员数据比例。

从图3中可以看出，在V1中，驾驶员的最高识别率可达97.46％，最低识别率为90.19％。在V2中，驾驶员的最高识别率可达96.55％，最低识别率为 90.25％。

此外，在最新的模型中，新添加的授权驾驶员的准确性高于以前的授权驾驶员。这是因为在重训练期间，灾难性遗忘问题将降低先前授权驾驶员的准确性。

(2)同类增量学习算法对比实验结果

请参阅图4，使用相同的训练/测试数据集与其他两种代表性增量学习模型 (生成重放(GR)和弹性权重整合(EWC))进行实验比较。首先使用5个授权驾驶员初始化这些模型，并记录当前的平均识别准确率。然后，将其他10名授权驾驶员逐个添加到这些模型中，并记录每次的平均精度。从图5看出，随着越来越多的驾驶员加入到这些模型中，驾驶员识别准确度会慢慢降低。然而， G-DriverID模型的平均精度高于GR和EWC模型。在V1的实验中，G-DriverID、 GR和EWC车型中15名授权驾驶员的平均准确率分别为93.51％、91.08％和76.25％。在V2的实验中，这三款车型中15名授权驾驶员的平均准确率分别为 92.84％、90.4％和76.41％。由此可见，本发明具有优越性。

虽然增量学习模型在动态场景中重训练效率高，但这些模型存在灾难性遗忘的问题。随着驾驶员数量的增加，最先加入模型的驾驶员身份识别准确率下降。从图5中可以看出，在V1中，对于编号前三位的驾驶员来说，G-DriverID 模型的准确率分别为90.9％、91.9％和90.1％。GR模型的准确率分别为87.7％、 88.3％、88.7％。在EWC模型中，准确率分别为59.7％、61.1％和61.3％。在V2 中，这三位驾驶员在G-DriverID模型中的准确率分别为91.8％、91.9％和90.6％。在GR模型中，比率分别为86.6％、87.3％和87.4％。在EWC模型中，该比率分别为60.8％、62.4％和64.7％。实验结果表明，与其他增量学习模型相比，G-DriverID的识别效果普遍良好。

(3)与现有驾驶员身份识别方案对比实验结果

与现有驾驶员身份识别方案相比，当模型需要扩展的场景下，方案具有显著的优势。在现有的驾驶员身份识别方案中，选择了两种典型的模型SVM和 CNN进行实验比较。

首先，使用五名驾驶员数据训练这些模型。当需要向这些模型中添加新的待识别驾驶员时，CNN和SVM需要对整个模型进行重新训练，但方案G- DriverID只需要对以前的模型进行增量重新训练。

按照上述方法依次向这些模型中添加15名驾驶员，并记录模型重训练的运行时间。从图5中看出，在V1和V2两辆汽车中，随着授权驾驶员数量的增加，G-DriverID的优势越来越突出，再培训运行时间远低于CNN和SVM模型。因此，在实际场景中，G-DriverID比其他模型具有更好的应用价值。

综上所述，本发明一种基于增量学习的动态驾驶员身份识别方法及系统，具有以下特点：

第一、本发明在真实汽车中进行实验，数据获取和驾驶员身份识别结果真实可靠；测试结果表明，本发明提供的方法可以精准识别驾驶员身份，具有很强的可用性和实用性。

第二、本发明对收集到的CAN总线数据进行进一步分析处理，提取更能体现驾驶员特征的CAN总线数据，减小无关数据造成的影响，数据来源更加具有代表性。

第三、与现有工业中使用的驾驶员身份识别方案相比，本发明通过驾驶员特征数据隐性识别驾驶员身份，识别结果更加精准，难以被攻击，安全性强。

第四、与其他机器学习驾驶员身份识别方案相比，本发明不仅可以精准识别驾驶员身份，显著提高新的驾驶员加入到驾驶员身份识别系统时系统重新训练的效率。

第五、本发明在两辆不同制造商生产的汽车中进行实验，考虑了不同车辆对识别结果造成的影响，实验结果具有鲁棒性。

第六、本发明可以应用在长途公交车，运钞车和其他驾驶员变化频繁的特种车辆中，提高新的驾驶员加入时识别系统的效率，提高驾驶安全性。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/ 或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上内容仅为说明本发明的技术思想，不能以此限定本发明的保护范围，凡是按照本发明提出的技术思想，在技术方案基础上所做的任何改动，均落入本发明权利要求书的保护范围之内。

Claims

1.一种基于增量学习的动态驾驶员身份识别方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，步骤S1中，传感器包括刹车踏板、发动机扭矩、转向轮、横向加速度、节流阀、横摆率和油门踏板。

3.根据权利要求1所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，步骤S2中，驾驶员行为特征数据片大小为[300×m]，滑动窗口滑动的步长为60。

4.根据权利要求1所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，步骤S2中，对驾驶员进行身份识别具体为：

生成器模型G_n-1利用原重放数据

使用新的生成器模型G_n生成新重放数据

使用知识蒸馏的方式标记新重放数据

和拟加入到识别模型中的编号为n的驾驶员特征数据D_n重新训练主模型M_n-1，主模型在重训练过程中进行判定分类结果时，使用知识蒸馏的方式标记结果，

最终，得到识别n位驾驶员的新主模型M_n，完成基于增量学习的驾驶员身份识别模型重训练。

5.根据权利要求4所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，卷积核中，滤波器的大小为[21×m]，步长大小为1，通道数为256。

6.根据权利要求4所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，主模型为具有基本神经网络结构的分类器，主模型的训练结果用损失函数L_total量化表示，损失函数L_total为：

7.根据权利要求4所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，生成器模型使用变分自动编码器网络进行深度学习，并与主模型共享同一卷积层和全连接层。

8.根据权利要求4所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，生成器模型中，使用x表示待加入识别模型的驾驶员任务，P(x)表示驾驶员被正确识别的概率，通过求P(x)的对数确定最大值，logP(x)为：

logP(x)＝L_b+KL(q(z|x)||L(z|x)

其中，z为隐变量，代表生成器模型使用的VAE网络编码器的编码结果，L_b为logP(x)的下限，KL(q(z|x)||P(z|x))为KL散度，q(z|x)代表输入为x时编码器将其输出为z的概率，P(x|z)为输入为z时解码器输出x的概率，P(z)为隐变量z被正确识别的概率。

9.根据权利要求4所述的基于增量学习的动态驾驶员身份识别方法，其特征在于，驾驶员n训练期间蒸馏的损失L_D为：

其中，θ指在第n位驾驶员在训练时的超参数，T为温度变量

为主模型预先定义温度为T时的条件概率。

10.一种基于增量学习的动态驾驶员身份识别系统，其特征在于，包括：