WO2020224127A1

WO2020224127A1 - 视频流截取方法、装置及存储介质

Info

Publication number: WO2020224127A1
Application number: PCT/CN2019/103615
Authority: WO
Inventors: 秦勇
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-05-05
Filing date: 2019-08-30
Publication date: 2020-11-12
Also published as: CN110267095A

Abstract

本申请涉及人工智能技术领域，提出一种视频流截取方法、装置及存储介质，其中的方法包括：在html前端打开摄像装置，利用摄像装置获取待确认身份的客户的视频；将视频处理成图片，其中，利用canvas对视频进行解析生成视频流数据，视频流数据包括每一帧图像的视频流信息，在视频流信息中截取图片；将截取的图片传输至后台，在后台对图片进行识别，确定客户的身份。本申请通过在html前端打开摄像装置获取视频，并利用canvas方式将视频截取图片，然后图片在后台进行识别，从而解决目前图像处理也必须在后台处理的问题，节省了开发工作量，并降低了人力和物力。

Description

视频流截取方法、装置及存储介质

本申请要求于2019年5月5日提交中国专利局，申请号为201910367384.3、发明名称为“视频流截取方法、装置及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种视频流截取方法、装置及计算机可读存储介质。

背景技术

目前，在无人超市中买东西付款时，需要采集视频信息进行匹配身份，将采集到的视频流截取图片，并将截图的图片进行处理，然后与数据库中的标准图片进行匹配，匹配成功后，需要支付的货款就直接支付到无人超市；这种支付方式更加方便和快速。

但是，目前这种支付方式是由后台编写一套图像处理软件来开启摄像头、获取视频流和截取图片来完成的，由于是在后台应用，这一系列处理耗时耗力，对电脑的性能要求也比较高。

为解决上述问题，亟需一种新的视频流截取方法。

发明内容

本申请提供一种视频流截取方法、电子装置及计算机可读存储介质，其主要目的在于通过在html前端打开摄像装置获取视频，并利用canvas方式将视频截取图片，然后将截取的图片在后台进行识别，从而解决目前的图像处理也必须在后台处理的问题，节省了开发工作量，并降低了人力和物力。

为实现上述目的，本申请提供一种电子装置，该装置包括：存储器、处理器及摄像装置，所述存储器中包括视频流截取程序，所述视频流截取程序被所述处理器执行时实现如下步骤：

在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频；

将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。

此外，为实现上述目的，本申请还提供一种视频流截取方法，所述方法包括：

将截取的所述图片传输至后台，所述后台对所述掌纹和所述图片进行识别，确定客户的身份。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中包括视频流截取程序，所述视频流截取程序被处理器执行时，实现如下步骤：

本申请提出的视频流截取方法、装置及计算机可读存储介质，通过从在html前端打开摄像装置，利用摄像装置获取待确认身份的客户的视频；将视频处理成图片，利用canvas对视频进行解析生成视频流数据，视频流数据包括每一帧图像的视频流信息，在视频流信息中截取图片。通过结合机器学习模型对截取的图片进行训练学习确定客户的身份，有效提高研发的工作效率，降低人力和物力，以及对电脑性能要求。

附图说明

图1为本申请视频流截取方法较佳实施例的应用环境示意图；

图2为图1中视频流截取程序较佳实施例的模块示意图；

图3为本申请视频流截取方法较佳实施例的流程图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供一种视频流截取方法，应用于一种电子装置1。参照图1所示，为本申请视频流截取方法较佳实施例的应用环境示意图。

在本实施例中，电子装置1可以是服务器、智能手机、平板电脑、便携计算机、桌上型计算机等具有运算功能的终端设备。

该电子装置1包括：处理器12、存储器11、摄像装置13、网络接口14及通信总线15。

存储器11包括至少一种类型的可读存储介质。所述至少一种类型的可读存储介质可为如闪存、硬盘、多媒体卡、卡型存储器11等的非易失性存储介质。在一些实施例中，所述可读存储介质可以是所述电子装置1的内部存储单元，例如该电子装置1的硬盘。在另一些实施例中，所述可读存储介质也可以是所述电子装置1的外部存储器11，例如所述电子装置1上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。

在本实施例中，所述存储器11的可读存储介质通常用于存储安装于所述电子装置1的视频流截取程序10等。所述存储器11还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)，微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行视频流截取程序10等。

摄像装置13既可以是所述电子装置1的一部分，也可以独立于电子装置1。在一些实施例中，所述电子装置1为智能手机、平板电脑、便携计算机等具有摄像头的终端设备，则所述摄像装置13即为所述电子装置1的摄像头。在其他实施例中，所述电子装置1可以为服务器，所述摄像装置13独立于该电子装置1、与该电子装置1通过网络连接，例如，该摄像装置13安装于特定场所，如办公场所、监控区域，对进入该特定场所的目标实时拍摄得到实时图像，通过网络将拍摄得到的实时图像传输至处理器12。

网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该电子装置1与其他电子设备之间建立通信连接。

通信总线15用于实现这些组件之间的连接通信。

图1仅示出了具有组件11-15的电子装置1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

可选地，该电子装置1还可以包括用户接口，用户接口可以包括输入单元比如键盘(Keyboard)、语音输入装置比如麦克风(microphone)等具有语音识别功能的设备、语音输出装置比如音响、耳机等，可选地用户接口还可以包括标准的有线接口、无线接口。

可选地，该电子装置1还可以包括显示器，显示器也可以称为显示屏或显示单元。在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode，OLED)触摸器等。显示器用于显示在电子装置1中处理的信息以及用于显示可视化的用户界面。

可选地，该电子装置1还包括触摸传感器。所述触摸传感器所提供的供用户进行触摸操作的区域称为触控区域。此外，这里所述的触摸传感器可以为电阻式触摸传感器、电容式触摸传感器等。而且，所述触摸传感器不仅包括接触式的触摸传感器，也可包括接近式的触摸传感器等。此外，所述触摸传感器可以为单个传感器，也可以为例如阵列布置的多个传感器。

此外，该电子装置1的显示器的面积可以与所述触摸传感器的面积相同，也可以不同。可选地，将显示器与所述触摸传感器层叠设置，以形成触摸显示屏。该装置基于触摸显示屏侦测用户触发的触控操作。

可选地，该电子装置1还可以包括射频(Radio Frequency，RF)电路，传感器、音频电路等等，在此不再赘述。

在图1所示的装置实施例中，作为一种计算机存储介质的存储器11中可以包括操作系统、以及视频流截取程序10；处理器12执行存储器11中存储的视频流截取程序10时实现如下步骤：

在html前端打开摄像装置13，利用所述摄像装置13获取待确认身份的客户的视频；

将所述视频处理成图片，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

其中，所述视频为掌纹视频或者脸部视频；在本申请中，可以通过摄像装置13获取掌纹视频或者脸部视频，当获取掌纹视频时，将客户的手掌心按照要求的手势和部位在摄像装置所能拍摄的范围内，摄像装置13获取有效的客户的掌纹视频；当获取客户的脸部视频时，客户按照规定的要求站在摄像装置13前方所能拍摄的范围内，使得摄像装置拍摄到有效的客户的脸部视频。

当所述视频为掌纹视频时，在所述视频流信息中截取的图片为掌纹图片；

将截取到的所述掌纹图片传输至后台，在所述后台，将所述掌纹图片与后台数据库中的标准掌纹图片进匹配，确定客户的身份。

当所述视频为脸部视频时，在所述视频流信息中截取的图片为脸部图片；

将截取到的所述脸部图片传输至后台，在所述后台，将所述脸部图片与后台数据库中的标准脸部图片进匹配，确定客户的身份。

在本申请中，在html前端使用代码打开摄像头，底层功能集成到navigator对象中；即：在所述html前端，利用navigator和video打开摄像装置；其中，Navigator对象包含有关浏览器的信息，所有浏览器都支持该对象；具体地，Navigator对象包含的属性描述了正在使用的浏览器，可以使用这些属性进行平台专用的配置。虽然这个对象的名称显而易见的是Netscape的Navigator浏览器，但其他实现了JavaScript的浏览器也支持这个对象。Navigator对象的实例是唯一的，可以用Window对象的navigator属性来引用它。

当摄像装置13拍摄到视频时，摄像装置13将拍摄到的视频发送到处理器12，当处理器12接收到该视频后，首先对拍摄到的视频流进行缓冲或者解析，并按照canvas制式对视频流数据进行解析，生成视频流数据对应的每一帧图像的视频流数据；然后按照每隔300ms(0.3秒)在视频流中截取一张图片，将截取的图片转成base64形式传输至后台。

具体地，在视频处理过程中，具体过程如下：

首先使用canvas.getContext('2d')创建画布；其中，创建画布是为了之后的截取图片做准备，截到图片放在画布中展示，然后转成相应的格式(png或jpg)。

然后使用context.drawImage(video,0,0,800,600)；画出当前video内展示的图片，图片大小为800*600；

其中，每隔300ms(0.3秒)截取一张图片，在本申请中共截取10张，可以根据需要截取更多的图片。

上述这一步骤的目的是为了设置了截取的图片的规格大小，在视频流中，截取到的图片的大小都是800*600，以及截取的时间间隔。

在本申请中，通过机器学习模型对截取的图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。

具体地，采用长短期记忆网络对输入的超市购物客户的掌纹进行图像分析，分析客户的掌纹与后端的数据库的客户的标准掌纹是否匹配，从而通过掌纹信息确定客户的身份；或者对输入的客户的脸部图片进行图像分析，分析获取客户的脸部图片与后端数据库中的客户的标准脸部图片是否匹配，从而通过脸部信息确定客户的身份。

通过机器学习模型识对掌纹图片或者脸部图片进行学习，机器学习模型可以不做特指，目前用到的是深度学习模型。

其中，深度学习就是要构建一个网络，这个网络也就是指深度学习神经网络模型，深度学习一般可以归纳为以下所示的3个步骤：

第一步骤，神经网络模型是一个有简单函数组成的复杂的函数，通常设计一个神经网络模型，然后用计算机从给定的训练数据中训练得到一些参数，这些参数保证模型能够在测试集中达到设计预期的效果，并且具有泛化能力。

第二步骤，根据训练数据定义一个代价函数，通过代价函数可以评估参数有效性，定义一个代价函数则是根据具体任务和实际的训练数据进行设计。

第三个步骤，根据前面两步骤的结果找出最佳的函数，例如用梯度下降的方法找出这个最佳的函数。

其中，在本申请中的深度学习模型可以为CNN(Convolutional Neural Network，卷积神经网络)和LSTM(Long Short-Term Memory，长短期记忆网络)。

其中，卷积神经网络CNN是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现，它包括卷积层(convolutional layer)和池化层(pooling layer)。

CNN的基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。

LSTM(是长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。基于LSTM的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等任务。

需要说明的是，上述实施例中采用长短期记忆网络对输入的超市购物客户的掌纹图片或者脸部图片进行分析，确定客户的掌纹是否与数据库的客户的标准掌纹匹配，或者确定客户的脸部图片是否与数据库中的客户的脸部标准图片匹配，从而确定客户的身份。

上述实施例提出的电子装置1，通过从在html前端打开摄像装置，利用摄像装置获取待确认身份的客户的视频；将视频处理成图片，利用canvas对视频进行解析生成视频流数据，视频流数据包括每一帧图像的视频流信息，在视频流信息中截取图片。通过结合机器学习模型对截取的图片进行训练学习确定客户的身份，有效提高研发的工作效率，降低人力和物力，以及对电脑性能要求。

在其他实施例中，视频流截取程序10还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由处理器12执行，以完成本申请。本申请所称的模块是指能够完成特定功能的一系列计算机程序指令段。参照图2所示，为图1中视频流截取程序10较佳实施例的程序模块图。所述视频流截取程序10可以被分割为：视频获取模块110、图片截取模块120及图片识别模块130。所述模块110-130所实现的功能或操作步骤均与上文类似，此处不再详述，示例性地，例如其中：

视频获取模块110，用于在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频；

图片截取模块120，用于将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

图片识别模块130，用于将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。

此外，本申请还提供一种视频流截取方法。参照图3所示，为本申请视频流截取方法较佳实施例的流程图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，视频流截取方法包括：步骤S110-步骤S130。

步骤S110，在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频。

在所述html前端，利用navigator和video打开摄像装置。在本申请中，在html前端使用代码打开摄像头，底层功能集成到navigator对象中。其中，Navigator对象包含有关浏览器的信息，所有浏览器都支持该对象。

其中具体用到的代码如下：

通过上述代码在html前端，利用navigator和video打开摄像装置。

其中，所述视频为掌纹视频或者脸部视频；在本申请中，可以通过摄像装置获取掌纹视频或者脸部视频，当获取掌纹视频时，将客户的手掌心按照要求的手势和部位在摄像装置所能拍摄的范围内，摄像装置获取有效的客户的掌纹视频；当获取客户的脸部视频时，客户按照规定的要求站在摄像装置前方所能拍摄的范围内，使得摄像装置拍摄到有效的客户的脸部视频。

将截取到的所述脸部图片传输至后台，在所述后台，将所述脸部图片与后台数据库中的标准脸部图片进匹配，确定客户的身份。步骤S130，将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片。

在本申请中，采用canvas方式将摄像头拍摄到的视频处理成图片，其中，每隔300ms截取一张图片。

在视频处理过程中，首先对拍摄到的视频流进行缓冲或者解析，并按照canvas制式对视频流数据进行解析，生成视频流数据对应的每一帧图像的视频流数据；然后按照每隔300ms(0.3秒)在视频流中截取一张图片。

将所述视频处理成图片的步骤包括：

然后使用context.drawImage(video,0,0,800,600)；画出当前video内展示的图片，图片大小为800*600，也就是说，利用context.drawImage按照预设的规定画出当前在所述画布中展示的截取的图片。

采用如下的代码截取10张图片：

最后，将截取的图片转成base64形式传输至后台。

步骤S130，将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。

在本申请中，通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。

通过机器学习模型识对掌纹图片和脸部图片进行学习，机器学习模型可以不做特指，目前用到的是深度学习模型。

上述实施例提出的视频流截取方法，通过从在html前端打开摄像装置，利用摄像装置获取待确认身份的客户的视频；将视频处理成图片，利用canvas对视频进行解析生成视频流数据，视频流数据包括每一帧图像的视频流信息，在视频流信息中截取图片。通过结合机器学习模型对截取的图片进行训练学习确定客户的身份，有效提高研发的工作效率，降低人力和物力，以及对电脑性能要求。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质中包括视频流截取程序，所述视频流截取程序被处理器执行时实现如下操作：

优选地，所述视频为掌纹视频或者脸部视频；其中，

优选地，当所述视频为脸部视频时，在所述视频流信息中截取的图片为脸部图片；

优选地，所述将所述视频处理成图片的步骤包括：

利用canvas.getContext创建画布，将截取的图片放置在所述画布中展示；

利用context.drawImage按照预设的规定画出当前在所述画布中展示的截取的图片；

将画出的截取的图片转换成base64形式传输至所述后台。

优选地，所通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。

本申请之计算机可读存储介质的具体实施方式与上述视频流截取方法、电子装置的具体实施方式大致相同，在此不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种视频流截取方法，应用于电子装置，其特征在于，所述方法包括：

在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频；

将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。
根据权利要求1所述的视频流截取方法，其特征在于，

所述视频为掌纹视频或者脸部视频；其中，

当所述视频为掌纹视频时，在所述视频流信息中截取的图片为掌纹图片；

将截取到的所述掌纹图片传输至后台，在所述后台，将所述掌纹图片与后台数据库中的标准掌纹图片进匹配，确定客户的身份。
根据权利要求2所述的视频流截取方法，其特征在于，

当所述视频为脸部视频时，在所述视频流信息中截取的图片为脸部图片；

将截取到的所述脸部图片传输至后台，在所述后台，将所述脸部图片与后台数据库中的标准脸部图片进匹配，确定客户的身份。
根据权利要求1所述的视频流截取方法，其特征在于，

所述将所述视频处理成图片的步骤包括：

利用canvas.getContext创建画布，将截取的图片放置在所述画布中展示；

利用context.drawImage按照预设的规定画出当前在所述画布中展示的截取的图片；

将画出的截取的图片转换成base64形式传输至所述后台。
根据权利要求1所述的视频流截取方法，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求2所述的视频流截取方法，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求3所述的视频流截取方法，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求4所述的视频流截取方法，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
一种电子装置，其特征在于，该电子装置包括：存储器、处理器及摄像装置，所述存储器中包括视频流截取程序，所述视频流截取程序被所述处理器执行时实现如下步骤：

在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频；

将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。
根据权利要求9所述的电子装置，其特征在于，

所述视频为掌纹视频或者脸部视频；其中，

当所述视频为掌纹视频时，在所述视频流信息中截取的图片为掌纹图片；

将截取到的所述掌纹图片传输至后台，在所述后台，将所述掌纹图片与后台数据库中的标准掌纹图片进匹配，确定客户的身份。
根据权利要求9所述的电子装置，其特征在于，

所述将所述视频处理成图片的步骤包括：

利用canvas.getContext创建画布，将截取的图片放置在所述画布中展示；

利用context.drawImage按照预设的规定画出当前在所述画布中展示的截取的图片；

将画出的截取的图片转换成base64形式传输至所述后台。
根据权利要求9所述的电子装置，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求10所述的电子装置，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求11所述的电子装置，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括视频流截取程序，所述视频流截取程序被处理器执行时，实现如下步骤：

在html前端打开摄像装置，利用所述摄像装置获取待确认身份的客户的视频；

将所述视频处理成图片，其中，利用canvas对所述视频进行解析生成视频流数据，所述视频流数据包括每一帧图像的视频流信息，在所述视频流信息中截取图片；

将截取的所述图片传输至后台，在所述后台对所述图片进行识别，确定客户的身份。
根据权利要求15所述的计算机可读存储介质，其特征在于，

所述视频为掌纹视频或者脸部视频；其中，

当所述视频为掌纹视频时，在所述视频流信息中截取的图片为掌纹图片；

将截取到的所述掌纹图片传输至后台，在所述后台，将所述掌纹图片与后台数据库中的标准掌纹图片进匹配，确定客户的身份。

当所述视频为脸部视频时，在所述视频流信息中截取的图片为脸部图片；

将截取到的所述脸部图片传输至后台，在所述后台，将所述脸部图片与后台数据库中的标准脸部图片进匹配，确定客户的身份。
根据权利要求16所述的计算机可读存储介质，其特征在于，

所述将所述视频处理成图片的步骤包括：

利用canvas.getContext创建画布，将截取的图片放置在所述画布中展示；

利用context.drawImage按照预设的规定画出当前在所述画布中展示的截取的图片；

将画出的截取的图片转换成base64形式传输至所述后台。
根据权利要求15所述的计算机可读存储介质，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求16所述的计算机可读存储介质，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。
根据权利要求17所述的计算机可读存储介质，其特征在于，

通过机器学习模型对所述图片进行训练学习确定客户的身份，其中，所述机器学习模型包括卷积神经网络和长短期记忆网络。