[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN115546824B - 禁忌图片识别方法、设备及存储介质 - Google Patents

禁忌图片识别方法、设备及存储介质 Download PDF

Info

Publication number
CN115546824B
CN115546824B CN202210405635.4A CN202210405635A CN115546824B CN 115546824 B CN115546824 B CN 115546824B CN 202210405635 A CN202210405635 A CN 202210405635A CN 115546824 B CN115546824 B CN 115546824B
Authority
CN
China
Prior art keywords
picture
tabu
resource
resources
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210405635.4A
Other languages
English (en)
Other versions
CN115546824A (zh
Inventor
石英男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honor Device Co Ltd
Original Assignee
Honor Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honor Device Co Ltd filed Critical Honor Device Co Ltd
Priority to CN202210405635.4A priority Critical patent/CN115546824B/zh
Publication of CN115546824A publication Critical patent/CN115546824A/zh
Application granted granted Critical
Publication of CN115546824B publication Critical patent/CN115546824B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种禁忌图片识别方法、设备及存储介质,该方法通过设置预处理后的图片资源先经过人像识别模型进行人像的识别,从而可以滤除掉大量不符合裸露皮肤类型的禁忌图片,然后再由裸露皮肤程度检测模型对人像识别模型识别出的人像图片资源进行打分,确定裸露分数,并将裸露分数与一个较低的裸露阈值进行比较,从而便可以高效、精准的确定当前图片资源是否为禁忌图片,进而确保针对不允许人像裸露皮肤地区的操作系统版本中不包括被认为是裸露皮肤类型的人像图片资源,更好的满足了足当地的历史背景等需求。

Description

禁忌图片识别方法、设备及存储介质
技术领域
本申请涉及图片处理技术领域,尤其涉及一种禁忌图片识别方法、设备及存储介质。
背景技术
随着全球化地发展,越来越多的产品不仅限于国内市场,也走向了国际市场。由于不同国家、地区有着自己特有的历史背景等,因此为了使产品,例如具备显示界面的各种电子设备能够更好的满足当地的需求,在发布涉及图片资源的操作系统时,目前通常是由人工进行禁忌图片的识别,以确保针对不同国家、地区的操作系统版本能够满足当地的历史背景等需求。
但是,这种禁忌图片的识别方式太过依赖人力,费时费力,因此亟需提供一种禁忌图片识别方案,以降低对人力的依赖,提升识别效率。
发明内容
为了解决上述技术问题,本申请提供一种禁忌图片识别方法、设备及存储介质,旨在减少人力投入,以更稳定、更高效、更精准的方式自动对操作系统中涉及的图片资源进行识别,确保针对不同国家、地区的操作系统版本能够满足当地的历史背景等需求。
第一方面,本申请提供一种禁忌图片识别方法。该方法包括:获取操作系统中涉及的图片资源;根据人像识别模型识别出图片资源中的人像图片资源,人像图片资源为图片资源中包括人像的图片资源;根据裸露皮肤程度检测模型确定人像图片资源的裸露分数;根据裸露阈值和裸露分数,确定人像图片资源是否为禁忌图片。这样,通过设置预处理后的图片资源先经过人像识别模型进行人像的识别,从而可以滤除掉大量不符合裸露皮肤类型的禁忌图片,然后再由裸露皮肤程度检测模型对人像识别模型识别出的人像图片资源进行打分,确定裸露分数,并将裸露分数与一个较低的裸露阈值进行比较,从而便可以高效、精准的确定当前图片资源是否为禁忌图片,进而确保针对不允许人像裸露皮肤地区的操作系统版本中不包括被认为是裸露皮肤类型的人像图片资源,更好的满足了足当地的历史背景等需求。
根据第一方面,人像识别模型基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得。
根据第一方面,或者以上第一方面的任意一种实现方式,裸露皮肤程度检测模型基于残差网络ResNet50的NSFW框架对Imagenet数据集中的数据训练获得。
根据第一方面,或者以上第一方面的任意一种实现方式,方法还包括:根据禁忌动物识别模型识别出图片资源中的禁忌动物图片资源,禁忌动物图片资源为图片资源中包括禁忌动物的图片资源;其中,禁忌动物识别模型基于ResNext卷积神经网络对Imagenet数据集中的数据和网络爬取的禁忌动物的图片数据训练获得。这样,就可以得到一个能够覆盖真实场景(动物的照片)和虚拟场景(卡通/简笔画的动物)的禁忌动物识别模型,从而能够更加精准的识别出禁忌动物类型的禁忌图片。
根据第一方面,或者以上第一方面的任意一种实现方式,方法还包括:根据禁忌旗帜识别模型识别出图片资源中的禁忌旗帜图片资源,禁忌旗帜图片资源为图片资源中包括禁忌旗帜的图片资源,禁忌旗帜识别模型为YoloV3框架结构;和/或,根据敏感地区识别模型识别出图片资源中的敏感地区图片资源,敏感地区图片资源为图片资源中包括敏感地区的图片资源,敏感地区识别模型为YoloV3框架结构。
根据第一方面,或者以上第一方面的任意一种实现方式,方法还包括:在确定图片资源为禁忌图片时,根据图片资源的名称、路径地址和可视化的图片资源生成可视化警告报告;将可视化警告报告提交人工复核;在接收到复核人员提交的复核信息时,响应于复核人员提交的复核信息,将复核人员确定的禁忌图片从操作系统中删除。这样,通过生成可视化警告报告,从而在人工复核时可以直接确定该图片资源是否确实是禁忌图片,而无需根据图片资源的名称和路径地址查找图片资源才能确定,进而提升了人工复核环节的复核效率。
根据第一方面,或者以上第一方面的任意一种实现方式,在获取操作系统中涉及的图片资源之后,方法还包括:根据自学习后的ResNet50卷积神经网络模型从图片资源中提取特征信息;根据自学习后的一分类模型对特征信息进行分类处理,识别出误报图片资源,误报图片资源为经复核人员复核后确定的不是禁忌图片的图片资源;将误报图片资源从图片资源中过滤掉。这样,每一张误报图片资源,复核人员只需审视一次,后续就不会在出现在可视化warning报告表中,从而可以减少不必要的人力投入。
根据第一方面,或者以上第一方面的任意一种实现方式,方法还包括:根据复核人员提交的复核信息,确定可视化警告报告中的误报图片资源;根据误报图片资源构建学习数据集;基于学习数据集中的数据对ResNet50卷积神经网络模型进行过采样训练,得到自学习后的ResNet50卷积神经网络模型;基于学习数据集中的数据对一分类模型进行过拟合训练,得到自学习后的一分类模型。这样,不仅可以将一模一样的误报图片资源先过滤掉,还可以过滤掉类似的图片资源。
根据第一方面,或者以上第一方面的任意一种实现方式,在获取操作系统中涉及的图片资源之后,方法还包括:对图片资源进行预处理,统一图片资源的尺寸、通道数。这样,实现了对待识别图片资源的规范,从而能够使得识别不同禁忌类型的禁忌图片的识别模型能够快速、精准的提取特征信息进行识别。
根据第一方面,或者以上第一方面的任意一种实现方式,在对图片资源进行预处理,统一图片资源的尺寸、通道数之前,方法还包括:确定图片资源的格式;在图片资源的格式为矢量可绘制对象DVG格式时,改编图片资源的属性和值,将图片资源从DVG格式转换为可缩放的矢量图像格式SVG;将SVG格式的图片资源转换为便携式网络图形PNG格式。这样,对于以XML形式存在的DVG格式的图片资源便可以转换为可视化的PNG格式,方便后续识别模型进行特征提取,以及生成可视化警告报告。
第二方面,本申请提供了一种电子设备。该电子设备包括:存储器和处理器,存储器和处理器耦合;存储器存储有程序指令,程序指令由处理器执行时,使得所述电子设备执行第一方面或第一方面的任意可能的实现方式中的方法的指令。
第三方面,本申请提供了一种计算机可读介质,用于存储计算机程序,该计算机程序包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的指令。
第四方面,本申请提供了一种计算机程序,该计算机程序包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的指令。
第五方面,本申请提供了一种芯片,该芯片包括处理电路、收发管脚。其中,该收发管脚、和该处理电路通过内部连接通路互相通信,该处理电路执行第一方面或第一方面的任一种可能的实现方式中的方法,以控制接收管脚接收信号,以控制发送管脚发送信号。
附图说明
图1是示例性示出的数据层获取图片资源和对图片资源进行预处理的示意图;
图2是示例性示出的一种包含手的图片资源示意图;
图3是采用本申请提供的手部识别模型对图2所示的图片资源识别后得到的手部图片资源示意图;
图4是采用本申请提供的手部识别模型对包含手掌的图片资源识别后得到的手部图片资源示意图;
图5是采用本申请提供的手势识别模型对图4所示的手部图片资源中手关节点定位后的示意图;
图6是本申请提供的禁忌图片识别方法中,数据层、强化学习层、模型层和判断层的处理流程示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请实施例的说明书和权利要求书中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述对象的特定顺序。例如,第一目标对象和第二目标对象等是用于区别不同的目标对象,而不是用于描述目标对象的特定顺序。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,除非另有说明,“多个”的含义是指两个或两个以上。例如,多个处理单元是指两个或两个以上的处理单元;多个系统是指两个或两个以上的系统。
为了更好的理解本申请实施例提供的技术方案,在对本申请的技术方案说明之前,首先对当前被特定国家、地区认为是禁忌图片(不允许出现的图片)的类型进行说明。具体的说,目前的禁忌图片大致可以分为:裸露皮肤、禁忌手势、禁忌动物、禁忌旗帜、地图标志这五类。
示例性的,在一些实现方式中,对于裸露皮肤类型的禁忌图片,主要针对严禁使用皮肤暴露的人像图片的地区的禁忌要求来确定。
示例性的,在另一些实现方式中,对于禁忌手势类型的禁忌图片,主要针对不同地区对相同手势的不同解读的禁忌要求来确定。
示例性的,在另一些实现方式中,对于禁忌动物类型的禁忌图片,主要针对不同地区对相同动物的禁忌要求来确定。
示例性的,在另一些实现方式中,对于禁忌旗帜类型的禁忌图片,主要根据目前全球给出的禁忌旗帜要求来确定。
示例性的,在另一些实现方式中,对于地图标志类型的禁忌图片,目前主要针对存在国家争议的禁忌要求来确定。
关于上述五种禁忌图片类型就介绍到此,应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。在实际应用中,如果产品推广的地区涉及其他禁忌要求,禁忌图片的类型、判定禁忌图片的要求也可以根据需求进行调整,本申请对此不作限制。
基于上述禁忌图片类型对应的禁忌要求(判定要求),为了使产品,尤其是具备显示界面的各种电子设备能够更好的满足当地的历史背景等需求,提出了本申请提供的禁忌图片识别方案,以在减少人力投入的情况下,能够以更稳定、更高效、更精准的方式自动对操作系统中涉及的图片资源进行识别,从而确保针对不同国家、地区的操作系统版本能够满足当地的历史背景等需求。
可理解的,关于电子设备的操作系统,通常是由拍包服务器发布的。因此,在一些实现方式中,本申请提供的技术方案可以适用于拍包服务器,这样在发布需要更新迭代的操作系统时,便可以先利用本申请提供的禁忌图片识别方法对需要发布的操作系统的升级包进行识别,然后将识别出的禁忌图片进行过滤(删除),从而确保发布出去的针对不同国家、地区的操作系统版本是满足当前国家、地区需求的。
示例性的,在另一些实现方式中,对禁忌图片的识别也可以由针对不同国家、地区的空中下载技术(Over-the-Air Technology,OTA)服务器实现。即,拍包服务器发布更新迭代的操作系统的升级包时,只需发布一份,针对不同国家、地区的OTA服务器从拍包服务器获取升级包时,根据预先置入的禁忌要求,按照本申请提供的技术方案进行禁忌图片的识别,然后将识别出的禁忌图片进行过滤,从而确保更新迭代后的操作系统能够满足当前国家、地区的历史背景等需求。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
下面对本申请各实施例提供的技术方案的实现细节进行说明,以下内容仅为方便理解而提供的实现细节,并非实施本方案的必须。
示例性的,以一种可行的实现方式为例,本申请提供的技术方案所适用于的平台架构可以分为数据层、模型层、判断层和强化学习层。其中,数据层用于获取操作系统中需要进行识别处理的图像资源,并对这些图像资源进行预处理;模型层用于根据业务需求将不同禁忌图片类型对应的识别模型进行组合,从而识别不同禁忌图片;判断层用于回溯确认禁忌图片的资源,并自动生成可视化报告;强化学习层用于根据可视化报告中标注的误报图片资源训练强化学习模型,从而能够在后续识别中,先由强化学习模型对数据层提供的图片资源进行过滤,从而去掉之前被误认为禁忌图片的图片资源,然后再讲过滤后的图片资源送往模型层中的各个识别模型进行识别处理。
为了更好的理解上述平台架构,以下分别对每一层涉及的内容进行说明。
具体的说,对于数据层的处理逻辑,大致分为图片资源获取和图片资源预处理两个步骤。
示例性的,对于图片资源获取步骤,在一些实现方式中,例如可以是在接收到扫描代码仓内的图片资源的分布式版本控制系统(git)命令后,对代码仓内的图像资源进行自动化扫描。以Android系统为例,关于扫描的图像资源例如可以分为便携式网络图形(Portable Network Graphics,PNG)格式、联合图像专家组(Joint Photographic ExpertsGroup,JPEG/JPG)格式、Android特定的可绘制对象(Drawable Vector Graphics,DVG)格式。
此外,需要说明的是,在本申请提供的技术方案中,为了便于在后续确定图片资源为禁忌图片时能够精准定位禁忌图片的位置将其删除,在图片资源获取步骤中除了会获取图片资源本身,还可以获取图片资源的名称、存储的路径地址等,以便后续根据名称和路径地址精准定位禁忌图片的位置将其删除。
为了便于后续说明,本申请中将从代码仓扫描图片资源的程序/函数称为图片资源扫描器,例如图1所示。此外,可理解的,关于PNG格式和JPG格式的图片资源,例如图1所示的电话图片资源101,在代码仓内其背景颜色是透明的(没有背景颜色),因此对于用户而言,实质上肉眼是无法看到的,因此为了便于模型层、判断层和强化学习层的识别处理,在扫描得到PNG格式和JPG格式的图片资源时,需要对其进行预处处理,即执行图片资源预处理步骤,从而得到图1所示的电话图片资源102,即能够肉眼可见。
此外,对于DVG格式的图片资源,在Android系统中为了节约图像存储空间,使用了矢量可绘制对象(VectorDrawable)来存储图片资源,尤其是系统自带的一些图标,而VD形式的图标,即DVG格式的图片资源是以XML格式存储在代码仓中的,例如录像机图片资源的XML代码可以如图1中103所示。对于这类图片资源,由于同样是未可视的,因此模型层、判断层和强化学习层无法直接进行特征提取,在扫描得到DVG格式的图片资源时,同样需要对其进行预处处理,即执行图片资源预处理步骤,从而得到图1所示的录像机图片资源104,即能够肉眼可见。
此外,可理解的,虽然PNG格式和JPG格式的图片资源是无法肉眼可见的,但系统可以识别,即此类图片资源本身是以图片形式存储的,并非XML代码。因此,对PNG格式和JPG格式的图片资源进行的预处理步骤例如可以包括尺寸处理、通道数处理和可视化处理。
示例性的,具体到本申请提供的技术方案中,对于尺寸处理,具体是将图片资源扫描器扫描到的图片资源的尺寸统一成640*640*3的格式;对于通道数处理,在本申请中不论是单通道、三通道,还是四通道均将其统一处理为三通道。
需要说明的是,在实际应用中,常见的图像通道数分为单通道、三通道和四通道(RGBA)。其中,单通道即灰度照片(GrayScale),图层数只有一层;三通道为常见的彩色照片(RGB),通道数为R、G、B三层;四通道则为RGB+Alpha的图片,通常情况下最后一层的Alpha为不透明参数,因此四通道的图片资源可能会出现全透明(如图101所示)或全黑的情况。
此外,还需要说明的是,对于上述所说的可视化处理,具体是针对四通道,且Alpha层为全黑或全透明的图片资源的。
示例性的,对于Alpha图层全为1(全黑)或全为0(全透明)的情况,通常情况下可以选择直接删除Alpha图层,直接使用其RGB图层,但对于少部分将图像存在Alpha层,而使用RGB层做透明化处理的图片资源,则需要使用Alpha图层作为处理后的单图层图像,去除RGB层,再将其叠加为三通道图片。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。在实际应用中,可以根据业务需要设置图片资源的预处理流程,例如根据业务需求选择上述任意几项,或者在上述处理流程的基础上,再增加图像增强处理,从而便于后续特征提取,进而更好的对图片资源进行识别。
此外,通过上述描述可知,DVG格式的图片资源是以XML代码的形式存在的。因此,对于此类图片资源的预处理,需要先将DVG格式的图片资源中的属性和值改编成可缩放的矢量图像(Scalable Vector Graphics,SVG)对应的属性和值,然后保存成SVG格式的图片资源,最后使用python(一种计算机编程语言)中的cairosvg模块包(一个用于将SVG格式转换为PNG格式的工具包),将SVG格式图片资源转化为PNG格式的图片资源,从而完成DVG格式到PNG格式的转换。接着,便可以执行上述给出的对PNG格式的图片资源进行的预处理操作,例如尺寸处理、通道数处理和可视化处理。
可理解的,由于DVG(或者VG)格式的图片资源和SVG格式的图片资源都是基于XML语法实现的,并且这两种格式对基本图形定义的名称都是通用的,例如线条(line)、文本(text)、矩形(rect)、圆(circle)等都是一样的名称,另外这两种格式的图片资源都是基于坐标进行布局的。因此,通过改编属性和值便可以实现相互的转换。而SVG格式的图片资源目前可以基于python中的cairosvg模块包转换为PNG格式的图片资源,DVG暂时还没有可以直接转换为PNG格式或JPG格式的方式,因此需要先将DVG格式的图片资源转换为SVG格式的图片资源,如果随着图片处理技术的发展,后续可以将DVG格式的图片资源直接转换为PNG格式或JPG格式,则可以跳过将DVG格式的图片资源中的属性和值改编成SVG格式的图片资源中对应的属性和值的操作,直接借助工具执行将DVG格式的图片资源转换为SVG格式的图片资源的操作。
具体到本申请中,在将DVG格式的图片资源中的属性和值改编成SVG格式的图片资源中对应的属性和值时,例如可以是先加载DVG格式的图片资源,然后识别DVG格式的图片资源的作用域,进而计算出转换为SVG格式的图片资源时的原点坐标,接着根据计算出的原点坐标开始对DVG格式的图片资源的属性和值进行改编,进而得到SVG格式的图形元素,最后创建SVG文件,将转换后的图像元素添加到SVG文件中,便可以实现将DVG格式的图片资源中的属性和值改编成SVG格式的图片资源中对应的属性和值的操作。
关于数据层中图片资源获取步骤和图片资源预处理步骤的描述就介绍到此,应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。关于将DVG格式的图片资源中的属性和值改编成SVG格式的图片资源中对应的属性和值的操作、以及将SVG格式图片资源转化为PNG格式的图片资源的操作,以及尺寸处理、通道数处理、可视化处理、图像增强处理的具体实现细节可以参见现有标准,此处不再赘述。
对于模型层的处理逻辑,根据禁忌图片类型,例如上述给出的五种,可以根据业务需求在模型层选择对应每一种禁忌图片类型的识别模型进行组合。为了便于后续说明,在本申请提供的技术方案中,将识别裸露皮肤类别的禁忌图片的识别模型称为裸露皮肤识别模型,将识别禁忌手势类别的禁忌图片的识别模型称为禁忌手势识别模型,将识别禁忌动物类别的禁忌图片的识别模型称为禁忌动物识别模型,将识别禁忌旗帜类别的禁忌图片的识别模型称为禁忌旗帜识别模型,将识别敏感地区(禁忌地图标识)类别的禁忌图片的识别模型称为敏感地区识别模型。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。在实际应用中,可以根据需要对识别不同禁忌图片的识别模型进行命名,此处不作限制。
示例性的,以上述名称为例,具体到本申请提供的技术方案中,裸露皮肤识别模型包括人像识别模型和裸露皮肤程度检测模型。其中,人像识别模型基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得,用来对预处理后的图片资源进行人像的识别;裸露皮肤程度检测模型基于残差网络ResNet50的NSFW框架对Imagenet数据集中的数据训练获得,用来对人像识别模型识别出的人像图片资源,即包括人像的图片资源进行裸露皮肤程度检测。
可理解的,YoloV5网络与通用Yolo系列算法同属于一步检测算法的范畴。在数据预处理方面,YoloV5沿用了YoloV4提出的马赛克图像在线增强方式,旨在增加单个批量中小目标的数量,提升网络对小目标的识别能力,同时也增大了单个批量的数据信息。也就是说,YoloV5是用来进行目标对象识别的,具体到本申请中是对人像的识别,即识别的目标对象是人像。而COCO数据集,即上下文中的常见对象(Common Objects in COntext,COCO)数据集,它是一个可以用来进行图像识别的数据集,其内包括了大型的、丰富的物体检测,分割和字幕数据。COCO数据集以scene understanding(场景理解)为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation(分割)进行位置的标定。目前,COCO数据集中的图像包括91类目标,328000影像和2500000个label(标签)。此外,COCO数据集也是目前为止有语义分割的最大数据集,它提供的类别有80类,有超过33万张图片资源,其中20万张图片资源有标注,整个数据集中个体的数目超过150万个。因此,本申请提供的技术方案中用来识别人像图片资源的人像识别模型通过基于YoloV5网络对COCO数据集中人像类别的图片资源进行迭代训练,直至满足预设的收敛要求,从而在将预处理后的图片资源作为输出参数输入人像识别模型后,通过人像识别模型对图片资源的识别处理,便可以精准的确定当前输入的图片资源中是否包含人像,即是否为人像图片资源。
此外,需要说明的是,YoloV5网络采用了不同于通用Yolo系列算法的正例定义方式。通用Yolo系列算法利用先验框与真实目标框的交并比(Intersection overUnion,IOU)值来定义正例,IOU值大于阈值的先验框设为正例,而由于先验框与真实目标框是一一对应的关系,故最多仅有与真实目标框个数相同的正例,会存在正负例不均衡的情况。而YoloV5则利用先验框与真实目标框的宽高比来定义正例,宽高比小于阈值即为正例,同时以允许多个先验框匹配一个真实目标框的方式增大正例的比例,并设置偏移量,用临近网格同时预测同一个目标,进一步增加正例数量,使得正例比例大大增加。
在损失函数方面,YoloV5采用类别损失、目标损失与回归损失三部分来指导训练。设预测框总索引为i,预测正例索引为p,y为预测类别,y1为真实类别。
示例性的,关于类别损失,采用二值交叉熵,其计算公式如下式(1):
示例性的,关于目标损失,采用二值交叉熵,计算公式如下式(2):
示例性的,关于回归损失,采用GIOU(GeneralizedIntersection overUnion,可以作为目标检测回归部分目标函数以及一种度量)计算方式,其计算公式如下式(3),其中ioup为预测正例框p与对应真实框的交并比:
示例性的,关于总损失,为以上三部分损失的加权和,其计算公式如下式(4):
loss=α·clsloss+β·objloss+γ·giouloss (4)
关于YoloV5网络,以及COCO数据集的内容就介绍到此,在基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得人像识别模型时,未在本申请中记载的内容可以参见YoloV5网络,以及COCO数据集的相关标准,此处不再赘述。
此外,需要说明的是,在一些实现方式中,输入训练获得的人像识别模型的内容例如可以是数据层中预处理操作后的图片资源,也可以是经过强化学习层滤除往期误报的禁忌图片的图片资源。
此外,在一些实现方式中,可以设置经人像识别模型识别处理后输出的内容为“1”或“0”,并约定“1”指示当前识别的图片资源包含人像,即是人像图片资源,“0”指示当前识别的图片资源不包含人像。
此外,在另一些实现方式中,还可以设置经人像识别模型识别处理后输出的内容为“Yes”或“No”,并约定“Yes”指示当前识别的图片资源包含人像,即是人像图片资源,“No”指示当前识别的图片资源不包含人像。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
此外,需要说明的是,关于训练裸露皮肤程度检测模型所使用的Imagenet数据集就像一个网络一样,拥有多个Node(节点)。每一个Node相当于一个item(项)或者subcategory(子类)。根据Imagenet数据集的标准可知,一个Node含有至少500个对应物体的可供训练的图片/图像,即Imagenet数据集实际上就是一个巨大的可供图像/视觉训练的图片库。关于裸露皮肤程度检测模型,本申请依旧采用的是现有训练裸露皮肤程度检测模型常用的ResNet50的NSFW(Not Suitable For Work)框架,但是由于本申请提供的技术方案中所说的裸露皮肤类别的禁忌图片主要是指某些地区要求的严禁使用皮肤暴露的人像图片,因此本申请提供的技术方案中涉及的裸露皮肤程度检测模型与现有用来识别不适合浏览内容(色情图片)的裸露皮肤程度检测模型有本质的区别。具体的说,本申请提供的技术方案中涉及的裸露皮肤程度检测模型是针对经人像识别模型识别为人像图片资源中的皮肤区域个数、每个皮肤区域的像素与该人像图像资源中所有像素的比值、该人像图片资源中最大的皮肤区域和总皮肤面积等特征进行训练获得的。并且,由于这些地区对裸露容忍度较低,因此可以设置一个较低的收敛值,通过不断的更新迭代训练,直至满足收敛要求为止。
具体到本申请中,通过上述特征训练获得的裸露皮肤程度检测模型对人像图片资源进行检测时,主要将上述特征作为打分参数,即对皮肤区域个数、每个皮肤区域的像素与该人像图像资源中所有像素的比值、该人像图片资源中最大的皮肤区域和总皮肤面积等打分参数进行打分,进而确定该人像图片资源的裸露分数。
此外,需要说明的是,对于一些仅裸露双臂的人像,经过本申请的裸露皮肤程度检测模型确定的裸露分数可能有0.22的分数,这一分数对于大部分地区而言并不属于禁忌图片,但是对于严禁裸露皮肤的地区依旧会被认为是禁忌图片,因此可以设置一个较低的裸露阈值,比如0.01,这样通过比较裸露阈值和经裸露皮肤程度检测模型确定的裸露分数的大小,便可以确定当前的人像图片资源是否为禁忌图片。
示例性的,在一些实现方式中可以设置裸露分数小于裸露阈值时,确定该人像图片资源不是禁忌图片,反之则确定该人像图片资源是裸露皮肤类型的禁忌图片。
关于ResNet50的NSFW框架,以及Imagenet数据集的内容就介绍到此,在基于ResNet50的NSFW框架对Imagenet数据集中的数据训练得裸露皮肤程度检测模型时,未在本申请中记载的内容可以参见ResNet50的NSFW框架,以及Imagenet数据集的相关标准,此处不再赘述。
此外,还需要说明的是,在一些实现方式中,可以设置经裸露皮肤程度检测模型识别处理后输出的内容为“1”或“0”,并约定“1”指示当前的人像图片资源是裸露皮肤类型的禁忌图片,即裸露分数大于或等于裸露阈值的情况,“0”指示当前的人像图片资源不是禁忌图片,即裸露分数小于裸露阈值的情况。
此外,在另一些实现方式中,还可以设置经裸露皮肤程度检测模型识别处理后输出的内容为“Yes”或“No”,并约定“Yes”指示当前的人像图片资源是裸露皮肤类型的禁忌图片,即裸露分数大于或等于裸露阈值的情况,“No”指示当前的人像图片资源不是禁忌图片,即裸露分数小于裸露阈值的情况。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
由此,本申请提供的技术方案中,通过设置识别裸露皮肤类型的禁忌图片的裸露皮肤识别模型包括人像识别模型和裸露皮肤程度检测模型,并设置预处理后的图片资源或者经过强化学习层滤除往期误报的禁忌图片的图片资源先经过人像识别模型进行人像的识别,从而可以滤除掉大量不符合裸露皮肤类型的禁忌图片,然后再由裸露皮肤程度检测模型对人像识别模型识别出的人像图片资源进行打分,确定裸露分数,并将裸露分数与一个较低的裸露阈值进行比较,从而便可以高效、精准的确定当前图片资源是否为禁忌图片。
示例性的,由于大部分禁忌手势较为小众,难以收集到大量的图片资源供深度学习训练,因此无法直接利用常规的神经网络技术来进行检测。仍以上述名称为例,具体到本申请提供的技术方案中,为了高效、精准的实现禁忌手势图片的识别,禁忌手势识别模型包括手部识别模型和手势识别模型。其中,手部识别模型基于SSD(Single-shot Detector)目标识别框架对手势识别数据集中的手部数据训练获得,用来对预处理后的图片资源进行手部识别,并返回边界框;手势识别模型为MediaPipe框架结构,用来对手部识别模型识别出的手部图片资源(包括手部的图片资源)中手区域内部的21个3D手关节点(landmark)进行精确的关键点定位(即对21个3D landmarks的自动打点),并提取这21个3D landmarks的坐标信息,进而基于支持向量机(Support Vector Machine,SVM)算法对这21个3D landmarks的坐标信息进行分析,从而预测出该手部图片资源中的手势。
可理解的,SSD是一种目标检测算法,SSD目标识别框架的主要设计思想是特征分层提取,并依次进行边框回归和分类,具体到本申请提供的技术方案中,基于SSD目标识别框对手势识别数据集中的手部数据训练获得手势识别模型,从而在对预处理后的图片资源进行识别时,先由手势识别模型进行识别处理,从而实现了使用深度学习提取特征信息,保证了提取的特征信息的精准度。
此外,由于手部识别模型为处理速度快且开销小的SSD目标识别框架结构,因此在保证精准度的同时,又能够高效的完成特征信息的提取,从而节省了运算资源。
此外,需要说明的是,在一些实现方式中,上述所说的手势识别数据集例如可以是HGRD(Hand Gesture Recognition Dataset)数据集,HGRD数据集收集了各种手部图片/图像。
此外,在另一些实现方式中,上述所说的手势识别数据集例如可以是动态手势数据集,如CGD(ChaLearn Gesture Data)、源自CGD的ChaLearn LAP IsoGD数据集、源自CGD的ChaLearn LAP ConGD等,此处不再一一列举,本申请对此不作限制。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
此外,关于上述所说的MediaPipe框架,是一个主要用于构建音频、视频或任何时间序列数据的框架。在MediaPipe框架的帮助下,可以为不同的媒体处理功能构建管道。目前,MediaPipe主要应用于多手追踪、人脸检测、对象检测和跟踪、3D对象检测和跟踪、自动视频裁剪管道等,此处不再一一列举,本申请对此不作限制。具体到本申请提供的技术方案中,手势识别模型是基于MediaPipe框架能够应用于多手追踪的特性,即MediaPipe框架结构的手势识别模型使用单次手掌检测,一旦完成,它会对检测到的手部区域中的21个3Dlandmarks打点,即进行精确的关键点定位。
此外,手势识别模型在对21个3D landmarks打点,提取这21个3D landmarks的坐标信息后,便会采用SVS算法,本申请中具体为一对一法(one-versus-one,简称OVO SVMs或者pairwise)。关于该算法的本意是在任意两个样本之间设计一个SVM,因此k(大于0的整数)个类别的样本就需要设计k(k-1)/2个SVM。
示例性的,当采用SVM预测样本的类别时,例如对于一个未知样本进行的分类,最后得票最多的类别即为该未知样本的类别,为了便于理解,以下结合实例进行说明。
示例性的,假设样本有4个分类,分别为A、B、C和D。在预测的时候,可以将A、B、C和D这4个分类两两作为一个SVM,则得到(A,B)、(A,C)、(A,D)、(B,C)、(B,D)和(C,D)这6个SVM训练集。在测试的时候,把对应的向量分别对6个结果进行测试,然后采取投屏形式,最后便可以得到一组结果。
示例性的,关于投票过程,例如为:
初始化A、B、C、D时,设置A=B=C=D=0;
然后对这6个SVM训练集进行投票:
(A,B)-classifier,如果A win,则A=A+1;otherwise,B=B+1;
(A,C)-classifier,如果A win,则A=A+1;otherwise,C=C+1;
(A,D)-classifier,如果A win,则A=A+1;otherwise,D=D+1;
(B,C)-classifier,如果B win,则B=B+1;otherwise,C=C+1;
(B,D)-classifier,如果B win,则B=B+1;otherwise,D=D+1;
(C,D)-classifier,如果C win,则C=C+1;otherwise,D=D+1;
The decision is the Max(A,B,C,D)。
由此,如果经过上述投票过程,最终A=3,B=2,C=1,D=0,则该样本最终的分类即为A分类。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
为了更好的理解对禁忌手势图片的识别逻辑,以下结合图2至图5进行具体说明。
示例性的,如果经过预处理输入手部识别模型的图片资源为图2所示(包括电子设备201和手202),经手部识别模型对图片资源进行识别处理后,确定图2所示的图片资源中包括手,因此将该图片资源确定为手部图片资源(包括手部的图片资源),并标注出手202所在位置的边界框203,如图3所示。
此外,需要说明的是,在一些实现方式中,可以设置手部识别模型处理后输出的内容为“1”或“0”,并约定“1”指示当前的图片资源包含手部,即是手部图片资源,“0”指示当前的图片资源不包含手部。
示例性的,如果经过预处理输入手部识别模型的图片资源中包括的手为图4所示,则经手部识别模型对图片资源进行识别处理后,确定图4所示的图片资源中包括手,因此将该图片资源确定为手部图片资源(包括手部的图片资源),并标注出手301所在位置的边界框302,如图4所示。
此外,在另一些实现方式中,可以设置手部识别模型处理后输出的内容为“Yes”或“No”,并约定“Yes”指示当前的图片资源包含手部,即是手部图片资源,“No”指示当前的图片资源不包含手部。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
为了更直观的获知手势识别模型对手部图片资源中21个3D landmarks的打点,以图4识别出的手部图片资源为例。
示例性的,若将手部识别模型识别出的手部图片资源输入手势识别模型,手势识别模型对手部图片资源进行打点后,会得到如图5所示的手部地标示意图,其中0至20便是21个3D landmarks的打点。
示例性的,在得到这21个3D landmarks打点后,提取这21个3D landmarks的坐标信息。为了便于说明,本申请这21个3D landmarks的坐标信息作为一个样本集,然后将这一样本集分为16个分类,基于上述给出的SVM算法,将样本通过16(16-1)/2个SVM进行预测处理,从而实现对手部图片资源中手势的分类处理。
仍以图4所示的手部图片资源为例,基于SVM算法对图5打点后的21个3Dlandmarks的坐标信息对应的样本进行预测后,可以确定图4所示的手部图片资源中的手势为“五指张开”的手势。
此外,可理解的,本申请中将样本分为16个分类是基于目前确定的16种禁忌手势确定的,也就是说在实际应用中,将手部图片资源对应的样本分为多少个分类,可以根据需要识别的禁忌手势的种类确定。
关于SSD目标识别框架、MediaPipe框架,以及SVM算法的内容就介绍到次,在基于SSD目标识别框架训练手部识别模型,基于MediaPipe框架构建手势识别模型,以及基于SVM算法预测手势时,未在本申请中记载的内容可以参见SSD目标识别框架、MediaPipe框架,以及SVM算法的相关标准,此处不再赘述。
由此,本申请提供的技术方案中,通过设置设备禁忌手势类型的禁忌图片的禁忌手势识别模型包括手部识别模型和手势识别模型,并设置预处理后的图片资源或者经过强化学习层滤除往期误报的禁忌图片的图片资源先经过计算开销小的SSD目标识别框架结构的手部识别模型进行手部识别,并返回边界框,从而缩小了手势检测范围,进而能够提升手势识别模型的识别效率。
此外,在本申请提供的技术方案中,在手部识别模型识别出当前图片资源为手部图片资源时,通过将标注了手部边界框的手部图片输入到手势识别模型进行识别处理,从而使得MediaPipe框架结构的手势识别模型能够在确定有手的范围内进行手势检测,进而提高了手势识别模型的识别精度。
示例性的,考虑到实际的业务需求,对于禁忌动物类型的禁忌图片,不论是真实的动物图像,还是卡通/简笔画类型的动物图像都不适合在这些忌讳这些禁忌图片的地区显示,因此为了更好的满足用户需求,提升用户体验,具体到本申请提供的技术方案中,在基于ResNext网络(一种卷积神经网络)训练上述所说的禁忌动物识别模型时,训练所需的数据集融合了Imagenet数据集中的动物图像数据,以及从网络上爬取的各种卡通/简笔画动物图像数据,这样就可以得到一个能够覆盖真实场景(动物的照片)和虚拟场景(卡通/简笔画的动物)的禁忌动物识别模型,从而能够更加精准的识别出禁忌动物类型的禁忌图片。
可理解的,目前Imagenet数据集中已经涵盖了1200万张图片资源,这些图片资源覆盖了1000多个种类,针对常见的禁忌动物,如“猪”和“狗”,“猫”,尤其是“黑猫”这三类动物大概有35万张图片资源,因此训练数据比较丰富。
此外,为了保证对卡通/简笔画形式存在的这三类禁忌动物,可以爬取尽可能多的数量,例如5万张,并对爬取的内容进行1:1的处理,以便后续处理。
由此,基于Imagenet数据集中的35张三类禁忌动物的图片资源,和爬取的例如5万张卡通/简笔画形式的图片资源进行迭代训练,直至满足收敛条件便可以获得满足业务需求的禁忌动物识别模型。
关于从网络爬取卡通/简化画形式的图片资源的方式,可以参见现有标准,此处不再赘述。
示例性的,考虑到禁忌旗帜和敏感地区数量有限,因此难以收集到大量的图片资源供深度学习训练,暂时没有合适的框架和管道模型,因此采用了YoloV3网络来构建识别这两类禁忌图片的识别模型,即在实际应用中,用来识别禁忌旗帜类型的禁忌图片的禁忌旗帜识别模型和用来识别敏感地区类型的禁忌图片的敏感地区识别模型可以是单独存在的,即分别基于YoloV3网络对禁忌旗帜类型的图片资源的训练数据训练禁忌旗帜识别模型,基于YoloV3网络对敏感地区类型的图片资源的训练数据训练敏感地区识别模型。
示例性的,在另一些实现方式中,用来识别禁忌旗帜类型的禁忌图片的禁忌旗帜识别模型和用来识别敏感地区类型的禁忌图片的敏感地区识别模型也可以是一个识别模型,即该识别模型既可以识别出禁忌旗帜类型的禁忌图片,也可以识别出敏感地区类型的禁忌图片,因此可以将禁忌旗帜类型的图片资源的数据和敏感地区类型的图片资源的数据融合到一个数据集中,然后基于YoloV3网络对该数据集中的数据进行训练,以获得既可以识别出禁忌旗帜类型的禁忌图片,也可以识别出敏感地区类型的禁忌图片的识别模型。
关于模型层中上述五种禁忌类型对应的识别模型的构建方式就介绍到此,应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。关于使用的各种网络架构,算法未在本申请中详细说明的,可以参见现有标准,此处不再赘述。
对于判断层的处理逻辑,为了进一步提高识别的精准度,对于未通过模型层中任意一条管道(对应不同禁忌类型的识别模型的管道)的图片资源,即被模型层确定为禁忌图片的图片资源,可以将该图片资源的名称、路径地址,以及可视化的图片资源生成警告报告(后续称为warning报告),并将该warning报告提交给人工进行复核。
需要说明的是,虽然本申请依旧会涉及人工复核环节,但是在人工复核前,借助模型层中对应不同禁忌类型的识别模型识别处理,快速、精准的过滤掉了大部分的图片资源,提交人工复核的图片资源大幅度减少,例如可能从几万张减少到几百张,因此可以有效减少人力成本。
此外,由于提交人工复核的warning报告中,被模型层中的识别模型确定为禁忌图片的图片资源是以可视化的形式展示的,因此在人工复核时可以直接确定该图片资源是否确实是禁忌图片,而无需根据图片资源的名称和路径地址查找图片资源才能确定,从而也提升了人工复核环节的复核效率。
为了更好的理解,以下结合表1所示的一种可视化warning报告表进行具体说明。
表1可视化warning报告表
示例性的,如表1所示,图片格式为PNG格式,名称为黑猫1_1.PNG,路径地址为“http://schemas.android.com/apk/res/android1.1”的图片资源、图片格式为JPG格式,名称为恶魔牛角手势.JPG,路径地址为“http://schemas.android.com/apk/res/android1.2”的图片资源,以及图片格式为PNG格式,名称为触摸手势.PNG,路径地址为“http://schemas.android.com/apk/res/android1.3”的图片资源经模型层的禁忌动物识别模型和禁忌手势识别模型识别处理后,被确定为是禁忌图片,这种情况下,就会将图片资源扫描器获取图片资源时获取到的名称和路径地址,以及预处理后的可视化图片资源生成如表1所示的可视化warning报告表,然后将可视化warning报告表提交给人工复核。
相应地,如果在将视化warning报告表提交给人工复核后,接收到复核人员的提交的复核信息,响应于复核人员的复核操作,便会将复核人员确定为误报的图片资源从可视化warning报告表中删除,最后根据可视化warning报告表中剩余的禁忌图片的路径地址,将可视化warning报告表中剩余的禁忌图片从系统中删除。
为了便于理解,以下结合表2所示的一种人工复核后的可视化warning报告表进行具体说明。
表2可视化warning报告表
示例性的,如表2所示,根据人工复核结果(“是否误报”一列记载的复核信息“Yes”或“No”)便可以或者哪些图片资源是误报的,需要从表2所示的可视化warning报告表中删除。
示例性的,在一些实现方式中,可以约定“Yes”指示当前图片资源为误报,即该图片资源不是禁忌图片,不需要将其从系统删除,可以正常显示;约定“No”指示当前图片资源没有误报,即该图片资源是禁忌图片,需要将其从系统删除,不能显示。
示例性的,在另一些实现方式中,还可以约定“1”指示当前图片资源为误报,即该图片资源不是禁忌图片,不需要将其从系统删除,可以正常显示;约定“0”指示当前图片资源没有误报,即该图片资源是禁忌图片,需要将其从系统删除,不能显示。
示例性的,基于表2所示的可视化warning报告表,在判断层响应于复核人员的复核操作,便会将复核人员确定为误报的图片资源,如表2中存储在“http://schemas.android.com/apk/res/android1.3”路径地址下的“触摸手势.PNG”图片资源从可视化warning报告表中删除,删除误报图片资源的可视化warning报告表如表3所示。
表3可视化warning报告表
最后根据表3所示的可视化warning报告表中剩余的禁忌图片的路径地址“http://schemas.android.com/apk/res/android1.1”将可视化warning报告表中剩余的禁忌图片“黑猫1_1.PNG”从系统中删除,根据“http://schemas.android.com/apk/res/android1.2”,将“恶魔牛角手势.JPG”从系统中删除即可。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
对于强化学习层的处理逻辑,为了降低模型层中各识别模型识别出的禁忌图片的误报情况,进一步减少人力投入,可以将复核人员复核过确定为误报的图片资源(后续称为误报图片资源)进行记录,然后基于ResNet50卷积神经网络提取误报图片资源的特征信息,并采用过采样的强记忆训练方式训练ResNet50框架的卷积神经网络模型,采用过拟合的方式对一分类模型(OneClassSVM)进行训练,然后将数据层预处理后的图片资源输入模型层中个管道的识别模型进行识别前先输入强化学习层中的ResNet50卷积神经网络模型进行特征提取,然后在将提前到的特征输入OneClassSVM分类模型进行处理,这样不仅可以将一模一样的误报图片资源先过滤掉,还可以过滤掉类似的图片资源。也就是说,每一张误报图片资源,复核人员只需审视一次,后续就不会在出现在可视化warning报告表中。
此外,还需要说明的是,关于本申请中强化学习层中ResNet50卷积神经网络模型的构建,具体可以将已有的ResNet网络模型进行改造,以使其适应本申请中的图像分类任务。
具体的说,对ResNet网络模型的改造,例如为移除该网络模型的最后一层(top层),然后固定(freeze)前方所有神经网络层的参数,随后在该网络模型的最后依次加入32*640*640*3的全连接层和最后一层判断层,最后使用过采样处理后的误报图片资源数据集中的特征信息作为参数进行训练即可。
可理解的,由于误报图片资源数量相对较少,因此为了保证训练出的ResNet50卷积神经网络模型的精准度,需要将误报图片资源进行复制,以使训练样本数据集中有足够的样本数据,例如将同一个误报图片资源复制1000份,甚至更多。
此外,需要说明的是,在一些实现方式中,对强化学习层中ResNet50卷积神经网络模型和OneClassSVM分类模型的更新训练,例如可以是在满足预设时间,如一个月时,获取依次记录的误报图片资源,然后按照上述方式进行依次学习训练,从而确保往期(之前)的误报图片资源以及类似的图片资源不会在下次禁忌图片识别中再度出现,从而减少可视化warning报告表中记录的误报图片资源,进而减少无效的人力投入。
示例性的,在另一些实现方式中,对强化学习层中ResNet50卷积神经网络模型和OneClassSVM分类模型的更新训练,例如可以是在记录的误报图片资源满足预设阈值时,按照上述方式进行依次学习训练,从而确保往期(之前)的误报图片资源以及类似的图片资源不会在下次禁忌图片识别中再度出现,从而减少可视化warning报告表中记录的误报图片资源,进而减少无效的人力投入。
示例性的,在另一些实现方式中,对强化学习层中ResNet50卷积神经网络模型和OneClassSVM分类模型的更新训练,例如可以是在操作系统需要进行更新迭代,即发布新版本时,按照上述方式进行依次学习训练,从而确保往期(之前)的误报图片资源以及类似的图片资源不会在下次禁忌图片识别中再度出现,从而减少可视化warning报告表中记录的误报图片资源,进而减少无效的人力投入。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
此外,需要说明的是,在一些实现方式中,可以根据业务需求引入本申请提供的技术方案中涉及的强化学习层,即经数据层处理的图片资源先输入强化学习层进行处理,然后再讲强化学习层处理后的图片资源输入到模型层进行禁忌图片的识别操作。
此外,在另一些实现方式中,也可以不引入本申请提供的技术方案中涉及的强化学习层,即经数据层处理的图片资源直接输入到模型层进行禁忌图片的识别操作。
此外,在另一些实现方式中,还可以根据业务需求选择模型层中的任意一个或几个识别模型(裸露皮肤识别模型、禁忌手势识别模型、禁忌动物识别模型、禁忌旗帜识别模型和敏感地区识别模型)组合,实现多条深度学习的管道(Pipeline)来识别禁忌图片,从而能够更加稳定、更加高效、更加精准、更加锋利、更加用户友好的完成对操作系统中禁忌图片的识别、过滤,进而确保针对不同国家、地区的操作系统版本能够满足当地的历史背景等需求。
为了更好的理解本申请提供的技术方案,以下结合图6以数据层、强化学习层、模型层和判断层均涉及的场景为例,对模型层中五种识别模型不同组合的实现方式进行说明。
参见图6,在接收到禁忌图片的识别操作,例如接收到指定的git命令后,响应于该git命令,由上述所说的图片资源扫描器获取操作系统中涉及的图片资源,即执行步骤S101。
示例性的,步骤S101中图片资源扫描器从操作系统中获取图片资源的操作,具体是从代码仓中扫描获取。
可理解的,在实际应用中,代码仓中可能存储了大量的图片资源,因此对于这些图片资源可以设置每扫描到一张,就执行一次步骤S102,即对扫描到的图片资源进行预处理。
此外,在另一些实现方式中,也可以设置将代码仓中全部的图片资源扫描出来后,调用一次步骤S102,然后对扫描到的全部的图片资源一次进行预处理。
此外,在另一些实现方式中,还可以设置每扫描到预设数量的图片资源后,就执行一次步骤S102,从而实现定时、定量的批处理操作。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
接着,在进入步骤S102,对图片资源进行预处理时,根据当前需要进行预处理操作的图片资源的格式选择对应的预处理方式进行处理即可。
关于对不同格式的图片资源进行预处理,可以参见图1,以及针对图1的文字描述部分,此处不再赘述。
接着,在执行完步骤S102的操作后,本申请中需要数据层执行的操作就执行完毕,此时可以将预处理后的图片资源直接输入模型层中选择的识别模型,也可以先输入强化学习层,本申请以先输入强化学习层为例进行说明。
继续参见图6,示例性的,经步骤S102对图片资源进行预处理后,会将预处理后的图片资源输入到强化学习层中经过自学习训练的ResNet50卷积神经网络模型(后续简称:ResNet50)进行特征提取,然后由强化学习层中经过自学习训练的OneClassSVM分类模型(后续简称:OneClassSVM)对提取的特征信息进行处理,进而确定当前输入的图片资源是否为误报图片资源,即执行步骤S203,经ResNet50和OneClassSVM确定是否为误报图片资源。
相应地,如果经ResNet50和OneClassSVM的处理后,确定当前的图片资源为误报图片资源,即往期被误认为是禁忌图片的图片资源,则执行步骤S204,过滤掉误报图片资源;否则,即确定当前的图片资源不是往期被误认为是禁忌图片的图片资源,则将处理后的图片资源输入到模型层中选择的识别模型中。
可理解的,步骤S204中所说的过滤掉误报图片资源,例如可以是将图片资源扫描器扫描到的图片资源集合中去掉,这样后续处理就不会再对过滤掉的误报图片资源进行识别,误报图片资源也不会再次出现在可视化warning报告中,这样就从源头上减少了误报的情况,从而降低了人力投入成本。
继续参见图6,示例性的,在强化学习层中,还需要定期对ResNet50和OneClassSVM进行自学习训练,即执行步骤S201和步骤S202。其中,步骤S201中收集误报图片资源作为学习数据集,在一些实现方式中是从判断层中响应于复核人员提交的复核信息时记录的误报图片资源获取的。
接着,在得到学习数据集,并满足自学习训练条件,例如达到预设时间,或者学习数据集中的误报图片资源达到预设数量时,便会执行步骤S202,基于学习数据集对ResNet50进行过采样训练,对OneClassSVM进行过拟合训练。
关于基于学习数据集对ResNet50进行过采样训练,对OneClassSVM进行过拟合训练的过程,可以参见上述关于强化学习层的处理逻辑部分的描述,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品是面向严禁裸露皮肤的地区时,需要过滤的禁忌图片为裸露皮肤的人像图片资源,因此经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的裸露皮肤识别模型,即执行步骤S301,由裸露皮肤识别模型进行禁忌图片识别。
具体的,通过上述描述可知,裸露皮肤识别模型包括人像识别模型和裸露皮肤程度检测模型。故而,由裸露皮肤识别模型进行禁忌图片识别的过程,具体是由上述所说的基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得的人像识别模型进行人像的识别,进而将人像图片资源识别出来,然后将识别出的人像图片资源交由基于ResNet50的NSFW框架对Imagenet数据集中的数据训练获得的裸露皮肤程度检测模型进行处理,确定人像图片资源的裸露分数,最后根据预设的裸露阈值和裸露皮肤程度检测模型确定的裸露分数,确定人像图片资源是否为禁忌图片,即是否为裸露皮肤的禁忌图片。
继续参见图6,示例性的,模型层的裸露皮肤识别模型进行禁忌图片识别后,判断层会执行步骤401,即根据裸露皮肤识别模型的输出确定是否为禁忌图片。
相应地,如果经过裸露皮肤识别模型进行禁忌图片识别后,确定该图片资源不是禁忌图片,即该图片资源可以显示,则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括裸露皮肤的人像图片;如果经过裸露皮肤识别模型进行禁忌图片识别后,确定该图片资源是禁忌图片,即裸露皮肤的禁忌图片,则将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
可理解的,在实际应用中,每得到一张图片资源对应的识别结果,经步骤S401判断后,便会将确定为禁忌图片的图片资源的上述信息记录到可视化warning报告中,然后在所有图片资源均识别处理后,再将得到的可视化warning报告提交给复核人员进行复核。
相应地,在向复核人员提交可视化warning报告后,如果接收到复核人员提交的复核信息,则执行步骤S404,响应于复核人员提交的复核信息,将复核人员确定的禁忌图片从系统中删除,并记录误报图片资源。
关于可视化warning报告的形式,以及复核人员提交的复核信息的形式可以参见上述针对表1至表3的描述,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品是面向对手势,例如恶魔牛角手势禁忌的地区时,需要过滤的禁忌图片为魔牛角手势的图片资源,因此经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的禁忌手势识别模型,即执行步骤S302,禁忌手势识别模型进行禁忌图片识别。
具体的,通过上述描述可知,禁忌手势识别模型包括手部识别模型和手势识别模型。故而,由禁忌手势识别模型进行禁忌图片识别的过程,具体是由上述所说的基于SSD目标识别框架对势识别数据集中的手部数据训练获得手部识别模型对图片资源进行手部识别,进而将手部图片资源识别处理,并在识别出的手部图片资源中标注边界框,然后将标注了边界框的手部图片资源交由手MediaPipe框架结构的势识别模型对手部图片资源中手区域内部的21个3D手关节点进行定位,并提取这21个3D手关节点的坐标信息,最后采用SVM算法对这21个3D landmarks的坐标信息进行分析,从而预测出该手部图片资源中的手势,进而确定该手势是否为禁忌手势。
继续参见图6,示例性的,模型层的禁忌手势识别模型进行禁忌图片识别后,判断层会执行步骤401,即根据禁忌手势识别模型的输出确定是否为禁忌图片。
相应地,如果经过禁忌手势识别模型进行禁忌图片识别后,确定该图片资源不是禁忌图片,即该图片资源可以显示,则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括恶魔手势的禁忌手势图片;如果经过禁忌手势识别模型进行禁忌图片识别后,确定该图片资源是禁忌图片,即恶魔手势的禁忌图片,则将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品是面向对“猪”和“狗”忌讳的地区时,需要过滤的禁忌图片为“猪”和“狗”等禁忌动物的禁忌图片资源,因此在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的禁忌动物识别模型,即执行步骤S303,禁忌动物识别模型进行禁忌图片识别。
关于禁忌动物识别模型识别禁忌动物的实现细节,可以参见上述模型层中针对几禁忌动物识别模型的描述部分,此处不再赘述。
继续参见图6,示例性的,模型层的禁忌动物识别模型进行禁忌图片识别后,判断层会执行步骤401,即根据禁忌动物识别模型的输出确定是否为禁忌图片。
相应地,如果经过禁忌动物识别模型进行禁忌图片识别后,确定该图片资源不是禁忌图片,即该图片资源可以显示,则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括“猪”和“狗”的禁忌手势图片;如果经过禁忌动物识别模型进行禁忌图片识别后,确定该图片资源是禁忌图片,即包含“猪”和/或“狗”的禁忌图片,则将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,电子设备是面向对禁忌旗帜较为敏感的地区时,需要过滤的禁忌图片即为禁忌旗帜类型的图片资源,因此在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的禁忌旗帜识别模型,即执行步骤S304,禁忌旗帜识别模型进行禁忌图片识别。
关于禁忌旗帜识别模型识别禁忌旗帜的实现细节,可以参见上述模型层中针对禁忌旗帜识别模型的描述部分,此处不再赘述。
继续参见图6,示例性的,模型层的禁忌旗帜识别模型进行禁忌图片识别后,判断层会执行步骤401,即根据禁忌旗帜识别模型的输出确定是否为禁忌图片。
相应地,如果经过禁忌旗帜识别模型进行禁忌图片识别后,确定该图片资源不是禁忌图片,即该图片资源可以显示,则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括禁忌旗帜的图片资源;如果经过禁忌旗帜识别模型进行禁忌图片识别后,确定该图片资源是禁忌图片,则将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,电子设备是面向对地图标记(某些敏感地区)较为敏感的地区时,需要过滤的禁忌图片即当前被列为敏感地区的图片资源,因此在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的敏感地区识别模型,即执行步骤S305,敏感地区识别模型进行禁忌图片识别。
关于敏感地区识别模型识别敏感地区的实现细节,可以参见上述模型层中针对敏感地区识别模型的描述部分,此处不再赘述。
继续参见图6,示例性的,模型层的敏感地区识别模型进行禁忌图片识别后,判断层会执行步骤401,即根据敏感地区识别模型的输出确定是否为禁忌图片。
相应地,如果经过敏感地区识别模型进行禁忌图片识别后,确定该图片资源不是禁忌图片,即该图片资源可以显示,则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括当前被列为敏感地区对应的地图标记的图片资源;如果经过敏感地区识别模型进行禁忌图片识别后,确定该图片资源是禁忌图片,则将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品面向的地区既对人像的裸露皮肤有要求,又对一些手势有要求,则需要选择裸露皮肤识别模型和禁忌手势识别模型共同完成对图片资源的识别处理。即在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的裸露皮肤识别模型和禁忌手势识别模型,即执行步骤S301,裸露皮肤识别模型进行禁忌图片识别,以及执行步骤S302,禁忌手势识别模型进行禁忌图片识别。
需要说明的是,在一些实现方式中,当从模型层中选择的识别模型为2种,甚至更多种时,各个识别模型的识别处理操作可以是并行执行的,即经步骤203处理后的图片资源分别输入到选中的识别模型进行识别处理。
此外,还需要说明的是,在另一些实现方式中,当从模型层中选择的识别模型为2种,甚至更多种时,各个识别模型的识别处理操作可以是串行执行的,即经步骤203处理后的图片资源先输入到选中的一个识别模型进行识别处理,再该识别模型对图片资源识别处理后,再交由下一个本选中的识别模型进行识别处理。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。
为了便于说明,图6以并行执行的方式为例进行说明。即,经强化学习层处理后的图片资源输入模型层中的裸露皮肤识别模型和禁忌手势识别模型后,裸露皮肤识别模型中基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得的人像识别模型会进行人像的识别,进而将人像图片资源识别出来,然后将识别出的人像图片资源交由基于ResNet50的NSFW框架对Imagenet数据集中的数据训练获得的裸露皮肤程度检测模型进行处理,确定人像图片资源的裸露分数,最后根据预设的裸露阈值和裸露皮肤程度检测模型确定的裸露分数,确定人像图片资源是否为禁忌图片,即是否为裸露皮肤的禁忌图片;禁忌手势识别模型中基于SSD目标识别框架对势识别数据集中的手部数据训练获得手部识别模型会对图片资源进行手部识别,进而将手部图片资源识别处理,并在识别出的手部图片资源中标注边界框,然后将标注了边界框的手部图片资源交由手MediaPipe框架结构的势识别模型对手部图片资源中手区域内部的21个3D手关节点进行定位,并提取这21个3D手关节点的坐标信息,最后采用SVM算法对这21个3Dlandmarks的坐标信息进行分析,从而预测出该手部图片资源中的手势,进而确定该手势是否为禁忌手势。
此外,还需要说明的是,不论是裸露皮肤识别模型进行禁忌图片识别后,还是禁忌手势识别模型进行禁忌图片识别后,判断层均会执行步骤S401。
可理解的,如果是裸露皮肤识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据裸露皮肤识别模型的输出确定是否为禁忌图片;如果是禁忌手势识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据禁忌手势识别模型的输出确定是否为禁忌图片。
相应地,如果经步骤S401判断后,当前图片资源不是禁忌图片(既不是裸露皮肤类型的禁忌图片,也不是禁忌手势类型的禁忌图片),则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括裸露皮肤类型的禁忌图片和禁忌手势类型的禁忌图片;如果经步骤S401判断后,确定该图片资源是禁忌图片,不论是裸露皮肤类型的禁忌图片,还是禁忌手势类型的禁忌图片,均会将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品面向的地区既对人像的裸露皮肤有要求,又对一些动物有要求,则需要选择裸露皮肤识别模型和禁忌动物识别模型共同完成对图片资源的识别处理。即在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的裸露皮肤识别模型和禁忌动物识别模型,即执行步骤S301,裸露皮肤识别模型进行禁忌图片识别,以及执行步骤S303,禁忌动物识别模型进行禁忌图片识别。
为了便于说明,仍以并行执行的方式为例进行说明。即,经强化学习层处理后的图片资源输入模型层中的裸露皮肤识别模型和禁忌动物识别模型后,裸露皮肤识别模型中基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得的人像识别模型会进行人像的识别,进而将人像图片资源识别出来,然后将识别出的人像图片资源交由基于ResNet50的NSFW框架对Imagenet数据集中的数据训练获得的裸露皮肤程度检测模型进行处理,确定人像图片资源的裸露分数,最后根据预设的裸露阈值和裸露皮肤程度检测模型确定的裸露分数,确定人像图片资源是否为禁忌图片,即是否为裸露皮肤的禁忌图片;禁忌动物识别模型会按照上述实现方式中描述的方式识别图片资源是否包含禁忌动物。
此外,还需要说明的是,不论是裸露皮肤识别模型进行禁忌图片识别后,还是禁忌动物识别模型进行禁忌图片识别后,判断层均会执行步骤S401。
可理解的,如果是裸露皮肤识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据裸露皮肤识别模型的输出确定是否为禁忌图片;如果是禁忌动物识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据禁忌动物识别模型的输出确定是否为禁忌图片。
相应地,如果经步骤S401判断后,当前图片资源不是禁忌图片(既不是裸露皮肤类型的禁忌图片,也不是禁忌动物类型的禁忌图片),则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括裸露皮肤类型的禁忌图片和禁忌动物类型的禁忌图片;如果经步骤S401判断后,确定该图片资源是禁忌图片,不论是裸露皮肤类型的禁忌图片,还是禁忌动物类型的禁忌图片,均会将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
继续参见图6,示例性的,在一种可行的实现方式中,例如电子产品面向的地区既对人像的裸露皮肤有要求,又对一些动物有要求,还对一些旗帜、地图标识有要求,则需要选择裸露皮肤识别模型、禁忌动物识别模型、禁忌旗帜识别模型和敏感地区识别模型共同完成对图片资源的识别处理。即在经步骤S203处理后,被确定为不是误报图片资源的图片资源需要输入到模型层的裸露皮肤识别模型、禁忌动物识别模型、禁忌旗帜识别模型和敏感地区识别模型,即执行步骤S301,裸露皮肤识别模型进行禁忌图片识别;执行步骤S303,禁忌动物识别模型进行禁忌图片识别;执行步骤S304,禁忌旗帜识别模型进行禁忌图片识别;执行步骤S305,敏感地区识别模型进行禁忌图片识别。
为了便于说明,仍以并行执行的方式为例进行说明。即,经强化学习层处理后的图片资源输入模型层中的裸露皮肤识别模型和禁忌动物识别模型后,裸露皮肤识别模型中基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得的人像识别模型会进行人像的识别,进而将人像图片资源识别出来,然后将识别出的人像图片资源交由基于ResNet50的NSFW框架对Imagenet数据集中的数据训练获得的裸露皮肤程度检测模型进行处理,确定人像图片资源的裸露分数,最后根据预设的裸露阈值和裸露皮肤程度检测模型确定的裸露分数,确定人像图片资源是否为禁忌图片,即是否为裸露皮肤的禁忌图片;禁忌动物识别模型会按照上述实现方式中描述的方式识别图片资源是否包含禁忌动物;禁忌旗帜识别模型会按照上述实现方式中描述的方式识别图片资源是否包含禁忌旗帜;敏感地区识别模型会按照上述实现方式中描述的方式识别图片资源是否包含敏感地区。
此外,还需要说明的是,不论是裸露皮肤识别模型进行禁忌图片识别后,还是禁忌动物识别模型进行禁忌图片识别后,还是禁忌旗帜识别模型进行禁忌图片识别后,还是敏感地区识别模型进行禁忌图片识别后,判断层均会执行步骤S401。
可理解的,如果是裸露皮肤识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据裸露皮肤识别模型的输出确定是否为禁忌图片;如果是禁忌动物识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据禁忌动物识别模型的输出确定是否为禁忌图片;如果是禁忌旗帜识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据禁忌旗帜识别模型的输出确定是否为禁忌图片;如果是敏感地区识别模型进行禁忌图片识别后,判断层中执行的步骤S401具体是根据敏感地区识别模型的输出确定是否为禁忌图片。
相应地,如果经步骤S401判断后,当前图片资源不是禁忌图片(既不是裸露皮肤类型的禁忌图片,也不是禁忌动物类型的禁忌图片,也不是禁忌旗帜类型的禁忌图片,也不是敏感地区类型的禁忌图片),则执行步骤S402,过滤掉非禁忌图片,从而确保最后发布的操作系统版本不包括裸露皮肤类型的禁忌图片、禁忌动物类型的禁忌图片、禁忌旗帜类型的禁忌图片和敏感地区类型的禁忌图片;如果经步骤S401判断后,确定该图片资源是禁忌图片,不论是裸露皮肤类型的禁忌图片,还是禁忌动物类型的禁忌图片,还是禁忌旗帜类型的禁忌图片,还是敏感地区类型的禁忌图片,均会将该图片资源的名称、路径地址和可视化的图片资源等信息记录到可视化warning报告中,即执行步骤403。
关于步骤403和步骤404的的执行逻辑,与上述实现方式大致相同,此处不再赘述。
应当理解的是,上述说明仅是为了更好的理解本实施例的技术方案而列举的示例,不作为对本实施例的唯一限制。在实际应用中,可以根据业务需求,从模型层给出的5种识别模型中选择任意一种进行禁忌图片识别操作,也可以从模型层给出的5种识别模型中选择任意两种进行禁忌图片识别操作,还可以从模型层给出的5种识别模型中选择任意三种进行禁忌图片识别操作,还可以从模型层给出的5种识别模型中选择任意四种进行禁忌图片识别操作,还可以选择模型层给出的5种识别模型共同进行禁忌图片识别操作。
此外,还需要说明的是,在实际的应用场景中由电子设备实现的上述各实施例提供的禁忌图片识别方法,也可以由电子设备中包括的一种芯片系统来执行,其中,该芯片系统可以包括处理器。该芯片系统可以与存储器耦合,使得该芯片系统运行时调用该存储器中存储的计算机程序,实现上述电子设备执行的步骤。其中,该芯片系统中的处理器可以是应用处理器也可以是非应用处理器的处理器。
另外,本申请实施例还提供一种计算机可读存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在电子设备上运行时,使得电子设备执行上述相关方法步骤实现上述实施例中的禁忌图片识别方法。
另外,本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在电子设备上运行时,使得电子设备执行上述相关步骤,以实现上述实施例中的禁忌图片识别方法。
另外,本申请的实施例还提供一种芯片(也可以是组件或模块),该芯片可包括一个或多个处理电路和一个或多个收发管脚;其中,所述收发管脚和所述处理电路通过内部连接通路互相通信,所述处理电路执行上述相关方法步骤实现上述实施例中的禁忌图片识别方法,以控制接收管脚接收信号,以控制发送管脚发送信号。
此外,通过上述描述可知,本申请实施例提供的电子设备、计算机可读存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (9)

1.一种禁忌图片识别方法,其特征在于,所述方法包括:
获取操作系统中涉及的图片资源,所述图片资源用户无法肉眼看到,且不包括色情图片;
对于每一张所述图片资源,进行图片资源预处理操作,将用户无法肉眼看到的所述图片资源处理为用户肉眼可见的图片资源;
对于每一张用户肉眼可见的所述图片资源,根据ResNet50卷积神经网络模型从所述图片资源中提取特征信息,并根据一分类模型对所述特征信息进行分类处理,识别出往期被误认为是禁忌图片的图片资源;
从所述图片资源中过滤掉往期被误认为是禁忌图片的图片资源;
对于每一张用户肉眼可见的所述图片资源,基于禁忌图片识别模型,进行禁忌图片识别,所述禁忌图片识别模块包括用于进行裸露皮肤识别、禁忌手势识别、禁忌动物识别、禁忌旗帜识别和敏感地区识别的模型;
对于每一张用户肉眼可见的所述图片资源,在满足所述裸露皮肤识别、所述禁忌手势识别、所述禁忌动物识别、所述禁忌旗帜识别和所述敏感地区识别中任一项对应的禁忌图片条件时,确定用户肉眼可见的所述图片资源为禁忌图片;
根据识别出的禁忌图片的名称、路径地址和用户肉眼可见的所述禁忌图片,生成可视化警告报告;
接收复核人员在所述可视化警告报告中针对每一张被识别为禁忌图片的图片资源作出的复核信息,每一张禁忌图片对应的所述复核信息用于描述所述禁忌图片是否为误报图片资源,所述误报图片资源为经所述复核人复核后确定的不是禁忌图片的图片资源;
根据所述可视化警告报告中记录的每一张禁忌图片对应的所述复核信息,将所述误报图片资源、所述误报图片资源的名称和路径地址,从所述可视化警告报告中删除;
根据删除所述误报图片资源的相关信息的所述可视化警告报告,从所述操作系统中删除所述可视化警告报告中标识为禁忌图片的图片资源;
根据所述误报图片资源构建学习数据集;
基于所述学习数据集中的数据重新对所述ResNet50卷积神经网络模型进行过采样训练,得到自学习后的所述ResNet50卷积神经网络模型,基于所述学习数据集中的数据重新对所述一分类模型进行过拟合训练,得到自学习后的一分类模型;其中,当所述操作系统中涉及的图片资源包括所述误报图片资源时,基于重新训练的所述ResNet50卷积神经网络模型和所述一分类模型进行禁忌图片识别时,会自动过滤掉所述误报图片资源,所述禁忌图片识别模型不会再对所述误报图片资源进行禁忌图片识别;
其中,在基于所述禁忌图片识别模块,对每一张用户肉眼可见的所述图片资源进行裸露皮肤识别时,包括:
根据人像识别模型识别出所述图片资源中的人像图片资源,所述人像图片资源为所述图片资源中包括人像的图片资源;
根据裸露皮肤程度检测模型确定所述人像图片资源的裸露分数;
根据裸露阈值和所述裸露分数,确定所述人像图片资源是否为禁忌图片,所述裸露阈值为0.01,被确定为禁忌图片的所述人像图片资源并非色情图片资源;
在所述裸露分数不小于所述裸露阈值时,确定所述人像图片资源为禁忌图片。
2.根据权利要求1所述的方法,其特征在于,所述人像识别模型基于YoloV5网络对COCO数据集中人像类别的图片资源训练获得。
3.根据权利要求1所述的方法,其特征在于,所述裸露皮肤程度检测模型基于残差网络ResNet50的NSFW框架对Imagenet数据集中的数据训练获得。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据禁忌动物识别模型识别出所述图片资源中的禁忌动物图片资源,所述禁忌动物图片资源为所述图片资源中包括禁忌动物的图片资源;
其中,所述禁忌动物识别模型基于ResNext卷积神经网络对Imagenet数据集中的数据和网络爬取的禁忌动物的图片数据训练获得。
5.根据权利要求1或4所述的方法,其特征在于,所述方法还包括:
根据禁忌旗帜识别模型识别出所述图片资源中的禁忌旗帜图片资源,所述禁忌旗帜图片资源为所述图片资源中包括禁忌旗帜的图片资源,所述禁忌旗帜识别模型为YoloV3框架结构;
和/或,
根据敏感地区识别模型识别出所述图片资源中的敏感地区图片资源,所述敏感地区图片资源为所述图片资源中包括敏感地区的图片资源,所述敏感地区识别模型为YoloV3框架结构。
6.根据权利要求1至4任一项所述的方法,其特征在于,所述对于每一张所述图片资源,进行图片资源预处理操作,将用户无法肉眼看到的所述图片资源处理为用户肉眼可见的图片资源,包括:
对于每一张所述图片资源,进行图片资源预处理操作,统一所述图片资源的尺寸、通道数,并对所述图片资源进行可视化处理,得到用户肉眼可见的图片资源。
7.根据权利要求6所述的方法,其特征在于,在所述对于每一张所述图片资源,进行图片资源预处理操作,统一所述图片资源的尺寸、通道数之前,所述方法还包括:
确定所述图片资源的格式;
在所述图片资源的格式为矢量可绘制对象DVG格式时,改编所述图片资源的属性和值,将所述图片资源从所述DVG格式转换为可缩放的矢量图像格式SVG;
将所述SVG格式的所述图片资源转换为便携式网络图形PNG格式。
8.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器和所述处理器耦合;所述存储器存储有程序指令,所述程序指令由所述处理器执行时,使得所述电子设备执行如权利要求1至7任意一项所述的禁忌图片识别方法。
9.一种计算机可读存储介质,其特征在于,包括计算机程序,当所述计算机程序在电子设备上运行时,使得所述电子设备执行如权利要求1至7任意一项所述的禁忌图片识别方法。
CN202210405635.4A 2022-04-18 2022-04-18 禁忌图片识别方法、设备及存储介质 Active CN115546824B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210405635.4A CN115546824B (zh) 2022-04-18 2022-04-18 禁忌图片识别方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210405635.4A CN115546824B (zh) 2022-04-18 2022-04-18 禁忌图片识别方法、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115546824A CN115546824A (zh) 2022-12-30
CN115546824B true CN115546824B (zh) 2023-11-28

Family

ID=84723801

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210405635.4A Active CN115546824B (zh) 2022-04-18 2022-04-18 禁忌图片识别方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115546824B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117593596B (zh) * 2024-01-19 2024-04-16 四川封面传媒科技有限责任公司 一种敏感信息检测方法、系统、电子设备及介质

Citations (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201329874A (zh) * 2012-01-06 2013-07-16 Shi yi min 影像辨識系統及其操作方法
US8954884B1 (en) * 2013-11-18 2015-02-10 Maestro Devices, LLC Navigation system for viewing an image data-stack in less time with less effort and less repetitive motions
CN106446932A (zh) * 2016-08-30 2017-02-22 上海交通大学 基于机器学习与图片识别的可进化违禁图片批量处理方法
CN107330453A (zh) * 2017-06-19 2017-11-07 中国传媒大学 基于分步识别和融合关键部位检测的色情图像识别方法
CN107895140A (zh) * 2017-10-20 2018-04-10 九次方大数据信息集团有限公司 基于人脸肤色的色情图片识别办法
CN108171274A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于识别动物的方法和装置
CN108172271A (zh) * 2017-12-27 2018-06-15 沈阳东软医疗系统有限公司 一种图文报告处理方法及装置
CN108229318A (zh) * 2017-11-28 2018-06-29 北京市商汤科技开发有限公司 手势识别和手势识别网络的训练方法及装置、设备、介质
CN108229324A (zh) * 2017-11-30 2018-06-29 北京市商汤科技开发有限公司 手势追踪方法和装置、电子设备、计算机存储介质
CN108491866A (zh) * 2018-03-06 2018-09-04 平安科技(深圳)有限公司 色情图片鉴定方法、电子装置及可读存储介质
CN109063054A (zh) * 2018-07-19 2018-12-21 天津迈基生物科技有限公司 一种机器学习和大数据处理系统
CN109241951A (zh) * 2018-10-26 2019-01-18 北京陌上花科技有限公司 色情图片识别方法、识别模型构建方法及识别模型和计算机可读存储介质
CN109359551A (zh) * 2018-09-21 2019-02-19 深圳市璇玑实验室有限公司 一种基于机器学习的敏感图像识别方法与系统
CN110084987A (zh) * 2019-04-29 2019-08-02 复钧智能科技(苏州)有限公司 一种面向轨道交通的异物检查系统及方法
CN110390305A (zh) * 2019-07-25 2019-10-29 广东工业大学 基于图卷积神经网络的手势识别的方法及装置
CN110390281A (zh) * 2019-07-11 2019-10-29 南京大学 一种基于感知设备的手语识别系统及其工作方法
CN111062311A (zh) * 2019-12-13 2020-04-24 东南大学 一种基于深度级可分离卷积网络的行人手势识别与交互方法
CN111104820A (zh) * 2018-10-25 2020-05-05 中车株洲电力机车研究所有限公司 一种基于深度学习的手势识别方法
CN111191632A (zh) * 2020-01-08 2020-05-22 梁正 一种基于红外反射手套的手势识别方法及系统
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111444764A (zh) * 2020-02-21 2020-07-24 广东工业大学 一种基于深度残差网络的手势识别方法
CN111476309A (zh) * 2020-04-13 2020-07-31 北京字节跳动网络技术有限公司 图像处理方法、模型训练方法、装置、设备及可读介质
CN111783812A (zh) * 2019-11-18 2020-10-16 北京沃东天骏信息技术有限公司 违禁图像识别方法、装置和计算机可读存储介质
CN112001282A (zh) * 2020-08-12 2020-11-27 腾讯音乐娱乐科技(深圳)有限公司 一种图像识别方法
CN112153378A (zh) * 2020-09-27 2020-12-29 福建天晴数码有限公司 一种视频审核能力的测试方法及其系统
US10893329B1 (en) * 2019-09-03 2021-01-12 International Business Machines Corporation Dynamic occlusion of livestreaming
CN112597770A (zh) * 2020-12-16 2021-04-02 盐城数智科技有限公司 基于深度学习的敏感信息查询方法
CN112906588A (zh) * 2021-03-01 2021-06-04 上海交通大学 基于深度学习的暴恐图片安全检测系统
CN113011403A (zh) * 2021-04-30 2021-06-22 恒睿(重庆)人工智能技术研究院有限公司 手势识别方法、系统、介质及设备
CN113329260A (zh) * 2021-06-15 2021-08-31 北京沃东天骏信息技术有限公司 一种直播处理方法、装置、存储介质及电子设备
CN114329022A (zh) * 2021-12-28 2022-04-12 百果园技术(新加坡)有限公司 一种色情分类模型的训练、图像检测方法及相关装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2431667T3 (es) * 2006-05-31 2013-11-27 Nec Corporation Dispositivo y método para detectar una actividad sospechosa, programa y medio de grabación

Patent Citations (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201329874A (zh) * 2012-01-06 2013-07-16 Shi yi min 影像辨識系統及其操作方法
US8954884B1 (en) * 2013-11-18 2015-02-10 Maestro Devices, LLC Navigation system for viewing an image data-stack in less time with less effort and less repetitive motions
CN106446932A (zh) * 2016-08-30 2017-02-22 上海交通大学 基于机器学习与图片识别的可进化违禁图片批量处理方法
CN107330453A (zh) * 2017-06-19 2017-11-07 中国传媒大学 基于分步识别和融合关键部位检测的色情图像识别方法
CN107895140A (zh) * 2017-10-20 2018-04-10 九次方大数据信息集团有限公司 基于人脸肤色的色情图片识别办法
CN108229318A (zh) * 2017-11-28 2018-06-29 北京市商汤科技开发有限公司 手势识别和手势识别网络的训练方法及装置、设备、介质
CN108229324A (zh) * 2017-11-30 2018-06-29 北京市商汤科技开发有限公司 手势追踪方法和装置、电子设备、计算机存储介质
CN108172271A (zh) * 2017-12-27 2018-06-15 沈阳东软医疗系统有限公司 一种图文报告处理方法及装置
CN108171274A (zh) * 2018-01-17 2018-06-15 百度在线网络技术(北京)有限公司 用于识别动物的方法和装置
CN108491866A (zh) * 2018-03-06 2018-09-04 平安科技(深圳)有限公司 色情图片鉴定方法、电子装置及可读存储介质
CN109063054A (zh) * 2018-07-19 2018-12-21 天津迈基生物科技有限公司 一种机器学习和大数据处理系统
CN109359551A (zh) * 2018-09-21 2019-02-19 深圳市璇玑实验室有限公司 一种基于机器学习的敏感图像识别方法与系统
CN111104820A (zh) * 2018-10-25 2020-05-05 中车株洲电力机车研究所有限公司 一种基于深度学习的手势识别方法
CN109241951A (zh) * 2018-10-26 2019-01-18 北京陌上花科技有限公司 色情图片识别方法、识别模型构建方法及识别模型和计算机可读存储介质
CN110084987A (zh) * 2019-04-29 2019-08-02 复钧智能科技(苏州)有限公司 一种面向轨道交通的异物检查系统及方法
CN110390281A (zh) * 2019-07-11 2019-10-29 南京大学 一种基于感知设备的手语识别系统及其工作方法
CN110390305A (zh) * 2019-07-25 2019-10-29 广东工业大学 基于图卷积神经网络的手势识别的方法及装置
US10893329B1 (en) * 2019-09-03 2021-01-12 International Business Machines Corporation Dynamic occlusion of livestreaming
CN111783812A (zh) * 2019-11-18 2020-10-16 北京沃东天骏信息技术有限公司 违禁图像识别方法、装置和计算机可读存储介质
CN111062311A (zh) * 2019-12-13 2020-04-24 东南大学 一种基于深度级可分离卷积网络的行人手势识别与交互方法
CN111199233A (zh) * 2019-12-30 2020-05-26 四川大学 一种改进的深度学习色情图像识别方法
CN111191632A (zh) * 2020-01-08 2020-05-22 梁正 一种基于红外反射手套的手势识别方法及系统
CN111444764A (zh) * 2020-02-21 2020-07-24 广东工业大学 一种基于深度残差网络的手势识别方法
CN111476309A (zh) * 2020-04-13 2020-07-31 北京字节跳动网络技术有限公司 图像处理方法、模型训练方法、装置、设备及可读介质
CN112001282A (zh) * 2020-08-12 2020-11-27 腾讯音乐娱乐科技(深圳)有限公司 一种图像识别方法
CN112153378A (zh) * 2020-09-27 2020-12-29 福建天晴数码有限公司 一种视频审核能力的测试方法及其系统
CN112597770A (zh) * 2020-12-16 2021-04-02 盐城数智科技有限公司 基于深度学习的敏感信息查询方法
CN112906588A (zh) * 2021-03-01 2021-06-04 上海交通大学 基于深度学习的暴恐图片安全检测系统
CN113011403A (zh) * 2021-04-30 2021-06-22 恒睿(重庆)人工智能技术研究院有限公司 手势识别方法、系统、介质及设备
CN113329260A (zh) * 2021-06-15 2021-08-31 北京沃东天骏信息技术有限公司 一种直播处理方法、装置、存储介质及电子设备
CN114329022A (zh) * 2021-12-28 2022-04-12 百果园技术(新加坡)有限公司 一种色情分类模型的训练、图像检测方法及相关装置

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
FILTERING ADULT IMAGE CONTENT WITH TOPIC MODELS;Rainer Lienhart等;《ICME 2009》;第1472-1475页 *
Nouar AlDahoul等.Transfer Detection of YOLO to Focus CNN’s Attention on Nude Regions for Adult Content Detection.《symmetry》.2020,第13卷(第1期),第1-26页. *
Zhicheng Zhao等.COMBINING MULTIPLE SVM CLASSIFIERS FOR ADULT IMAGE RECOGNITION.《2010 2nd IEEE International Conference on Network Infrastructure and Digital Content》.2010,第149-153页. *
基于违禁图库中的敏感图片识别系统的设计与实现;韩中海;《中国优秀硕士学位论文全文数据库 信息科技辑》(第(2012)05期);I138-1262 *
平台型移动媒体新闻直播把关流程再造研究;史晓云;《万方数据》;第1-95页 *
杨雄.深度学习在网络色情图像检测中的应用.《安阳工学院学报》.2018,第17卷(第17期),第39-42页引言最后一段、第1节、图4、7. *
浅谈计算机视觉技术进展及其新兴应用;余京蕾;《北京联合大学学报》;第34卷(第1期);第63-69页 *
陈俊任等.基于预过滤与数据增强的色情图像识别模型.《图形图像》.2020,第69-75页第2节. *

Also Published As

Publication number Publication date
CN115546824A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN112560999B (zh) 一种目标检测模型训练方法、装置、电子设备及存储介质
KR102220174B1 (ko) 머신러닝 학습 데이터 증강장치 및 증강방법
CN112101357A (zh) 一种rpa机器人智能元素定位拾取方法及系统
CN110033018B (zh) 图形相似度判断方法、装置及计算机可读存储介质
CN108416003A (zh) 一种图片分类方法和装置、终端、存储介质
CN112927776A (zh) 一种面向医学检验报告的人工智能自动解读系统
CN116049397B (zh) 基于多模态融合的敏感信息发现并自动分类分级方法
CN108960412B (zh) 图像识别方法、装置及计算机可读存储介质
CN110780965A (zh) 基于视觉的流程自动化方法、设备及可读存储介质
CN109857878B (zh) 物品标注方法及装置、电子设备及存储介质
CN113282215A (zh) 一种rpa系统中基于目标检测技术的ui元素拾取方法和系统
CN110363190A (zh) 一种文字识别方法、装置及设备
CN115546824B (zh) 禁忌图片识别方法、设备及存储介质
CN112070093A (zh) 生成图像分类模型的方法、图像分类方法、装置和设备
CN109598712A (zh) 塑料泡沫餐盒的质量检测方法、装置、服务器及存储介质
CN115565201B (zh) 禁忌图片识别方法、设备及存储介质
CN113139452A (zh) 基于目标检测的使用手机行为的检测方法
CN110580299B (zh) 生成对象的推荐语的配图的方法、系统、设备及存储介质
CN117437647A (zh) 基于深度学习和计算机视觉的甲骨文字检测方法
CN111753618A (zh) 图像识别方法、装置、计算机设备及计算机可读存储介质
CN113705559B (zh) 基于人工智能的文字识别方法及装置、电子设备
CN115631374A (zh) 控件操作方法、控件检测模型的训练方法、装置和设备
CN117253099A (zh) 影像数据扩增装置以及方法
CN113903025A (zh) 场景文本检测方法、装置和模型及其训练方法和训练装置
CN114387600A (zh) 文本特征识别方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant