CN112487853A - 一种字迹比对方法、系统、电子设备及存储介质 - Google Patents
一种字迹比对方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112487853A CN112487853A CN201910866358.5A CN201910866358A CN112487853A CN 112487853 A CN112487853 A CN 112487853A CN 201910866358 A CN201910866358 A CN 201910866358A CN 112487853 A CN112487853 A CN 112487853A
- Authority
- CN
- China
- Prior art keywords
- handwriting
- image
- images
- extraction model
- comparison
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 81
- 238000000605 extraction Methods 0.000 claims abstract description 70
- 238000012549 training Methods 0.000 claims abstract description 27
- 238000012545 processing Methods 0.000 claims description 26
- 238000004891 communication Methods 0.000 claims description 19
- 238000005259 measurement Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 6
- 238000005260 corrosion Methods 0.000 claims description 6
- 230000007797 corrosion Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000003086 colorant Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000011800 void material Substances 0.000 description 2
- QZXATCCPQKOEIH-UHFFFAOYSA-N Florasulam Chemical compound N=1N2C(OC)=NC=C(F)C2=NC=1S(=O)(=O)NC1=C(F)C=CC=C1F QZXATCCPQKOEIH-UHFFFAOYSA-N 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明涉及一种字迹比对方法、系统、电子设备及存储介质。方法包括:获取需要进行字迹比对的至少两张字迹图像;通过预先训练得到的特征提取模型,提取字迹图像中的字迹特征向量;根据字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;若相似度值大于预设阈值,则相似度值对应的两组字迹图像为同一人的字迹图像。本发明实施例通过预先训练的特征提取模型,提取字迹图像中的字迹特征向量,基于字迹特征向量,得到不同字迹图像的相似度值,根据字迹图像之间的相似度值判断字迹图像是否为同一人的字迹图像,实现对不同字迹图像的识别,针对字迹图像从训练数据中学习到如何进行特征表达,进而提升字迹比对的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种字迹比对方法、系统、电子设备及存储介质。
背景技术
随着信息技术的不断发展,手写字迹相关的生物特征识别由于其高度的唯一性与安全可靠性成为了金融、电子商务与企业资源管理系统等领域研究的热点。主要是通过计算机技术将手写字迹的特征信息与真实的字迹进行比对,以此判断字迹的真伪与否,技术原理是每个人的字迹都是独特的,但是同时也有着一定的相对不稳定性,对比对算法提出了很高的要求。
发明内容
为了解决现有技术存在的问题,本发明的至少一个实施例提供了一种字迹比对方法、系统、电子设备及存储介质。
第一方面,本发明实施例提供了一种字迹比对方法,所述方法包括:
获取需要进行字迹比对的至少两张字迹图像;
通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量;
根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;
若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
基于上述技术方案,本发明实施例还可以做出如下改进。
结合第一方面,在第一方面的第一种实施例中,所述获取需要进行字迹比对的至少两张字迹图像包括:
采集需要进行字迹比对的至少两张书写图像;
对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像;
提取所述字迹轮廓,得到所述字迹图像。
结合第一方面的第一种实施例,在第一方面的第二种实施例中,所述对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像,包括:
将所述书写图像从RGB空间变换至HSV空间;
根据所述书写图像中像素点的HSV分量剔除干扰像素点;
将剔除干扰像素点的书写图像从HSV空间变换至RGB空间;
对所述书写图像进行灰度化处理和膨胀腐蚀处理,得到包括字迹轮廓的书写图像。
结合第一方面,在第一方面的第三种实施例中,所述特征提取模型的训练方法包括:
建立孪生网络作为所述特征提取模型;
获取多组字迹样本对;每组所述字迹样本对包括:两张字迹样本和两张字迹样本是否匹配的标注;
针对每组所述字迹样本对,通过所述特征提取模型对所述字迹样本对中的字迹样本进行处理得到相应的第一字迹特征向量和第二字迹特征向量;
基于所述第一字迹特征向量和所述第二字迹特征向量,得到相应字迹样本的相似度值;
根据所述相似度值判断所述字迹样本对中的两张所述字迹样本是否匹配;
针对每组所述字迹样本对,判断所述字迹样本对中两张所述字迹样本的匹配结果和相应的标注是否一致;
若所有所述匹配结果与相对应的标注均一致;则所述特征提取模型收敛,得到训练完成的所述特征提取模型;
若任一所述匹配结果与相对应的标注不一致,则调整所述特征提取模型中的参数,根据调整后的特征提取模型重新对所述字迹样本对中的字迹样本进行处理,直至所有匹配结果与相对应的标注均一致。
结合第一方面的第三种实施例,在第一方面的第四种实施例中,所述方法还包括:
获取所述特征提取模型的调整次数;
判断所述调整次数是否大于预设阈值;
若所述调整次数大于预设阈值,则不再调整所述特征提取模型。
结合第一方面,在第一方面的第五种实施例中,所述提取所述字迹图像中的字迹特征向量,包括:
提取所述字迹图像中的字迹特征;
将所述字迹特征进行组合,得到所述字迹特征向量。
结合第一方面或第一方面的第一、第二、第三、第四或第五种实施例,在第一方面的第六种实施例中,所述根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值,包括:
计算每个字迹特征向量与其他所述字迹特征向量的距离度量;
根据每个所述字迹特征向量与其他所述字迹特征向量的距离度量,得到对应的每个所述字迹图像与其他所述字迹图像的相似度值。
第二方面,本发明实施例提供了一种字迹比对系统,所述系统包括:
获取单元,用于获取需要进行字迹比对的至少两张字迹图像;
提取单元,用于通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量;
计算单元,用于根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;
处理单元,用于若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面中任一实施例所述的字迹比对方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一实施例所述的字迹比对方法。
本发明的上述技术方案与现有技术相比具有如下优点:本发明实施例通过预先训练的特征提取模型,提取字迹图像中的字迹特征向量,基于字迹特征向量,得到不同字迹图像的相似度值,根据字迹图像之间的相似度值判断字迹图像是否为同一人的字迹图像,实现对不同字迹图像的识别,针对字迹图像从训练数据中学习到如何进行特征表达,进而提升字迹比对的准确性。
附图说明
图1是本发明实施例提供的一种字迹比对方法流程示意图;
图2是本发明另一实施例提供的一种字迹比对方法流程示意图;
图3是本发明又一实施例提供的一种字迹比对方法流程示意图;
图4是本发明又一实施例提供的一种字迹比对方法流程示意图其一;
图5是本发明又一实施例提供的一种特征提取模型训练方法流程示意图;
图6是本发明又一实施例提供的一种特征提取模型训练方法流程示意图;
图7是本发明又一实施例提供的一种字迹比对系统结构示意图;
图8是本发明又一实施例提供的一种电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供的一种字迹比对方法。参照图1,所述方法包括如下步骤:
S11、获取需要进行字迹比对的至少两张字迹图像。
在本实施例中,字迹图像可以通过图像获取装置获取得到,传输至处理器进行处理,也可以是存储在存储器中,被处理器获取得到,比如,可以通过终端实时监控预设区域,通过控制器控制终端拍摄预设区域的图像作为字迹图像,其中控制器可以是与终端连接的硬件按钮,或者是终端上设置的虚拟按钮,该终端可以是图像获取装置;还可以建立一存储有字迹图像的数据库,从数据库中获取字迹图像与其他方式获取得到的字迹图像进行比对,根据字迹图像的比对结果确认字迹图像对应的人是否一致。
S12、通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量。
在本实施例中,特征提取模型可以是通过深度学习方法构建相应的网络,通过将字迹图像样本作为输入,字迹图像样本与其他字迹图像样本对应的比对结果作为输出,对特征提取模型进行训练,使得特征提取模型收敛,根据所述特征提取训练提取字迹图像中的字迹特征向量,比如,提取所述字迹图像中的字迹特征;将所述字迹特征进行组合,得到所述字迹特征向量,具体的,可以将字迹图像中各像素点相对位置坐标组合,得到字迹特征向量;还可以通过将字迹图像中的字迹分段,获取每段字迹的字迹轮廓的相对位置、宽度和长度,将这些字迹轮廓的相对位置、宽度和长度进行组合,得到字迹特征向量。
S13、根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值。
在本实施例中,不同字迹图像的相似度值可以通过相应字迹特征向量的余弦值计算得到,其中,向量的余弦值的绝对值越大,说明两个向量越相似,则向量对应的字迹图像越相似,也可以通过比对字迹图像中的每个特征点来确认字迹图像之间的相似度,比如,提取两个字迹图像中字迹的外接轮廓矩形,以该矩形任意一点作为原点,生成字迹中各个像素点的坐标值,将字迹中的线条转折作为特征区域,得到特征区域的宽度和特征区域中的像素点的平均坐标,比对不同字迹各个相应特征区域的宽度和各个特征区域的平均坐标,生成每个特征区域的差异值,将所有差异值累加得到累计差异值,该累计差异值可作为所述相似度值,或者根据该累计差异值计算得到一相似度值。
S14、若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
在本实施例中,判断相似度值是否大于预设阈值,当相似度值大于预设阈值时,则认为两组字迹图像相似,说明两组字迹图像是同一用户书写,若相似度值小于或等于预设阈值,则认为两组字迹图像不相似,两组字迹图像并非同一用户书写。
如图2所示,在本实施例中,根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值,包括如下步骤:
S21、计算每个字迹特征向量与其他所述字迹特征向量的距离度量。
在本实施例中,距离度量,亦称距离函数,是度量空间中满足特定条件的特殊函数,一般用d表示。度量空间也叫做距离空间,是一类特殊的拓扑空间。度量空间是现代数学中一种基本的、重要的、最接近于欧几里得空间的抽象空间。19世纪末叶,德国数学家G.康托尔创立了集合论,为各种抽象空间的建立奠定了基础。20世纪初期,法国数学家M.R.弗雷歇发现许多分析学的成果从更抽象的观点看来,都涉及函数间的距离关系,从而抽象出度量空间的概念。度量空间中最符合我们对于现实直观理解的是三维欧氏空间。这个空间中的欧几里德度量定义两点之间距离为连接这两点的线段的长度。距离度量包括但不限于:欧氏距离、可夫斯基距离、马氏距离、互信息、余弦相似度、皮尔逊相关系数、Jaccard相关系数等。
S22、根据每个所述字迹特征向量与其他所述字迹特征向量的距离度量,得到对应的每个所述字迹图像与其他所述字迹图像的相似度值。
在本实施例中,根据字迹特征向量之间的距离度量,得到相应的相似度值,比如,计算字迹特征向量之间的欧式距离,而欧式距离越近,说明两个字迹特征向量越相似,相似度越高;而计算字迹特征向量之间的余弦值,余弦值越接近1或-1,说明字迹特征向量越相似,相似度越高,所以,本方案中以不同的方式计算距离度量时,会以不同映射的方式得到相似度值。
如图3所示,本发明实施例提供了一种字迹比对方法。参照图3,所述字迹比对方法包括如下步骤:
S31、采集需要进行字迹比对的至少两张书写图像。
在本实施例中,书写图像可以放置在预设区域内的图像数据,通过图像获取装置进行拍摄得到,所述图像获取装置可以是固定设置的,也可以是用户控制图像获取装置对书写图像进行拍摄得到。
S32、对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像。
在本实施例中,对获取到的书写图像进行图像处理,比如,剔除书写图像中除字迹像素点颜色之外的所有颜色的像素点,或者,根据选取的颜色,剔除所述书写图像中所有该颜色的像素点,并对剔除了像素点的图像灰度化、膨胀腐蚀后得到包括字迹轮廓的书写图像。
S33、提取所述字迹轮廓,得到所述字迹图像。
在本实施例中,生成基于所述字迹轮廓的外接矩形,提取所述矩形图像作为字迹图像,所述矩形图像中包括所有的字迹轮廓。
S34、通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量。
有关步骤S34,详细可参见步骤S12中的描述,本实施例在此不再赘述。
S35、根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值。
有关步骤S35,详细可参见步骤S13中的描述,本实施例在此不再赘述。
S36、若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
有关步骤S36,详细可参见步骤S14中的描述,本实施例在此不再赘述。
如图4所示,在本实施例中,所述对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像,包括如下步骤:
S41、将所述书写图像从RGB空间变换至HSV空间。
在本实施中,RGB是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,而HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model),这个模型中颜色的参数分别是:色调(H),饱和度(S),明度(V)。相对于RGB空间,HSV空间能够非常直观的表达色彩的明暗,色调,以及鲜艳程度,方便进行颜色之间的对比。
S42、根据所述书写图像中像素点的HSV分量剔除干扰像素点。
在本实施例中,根据书写图像中像素点的HSV的各个分量,剔除书写图像中的干扰像素点,比如,一般合同在签名后,还需在签名上按压指纹,在本方案中,可以根据指纹的颜色,设置相应的HSV分量,将书写图像中对应HSV分量的像素点全部剔除,完成对指纹像素点的删除,当然书写图像中还可能存在其他类型的干扰像素点,以相同方式剔除干扰像素点。
S43、将剔除干扰像素点的书写图像从HSV空间变换至RGB空间。
S44、对所述书写图像进行灰度化处理和膨胀腐蚀处理,得到包括字迹轮廓的书写图像。
在本实施例中,一般剔除图像中的像素点后,需要保存的像素点会有部分被作为干扰像素点被剔除,或者,删除干扰像素点时,导致字迹出现空洞,比如,签名上覆盖的指纹被删除时,比较容易出现剩余的签名图像不完整的情况,在本方案中,将书写图像进行灰度化处理,并对灰度化后的图像进行膨胀腐蚀处理,使得图像中的连贯轮廓的空洞被填充,并腐蚀掉孤立的像素点,
如图5所示,本发明实施例提供了一种特征提取模型训练方法。参照图5,所述训练方法包括如下步骤:
S51、建立孪生网络作为所述特征提取模型。
在本实施例中,可以以卷积网络为基础建立所述孪生网络,也可以通过其他深度学习方法建立孪生网络,其中孪生网络分为两个网络分支,且两个网络分支之间的权值共享。
由于字迹比对是针对两个字迹图像之间的比对,孪生网络在处理相似字迹时,因其包含两个网络分支,并且共享参数,自动学习两个字迹样本之间的内在联系,鉴别能力更强。
S52、获取多组字迹样本对;每组所述字迹样本对包括:两张字迹样本和两张字迹样本是否匹配的标注。
在本实施例中,本方案中的字迹样本对可通过上述实施例中提供的方式进行处理得到,以减少字迹图像中的干扰,其中,字迹样本对可以由若干用户书写得到,其中,同一用户书写的字迹样本对对应的标注为相匹配,不是同一用户书写的字迹样本对对应的标注为不匹配;将字迹样本对作为训练样本。
S53、针对每组所述字迹样本对,通过所述特征提取模型对所述字迹样本对中的字迹样本进行处理得到相应的第一字迹特征向量和第二字迹特征向量。
在本实施例中,结合上述描述,将字迹样本对中的字迹样本分别输入特征提取模型中的两个网络分支,两个网络分支以相同的方式对字迹样本进行处理,分别得到相应的第一字迹特征向量和第二字迹特征向量。
S54、基于所述第一字迹特征向量和所述第二字迹特征向量,得到相应字迹样本的相似度值。
在本实施例中,基于字迹特征向量计算得到每组字迹样本对中的字迹样本的相似度值,可以参考步骤S13中的描述,本步骤中不再赘述。
S55、根据所述相似度值判断所述字迹样本对中的两张所述字迹样本是否匹配。
在本实施例中,可以将相似度值与预设阈值进行比较,其中预设阈值与上述实施例中的预设阈值可以相同,判断两张字迹样本的相似度值是否达到预设阈值,若相似度值达到预设阈值,则认定两张字迹样本相匹配,为同一用户书写得到。
S56、针对每组所述字迹样本对,判断所述字迹样本对中两张所述字迹样本的匹配结果和相应的标注是否一致。
在本实施例中,根据特征提取模型提取得到的特征向量之间的相似度值判断字迹样本对中的字迹样本是否匹配,若匹配,可以将该字迹样本对记为1,若不匹配,将该字迹样本对记为0;将匹配结果与预先标记的标注进行比对,判断每组字迹样本对的匹配结果和相应的标注是否一致,其中,预设标记的标注也可以是0和1,当字迹样本对中的字迹样本为同一用户书写得到时,将标注记为1,当字迹样本对重的字迹样本为不同用户书写得到时,将标注记为0。
S57a、若所有所述匹配结果与相对应的标注均一致;则所述特征提取模型收敛,得到训练完成的所述特征提取模型。
在本实施例中,若每组字迹样本对的匹配结果与相应的标注均一致时,说明特征提取模型提取得到的特征向量之间的相似度值可以用以判断字迹样本之间是否匹配,则认为此时的特征提取模型收敛,得到训练完成的特征提取模型。
S57b、若任一所述匹配结果与相对应的标注不一致,则调整所述特征提取模型中的参数,根据调整后的特征提取模型重新对所述字迹样本对中的字迹样本进行处理,直至所有匹配结果与相对应的标注均一致。
在本实施例中,若出现任一字迹样本对的匹配结果与相应的标注不一致,说明特征提取模型提取的特征向量还是有一定的偏差,所以,此时需要调整特征提取模型中的参数,重新以该特征提取模型对字迹样本对进行处理,直到特征提取模型符合条件。
如图6所示,在本实施例中,所述方法还包括:
S61、获取所述特征提取模型的调整次数;判断所述调整次数是否大于预设阈值。
S62、若所述调整次数大于预设阈值,则不再调整所述特征提取模型。
在本实施例中,为避免特征提取模型的调整次数过多造成系统运算压力过大,在调整次数大于预设阈值时,不再调整所述特征提取模型,即停止训练所述特征提取模型,并生成提示信息发送至相关工作人员的终端,提示工作人员该训练未完成,请工作人员确认是否重新启动对特征提取模型的训练过程,还可以,在调整次数大于预设阈值时,生成特征提取模型的训练过程的训练报告发送至工作人员的终端,方便工作人员进行分析,并接受工作人员输入的操作指令对特征提取模型的参数进行定向调整,以提高对特征提取模型的优化效率。
如图7所示,本发明实施例提供了一种字迹比对系统,所述系统包括:获取单元11、提取单元12、计算单元13和处理单元14。
在本实施例中,获取单元11,用于获取需要进行字迹比对的至少两张字迹图像。
在本实施例中,提取单元12,用于通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量。
在本实施例中,计算单元13,用于根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值。
在本实施例中,处理单元14,用于判断所述相似度值是否大于预设阈值,若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
在本实施例中,获取单元11,具体用于采集需要进行字迹比对的至少两张书写图像;对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像;提取所述字迹轮廓,得到所述字迹图像。
在本实施例中,所述获取单元11,具体用于将所述书写图像从RGB空间变换至HSV空间;根据所述书写图像中像素点的HSV分量剔除干扰像素点;将剔除干扰像素点的书写图像从HSV空间变换至RGB空间;对所述书写图像进行灰度化处理和膨胀腐蚀处理,得到包括字迹轮廓的书写图像。
在本实施例中,提取单元12,具体用于提取所述字迹图像中的字迹特征;将所述字迹特征进行组合,得到所述字迹特征向量。
在本实施例中,计算单元13,具体用于计算每个字迹特征向量与其他所述字迹特征向量的距离度量;根据每个所述字迹特征向量与其他所述字迹特征向量的距离度量,得到对应的每个所述字迹图像与其他所述字迹图像的相似度值。
在本实施例中,系统还包括:训练单元,用于建立孪生网络作为所述特征提取模型;获取多组字迹样本对;每组所述字迹样本对包括:两张字迹样本和两张字迹样本是否匹配的标注;针对每组所述字迹样本对,通过所述特征提取模型对所述字迹样本对中的字迹样本进行处理得到相应的第一字迹特征向量和第二字迹特征向量;基于所述第一字迹特征向量和所述第二字迹特征向量,得到相应字迹样本的相似度值;根据所述相似度值判断所述字迹样本对中的两张所述字迹样本是否匹配;针对每组所述字迹样本对,判断所述字迹样本对中两张所述字迹样本的匹配结果和相应的标注是否一致;若所有所述匹配结果与相对应的标注均一致;则所述特征提取模型收敛,得到训练完成的所述特征提取模型;若任一所述匹配结果与相对应的标注不一致,则调整所述特征提取模型中的参数,根据调整后的特征提取模型重新对所述字迹样本对中的字迹样本进行处理,直至所有匹配结果与相对应的标注均一致。
在本实施例中,训练单元,还用于获取所述特征提取模型的调整次数;判断所述调整次数是否大于预设阈值;若所述调整次数大于预设阈值,则不再调整所述特征提取模型。
如图8所示,本发明实施例提供了一种电子设备,包括处理器1110、通信接口1120、存储器1130和通信总线1140,其中,处理器1110,通信接口1120,存储器1130通过通信总线1140完成相互间的通信;
存储器1130,用于存放计算机程序;
处理器1110,用于执行存储器1130上所存放的程序时,实现如下步骤:
获取需要进行字迹比对的至少两张字迹图像;
通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量;
根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;
若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
上述电子设备提到的通信总线1140可以是外设部件互连标准(PeripheralComponentInterconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,简称EISA)总线等。该通信总线1140可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口1120用于上述电子设备与其他设备之间的通信。
存储器1130可以包括随机存取存储器1130(RandomAccessMemory,简称RAM),也可以包括非易失性存储器1130(non-volatilememory),例如至少一个磁盘存储器1130。可选的,存储器1130还可以是至少一个位于远离前述处理器1110的存储装置。
上述的处理器1110可以是通用处理器1110,包括中央处理器1110(CentralProcessingUnit,简称CPU)、网络处理器1110(NetworkProcessor,简称NP)等;还可以是数字信号处理器1110(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述任一实施例所述的字迹比对方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种字迹比对方法,其特征在于,所述方法包括:
获取需要进行字迹比对的至少两张字迹图像;
通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量;
根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;
若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
2.根据权利要求1所述的字迹比对方法,其特征在于,所述获取需要进行字迹比对的至少两张字迹图像包括:
采集需要进行字迹比对的至少两张书写图像;
对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像;
提取所述字迹轮廓,得到所述字迹图像。
3.根据权利要求2所述的字迹比对方法,其特征在于,所述对所述书写图像进行处理,得到包括字迹轮廓的所述书写图像,包括:
将所述书写图像从RGB空间变换至HSV空间;
根据所述书写图像中像素点的HSV分量剔除干扰像素点;
将剔除干扰像素点的书写图像从HSV空间变换至RGB空间;
对所述书写图像进行灰度化处理和膨胀腐蚀处理,得到包括字迹轮廓的书写图像。
4.根据权利要求1所述的字迹比对方法,其特征在于,所述特征提取模型的训练方法包括:
建立孪生网络作为所述特征提取模型;
获取多组字迹样本对;每组所述字迹样本对包括:两张字迹样本和两张字迹样本是否匹配的标注;
针对每组所述字迹样本对,通过所述特征提取模型对所述字迹样本对中的字迹样本进行处理得到相应的第一字迹特征向量和第二字迹特征向量;
基于所述第一字迹特征向量和所述第二字迹特征向量,得到相应字迹样本的相似度值;
根据所述相似度值判断所述字迹样本对中的两张所述字迹样本是否匹配;
针对每组所述字迹样本对,判断所述字迹样本对中两张所述字迹样本的匹配结果和相应的标注是否一致;
若所有所述匹配结果与相对应的标注均一致;则所述特征提取模型收敛,得到训练完成的所述特征提取模型;
若任一所述匹配结果与相对应的标注不一致,则调整所述特征提取模型中的参数,根据调整后的特征提取模型重新对所述字迹样本对中的字迹样本进行处理,直至所有匹配结果与相对应的标注均一致。
5.根据权利要求4所述的字迹比对方法,其特征在于,所述方法还包括:
获取所述特征提取模型的调整次数;
判断所述调整次数是否大于预设阈值;
若所述调整次数大于预设阈值,则不再调整所述特征提取模型。
6.根据权利要求1所述的字迹比对方法,其特征在于,所述提取所述字迹图像中的字迹特征向量,包括:
提取所述字迹图像中的字迹特征;
将所述字迹特征进行组合,得到所述字迹特征向量。
7.根据权利要求1~6中任一所述的字迹比对方法,其特征在于,所述根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值,包括:
计算每个字迹特征向量与其他所述字迹特征向量的距离度量;
根据每个所述字迹特征向量与其他所述字迹特征向量的距离度量,得到对应的每个所述字迹图像与其他所述字迹图像的相似度值。
8.一种字迹比对系统,其特征在于,所述系统包括:
获取单元,用于获取需要进行字迹比对的至少两张字迹图像;
提取单元,用于通过预先训练得到的特征提取模型,提取所述字迹图像中的字迹特征向量;
计算单元,用于根据所述字迹特征向量,得到每个字迹图像与其他每个字迹图像之间的相似度值;
处理单元,用于判断所述相似度值是否大于预设阈值,若所述相似度值大于预设阈值,则所述相似度值对应的两组字迹图像为同一人的字迹图像。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1~7任一所述的字迹比对方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1~7中任一所述的字迹比对方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866358.5A CN112487853A (zh) | 2019-09-12 | 2019-09-12 | 一种字迹比对方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910866358.5A CN112487853A (zh) | 2019-09-12 | 2019-09-12 | 一种字迹比对方法、系统、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112487853A true CN112487853A (zh) | 2021-03-12 |
Family
ID=74920735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910866358.5A Pending CN112487853A (zh) | 2019-09-12 | 2019-09-12 | 一种字迹比对方法、系统、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112487853A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468987A (zh) * | 2021-06-17 | 2021-10-01 | 傲雄在线(重庆)科技有限公司 | 一种电子笔迹鉴定方法、系统、电子设备及存储介质 |
CN113723303A (zh) * | 2021-08-31 | 2021-11-30 | 中国平安人寿保险股份有限公司 | 一种笔迹校验方法、装置、计算机设备及存储介质 |
CN115878561A (zh) * | 2022-12-19 | 2023-03-31 | 青岛诺亚信息技术有限公司 | 一种电子档案四性检测方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070005537A1 (en) * | 2005-06-02 | 2007-01-04 | Microsoft Corporation | Handwriting recognition using a comparative neural network |
US7580551B1 (en) * | 2003-06-30 | 2009-08-25 | The Research Foundation Of State University Of Ny | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples |
US20140363082A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Integrating stroke-distribution information into spatial feature extraction for automatic handwriting recognition |
CN104809451A (zh) * | 2015-05-15 | 2015-07-29 | 河海大学常州校区 | 一种基于笔画曲率检测的笔迹鉴伪系统 |
CN106384094A (zh) * | 2016-09-18 | 2017-02-08 | 北京大学 | 一种基于书写风格建模的中文字库自动生成方法 |
EP3255586A1 (en) * | 2016-06-06 | 2017-12-13 | Fujitsu Limited | Method, program, and apparatus for comparing data graphs |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
-
2019
- 2019-09-12 CN CN201910866358.5A patent/CN112487853A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7580551B1 (en) * | 2003-06-30 | 2009-08-25 | The Research Foundation Of State University Of Ny | Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples |
US20070005537A1 (en) * | 2005-06-02 | 2007-01-04 | Microsoft Corporation | Handwriting recognition using a comparative neural network |
US20140363082A1 (en) * | 2013-06-09 | 2014-12-11 | Apple Inc. | Integrating stroke-distribution information into spatial feature extraction for automatic handwriting recognition |
CN104809451A (zh) * | 2015-05-15 | 2015-07-29 | 河海大学常州校区 | 一种基于笔画曲率检测的笔迹鉴伪系统 |
EP3255586A1 (en) * | 2016-06-06 | 2017-12-13 | Fujitsu Limited | Method, program, and apparatus for comparing data graphs |
CN106384094A (zh) * | 2016-09-18 | 2017-02-08 | 北京大学 | 一种基于书写风格建模的中文字库自动生成方法 |
CN109472249A (zh) * | 2018-11-22 | 2019-03-15 | 京东方科技集团股份有限公司 | 一种确定书写体优劣等级的方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113468987A (zh) * | 2021-06-17 | 2021-10-01 | 傲雄在线(重庆)科技有限公司 | 一种电子笔迹鉴定方法、系统、电子设备及存储介质 |
CN113723303A (zh) * | 2021-08-31 | 2021-11-30 | 中国平安人寿保险股份有限公司 | 一种笔迹校验方法、装置、计算机设备及存储介质 |
CN115878561A (zh) * | 2022-12-19 | 2023-03-31 | 青岛诺亚信息技术有限公司 | 一种电子档案四性检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107679466B (zh) | 信息输出方法和装置 | |
CN106203242B (zh) | 一种相似图像识别方法及设备 | |
CN106981077B (zh) | 基于dce和lss的红外图像和可见光图像配准方法 | |
WO2016065701A1 (zh) | 图像文字识别方法及装置 | |
CN114155546B (zh) | 一种图像矫正方法、装置、电子设备和存储介质 | |
US11263437B2 (en) | Method for extracting a feature vector from an input image representative of an iris by means of an end-to-end trainable neural network | |
CN112487853A (zh) | 一种字迹比对方法、系统、电子设备及存储介质 | |
US10528844B2 (en) | Method and apparatus for distance measurement | |
CN110807110B (zh) | 结合局部和全局特征的图片搜索方法、装置及电子设备 | |
WO2023124278A1 (zh) | 图像处理模型的训练方法、图像分类方法及装置 | |
TWI776176B (zh) | 手部作業動作評分裝置、方法及電腦可讀取存儲介質 | |
CN114972817A (zh) | 图像相似度匹配方法、设备及存储介质 | |
US8842917B2 (en) | Local feature extraction apparatus, control method therefor, and computer-readable medium | |
CN109919164B (zh) | 用户界面对象的识别方法及装置 | |
CN109871249B (zh) | 一种远程桌面操作方法、装置、可读存储介质及终端设备 | |
CN114548218A (zh) | 图像匹配方法、装置、存储介质和电子装置 | |
CN113822871A (zh) | 基于动态检测头的目标检测方法、装置、存储介质及设备 | |
CN110135274B (zh) | 一种基于人脸识别的人流量统计方法 | |
JP6699048B2 (ja) | 特徴選択装置、タグ関連領域抽出装置、方法、及びプログラム | |
US20220327803A1 (en) | Method of recognizing object, electronic device and storage medium | |
CN111507289A (zh) | 视频匹配方法、计算机设备和存储介质 | |
CN114820707A (zh) | 一种用于摄像头目标自动追踪的计算方法 | |
CN108446653B (zh) | 用于处理面部图像的方法和装置 | |
CN116071628B (zh) | 图像处理方法、装置、电子设备和存储介质 | |
JP2017138742A (ja) | 画像処理装置、画像処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 510000 no.2-8, North Street, Nancun Town, Panyu District, Guangzhou City, Guangdong Province Applicant after: Guangzhou huiruisitong Technology Co.,Ltd. Address before: 510000 no.2-8, North Street, Nancun Town, Panyu District, Guangzhou City, Guangdong Province Applicant before: GUANGZHOU HUIRUI SITONG INFORMATION TECHNOLOGY Co.,Ltd. |