[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN111476090A - 水印识别方法和装置 - Google Patents

水印识别方法和装置 Download PDF

Info

Publication number
CN111476090A
CN111476090A CN202010145315.0A CN202010145315A CN111476090A CN 111476090 A CN111476090 A CN 111476090A CN 202010145315 A CN202010145315 A CN 202010145315A CN 111476090 A CN111476090 A CN 111476090A
Authority
CN
China
Prior art keywords
information
content
image
area
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010145315.0A
Other languages
English (en)
Other versions
CN111476090B (zh
Inventor
宋烈金
赵秀慧
黄雪原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202010145315.0A priority Critical patent/CN111476090B/zh
Publication of CN111476090A publication Critical patent/CN111476090A/zh
Application granted granted Critical
Publication of CN111476090B publication Critical patent/CN111476090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

本申请公开了一种水印识别方法和装置,涉及计算机技术领域中的图像识别技术领域,其中,方法包括:获取目标图像的功能信息,并识别目标图像中的内容区域;将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域;在内容区域中确定功能子区域之外的候选子区域;在候选子区域中进行水印检测。由此,提高了水印识别的准确率和效率,解决现有技术中,水印多样化带来的识别困难的技术问题。

Description

水印识别方法和装置
技术领域
本申请涉及计算机技术中的图像识别技术领域,尤其涉及一种水印识别方法和装置。
背景技术
通常,智能认证是指个人或机构提交代表自身的资质证书图像,由认证平台判定该认证需求是否通过,主要包括资质认证和资质反作弊两个方面,其中资质反作弊是验证是否存在伪造、冒用的情况。目前,主要根据检测资质证书中的水印来检测资质证书的合法性。
相关技术中,水印检测的主要的解决方案是人工审核,存在的问题认证等待时间长,一般需要几个小时,甚至几天。人工审核不仅需要耗费巨大的人力成本而且还导致认证时间长影响用户体验。
发明内容
本申请的第一个目的在于提出一种水印识别方法。
本申请的第二个目的在于提出一种水印识别装置。
本申请的第三个目的在于提出一种电子设备。
本申请的第四个目的在于提出一种存储有计算机指令的非瞬时计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种水印识别方法,包括:获取所述目标图像的功能信息,并识别目标图像中的内容区域;将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域;确定所述内容区域中所述功能子区域之外的候选子区域;在所述候选子区域中进行水印检测。
为达上述目的,本申请第二方面实施例提出了一种水印识别装置,包括:获取模块,用于获取所述目标图像的功能信息;识别模块,用于识别目标图像中的内容区域;第一确定模块,用于将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域;第二确定模块,用于确定所述内容区域中所述功能子区域之外的候选子区域;检测模块,用于在所述候选子区域中进行水印检测。
为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例描述的水印识别方法。
为达上述目的,本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述实施例描述的水印识别方法。
上述申请中的一个实施例具有如下优点或有益效果:
获取目标图像的功能信息,并识别目标图像中的内容区域,进而,将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域,确定内容区域中功能子区域之外的候选子区域,最后,在候选子区域中进行水印检测。由此,首先筛选出水印可能所在的候选子区域,在候选子区域中进行水印检测,提高了水印识别的准确率和效率,解决现有技术中,水印多样化带来的识别困难的技术问题。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请第一实施例的水印识别方法的流程图;
图2是根据本申请第二实施例的目标图像的示意图;
图3是根据本申请第三实施例的功能子区域确定场景示意图;
图4是根据本申请第四实施例的水印识别方法的场景示意图;
图5是根据本申请第五实施例的水印识别应用场景示意图;
图6是根据本申请第六实施例的水印识别装置的结构示意图;以及
图7是用来实现本申请实施例的水印识别方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的水印识别方法和装置。
针对背景技术中提到的,水印由于人工审核,导致的审核压力过大,以及效率不高的技术问题,本申请提出一种智能化的水印识别方法。
其中,在本申请中,考虑到水印不存在固定的格式、固定的样式,一般是个人或者机构为了限定某种授权,随意机打或者手写的一种水印形式,这种灵活的水印方式导致资质水印的复杂多样。
如单纯的通过学习水印特征进行水印的检测,一方面,需要训练标准大量的样本,工作量巨大,另一方面,仅限于应用于图像与水印具有明显区分特征的情况,如:图像利用水印表明来源信息,这种水印与图像差异很大,容易构建模型进行区分。而实际应用中,水印可能是任意字体格式的机打文字,还可能是手写的某一行或者多行字,还存在各种方向倾斜的不确定性,这类水印检测的难度较大。本申请提供的水印识别方法中,首先排除水印不存在的区域,在剩余区域进行水印检测,降低了水印识别的工作量和干扰,提高了水印识别的准确性和效率。
具体而言,如图1是根据本申请一个实施例的水印识别方法的流程图,如图1所示,该方法包括:
步骤101,获取目标图像的功能信息,并识别目标图像中的内容区域。
其中,目标图像可以是学位证、教师资格证等资质图像,另外,目标图像的功能信息指的对应目标图像中固定存在的原有信息,比如,标题信息、盖章信息、内容信息以及对应的排版信息等。
在不同的应用场景下,获取目标图像的功能信息的方式不同,作为一种可能的示例,由于每一类目标图像的排版结构信息是不同的,比如,如图2所示的,出入证明中,排版结构信息规定分为区域A为标题、区域B为内容、区域C为公司信息等,其中,排版结构信息中可以包含对应排版区域对应的位置以及功能信息类型等,在本实施例中,获取目标图像的图像类型信息,该图像类型信息可以根据识别图像中的关键字确定,也可以根据上传目标图像的网页类型确定等。
进而,可查询预设的数据库,该数据库中存储有图像类型信息和排版结构信息的对应关系,通过查询预设的数据库获取与图像类型信息对应的排版结构信息,根据该排版结构信息可以确定对应的功能信息,比如,根据排版结构信息确定标题区域对应的标题内容,根据排版结构信息确定关键字内容等,根据排版结构信息确定二维码对应的图像特征,根据排版结构信息确定国徽对应的图像特征和面积大小等。
由于在一些应用场景中,目标图像上传的网页可能根据需要对目标图像进行二维码的添加等操作,因而,还可以根据网页标识,查询预设的数据库,获取与该网页标识对应的功能信息,该功能信息可以为二维码信息或者条形码信息,将网页中加入的显示在目标图像中的这些信息作为功能信息来获取。
在本申请的实施例中,还需要识别目标图像中的内容区域,将包含内容的区域首先提取出来,以便于进一步在内容区域中筛选出可能包含水印的子区域,其中,内容区域可以理解为图像中非背景区域的所有包含内容的非空白区域。在本实施例中,可以识别目标图像中的内容,根据美容所在的位置确定出内容区域。
需要说明的是,在不同的应用场景下,识别目标图像中的内容区域的方式不同,示例如下:
示例一:
在本示例中,根据文字识别算法识别目标图像中的文字区域,其中,文字识别算法可以是OCR识别算法等可以明确检测出文字的算法,进而,考虑到文字识别算法可能无法将目标图像中每一字都能识别出来,更为困难的是水印可能存在非文字的情况、另外文字水印存在灰度深浅不一、角度任意,OCR识别会很困难,因此,作为补充,根据区域检测算法检测目标图像中的候选内容区域,比如,该区域检测算法为mser算法,而mser算法是基于分水岭的思想来做图像中斑点的检测,对目标图像处理为灰度图像中,mser算法对已经处理成灰度的目标图像做二值化处理,这个处理的阈值从0到255递增,这个阈值的递增类似于在一片土地上做水平面的上升,随着水平面上升,高高低低凹凸不平的土地区域就会不断被淹没,这就是分水岭算法,而这个高低不同,就是图像中灰度值的不同。而在一幅含有文字的图像上,有些区域(比如文字)由于颜色(灰度值)是一致的,因此在水平面(阈值)持续增长的一段时间内都不会被覆盖,直到阈值涨到文字本身的灰度值时才会被淹没,这些区域就叫做稳定区域,也可以理解为本申请中的候选内容区域,该候选内容区域可以检测出目标图像中的文字区域和包含其他内容的区域,所以可以弥补OCR区域漏召的情况,根据文字区域和候选内容区域的合并可以生成内容区域。
当然,在实际应用中,目标图像可能是用户拍照得到的,由于用户拍照角度和目标图像对应的资质证书的摆放角度双重影响,一般提交的目标图像都会存在一定角度的倾斜,虽然目前的OCR识别技术能够容忍一定程度的倾斜,但是会影响到识别效果,所以首先需要对资质图像进行倾斜矫正,比如,可以识别图像的外边缘,根据外边缘的轮廓确定图像的倾斜度,进而,根据图像的倾斜度修正图像。
在实际执行过程中,水印检测的效果并非图像尺寸越大,识别效果越高,而图像尺寸会影响到检测时间,所以可以对目标图像进行一定程度的缩小,提升检测速度,在本申请的一个实施例中,可以检测目标图像的大小,当目标图像的大小超过一定值时,对目标图像进行裁剪,比如,将目标图像中的空白区域裁剪,又比如,通过降低图像的分辨率等来缩小图像的大小等。
步骤102,将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域。
不难理解的是,功能信息是图像中的原有信息所在区域,而内容区域中既包含了功能信息也包含了水印信息,在本申请的实施例中,将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域。
在本申请的一个实施例中,当功能信息是文字信息时,将文字信息与内容区域中的内容进行关键字匹配,若所述内容区域中包含匹配成功的目标内容,则获取文字信息的第一文字排版信息,该第一文字排版信息包括文字中文字信息中每个文字的顺序以及文字的字体大小关系和文字信息的字数等,进而,获取目标内容的第二文字排版信息,第二文字排版信息包括目标内容的间隔距离以及包含的文字信息和、字体大小和字数等,根据第一文字排版信息和第二文字排版信息确定功能子区域。
在本示例中,确定出文字信息时,根据关键字识别技术在上述识别得到的内容区域中,确定目标图像中所需关键字的位置,因为OCR文字识别可能存在遗漏的情况,并非完整识别出整个关键字中的全部文字和位置,这时需要排版信息来确定出功能子区域。
举例而言,如图3所示,当文字信息为“考生姓名”,则根据关键字匹配技术,识别出的内容区域中的目标内容为“姓名”,获取的“考生姓名”的第一排版信息为“四个文字、顺序分别为“考、生、姓、名”,字体大小相同”,则获取的“姓名”的第二排版信息为“两个字、顺序为“姓名”,字与字之间的间隔为A,字体大小均为b”,则可以按照A和b,推算出内容区域中的功能子区域。
在本申请的一个实施例中,当功能信息包括图像信息时,比如,印章信息、二维码信息、条形码信息等,可以提取内容区域中的第一图像特征信息,并获取图形信息的第二图像特征信息,将第一图像特征信息与所述第二图像特征信息匹配,以便于根据匹配结果发现目标图像中的图像信息所在区域。即若是在第一图像特征信息中确定匹配成功的目标图像特征信息,则将目标图像特征信息所在区域确定为功能子区域。
在本实施例中,也可以预先确定图像信息的类型,针对每一种图像信息的类型匹配对应的识别工具,比如,当图像信息是二维码时,可以根据二维码识别工具来识别对应的二维码。
在本实施例中,针对国徽和印章等图像信息,由于这类图像信息比较固定,因而,可以采用目标检测的技术,利用标记有国徽和印章图案位置的图像作为训练集,训练得到目标检测模型,应用于对资质的国徽和印章进行检测。
步骤103,确定内容区域中功能子区域之外的候选子区域。
步骤104,在候选子区域中进行水印检测。
容易理解的是,内容区域之外的候选子区域是水印存在的区域因而,在内容区域中,确定功能子区域之外的候选子区域,以在候选子区域中进行水印检测,由此,一方面,提高了水印检测的效率,无需对目标图像的每个区域都进行检测,另一方面,提高了水印检测的准确率,由于预先将功能子区域识别出来,避免了功能子区域对水印检测的干扰。
在本申请的一个实施例中,识别候选子区域的图像特征,将识别到的图像特征与预设的水印图像特征匹配,若是候选子区域中包含与预设的水印图像特征匹配的图像特征,则表明该候选子区域中存在水印图像。考虑到在直接执行过程中,可能水印是隐形水印,这种情况下,从候选子区域中获取分量图像,并对分量图像进行划分,获得像素块,从像素块中选择出包含隐形水印信息的像素块,进而,对包含隐形水印信息的像素块进行QRC分解,获得上三角形矩阵,从上三角形矩阵的第一行第四列中提取隐形水印的二进制序列信息,根据隐形水印的二进制序列信息获取水印分量信息,对水印分量信息进行处理,获取隐形水印提取图;对隐形水印提取图进行解码,识别出隐形水印。
由于水印均集中在目标图像的核心部分,边框以外的区域比较复杂,如图像背景,很容易导致误识别为水印,因而,在本申请的一个实施例中,为了进一步提高水印识别的准确率和效率,检测目标图像的图像边框,比如,可以根据识别出的功能子区域的边界作为初始边框,另外目标图像的边框具有四周环绕并连续的特点,因此,可以通过mser算法圈出初始边界以外的区域作为目标图像的图像边框,进而,在候选子区域中确定位于图像边框内的目标子区域,在目标子区域中进行水印检测,在一些可能的示例中,也可以直接将目标图像的图像边框之外的区域描黑,这时图像边框就会变成全黑的情况,然后将初始边界分别向上下左右延伸,接触到封闭黑线时,将其确定为图像边框的边界。
为了使得本领域的技术人员更加清楚的了解,本申请实施例的水印识别方法,下面结合具体的实施例进行举例说明,其中,在本示例中,目标图像为营业执照:
在本示例中,如图4所示,在获取到目标图像后,对目标图像进行倾斜矫正和图像缩放处理,将目标图像处理为摆放正确且图像尺寸合适,进而,根据OCR文字识别算法识别目标图像中的文字区域,给予Mser算法识别目标图像中的稳定区域,同时进行二维码检测以及条形码检测等,识别出图像中的内容区域。
进而,获取营业执照中的原有功能信息,比如,标题为“营业执照”关键字所在区域,国徽和印章区域,边框区域等,进而,参照图4和图5,进行区域筛选,筛选出除了营业执照中的功能信息所在的功能子区域(图5中的虚线区域)之外的内容区域(图5中的细实线区域)作为候选子区域(图5中的粗实线区域),在候选子区域进行水印的检测。
然而,上述水印识别方法旨在检测出水印可能存在的候选子区域,当水印重叠覆盖在部分功能信息上时,为了准确的提取出水印,还可以在检测到功能子区域时,识别该功能子区域是否存在水印信息,若是存在水印,则将该功能子区域的功能信息擦除将擦除后的区域作为候选子区域,若是部分水印覆盖在功能信息上,则保留该区域,将没有被水印覆盖的功能信息擦除。
综上,本申请实施例的水印检测方法,获取目标图像的功能信息,并识别目标图像中的内容区域,进而,将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域,确定内容区域中功能子区域之外的候选子区域,最后,在候选子区域中进行水印检测。由此,首先筛选出水印可能所在的候选子区域,在候选子区域中进行水印检测,提高了水印识别的准确率和效率,解决现有技术中,水印多样化带来的识别困难的技术问题。
为了实现上述实施例,本申请还提出了一种水印识别装置,图6是根据本申请一个实施例的水印识别装置的结构示意图,如图6所示,该水印识别包括:获取模块10、识别模块20、第一确定模块30、第二确定模块40和检测模块50,其中,
获取模块10,用于获取目标图像的功能信息。
识别模块20,用于识别目标图像中的内容区域。
第一确定模块30,用于将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域。
第二确定模块40,用于确定内容区域中功能子区域之外的候选子区域。
检测模块50,用于在候选子区域中进行水印检测。
在本申请的一个实施例中,当功能信息包括文字信息时,第一确定模块30,具体用于:
将文字信息与内容区域中的内容进行关键字匹配;
若内容区域中包含匹配成功的目标内容,则获取文字信息的第一文字排版信息;
获取目标内容的第二文字排版信息,并根据第一文字排版信息和第二文字排版信息确定功能子区域。
在本申请的一个实施例中,当功能信息包括图像信息时,第一确定模块30,具体用于:
提取内容区域中的第一图像特征信息,并获取图像信息的第二图像特征信息;
将第一图像特征信息与第二图像特征信息匹配,在第一图像特征信息中确定匹配成功的目标图像特征信息;
将目标图像特征信息所在区域确定为功能子区域。
在本申请的一个实施例中,获取模块10,具体用于:获取所述目标图像对应的图像类型信息;
查询预设的数据库获取与所述图像类型信息对应的排版结构信息,其中,所述排版结构信息包括功能信息类型和所述功能信息类型对应的位置信息;
根据所述排版结构信息确定所述功能信息。
需要说明的是,前述对水印识别方法的解释说明,也适用于本发明实施例的水印识别装置,其实现原理类似,在此不再赘述。
综上,本申请实施例的水印检测装置,获取目标图像的功能信息,并识别目标图像中的内容区域,进而,将功能信息与内容区域中的内容匹配,确定功能信息所在的功能子区域,确定内容区域中功能子区域之外的候选子区域,最后,在候选子区域中进行水印检测。由此,首先筛选出水印可能所在的候选子区域,在候选子区域中进行水印检测,提高了水印识别的准确率和效率,解决现有技术中,水印多样化带来的识别困难的技术问题。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的水印识别方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的停车位数据的有效性识别的方法对应的程序指令/模块(例如,附图6所示的获取模块10、识别模块20、第一确定模块30、第二确定模块40和检测模块50)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的水印识别的方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
执行水印识别的方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
为了实现上述实施例,本申请还提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行上述的水印识别方法。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (12)

1.一种水印识别方法,其特征在于,包括:
获取所述目标图像的功能信息,并识别目标图像中的内容区域;
将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域;
确定所述内容区域中所述功能子区域之外的候选子区域;
在所述候选子区域中进行水印检测。
2.如权利要求1所述的方法,其特征在于,所述获取所述目标图像的功能信息,包括:
获取所述目标图像对应的图像类型信息;
确定与所述图像类型信息对应的排版结构信息,其中,所述排版结构信息包括功能信息类型和所述功能信息类型对应的位置信息;
根据所述排版结构信息确定所述功能信息。
3.如权利要求1所述的方法,其特征在于,当所述功能信息包括文字信息时,所述将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域,包括:
将所述文字信息与所述内容区域中的内容进行关键字匹配;
若所述内容区域中包含匹配成功的目标内容,则获取所述文字信息的第一文字排版信息;
获取所述目标内容的第二文字排版信息,并根据所述第一文字排版信息和所述第二文字排版信息确定所述功能子区域。
4.如权利要求1所述的方法,其特征在于,当所述功能信息包括图像信息时,所述将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域,包括:
提取所述内容区域中的第一图像特征信息,并获取所述图像信息的第二图像特征信息;
将所述第一图像特征信息与所述第二图像特征信息匹配,在所述第一图像特征信息中确定匹配成功的目标图像特征信息;
将所述目标图像特征信息所在区域确定为所述功能子区域。
5.如权利要求1所述的方法,其特征在于,所述识别目标图像中的内容区域,包括:
根据文字识别算法识别所述目标图像中的文字区域;
根据区域检测算法检测所述目标图像中的候选内容区域;
根据所述文字区域和所述候选内容区域生成所述内容区域。
6.如权利要求1所述的方法,其特征在于,所述在所述候选子区域中进行水印检测,包括:
检测所述目标图像的图像边框;
在所述候选子区域中确定位于所述图像边框内的目标子区域;
在所述目标子区域中进行水印检测。
7.一种水印识别装置,其特征在于,包括:
获取模块,用于获取所述目标图像的功能信息;
识别模块,用于识别目标图像中的内容区域;
第一确定模块,用于将所述功能信息与所述内容区域中的内容匹配,确定所述功能信息所在的功能子区域;
第二确定模块,用于确定所述内容区域中所述功能子区域之外的候选子区域;
检测模块,用于在所述候选子区域中进行水印检测。
8.如权利要求7所述的装置,其特征在于,所述获取模块,具体用于:
获取所述目标图像对应的图像类型信息;
查询预设的数据库获取与所述图像类型信息对应的排版结构信息,其中,所述排版结构信息包括功能信息类型和所述功能信息类型对应的位置信息;
根据所述排版结构信息确定所述功能信息。
9.如权利要求7所述的装置,其特征在于,当所述功能信息包括文字信息时,所述第一确定模块,具体用于:
将所述文字信息与所述内容区域中的内容进行关键字匹配;
若所述内容区域中包含匹配成功的目标内容,则获取所述文字信息的第一文字排版信息;
获取所述目标内容的第二文字排版信息,并根据所述第一文字排版信息和所述第二文字排版信息确定所述功能子区域。
10.如权利要求7所述的装置,其特征在于,当所述功能信息包括图像信息时,所述第一确定模块,具体用于:
提取所述内容区域中的第一图像特征信息,并获取所述图像信息的第二图像特征信息;
将所述第一图像特征信息与所述第二图像特征信息匹配,在所述第一图像特征信息中确定匹配成功的目标图像特征信息;
将所述目标图像特征信息所在区域确定为所述功能子区域。
11.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的水印识别方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的水印识别方法。
CN202010145315.0A 2020-03-04 2020-03-04 水印识别方法和装置 Active CN111476090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010145315.0A CN111476090B (zh) 2020-03-04 2020-03-04 水印识别方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010145315.0A CN111476090B (zh) 2020-03-04 2020-03-04 水印识别方法和装置

Publications (2)

Publication Number Publication Date
CN111476090A true CN111476090A (zh) 2020-07-31
CN111476090B CN111476090B (zh) 2023-04-07

Family

ID=71747154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010145315.0A Active CN111476090B (zh) 2020-03-04 2020-03-04 水印识别方法和装置

Country Status (1)

Country Link
CN (1) CN111476090B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036287A (zh) * 2020-08-26 2020-12-04 北京指掌易科技有限公司 一种盲水印识别方法、装置、计算机设备及存储介质
CN113012018A (zh) * 2021-04-12 2021-06-22 中船重工汉光科技股份有限公司 一种隐形办公打印文本加密及解密方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120041941A1 (en) * 2004-02-15 2012-02-16 Google Inc. Search Engines and Systems with Handheld Document Data Capture Devices
CN108038357A (zh) * 2017-11-22 2018-05-15 明鉴方寸(北京)科技有限公司 一种隐形水印嵌入方法、装置以及存储设备
CN108550101A (zh) * 2018-04-19 2018-09-18 腾讯科技(深圳)有限公司 图像处理方法、装置及存储介质
CN108596916A (zh) * 2018-04-16 2018-09-28 深圳市联软科技股份有限公司 一种颜色相近的水印识别方法、系统、终端及介质
CN109492349A (zh) * 2018-10-30 2019-03-19 连尚(新昌)网络科技有限公司 一种用于识别和管理文档分发渠道的方法与设备
CN110135412A (zh) * 2019-04-30 2019-08-16 北京邮电大学 名片识别方法和装置
CN110428357A (zh) * 2019-08-09 2019-11-08 厦门美图之家科技有限公司 图像中水印的检测方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120041941A1 (en) * 2004-02-15 2012-02-16 Google Inc. Search Engines and Systems with Handheld Document Data Capture Devices
CN108038357A (zh) * 2017-11-22 2018-05-15 明鉴方寸(北京)科技有限公司 一种隐形水印嵌入方法、装置以及存储设备
CN108596916A (zh) * 2018-04-16 2018-09-28 深圳市联软科技股份有限公司 一种颜色相近的水印识别方法、系统、终端及介质
CN108550101A (zh) * 2018-04-19 2018-09-18 腾讯科技(深圳)有限公司 图像处理方法、装置及存储介质
CN109492349A (zh) * 2018-10-30 2019-03-19 连尚(新昌)网络科技有限公司 一种用于识别和管理文档分发渠道的方法与设备
CN110135412A (zh) * 2019-04-30 2019-08-16 北京邮电大学 名片识别方法和装置
CN110428357A (zh) * 2019-08-09 2019-11-08 厦门美图之家科技有限公司 图像中水印的检测方法、装置、电子设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
LIN G S等: "A passive-blind forgery detection scheme based on content-adaptive quantization table estimation" *
林建忠: "面向数字信息安全的可逆水印方法研究" *
谢剑斌,等: "一种基于先验信息和多模板匹配的票据水印检测算法" *
鲍佳立: "基于H.264/SVC可伸缩视频的感兴趣区域数字水印算法研究" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036287A (zh) * 2020-08-26 2020-12-04 北京指掌易科技有限公司 一种盲水印识别方法、装置、计算机设备及存储介质
CN113012018A (zh) * 2021-04-12 2021-06-22 中船重工汉光科技股份有限公司 一种隐形办公打印文本加密及解密方法
CN113012018B (zh) * 2021-04-12 2022-02-25 中船重工汉光科技股份有限公司 一种隐形办公打印文本加密及解密方法

Also Published As

Publication number Publication date
CN111476090B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
US10013643B2 (en) Performing optical character recognition using spatial information of regions within a structured document
US11783610B2 (en) Document structure identification using post-processing error correction
CN111507330B (zh) 习题识别方法、装置、电子设备及存储介质
CN111695518B (zh) 结构化文档信息标注的方法、装置及电子设备
US20210295085A1 (en) Image moderation method, electronic device, and storage medium
CN110598686A (zh) 发票的识别方法、系统、电子设备和介质
Alberti et al. Open evaluation tool for layout analysis of document images
CN112183296B (zh) 模拟票据图像生成、票据图像识别方法和装置
CN111209909B (zh) 资质识别模板构建方法、装置、设备和存储介质
US20220237397A1 (en) Identifying handwritten signatures in digital images using ocr residues
CN112749606A (zh) 一种文本定位方法和装置
CN112818852A (zh) 印章校验方法、装置、设备及存储介质
CN111738252B (zh) 图像中的文本行检测方法、装置及计算机系统
CN113762455A (zh) 检测模型训练方法、单字检测方法、装置、设备及介质
CN111476090B (zh) 水印识别方法和装置
CN112668580A (zh) 一种文本识别方法、文本识别装置及终端设备
JP5634972B2 (ja) テキストセグメンテーションのための方法、コンピュータプログラム製品およびシステム
CN111651971A (zh) 一种表格信息转录方法、系统、电子设备和存储介质
CN112542163B (zh) 智能语音交互方法、设备及存储介质
CN115004261A (zh) 文本行检测
CN112784825A (zh) 图片中文字的识别方法、关键字检索方法、装置及设备
CN112101368B (zh) 一种字符图像处理方法、装置、设备和介质
CN110163203B (zh) 字符识别方法、装置、存储介质及计算机设备
CN118570824A (zh) 印章识别的方法、装置、计算机设备及介质
CN117251158A (zh) 一种基于图像识别的ui界面生成方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant