CN115756461A - 标注模板生成方法、图像识别方法、装置和电子设备 - Google Patents
标注模板生成方法、图像识别方法、装置和电子设备 Download PDFInfo
- Publication number
- CN115756461A CN115756461A CN202211477254.3A CN202211477254A CN115756461A CN 115756461 A CN115756461 A CN 115756461A CN 202211477254 A CN202211477254 A CN 202211477254A CN 115756461 A CN115756461 A CN 115756461A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- interface
- template
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本公开提供了一种标注模板生成方法,涉及计算机技术领域,可以应用于金融技术领域。该方法包括:响应于接收到来自用户的标注模板配置指令,根据配置指令确定第一待展示界面;响应于接收到来自用户的图像,根据图像确定第二待展示界面;根据第一待展示界面和第二待展示界面,向用户展示配置界面;响应于接收到来自用户的标注模板生成指令,确定用户针对目标图像在配置界面的操作信息;以及基于操作信息生成与图像对应的目标标注模板,目标标注模板用于图像识别。本公开还提供了一种图像识别方法、装置、设备、存储介质和程序产品。
Description
技术领域
本公开涉及计算机技术领域,可以应用于金融技术领域,更具体地涉及一种标注模板生成方法、图像识别方法、装置、设备、介质和程序产品。
背景技术
在现有的图像分类应用中,主要采用的是基于深度学习的图像识别技术,该技术需要开发人员准备大量真实图像作为训练数据训练出图像分类模型。
对于现有的标注模板生成方法,需要开发人员训练针对性深度学习模型或制作模板,需要为每一类图像编写特定后处理代码并重新部署,通常耗时较长,开发效率低;除此之外,不同模型需要的模板图片尺寸多样,分辨率不固定、图片角度多样,给模板制作带来一定不便。
发明内容
鉴于上述问题,本公开提供了标注模板生成方法、图像识别方法、装置、设备、介质和程序产品。通过标注模板生成方法,用户可以上传任意尺寸的图像。在生成目标模板生成区前,通过该图像的尺寸确定第二待展示界面中目标图像的尺寸,以及相应的目标模板生成区,一方面有利于保证目标图像的清晰度,可以避免由于目标模板生成区过小导致目标图像模糊,还可以避免由于目标模板生成区过大导致滚动的弊端。另一方面,有利于使目标模板生成区的每个像素点与目标图像上的坐标相对应,有利于准确确定标注模板中的坐标信息。还可以基于用户的操作信息生成与图像对应的目标标注模板。从而使用户配置模板的过程更便捷与灵活,使最终生成的标注模板更准确。
根据本公开的第一个方面,提供了一种标注模板生成方法,包括:响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面;响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面;其中,所述第二待展示界面包括与所述图像对应的目标图像和与所述目标图像对应的目标模板生成区;根据所述第一待展示界面和所述第二待展示界面,向用户展示配置界面;响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息;以及基于所述操作信息生成与所述图像对应的目标标注模板,所述目标标注模板用于图像识别。
根据本公开实施例,所述响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面,包括:根据所述图像的尺寸和所述第一待展示界面的尺寸,确定所述目标图像的尺寸;以及基于所述目标图像的尺寸,对所述图像进行处理,得到所述第二待展示界面中的所述目标图像。
根据本公开实施例,所述基于所述目标图像的尺寸,对所述图像进行处理,得到所述第二待展示界面中的所述目标图像,包括:基于所述目标图像的尺寸,确定所述图像的缩放比;以及在确定所述缩放比超出预定范围的情况下,调整所述图像的缩放比,得到所述目标图像。
根据本公开实施例,所述配置界面包括配置项,所述响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息,包括:响应于接收到所述用户选择所述配置项的通知,监听所述用户采用所述配置项在所述目标模板生成区的框选操作;以及基于与所述框选操作对应的区域的第一坐标信息,确定所述目标标注模板中的目标识别区。
根据本公开实施例,所述方法还包括:识别所述目标图像,确定所述目标图像中的文字信息和与每个文字信息对应的第二坐标信息;以及根据所述第一坐标信息和所述第二坐标信息的匹配关系,确定所述目标标注模板中与所述目标识别区对应的目标字段。
根据本公开实施例,所述标注模板配置指令包括根据所述用户选择的预定项目生成的指令,所述响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面,包括:根据所述配置指令确定与所述预定项目匹配的第一待展示界面。
根据本公开实施例,所述方法还包括:获取配置组件,所述配置组件用于生成交互界面;其中,所述交互界面包括所述配置界面,所述配置界面包括配置项。
本公开的第二方面提供了一种图像识别方法,包括:获取待识别图像;以及针对所述待识别图像,基于所述目标标注模板,得到所述待识别图像的识别结果;其中,所述目标标注模板是根据本公开提供的方法得到的
本公开的第三方面提供了一种标注模板生成装置,包括:第一确定模块,用于响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面;第二确定模块,用于响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面;其中,所述第二待展示界面包括与所述图像对应的目标图像和与所述目标图像对应的目标模板生成区;展示模块,用于根据所述第一待展示界面和所述第二待展示界面,向用户展示配置界面;第三确定模块,用于响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息;以及生成模块,用于基于所述操作信息生成与所述图像对应的目标标注模板,所述目标标注模板用于图像识别。
本公开的第四方面提供了一种图像识别装置,包括:获取模块,用于获取待识别图像;以及识别模块,用于针对所述待识别图像,基于所述目标标注模板,得到所述待识别图像的识别结果;其中,所述目标标注模板是根据本公开提供的装置得到的
本公开的第五方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述公开的方法。
本公开的第六方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述公开的方法。
本公开的第七方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述公开的方法。
本公开提供的标注模板生成方法,用户可以上传任意尺寸的图像。在生成目标模板生成区前,通过该图像的尺寸确定第二待展示界面中目标图像的尺寸,以及相应的目标模板生成区,一方面有利于保证目标图像的清晰度,可以避免由于目标模板生成区过小导致目标图像模糊,还可以避免由于目标模板生成区过大导致滚动的弊端。另一方面,有利于使目标模板生成区的每个像素点与目标图像上的坐标相对应,有利于准确确定标注模板中的坐标信息。还可以基于用户的操作信息生成与图像对应的目标标注模板。从而使用户配置模板的过程更便捷与灵活,使最终生成的标注模板更准确。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的标注模板生成方法、图像识别方法、装置、设备、介质和程序产品的应用场景图;
图2示意性示出了根据本公开实施例的标注模板生成方法的流程图;
图3示意性示出了根据本公开实施例的图像识别方法的流程图;
图4示意性示出了根据本公开实施例的标注模板生成装置的结构框图;
图5示意性示出了根据本公开实施例的图像识别装置的结构框图;以及
图6示意性示出了根据本公开实施例的适于实现标注模板生成方法和/或的图像识别方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种标注模板生成方法和装置,响应于接收到来自用户的标注模板配置指令,根据配置指令确定第一待展示界面;响应于接收到来自用户的图像,根据图像确定第二待展示界面;其中,第二待展示界面包括与图像对应的目标图像和与目标图像对应的目标模板生成区;根据第一待展示界面和第二待展示界面,向用户展示配置界面;响应于接收到来自用户的标注模板生成指令,确定用户针对目标图像在配置界面的操作信息;以及基于操作信息生成与图像对应的目标标注模板,目标标注模板用于图像识别。
图1示意性示出了根据本公开实施例的标注模板生成方法、图像识别方法、装置、设备、介质和程序产品的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的标注模板生成方法和/或的图像识别方法一般可以由服务器105执行。相应地,本公开实施例所提供的标注模板生成装置和/或的图像识别装置一般可以设置于服务器105中。本公开实施例所提供的标注模板生成方法和/或的图像识别方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的标注模板生成装置和/或的图像识别装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2对公开实施例的标注模板生成方法进行详细描述。
图2示意性示出了根据本公开实施例的标注模板生成方法的流程图。
如图2所示,该实施例包括操作S210~操作S250,该标注模板生成方法可以通过服务器执行。
在本公开的技术方案中,对数据的获取、收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在操作S210,响应于接收到来自用户的标注模板配置指令,根据配置指令确定第一待展示界面。
第一待展示界面可以为供模板生成区和目标图像展示的展示区。可以在第一待展示界面中配置操作栏和模板生成区。由于不同识别模型所需要的模板不同,在本步骤中的待展示界面可以不包括模板生成区。
在操作S220,响应于接收到来自用户的图像,根据图像确定第二待展示界面;其中,第二待展示界面包括与图像对应的目标图像和与目标图像对应的目标模板生成区。
用户可以上传任意尺寸的图像。本步骤可以根据不同尺寸的图像,来调整目标图像的尺寸。
可以根据目标图像的尺寸配置目标模板生成区的尺寸,目标模板生成区可以理解为画布区,供用户在目标模板生成区这个画布上进行内容标注操作,以生成标注模板。
在操作S230,根据第一待展示界面和第二待展示界面,向用户展示配置界面。
配置界面包括最底层的第一待展示界面、包括供用户配置的操作栏。供用户操作的模板生成区和向用户展示的目标图像,如在模板生成区框选识别区。
目标模板生成区在第一待展示界面内部,且区域小于第一待展示界面。
在操作S240,响应于接收到来自用户的标注模板生成指令,确定用户针对目标图像在配置界面的操作信息。
操作信息可以包括用户在配置界面画框;调整、放大以及拖拽目标区域、目标图像;清空画框等操作。
用户可以自主绘制模板、配置识别区域字段、识别区和后处理规则。
在操作S250,基于操作信息生成与图像对应的目标标注模板,目标标注模板用于图像识别。
将于操作信息对应的模板生成区,作为用户配置的目标标注模板,自动转换为模板文件,用于后续使用该模板进行图像分类与识别。
目前针对特定类型图片的图像识别应用中包含判断图片是否为指定类型、识别图片内容两个步骤:一、判断图片类型;二、识别图片内容。针对第一步,通常采用的判断图片类型方法主要有两种,第一种为开发人员训练模型的方法,第二种为开发人员配置模板的方法,在这里仅对配置模板方式展开说明。开发人员制作模板的方法:开发人员针对性地根据图像特点绘制图像模板,然后使用模板匹配分类算法进行分类,制作模板的主要步骤如下:开发人员为每一类图像选择一张标准图片,根据图像的特点,例如票据中每个栏位的名称分布规律,绘制模板。绘制模板包括记录图片中每个可作为图像特征的定位字段与识别区的文字内容与坐标,最后保存为模板文件。N类图像则会生成N个模板文件。
根据图像确定第二待展示界面,可以支持用户上传任意尺寸图像。例如,当用户选中一张图像作为模板图片时,将模板生成区的宽高比设置为与目标图像相同的宽高比,动态调整画布大小,将目标图像铺满整个模板生成区,避免模板生成区中出现超出目标图像的坐标,可以减少无用数据的干扰。
目标标注模板可以用于图像识别。例如,该目标可以记录每类图片中每个定位字段、识别区的坐标与文字内容。
本实施例提供的标注模板生成方法,用户可以上传任意尺寸的图像。在生成目标模板生成区前,通过该图像的尺寸确定第二待展示界面中目标图像的尺寸,以及相应的目标模板生成区,一方面有利于保证目标图像的清晰度,可以避免由于目标模板生成区过小导致目标图像模糊,还可以避免由于目标模板生成区过大导致滚动的弊端。另一方面,有利于使目标模板生成区的每个像素点与目标图像上的坐标相对应,有利于准确确定标注模板中的坐标信息。还可以基于用户的操作信息生成与图像对应的目标标注模板。从而使用户配置模板的过程更便捷与灵活,使最终生成的标注模板更准确。
响应于接收到来自用户的图像,根据图像确定第二待展示界面,包括:根据图像的尺寸和第一待展示界面的尺寸,确定目标图像的尺寸;以及基于目标图像的尺寸,对图像进行处理,得到第二待展示界面中的目标图像。
举例来说,接收到来自用户的图像后,获取图像的尺寸,如原始图像的高度和宽度。然后,为了保证该图像可以在第一待展示界面中完整的展示,保证清晰度。,可以根据图像的尺寸和第一待展示界面的尺寸,来确定目标图像的尺寸,如(展示区的宽度-操作栏宽度)/图片的宽度,值为scaleX,展示区的高度/图片的高度,值为scaleY。若符合要求,即将(scaleX,scaleY)作为目标图像的尺寸,对图像进行处理,得到第二待展示界面中的目标图像。
本实施例提供的标注模板生成方法,可以充分利于第一待展示界面的展示区域。同时,由于目标模板生成区与目标图像相对应,通过基于目标图像的尺寸,对图像进行处理,得到第二待展示界面中的目标图像,有利于保证目标模板生成区的清晰度,避免因图像分辨率过大或过小而造成目标模板生成区背景不清晰。
基于目标图像的尺寸,对图像进行处理,得到第二待展示界面中的目标图像,包括:基于目标图像的尺寸,确定图像的缩放比;以及在确定缩放比超出预定范围的情况下,调整图像的缩放比,得到目标图像。
举例来说,接收到来自用户的图像后,获取图像的尺寸,如原始图像的高度和宽度。然后,为了保证该图像可以在第一待展示界面中完整的展示,保证清晰度。,可以根据图像的尺寸和第一待展示界面的尺寸,来确定目标图像的尺寸,如(展示区的宽度-操作栏宽度)/图片的宽度,值为scaleX,展示区的高度/图片的高度,值为scaleY。若不符合要求,可以取其中的较小者为原始图像的缩放比(scale),并判断该缩放比是否超出预先设定的缩放范围,如果超出预定范围最大值,则将缩放比设置成预定范围的最大值,如果缩放比小于预定范围的最小值,则将缩放比设置成预定范围的最小值。从而设置模板生成区的高度为图像高度乘相应的最终缩放比,模板生成区的宽度为图像宽度乘相应的最终缩放比。由此即可确定目标图像的尺寸和目标模板生成区的尺寸。
本实施例提供的标注模板生成方法,为了保证图像展示的清晰度,对原始图片的缩放比进行了范围限制,有利于避免了目标模板生成区过小导致图像模糊,目标模板生成区过大导致出现图像需滚动的弊端。
配置界面包括配置项,响应于接收到来自用户的标注模板生成指令,确定用户针对目标图像在配置界面的操作信息,包括:响应于接收到用户选择配置项的通知,监听用户采用配置项在目标模板生成区的框选操作;以及基于与框选操作对应的区域的第一坐标信息,确定目标标注模板中的目标识别区。
通过配置项可以支持放大模板生成区、缩小模板生成区、还原模板生成区、拖拽模板生成区、旋转模板生成区、裁剪模板生成区等功能,以适应用户对不同分辨率、不同角度的图像生成的模板生成区进行调整,提高标注操作的灵活性。
举例来说,当用户选择配置项“画框”时,使用相应的JavaScript脚本监听用户的鼠标操作,当用户按下鼠标时,记录下初始坐标点,然后移动鼠标,此时可以在模板生成区,即画布上会相应绘制以初始点坐标为对角线起点,以当前鼠标位置对应坐标为对角线终点的矩形,当用户松开鼠标时,识别框绘制完成。脚本监听到矩形绘制完成操作,将矩形对应的坐标值传送给服务器保存,从而确定目标标注模板中的目标识别区。
例如,起始点坐标值为(x1,y1),结束点坐标值为(x2,y2),则框选操作对应的区域的宽度为x1与x2之间差的绝对值,高度为y1与y2之间差的绝对值。
进一步的脚本监听到矩形绘制完成操作,可以继续提示用户选择此目标识别区的字段名,此字段名称可以来自于生成标注模板配置指令时的预定项目,可以为预定项目中文档内置的字段名、字段模型。
识别区与用户框选操作形成的目标框相对应,将目标框作为目标识别区,在识别图像的过程中,可以通过该识别区确定图像中需要识别的区域,该区域可以为文字区域。
本实施例提供的标注模板生成方法,用户可以根据需求在目标模板生成区的进行框选操作,实现灵活配置各识别区,从而帮助用户基于标注模板生成方法对上传的图像进行自动化标注识别区。通过目标识别区来进行图像识别,可以提升图像识别应用准确率,提高标注模板的开发效率。
标注模板生成方法还包括:识别目标图像,确定目标图像中的文字信息和与每个文字信息对应的第二坐标信息;以及根据第一坐标信息和第二坐标信息的匹配关系,确定目标标注模板中与目标识别区对应的目标字段。
例如,目标字段可以包括定位字段,即每类图像中的固定文字区域。
由于目标图像与目标模板生成区存在对应关系,因此可以根据第一坐标信息和第二坐标信息的匹配关系,确定目标标注模板中与目标识别区对应的目标字段,从而确定文字信息。
本实施例提供的标注模板生成方法,可以确定目标标注模板中与目标识别区对应的目标字段,从而便于在图像识别时定位字段。
标注模板配置指令包括根据用户选择的预定项目生成的指令,响应于接收到来自用户的标注模板配置指令,根据配置指令确定第一待展示界面,包括:根据配置指令确定与预定项目匹配的第一待展示界面。
预定项目可以为项目和文档。例如,在创建模板前,用户需先选择内置的任一项目内的任一文档。其中,项目的作用是隔离不同客户的不同数据模型需求,比如,a银行的需求有身份证、银行卡、回执单;b银行的需求有银行卡,回执单,通过建立项目a,项目b来对客户进行区分。文档的作用是为了预置通用文档字段信息,比如在项目a下建立文档:身份证,并录入身份证常用字段:姓名、性别、身份证号;在项目a下建立文档:银行卡,并录入银行卡常用字段:卡号、银行名称。
可以通过选择预设的项目、文档等方式,来对数据进行隔离,使得用户能够根据不同客户、不同需求场景设置对应的标注模板,增加了数据的多样性。
本实施例提供的标注模板生成方法,根据配置指令确定与预定项目匹配的第一待展示界面,能够对数据进行隔离,生成匹配的第一待展示界面,从而展示匹配的配置界面。
标注模板生成方法还包括:获取配置组件,配置组件用于生成交互界面;其中,交互界面包括配置界面,配置界面包括配置项。
例如,配置组件可以是画布组件canvas。可以理解,canvas是指在HTML5中新增的标签,用于在网页实时生成图像,并且可以操作图像内容。可以用JavaScript操作的位图,可以通过定义API支持脚本化客户端绘图操作。
通过配置组件实现与用户的交互,如提供交互界面。如交互界面可以为向用户展示的配置界面,可以在配置界面中提供操作栏,操作栏中可以包括多个配置项,如画框、调整、放大、拖拽、选择以及清空等功能,方便用户配置标注模板。
本实施例提供的标注模板生成方法,通过配置组件提供交互界面以及配置项,提高了标注模板的便捷性和灵活性。
图3示意性示出了根据本公开实施例的图像识别方法的流程图。
如图3所示,该实施例包括操作S310~操作S320,该图像识别方法可以通过服务器执行。
在本公开的技术方案中,对数据的获取、收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
在操作S310,获取待识别图像。
在操作S320,针对待识别图像,基于目标标注模板,得到待识别图像的识别结果;其中,目标标注模板是根据标注模板生成方法得到的。
举例来说,用户上传待识别图片后,可以先采用通用图像识别模型识别整张图片文字内容。可以根据目标标注模板来定位字段的坐标与文字内容,在已知的识别结果中查找与目标标注模板中定位字段相同的字符,获取每个定位字段在上传图片中的真实坐标。利用所有定位字段的模板坐标和真实坐标、识别区的模板坐标,通过线性回归、矩形面积计算等方式计算出识别区在上传图像中的真实坐标和当前识别区的结果。利用每个识别区在上传图像中的真实坐标与识别结果,调用模板匹配分类算法对图像进行分类,并根据模板中配置的模型和后处理规则进行二次识别得到最终识别结果。
本实施例提供的图像识别方法,利用目标标注模板可以得到所述待识别图像的识别结果,识别结果准确。
基于上述标注模板生成方法,本公开还提供了一种标注模板生成装置。以下将结合图4对该装置进行详细描述。
图4示意性示出了根据本公开实施例的标注模板生成装置的结构框图。
如图4所示,该实施例的标注模板生成装置400包括第一确定模块410、第二确定模块420、展示模块430、第三确定模块440和生成模块450。
第一确定模块410,用于响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面;第二确定模块420,用于响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面;其中,所述第二待展示界面包括与所述图像对应的目标图像和与所述目标图像对应的目标模板生成区;展示模块430,用于根据所述第一待展示界面和所述第二待展示界面,向用户展示配置界面;第三确定模块440,用于响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息;以及生成模块450,用于基于所述操作信息生成与所述图像对应的目标标注模板,所述目标标注模板用于图像识别。
在一些实施例中,所述第二确定模块包括:第一确定子模块,用于根据所述图像的尺寸和所述第一待展示界面的尺寸,确定所述目标图像的尺寸;以及处理模块,用于基于所述目标图像的尺寸,对所述图像进行处理,得到所述第二待展示界面中的所述目标图像。
在一些实施例中,所述处理模块包括:确定单元,用于基于所述目标图像的尺寸,确定所述图像的缩放比;以及调整单元,用于在确定所述缩放比超出预定范围的情况下,调整所述图像的缩放比,得到所述目标图像。
在一些实施例中,所述配置界面包括配置项,所述生成模块,包括:监听子模块,用于响应于接收到所述用户选择所述配置项的通知,监听所述用户采用所述配置项在所述目标模板生成区的框选操作;以及第二确定子模块,用于基于与所述框选操作对应的区域的第一坐标信息,确定所述目标标注模板中的目标识别区。
在一些实施例中,所述装置还包括,匹配模块,用于识别所述目标图像,确定所述目标图像中的文字信息和与每个文字信息对应的第二坐标信息;以及根据所述第一坐标信息和所述第二坐标信息的匹配关系,确定所述目标标注模板中与所述目标识别区对应的目标字段。
在一些实施例中,所述标注模板配置指令包括根据所述用户选择的预定项目生成的指令,所述第一确定模块,用于根据所述配置指令确定与所述预定项目匹配的第一待展示界面。
在一些实施例中,所述装置还包括,获取模块,用于获取配置组件,所述配置组件用于生成交互界面;其中,所述交互界面包括所述配置界面,所述配置界面包括配置项。
根据本公开的实施例,第一确定模块410、第二确定模块420、展示模块430、第三确定模块440和生成模块450中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一确定模块410、第二确定模块420、展示模块430、第三确定模块440和生成模块450中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一确定模块410、第二确定模块420、展示模块430、第三确定模块440和生成模块450中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
基于上述图像识别方法,本公开还提供了一种图像识别装置。以下将结合图5对该装置进行详细描述。
图5示意性示出了根据本公开实施例的图像识别装置的结构框图。
如图5所示,该实施例的图像识别装置500包括获取模块510和识别模块520。
获取模块510,用于获取待识别图像;以及识别模块520,用于针对所述待识别图像,基于所述目标标注模板,得到所述待识别图像的识别结果;其中,所述目标标注模板是根据标注模板生成装置得到的。
根据本公开的实施例,获取模块510和识别模块520中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,获取模块510和识别模块520中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块510和识别模块520中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的适于实现标注模板生成方法和/或的图像识别方法的电子设备的方框图。
如图6所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、ROM602以及RAM 603通过总线604彼此相连。处理器601通过执行ROM 602和/或RAM 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 602和RAM 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备600还可以包括输入/输出(I/O)接口605,输入/输出(I/O)接口605也连接至总线604。电子设备600还可以包括连接至I/O接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 602和/或RAM 603和/或ROM 602和RAM 603以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的标注模板生成方法。
在该计算机程序被处理器601执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分609被下载和安装,和/或从可拆卸介质611被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
Claims (13)
1.一种标注模板生成方法,包括:
响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面;
响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面;其中,所述第二待展示界面包括与所述图像对应的目标图像和与所述目标图像对应的目标模板生成区;
根据所述第一待展示界面和所述第二待展示界面,向用户展示配置界面;
响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息;以及
基于所述操作信息生成与所述图像对应的目标标注模板,所述目标标注模板用于图像识别。
2.根据权利要求1所述的方法,其中,所述响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面,包括:
根据所述图像的尺寸和所述第一待展示界面的尺寸,确定所述目标图像的尺寸;以及
基于所述目标图像的尺寸,对所述图像进行处理,得到所述第二待展示界面中的所述目标图像。
3.根据权利要求2所述的方法,其中,所述基于所述目标图像的尺寸,对所述图像进行处理,得到所述第二待展示界面中的所述目标图像,包括:
基于所述目标图像的尺寸,确定所述图像的缩放比;以及
在确定所述缩放比超出预定范围的情况下,调整所述图像的缩放比,得到所述目标图像。
4.根据权利要求1所述的方法,其中,所述配置界面包括配置项,所述响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息,包括:
响应于接收到所述用户选择所述配置项的通知,监听所述用户采用所述配置项在所述目标模板生成区的框选操作;以及
基于与所述框选操作对应的区域的第一坐标信息,确定所述目标标注模板中的目标识别区。
5.根据权利要求4所述的方法,还包括:
识别所述目标图像,确定所述目标图像中的文字信息和与每个文字信息对应的第二坐标信息;以及
根据所述第一坐标信息和所述第二坐标信息的匹配关系,确定所述目标标注模板中与所述目标识别区对应的目标字段。
6.根据权利要求1所述的方法,其中,所述标注模板配置指令包括根据所述用户选择的预定项目生成的指令,所述响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面,包括:
根据所述配置指令确定与所述预定项目匹配的第一待展示界面。
7.根据权利要求1所述的方法,还包括:
获取配置组件,所述配置组件用于生成交互界面;其中,所述交互界面包括所述配置界面,所述配置界面包括配置项。
8.一种图像识别方法,包括:
获取待识别图像;以及
针对所述待识别图像,基于所述目标标注模板,得到所述待识别图像的识别结果;
其中,所述目标标注模板是根据权利要求1至7任一项所述的方法得到的。
9.一种标注模板生成装置,包括:
第一确定模块,用于响应于接收到来自用户的标注模板配置指令,根据所述配置指令确定第一待展示界面;
第二确定模块,用于响应于接收到来自所述用户的图像,根据所述图像确定第二待展示界面;其中,所述第二待展示界面包括与所述图像对应的目标图像和与所述目标图像对应的目标模板生成区;
展示模块,用于根据所述第一待展示界面和所述第二待展示界面,向用户展示配置界面;
第三确定模块,用于响应于接收到来自所述用户的标注模板生成指令,确定所述用户针对所述目标图像在所述配置界面的操作信息;以及
生成模块,用于基于所述操作信息生成与所述图像对应的目标标注模板,所述目标标注模板用于图像识别。
10.一种图像识别装置,包括:
获取模块,用于获取待识别图像;以及
识别模块,用于针对所述待识别图像,基于所述目标标注模板,得到所述待识别图像的识别结果;
其中,所述目标标注模板是根据权利要求9所述的装置得到的。
11.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~8中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。
13.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211477254.3A CN115756461A (zh) | 2022-11-23 | 2022-11-23 | 标注模板生成方法、图像识别方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211477254.3A CN115756461A (zh) | 2022-11-23 | 2022-11-23 | 标注模板生成方法、图像识别方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115756461A true CN115756461A (zh) | 2023-03-07 |
Family
ID=85336329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211477254.3A Pending CN115756461A (zh) | 2022-11-23 | 2022-11-23 | 标注模板生成方法、图像识别方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115756461A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402026A (zh) * | 2023-04-13 | 2023-07-07 | 广州文石信息科技有限公司 | 应用内容批注方法、装置、设备以及存储介质 |
-
2022
- 2022-11-23 CN CN202211477254.3A patent/CN115756461A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402026A (zh) * | 2023-04-13 | 2023-07-07 | 广州文石信息科技有限公司 | 应用内容批注方法、装置、设备以及存储介质 |
CN116402026B (zh) * | 2023-04-13 | 2023-12-19 | 广州文石信息科技有限公司 | 应用内容批注方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107911753B (zh) | 用于在视频中添加数字水印的方法和装置 | |
CN109255767B (zh) | 图像处理方法和装置 | |
CN109118456B (zh) | 图像处理方法和装置 | |
CN109242801B (zh) | 图像处理方法和装置 | |
CN109344762B (zh) | 图像处理方法和装置 | |
CN109711508B (zh) | 图像处理方法和装置 | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
CN112306793A (zh) | 用于监控网页的方法和装置 | |
CN107656911B (zh) | 表格处理方法及其系统 | |
CN110263301B (zh) | 用于确定文字的颜色的方法和装置 | |
US20180107686A1 (en) | Search method and apparatus | |
US20200050906A1 (en) | Dynamic contextual data capture | |
US20180307399A1 (en) | Dynamic Thumbnails | |
KR20210058768A (ko) | 객체 라벨링 방법 및 장치 | |
CN107330087B (zh) | 页面文件生成方法和装置 | |
CN113553123B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN115756461A (zh) | 标注模板生成方法、图像识别方法、装置和电子设备 | |
CN106611148B (zh) | 基于图像的离线公式识别方法和装置 | |
CN113220381A (zh) | 一种点击数据展示方法和装置 | |
US20170053383A1 (en) | Apparatus and method for providing 3d content and recording medium | |
CN113763009A (zh) | 一种图片处理方法、图片跳转方法、装置、设备和介质 | |
CN108834202B (zh) | 信息展示方法和设备 | |
CN110888583B (zh) | 页面显示方法、系统、装置和电子设备 | |
CN112015936B (zh) | 用于生成物品展示图的方法、装置、电子设备和介质 | |
CN114049633A (zh) | 图像识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |