CN111582153A - 确定文档朝向的方法和装置 - Google Patents
确定文档朝向的方法和装置 Download PDFInfo
- Publication number
- CN111582153A CN111582153A CN202010377027.8A CN202010377027A CN111582153A CN 111582153 A CN111582153 A CN 111582153A CN 202010377027 A CN202010377027 A CN 202010377027A CN 111582153 A CN111582153 A CN 111582153A
- Authority
- CN
- China
- Prior art keywords
- orientation
- document
- point
- position coordinates
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000001514 detection method Methods 0.000 claims abstract description 60
- 238000012549 training Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 21
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了确定文档朝向的方法和装置,涉及计算机视觉技术领域。该方法的一具体实施方式包括:获取包括表格的待测文档的图像;将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息,其中,关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置;基于待测文档的表格的关键点信息,确定待测文档的朝向。该实施方式可以准确、高效地检测文档朝向。
Description
技术领域
本申请的实施例涉及计算机技术领域,具体涉及计算机视觉技术领域,尤其涉及确定文档朝向的方法和装置。
背景技术
图像识别技术其主要的作用就是按照所观测到的图像,对图像中的物体进行分辨,以此来做好相应的具有意义的判断,具体实现则是应用现代信息处理技术,以及计算机对人类认知过程进行模拟。
在文档处理技术中,经常需要通过图像识别技术从文档图像中识别多个文本图像,并利用识别到的文本图像来进行后续的诸如文档方向矫正、光学字符识别等处理。
在对文档图像进行方向矫正时依赖于准确的文档朝向检测,目前文档朝向检测技术,在准确性和处理效率上存在不足。
发明内容
提供了一种确定文档朝向的方法、装置、电子设备以及计算机可读介质。
根据第一方面,提供了一种确定文档朝向的方法,上述方法包括:获取包括表格的待测文档的图像;将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息,其中,关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置;基于待测文档的表格的关键点信息,确定待测文档的朝向。
根据第二方面,提供了一种确定文档朝向的装置,该装置包括:图像获取模块,被配置成获取包括表格的待测文档的图像;信息获取模块,被配置成将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息,其中,关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置;朝向确定模块,被配置成基于待测文档的表格的关键点信息,确定待测文档的朝向。
根据第三方面,提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面任一实现方式描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面任一实现方式描述的方法。
本申请的实施例提供的确定文档朝向的方法和装置,首先获取包括表格的待测文档的图像,其次将待测文档的图像输入已训练的关键点检测模型,获取关键点检测模型输出的待测文档的表格的关键点信息,最后基于待测文档的表格的关键点信息确定待测文档的朝向。由此,本申请的实施例通过已训练的关键点检测模型,对待测文档的表格的关键点进行检测得到关键点信息,由关键点信息确定整个文档的朝向,定位准确,可以准确、高效地检测文档朝向。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请确定文档朝向的方法的一个实施例的流程图;
图2是根据本申请的一个应用场景中预设关键点的示意图;
图3是根据本申请中的确定待测文档的朝向的一种示例性流程图;
图4是根据本申请确定文档朝向的方法的又一个实施例的流程图;
图5是根据本申请的确定文档朝向的装置的实施例的结构示意图;
图6是用来实现本申请实施例的确定文档朝向的方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1示出了根据本申请确定文档朝向的方法的一个实施例的流程100。上述确定文档朝向的方法包括以下步骤:
步骤101,获取包括表格的待测文档的图像。
本实施例中,确定文档朝向的方法运行于其上的执行主体可以通过实时拍摄或内存读取等方式获取包括表格的待测文档的图像。该包括表格的待测文档的图像是通过对包括表格的待测文档进行图像数据采集(即拍摄)形成的图像。待测文档包括表格,而该表格可以是空表也可以填充有内容的表格,该填充的内容包括:文字、符号等,当然,待测文档包括的内容也可以不仅仅限于表格,比如,待测文档还包括文本段落、标点符号、字符、标题等。而文本段落、标点符号、标题以及字符的位置可以根据文档排版需求而设置,比如,金融表单的图像中,字符聚簇或分散在表格中,标题位于表格的外部。
本实施例中,为了便于后续对获取到的包括表格的待测文档的图像进行信息提取,可选地,在获取到包括表格的待测文档的图像之后,可以对表格进行预处理。针对提取的信息不同,预处理的方式可以有多种,例如,为了便于识别包括表格的待测文档的图像中的待测文档,预处理可以包括去噪处理,去噪处理是指减小图像中噪声的过程,通过去噪处理可以有效地提高图像质量,增大信噪比,更好地体现原来图像所携带的有效信息。
步骤102,将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息。
关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置。在这里,与文档朝向关联的至少两个预设关键点可以是连接形成的线段与文档的朝向平行、垂直、呈固定的角度的关键点。例如,表格行方向上的两个顶点,或者表格列方向上的两个顶点。其中表格行方向上的两个顶点的连线方向与文档朝向一致,表格列方向上的两个顶点的连线与文档的朝向垂直。
在本实施例的一些可选的实现方式中,至少两个与文档朝向关联的预设关键点包括:待测文档中的表格的四个顶点中的至少两个。本可选实现方式中,将表格的四个顶点中的至少两个作为预设关键点,根据两点生成一线的原理,至少两个顶点得到至少一条表征待测文档的表格的朝向的线,由此可以有效确定待测文档的表格的朝向。
在本实施例的一些可选的实现方式中,如图2所示,至少两个与文档朝向关联的预设关键点包括:待测文档中的表格的四个顶点(B1、B2、B3、B4)中的至少两个以及表征待测文档中的表格的标题的两端的至少两个端点(D1、D2),在图2中,表格的标题为“利润表”,表格标题的两端的两个端点分别为端点D1和端点D2。本可选实现方式中,除了将表格四个顶点中的至少两个作为预设关键点,还增加了待测文档中的表格的标题的两端的至少两个端点,标题可以进行指示待测文档的表格的朝向,从而提高了待测文档的表格的朝向确定的准确性,为待测文档的朝向检测提供了可靠的依据。
关键点信息可以表征上述预设关键点在待测文档的图像中的位置的信息,例如可以是各预设关键点的位置坐标。或者,可以是预设关键点的热力图。热力图中一个位置坐标的热力值越高,表征预设关键点落在该位置坐标的置信度越高。
本实施例中,关键点检测模型用于检测待测文档的图像的关键点,是预先训练好的模型。上述执行主体在获取包含关键点标注信息的训练样本之后,采用训练样本训练初始模型,经过对初始模型的多次训练、评估和算法调参后,获得已训练的关键点检测模型。将包括表格的待测文档的图像输入关键点检测模型后,可以得出待测文档的表格的关键点信息。
具体地,关键点检测模型训练过程可以如下:
1)收集包括表格的文档的图像作为训练样本。
2)对训练样本的表格中至少两个与文档朝向关联的预设关键点进行标注,构建数据集。比如,至少两个与文档朝向关联的预设关键点包括表格的两个顶点,标注这两个顶点的位置。
3)采用诸如卷积神经网络等模型结构构建关键点检测模型。然后利用构建的训练样本对关键点检测模型进行训练。在训练过程中,可以根据关键点检测模型对训练样本的关键点检测结果与训练样本的关键点标注信息之间的差异确定关键点检测模型的误差,利用误差反向传播的方式迭代调整关键点检测模型的参数,使其误差逐步缩小。在关键点检测模型的误差收敛至一定的范围内或迭代的次数达到预设的次数阈值时可以停止调整参数,得到训练完成的关键点检测模型。
可选地,上述对表格的预处理可以包括:在将待测文档的图像输入已训练的关键点检测模型之前,将图像缩放至预设的尺寸,使缩放后的图像尺寸适应已训练的关键点检测模型。例如,已训练的关键点检测模型可处理的图像尺寸为a*b,可将待测文档的图像缩放至该尺寸。然后将缩放后的图像输入至已训练的关键点检测模型进行检测。
步骤103,基于待测文档的表格的关键点信息,确定待测文档的朝向。
本实施例中,由于关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设的关键点的位置,因此在确定了待测文档的表格的关键点信息之后,可以确定待测文档的表格的朝向,进一步可以很容易确定待测文档的朝向。
在至少两个与文档朝向关联的预设关键点有两个以上,即多个时,多个中任意两个不同的预设关键点均可以确定待测文档的表格的朝向,因此待测文档的朝向可以通过多种预设关键点的组合来确定。在这里,待测文档的朝向可以利用其文本行的方向或文本列的方向来表征。
具体地,参照图2所示,假设确定了待测文档中的表格的四个顶点(B1、B2、B3、B4)中的顶点B1与顶点B2的位置坐标,其中B1、B2是位于表格的行方向的两个顶点,则可以根据顶点B1与顶点B2的位置坐标构建从顶点B1到顶点B2的方向向量,该方向向量所指示的方向即为文档的文本行方向。又例如,假设确定了待测文档中的表格的四个顶点(B1、B2、B3、B4)中的点B1与顶点B3的位置坐标,其中B1、B3是位于表格的列方向的两个顶点,则可以根据顶点B1与顶点B3的位置坐标构建从顶点B1到顶点B3的方向向量,该方向向量垂直的方向即为文档的文本行方向。
而在预设关键点既包括表格的至少两个顶点、又包括表格的标题两端的端点时,可以首先通过表格的顶点确定出表征文本行方向的第一候选方向,然后根据表格的标题两端的端点的连线确定出表征文本行方向的第二候选方向,根据第一候选方向和第二候选方向的置信度确定出文本行方向最终检测结果。这样,可以通过多组预设关键点确定出多个候选方向,从而提升文档朝向检测结果的可靠性。
本申请的实施例提供的确定文档朝向的方法,首先获取包括表格的待测文档的图像,其次将待测文档的图像输入已训练的关键点检测模型,获取关键点检测模型输出的待测文档的表格的关键点信息,最后基于待测文档的表格的关键点信息确定待测文档的朝向。由此,本申请的实施例通过已训练的关键点检测模型,对待测文档的表格的关键点进行检测得到关键点信息,由关键点信息确定整个文档的朝向,定位准确,可以准确、高效地检测文档朝向。
本实施例的一些可选实现方式中,继续参考图3,图3示出了根据本申请中的确定待测文档的朝向的一种示例性流程300,上述基于待测文档的表格的关键点信息,确定待测文档的朝向,包括以下步骤:
步骤301,将预设关键点组合为至少一个点对,基于关键点信息确定至少一个点对的位置信息。
具体地,参照图2所示,标题端点D1与端点D2组合成一个点对、表格顶点B1与顶点B2组合成一个点对、表格顶点B3与顶点B4组合成一个点对、表格顶点B1与顶点B3组合成一个点对、表格顶点B2与顶点B4组合成一个点对,每个组合成的点对均可表征表格的真实朝向。
点对是由预设关键点组合形成的,其位置信息可以由所包含的两个预设关键点的位置信息确定。可选地,关键点信息包括:预设关键点的位置坐标;上述基于关键点信息确定至少一个点对的位置信息,包括:由各点对中的两个预设关键点的位置坐标,确定各点对的位置坐标。比如,标题端点D1的位置坐标为(12,10),标题端点D2的位置坐标为(18,15),标题端点D1与端点D2组合成一个点对的位置可以表示为(12,10,18,15)。
本实施例的一些可选实现方式中,关键点信息包括:预设关键点的位置坐标和位置坐标的置信度;上述基于关键点信息确定至少一个点对的位置信息,包括:由各点对中的两个预设关键点的位置坐标及对应的置信度,分别确定各点对的位置坐标及对应的置信度。本可选实现方式中,关键点信息既包括预设关键点的位置坐标还包括位置坐标的置信度,为确定待测文档的表格的朝向提供了多种不同依据,进一步提高了点对的位置信息的可信度。
步骤302,基于至少一个点对的位置信息,确定待测文档的朝向。
本可选实现方式中,关键点信息与文档朝向关联,关键点组合成点对,因此点对的位置信息与文档朝向关联,由至少一个点对的位置信息,可以确定出待测文档的朝向。可以基于至少一个点对的位置信息,确定点对所在直线相对待测文档的方向,进一步由点对所在直线相对待测文档的方向,确定待测文档的朝向。
本实施例的一些可选实现方式中,点对的位置信息包括:点对的位置坐标及位置坐标的置信度,其中,点对的位置坐标的置信度可以通过点对中的关键点的位置坐标的置信度计算得到,具体计算方式包括加法平均、最低值法等。例如标题端点D1与端点D2组合成一个点对,标题端点D1的位置坐标的置信度为50%;标题端点D2的位置坐标的置信度为30%;则采用加法平均的方式得到的标题端点D1与端点D2组合成的点对的位置坐标的置信度为1/2*(50%+30%)=40%,而采用最低值法得到的标题端点D1与端点D2组合成的点对的位置坐标的置信度为标题端点D1位置坐标的置信度与端点D2位置坐标的置信度两者中的最低值,即30%。
本可选实现方式中,上述基于至少一个点对的位置信息,确定待测文档的朝向,包括:
根据各点对的位置坐标的置信度的排序以及各点对的位置坐标,确定待测文档的朝向。本可选实现方式中,将各点对的位置坐标的置信度进行排序,可以确定位置坐标的置信度较高的一些点对,保证了点对位置选择的可靠性。进一步,在位置坐标的置信度较高的基础上,结合点对的位置坐标,可以更进一步提高待测文档的朝向检测的可靠性。
进一步地,上述根据各点对的位置坐标的置信度的排序以及各点对的位置坐标,确定待测文档的朝向的方法,可以采用以下实现方式中的任一种:
1)将各点对的位置坐标的置信度进行排序,根据置信度最高的点对中的两个预设关键点的连线与待测文档的朝向之间的预设对应关系确定待测文档的朝向。需要说明的是,任意两个预设关键点的连线与待测文档的朝向之间的预设对应关系可以预先进行标定得到,比如,表格标题两个端点的连线与待测文档的预设对应关系为:两者朝向相垂直。
本实现方式中,选取位置坐标的置信度最高的点对,可以保证点对位置信息最可靠,为点对的位置坐标的置信度排序提供了一种可选实现方式,在最优点对位置表征方面保证了待测文档的朝向检测的可靠性。
2)将所有点对的位置坐标的置信度由大到小进行排序,获取排序前预设位的点对,构成点对集合;基于点对集合中的每个点对的位置坐标分别对待测文档的朝向进行计算,得到与各点对一一对应的至少一个候选朝向;确定各候选朝向的方向角,计算各候选朝向的方向角的平均值,并将各候选朝向的方向角的平均值表征的方向作为待测文档的朝向。需要说明的是,候选朝向的方向角可以待测文档的图像中某一元素作为参照而形成,比如像素的行或列方向。
本实现方式中,选取各候选朝向的方向角的平均值表征的方向作为待测文档的朝向,为点对的位置坐标的置信度排序提供了一种可选实现方式,吸取各点对位置信息的共性,在各点对共性方面保证了待测文档的朝向检测的可靠性。
图3所示的可选实现方式提供的确定待测文档的朝向的方法,在确定了至少两个与文档朝向关联的预设关键点的基础上,将预设关键点组合成至少一个点对,基于关键点信息确定至少一个点对的位置信息,基于至少一个点对的位置信息,确定待测文档的朝向,由于点对比关键点的信息量更大,相对于只通过关键点确定待测文档的朝向,提高了待测文档朝向检测的可靠性,保证了待测文档朝向检测的准确性。
本实施例的一些可选实现方式中,关键点信息包括:预设关键点的位置坐标;进一步,参照图4所示,其示出了确定文档朝向的方法的又一个实施例的流程400,该确定文档朝向的方法的又一个实施例的流程图400,可以包括以下步骤:
步骤401,获取包括表格的待测文档的图像。
步骤402,将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息。
步骤403,将预设关键点组合为至少一个点对。
步骤404,基于各点对中的两个预设关键点的位置坐标,分别确定各点对的位置坐标。
具体地,点对是由关键点组合形成的,而预设关键点的位置也是确定的,在预设关键点的位置坐标确定之后,可以确定各点对的位置坐标。比如,某表格的一点对中两个预设关键点(B1、B2)的位置坐标分别为B1(24,36),B2(45,28),则当前点对的位置坐标可以表示为(24,36,45,28)。
步骤405,将至少一个点对的位置坐标输入预先训练的文档朝向预测模型,得到朝向预测模型输出的待测文档的朝向。
朝向预测模型通过获取多个包含表格的样本文档中的预设关键点的位置信息,结合样本文档的朝向标注信息训练得到。
朝向预测模型用于检测待测文档的真实朝向,其是预先训练好的模型,当将至少一个点对的位置坐标输入朝向预测模型后,可以得出待测文档的真实朝向。朝向预测模型训练过程:首先,获取由多个样本文档组成的训练样本集,其中训练样本集的样本文档上预先标注有预设关键点的位置信息,并且每个预设关键点的位置信息均与样本文档真实朝向相对应。其次,结合样本文档的朝向标注信息采用训练样本训练朝向预测模型的初始模型,经过对初始模型的多次训练、评估和算法调参后,获得朝向预测模型。
图4所示的实施例提供的确定文档朝向的方法,在关键点信息包括预设关键点的位置坐标时,基于各点对中的两个预设关键点的位置坐标,分别确定各点对的位置坐标,将至少一个点对的位置坐标输入预先训练的文档朝向预测模型,得到待测文档的朝向,提高了待测文档朝向检测的可靠性。
下面结合图2,对本实施例的确定文档朝向的方法的一个具体实施方式的实施过程进行详细介绍:
具体实施方式的实施过程分为三步骤,第一步骤,训练关键点检测模型。第二步骤,使用该模型对包括表格的待测文档的图像进行关键点检测,得到关键点信息。第三步骤,由关键点信息确定待测文档的朝向,每步具体如下:
在第一步骤中,需要收集大量各种包括表格以及表格的标题的文档图像资料,并对其中每张图像里的表格以及表格的标题进行关键点的标注,可以标注标题的左右两个端点(例如图2中D1与D2),表格的四个顶点(例如图2中的B1~B4),构建数据集。基于上述数据集训练关键点检测模型。
第二步骤,该第二步骤将一个包括表格以及表格的标题的待测文档的图像使用该关键点检测模型进行关键点信息检测,具体的:
获取一张包括表格以及表格的标题的待测文档的图像,并对该图像进行关键点检测模型需要的相应预处理(比如,将该图像缩小到关键点检测模型要求的大小),将该待测文档的图像输入关键点检测模型,运行模型检测过程,获取关键点检测模型输出的关键点信息,且关键点信息包括各个预设关键点的位置坐标和位置坐标的置信度。
第三步骤,根据关键点检测模型输出的关键点信息,确定待测文档的朝向,具体的:
将预设关键点组合为至少一个点对,例如,D1与端点D2组合成一个点对、表格顶点B1与顶点B2组合成一个点对、表格顶点B3与顶点B4组合成一个点对、表格顶点B1与顶点B3组合成一个点对、表格顶点B2与顶点B4组合成一个点对,由于每个点对均可导出待测文档的表格的真实朝向,这里有多种可选实现方式,因此可以采用以下任一种:
1)将各点对的位置坐标的置信度进行排序,直接根据一组置信度最高的点对,推断出待测文档的表格真实朝向。
2)将所有点对的位置坐标的置信度由大到小进行排序,取置信度最高的前预设位的点对,取其对应表格真实朝向的平均值作为待测文档的表格朝向。
3)拟合各个点对对应表格真实朝向的分布,取期望朝向作为待测文档的表格朝向(具体可参照图4所示实现过程)。
综上所述,经过上述三个步骤,完成了基于有标题表格的文档朝向检测。
需要说明的是,在本申请的一些实施例中,上述第一步骤是非必要的步骤,例如在实践中,关键点检测模型可以是在其他端训练完成的,这时可以直接使用该关键点检测模型来检测待测文档的图像中的预设关键点的位置。上述第一步骤的描述并不构成对本申请各实施例的具体实施方式的必要限定。
进一步参考图5,作为对上述各图所示方法的实现,本申请提供了确定文档朝向的装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,该装置具体可应用于各种电子设备中。
如图5所示,本实施例提供的确定文档朝向的装置500包括:图像获取模块501,信息获取模块502,朝向确定模块503。其中,上述图像获取模块501,可以被配置成获取包括表格的待测文档的图像。上述信息获取模块502,可以被配置成将待测文档的图像输入已训练的关键点检测模型,获得关键点检测模型输出的待测文档的表格的关键点信息,其中,关键点信息表征待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置。上述朝向确定模块503,可以被配置成基于待测文档的表格的关键点信息,确定待测文档的朝向。
在本实施例中,确定文档朝向的装置500中:图像获取模块501,信息获取模块502,朝向确定模块503的具体处理及其所带来的技术效果可分别参考图1对应实施例中的步骤101、步骤102和步骤103的相关说明,在此不再赘述。
在本实施例的一些可选的实现方式中,上述朝向确定模块503包括:点对组合子模块(图中未示出),朝向确定子模块(图中未示出)。其中,上述点对组合子模块,可以被配置成将预设关键点组合为至少一个点对,基于关键点信息确定至少一个点对的位置信息。上述朝向确定子模块,可以被配置成基于至少一个点对的位置信息,确定待测文档的朝向。
在本实施例的一些可选的实现方式中,关键点信息包括:预设关键点的位置坐标和位置坐标的置信度;上述点对组合子模块包括:位置确定单元(图中未示出)。上述位置确定单元,可以被配置成由各点对中的两个预设关键点的位置坐标及对应的置信度,分别确定各点对的位置坐标及对应的置信度。上述朝向确定子模块包括:朝向确定单元(图中未示出)。上述朝向确定单元,可以被配置成根据各点对的位置坐标的置信度的排序以及各点对的位置坐标,确定待测文档的朝向。
在本实施例的一些可选的实现方式中,上述朝向确定单元包括:朝向确定子单元(图中未示出)。上述朝向确定子单元,可以被配置成将各点对的位置坐标的置信度进行排序,根据置信度最高的点对中的两个预设关键点的连线与待测文档的朝向之间的预设对应关系确定待测文档的朝向。
在本实施例的一些可选的实现方式中,上述朝向确定单元包括:集合构成子单元(图中未示出)、朝向计算子单元(图中未示出)、平均朝向计算子单元(图中未示出)。上述集合构成子单元,可以被配置成将所有点对的位置坐标的置信度由大到小进行排序,获取排序前预设位的点对,构成点对集合。上述朝向计算子单元,可以被配置成基于点对集合中的每个点对的位置坐标分别对待测文档的朝向进行计算,得到与各点对一一对应的至少一个候选朝向。上述平均朝向计算子单元,可以被配置成确定各候选朝向的方向角,计算各候选朝向的方向角的平均值,并将各候选朝向的方向角的平均值表征的方向作为待测文档的朝向。
在本实施例的一些可选的实现方式中,关键点信息包括:预设关键点的位置坐标;上述点对组合子模块包括:点对确定单元(图中未示出)。上述朝向确定子模块包括:朝向预测单元(图中未示出)。上述点对确定单元,可以被配置成基于各点对中的两个预设关键点的位置坐标,分别确定各点对的位置坐标。上述朝向预测单元,可以被配置成将至少一个点对的位置坐标输入预先训练的文档朝向预测模型,得到朝向预测模型输出的待测文档的朝向;其中,朝向预测模型通过获取多个包含表格的样本文档中的预设关键点的位置信息,结合样本文档的朝向标注信息训练得到。
在本实施例的一些可选的实现方式中,上述至少两个与文档朝向关联的预设关键点包括:待测文档中的表格的四个顶点中的至少两个。
在本实施例的一些可选的实现方式中,上述至少两个与文档朝向关联的预设关键点还包括:表征待测文档中的表格的标题的两端的至少两个端点。
本申请的实施例提供的确定文档朝向的装置,首先图像获取模块501获取包括表格的待测文档的图像,其次信息获取模块502将待测文档的图像输入已训练的关键点检测模型,获取关键点检测模型输出的待测文档的表格的关键点信息,最后朝向确定模块503基于待测文档的表格的关键点信息确定待测文档的朝向。由此,本申请的实施例通过已训练的关键点检测模型,对待测文档的表格的关键点进行检测得到关键点信息,由关键点信息确定整个文档的朝向,定位准确,可以准确、高效地检测文档朝向。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图6所示,是根据本申请实施例的确定文档朝向的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线605互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。
存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的确定文档朝向的方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的确定文档朝向的方法。
存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的确定文档朝向的方法对应的程序指令/模块(例如,附图5所示的图像获取模块501、信息获取模块502和朝向确定模块503)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的确定文档朝向的方法。
存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据用于确定传输路径的方法的电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至确定文档朝向的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
确定文档朝向的方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线605或者其他方式连接,图6中以通过总线605连接为例。
输入装置603可接收输入的数字或字符信息,以及产生与用于确定传输路径的方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (18)
1.一种确定文档朝向的方法,所述方法包括:
获取包括表格的待测文档的图像;
将所述待测文档的图像输入已训练的关键点检测模型,获得所述关键点检测模型输出的待测文档的表格的关键点信息,其中,所述关键点信息表征所述待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置;
基于所述待测文档的表格的关键点信息,确定所述待测文档的朝向。
2.根据权利要求1所述的方法,其中,所述基于所述待测文档的表格的关键点信息,确定所述待测文档的朝向,包括:
将所述预设关键点组合为至少一个点对,基于所述关键点信息确定所述至少一个点对的位置信息;
基于所述至少一个点对的位置信息,确定所述待测文档的朝向。
3.根据权利要求2所述的方法,其中,所述关键点信息包括:所述预设关键点的位置坐标和所述位置坐标的置信度;以及
所述基于所述关键点信息确定所述至少一个点对的位置信息,包括:
由各所述点对中的两个预设关键点的位置坐标及对应的置信度,分别确定各所述点对的位置坐标及对应的置信度;
所述基于所述至少一个点对的位置信息,确定所述待测文档的朝向,包括:
根据各所述点对的位置坐标的置信度的排序以及各所述点对的位置坐标,确定所述待测文档的朝向。
4.根据权利要求3所述的方法,其中,所述根据各所述点对的位置坐标的置信度的排序以及各所述点对的位置坐标,确定所述待测文档的朝向,包括:
将各点对的位置坐标的置信度进行排序,根据置信度最高的点对中的两个预设关键点的连线与所述待测文档的朝向之间的预设对应关系确定所述待测文档的朝向。
5.根据权利要求3所述的方法,其中,所述根据各所述点对的位置坐标的置信度的排序以及各所述点对的位置坐标,确定所述待测文档的朝向,包括:
将所有点对的位置坐标的置信度由大到小进行排序,获取排序前预设位的点对,构成点对集合;
基于所述点对集合中的每个点对的位置坐标分别对待测文档的朝向进行计算,得到与各点对一一对应的至少一个候选朝向;
确定各所述候选朝向的方向角,计算各所述候选朝向的方向角的平均值,并将各所述候选朝向的方向角的平均值表征的方向作为所述待测文档的朝向。
6.根据权利要求2所述的方法,其中,所述关键点信息包括:所述预设关键点的位置坐标;以及
所述基于所述关键点信息确定所述至少一个点对的位置信息,包括:
基于各所述点对中的两个预设关键点的位置坐标,分别确定各所述点对的位置坐标;
所述基于所述至少一个点对的位置信息,确定所述待测文档的朝向,包括:
将所述至少一个点对的位置坐标输入预先训练的文档朝向预测模型,得到所述朝向预测模型输出的所述待测文档的朝向;
其中,所述朝向预测模型通过获取多个包含表格的样本文档中的预设关键点的位置信息,结合样本文档的朝向标注信息训练得到。
7.根据权利要求1-6之一所述的方法,其中,所述至少两个与文档朝向关联的预设关键点包括:所述待测文档中的表格的四个顶点中的至少两个。
8.根据权利要求7所述的方法,其中,所述至少两个与文档朝向关联的预设关键点还包括:
表征所述待测文档中的表格的标题的两端的至少两个端点。
9.一种确定文档朝向的装置,所述装置包括:
图像获取模块,被配置成获取包括表格的待测文档的图像;
信息获取模块,被配置成将所述待测文档的图像输入已训练的关键点检测模型,获得所述关键点检测模型输出的待测文档的表格的关键点信息,其中,所述关键点信息表征所述待测文档中的表格的至少两个与文档朝向关联的预设关键点的位置;
朝向确定模块,被配置成基于所述待测文档的表格的关键点信息,确定所述待测文档的朝向。
10.根据权利要求9所述的装置,其中,所述朝向确定模块还包括:
点对组合子模块,被配置成将所述预设关键点组合为至少一个点对,基于所述关键点信息确定所述至少一个点对的位置信息;
朝向确定子模块,被配置成基于所述至少一个点对的位置信息,确定所述待测文档的朝向。
11.根据权利要求10所述的装置,其中,所述关键点信息包括:所述预设关键点的位置坐标和所述位置坐标的置信度;
所述点对组合子模块包括:
位置确定单元,被配置成由各所述点对中的两个预设关键点的位置坐标及对应的置信度,分别确定各所述点对的位置坐标及对应的置信度;
所述朝向确定子模块包括:
朝向确定单元,被配置成根据各所述点对的位置坐标的置信度的排序以及各所述点对的位置坐标,确定所述待测文档的朝向。
12.根据权利要求11所述的装置,其中,所述朝向确定单元包括:
朝向确定子单元,被配置成将各点对的位置坐标的置信度进行排序,根据置信度最高的点对中的两个预设关键点的连线与所述待测文档的朝向之间的预设对应关系确定所述待测文档的朝向。
13.根据权利要求11所述的装置,其中,所述朝向确定单元包括:
集合构成子单元,被配置成将所有点对的位置坐标的置信度由大到小进行排序,获取排序前预设位的点对,构成点对集合;
朝向计算子单元,被配置成基于所述点对集合中的每个点对的位置坐标分别对待测文档的朝向进行计算,得到与各点对一一对应的至少一个候选朝向;
平均朝向计算子单元,被配置成确定各所述候选朝向的方向角,计算各所述候选朝向的方向角的平均值,并将各所述候选朝向的方向角的平均值表征的方向作为所述待测文档的朝向。
14.根据权利要求10所述的装置,其中,所述关键点信息包括:所述预设关键点的位置坐标;
所述点对组合子模块包括:
点对确定单元,被配置成基于各所述点对中的两个预设关键点的位置坐标,分别确定各所述点对的位置坐标;
所述朝向确定子模块包括:
朝向预测单元,被配置成将所述至少一个点对的位置坐标输入预先训练的文档朝向预测模型,得到所述朝向预测模型输出的所述待测文档的朝向;
其中,所述朝向预测模型通过获取多个包含表格的样本文档中的预设关键点的位置信息,结合样本文档的朝向标注信息训练得到。
15.根据权利要求9-14之一所述的装置,其中,所述至少两个与文档朝向关联的预设关键点包括:所述待测文档中的表格的四个顶点中的至少两个。
16.根据权利要求15所述的装置,其中,所述至少两个与文档朝向关联的预设关键点还包括:
表征所述待测文档中的表格的标题的两端的至少两个端点。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010377027.8A CN111582153B (zh) | 2020-05-07 | 2020-05-07 | 确定文档朝向的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010377027.8A CN111582153B (zh) | 2020-05-07 | 2020-05-07 | 确定文档朝向的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582153A true CN111582153A (zh) | 2020-08-25 |
CN111582153B CN111582153B (zh) | 2023-06-30 |
Family
ID=72116976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010377027.8A Active CN111582153B (zh) | 2020-05-07 | 2020-05-07 | 确定文档朝向的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582153B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985459A (zh) * | 2020-09-18 | 2020-11-24 | 北京百度网讯科技有限公司 | 表格图像校正方法、装置、电子设备和存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282413A (ja) * | 1996-04-16 | 1997-10-31 | Canon Inc | 文書方向獲得方法とその装置並びに文字認識方法とその装置 |
US6137905A (en) * | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
CN1584920A (zh) * | 2004-06-04 | 2005-02-23 | 北京大学计算机科学技术研究所 | 一种已知表格的版面自动定向和定位方法 |
CN102236789A (zh) * | 2010-04-26 | 2011-11-09 | 富士通株式会社 | 对表格图像进行校正的方法以及装置 |
CN104077562A (zh) * | 2014-05-22 | 2014-10-01 | 山东山大鸥玛软件有限公司 | 一种答卷的扫描方向判断方法 |
CN108876858A (zh) * | 2018-07-06 | 2018-11-23 | 北京字节跳动网络技术有限公司 | 用于处理图像的方法和装置 |
CN109447007A (zh) * | 2018-12-19 | 2019-03-08 | 天津瑟威兰斯科技有限公司 | 一种基于表格节点识别的表格结构补全算法 |
CN109815954A (zh) * | 2019-01-31 | 2019-05-28 | 科大讯飞股份有限公司 | 增值税发票图像的方向校正方法、装置、设备及存储介质 |
CN109858325A (zh) * | 2018-12-11 | 2019-06-07 | 科大讯飞股份有限公司 | 一种表格检测方法和装置 |
CN110210409A (zh) * | 2019-06-04 | 2019-09-06 | 南昌市微轲联信息技术有限公司 | 表格单据中表格框线检测方法及系统 |
CN110287854A (zh) * | 2019-06-20 | 2019-09-27 | 北京百度网讯科技有限公司 | 表格的提取方法、装置、计算机设备和存储介质 |
CN110674815A (zh) * | 2019-09-29 | 2020-01-10 | 四川长虹电器股份有限公司 | 基于深度学习关键点检测的发票图像畸变校正方法 |
-
2020
- 2020-05-07 CN CN202010377027.8A patent/CN111582153B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6137905A (en) * | 1995-08-31 | 2000-10-24 | Canon Kabushiki Kaisha | System for discriminating document orientation |
JPH09282413A (ja) * | 1996-04-16 | 1997-10-31 | Canon Inc | 文書方向獲得方法とその装置並びに文字認識方法とその装置 |
CN1584920A (zh) * | 2004-06-04 | 2005-02-23 | 北京大学计算机科学技术研究所 | 一种已知表格的版面自动定向和定位方法 |
CN102236789A (zh) * | 2010-04-26 | 2011-11-09 | 富士通株式会社 | 对表格图像进行校正的方法以及装置 |
CN104077562A (zh) * | 2014-05-22 | 2014-10-01 | 山东山大鸥玛软件有限公司 | 一种答卷的扫描方向判断方法 |
CN108876858A (zh) * | 2018-07-06 | 2018-11-23 | 北京字节跳动网络技术有限公司 | 用于处理图像的方法和装置 |
CN109858325A (zh) * | 2018-12-11 | 2019-06-07 | 科大讯飞股份有限公司 | 一种表格检测方法和装置 |
CN109447007A (zh) * | 2018-12-19 | 2019-03-08 | 天津瑟威兰斯科技有限公司 | 一种基于表格节点识别的表格结构补全算法 |
CN109815954A (zh) * | 2019-01-31 | 2019-05-28 | 科大讯飞股份有限公司 | 增值税发票图像的方向校正方法、装置、设备及存储介质 |
CN110210409A (zh) * | 2019-06-04 | 2019-09-06 | 南昌市微轲联信息技术有限公司 | 表格单据中表格框线检测方法及系统 |
CN110287854A (zh) * | 2019-06-20 | 2019-09-27 | 北京百度网讯科技有限公司 | 表格的提取方法、装置、计算机设备和存储介质 |
CN110674815A (zh) * | 2019-09-29 | 2020-01-10 | 四川长虹电器股份有限公司 | 基于深度学习关键点检测的发票图像畸变校正方法 |
Non-Patent Citations (4)
Title |
---|
IULIU KONYA 等: "Fast Seamless Skew and Orientation Detection in Document Images" * |
SHUBHAM PALIWAL 等: "TableNet: Deep Learning model for end-to-end Table detection and Tabular data extraction from Scanned Document Images" * |
杜金辉 等: "一种快速稳定的倾斜文档校正方法" * |
陈优广: "边界跟踪、区域填充及链码的应用研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985459A (zh) * | 2020-09-18 | 2020-11-24 | 北京百度网讯科技有限公司 | 表格图像校正方法、装置、电子设备和存储介质 |
CN111985459B (zh) * | 2020-09-18 | 2023-07-28 | 北京百度网讯科技有限公司 | 表格图像校正方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111582153B (zh) | 2023-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113963087B (zh) | 图像处理方法、图像处理模型训练方法、装置及存储介质 | |
CN111523468B (zh) | 人体关键点识别方法和装置 | |
US11816915B2 (en) | Human body three-dimensional key point detection method, model training method and related devices | |
CN110659600B (zh) | 物体检测方法、装置及设备 | |
CN111881908B (zh) | 目标检测模型的修正方法、检测方法、装置、设备及介质 | |
CN112287924A (zh) | 文本区域检测方法、装置、电子设备和计算机存储介质 | |
CN111860362A (zh) | 生成人脸图像校正模型及校正人脸图像的方法和装置 | |
CN111832396B (zh) | 文档布局的解析方法、装置、电子设备和存储介质 | |
CN112308051B (zh) | 文本框检测方法、装置、电子设备和计算机存储介质 | |
CN111275827B (zh) | 基于边缘的增强现实三维跟踪注册方法、装置和电子设备 | |
CN113177468A (zh) | 人体行为检测方法、装置、电子设备及存储介质 | |
CN113362314B (zh) | 医学图像识别方法、识别模型训练方法及装置 | |
US20210365448A1 (en) | Method for recommending chart, electronic device, and storage medium | |
CN113012200B (zh) | 一种运动物体的定位方法、装置、电子设备及存储介质 | |
CN111783639A (zh) | 图像检测方法、装置、电子设备及可读存储介质 | |
CN112241716B (zh) | 训练样本的生成方法和装置 | |
CN111582153B (zh) | 确定文档朝向的方法和装置 | |
CN111861991A (zh) | 计算图像清晰度的方法以及装置 | |
CN113269213A (zh) | 训练集的获取方法、装置及电子设备 | |
CN112150380B (zh) | 校正图像的方法、装置、电子设备和可读存储介质 | |
CN112488126A (zh) | 特征图处理方法、装置、设备以及存储介质 | |
CN111915642A (zh) | 图像样本的生成方法、装置、设备和可读存储介质 | |
CN112200190B (zh) | 兴趣点的位置确定方法、装置、电子设备和存储介质 | |
CN110738261A (zh) | 图像分类和模型训练方法、装置、电子设备及存储介质 | |
CN113947771B (zh) | 图像识别方法、装置、设备、存储介质以及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |