CN106940798A - 一种文字识别的修正方法以及终端 - Google Patents
一种文字识别的修正方法以及终端 Download PDFInfo
- Publication number
- CN106940798A CN106940798A CN201710135955.1A CN201710135955A CN106940798A CN 106940798 A CN106940798 A CN 106940798A CN 201710135955 A CN201710135955 A CN 201710135955A CN 106940798 A CN106940798 A CN 106940798A
- Authority
- CN
- China
- Prior art keywords
- word
- modified
- character
- character features
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/235—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on user input or interaction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Discrimination (AREA)
Abstract
本发明实施例公开了一种文字识别的修正方法以及终端,所述方法包括|:生成修正请求,修正请求包括待修正的文字,待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取在预存图片中与待修正的文字相对应的图像文字的文字特征;将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的图像文字的文字特征的相似度高于预设标准值;显示若干候选文字以供用户选择;若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换文字识别结果中的待修正的文字。本发明实施例通过上述方法可以减少用户的操作,提高修正的效率。
Description
技术领域
本发明涉及电子技术领域,尤其涉及一种文字识别的修正方法以及终端。
背景技术
光学字符识别技术简称为OCR(Optical Character Recognition)识别技术,是一种通过光学技术对文字进行识别的图像识别技术。光学字符识别技术现已被广泛地应用到自动识别技术研究的领域。例如建立网络图书馆时,将纸质书籍扫描后以文件的形式存入电子识别,再通过OCR文字识别后以文本文件的形式展示。由于OCR识别时经常出现识别错误的情况,尤其识别相似的文字时出现识别混淆的情况,且识别出错后,一般是依靠用户手动编辑修改,即用户在键盘中输入正确的文字,但是该修正方式需要用户繁琐的操作,而导致修正的效率低。
发明内容
本发明实施例提供一种文字识别的修正方法以及终端,可以减少用户的操作,提高修正的效率。
第一方面,本发明实施例提供了一种文字识别的修正方法,方法包括:
生成修正请求,修正请求包括待修正的文字,待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取在预存图片中与待修正的文字相对应的图像文字的文字特征;将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的图像文字的文字特征的相似度高于预设标准值;显示若干候选文字以供用户选择;若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
另一方面,本发明实施例提供了一种终端,终端包括:导出单元、获取单元、对比单元、显示单元以及替换单元。
其中,导出单元用于生成修正请求,修正请求包括待修正的文字,待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;获取单元用于获取在预存图片中与待修正的文字相对应的图像文字的文字特征;对比单元用于将图像文字的文字特征与预存文字的文字特征进行对比来获取预存文字中的若干候选文字,若干候选文字的文字特征与相对应的图像文字的文字特征的相似度高于预存文字中剩余文字与相对应的图像文字的文字特征的相似度;显示单元用于显示若干候选文字,以供用户选择;替换单元用于若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
本发明实施例所公开的一种文字识别的修正方法,通过修正请求获取到待修正的文字,再获取在预存图片中与待修正的文字相对应的图像文字的文字特征;并将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字;显示若干候选文字以供用户选择;再将被用户选择的候选文字替换所述文字识别结果中的待修正的文字。由于将显示候选文字供用户选择,因此用户不再需要键盘输入修正文字,减少了用户的修正操作,提高修正效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种文字识别的修正方法的示意流程图;
图2a是本发明实施例提供的当前屏幕的第一种显示界面;
图2b是本发明实施例提供的当前屏幕的第二种显示界面;
图3a是本发明实施例提供的当前屏幕的第三种显示界面;
图3b是本发明实施例提供的当前屏幕的第四种显示界面;
图4是图1中的子流程的示意流程图;
图5是本发明实施例提供的一种终端的第一实施例的示意性框图;
图6是本发明实施例提供的图5中一种对比单元的示意性框图;
图7是本发明实施例提供的一种终端的第二实施例的示意性框图;
图8是本发明实施例提供的一种终端的第三实施例的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或若干个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
本发明实施例提供的一种文字识别的修正方法运行于终端,终端包括但是不限制于任何一款可以与用户进行人机交互的电子设备,例如智能手机(如Android手机、ios手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备等。以上电子设备仅是举例,而非穷举,本发明实施例提供的终端包括但是不限制于上述电子设备。但是需要说明的本发明实施例提供的终端具有光学字符识别(Optical CharacterRecognition)功能,可以进行OCR识别。
基于ORC识别技术进行识别时常常出现差错的原因,本发明实施例提供的一种文字识别的修正方法,可以修正ORC文字识别后的文字识别结果中的错误,减少用户修正操作,提高修正效率。
请参看图1,是本发明实施例提供的一种文字识别的修正方法的示意流程图,如图所示,该方法包括S101~S105:
S101,生成修正请求,修正请求包括待修正的文字。
具体的,文字可以是汉字、字母或者数字,本发明对此不进行具体的限定。待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成文字识别结果。即首先利用了OCR识别技术识别了预存图片上的图像文字而生成了文字识别结果并将文字识别结果显示于屏幕上,再从文字识别结果中选择待修正的文字而生成修正请求,选择待修正的文字的方式不限于根据用户操作进行选择或者自动选择的方式。
S102,获取在预存图片中与待修正的文字相对应的图像文字的文字特征。
具体的,由于待修正的文字选自于OCR识别预存图片的文字识别结果,而文字识别结果是与预存图片中的图像文字一一对应,因此预存图片中存在与待修正的文字相对应的图像文字。例如待修正的文字是“惊弓1鸟”,则相对应的图像文字是“惊弓之鸟”的图像文字。
需要说明的是,文字的文字特征是OCR识别技术中的识别因子,文字特征包括但不限于笔画特征,笔画特征包括但不限于笔画的规则、笔画的相对位置以及笔画的区域分布等因子。
还需要说明的是,获取的待修正文字可以是单个文字或者词组。若待修正的文字是单个文字,可以获取单个文字对应的图像文字的文字特征;若待修正的文字是词组,则获取词组对应的图像文字中每个文字的文字特征。
S103,将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值。
具体的,由于OCR识别技术是根据文字的文字特征来识别文字。因此将获取的图像文字的文字特征和预存文字的文字特征可以查找出候选文字。候选文字应当理解为预存文字中与获取的图像文字较相似的文字,即文字特征的相似度高于预设标准值的预存文字。例如图像文字为“之”时,候选的文字为“1”、“I”以及“i”等。
应当理解,若待修正的文字是单个文字,则获取的若干候选文字为单个文字;若待修正带文字是词组,则获取的若干候选文字为词组。
S104,显示若干候选文字以供用户选择。
S105,若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
需要说明的是,如图2a所示,本实施例中优选将当前屏幕包括第一显示区域31和第二显示区域32,第一显示区域31用于显示文字识别结果,第二显示区域32用于显示候选文字。
具体的,请看图2a和图2b,如图所示,图2a中待修正的文字是“惊弓1鸟”时,显示若干候选文字为“惊弓1鸟”“惊弓i鸟”“惊弓之鸟”。图2b所示为用户选择了候选文字中的“惊弓之鸟”后,将第一显示区域31中文字识别结果中的“惊弓1鸟”替换为“惊弓之鸟”。
应当理解,文字识别结果虽然是利用OCR识别技术识别出来的且是OCR识别出与图像文字相似度最高的文字,但是由于存在字体不同或者不同用户的字迹不同等原因,因此OCR识别出的相似度最高的文字不一定是正确文字,进而导致OCR识别错误。本发明实施例提供的一种文字识别的修正方法通过获取待修正文字对应的图像文字的文字特征,并将获取的图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字以供用户选择,而候选文字是与图像文字较相似的,进而用户进行修正时,只需要从候选文字中选择正确的候选文字即可实现修订,用户不需要在键盘中输入正确的词语即可实现修正,减少了OCR文字识别的修正操作,提高修正效率。一方面,本发明实施例可以提供用户的选择操作选择待修正的文字而生成修正请求;另一方面,本发明实施例还可以自动选择待修正的文字而生成修正请求,可以有效地提高修正效率。
优选地,S101,生成修正请求,包括:
检测是否存在用户从文字识别结果中选择文字的操作,若存在选择文字的操作,生成修正请求,修正请求包括被选择的文字,被选择的文字为待修正的文字;若不存在选择文字的操作,不生成修正请求,流程结束。
具体的,选择文字的操作可以是用户在触摸屏幕点击或者双击或者滑动选择文字或者用户利用鼠标等物理按键选择文字。如图3a和图3b所示,图3a所示为OCR识别预存图片后生成的文字识别结果,并显示在触摸屏幕上。图3b所示为用户在触摸屏幕上点击“惊弓1鸟”为待修正的文字而生成修正请求。
需要说明的是,在另一些实施例中,S101,生成修正请求,包括:
检测文字识别结果中是否有预设的文字,预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;
若有预设的文字,生成修正请求,所述修正请求包括预设的文字,预设的文字为待修正的文字;若没有预设的文字,不生成修正请求,流程结束。
具体的,预设的文字视为OCR识别时出错频率高的文字,本实施例中优选特定值是经过若干数据样本计算得出。例如将“1”“i”“之”等设置为预设的文字,当检测到文字识别结果中存在预设的文字,则自动生成修正请求。
同理,其他可行的实施例中,还可以通过检测是否有预设的文字来提示用户是否进行修订,若用户选择进行修正,则生成修正请求,预设的文字为待修正的文字。
优选地,本发明实施例提供的一种文字识别的修正方法还包括:
根据待修正的文字的笔画数量划分若干等级,不同的等级对应的预设标准值不同。
具体的,这是基于文字的复杂程度将会影响到OCR识别结果。例如笔画简单数量少的文字越加容易出现OCR识别错误的情况。因此本实施例中优选根据文字的笔画数量进行等级划分以便提高修正的准确率。例如笔画数量少的等级对应的预设标准值低于笔画数量多的等级对应的预设标准值,进而保证笔画数量少的文字可以候选文字增加。
因此,S103将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字之前,上述一种文字识别的修正方法还包括:
识别待修正的文字的笔画数量;以及根据笔画数量获取相对应预设标准值。
需要说明的是,若待修正的文字是单个文字或者词组时,S103中将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字的方式将有所不同。
具体的,若待修正的文字是单个文字,则获取候选文字时将图像文字的文字特征与预存文字的文字特征进行对比来获取相似度高于预设标准值的预存文字,相似度高于预设标准值的预存文字为候选文字。
若待修正的文字是词组,请看图4,本实施例中优选S103中将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,包括:
S401,将待修正的文字中每个文字对应的图像文字的文字特征分别与预存文字的文字特征进行对比来获取每个文字对应的候选文字。
例如若修正的文字是“惊弓1鸟”,则将其中“惊弓1鸟”每个文字对应的图像文字“惊”、“弓”、“之”、“鸟”的文字特征分别与预存的文字的文字特征进行对比来获取每个文字对应的候选文字。本实施例中优选获取的候选文字是与相对应的图像文字的文字特征的相似度高于相似度预设值的预存文字。其中相似度预设值可以与预设标准值相同,相似度预设值还可以与预设标准值不同。
S402,根据待修正的文字中每个文字对应的候选文字进行组合以形成若干词组。
应当理解,根据排列组合的规则,若每个文字对应的候选文字的数量越多,获得的候选文字的组合也将越多。
S403,获取若干词组中每个文字与相对应的图像文字的文字特征的相似度。
例如将候选文字组合后有6个词组,则计算出6个词组中每个词组中的每个文字与相对应的图像文字的文字特征的相似度。
S404,计算出若干词组中每个词组的相似度,每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值。
具体的,若1个词组中有4个文字,则计算出这4个文字分别与相对应的图像文字的文字特征的相似度的平均值,该平均值为该1个词组的相似度。
S405,将若干词组中词组的相似度高于预设标准值的词组设置为候选文字。
从上述所知,该方式中若待修正的文字是词组,则将词组进行拆分识别,再进行组合,该方式可以更加全面地获取到候选文字,进而提高修正的准确率。在其他可行的实施例中,若待修正的文字是词组,则直接将词组作为一个整体进行识别来获取候选文字,即直接将词组方式的候选文字的文字特征与相对应的词组方式的图像文字的文字特征进行对比。
请参看图5,本发明实施例提供的一种终端的第一实施例的示意性框图,如图所示,该终端50包括导出单元501、获取单元502、对比单元503、显示单元504和替换单元505。
其中,导出单元501,用于生成修正请求,修正请求包括待修正的文字。
具体的,文字可以是汉字、字母或者数字。待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成文字识别结果。
获取单元502,用于获取在预存图片中与待修正的文字相对应的图像文字的文字特征。
具体的,由于待修正的文字选自于OCR识别预存图片的文字识别结果,而文字识别结果是与预存图片中的图像文字一一对应,因此预存图片中存在与待修正的文字相对应的图像文字。文字的文字特征是OCR识别技术中的识别因子,文字的文字特征包括笔画的规则、笔画的相对位置以及笔画的区域分布等因子。
还需要说明的是,获取的待修正文字可以是单个文字或者词组。若待修正的文字是单个文字,可以获取单个文字对应的图像文字的文字特征;若待修正的文字是词组,则获取词组对应的图像文字中每个文字的文字特征。
对比单元503,用于将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值。
具体的,由于OCR识别技术是根据文字的文字特征来识别文字。因此将获取的图像文字的文字特征和预存文字的文字特征可以查找出候选文字。候选文字应当理解为预存文字中与获取的图像文字较相似的文字,即文字特征的相似度高于预设标准值的预存文字。应当理解,若待修正的文字是单个文字,则获取的若干候选文字为单个文字;若待修正带文字是词组,则获取的若干候选文字为词组。
显示单元504,用于显示若干候选文字以供用户选择。
替换单元505,用于若检测到用户从若干候选文字中选择了候选文字,将被选择候选文字替换所述文字识别结果中的待修正的文字。
需要说明的是,如图2a所示,本实施例中优选将当前屏幕划分为第一显示区域和第二显示区域,第一显示区域用于显示文字识别结果,第二显示区域用于显示候选文字。
优选地,本发明实施例提供的一种终端50还包括:划分单元508、鉴定单元509以及收获单元510。
划分单元508,用于根据待修正的文字的笔画数量划分若干等级,不同的等级对应的预设标准值不同。
具体的,这是基于文字的复杂程度将会影响到OCR识别结果。例如笔画简单数量少的文字越加容易出现OCR识别错误的情况。因此本实施例中优选根据文字的笔画数量进行等级划分以便提高修正的准确率。例如笔画数量少的等级对应的预设标准值低于笔画数量多的等级对应的预设标准值,进而保证笔画数量少的文字可以候选文字增加。
因此,对比单元503将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字之前,鉴定单元509,用于识别所述待修正的文字的笔画数量;收获单元510,用于根据笔画数量获取相对应的预设标准值。
需要说明的是,若待修正的文字是单个文字或者词组时,对比单元503将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字的方式将有所不同。
具体的,若待修正的文字是单个文字,则获取候选文字时将图像文字的文字特征与预存文字的文字特征进行对比来获取相似度高于预设标准值的预存文字,相似度高于预设标准值的预存文字为候选文字。
若待修正的文字是词组,请看图6,本实施例中优选对比单元503包括:鉴别单元601、组合单元602、收取单元603、计算单元604以及设置单元605。
鉴别单元601,用于将待修正的文字中每个文字对应的图像文字的文字特征分别与预存文字的文字特征进行对比来获取每个文字对应的候选文字。
例如若修正的文字是“惊弓1鸟”,则将其中“惊弓1鸟”每个文字对应的图像文字“惊”、“弓”、“之”、“鸟”的文字特征分别与预存的文字的文字特征进行对比来获取每个文字对应的候选文字。本实施例中优选获取的候选文字是与相对应的图像文字的文字特征的相似度高于相似度预设值的预存文字。其中相似度预设值可以与预设标准值相,相似度预设值还可以与预设标准值不同。
组合单元602,用于根据待修正的文字中每个文字对应的候选文字进行组合以形成若干词组。
应当理解,根据排列组合的规则,若每个文字对应的候选文字的数量越多,获得的候选文字的组合也将越多。
收取单元603,用于获取若干词组中每个文字与相对应的图像文字的文字特征的相似度。
例如将候选文字组合后有6个词组,则计算出6个词组中每个词组中的每个文字与相对应的图像文字的文字特征的相似度。
计算单元604,用于计算出若干词组中每个词组的相似度,每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值。
具体的,若1个词组中有4个文字,则计算出这4个文字分别与相对应的图像文字的文字特征的相似度的平均值,该平均值为该1个词组的相似度。
设置单元605,用于将若干词组中词组的相似度高于预设标准值的词组设置为候选文字。
请继续看图5,优选地,导出单元501包括:第一检测单元506和第一生成单元507。
第一检测单元506,用于检测是否存在用户从文字识别结果中选择文字的操作,第一生成单元507,用于若存在选择文字的操作,生成修正请求,修正请求包括被选择的文字,被选择的文字为待修正的文字;若不存在选择文字的操作,不生成修正请求,流程结束。
具体的,选择文字的操作可以是用户在触摸屏幕点击或者双击或者滑动选择文字或者用户利用鼠标等物理按键选择文字。
在另一些实施例中,请看图7,图7是本发明实施例提供的一种终端的第二实施例的示意性框图。本实施例中终端70包括导出单元701、获取单元702。对比单元703、显示单元704、替换单元705、划分单元708、鉴定单元709以及收获单元710,具体请参照第一实施例中的终端的相对应描述,本实施例中将不再赘述。但需要说明的是,本实施例中,导出单元701包括:第二检测单元706和第二生成单元707。
其中,第二检测单元706,用于检测文字识别结果中是否有预设的文字,预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;
第二生成单元707,用于若有预设的文字,生成修正请求,所述修正请求包括预设的文字,预设的文字为待修正的文字;若没有预设的文字,不生成修正请求,流程结束。
具体的,预设的文字视为OCR识别时出错频率高的文字,本实施例中优选特定值是经过若干数据样本计算得出。同理,其他可行的实施例中,还可以通过第二检测单元706检测是否有预设的文字来提示用户是否进行修订,若用户选择进行修正,则生成修正请求,预设的文字为待修正的文字。
参见图8,是本发明实施例提供的一种终端的第三实施例的示意框图。如图所示的本实施例中的终端可以包括一个或者若干个处理器801、一个或者若干个输入装置802、一个或者若干个输出装置803以及存储器804。上述处理器801、输入装置802、输出装置803以及存储器804通过总线连接。
输入装置802用于接收用户操作输入的信息。具体实现中,本发明实施例的输入装置802可包括键盘、鼠标、光电输入装置、声音输入装置、触摸式输入装置、扫描仪等。
输出装置803用于对外输出信息给用户。具体实现中,本发明实施例的输出装置803可包括显示器、扬声器、打印机等。
存储器804用于存储带有各种功能的程序数据,具体实现中,本发明实施例的存储器804可以是系统存储器,比如,挥发性的(诸如RAM),非易失性的(诸如ROM,闪存等),或者两者的结合。具体实现中,本发明实施例的存储器204还可以是系统之外的外部存储器,比如,磁盘、光盘、磁带等。
处理器801用于调用存储器804中存储的程序数据即执行存储器804存储的指令,并执行如下操作:
生成修正请求,修正请求包括待修正的文字;获取在预存图片中与待修正的文字相对应的图像文字的文字特征;将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值;显示若干候选文字以供用户选择;若检测到用户从若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
生成修正请求时,处理器801还执行如下操作:
检测是否存在用户从文字识别结果中选择文字的操作,若存在选择文字的操作,生成修正请求,修正请求包括被选择的文字,被选择的文字为待修正的文字;若不存在选择文字的操作,不生成修正请求。
在另一些实施例中,生成修正请求时,处理器801还执行如下操作:检测文字识别结果中是否有预设的文字,预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;若有预设的文字,生成修正请求,所述修正请求包括预设的文字,预设的文字为待修正的文字;若没有预设的文字,不生成修正请求。
处理器801还执行如下操作:根据待修正的文字的笔画数量划分若干等级,不同的等级对应的预设标准值不同。
因此,将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字之前,处理器801还执行如下操作:
识别所述待修正的文字的笔画数量;以及根据笔画数量获取相对应的所述预设标准值。
若待修正的文字是词组,处理器801将图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,包括:
将待修正的文字中每个文字对应的图像文字的文字特征分别与预存文字的文字特征进行对比来获取每个文字对应的候选文字;根据待修正的文字中每个文字对应的候选文字进行组合为若干词组;获取若干词组中每个文字与相对应的图像文字的文字特征的相似度;计算出若干词组中每个词组的相似度,每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值;以及将若干词组中词组的相似度高于预设标准值的词组设置候选文字。
应当理解,在本发明实施例中,所称处理器801可以是中央第一处理单元(CentralProcessing Unit,CPU),该处理器801还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
需要说明的是,本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如若干个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
另外,在本发明各个实施例中的各功能单元可以集成在一个第一处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种文字识别的修正方法,其特征在于,包括:
生成修正请求,所述修正请求包括待修正的文字,所述待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;
获取在所述预存图片中与所述待修正的文字相对应的图像文字的文字特征;
将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,所述若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预设标准值;
显示所述若干候选文字以供用户选择;
若检测到用户从所述若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
2.根据权利要求1所述方法,其特征在于,所述生成修正请求包括:
检测是否存在用户从所述文字识别结果中选择文字的操作;
若存在选择文字的操作,生成修正请求,所述修正请求包括被选择的文字,所述被选择的文字为所述待修正的文字。
3.根据权利要求1所述的方法,其特征在于,所述生成修正请求包括:
检测所述文字识别结果中是否有预设的文字,所述预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;
若有预设的文字,生成修正请求,所述修正请求包括所述预设的文字,所述预设的文字为所述待修正的文字。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据待修正文字的笔画数量划分若干等级,不同的等级对应的所述预设标准值不同;
将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字之前,所述方法还包括:
识别所述待修正的文字的笔画数量;
根据笔画数量获取相对应的所述预设标准值。
5.根据权利要求1所述的方法,其特征在于,若待修正的文字包括词组,所述将所述图像文字的文字特征与预存文字的文字特征进行对比来获取若干候选文字,包括:
将待修正的文字中每个文字对应的所述图像文字的文字特征分别与预存文字的文字特征进行对比来获取所述每个文字对应的候选文字;
根据所述待修正的文字中所述每个文字对应的候选文字进行组合以形成若干词组;
获取所述若干词组中每个文字与相对应的图像文字的文字特征的相似度;
计算出所述若干词组中每个词组的相似度,所述每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值;
将所述若干词组中词组的相似度高于预设标准值的词组设置为所述候选文字。
6.一种终端,其特征在于,所述终端包括:
导出单元,用于生成修正请求,所述修正请求包括待修正的文字,所述待修正的文字选自于利用光学字符识别技术识别预存图片上的图像文字而生成的文字识别结果;
获取单元,用于获取在所述预存图片中与所述待修正的文字相对应的图像文字的文字特征;
对比单元,用于将所述图像文字的文字特征与预存文字的文字特征进行对比来获取所述预存文字中的若干候选文字,所述若干候选文字的文字特征与相对应的所述图像文字的文字特征的相似度高于预存文字中剩余文字与相对应的所述图像文字的文字特征的相似度;
显示单元,用于显示所述若干候选文字,以供用户选择;
替换单元,用于若检测到用户从所述若干候选文字中选择了候选文字,将被选择的候选文字替换所述文字识别结果中的待修正的文字。
7.根据权利要求6所述的终端,其特征在于,所述导出单元包括:
所述第一检测单元,用于检测是否存在用户从所述文字识别结果中选择文字的操作;
所述第一生成单元,用于若存在选择文字的操作,生成修正请求,所述修正请求包括被选择的文字,所述被选择的文字为所述待修正的文字。
8.根据权利要求6所述的终端,其特征在于,所述导出单元包括:
第二检测单元,用于检测所述文字识别结果中是否有预设的文字,所述预设的文字是预先设置的基于光学字符识别时出错频率高于特定值的文字;
第二生成单元,用于若有预设的文字,生成修正请求,所述修正请求包括所述预设的文字,所述预设的文字为所述待修正的文字。
9.根据权利要求6所述的终端,其特征在于,所述终端还包括:
划分单元,用于根据待修正文字的笔画数量划分若干等级,不同的等级对应的所述预设标准值不同;
鉴定单元,用于识别所述待修正的文字的笔画数量;
收获单元,用于根据笔画数量获取相对应的所述预设标准值。
10.根据权利要求6所述的终端,其特征在于,若待修正的文字包括词组,所述对比单元包括:
鉴别单元,用于将待修正的文字中每个文字对应的所述图像文字的文字特征分别与预存文字的文字特征进行对比来获取所述每个文字对应的候选文字;
组合单元,用于根据所述待修正的文字中所述每个文字对应的候选文字进行组合以形成若干词组;
收取单元,用于获取所述若干词组中每个文字与相对应的图像文字的文字特征的相似度;
计算单元,用于计算出所述若干词组中每个词组的相似度,所述每个词组的相似度为获取的每个词组中每个文字与相对应的图像文字的文字特征的相似度的平均值;
设置单元,用于将所述若干词组中词组的相似度高于预设标准值的词组设置为所述候选文字。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710135955.1A CN106940798A (zh) | 2017-03-08 | 2017-03-08 | 一种文字识别的修正方法以及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710135955.1A CN106940798A (zh) | 2017-03-08 | 2017-03-08 | 一种文字识别的修正方法以及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106940798A true CN106940798A (zh) | 2017-07-11 |
Family
ID=59468950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710135955.1A Withdrawn CN106940798A (zh) | 2017-03-08 | 2017-03-08 | 一种文字识别的修正方法以及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106940798A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633250A (zh) * | 2017-09-11 | 2018-01-26 | 畅捷通信息技术股份有限公司 | 一种文字识别纠错方法、纠错系统及计算机装置 |
CN107728783A (zh) * | 2017-09-25 | 2018-02-23 | 联想(北京)有限公司 | 人工智能处理方法及其系统 |
CN109345451A (zh) * | 2017-09-27 | 2019-02-15 | 牛毅 | 一种实现图像汉字拼接成词的系统及移动终端 |
CN110276331A (zh) * | 2019-06-28 | 2019-09-24 | 四川长虹电器股份有限公司 | 人像识别结果的检查修正方法 |
CN110287910A (zh) * | 2019-06-28 | 2019-09-27 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN111260623A (zh) * | 2020-01-14 | 2020-06-09 | 广东小天才科技有限公司 | 图片评价方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211243A (zh) * | 2006-12-25 | 2008-07-02 | 卡西欧计算机株式会社 | 手写文字输入装置 |
CN101881999A (zh) * | 2010-06-21 | 2010-11-10 | 安阳师范学院 | 甲骨文视频输入系统及实现方法 |
CN101887519A (zh) * | 2010-08-16 | 2010-11-17 | 同方知网(北京)技术有限公司 | 文字识别、编改的方法 |
CN104461057A (zh) * | 2014-12-26 | 2015-03-25 | 安徽寰智信息科技股份有限公司 | 基于唇形图像识别的文字输入方法 |
CN106326888A (zh) * | 2016-08-16 | 2017-01-11 | 北京旷视科技有限公司 | 图像识别方法和装置 |
-
2017
- 2017-03-08 CN CN201710135955.1A patent/CN106940798A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101211243A (zh) * | 2006-12-25 | 2008-07-02 | 卡西欧计算机株式会社 | 手写文字输入装置 |
CN101881999A (zh) * | 2010-06-21 | 2010-11-10 | 安阳师范学院 | 甲骨文视频输入系统及实现方法 |
CN101887519A (zh) * | 2010-08-16 | 2010-11-17 | 同方知网(北京)技术有限公司 | 文字识别、编改的方法 |
CN104461057A (zh) * | 2014-12-26 | 2015-03-25 | 安徽寰智信息科技股份有限公司 | 基于唇形图像识别的文字输入方法 |
CN106326888A (zh) * | 2016-08-16 | 2017-01-11 | 北京旷视科技有限公司 | 图像识别方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107633250A (zh) * | 2017-09-11 | 2018-01-26 | 畅捷通信息技术股份有限公司 | 一种文字识别纠错方法、纠错系统及计算机装置 |
CN107633250B (zh) * | 2017-09-11 | 2023-04-18 | 畅捷通信息技术股份有限公司 | 一种文字识别纠错方法、纠错系统及计算机装置 |
CN107728783A (zh) * | 2017-09-25 | 2018-02-23 | 联想(北京)有限公司 | 人工智能处理方法及其系统 |
CN107728783B (zh) * | 2017-09-25 | 2021-05-18 | 联想(北京)有限公司 | 人工智能处理方法及其系统 |
CN109345451A (zh) * | 2017-09-27 | 2019-02-15 | 牛毅 | 一种实现图像汉字拼接成词的系统及移动终端 |
CN110276331A (zh) * | 2019-06-28 | 2019-09-24 | 四川长虹电器股份有限公司 | 人像识别结果的检查修正方法 |
CN110287910A (zh) * | 2019-06-28 | 2019-09-27 | 北京百度网讯科技有限公司 | 用于获取信息的方法及装置 |
CN111260623A (zh) * | 2020-01-14 | 2020-06-09 | 广东小天才科技有限公司 | 图片评价方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106940798A (zh) | 一种文字识别的修正方法以及终端 | |
US11176141B2 (en) | Preserving emotion of user input | |
US10838592B2 (en) | Terminal and method for determining type of input method editor | |
CN102725729B (zh) | 对于标准验证从图形界面分析对象 | |
CN107679032A (zh) | 语音转换纠错方法和装置 | |
WO2016095689A1 (zh) | 基于终端界面多次触控操作进行识别搜索的方法及系统 | |
WO2019024692A1 (zh) | 语音输入方法、装置、计算机设备和存储介质 | |
US9524428B2 (en) | Automated handwriting input for entry fields | |
CN103324674A (zh) | 网页内容选取方法及装置 | |
CN104423800A (zh) | 电子设备以及执行其应用程序的方法 | |
EP3166012A1 (en) | Audio input of field entries | |
US20130219257A1 (en) | Textual and formatted data presentation | |
US9460067B2 (en) | Automatic sentence punctuation | |
CN105678141A (zh) | 信息展示方法、信息展示装置及终端 | |
US20150002484A1 (en) | Stylus lexicon sharing | |
US20170083499A1 (en) | Identifying and modifying specific user input | |
CN104424944A (zh) | 一种信息处理方法及电子设备 | |
CN106911971A (zh) | 一种视频字幕处理方法及电子设备 | |
CN106228047A (zh) | 一种应用程序图标处理方法及终端设备 | |
CN114241471B (zh) | 视频文本识别方法、装置、电子设备及可读存储介质 | |
CN105094562A (zh) | 一种信息处理方法及终端 | |
CN108052212A (zh) | 一种输入文字的方法、终端及计算机可读介质 | |
US10592096B2 (en) | Cursor indicator for overlay input applications | |
US10032071B2 (en) | Candidate handwriting words using optical character recognition and spell check | |
CN105426823A (zh) | 指纹识别方法、装置以及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20170711 |