CN114330332A - 表单数据的处理方法、装置、电子设备及存储介质 - Google Patents
表单数据的处理方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114330332A CN114330332A CN202111626728.1A CN202111626728A CN114330332A CN 114330332 A CN114330332 A CN 114330332A CN 202111626728 A CN202111626728 A CN 202111626728A CN 114330332 A CN114330332 A CN 114330332A
- Authority
- CN
- China
- Prior art keywords
- character
- recognized
- characters
- illegal
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims description 17
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013500 data storage Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Abstract
本发明实施例公开了一种表单数据的处理方法、装置、电子设备及存储介质,其中,该方法包括:当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。本发明实施例的技术方案达到了对数据存储本身即是错误的乱码等非法字符的有效识别和提示的技术效果。
Description
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种表单数据的处理方法、装置、电子设备及存储介质。
背景技术
随着信息技术的发展,计算机处理的数据量也不断发展,越来越多的数据需要数字化的存储与处理,在大数据量存储的应用系统中,由于历史问题、系统升级、伴随系统重构进行的数据移植、主机系统下移开放进行的数据迁移等原因,数据难免造成转码错误、数据丢失出现乱码等非法字符,非法字符会导致数据校验、报文非法等一系列业务及系统问题,现在,对于数据中乱码等非法字符的检测的需求也越发强烈。
目前识别数据中乱码的技术方案主要是通过转换编码格式来实现的,无法识别数据存储本身即是错误的乱码等非法字符,导致数据中含有非法字符,进而影响系统运行或造成其他损失。
发明内容
本发明实施例提供了一种表单数据的处理方法、装置、电子设备及存储介质,以实现对数据存储本身即是错误的乱码等非法字符的有效识别和提示的技术效果。
第一方面,本发明实施例提供了一种表单数据的处理方法,该方法包括:
当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;
针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;
如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
第二方面,本发明实施例还提供了一种表单数据的处理装置,该表单数据的处理装置包括:
表单数据获取模块,用于当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;
非法字符识别模块,用于针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;
表单信息提示模块,用于如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的表单数据的处理方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的表单数据的处理方法。
本发明实施例的技术方案,通过获取目标表单的目标表单数据,确定目标表单数据中的待识别字符,并根据预先设置的至少一个字符标准存储长度对待识别字符进行字符识别,来确定所述待识别字符是否为非法字符,解决了目标表单中可能出现非法字符的技术问题,特别是解决了对通过转换编码格式也无法正常显示的非法字符的识别,达到了对数据存储本身即是错误的乱码等非法字符的有效识别和提示的技术效果。
附图说明
为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
图1为本发明实施例一所提供的一种表单数据的处理方法的流程示意图;
图2为本发明实施例二所提供的一种表单数据的处理方法的流程示意图;
图3为本发明实施例二所提供的一种表单数据的处理方法的流程示意图;
图4为本发明实施例三提供的一种表单数据的处理装置的结构示意图;
图5为本发明实施例四所提供的一种电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
为便于理解,在介绍本发明实施例之前,先对本发明是私立提供的表单数据的处理方法的应用场景进行说明。为了保证表单数据的正确性,在表单提交之前可以先对表单数据进行乱码识别,即,识别表单数据中是否含有非法字符。相关技术处理的乱码的方式通常包含以下几种:在非英文环境下采用每一个字节就是一个字符的方式转换;非UNICODE程序在不同语言环境间移植时的乱码;网页端编码与服务端编码不同造成的乱码。这些乱码的共通点就是数据本身存储是正确的,只需要转换编码格式即可解决。然而,本发明实施例表单数据的处理方法旨在对数据存储错误的乱码等非法字符进行识别。
实施例一
图1为本发明实施例一所提供的一种表单数据的处理方法的流程示意图,本实施例可适用于识别表单中是否出现非法字符的情况,该方法可以由表单数据的处理装置来执行,该装置可以通过软件和/或硬件来实现,可配置于终端和/或服务器中来实现本发明实施例中的表单数据的处理方法。
如图1所示,本实施例的方法具体可包括:
S110、当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符。
其中,所述目标表单可以为数字化的存储在存储介质上的电子表格数据,例如目标表单可以用于在网页上采集数据,例如还可以利用表单进行数据存储。
其中,所述表单提交请求可以为提交目标表单的请求,例如在目标表单内数据输入完成时,可以提交此表单,完成表单内数据的传输。
其中,所述目标表单数据可以为目标表单内的数据,例如目标表单数据可以为字符数据、数值数据或复杂数据等数据类型。
其中,所述字符可以为计算机或无线电通信中使用的电子化的符号,用来表示一定的含义,例如汉字字符,可以表示人们使用的汉字,通过字符的使用,方便了计算机等设备的数据存储、传输与处理;本发明实施例就是识别字符是否为非法字符,从而避免非法字符的引入造成数据混乱从而造成不必要的损失;所述待识别字符可以为本发明实施例所要检测的字符,通过对待识别字符的检测,确定待识别字符是否为非法字符。
S120、针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符。
其中,所述字符标准存储长度可以为标准字符在存储介质上的存储空间大小,例如ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)里的字符在存储介质上占用8位即1个字节存储空间,标准字符可以为本发明实施例中的合法字符。
其中,所述根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,可以为根据预先设置的至少一个字符标准存储长度与所述待识别字符的存储长度进行比较,来识别字符,例如所述待识别字符的字符存储长度与预先设置的至少一个字符标准存储长度都不相同,则认为所述待识别字符为非法字符,例如待识别字符为“a”,其存储长度为1位,预先设置的至少一个字符标准存储长度为1位和4位,待识别字符的存储长度与预先设置的至少一个字符存储长度相同,则确定所述待识别字符不为非法字符,若待识别字符的字符存储长度为3位,待识别字符的字符存储长度与预先设置的至少一个字符存储长度都不相同,则确定所述待识别字符为非法字符;也可以在所述待识别字符的字符存储长度与预先设置的至少一个字符标准存储长度相同的情况下,继续确定待识别字符是否属于预设字符,来识别字符,例如待识别字符为“θ”,其字符存储长度为1位,预先设置的至少一个字符标准存储长度为1位和4位,待识别字符的存储长度与预先设置的至少一个字符存储长度相同,继续判断待识别字符是否属于特定字符,如果“θ”不属于预设字符,则判断待识别字符为非法字符。
可选的,在本发明实施例中任一可选技术方案的基础上,所述根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述目标表单数据中是否存在非法字符,包括:
计算所述待识别字符的字符实际存储长度,并将所述字符实际存储长度与预先设置的字符标准存储长度进行比对;
如果所述字符实际存储长度不等于预先设置的任意一个字符标准存储长度,则将所述待识别字符确定为非法字符。
其中,所述字符实际存储长度为待识别字符在存储介质上的存储空间大小,例如ASCII里的字符在存储介质上占用8位即1个字节存储空间。
其中,所述如果所述字符实际存储长度不等于预先设置的任意一个字符标准存储长度,则将所述待识别字符确定为非法字符,可以理解为用待识别字符的实际存储长度与预先设置的字符标准存储长度进行对比,如果都不相等,则将所述待识别字符确定为非法字符,例如待识别字符的字符实际存储长度为3位,预先设置的至少一个字符标准存储长度为1位和4位,待识别字符的存储长度与预先设置的至少一个字符存储长度都不相同,则确定所述待识别字符为非法字符。
S130、如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
其中,所述表单提示信息可以为能够提示表单中含有非法字符的提示信息,例如可以通过文字、图像和/或符号等方式表示提示信息。
其中,所述如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息,可以理解为,若检测到目标表单数据中存在非法字符,则生成表单提示信息,表单提示信息可以根据所述非法字符所属目标表单单元格的位置生成,也可以继续精确定位非法字符在目标表单数据的精确位置,例如非法字符在目标表单数据的第几个字符位置处,提示信息也可以包含非法字符本身的形态,以利于纠正,提示信息可以包含合法字符的设定规则,帮助用户更正非法字符,并展示所述表单提示信息,例如可以通过提示窗提示所述表单提示信息,也可以通过突出非法字符的显示来展示表单提示信息,本发明实施例对此不作限制。
可选的,在本发明实施例中任一可选技术方案的基础上,所述基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息,包括:
确定所述非法字符的位置信息,根据所述位置信息生成位置提示信息,并将所述非法字符进行突出显示。
其中,所述位置信息可以为能够确定非法字符在目标表单中所处位置的信息,例如位置信息可以为非法字符在目标表单的哪个单元格中,也可以更加精确到目标表单单元格中所处的是地几个字符处。
其中,所述确定所述非法字符的位置信息,根据所述位置信息生成位置提示信息,并将所述非法字符进行突出显示,可以理解为定位非法字符在目标表单的位置,根据非法字符在目标表单的位置信息生成位置提示信息,并将所述位置提示信息进行展示,可以通过文字、符号和/或图像等方式展示,例如将所述非法字符进行突出显示,所述突出显示可以为在非法字符上用不同的底色进行标记,也可以改变非法字符的颜色或者线条指示非法字符的位置,本发明实施例对此不作限制。
可选的,在本发明实施例中任一可选技术方案的基础上,所述表单数据的处理方法,还包括:
如果所述目标表单数据中不存在非法字符,则响应于所述表单提交请求,将所述目标表单进行提交。
其中,所述如果所述目标表单数据中不存在非法字符,则响应于所述表单提交请求,将所述目标表单进行提交,可以理解为若检测目标表单数据中不含有非法字符,则响应于所述表单提交请求,将所述目标表单进行提交,例如根据提交请求,把目标表单按照提交请求进行提交,例如可以根据提交请求确定提交的目的地,将目标表单发送至目的地。
本实施例的技术方案,通过获取目标表单的目标表单数据,确定目标表单数据中的待识别字符,并根据预先设置的至少一个字符标准存储长度对待识别字符进行字符识别,来确定所述待识别字符是否为非法字符,解决了目标表单中可能出现非法字符的技术问题,特别是解决了对通过转换编码格式也无法正常显示的非法字符的识别,达到了对数据存储本身即是错误的乱码等非法字符的有效识别和提示的技术效果。
实施例二
图2为本发明实施例二所提供的一种表单数据的处理方法的流程示意图,本实施例在本发明实施例中任一可选技术方案的基础上,可选地,所述表单数据的处理方法,还包括:如果存在与所述字符实际存储长度相等的预先设置的字符标准存储长度,则将所述字符实际存储长度作为目标字符长度;如果所述目标字符长度为第一预设长度,则将所述待识别字符与至少一个预设字符进行比对;如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
在此技术上,可选地,所述表单数据的处理方法,还包括:如果所述目标字符长度为第一预设长度且存在于所述待识别字符相同的预设字符,或者,所述目标字符长度为第二预设长度则将所述待识别字符确定为合法字符。
如图2所示,本实施例的方法具体可包括:
S210、当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符。
S220、针对每个所述待识别字符,计算所述待识别字符的字符实际存储长度,并将所述字符实际存储长度与预先设置的字符标准存储长度进行比对。
S230、如果所述字符实际存储长度不等于预先设置的任意一个字符标准存储长度,则将所述待识别字符确定为非法字符。
S240、如果存在与所述字符实际存储长度相等的预先设置的字符标准存储长度,则将所述字符实际存储长度作为目标字符长度。
其中,所述目标字符长度可以为待识别字符实际存储长度,通过对目标字符长度的的识别,判断待识别字符的所述类别,进而判断待识别字符是否为非法字符,所述目标字符长度可以为字节数,例如目标字符长度可以为1个字节或4个字节长度等,需要说明的是,目标字符长度需要符合预先设置的字符标准存储长度。
S250、如果所述目标字符长度为第一预设长度,则将所述待识别字符与至少一个预设字符进行比对。
其中,所述第一预设长度可以为一种合法类型字符的字符标准存储长度,例如一种类型字符可以为ASCII里的字符,则第一预设长度可以为1个字节。
其中,所述预设字符可以为符合第一预设长度的所有合法字符,通过将所述待识别字符与至少一个预设字符进行比对,可以知道待识别字符是否是预设字符中的一个字符,例如预设字符可以为:“A B C D E F G H I J K L M N O P Q R S T U V W X Y Z ab c d e f g h i j k l m n o p q r s t u v w x y z`~!@#$%^&*();’,./[]\-=_+{}|:”<>?1234567890”字符序列,如果所述目标字符长度为第一预设长度,但与预设字符中的任意一个字符都不相同,例如软键盘输入的特殊符号或其他国家字符因,若与预设字符中的任意一个字符都不相同则识别为非法。
其中,所述如果所述目标字符长度为第一预设长度,则将所述待识别字符与至少一个预设字符进行比对,可以理解为,如果目标字符长度与第一预设长度相等,则将待识别字符与预设字符进行一一比对,识别出待识别字符是否属于预设字符中的字符。
S260、如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
其中,所述如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符,可以理解为,将待识别字符与预设字符进行一一比对,如果识别出待识别字符不属于预设字符中的字符,而预设字符是符合第一预设长度的所有合法字符,则可以确定待识别字符确定为非法字符。
可选的,在本发明实施例中任一可选技术方案的基础上,所述目标表单数据的处理基于Rule语言实现,还包括:
如果针对所述目标表单数据中的多个所述待识别字符组成的字符串进行识别,则获取Rule语言中的STRLEN()函数的返回值,将所述返回值作为所述待识别字符组成的字符串的字符数量;
如果待识别字符组成的字符串的实际存储长度与所述待识别字符组成的字符串的字符数量相等,则待识别字符组成的字符串是由单字节字符所组成,将所述待识别字符组成的字符串拆分成单个待识别字符,并将所述待识别字符与至少一个预设字符进行比对;
如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
其中,所述Rule语言可以为中国农业银行独有的第四代编程语言,Rule语言可以用于农行新一代核心系统的前后台开发。
其中,所述STRLEN()函数可以为能够计算所检测的字符串的字符个数的函数,例如字符串“ab”,通过STRLEN()函数对字符串“ab”的检测,能够得到的返回值为2,例如字符串“你好”,通过STRLEN()函数对字符串“你好”的检测,能够得到的返回值为2。
其中,所述单字节字符可以为字符的实际存储长度为1个字节的字符,例如ASCII里的字符或其他实际存储长度为1个字节的字符。
其中,所述将所述待识别字符组成的字符串拆分成单个待识别字符,可以理解为,通过调用字符串拆分函数对所述待识别字符组成的字符串进行拆分,例如对英文字母字符组成的字符串进行拆分,则除去最后字符串结尾字符,把字符串的每一个字节拆分成一个英文字符,若果存在其他字符,也按照响应规则把字符串拆分成单个待识别字符。
示例性地,rule语言识别乱码原理如下:
rule程序中的STRLEN()函数只按字符个数计算字符串长度,单个汉字的长度记为1。rule程序编程环境采用主机编码,而主机编码EBCDIC字符集汉字长度是0E+汉字长度(每个汉字两字节)+0F,即一个汉字的实际长度是1*2+2=4,N个汉字的实际长度是N*2+2。根据此区别可判断字符串中是否包含汉字。
S270、如果所述目标字符长度为第一预设长度且存在于所述待识别字符相同的预设字符,或者,所述目标字符长度为第二预设长度则将所述待识别字符确定为合法字符。
其中,所述第二预设长度可以为另一种合法类型字符的字符标准存储长度,例如另一种类型字符可以为EBCDIC(Extended Binary Coded Decimal Interchange Code,扩展二进制编码的十进制交换码)里的汉字字符,则第二预设长度可以为4个字节。
其中,所述如果所述目标字符长度为第一预设长度且存在于所述待识别字符相同的预设字符,或者,所述目标字符长度为第二预设长度则将所述待识别字符确定为合法字符,可以理解为,如果目标字符长度与第一预设长度相等,则将待识别字符与预设字符进行一一比对,并且识别出待识别字符属于预设字符中的字符,或者目标字符长度与第二预设长度相等,则确定待识别字符为合法字符。
S280、如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
本实施例的技术方案,通过对待识别字符的字符实际存储长度与预先设置的字符标准存储长度进行比对,如果如果存在与所述字符实际存储长度相等的预先设置的字符标准存储长度,则将所述字符实际存储长度作为目标字符长度,再通过对目标字符长度的对比,进而判断待识别字符是否为非法字符,解决了待识别字符的类型判断的技术问题,进而解决待识别字符是否为非法字符的技术问题,达到了对待识别字符的有效识别的技术效果。
如图3所示,为本发明实施例的一种表单数据的处理方法的流程示意图,其中,获取目标表单可以为用户通过查询、录入等方式填写表单数据,录入完成后提交数据,表单数据的处理装置接收到目标表单的目标表单数据;识别乱码等非法字符可以为表单数据的处理装置自动检查目标表单数据是否包含乱码等非法字符,如果识别到目标表单数据包含乱码等非法字符,弹出提示,提示用户具体出错位置栏位,提醒用户对数据进行更正;如果识别到目标表单数据不包含乱码等非法字符,则放行表单数据,表单数据将提交到后端服务器。
实施例三
图4为本发明实施例三提供的一种表单数据的处理装置的结构示意图,本实施例所提供的表单数据的处理装置可以通过软件和/或硬件来实现,可配置于终端和/或服务器中来实现本发明实施例中的表单数据的处理方法。该装置具体可包括:表单数据获取模块310、非法字符识别模块320和表单信息提示模块330。
其中,表单数据获取模块310,用于当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;非法字符识别模块320,用于针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;表单信息提示模块330,用于如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
本实施例的技术方案,通过获取目标表单的目标表单数据,确定目标表单数据中的待识别字符,并根据预先设置的至少一个字符标准存储长度对待识别字符进行字符识别,来确定所述待识别字符是否为非法字符,解决了目标表单中可能出现非法字符的技术问题,特别是解决了对通过转换编码格式也无法正常显示的非法字符的识别,达到了对数据存储本身即是错误的乱码等非法字符的有效识别和提示的技术效果。
在本发明实施例中任一可选技术方案的基础上,可选地,所述非法字符识别模块320,可用于:
计算所述待识别字符的字符实际存储长度,并将所述字符实际存储长度与预先设置的字符标准存储长度进行比对;
如果所述字符实际存储长度不等于预先设置的任意一个字符标准存储长度,则将所述待识别字符确定为非法字符。
在本发明实施例中任一可选技术方案的基础上,可选地,所述非法字符识别模块320,还包括:
目标字符长度确定单元,用于如果存在与所述字符实际存储长度相等的预先设置的字符标准存储长度,则将所述字符实际存储长度作为目标字符长度;
待识别字符比对单元,用于如果所述目标字符长度为第一预设长度,则将所述待识别字符与至少一个预设字符进行比对;
非法字符确定单元,用于如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
在本发明实施例中任一可选技术方案的基础上,可选地,所述非法字符识别模块320,还包括:
合法字符确定单元,用于如果所述目标字符长度为第一预设长度且存在于所述待识别字符相同的预设字符,或者,所述目标字符长度为第二预设长度则将所述待识别字符确定为合法字符。
在本发明实施例中任一可选技术方案的基础上,可选地,所述目标表单数据的处理基于Rule语言实现,所述表单数据的处理装置,还包括:
字符数量确定模块,用于如果针对所述目标表单数据中的多个所述待识别字符组成的字符串进行识别,则获取Rule语言中的STRLEN()函数的返回值,将所述返回值作为所述待识别字符组成的字符串的字符数量;
单字节字符识别模块,用于如果待识别字符组成的字符串的实际存储长度与所述待识别字符组成的字符串的字符数量相等,则待识别字符组成的字符串是由单字节字符所组成,将所述待识别字符组成的字符串拆分成单个待识别字符,并将所述待识别字符与至少一个预设字符进行比对;
待识别字符比对模块,用于如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
在本发明实施例中任一可选技术方案的基础上,可选地,所述表单信息提示模块330,可用于:
确定所述非法字符的位置信息,根据所述位置信息生成位置提示信息,并将所述非法字符进行突出显示。
在本发明实施例中任一可选技术方案的基础上,可选地,所述表单数据的处理装置,还包括:
目标表单提交模块,用于如果所述目标表单数据中不存在非法字符,则响应于所述表单提交请求,将所述目标表单进行提交。
上述表单数据的处理装置可执行本发明任意实施例所提供的表单数据的处理方法,具备执行表单数据的处理方法相应的功能模块和有益效果。
实施例四
图5为本发明实施例四提供的一种电子设备的结构示意图,如图5所示,该电子设备包括处理器410、存储器420、输入装置430和输出装置440;设备中处理器410的数量可以是一个或多个,图5中以一个处理器410为例;设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或其他方式连接,图5中以通过总线连接为例。
存储器420作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的表单数据的处理方法对应的程序指令/模块。处理器410通过运行存储在存储器420中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理。
存储器420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器420可进一步包括相对于处理器410远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置430可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的信号输入。输出装置440可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行表单数据的处理方法,该方法包括:当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (10)
1.一种表单数据的处理方法,其特征在于,包括:
当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;
针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;
如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
2.根据权利要求1所述的方法,其特征在于,所述根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述目标表单数据中是否存在非法字符,包括:
计算所述待识别字符的字符实际存储长度,并将所述字符实际存储长度与预先设置的字符标准存储长度进行比对;
如果所述字符实际存储长度不等于预先设置的任意一个字符标准存储长度,则将所述待识别字符确定为非法字符。
3.根据权利要2所述的方法,其特征在于,还包括:
如果存在与所述字符实际存储长度相等的预先设置的字符标准存储长度,则将所述字符实际存储长度作为目标字符长度;
如果所述目标字符长度为第一预设长度,则将所述待识别字符与至少一个预设字符进行比对;
如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
4.根据权利要3所述的方法,其特征在于,还包括:
如果所述目标字符长度为第一预设长度且存在于所述待识别字符相同的预设字符,或者,所述目标字符长度为第二预设长度则将所述待识别字符确定为合法字符。
5.根据权利要1所述的方法,其特征在于,所述目标表单数据的处理基于Rule语言实现,还包括:
如果针对所述目标表单数据中的多个所述待识别字符组成的字符串进行识别,则获取Rule语言中的STRLEN()函数的返回值,将所述返回值作为所述待识别字符组成的字符串的字符数量;
如果待识别字符组成的字符串的实际存储长度与所述待识别字符组成的字符串的字符数量相等,则待识别字符组成的字符串是由单字节字符所组成,将所述待识别字符组成的字符串拆分成单个待识别字符,并将所述待识别字符与至少一个预设字符进行比对;
如果所述待识别字符与任意一个预设字符均不相同,则将所述待识别字符确定为非法字符。
6.根据权利要1所述的方法,其特征在于,所述基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息,包括:
确定所述非法字符的位置信息,根据所述位置信息生成位置提示信息,并将所述非法字符进行突出显示。
7.根据权利要求1所述的方法,其特征在于,还包括:
如果所述目标表单数据中不存在非法字符,则响应于所述表单提交请求,将所述目标表单进行提交。
8.一种表单数据的处理装置,其特征在于,包括:
表单数据获取模块,用于当接收到目标表单的表单提交请求时,获取所述目标表单的目标表单数据,并确定所述目标表单数据中的至少一个待识别字符;
非法字符识别模块,用于针对每个所述待识别字符,根据预先设置的至少一个字符标准存储长度对所述待识别字符进行字符识别,以确定所述待识别字符是否为非法字符;
表单信息提示模块,用于如果所述目标表单数据中存在非法字符,则基于所述非法字符生成与所述目标表单对应的表单提示信息,并展示所述表单提示信息。
9.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的表单数据的处理方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的表单数据的处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111626728.1A CN114330332B (zh) | 2021-12-28 | 2021-12-28 | 表单数据的处理方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111626728.1A CN114330332B (zh) | 2021-12-28 | 2021-12-28 | 表单数据的处理方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114330332A true CN114330332A (zh) | 2022-04-12 |
CN114330332B CN114330332B (zh) | 2024-07-30 |
Family
ID=81014329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111626728.1A Active CN114330332B (zh) | 2021-12-28 | 2021-12-28 | 表单数据的处理方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114330332B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046359A (ja) * | 2002-07-09 | 2004-02-12 | Sharp Corp | 手書き入力装置および方法、手書き入力プログラム、並びに、プログラム記録媒体 |
US20070113222A1 (en) * | 2005-11-14 | 2007-05-17 | Dignum Marcelino M | Hardware unit for parsing an XML document |
JP2008077454A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム |
CN105282554A (zh) * | 2014-07-07 | 2016-01-27 | 富士通株式会社 | 解码方法及解码装置 |
WO2016173453A1 (zh) * | 2015-04-30 | 2016-11-03 | 腾讯科技(深圳)有限公司 | 活体鉴别方法、信息生成方法和终端 |
CN106844430A (zh) * | 2016-12-12 | 2017-06-13 | 天格科技(杭州)有限公司 | 一种改进的实时社交平台广告及敏感信息快速识别的方法 |
CN107818321A (zh) * | 2017-10-13 | 2018-03-20 | 上海眼控科技股份有限公司 | 一种用于车辆年检的水印日期识别方法 |
US10461772B1 (en) * | 2019-01-14 | 2019-10-29 | International Business Machines Corporation | Code conversion |
CN111949990A (zh) * | 2020-08-10 | 2020-11-17 | 曙光信息产业(北京)有限公司 | 跨站脚本风险检测方法、装置、计算机设备和存储介质 |
WO2021104270A1 (zh) * | 2019-11-26 | 2021-06-03 | 中兴通讯股份有限公司 | 配置异常检测方法、服务器以及存储介质 |
CN113434674A (zh) * | 2021-06-25 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据解析方法、装置、电子设备及可读存储介质 |
CN113705167A (zh) * | 2021-08-31 | 2021-11-26 | 平安普惠企业管理有限公司 | 字符校验方法、装置、设备及存储介质 |
CN113743102A (zh) * | 2021-08-18 | 2021-12-03 | 百度在线网络技术(北京)有限公司 | 识别字符的方法、装置以及电子设备 |
-
2021
- 2021-12-28 CN CN202111626728.1A patent/CN114330332B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004046359A (ja) * | 2002-07-09 | 2004-02-12 | Sharp Corp | 手書き入力装置および方法、手書き入力プログラム、並びに、プログラム記録媒体 |
US20070113222A1 (en) * | 2005-11-14 | 2007-05-17 | Dignum Marcelino M | Hardware unit for parsing an XML document |
JP2008077454A (ja) * | 2006-09-22 | 2008-04-03 | Matsushita Electric Ind Co Ltd | タイトル抽出装置、画像読取装置、タイトル抽出方法、及びタイトル抽出プログラム |
CN105282554A (zh) * | 2014-07-07 | 2016-01-27 | 富士通株式会社 | 解码方法及解码装置 |
WO2016173453A1 (zh) * | 2015-04-30 | 2016-11-03 | 腾讯科技(深圳)有限公司 | 活体鉴别方法、信息生成方法和终端 |
CN106844430A (zh) * | 2016-12-12 | 2017-06-13 | 天格科技(杭州)有限公司 | 一种改进的实时社交平台广告及敏感信息快速识别的方法 |
CN107818321A (zh) * | 2017-10-13 | 2018-03-20 | 上海眼控科技股份有限公司 | 一种用于车辆年检的水印日期识别方法 |
US10461772B1 (en) * | 2019-01-14 | 2019-10-29 | International Business Machines Corporation | Code conversion |
WO2021104270A1 (zh) * | 2019-11-26 | 2021-06-03 | 中兴通讯股份有限公司 | 配置异常检测方法、服务器以及存储介质 |
CN111949990A (zh) * | 2020-08-10 | 2020-11-17 | 曙光信息产业(北京)有限公司 | 跨站脚本风险检测方法、装置、计算机设备和存储介质 |
CN113434674A (zh) * | 2021-06-25 | 2021-09-24 | 平安国际智慧城市科技股份有限公司 | 数据解析方法、装置、电子设备及可读存储介质 |
CN113743102A (zh) * | 2021-08-18 | 2021-12-03 | 百度在线网络技术(北京)有限公司 | 识别字符的方法、装置以及电子设备 |
CN113705167A (zh) * | 2021-08-31 | 2021-11-26 | 平安普惠企业管理有限公司 | 字符校验方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114330332B (zh) | 2024-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230326466A1 (en) | Text processing method and apparatus, electronic device, and medium | |
CN107038157B (zh) | 基于人工智能的识别错误发现方法、装置及存储介质 | |
CN113392253B (zh) | 视觉问答模型训练及视觉问答方法、装置、设备及介质 | |
CN108090043B (zh) | 基于人工智能的纠错举报处理方法、装置及可读介质 | |
CN110580308A (zh) | 信息审核方法及装置、电子设备、存储介质 | |
CN111079408A (zh) | 一种语种识别方法、装置、设备及存储介质 | |
CN112883968A (zh) | 图像字符识别方法、装置、介质及电子设备 | |
CN114373460A (zh) | 车载语音助手的指令确定方法、装置、设备及介质 | |
CN115544207A (zh) | 一种scd文件中装置快速匹配模板库类型的方法及系统 | |
CN112488103B (zh) | 地址信息抽取方法、模型训练方法及相关设备 | |
CN113743101A (zh) | 文本纠错方法、装置、电子设备和计算机存储介质 | |
CN110516125B (zh) | 识别异常字符串的方法、装置、设备及可读存储介质 | |
CN112559112B (zh) | 界面节点定位方法及装置 | |
CN113904943A (zh) | 账号检测方法、装置、电子设备和存储介质 | |
CN114330332B (zh) | 表单数据的处理方法、装置、电子设备及存储介质 | |
CN109614592B (zh) | 文本的处理方法、装置、存储介质和电子设备 | |
CN115600601B (zh) | 一种税法知识库构建方法、装置、设备及介质 | |
CN107992457B (zh) | 一种信息转换方法、装置、终端设备及存储介质 | |
CN113807056B (zh) | 一种文档名称序号纠错方法、装置和设备 | |
CN111339776B (zh) | 简历解析方法、装置、电子设备和计算机可读存储介质 | |
CN110704617B (zh) | 新闻文本的分类方法、装置、电子设备和存储介质 | |
CN114663886A (zh) | 文本识别方法、模型的训练方法及装置 | |
CN113343652A (zh) | 文本处理方法、装置、设备及介质 | |
CN112149417A (zh) | 词性标注方法和装置、存储介质和电子设备 | |
CN114943222B (zh) | 时间实体识别方法和装置、计算机存储介质、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |