[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN106774979A - 输入法测试方法及装置 - Google Patents

输入法测试方法及装置 Download PDF

Info

Publication number
CN106774979A
CN106774979A CN201611166880.5A CN201611166880A CN106774979A CN 106774979 A CN106774979 A CN 106774979A CN 201611166880 A CN201611166880 A CN 201611166880A CN 106774979 A CN106774979 A CN 106774979A
Authority
CN
China
Prior art keywords
input
content
noise
input content
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611166880.5A
Other languages
English (en)
Inventor
宁亚峰
李鹏
周立
胡新勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xinmeihutong Technology Co
Original Assignee
Beijing Xinmeihutong Technology Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xinmeihutong Technology Co filed Critical Beijing Xinmeihutong Technology Co
Priority to CN201611166880.5A priority Critical patent/CN106774979A/zh
Publication of CN106774979A publication Critical patent/CN106774979A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/006Identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

本发明实施例提供一种输入法测试方法、装置,其基于预设错误输入类型对获取到的大量目标输入内容进行噪音处理,得到与实际按键轨迹一致性更高的噪音输入内容,并以该噪音输入内容为测试用例,对目标输入法进行性能测试,可以使得到的性能测试结果与该目标输入法实际可以达到的性能水平更接近,即提高性能测试准确度。另外,以噪音输入内容为测试用例,输入候选项中显示的后续词语实际为目标输入法根据自身具备的纠错功能进行纠错处理后的结果,因此,本发明实施例还可以实现对目标输入法的纠错能力的测试。

Description

输入法测试方法及装置
技术领域
本发明实施例涉及输入法技术领域,尤其涉及一种输入法测试方法及装置。
背景技术
输入法是指为了将各种符号、文字等信息输入计算机、手机、平板电脑等电子终端而采用的编码方法。随着移动互联网及各种电子终端的普及和推广,输入法作为内容输入工具,是电子终端上必不可少的一款应用。现有输入法种类多种多样,为评价不同输入法的性能优劣,通常收集用户的目标输入内容,并将该目标输入内容作为测试用例,模拟被测输入法的实际输入场景,根据模拟得到的输入结果计算被测输入法的输入效率(输入效率=最终输入字母总数/按键总数)等表征输入法优劣的性能指标。
如图1所示,用户利用某输入法输入b-e-a-u-t这5个字符时,在输入法的输入候选项中就出现了词语beautiful,用户选择该词语并完成输入,则词语beautiful为本次输入的目标输入内容,字母总数为9,b-e-a-u-t为本次输入的按键轨迹,按键总数为5,那么本次输入的输入效率=9/5=1.8;根据多次输入的字母总数和按键总数,即可计算得到该输入法的输入效率。显然计算得到的输入效率的值越大,输入相同目标词语所需的按键总数越少,证明输入法的输入效率越高,用户的输入体验就越好。
但是在实际应用场景中,由于某些电子终端(如手机)的键盘按键较小等因素,用户输入时极有可能出现误按,导致错误输入;因此,输入法通常还具有自动纠错功能,以纠正可能出现的错误输入,最终给出正确的输入候选项。依然以beautiful为例,在实际应用场景中用户可能出现这样的按键轨迹:b-e-s-u-t-i-f-u-l,即第三个字符按键a误按成其相邻按键s,如图1所示的一种常用手机键盘布局。实际上,对于任意用户而言,随着输入量的累积,都很难始终保证完全正确的按键输入,即难以保证其按键轨迹与目标输入内容完全一致;而现有技术直接收集目标输入内容为测试用例进行测试,与实际应用场景不符,难以评估被测输入法的纠错能力,使得测试准确度大打折扣。
发明内容
本发明实施例中提供了一种输入法测试方法及装置,以解决现有输入法测试方法难以正确评估被测输入法的纠错能力,测试准确度低的问题。
本发明实施例公开了如下技术方案:
第一方面,本发明实施例提供了一种输入法测试方法,包括:
获取目标输入内容;
根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容;
以所述噪音输入内容为测试用例,对目标输入法进行测试。
可选的,获取目标输入内容,包括:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
可选的,所述方法还包括:
获取预设条数的输入记录,每条输入记录包括按键轨迹及对应的用户选定输入内容;
对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型;
统计每种预设错误输入类型对应的输入记录总条数;
根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率;
相应的,根据预设错误输入类型对所述目标输入内容进行噪音处理,包括:
根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理。
可选的,所述预设错误输入类型,包括以下至少一项:
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻;
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻;
按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒;
相对于用户选定输入内容,按键轨迹中存在冗余输入按键;
相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键;
相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
可选的,以所述噪音输入内容为测试用例,对目标输入法进行测试,包括:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,及噪音输入时的首页率、首选率和未输出率;
可选的,计算所述性能指标的方法包括:
计算各个目标输入内容对应的字母总数;
对于每个噪音输入内容,记录相应的目标输入内容首次出现在输入候选项第一页时已经输入的第一字母个数,及相应的目标输入内容首次出现在输入候选项第一项时已经输入的第二字母个数;
计算各个噪音输入内容对应的第一字母个数之和,并计算所述字母总数与所述第一字母个数之和的比值,得到所述目标输入法的首页输入效率;
计算各个噪音输入内容对应的第二字母个数之和,并计算所述字母总数与所述第二字母个数之和的比值,得到所述目标输入法的首选输入效率;
统计相应的目标输入内容出现在输入候选项第一页的噪音输入内容个数,记为第一个数,以及相应的目标输入内容出现在输入候选项第一项的噪音输入内容个数,记为第二个数,以及相应的目标输入内容未出现在输入候选项第一页的噪音输入内容个数,记为第三个数;
计算所述第一个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首页率;
计算所述第二个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首选率;
计算所述第三个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的未输出率。
第二方面,本发明实施例提供了一种输入法测试装置,包括:
目标内容获取单元,用于获取目标输入内容;
噪音处理单元,用于根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容;
模拟测试单元,用于以所述噪音输入内容为测试用例,对目标输入法进行测试。
可选的,所述目标内容获取单元具体被配置为:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
可选的,所述装置还包括:
输入记录获取单元,用于获取预设条数的输入记录,每条输入记录包括按键轨迹及对应的用户选定输入内容;
错误类型统计单元,用于对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型,并统计每种预设错误输入类型对应的输入记录总条数;
发生概率计算单元,用于根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率;
相应的,所述噪音处理单元具体被配置为:
根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理。
可选的,所述错误类型统计单元中的预设错误输入类型,包括以下至少一项:
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻;
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻;
按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒;
相对于用户选定输入内容,按键轨迹中存在冗余输入按键;
相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键;
相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
可选的,所述模拟测试单元具体被配置为:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,及噪音输入时的首页率、首选率和未输出率。
可选的,所述模拟测试单元还可以被配置为:计算所述目标输入法的以下性能指标中的至少一项:正常输入时的首页率、首选率和未输出率。
由以上技术方案可知,本发明实施例基于预设错误输入类型对获取到的大量目标输入内容进行噪音处理,得到与实际按键轨迹一致性更高的噪音输入内容,并以该噪音输入内容为测试用例,对目标输入法进行性能测试,可以使得到的性能测试结果与该目标输入法实际可以达到的性能水平更接近,即提高性能测试准确度。另外,以噪音输入内容为测试用例,输入候选项中显示的后续词语实际为目标输入法根据自身具备的纠错功能进行纠错处理后的结果,因此,本发明实施例还可以实现对目标输入法的纠错能力的测试。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为基于虚拟键盘的文本输入界面示意图;
图2为本发明实施例提供的一种输入法测试方法的流程图;
图3为本发明实施例提供的另一种输入法测试方法的流程图;
图4为本发明实施例提供的一种输入法测试装置的结构示意图;
图5为本发明实施例提供的另一种输入法测试装置的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本发明实施例中提供了一种输入法测试方法及装置,以解决现有输入法测试方法难以正确评估被测输入法的纠错能力,测试准确度低的问题。
图2为本发明实施例提供的一种输入法测试方法的流程图。参照图2,本发明实施例提供的输入法测试方法至少包括以下步骤:
S11、获取目标输入内容。
考虑到不同用户、不同场景下所输入的词语范围不同,例如:聊天工具中输入词语的大部分为口语,电子邮件(email)中大多为正式用语,游戏中则多为游戏领域的专用术语;因此,本发明实施例中,可以从多个电子设备的多个应用程序中获取尽量多的目标输入内容,以保证所获取到的目标输入内容尽量覆盖更多的应用场景(或使用范围),进而提高对目标输入法的性能测试准确度。
S12、根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容。
实际应用场景中可能出现的错误输入类型可能有多种,例如前文背景技术部分所述的对于目标输入内容“beautiful”,实际按键轨迹可能为b-e-s-u-t-i-f-u-l,即将第三个按键a误按成其相邻键s;又如对于目标输入内容“same”,实际按键轨迹可能为s-m-e,即漏按了第二个字母a。
本发明实施例所述的噪音处理过程相当于输入法纠错过程的逆运算,即将正确的目标输入内容处理为包含误按、漏按等错误输入的噪音输入内容。本发明实施例,预先统计不同词语、不同应用场景下可能会出现的多种错误输入类型,即上述预设错误输入类型,并根据该预设错误输入类型对获取到的目标输入内容进行噪音处理,使得得到的噪音输入数据与实际应用场景中的按键轨迹一致性更高。例如,对于目标输入内容“beautiful”,经过噪音处理得到相应的噪音输入内容“besutiful”,对于目标输入内容“same”,经过噪音处理得到相应的噪音输入内容“sme”等。
S13、以所述噪音输入内容为测试用例,对目标输入法进行测试。
可以理解的是,对于同一输入法,在实际按键轨迹与目标输入内容一致和不一致两种情况下,其输入效率是不一样的;仍以目标输入内容“besutiful”为例,对于某个输入法,如果按键轨迹没有误按、漏按等错误,则可能只输入三个字母b-e-a,输入候选项中就出现了“besutiful”,此时对应的输入效率为9/3=3;而如果将第三个字母a误按成s,则可能需要输入五个(或更多个)字母b-e-s-u-t,输入候选项中才出现“besutiful”,此时对应的输入效率为9/5=1.8。因此,现有技术直接以目标输入内容为测试用例进行测试,完全忽略了实际应用场景中会出现各种错误输入的情况,导致测试得到的输入效率比输入法能达到的实际输入效率高,即现有技术测试准确度较低。
而本发明实施例以包含错误输入的噪音输入内容为测试用例,可以使得到的性能测试结果与该目标输入法实际可以达到的性能水平更接近。另外,本申请实施例还可以同时测试目标输入法的纠错能力。例如,同样输入噪音输入内容“sme”,第一种目标输入法的输入候选项中出现了目标输入内容“same”,而第二种目标输入法的输入候选项中始终未出现目标输入内容“same”,从而可知,对于漏按这种错误输入类型,第一种目标输入法的纠错能力比第二种输入法的纠错能力更好。
由以上技术方案可知,本发明实施例基于预设错误输入类型对获取到的大量目标输入内容进行噪音处理,得到与实际按键轨迹一致性更高的噪音输入内容,并以该噪音输入内容为测试用例,对目标输入法进行性能测试,可以使得到的性能测试结果与该目标输入法实际可以达到的性能水平更接近,即提高性能测试准确度。另外,以噪音输入内容为测试用例,输入候选项中显示的后续词语实际为目标输入法根据自身具备的纠错功能进行纠错处理后的结果,因此,本发明实施例还可以实现对目标输入法的纠错能力的测试。
在本发明一个可行的实施例中,上述步骤S11所述的获取目标输入内容,具体可以包括以下步骤:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
实际应用场景中,不同应用程序对应的目标输入内容,不仅在覆盖范围上有差别,还在输入数量上有差别。例如,经过统计,某个电子终端在7天内的输入内容总量为10000个词语,其中包括:在聊天工具中输入的7000个词语,在游戏软件中输入的1500个词语,在浏览器中输入的1000个词语,在电子邮件中输入的300个词语,和在其他应用程序中输入的200个词语。由此可以计算得到各个应用程序对应的输入比例,即:
聊天工具:7000/10000=70%;
游戏:1500/10000=15%;
浏览器:1000/10000=10%;
电子邮件:300/10000=3%;
其他:200/10000=2%。
在以该电子终端为数据源获取一定数量的目标输入内容时,可以根据上述输入比例确定从每个应用程序中获取的输入内容数量。假设需要获取10万个目标输入内容,则可以从聊天工具中获取7万个(即70%),从游戏软件中获取1.5万个(即15%),从浏览器中获取1万个(即10%),从电子邮件中获取0.3万个(即3%),从其他应用程序中获取0.2万个(即2%),从而保证最终获取的目标输入内容与实际应用场景更匹配,进而可以提高最终测试准确度。
图3为本发明实施例提供的另一种输入法测试方法的流程图。如图3所示,该方法包括以下步骤:
S21、从多种输入法后台数据中获取预设条数的输入记录;其中,每条输入记录包括按键轨迹及对应的用户选定输入内容。
S22、对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型。
S23、统计每种预设错误输入类型对应的输入记录总条数。
S24、根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率,以应用于步骤S26。
上述步骤S21至S24基于输入法后台的输入记录统计并计算得到实际应用场景会发生的多种预设错误输入类型及其发生概率。
可选的,上述预设错误输入类型包括但不限于以下几种:
(1)按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻。
例如,按键轨迹为s-a-n-e,选定输入内容为same,即错误按键n和正确按键m相邻。
(2)按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻.
例如,按键轨迹为s-a-z-e,选定输入内容为same,即错误按键z和正确按键m不相邻。
(3)按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒。
例如,按键轨迹为s-m-a-e,选定输入内容为same,即中间两个按键m和a顺序颠倒。
(4)相对于用户选定输入内容,按键轨迹中存在冗余输入按键。
例如,按键轨迹为s-a-a-m-e,选定输入内容为same,即按键轨迹中存在一个冗余输入按键a。
(5)相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键。
例如,按键轨迹为s-m-e,选定输入内容为same,即按键轨迹中缺失一个非末位按键a(same的末位按键为e)。
(6)相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
例如,按键轨迹为s-a,选定输入内容为same,即按键轨迹中缺失最后两位按键m和e,也即没有输入完全,输入候选项中就出现了same。
分别统计所获取到的输入记录中所出现的上述每种错误输入类型的总条数。假设经过统计,在后台获取的10000条输入记录中,有5000条输入记录中的按键轨迹与用户选定输入内容不一致,其中各种错误输入类型对应的数据记录总条数及对应的发生概率如下表1所示。
表1输入记录统计结果
可选的,如表1所示统计结果,在计算各种错误输入类型对应的发生概率时,还可以同时计算正确输入(即按键轨迹与用户选定输入内容完全一致)的发生概率。
S25、获取目标输入内容。
S26、根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容。
S27、以所述噪音输入内容为测试用例,对目标输入法进行测试。
实际应用场景中,对于同一按键轨迹,不同输入法的处理方式不完全相同。例如,利用第一种输入法,按键轨迹为d-a-m-e时,可以得到same,按键轨迹为s-a-n-e,无法得到same;但利用第二种输入法时,按键轨迹为d-a-m-e时,无法得到same,按键轨迹为s-a-n-e时,可以得到same。可见第一种输入法偏重于纠正按键轨迹前部的错误,而第二种输入法擅长纠正按键轨迹尾部的错误。
而且,任一输入法都不可能知道用户想要输入的内容是什么,因此对于当前的按键轨迹,任一输入法都不能确定是否需要对其进行纠错处理,以及采用哪种错误输入类型对应的纠错方式,只有在用户选择最终的目标输入内容后,才可以确定该输入法的纠错处理是否符合用户的输入意图。例如,按键轨迹为h-a-p时,用户想要输入的内容可能为“hope”,则需要经过纠错处理(将a纠正为o)才可以得到目标输入内容,而如果用户想要输入的内容为“happy”,则不需要进行纠错。另外,利用不同的纠错方式(对应不同的错误输入类型)得到的纠错结果也不同。
有鉴于此,本发明实施例中,通过步骤S21至S24统计并计算得实际应用场景会发生的多种预设错误输入类型,以及每种预设错误输入类型对应的发生概率,基于该输入概率决定是否对某个目标输入内容进行噪音处理,以及按照哪种预设错误输入类型进行噪音处理。
可选的,在本发明一个可行的实施例中,步骤S26中具体可以通过随机选择,确定是否对某个目标输入内容进行噪音处理,以及按照哪种预设错误输入类型进行噪音处理;具体包括:
第一次随机选择,根据步骤S24中得到的各种预设错误输入类型的发生概率之和P(或者正确输入的发生概率1-P),从步骤S25所获取到的所有(N个)目标输入内容中任选M个目标输入内容作为噪音处理对象;其中M/N=P。
例如,基于表1所示统计结果,P=50%,假设N=10万,则M=5万,即从10万个目标输入内容中任选5万个作为噪音处理对象。
第二次随机选择,根据每种预设错误输入类型的发生概率,从第一次随机选择的M个目标输入内容中,随机选择相应个数的目标输入内容,作为相应预设错误输入类型对应的噪音处理对象。
基于表1所示六种预设错误输入类型的发生概率,可知,从上述作为噪音处理对象的5万个目标输入内容中,任选1.5万个按照预设错误输入类型(1)进行噪音处理,任选0.3万个按照预设错误输入类型(2)进行噪音处理,任选0.2万个按照预设错误输入类型(3)进行噪音处理,任选0.5万个按照预设错误输入类型(4)进行噪音处理,任选0.5万个按照预设错误输入类型(5)进行噪音处理,任选2万个按照预设错误输入类型(6)进行噪音处理。其中,对应于每种预设错误输入类型所选出的目标输入内容不重复,即每个目标输入内容只作为一种预设错误输入类型对应的噪音处理对象。
可选的,基于上述两次随机选择,在本发明其他可行的实施例中,还可以继续执行第三次随机选择,即对于每个噪音处理对象,任选其中的一个或几个字母进行噪音处理。
据统计,对于大多数英文单词,其字母总数为5到6个,故可以随机选择噪音处理对象的第二个字母、或第三个字母、或第二个和第三个字母进行噪音处理。
可见,本申请实施例中,基于各种预设错误输入类型的发生概率,通过随机选择的方式确定是否对某个目标输入内容进行噪音处理,以及按照哪种预设错误输入类型进行噪音处理,在目标输入内容数量较大的前提下,上述随机选择结果与实际应用场景中输入法对按键轨迹的纠错处理情况相符,避免处理得到的噪音输入内容偏重于某一种输入法所擅长的纠错方式,从而可以保证对不同输入法的公平测试,减小测试结果与目标输入法的实际性能之间误差甚至无误差,提高测试准确度。
在本发明一个可行的实施例中,前文所述的以所述噪音输入内容为测试用例,对目标输入法进行测试(步骤S13或步骤S27),具体可以包括:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,及噪音输入时的首页率、首选率和未输出率。
可选的,上述噪音输入情况下对应的各项性能指标的计算方法如下:
对于每个噪音输入内容,记录相应的目标输入内容首次出现在输入候选项第一页时已经输入的字母个数,记为第一字母个数,及相应的目标输入内容首次出现在输入候选项第一项时已经输入的字母个数,记为第二字母个数;
计算各个噪音输入内容对应的第一字母个数之和,并计算所述字母总数与所述第一字母个数之和的比值,得到所述目标输入法的首页输入效率;
计算各个噪音输入内容对应的第二字母个数之和,并计算所述字母总数与所述第二字母个数之和的比值,得到所述目标输入法的首选输入效率。
统计相应的目标输入内容出现在输入候选项第一页的噪音输入内容个数,记为第一个数,以及相应的目标输入内容出现在输入候选项第一项的噪音输入内容个数,记为第二个数,以及相应的目标输入内容未出现在输入候选项第一页的噪音输入内容个数,记为第三个数;
计算所述第一个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首页率;
计算所述第二个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首选率;
计算所述第三个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的未输出率。
首页输入效率和首选输入效率越高,噪音输入得到的首页率和首选率越高,噪音输入的未输出率越低,表示相应的目标输入法的性能越好。
可选的,在其他可行的实施例中,还可以以目标输入内容为测试用例,根据得到的输入候选项计算目标输入法在正常输入得到的首页率、首选率和未输出率。
其中,正常输入得到的首页率,即正常输入得到的目标输入内容出现在输入候选项第一页的测试用例个数,与测试用例总个数(目标输入内容的总个数)之比;正常输入得到的首选率,即正常输入得到的目标输入内容出现在输入候选项第一项的测试用例个数,与测试用例总个数(目标输入内容的总个数)之比;正常输入得到的未输出率,即正常输入时目标输入内容未出现在输入候选项第一页的测试用例个数,与测试用例总个数(目标输入内容的总个数)之比。
下表2示出了某次性能测试所采用的大量目标输入内容中的20个目标输入内容对应的噪音处理结果及对某个目标输入法测试时输入候选项展示结果。其中,利用测试用例对目标输入法进行模拟输入时,目标输入法会根据输入的按键轨迹在输入候选区域的每页中输出3个(也可以是多个,本实施例中以3个为例)候选词,处在第一页的3个候选项分别为第一项,第二项和第三项;最可能匹配输入意图的候选词出现在第一项的位置上,称为“首选项”。X1表示按到第几个键时目标输入内容出现在第一页,X2表示按到第几个键时目标输入内容出现在第一项。表2的“噪音输入内容”列中,加粗字体表示该噪音输入内容相对于目标输入内容存在错误输入,“候选第一项”、“候选第二项”和“候选第三项”三列中加粗字体表示与相应的目标输入内容相同
表2噪音处理结果及测试统计结果
下面结合表2,对本发明实施例的性能指标计算方法进行阐述。
根据表2可知,在20个目标输入内容中,共有11个进行了噪音处理(即第2,3,5,6,9,13,14,15,17,19,20个),得到的包含错误输入的噪音输入内容,另外9个未进行噪音处理,即噪音输入内容与目标输入内容一致;相当于有11个测试用例实际输入的是包含错误的噪音输入内容,对应噪音输入场景,而另外9个测试用例实际输入的是目标输入内容,对应正常输入场景。可以计算得到以下性能指标:
1)该目标输入法的首页输入效率=目标输入内容的字母数之和/目标输入内容出现在第一页的按键之和=91/(47+4*3)=1.5423。
其中,上述计算式中括号内的4*3对应表2中第20个测试用例得到目标输入内容所需的按键个数,由表2可知,对于第20个测试用例,第一次输入的是噪音输入内容sive(按键4次),为得到目标输入内容,通常情况用户需要按四次删除键(或者回格键)删掉已经输入的4个字母,再将正确的4个字母love输入,即共按键4*3=12次。
2)该目标输入法的首选输入效率=目标输入内容的字母数之和/目标输入内容出现在第一项的按键之和=91/(51+5*3+3*3+2*3+7*3+3*3+4*3)=0.7398。
由于第3,14,15,18,19,20个测试用例对应的目标输入内容都没有出现在第一项中,按键统计方式采用上述首页输入效率中第20个测试用例的统计方式,即分别删除第一次输入的噪音输入内容,再重新输入相应的目标输入内容,实际按键数均为其字母数的3倍。
3)噪音输入时该目标输入法的首选率=目标输入内容出现在第一项的个数/噪音输入总个数=6/11=0.5454。
其中,在表2所示的噪音输入场景对应的11个测试用例中,第2,5,6,9,13,17个噪音输入内容对应的目标输入内容都出现在输入候选第一项(首选项),共有6个。
4)噪音输入时该目标输入法的首页率=目标输入内容出现在第一页的个数/噪音输入总个数=10/11=0.9090。
其中,在表2所示的噪音输入场景对应的11个测试用例中,第2,3,5,6,9,13,14,15,17,19个噪音输入内容对应的目标输入内容都出现在输入候选第一页,共有10个。
5)噪音输入时该目标输入法的未输出率=目标输入内容未出现在第一页的个数/噪音输入总个数=1/11=0.0909。
其中,在表2所示的噪音输入场景对应的11个测试用例中,第20个噪音输入内容对应的目标输入内容未出现在输入候选第一项,共有1个。
6)正常输入时该目标输入法的首选率=目标输入内容出现在第一项的个数/正常输入总个数=8/9=0.8889。
其中,在表2所示的正常输入场景对应的9个测试用例中,第1,4,7,8,10,11,12,16个目标输入内容都出现在输入候选第一项(首选项),共有8个。
7)正常输入时该目标输入法的首页率=目标输入内容出现在第一页的个数/正常输入总个数=9/9=1.0000。
其中,在表2所示的正常输入场景对应的9个测试用例中,其目标目标输入内容都出现在输入候选第一页中。
8)正常输入时该目标输入法的未输出率=目标输入内容未出现在第一页的个数/正常输入总个数=0/9=0.0000。
即正常输入场景下,没有目标输入内容未出现在候选项第一页中的情况。
可见,本发明实施例通过对收集的目标输入内容进行噪音处理,获得噪音输入内容作为测试用例,使得对目标输入法的测试结果更加精准,更加贴合实际情况。实际应用中,利用本发明实施例提供的测试方法,不仅可以测试对比不同输入法,或者不同版本的性能,还可以分别对同一版本输入法设置不同等级的纠错力度,然后分别对每种纠错力度下的输入法进行测试,从而对比得知不同纠错力度下同一版本输入法的性能。
与前文所述的方法实施例相对应的,本发明实施例还提供了一种输入法测试装置。参照图4所示的结构示意图,该装置至少包括:
目标内容获取单元100,用于获取目标输入内容;
噪音处理单元200,用于根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容;
模拟测试单元300,用于以所述噪音输入内容为测试用例,对目标输入法进行测试。
由以上结构可知,本发明实施例基于预设错误输入类型对获取到的大量目标输入内容进行噪音处理,得到与实际按键轨迹一致性更高的噪音输入内容,并以该噪音输入内容为测试用例,对目标输入法进行性能测试,可以使得到的性能测试结果与该目标输入法实际可以达到的性能水平更接近,即提高性能测试准确度。另外,以噪音输入内容为测试用例,输入候选项中显示的后续词语实际为目标输入法根据自身具备的纠错功能进行纠错处理后的结果,因此,本发明实施例还可以实现对目标输入法的纠错能力的测试。
在本发明一个可行的实施例中,上述目标内容获取单元具体被配置为:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
本发明实施例按照比例从多个应用程序中获取输入内容,可以保证最终获取的目标输入内容与实际应用场景更匹配,进而可以提高最终测试准确度。
参照图5,基于图4所示装置,在本发明一个可行的实施例中,上述输入法测试装置还可以包括:
输入记录获取单,400,用于获取预设条数的输入记录,每条输入记录包括按键轨迹及对应的用户选定输入内容;
错误类型统计单元500,用于对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型,并统计每种预设错误输入类型对应的输入记录总条数;
发生概率计算单元600,用于根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率;
相应的,所述噪音处理单元200具体被配置为:
根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理。
其中,所述错误类型统计单元中的预设错误输入类型,包括以下至少一项:
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻;
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻;
按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒;
相对于用户选定输入内容,按键轨迹中存在冗余输入按键;
相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键;
相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
本申请实施例中,基于各种预设错误输入类型的发生概率,通过随机选择的方式确定是否对某个目标输入内容进行噪音处理,以及按照哪种预设错误输入类型进行噪音处理,在目标输入内容数量较大的前提下,上述随机选择结果与实际应用场景中输入法对按键轨迹的纠错处理情况相符,避免处理得到的噪音输入内容偏重于某一种输入法所擅长的纠错方式,从而可以保证对不同输入法的公平测试,减小测试结果与目标输入法的实际性能之间误差甚至无误差,提高测试准确度。
在本发明一个可行的实施例中,所述模拟测试单元300具体被配置为:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,噪音输入时的首页率、首选率和未输出率,及正常输入时的首页率、首选率和未输出率。
上述各个性能指标的计算方法可参照前文方法实施例所述,此处不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种输入法测试方法,其特征在于,包括:
获取目标输入内容;
根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容;
以所述噪音输入内容为测试用例,对目标输入法进行测试。
2.根据权利要求1所述的方法,其特征在于,获取目标输入内容,包括:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
3.根据权利要求1所述的方法,其特征在于,还包括:
获取预设条数的输入记录,每条输入记录包括按键轨迹及对应的用户选定输入内容;
对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型;
统计每种预设错误输入类型对应的输入记录总条数;
根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率;
相应的,根据预设错误输入类型对所述目标输入内容进行噪音处理,包括:
根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理。
4.根据权利要求3所述的方法,其特征在于,所述预设错误输入类型,包括以下至少一项:
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻;
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻;
按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒;
相对于用户选定输入内容,按键轨迹中存在冗余输入按键;
相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键;
相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
5.根据权利要求1所述的方法,其特征在于,以所述噪音输入内容为测试用例,对目标输入法进行测试,包括:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,及噪音输入时的首页率、首选率和未输出率;
其中,计算所述性能指标的方法包括:
计算各个目标输入内容对应的字母总数;
对于每个噪音输入内容,记录相应的目标输入内容首次出现在输入候选项第一页时已经输入的第一字母个数,及相应的目标输入内容首次出现在输入候选项第一项时已经输入的第二字母个数;
计算各个噪音输入内容对应的第一字母个数之和,并计算所述字母总数与所述第一字母个数之和的比值,得到所述目标输入法的首页输入效率;
计算各个噪音输入内容对应的第二字母个数之和,并计算所述字母总数与所述第二字母个数之和的比值,得到所述目标输入法的首选输入效率;
统计相应的目标输入内容出现在输入候选项第一页的噪音输入内容个数,记为第一个数,以及相应的目标输入内容出现在输入候选项第一项的噪音输入内容个数,记为第二个数,以及相应的目标输入内容未出现在输入候选项第一页的噪音输入内容个数,记为第三个数;
计算所述第一个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首页率;
计算所述第二个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的首选率;
计算所述第三个数与噪音输入内容的总个数之比,得到噪音输入时所述目标输入法的未输出率。
6.一种输入法测试装置,其特征在于,包括:
目标内容获取单元,用于获取目标输入内容;
噪音处理单元,用于根据预设错误输入类型对所述目标输入内容进行噪音处理,得到包含错误输入的噪音输入内容;
模拟测试单元,用于以所述噪音输入内容为测试用例,对目标输入法进行测试。
7.根据权利要求6所述的输入法测试装置,其特征在于,所述目标内容获取单元具体被配置为:
确定不同应用程序对应的输入比例;所述输入比例为任一应用程序的输入内容数量与所有应用程序的输入内容总量之比;
根据要获取的目标输入内容的总数量及所述输入比例,选择多个应用程序的输入内容,作为所述目标输入内容。
8.根据权利要求6所述的输入法测试装置,其特征在于,还包括:
输入记录获取单元,用于获取预设条数的输入记录,每条输入记录包括按键轨迹及对应的用户选定输入内容;
错误类型统计单元,用于对于所述按键轨迹和对应的用户选定输入内容不匹配的每条输入记录,确定对应的预设错误输入类型,并统计每种预设错误输入类型对应的输入记录总条数;
发生概率计算单元,用于根据所述输入记录总条数和预设条数,计算每种预设错误输入类型对应的发生概率;
相应的,所述噪音处理单元具体被配置为:
根据所述预设错误输入类型及对应的发生概率,对所述目标输入内容进行噪音处理。
9.根据权利要求8所述的输入法测试装置,其特征在于,所述错误类型统计单元中的预设错误输入类型,包括以下至少一项:
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置相邻;
按键轨迹中的错误输入按键,与用户选定输入内容中相应的正确输入按键在键盘上的位置不相邻;
按键轨迹中的多个连续错误输入按键,与用户选定输入内容中相应的正确输入按键顺序颠倒;
相对于用户选定输入内容,按键轨迹中存在冗余输入按键;
相对于用户选定输入内容,按键轨迹中缺失至少一个非末位按键;
相对于用户选定输入内容,按键轨迹中缺失最后一位或最后几位按键。
10.根据权利要求6所述的输入法测试装置,其特征在于,所述模拟测试单元具体被配置为:
利用所述目标输入法顺序输入每个噪音输入内容的每个字母,根据输出结果计算所述目标输入法的以下性能指标中的至少一项:首页输入效率,首选输入效率,及噪音输入时的首页率、首选率和未输出率。
CN201611166880.5A 2016-12-16 2016-12-16 输入法测试方法及装置 Pending CN106774979A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611166880.5A CN106774979A (zh) 2016-12-16 2016-12-16 输入法测试方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611166880.5A CN106774979A (zh) 2016-12-16 2016-12-16 输入法测试方法及装置

Publications (1)

Publication Number Publication Date
CN106774979A true CN106774979A (zh) 2017-05-31

Family

ID=58892982

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611166880.5A Pending CN106774979A (zh) 2016-12-16 2016-12-16 输入法测试方法及装置

Country Status (1)

Country Link
CN (1) CN106774979A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943319A (zh) * 2017-11-28 2018-04-20 科大讯飞股份有限公司 一种模拟输入法操作的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102981954A (zh) * 2012-11-28 2013-03-20 百度国际科技(深圳)有限公司 一种输入法的兼容性测试方法及电子装置
CN103019924A (zh) * 2011-09-23 2013-04-03 腾讯科技(深圳)有限公司 输入法智能性评测系统和方法
CN103246355A (zh) * 2012-02-06 2013-08-14 百度在线网络技术(北京)有限公司 在线输入法评测方法、系统及装置
CN103324416A (zh) * 2012-03-23 2013-09-25 腾讯科技(深圳)有限公司 一种确定输入准确率的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103019924A (zh) * 2011-09-23 2013-04-03 腾讯科技(深圳)有限公司 输入法智能性评测系统和方法
CN103246355A (zh) * 2012-02-06 2013-08-14 百度在线网络技术(北京)有限公司 在线输入法评测方法、系统及装置
CN103324416A (zh) * 2012-03-23 2013-09-25 腾讯科技(深圳)有限公司 一种确定输入准确率的方法及装置
CN102981954A (zh) * 2012-11-28 2013-03-20 百度国际科技(深圳)有限公司 一种输入法的兼容性测试方法及电子装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHEN Z.ET AL: "A new statistical approach to Chinese Pinyin input", 《PROCEEDINGS OF THE 38TH ANNUAL MEETING ON ASSOCIATION FOR COMPUTATION LINGUISTICS》 *
张玉华 等: "汉字编码输入法动态测评系统的设计和实现", 《计算机工程与应用》 *
搜狗测试 DEADWALK: "输入法随机自动化测试框架", 《HTTP://WWW.51TESTING.COM/HTML/06/N-3712206.HTML》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107943319A (zh) * 2017-11-28 2018-04-20 科大讯飞股份有限公司 一种模拟输入法操作的方法及装置
CN107943319B (zh) * 2017-11-28 2021-12-03 科大讯飞股份有限公司 一种模拟输入法操作的方法及装置

Similar Documents

Publication Publication Date Title
US9165071B2 (en) Method and system for indicating a validity rating of an entity
CA3150500C (en) Uploader matching method and device
CN108322317B (zh) 一种账号识别关联方法及服务器
CN108304328B (zh) 一种众包测试报告的文本描述生成方法、系统及装置
CN112632257A (zh) 基于语义匹配的问题处理方法、装置、终端和存储介质
CN107918496A (zh) 一种输入纠错方法和装置、一种用于输入纠错的装置
CN107292141A (zh) 一种身份验证装置、终端及方法
US20170169062A1 (en) Method and electronic device for recommending video
CN108255962A (zh) 知识点关联方法、装置、存储介质和电子设备
CN107085490A (zh) 基于截图的多媒体信息播放方法及装置
CN110096539A (zh) 在线批量导入试题方法以及装置
CN111079499B (zh) 一种学习环境中的书写内容识别方法及系统
CN111639218A (zh) 一种口语训练的交互方法及终端设备
CN108764369A (zh) 基于数据融合的人物识别方法、装置和计算机存储介质
CN115061580A (zh) 输入方法、装置、电子设备及可读存储介质
CN106774979A (zh) 输入法测试方法及装置
CN104504051B (zh) 输入提示方法、装置及终端
CN105373568B (zh) 问题答案自动学习方法和装置
CN110019750A (zh) 呈现两个以上标准文本问题的方法和装置
CN108845955A (zh) 一种中文输入法的测试方法、装置及电子设备
CN113312889A (zh) 报表处理方法、装置、终端和存储介质
CN111460768B (zh) 调查问卷处理方法及装置、电子设备及存储介质
CN111050194B (zh) 视频序列处理方法、视频序列处理装置、电子设备及计算机可读存储介质
CN116226337A (zh) 智能人机对话方法、装置、存储介质和智能设备
CN111199148B (zh) 文本相似度确定方法、装置、存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication