[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN101645087A - 一种分类词库系统及其更新和维护方法、以及客户端 - Google Patents

一种分类词库系统及其更新和维护方法、以及客户端 Download PDF

Info

Publication number
CN101645087A
CN101645087A CN200910091922A CN200910091922A CN101645087A CN 101645087 A CN101645087 A CN 101645087A CN 200910091922 A CN200910091922 A CN 200910091922A CN 200910091922 A CN200910091922 A CN 200910091922A CN 101645087 A CN101645087 A CN 101645087A
Authority
CN
China
Prior art keywords
classified word
word bank
classified
updating
bank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910091922A
Other languages
English (en)
Inventor
张会鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN200910091922A priority Critical patent/CN101645087A/zh
Publication of CN101645087A publication Critical patent/CN101645087A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种分类词库系统,包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,输入法核心处理模块,用于实现输入法的基本功能;分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新;分类词库维护模块,用于对分类词库列表文件进行维护管理。本发明还同时公开了一种分类词库的更新方法和维护方法、以及客户端,采用本发明能根据用户需求提供不同的个性化词库,方便用户的使用。

Description

一种分类词库系统及其更新和维护方法、以及客户端
技术领域
本发明涉及输入法词库,特别是涉及一种分类词库系统及其更新和维护方法、以及客户端。
背景技术
计算机用户通常利用中文输入软件将汉字输入到智能设备,中文输入软件是运行于计算机操作系统上的一个工具软件,将键盘输入的编码或其他非键盘输入的媒体数据转换成汉字输入的软件。中文输入软件可分为键盘输入软件和非键盘输入软件。
目前比较成熟且使用最广的就是键盘中文输入软件,键盘中文输入软件就是利用键盘,根据一定的编码规则来输入汉字的一种方法。具体来说,对于英文字母输入,由于对应着键盘上的26个字母,直接输入即可;而对于汉字输入,由于汉字的字数有几万个,且与键盘没有任何对应关系,因此为了向计算机中输入汉字,必须对汉字进行编码,并将这些编码与键盘上的键联系起来,然后就能通过键盘输入某个汉字的编码,再根据编码转换成汉字。现有汉字编码方案已经有数百种,其中在电脑上已经运行的就有几十种,作为一种图形文字,汉字是由字的音、形、义来共同表达的,汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入的。
非键盘中文输入软件包括手写输入软件、光学字符识别技术(OCR)输入软件、和语音输入软件等。其中,手写输入软件是一种笔式环境下的手写中文识别输入软件,只要在手写板上按日常习惯写字,计算机就能将其识别显示出来。一般,手写输入软件需要配套的硬件手写板,在配套的手写板上用笔来书写录入汉字,不仅方便、快捷,且错字率也比较低。此外,用鼠标在指定区域内也可以写出文字来,然后通过手写软件转换成汉字,只是这种方法要求鼠标操作非常熟练。
OCR输入软件是先将要输入的文稿通过扫描仪转化为图形,然后将图形转换为文字。因此,这种输入方法需要配备扫描仪,而且原稿的印刷质量越高,识别的准确率就越高,一般最好是印刷体的文字,比如图书、杂志等,如果原稿的纸张较薄,那么有可能在扫描时纸张背面的图形、文字也透射过来,干扰最后的识别效果。
语音输入方法是根据操作者的语音,由计算机将语音识别成汉字的输入方法,因此又称声控输入方法。语音输入方法通过与计算机相连的话筒向计算机输入汉字的语音,利用语音识别系统分析辩识汉字或词组,把识别后的汉字显示在编辑区中,再通过“发送”功能将编辑区的文字传到计算机其它文档的编辑中。语音输入法只要会读出汉字的读音即可,使用起来简单、快捷。
无论采用上述哪种输入方法,输入软件都会根据用户输入的字或字的组合在自身已有的词库中进行检索,根据检索结果生成候选词供用户选择,确定最终输入的词句。对于每种输入方法,都对应有自己的基本词库,存储有各种常用字词的信息;用于完成从基本词库读取字词并生成候选词的模块一般称为输入法核心处理模块。
随着时代的飞速发展,各种各样的新词层出不穷,而且,对于不同的用户来说,由于他们各自关注的信息点、话题等等都不同,必然会在使用输入法进行沟通时,希望能更准确的获得自己所需的热点字词,而这些字词有很多可能是原有基本词库中没有的;或者,不容易查找到的。显然,仅仅基于各种输入法的原有基本词库进行输入,已经不能满足用户的需求,用户希望有针对自身需求提供不同类别字词的个性化词库,比如:有的用户比较喜欢成语,经常会用到成语,希望设置专门的成语词库;有的用户比较关心足球相关信息,希望设置专用的足球信息词库;再比如:某个车友会的成员,所有成员都会关注自己车型的相关信息以及车友会的相关信息,那么,对于这个群组的人员就希望设置车友会专用词库,目前还没有人提出能根据用户需求提供专用个性化词库的相关实现方案。
发明内容
有鉴于此,本发明的主要目的在于提供一种分类词库系统及其更新和维护方法、以及客户端,能根据用户需求提供不同的个性化词库,方便用户的使用。
为达到上述目的,本发明的技术方案是这样实现的:
本发明提供了一种分类词库系统,包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,
输入法核心处理模块,用于实现输入法的基本功能;
分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;
分类词库维护模块,用于对分类词库列表文件进行维护管理;
其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新。
上述方案中,该分类词库系统还包括分类词库更新模块和分类词库更新服务器;其中,分类词库更新模块,用于更新客户端的分类词库;分类词库更新服务器,用于提供需更新的分类词库的信息和分类词库文件。其中,所述更新为手动触发更新、或为自动更新;所述更新为周期性更新、或按指定时间更新、或根据用户请求在需要时进行更新。
上述方案中,所述元信息包括分类词库的版本标识、分类词库的名称、分类词库的类别。所述维护管理包括增加分类词库、删除分类词库、启用分类词库、禁用分类词库。所述分类词库在客户端本地生成,或由服务器端生成推送给客户端。
本发明还提供了一种分类词库的更新方法,包括:分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块;分类词库更新模块接收分类词库更新服务器返回的信息,确定需更新的分类词库;分类词库更新模块遍历待更新分类词库列表,分别向分类词库更新服务器发起请求,下载每个待更新的分类词库并覆盖本地的分类词库文件;下载完成后,设置需要重新加载分类词库的标志位。
在分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块之前,该方法还包括:分类词库更新模块构造请求更新分类词库版本标识的列表信息,并将所构造的列表信息发送给分类词库更新服务器;
相应的,所述分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块为:分类词库更新服务器根据收到的分类词库更新模块的请求,获取自身存储的需更新的分类词库信息,并将获取的分类词库信息和需要推荐的分类词库的信息发送给分类词库更新模块。
上述方案中,所述确定需更新的分类词库具体为:对每个分类词库,对比分类词库更新服务器返回信息中的版本标识和本地分类词库文件中的版本标识;如果分类词库更新服务器返回的版本标识更新,则将此分类词库版本标识添加到待更新分类词库列表中;如果本地没有分类词库更新服务器返回的分类词库信息对应的词库,则将此分类词库版本标识添加到待更新分类词库列表中。
本发明还提供了一种分类词库的维护方法,包括:设置分类词库列表文件,根据需对分类词库进行的维护操作更新所述分类词库列表文件存储的分类词库元信息。
本发明又提供了一种客户端,该客户端中设置有分类词库系统,所述分类词库系统包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,
输入法核心处理模块,用于实现输入法的基本功能;
分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;
分类词库维护模块,用于对分类词库列表文件进行维护管理;
其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新。
本发明所提供的分类词库系统及其更新和维护方法、以及客户端,根据用户需求设置一个或一个以上分类词库,并通过分类词库列表文件对分类词库进行维护和更新;当输入法核心处理模块生成候选词时,除了查找输入法的基本词库之外,还依次查找分类词库列表文件中的每个分类词库,以便生成用户所需的候选词。如此,就能根据用户需求为不同用户提供不同的个性化词库,满足用户对输入法词库的个性化需求,方便用户的使用,进而可以更准确、快速地获取用户所需的输入词,提高输入效率。
本发明中,分类词库可以动态地增加、删除、启用或禁用,所有操作通过分类词库列表文件进行维护,其中,对分类词库的增加可以采用各种不同的方式,比如:用户在客户端侧自行添加、由网络侧服务器推送等等;用户可以根据感兴趣的热点话题构成新的分类词库,还可以根据聊天记录所采集的同类词句构成新的分类词库,总之,具体实现方式多种多样,令用户的使用更灵活、多样、简单、方便。
附图说明
图1为本发明分类词库系统的组成结构示意图;
图2为本发明分类词库系统中分类词库列表文件的维护界面示意图;
图3为本发明分类词库更新的一种实现流程示意图。
具体实施方式
本发明的基本思想是:设置一个或一个以上分类词库,并通过分类词库列表文件对分类词库进行维护和更新;当输入法核心处理模块生成候选词时,除了查找输入法的基本词库之外,还依次查找分类词库列表文件中的每个分类词库,以便生成用户所需的候选词。
本发明的分类词库系统,除服务器部分以外的其他部分可以设置在客户端上,也可以作为单独的实体设置于网络中,且同时与客户端和服务器相连并交互信息。下面以分类词库系统设置于客户端上为例具体描述本发明的实现。
在每个用户的客户端上,所设置的分类词库是相对独立的,各个客户端上可以包括完全不同的分类词库,也可以包括相同的分类词库,比如:客户端1上包括分类词库A、分类词库B,客户端2上包括分类词库C、分类词库D,客户端3上包括分类词库A、分类词库D、分类词库E。
所述分类词库可以由用户在客户端本地生成,也可以由服务器端生成推送给客户端,本申请中不做具体限定;所述分类词库一般以分类词库文件的形式存储,当然,实际应用中也可以采用其他形式,本申请中不做具体限定。
本发明的分类词库系统如图1所示,包括输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,
所述输入法核心处理模块,用于实现输入法的基本功能;
这里,所述基本功能包括:对用户输入进行音节划分;查找各个词库,根据用户的输入生成候选词;进行智能组词等等。通常,输入法核心处理模块在生成候选词之前,需要加载每一个启用的分类词库文件。输入法核心处理模块在进行候选词生成时,除了要查找输入法的基本词库以外,还要依次查找分类词库列表文件中记录的每一个分类词库。
所述分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;这里,所述元信息至少包括分类词库的版本标识(ID)、分类词库的名称(name)、分类词库的类别(type)。
进一步的,分类词库文件,是输入法核心处理模块读取的文件,每个分类词库文件对应一个分类词库,保存所对应分类词库的词的信息;
一般,分类词库文件的格式与输入法基本词库格式一样,每个分类词库文件中的版本标识,用于分类词库更新模块判断分类词库的版本,版本标识通常是一个不断递增的整数,数字越大表示分类词库越新;也可以将版本时间作为版本标识,这种情况下,确认是否为最新版本就比较版本时间是否为最新的。
分类词库列表文件,对应一个分类词库列表,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新;其中,元信息包括分类词库的ID、name和type。
通常,输入法核心处理模块和分类词库维护模块都需要读写分类词库列表文件。具体的,分类词库列表文件可采用如下格式存储元信息:
[cdict1]
id=1
name=新词更新
type=语言
[cdict2]
id=18
name=魔兽世界
type=网游
[cdict3]
id=2
name=常用聊天短语
type=语言
[cdict4]
id=3
name=成语俗语
type=文学
[cdict5]
id=4
name=诗词
type=文学
[cdict6]
id=5
name=腾讯发烧友
type=其它
其中,对每个分类词库记录有分类词库ID、分类词库文件名和分类词库类型的信息;ID用于唯一标识一个分类词库文件,为避免分类词库的文件名冲突,分类词库的文件名可与ID相同;分类词库文件名和分类词库类型在分类词库维护模块显示分类词库列表文件时会用到。
所有的分类词库,包括已启用的和未启用的分类词库都存放在同一个目录下,分类词库列表文件中记录有已由用户启用的分类词库;相应的,输入法核心处理模块正是根据该分类词库列表文件加载已由用户启用的所有分类词库。
所述分类词库维护模块,用于对分类词库列表文件进行维护管理,包括:增加分类词库、删除分类词库、启用分类词库、禁用分类词库等。
其中,用户添加的分类词库可以从网上下载,也可以由用户自己添加一个文本格式的词库作为分类词库,分类词库维护模块会将文本格式的文件转换为分类词库格式的文件并存储,具体如何添加分类词库本申请中不做限定。
这里,具体到用户添加分类词库可以有多种实现方式,举例来说,用户可以根据自己的兴趣热点构成相关的分类词库,比如:用户喜欢体育运动,经常在即时通信的聊天内容中会提到各种体育运动、体育比赛、体育项目、体育人物等等,那么,可将与体育相关的词句专门生成一个体育词库,添加在客户端,并将该体育词库的相关标识、名称、类型存放在分类词库列表文件中。再比如:用户与联系人聊天时,经常会涉及一些电影相关信息,那么,可以从聊天内容中采集与电影相关的同类词句,形成一个电影词库,添加在客户端,并将该体育词库的相关标识、名称、类型存放在分类词库列表文件中;这里,聊天内容可以是用户发给联系人的,也可以是联系人发给该用户的,联系人可以是一个人或是一组人。
本发明的分类词库系统还进一步包括分类词库更新模块和分类词库更新服务器;其中,
所述分类词库更新模块,用于更新客户端的分类词库,即:将分类词库更新为最新版本;分类词库更新模块更新分类词库时需要对分类词库列表文件进行读写操作,修改分类词库列表文件中的版本标识信息。
这里,所述更新是对用户启用的分类词库进行更新,更新可以是手动触发更新,也可以是自动更新。可以是周期性更新,如每天执行一次对分类词库的更新;也可以是在指定时间更新;还可以是根据用户请求在需要时进行更新。
所述分类词库更新服务器,用于提供需要更新的分类词库的信息和分类词库文件;
分类词库更新服务器包含一个存放分类词库元信息的数据库,并存储有每个分类词库的最新版本;分类词库更新服务器不仅可以对用户请求更新的分类词库进行更新,还可以主动推荐分类词库到客户端,比如:在奥运会期间,分类词库更新服务器可以主动生成并推送一个奥运词库,客户端收到后,由分类词库维护模块将该奥运词库的元信息添加到分类词库列表文件中,这样,各个用户不需要自己添加就可以自动启用一个奥运词库,非常方便。
本发明分类词库系统中的输入法核心处理模块、分类词库维护模块、分类词库存储模块以及分类词库更新模块位于客户端;分类词库更新服务器位于网络侧服务器端,该分类词库更新服务器可以与即时通信服务器合设、或与其他已有服务器合设、或作为一个单独的服务器。
本发明可进一步提供一种客户端,设置有图1所示的分类词库系统,除了能支持对现有输入法词库的操作,还能实现对分类词库的维护与更新。
图2为本发明分类词库系统中分类词库列表文件的维护界面,如图2所示,分类词库列表文件中包含若干个已由用户启用的分类词库,如:新词更新词库、诗词词库、魔兽世界词库、常用聊天短语词库、成语俗语词库、腾讯发烧友词库、体育词库、常见错误音词库。对于每个分类词库,还存储有该分类词库的名称、类型、所包含词条数目、版本标识,这里,以版本时间作为版本标识,表示此版本的新旧程度。
另外,此维护界面还提供有添加词库/删除词库的接口,如果选择,可触发分类词库维护模块完成增加分类词库/删除分类词库的操作;还提供有更新词库的接口,如果选择,可触发分类词库更新模块立即更新分类词库;还提供有词库下载接口,如果选择,可触发对所需分类词库的下载;还可以选择是否启用分类词库的自动更新、是否启用分类词库等等。
基于图1所示的分类词库系统结构,本发明对分类词库的维护流程包括:设置分类词库列表文件;根据需对分类词库进行的维护操作更新所述分类词库列表文件存储的分类词库信息。
这里,所述维护操作包括增加分类词库、删除分类词库、启用分类词库、禁用分类词库。
具体的,如果需要增加一个用户已启用的分类词库,则在分类词库列表文件增加一条记录,存储相应分类词库的元信息;如果需要删除一个用户已启用的分类词库,则从分类词库列表文件中删除相应分类词库的元信息记录;如果用户启用某个分类词库,可直接将该分类词库的元信息加入分类词库列表文件,作为分类词库列表文件的一条记录,当然也可以之后在需要时再加入;如果用户禁用某个分类词库,则直接从分类词库列表文件中删除相应分类词库的元信息记录。
基于图1所示的分类词库系统结构,本发明中分类词库更新的一种实现流程如图3所示,包括以下步骤:
步骤301:分类词库更新模块读取分类词库列表,构造请求更新分类词库ID的列表信息,并将所构造的列表信息发送给分类词库更新服务器;
本发明中,分类词库列表文件中一般包括所有已由用户启用的分类词库,因此,分类词库列表文件中列举的所有分类词库都是需要更新的。
本步骤中,所述构造就是按分类词库更新模块与分类词库更新服务器协商好的信息格式生成传输信息,所构造的列表信息中包括所有需更新的分类词库的ID。
步骤302:分类词库更新服务器根据收到的分类词库更新模块的请求,获取自身存储的需更新的分类词库信息,并返回给分类词库更新模块;
本步骤中,分类词库更新服务器先检查分类词库更新模块发送的请求更新的分类词库ID列表,根据ID在自身数据库中查找每个请求更新的分类词库的信息,包括版本标识等,并将这些信息返回给分类词库更新模块;如果分类词库更新服服务器有需要推荐的分类词库,则在返回的信息中增加上需要推荐的分类词库的信息。
步骤303:分类词库更新模块接收分类词库更新服务器返回的信息,确定需更新的分类词库;
本步骤中,分类词库更新模块接收分类词库更新服务器返回的分类词库信息,对每个分类词库,对比分类词库更新服务器返回信息中的版本标识和本地分类词库文件中的版本标识;如果分类词库更新服务器返回的版本标识大于本地版本标识,说明分类词库更新服务器中相应分类词库的版本更新,则将此分类词库ID添加到待更新分类词库列表中;如果本地没有分类词库更新服务器返回的分类词库信息对应的词库,说明相应分类词库是需要添加的,则将此分类词库ID也添加到待更新分类词库列表中。
这里,如果版本标识为整数,则越大表示分类词库越新;如果版本标识为版本时间作,则时间越晚表示分类词库越新。
步骤304:分类词库更新模块遍历待更新分类词库列表,分别向分类词库更新服务器发起请求,下载每个待更新的分类词库并覆盖本地的分类词库文件;
步骤305:所有待更新分类词库均下载完成后,设置需要重新加载分类词库的标志位。
本发明中,由于分类词库维护模块和分类词库更新模块都可能会改变分类词库列表文件、或分类词库文件;当改变发生后,需要通知输入法核心处理模块重新加载分类词库。因此,本发明为各个模块创建一个共享的内存空间,称为共享内存,共享内存中设置有一个标志位,用于表示是否需要重新加载分类词库。
一般,初始时标志位为0,表示不需要重新加载分类词库;当分类词库维护模块执行添加、或删除、或启用、或禁用操作后,需要将此标志位置为1,当分类词库更新模块更新分类词库后,即:所有待更新分类词库均下载完成后,也需要将此标志位置为1,表示分类词库更新完毕,需要重新加载分类词库。
输入法核心处理模块在每次候选词生成之前,都检查一次这个标志位,如果标志位为1,则先根据分类词库列表重新加载分类词库,然后再进行正常的候选词生成。
图3所示流程为客户端发起的更新流程,如果由服务器端发起主动更新的话,步骤301可省略,且步骤302变为:分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块;这里的分类词库信息为需要推荐的分类词库的信息。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (15)

1、一种分类词库系统,其特征在于,该分类词库系统包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,
输入法核心处理模块,用于实现输入法的基本功能;
分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;
分类词库维护模块,用于对分类词库列表文件进行维护管理;
其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新。
2、根据权利要求1所述的分类词库系统,其特征在于,该分类词库系统还包括分类词库更新模块和分类词库更新服务器;其中,
分类词库更新模块,用于更新客户端的分类词库;
分类词库更新服务器,用于提供需更新的分类词库的信息和分类词库文件。
3、根据权利要求2所述的分类词库系统,其特征在于,所述更新为手动触发更新、或为自动更新;
所述更新为周期性更新、或按指定时间更新、或根据用户请求在需要时进行更新。
4、根据权利要求1、2或3所述的分类词库系统,其特征在于,所述元信息包括分类词库的版本标识、分类词库的名称、分类词库的类别。
5、根据权利要求1、2或3所述的分类词库系统,其特征在于,所述维护管理包括增加分类词库、删除分类词库、启用分类词库、禁用分类词库。
6、根据权利要求1、2或3所述的分类词库系统,其特征在于,所述分类词库在客户端本地生成,或由服务器端生成推送给客户端。
7、一种分类词库的更新方法,其特征在于,该更新方法包括:
分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块;
分类词库更新模块接收分类词库更新服务器返回的信息,确定需更新的分类词库;
分类词库更新模块遍历待更新分类词库列表,分别向分类词库更新服务器发起请求,下载每个待更新的分类词库并覆盖本地的分类词库文件;
下载完成后,设置需要重新加载分类词库的标志位。
8、根据权利要求7所述的更新方法,其特征在于,在分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块之前,该方法还包括:
分类词库更新模块构造请求更新分类词库版本标识的列表信息,并将所构造的列表信息发送给分类词库更新服务器;
相应的,所述分类词库更新服务器将需更新的分类词库信息发送给分类词库更新模块为:分类词库更新服务器根据收到的分类词库更新模块的请求,获取自身存储的需更新的分类词库信息,并将获取的分类词库信息和需要推荐的分类词库的信息发送给分类词库更新模块。
9、根据权利要求7或8所述的更新方法,其特征在于,所述确定需更新的分类词库具体为:
对每个分类词库,对比分类词库更新服务器返回信息中的版本标识和本地分类词库文件中的版本标识;如果分类词库更新服务器返回的版本标识更新,则将此分类词库版本标识添加到待更新分类词库列表中;如果本地没有分类词库更新服务器返回的分类词库信息对应的词库,则将此分类词库版本标识添加到待更新分类词库列表中。
10、一种分类词库的维护方法,其特征在于,该维护方法包括:设置分类词库列表文件,根据需对分类词库进行的维护操作更新所述分类词库列表文件存储的分类词库元信息。
11、根据权利要求10所述的维护方法,其特征在于,所述维护操作包括增加分类词库、删除分类词库、启用分类词库、禁用分类词库;所述元信息包括分类词库的版本标识、分类词库的名称、分类词库的类别。
12、一种客户端,其特征在于,该客户端中设置有分类词库系统,所述分类词库系统包括:输入法核心处理模块、分类词库维护模块和分类词库存储模块;其中,
输入法核心处理模块,用于实现输入法的基本功能;
分类词库存储模块,用于存储一个或一个以上分类词库文件,并存储含有分类词库元信息的分类词库列表文件;
分类词库维护模块,用于对分类词库列表文件进行维护管理;
其中,每个分类词库文件对应一个分类词库,用于保存所对应分类词库的词的信息;分类词库列表文件,用于记录用户启用的各个分类词库的元信息,支持分类词库的维护和更新。
13、根据权利要求12所述客户端,其特征在于,所述分类词库系统还包括分类词库更新模块和分类词库更新服务器;其中,
分类词库更新模块,用于更新客户端的分类词库;
分类词库更新服务器,用于提供需更新的分类词库的信息和分类词库文件。
14、根据权利要求13所述客户端,其特征在于,所述更新为手动触发更新、或为自动更新;
所述更新为周期性更新、或按指定时间更新、或根据用户请求在需要时进行更新。
15、根据权利要求12、13或14所述客户端,其特征在于,所述元信息包括分类词库的版本标识、分类词库的名称、分类词库的类别;所述维护管理包括增加分类词库、删除分类词库、启用分类词库、禁用分类词库。
CN200910091922A 2009-09-01 2009-09-01 一种分类词库系统及其更新和维护方法、以及客户端 Pending CN101645087A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910091922A CN101645087A (zh) 2009-09-01 2009-09-01 一种分类词库系统及其更新和维护方法、以及客户端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910091922A CN101645087A (zh) 2009-09-01 2009-09-01 一种分类词库系统及其更新和维护方法、以及客户端

Publications (1)

Publication Number Publication Date
CN101645087A true CN101645087A (zh) 2010-02-10

Family

ID=41656975

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910091922A Pending CN101645087A (zh) 2009-09-01 2009-09-01 一种分类词库系统及其更新和维护方法、以及客户端

Country Status (1)

Country Link
CN (1) CN101645087A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209083A (zh) * 2010-03-31 2011-10-05 北京搜狗科技发展有限公司 一种用户词库同步更新方法、更新服务器及输入法系统
CN102467320A (zh) * 2010-11-09 2012-05-23 腾讯科技(深圳)有限公司 一种输入法、输入法装置及系统
CN103324627A (zh) * 2012-03-21 2013-09-25 宇龙计算机通信科技(深圳)有限公司 终端和输入处理方法
CN103389979A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 在输入法中推荐分类词库的系统、装置及方法
CN104854585A (zh) * 2013-06-03 2015-08-19 东莞宇龙通信科技有限公司 关联提示输入系统、终端和关联提示输入方法
CN105022759A (zh) * 2014-04-30 2015-11-04 腾讯科技(深圳)有限公司 一种在组织内进行快速输入的方法和装置
CN106021527A (zh) * 2016-05-24 2016-10-12 努比亚技术有限公司 一种数据处理方法及搜索服务器、同步服务器
CN106933801A (zh) * 2017-02-13 2017-07-07 北京奇虎科技有限公司 一种词库的更新方法和装置
CN103678371B (zh) * 2012-09-14 2017-10-10 富士通株式会社 词库更新装置、数据整合装置和方法以及电子设备
CN108228620A (zh) * 2016-12-14 2018-06-29 北京搜狗科技发展有限公司 一种词库更新方法及装置
CN108256051A (zh) * 2018-01-15 2018-07-06 中企动力科技股份有限公司 网站产品生成方法及装置
CN109597498A (zh) * 2018-11-29 2019-04-09 北京蓦然认知科技有限公司 一种基于场景的输入方法、装置、设备
CN109754786A (zh) * 2017-11-06 2019-05-14 奥迪股份公司 用于车辆的语音控制装置
CN110288993A (zh) * 2019-06-26 2019-09-27 广州探迹科技有限公司 一种基于容器技术的个性化智能语音交互方法及装置
CN111354342A (zh) * 2020-02-28 2020-06-30 科大讯飞股份有限公司 一种个性化词库的更新方法、装置、设备及存储介质

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102209083A (zh) * 2010-03-31 2011-10-05 北京搜狗科技发展有限公司 一种用户词库同步更新方法、更新服务器及输入法系统
CN102209083B (zh) * 2010-03-31 2015-03-18 北京搜狗科技发展有限公司 一种用户词库同步更新方法、更新服务器及输入法系统
CN102467320A (zh) * 2010-11-09 2012-05-23 腾讯科技(深圳)有限公司 一种输入法、输入法装置及系统
CN103324627A (zh) * 2012-03-21 2013-09-25 宇龙计算机通信科技(深圳)有限公司 终端和输入处理方法
CN103389979A (zh) * 2012-05-08 2013-11-13 腾讯科技(深圳)有限公司 在输入法中推荐分类词库的系统、装置及方法
WO2013166949A1 (en) * 2012-05-08 2013-11-14 Shenzhen Shi Ji Guang Su Information Technology Co., Ltd. System, apparatus and method for recommending thesaurus in input method
CN103389979B (zh) * 2012-05-08 2018-10-12 深圳市世纪光速信息技术有限公司 在输入法中推荐分类词库的系统、装置及方法
US9984328B2 (en) 2012-05-08 2018-05-29 Shenzhen Shi Ji Guang Su Information Technology Co., Ltd. System, apparatus and method for recommending thesaurus in input method
CN103678371B (zh) * 2012-09-14 2017-10-10 富士通株式会社 词库更新装置、数据整合装置和方法以及电子设备
CN104854585A (zh) * 2013-06-03 2015-08-19 东莞宇龙通信科技有限公司 关联提示输入系统、终端和关联提示输入方法
CN104854585B (zh) * 2013-06-03 2018-12-25 东莞宇龙通信科技有限公司 关联提示输入系统、终端和关联提示输入方法
CN105022759B (zh) * 2014-04-30 2021-04-09 腾讯科技(深圳)有限公司 一种在组织内进行快速输入的方法和装置
CN105022759A (zh) * 2014-04-30 2015-11-04 腾讯科技(深圳)有限公司 一种在组织内进行快速输入的方法和装置
CN106021527B (zh) * 2016-05-24 2019-06-28 努比亚技术有限公司 一种数据处理方法及搜索服务器、同步服务器
CN106021527A (zh) * 2016-05-24 2016-10-12 努比亚技术有限公司 一种数据处理方法及搜索服务器、同步服务器
CN108228620A (zh) * 2016-12-14 2018-06-29 北京搜狗科技发展有限公司 一种词库更新方法及装置
CN106933801A (zh) * 2017-02-13 2017-07-07 北京奇虎科技有限公司 一种词库的更新方法和装置
CN106933801B (zh) * 2017-02-13 2021-02-05 北京安云世纪科技有限公司 一种词库的更新方法和装置
CN109754786A (zh) * 2017-11-06 2019-05-14 奥迪股份公司 用于车辆的语音控制装置
CN108256051A (zh) * 2018-01-15 2018-07-06 中企动力科技股份有限公司 网站产品生成方法及装置
CN109597498A (zh) * 2018-11-29 2019-04-09 北京蓦然认知科技有限公司 一种基于场景的输入方法、装置、设备
CN110288993A (zh) * 2019-06-26 2019-09-27 广州探迹科技有限公司 一种基于容器技术的个性化智能语音交互方法及装置
CN111354342A (zh) * 2020-02-28 2020-06-30 科大讯飞股份有限公司 一种个性化词库的更新方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN101645087A (zh) 一种分类词库系统及其更新和维护方法、以及客户端
CN100483416C (zh) 一种字符输入的方法、输入法系统及词库更新的方法
US10423649B2 (en) Natural question generation from query data using natural language processing system
US9501467B2 (en) Systems, methods, software and interfaces for entity extraction and resolution and tagging
CN102982021B (zh) 用于消除语言转换中的多个读法的歧义的方法
US9183192B1 (en) Translator
US20070055493A1 (en) String matching method and system and computer-readable recording medium storing the string matching method
US20070156404A1 (en) String matching method and system using phonetic symbols and computer-readable recording medium storing computer program for executing the string matching method
CN109635270A (zh) 双向概率性的自然语言重写和选择
JP2010529569A (ja) 辞書の単語及び熟語の判定
AU2004200638A1 (en) Methods and systems for language translation
WO2007004408A1 (ja) 情報処理装置,情報処理方法および情報処理プログラム
US20070011160A1 (en) Literacy automation software
JP4558680B2 (ja) 出願文書情報作成装置、説明情報抽出装置、出願文書情報作成方法、説明情報抽出方法
JP2007157123A (ja) 改善された中国語−英語翻訳ツール
EP2261818A1 (en) A method for inter-lingual electronic communication
Balakrishnan et al. Digital library of India: a testbed for Indian language research
JP5382965B2 (ja) 出願文書情報作成装置、出願文書情報作成方法、及びプログラム
JP2009104475A (ja) 類似文書検索装置、類似文書検索方法およびプログラム
Keskustalo et al. Analyzing gender clues in war-time letters
JP4579281B2 (ja) 出願文書情報作成装置、出願文書情報作成方法、及びプログラム
JPS61248160A (ja) 文書情報登録方式
CN110347804A (zh) 一种线性时间复杂度的敏感信息检测方法
US20040164989A1 (en) Method and apparatus for disclosing information, and medium for recording information disclosure program
Trips et al. From original sources to linguistic analysis: Tools and datasets for the investigation of multilingualism in medieval english

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20100210