CN107341251A - 一种医药偏方与关键字的提取和处理方法 - Google Patents
一种医药偏方与关键字的提取和处理方法 Download PDFInfo
- Publication number
- CN107341251A CN107341251A CN201710555383.2A CN201710555383A CN107341251A CN 107341251 A CN107341251 A CN 107341251A CN 201710555383 A CN201710555383 A CN 201710555383A CN 107341251 A CN107341251 A CN 107341251A
- Authority
- CN
- China
- Prior art keywords
- keyword
- text
- medical
- folk prescription
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 20
- 238000012937 correction Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000011218 segmentation Effects 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims abstract description 4
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000005540 biological transmission Effects 0.000 claims description 9
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 241001672694 Citrus reticulata Species 0.000 claims description 3
- 238000005194 fractionation Methods 0.000 claims description 3
- 239000002245 particle Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000003542 behavioural effect Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 abstract description 8
- 235000013305 food Nutrition 0.000 description 26
- 206010012601 diabetes mellitus Diseases 0.000 description 16
- 238000005516 engineering process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3343—Query execution using phonetics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
本发明涉一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;终端发送搜索输入命令将文本和/或语音命令传输至服务端;服务端提取文字命令文本,服务端进行处理;服务端通过对文本进行自然分割、词库分割、词组分词的方式提取有效的关键字;服务器通过比对关键字。本发明能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
Description
技术领域
本发明涉及软件方法,具体涉及一种医药偏方与关键字的提取和处理方法。
背景技术
目前国内老年人群在受教育程度上差异很大,对智能设备的接受程度也有很大不同,在输入文本上有大量的表述不清、错字、语序混乱问题,在终端的医药偏方推送中,往往不能够明确的得知用户的真实意图,因此,需要设计一种能够纠错、识别语音并高效筛选关键字进行文本推送的方法,以解决老年人群体使用终端带来的极大不便。
发明内容
本发明的目的在于克服现有技术中的缺陷,设计一种医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
为实现上述目的,本发明所采用的技术方案是一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;二级关键词优先为主要检索关键词,初级关键词为次要检索关键词组及非文本的目的判断,如分割出的标点符号及空格、标点符号不进入偏方搜索关键词范围。
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。根据得出的关键词进行数据库中的文章搜索,命中关键词越多的文章推送权重越高,相同命中效果的文章根据文章浏览量、更新时间进行次级排序。
优选的,步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
优选的,步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
语音分析软件采用第三方语音解析能力,可选用是科大讯飞股份有限公司的语音识别引擎等相关分析软件得到文本。也可以选择多个多个第三方的语音转文字系统服务多维转换得最终结果。
优选的,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。如文本“糖尿病应该食用哪些食物”,则系统优先划分为“糖尿病”“应该食用哪些”“食物”,确保贴切终端的索索意图。
优选的,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”“应该食用”“食用哪些食物”“食用哪些”。
优选的,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”,分析出的结果为“糖尿病”“食用”“食物”,主要索引项以及这三个词的顺序组合,按照顺序优先原则得出关键搜索词组合,整个分析基本的原则就是分割关键词按最少的分割。最少次数分割原则为断句式分割方式,不做相同文字的多次组词处理。
优选的,终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
优选的,步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。如文本“糖尿病应该食用哪些食物”,分字处理后得到“糖”“尿”“病”“应该”“食”“用”“哪”“些”“食物”,然后去数据库中匹配。
优选的,步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。如“食物”,在文本或语音输入过程中可能会成为“事务”或“实物”“失误”等错误信息,通过纠错处理后,替换为正确的“食物”。
优选的,终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
本发明的优点和有益效果在于:
医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
附图说明
图1是本发明医药偏方与关键字的提取和处理方法的流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施例1
如图1所示:本实施例为一种医药偏方与关键字的提取和处理方法,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;二级关键词优先为主要检索关键词,初级关键词为次要检索关键词组及非文本的目的判断,如分割出的标点符号及空格、标点符号不进入偏方搜索关键词范围。
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。根据得出的关键词进行数据库中的文章搜索,命中关键词越多的文章推送权重越高,相同命中效果的文章根据文章浏览量、更新时间进行次级排序。
步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
语音分析软件采用第三方语音解析能力,可选用是科大讯飞股份有限公司的语音识别引擎等相关分析软件得到文本。
优选的,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。如文本“糖尿病应该食用哪些食物”,则系统优先划分为“糖尿病”“应该食用哪些”“食物”,确保贴切终端的索索意图。
优选的,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”“应该食用”“食用哪些食物”“食用哪些”。
优选的,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。如文本“糖尿病应该食用哪些食物”,则系统划分为“糖尿病”“应该”“食用”“哪些”“食物”,分析出的结果为“糖尿病”“食用”“食物”,主要索引项以及这三个词的顺序组合,按照顺序优先原则得出关键搜索词组合,整个分析基本的原则就是分割关键词按最少的分割。最少次数分割原则为断句式分割方式,不做相同文字的多次组词处理。
终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。如文本“糖尿病应该食用哪些食物”,分字处理后得到“糖”“尿”“病”“应该”“食”“用”“哪”“些”“食物”,然后去数据库中匹配。
步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。如“食物”,在文本或语音输入过程中可能会成为“事务”或“实物”“失误”等错误信息,通过纠错处理后,替换为正确的“食物”。
终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
本实施例的有益效果在于:
医药偏方与关键字的提取和处理方法,能够接收文字和语音文本,并进行高效的关键系拆分提取,有效的就行纠错处理,得出最终的关键字,并依据关键字的排序进行推送文本的筛选和排序,根据终端搜索词进行服务端分析处理,得出有效检索关键词,为老年人的使用带来极大的便利,提高了医药偏方筛选推送的准确性。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种医药偏方与关键字的提取和处理方法,其特征在于,利用终端和服务端的计算处理对医药偏方与关键字进行提取和处理;
具体的方法步骤为:
(1)终端发送搜索输入命令将文本和/或语音命令传输至服务端;
(2)服务端提取文字命令文本,将语音命令转换为文本,服务端的服务器对搜索命令进行处理;
(3)服务端通过对文字命令文本和语音命令转换的文本进行自然分割、词库分割、词组分词的方式提取有效的初级关键字;
(4)服务器同时对文字命令文本和语音命令转换的文本进行分字和纠错处理后,得到二级关键字;
(5)服务器通过比对初级关键字和二级关键字后进行关键字排序,按排序先后的关键字与数据库中的医药偏方文章对比后将搜索结果按对应的排序推送至客户端,为用户提供医药偏方信息。
2.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(1)中,搜索输入命令包括输入法文本命令传输和语音输入音频命令传输;终端同时传输终端信息至服务端,包括终端位置、常使用位置信息。
3.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(2)中,将语音命令转换为文本过程中采用语音分析,其中语音分析优先采用普通话解析,同时根据步骤(1)上传的用户身份及所在地区方言进行解析,得出语音命令转换的文本。
4.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中自然分割的方式是以语气词、标点符号、空格符号、换行符作为首要分割条件对文本进行分割,以此为基础满足提取的关键词贴切终端的搜索意图。
5.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中的词库分割方式是依靠中文词典数据库、终端历史行为词库、历史搜索词库、全平台热门搜索词库进行关键词组合分割。
6.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(3)中的词组分词方式是利用终端的历史行为数据按照顺序优先原则得出关键搜索词组合即初级关键字,分析原则就是分割关键词按最少分割次数的分割。
7.如权利要求6所述的医药偏方与关键字的提取和处理方法,其特征在于,终端的历史行为数据包含终端历史行为词库、历史搜索词库、全平台热门搜索词库,以及终端使用过程中通过内容标签记录用户行为的关键词数据,记录用户有效历史搜索关键词、记录全平台用户搜索关键词及热门搜索词数据。
8.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(4)中服务器的分字处理是将文本文本拆分为基本的字和/或词,将拆分的字词与服务端的数据库进行比对后得到二级关键词。
9.如权利要求1所述的医药偏方与关键字的提取和处理方法,其特征在于,步骤(4)中服务器的纠错处理是为了防止终端错误输入文字或语音转文字处理错误的因素;服务端对错别字进行处理分析时,首先通过近义词匹配来进行纠错,然后采用常见同音字判断词组是否存在,若存在则进行纠错替换。
10.如权利要求1-9任一所述的医药偏方与关键字的提取和处理方法,其特征在于,终端智能设备终端,包括手机、电脑及平板电脑;服务端通过有线和/或无线的方式与终端数据连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710555383.2A CN107341251A (zh) | 2017-07-10 | 2017-07-10 | 一种医药偏方与关键字的提取和处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710555383.2A CN107341251A (zh) | 2017-07-10 | 2017-07-10 | 一种医药偏方与关键字的提取和处理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107341251A true CN107341251A (zh) | 2017-11-10 |
Family
ID=60219735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710555383.2A Pending CN107341251A (zh) | 2017-07-10 | 2017-07-10 | 一种医药偏方与关键字的提取和处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107341251A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832442A (zh) * | 2017-11-17 | 2018-03-23 | 陆光辉 | 一种中医药信息查询系统和方法 |
CN109243549A (zh) * | 2018-07-11 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 一种智能随访方法、装置及服务器 |
CN109360589A (zh) * | 2018-10-25 | 2019-02-19 | 天水师范学院 | 一种体育赛事数据统计方法及系统 |
CN109979450A (zh) * | 2019-03-11 | 2019-07-05 | 青岛海信电器股份有限公司 | 信息处理方法、装置及电子设备 |
CN110827801A (zh) * | 2020-01-09 | 2020-02-21 | 成都无糖信息技术有限公司 | 一种基于人工智能的自动语音识别方法及系统 |
CN110880316A (zh) * | 2019-10-16 | 2020-03-13 | 苏宁云计算有限公司 | 一种音频的输出方法和系统 |
CN111161706A (zh) * | 2018-10-22 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 交互方法、装置、设备和系统 |
CN111291088A (zh) * | 2020-01-17 | 2020-06-16 | 安徽机器猫电子商务股份有限公司 | 一种基于从属关系的零件号智能搜索方法 |
CN117152778A (zh) * | 2023-10-31 | 2023-12-01 | 安徽省立医院(中国科学技术大学附属第一医院) | 一种基于ocr的医疗器械注册证识别方法、装置及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912872A (zh) * | 2006-07-25 | 2007-02-14 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
CN101206673A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 网络搜索过程中关键词的智能纠错系统及方法 |
US20100161655A1 (en) * | 2008-12-22 | 2010-06-24 | Electronics And Telecommunications Research Institute | System for string matching based on segmentation method and method thereof |
CN102930022A (zh) * | 2012-10-31 | 2013-02-13 | 中国运载火箭技术研究院 | 面向用户的信息搜索引擎系统及方法 |
CN104281702A (zh) * | 2014-10-22 | 2015-01-14 | 国家电网公司 | 基于电力关键词分词的数据检索方法及装置 |
CN106815195A (zh) * | 2015-11-27 | 2017-06-09 | 方正国际软件(北京)有限公司 | 一种分词方法及装置、检索方法及装置 |
-
2017
- 2017-07-10 CN CN201710555383.2A patent/CN107341251A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1912872A (zh) * | 2006-07-25 | 2007-02-14 | 北京搜狗科技发展有限公司 | 一种提取新词的方法和系统 |
CN101206673A (zh) * | 2007-12-25 | 2008-06-25 | 北京科文书业信息技术有限公司 | 网络搜索过程中关键词的智能纠错系统及方法 |
US20100161655A1 (en) * | 2008-12-22 | 2010-06-24 | Electronics And Telecommunications Research Institute | System for string matching based on segmentation method and method thereof |
CN102930022A (zh) * | 2012-10-31 | 2013-02-13 | 中国运载火箭技术研究院 | 面向用户的信息搜索引擎系统及方法 |
CN104281702A (zh) * | 2014-10-22 | 2015-01-14 | 国家电网公司 | 基于电力关键词分词的数据检索方法及装置 |
CN106815195A (zh) * | 2015-11-27 | 2017-06-09 | 方正国际软件(北京)有限公司 | 一种分词方法及装置、检索方法及装置 |
Non-Patent Citations (3)
Title |
---|
B.GATOS: "A segmentation-free approach for keyword search in historical typewritten documents", 《IEEEXPLORE》 * |
吴亮等: "基于关键词筛选分词算法的企业级搜索引擎", 《微型电脑应用》 * |
欧振猛等: "中文分词算法在搜索引擎应用中的研究", 《计算机工程与应用》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107832442A (zh) * | 2017-11-17 | 2018-03-23 | 陆光辉 | 一种中医药信息查询系统和方法 |
CN109243549A (zh) * | 2018-07-11 | 2019-01-18 | 腾讯科技(深圳)有限公司 | 一种智能随访方法、装置及服务器 |
CN109243549B (zh) * | 2018-07-11 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 一种智能随访方法、装置及服务器 |
CN111161706A (zh) * | 2018-10-22 | 2020-05-15 | 阿里巴巴集团控股有限公司 | 交互方法、装置、设备和系统 |
CN109360589A (zh) * | 2018-10-25 | 2019-02-19 | 天水师范学院 | 一种体育赛事数据统计方法及系统 |
CN109979450B (zh) * | 2019-03-11 | 2021-12-07 | 海信视像科技股份有限公司 | 信息处理方法、装置及电子设备 |
CN109979450A (zh) * | 2019-03-11 | 2019-07-05 | 青岛海信电器股份有限公司 | 信息处理方法、装置及电子设备 |
CN110880316A (zh) * | 2019-10-16 | 2020-03-13 | 苏宁云计算有限公司 | 一种音频的输出方法和系统 |
CN110827801B (zh) * | 2020-01-09 | 2020-04-17 | 成都无糖信息技术有限公司 | 一种基于人工智能的自动语音识别方法及系统 |
CN110827801A (zh) * | 2020-01-09 | 2020-02-21 | 成都无糖信息技术有限公司 | 一种基于人工智能的自动语音识别方法及系统 |
CN111291088A (zh) * | 2020-01-17 | 2020-06-16 | 安徽机器猫电子商务股份有限公司 | 一种基于从属关系的零件号智能搜索方法 |
CN117152778A (zh) * | 2023-10-31 | 2023-12-01 | 安徽省立医院(中国科学技术大学附属第一医院) | 一种基于ocr的医疗器械注册证识别方法、装置及介质 |
CN117152778B (zh) * | 2023-10-31 | 2024-01-16 | 安徽省立医院(中国科学技术大学附属第一医院) | 一种基于ocr的医疗器械注册证识别方法、装置及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107341251A (zh) | 一种医药偏方与关键字的提取和处理方法 | |
US11675977B2 (en) | Intelligent system that dynamically improves its knowledge and code-base for natural language understanding | |
KR102163549B1 (ko) | 선행사의 결정방법 및 장치 | |
US9164983B2 (en) | Broad-coverage normalization system for social media language | |
US9058322B2 (en) | Apparatus and method for providing two-way automatic interpretation and translation service | |
US20150026106A1 (en) | Non-factoid question-answering system and computer program | |
US10803253B2 (en) | Method and device for extracting point of interest from natural language sentences | |
US20120303355A1 (en) | Method and System for Text Message Normalization Based on Character Transformation and Web Data | |
CN107077843A (zh) | 对话控制装置和对话控制方法 | |
CN111881297B (zh) | 语音识别文本的校正方法及装置 | |
CN106649778A (zh) | 基于深度问答的交互方法和装置 | |
CN105760359B (zh) | 问句处理系统及其方法 | |
US20140214406A1 (en) | Method and system of adding punctuation and establishing language model | |
CN107844470A (zh) | 一种语音数据处理方法及其设备 | |
CN104679735A (zh) | 语用机器翻译方法 | |
US9063923B2 (en) | Method for identifying the integrity of information | |
US10366173B2 (en) | Device and method of simultaneous interpretation based on real-time extraction of interpretation unit | |
CN106021532B (zh) | 关键词的显示方法和装置 | |
KR101333485B1 (ko) | 온라인 사전을 이용한 개체명 사전 구축 방법 및 이를 실행하는 장치 | |
CN103164397B (zh) | 汉哈电子辞典及其自动转译汉哈语的方法 | |
CN104572617A (zh) | 一种口语考试偏题检测方法及装置 | |
KR20150042533A (ko) | 복합 문장 분석 장치, 이를 위한 기록매체 | |
CN110610003A (zh) | 用于辅助文本标注的方法和系统 | |
RU2595531C2 (ru) | Способ и система генерирования определения слова на основе множественных источников | |
CN117556050B (zh) | 数据分类分级方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171110 |
|
WD01 | Invention patent application deemed withdrawn after publication |