[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN110781677A - 药品信息匹配处理方法、装置、计算机设备和存储介质 - Google Patents

药品信息匹配处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110781677A
CN110781677A CN201910969896.7A CN201910969896A CN110781677A CN 110781677 A CN110781677 A CN 110781677A CN 201910969896 A CN201910969896 A CN 201910969896A CN 110781677 A CN110781677 A CN 110781677A
Authority
CN
China
Prior art keywords
medicine
information
matching
drug
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910969896.7A
Other languages
English (en)
Other versions
CN110781677B (zh
Inventor
唐莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Medical Health Technology Service Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN201910969896.7A priority Critical patent/CN110781677B/zh
Publication of CN110781677A publication Critical patent/CN110781677A/zh
Application granted granted Critical
Publication of CN110781677B publication Critical patent/CN110781677B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Human Computer Interaction (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及一种人工智能领域的药品信息匹配处理方法、装置、计算机设备和存储介质。所述方法包括:接收终端上传的问题信息;调用线程对所述问题信息进行分词处理,得到对应的向量矩阵;将所述向量矩阵输入至训练后的分类模型中,计算所述向量矩阵对应的多个上下文向量,根据所述上下文向量识别所述问题信息对应的意图类型;当所述意图类型为与药品相关的意图类型时,在药品词典库中识别所述问题信息中的药品实体;调用线程扫描数据库,确定所述药品实体对应的药品级别;根据所述药品级别在所述数据库中进行药品信息匹配,输出与所述问题信息对应的药品答复信息,将所述药品答复信息返回至终端。采用本方法能够提高药品信息匹配的准确性。

Description

药品信息匹配处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种药品信息匹配处理方法、装置、计算机设备和存储介质。
背景技术
目前,我国医疗资源紧张,用药安全问题日益严峻。为了解决用药安全问题,出现了药品信息匹配处理方法。传统的药品信息匹配处理方法是通过接收用户的问题信息,直接对问题信息进行特征提取,从而识别问题信息中的用户意图,并识别问题信息中的药品实体,利用药品实体查找对应的药品答复信息。
传统的药品信息匹配处理方法中,由于问题信息中存在较多干扰信息,导致药品信息匹配的准确性较低。因此,如何提高药品信息匹配的准确性成为目前需要解决的一个技术问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够通过过滤问题信息中的干扰信息来提高药品信息匹配的准确性的药品信息匹配处理方法、装置、计算机设备和存储介质。
一种药品信息匹配处理方法,所述方法包括:
接收终端上传的问题信息;
调用线程对所述问题信息进行分词处理,得到对应的向量矩阵;
将所述向量矩阵输入至训练后的分类模型中,计算所述向量矩阵对应的多个上下文向量,根据所述上下文向量识别所述问题信息对应的意图类型;
当所述意图类型为与药品相关的意图类型时,在药品词典库中识别所述问题信息中的药品实体;
调用线程扫描数据库,确定所述药品实体对应的药品级别;
根据所述药品级别在所述数据库中进行药品信息匹配,输出与所述问题信息对应的药品答复信息,将所述药品答复信息返回至终端。
在其中一个实施例中,所述分类模型包括多个网络层,所述计算所述向量矩阵对应的多个上下文向量,根据所述上下文向量识别所述问题信息对应的意图类型包括:
将向量矩阵输入至训练后的分类模型中,通过所述分类模型的输入层提取所述向量矩阵中的多个词向量;
将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果;
将所述第一提取结果输入卷积层,提取所述上下文向量对应的上下文特征,生成第二提取结果;
将所述第二提取结果输入池化层,对所述第二提取结果进行降维处理;
将降维处理后的第二提取结果输入全连接层,对所述降维处理后的第二提取结果进行分类得到分类结果,通过输出层将所述分类结果进行加权后输出;
选取加权后输出的分类结果中权重最大的意图类型作为所述问题信息对应的意图类型。
在其中一个实施例中,所述在药品词典库中识别所述问题信息中的药品实体包括:
提取所述问题信息中的药品特征信息;
将所述药品特征信息与药品词典库进行精确匹配;
当精确匹配无法识别药品实体时,将所述药品特征信息与药品词典库进行模糊匹配,确定所述问题信息对应的药品实体。
在其中一个实施例中,所述调用线程扫描数据库,确定所述药品实体对应的药品级别包括:
将所述药品实体与数据库中的药品级别进行字符匹配;
当字符匹配未成功时,将所述药品实体与对应的药品级别进行拼音匹配;
选取拼音匹配概率最高的药品级别,作为所述药品实体对应的药品级别。
在其中一个实施例中,所述根据所述药品级别在数据库中进行药品信息匹配包括:
调用线程扫描配置文件,所述配置文件中记录有多个药品级别以及对应的匹配顺序;
根据所述药品级别对应的匹配顺序将所述药品实体与数据库进行字符匹配,得到所述问题信息对应的药品答复信息。
一种药品信息匹配处理装置,所述装置包括:
通信模块,用于接收终端上传的问题信息;
分词模块,用于调用线程对所述问题信息进行分词处理,得到对应的向量矩阵;
第一识别模块,用于将所述向量矩阵输入至训练后的分类模型中,计算所述向量矩阵对应的多个上下文向量;根据所述上下文向量识别所述问题信息对应的意图类型;
第二识别模块,用于当所述意图类型为与药品相关的意图类型时,在药品词典库中识别所述问题信息中的药品实体;
确定模块,用于利用线程扫描数据库,确定所述药品实体对应的药品级别;
匹配模块,用于根据所述药品级别在数据库中进行药品匹配,输出与所述问题信息对应的药品答复信息。
在其中一个实施例中,所述第一识别模块还用于将分词序列输入至训练后的分类模型中,通过所述分类模型的输入层提取所述向量矩阵中的多个词向量;将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果;将所述第一提取结果输入卷积层,提取所述上下文向量对应的上下文特征,生成第二提取结果;将所述第二提取结果输入池化层,对所述第二提取结果进行降维处理;将降维处理后的第二提取结果输入全连接层,对所述降维处理后的第二提取结果进行分类得到分类结果,通过输出层将所述分类结果进行加权后输出;选取加权后输出的分类结果中权重最大的意图类型作为所述问题信息对应的意图类型。
在其中一个实施例中,所述第二识别模块还用于提取所述问题信息中的药品特征信息;将所述药品特征信息与药品词典库进行精确匹配;当精确匹配无法识别药品实体时,将所述药品特征信息与药品词典库进行模糊匹配,确定所述问题信息对应的药品实体。
一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述各个方法实施例中的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述各个方法实施例中的步骤。
上述药品信息匹配处理方法、装置、计算机设备和存储介质,通过调用线程对问题信息进行分词处理,得到对应的向量矩阵,有利于输入训练后的分类模型中。通过训练后的分类模型计算向量矩阵对应的多个上下文向量,并根据上下文向量识别问题信息对应的意图类型,能够将问题信息中干扰信息进行过滤,实现对向量矩阵进行词语聚焦处理,进而提高意图识别的准确性。在识别问题信息中的药品实体后,调用线程扫描数据库,确定药品实体对应的药品级别,能够对药品实体进行有效分类,实现对药品粒度进行更为精细的划分。通过药品级别在数据库中进行药品信息匹配,输出与问题信息对应的药品答复信息,能够针对多样化的问题信息实现药品信息匹配,进而提高药品信息匹配的准确性以及全面性。
附图说明
图1为一个实施例中药品信息匹配处理方法的流程示意图;
图2为一个实施例中识别问题信息对应的意图类型步骤的流程示意图;
图3为一个实施例中药品信息匹配处理装置的结构框图;
图4为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种药品信息匹配处理方法,以该方法应用于计算机设备为例进行说明,包括以下步骤:
步骤102,接收终端上传的问题信息。
步骤104,调用线程对问题信息进行分词处理,得到对应的向量矩阵。
计算机设备可以接收终端上传的问题信息。其中,问题信息可以是语音信息,也可以是文本信息。当问题信息为语音信息时,计算机设备对语音信息进行语音识别,得到对应的文本信息。计算机设备在获取终端上传的问题信息后,可以对问题信息进行分词处理。具体地,计算机设备可以先对问题信息进行词性标注。计算机设备获取预先建立的词库,词库中包括大量的大量的常用词汇和特定词汇以及对应的词性标记信息。
计算机设备提取问题信息中的词汇,根据词汇在词库中提取对应的所有词性标记信息,根据词性标记信息确定每个词汇对应的词性,从而得到词性标注结果。计算机设备根据词性标注结果将问题信息与词库中的多个词汇进行匹配,将匹配后的词汇对问题信息进行分词,得到多个问题词汇。计算机设备将每个问题词汇转换为词向量,根据多个词向量生成问题信息对应的向量矩阵。
步骤106,将向量矩阵输入至训练后的分类模型中,计算向量矩阵对应的多个上下文向量,根据上下文向量识别问题信息对应的意图类型。
计算机设备在得到问题信息对应的向量矩阵后,将向量矩阵输入至训练后的分类模型中。其中,分类模型可以是基于注意力层的卷积神经网络模型。分类模型可以包括多个网络层。例如,分类模型可以包括输入层、注意力层、卷积层、池化层、全连接层以及输出层。计算机设备通过分类模型提取向量矩阵中的多个词向量,并计算每个词向量对应的上下文向量以及每个词向量对应的权重。计算机设备提取上下文向量对应的上下文特征,进而对上下文特征进行降维处理,得到上下文向量对应的主要上下文特征。计算机设备对降维处理后的上下文特征进行分类,并将分类结果进行加权后输出。计算机设备进一步地从加权输出后的分类结果中选取权重最大的意图类型作为问题信息对应的意图类型,实现识别问题信息对应的意图类型。
步骤108,当意图类型为与药品相关的意图类型时,在药品词典库中识别问题类型中的药品实体。
计算机设备根据上下文向量识别问题信息对应的意图类型后,判断意图类型是否为与药品相关的意图类型。其中,与药品相关的意图类型包括药品的适应症、药品的不良反应、药品的用法用量、药品的注意事项、药物之间的相互作用等。计算机设备可以将与药品相关的意图类型标记为有效意图,计算机设备只对有效意图进行药品信息匹配处理。当意图类型并非与药品相关的意图类型时,即意图类型为非有效意图时,计算机设备可以发送有效意图至终端。
当意图类型为与药品相关的意图类型时,计算机设备则获取预先建立的药品词典库,药品词典库中包括药品的通用名以及药品商品名。药品商品名是指可以准确定位到对应商品的标识信息。例如,批准文号、药品本位码等。计算机设备在药品词典库中识别问题信息中的药品实体。药品实体可以是药品的通用名称、产品名称以及商品名称。例如,药品的通用名称可以是阿卡波糖,产品名称可以是阿卡波糖片,商品名称可以是拜糖苹。
具体地,计算机设备提取问题信息中的药品特征信息,将药品特征信息与药品词典库进行精确匹配。当精确匹配无法识别问题信息中的药品实体时,计算机设备将提取出的药品特征信息与药品词典库进行模糊匹配,从而确定问题信息对应的药品实体。计算机设备通过将精确匹配方式与模糊匹配方式进行结合,来识别问题信息中的药品实体,能够提高药品实体识别的准确性。
步骤110,调用线程扫描数据库,确定药品实体对应的药品级别。
计算机设备在识别问题信息对应的药品实体后,调用线程扫描数据库,以确定药品实体对应的药品级别。其中,数据库中包括常见的药品说明书信息以及药品处方信息。例如,药品处方信息可以是《中国国家处方集(2010版)》。计算机设备将常见的药品说明书信息以及药品处方信息分别按照药品级别以及意图类型划分为适应症、禁忌症、不良反应、用法用量、注意事项以及药物相互作用等多个字段,并将多个字段存储于数据库中。药品级别包括通用名级别、通用名及剂型级别和商品级别。
计算机设备将药品实体与数据库中的药品级别进行字符匹配,当字符匹配未成功时,计算机设备将药品实体与对应的药品级别进行拼音匹配。计算机设备选取拼音匹配概率最高的药品级别作为药品实体对应的药品级别。为了提高药品级别的匹配准确性,计算机设备将字符匹配方式与拼音匹配方式进行结合,能够进一步提高药品实体识别的准确性。
步骤112,根据药品级别在数据库中进行药品信息匹配,输出与问题信息对应的药品答复信息,将药品答复信息返回至终端。
计算机设备在确定药品实体对应的药品级别后,进一步根据药品级别在数据库中进行药品信息匹配。具体地,计算机设备调用线程扫描配置文件,获取药品级别对应的匹配顺序。配置文件中记录有多个药品级别以及对应的匹配顺序。匹配顺序可以是药品级别对应的信息匹配内容的优先级。信息匹配内容可以是数据库中常见的药品说明书信息或者是药品处方信息。匹配顺序可以是优先匹配数据库中常见的药品说明书信息,再匹配数据库中药品处方信息。计算机设备根据药品级别对应的匹配顺序将药品实体与数据库进行字符匹配,从而得到问题信息对应的药品答复信息。
在本实施例中,计算机设备通过调用线程对问题信息进行分词处理,得到对应的向量矩阵,有利于输入训练后的分类模型中。计算机设备通过训练后的分类模型计算向量矩阵对应的多个上下文向量,并根据上下文向量识别问题信息对应的意图类型,能够将问题信息中干扰信息进行过滤,实现对向量矩阵进行词语聚焦处理,进而提高意图识别的准确性。计算机设备在识别问题信息中的药品实体后,调用线程扫描数据库,确定药品实体对应的药品级别,能够对药品实体进行有效分类,实现对药品粒度进行更为精细的划分。计算机设备通过药品级别在数据库中进行药品信息匹配,输出与问题信息对应的药品答复信息,能够针对多样化的问题信息实现药品信息匹配,进而提高药品信息匹配的准确性以及全面性。
在一个实施例中,如图2所示,计算向量矩阵对应的多个上下文向量,根据上下文向量识别问题信息对应的意图类型包括:
步骤202,将向量矩阵输入至训练后的分类模型中,通过分类模型的输入层提取向量矩阵中的多个词向量。
步骤204,将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果。
步骤206,将第一提取结果输入卷积层,提取上下文向量对应的上下文特征,生成第二提取结果。
步骤208,将第二提取结果输入池化层,对第二提取结果进行降维处理。
步骤210,将降维处理后的第二提取结果输入全连接层,对降维处理后的第二提取结果进行分类得到分类结果,通过输出层将分类结果进行加权后输出。
步骤212,选取加权后输出的分类结果中权重最大的意图类型作为问题信息对应的意图类型。
计算机设备在对问题信息进行分词处理后,将分词处理后向量矩阵输入至训练后的分类模型中进行意图识别。其中,分类模型可以是服务器预先利用大量样本数据进行训练后得到的分类模型。分类模型可以是基于注意力层的卷积神经网络模型。分类模型可以包括多个网络层。例如,分类模型可以包括输入层、注意力层、卷积层、池化层、全连接层以及输出层。
具体地,计算机设备通过分类模型的输入层对向量矩阵进行词向量提取,将提取出的词向量输入注意力层。计算机设备进而通过分类模型的注意力层计算每个词向量对应的上下文向量以及权重,根据多个上下文向量以及权重生成第一提取信息。计算机设备通过分类模型的注意力层将第一提取结果作为卷积层的输入,将第一提取结果传递至卷积层。计算机设备通过分类模型的卷积层提取上下文向量对应的上下文特征,并根据上下文向量对应的上下文特征生成第二提取结果。分类模型的卷积层将第二提取结果输入至池化层,通过池化层对第二提取结果进行降维处理。分类模型的池化层将降维处理后的第二提取结果输入至全连接层,通过全连接层对降维处理后的第二提取结果进行分类,得到分类结果。分类结果中可以包括多种意图类型。分类模型的全连接层将分类后得到分类结果输入至输出层,通过输出层将分类结果进行加权后输出。计算机设备在分类结果中选取权重最大的意图类型作为问题信息对应的意图类型。
在本实施例中,计算机设备通过分类模型提取向量矩阵在中的多个词向量,计算每个词向量对应的上下文向量以及权重。能够将问题矩阵中的干扰信息进行过滤,实现对向量矩阵进行词语聚焦处理。计算机设备通过对上下文特征进行降维处理,能够提取主要的上下文特征,避免多余特征的影响。计算机设备通过对降维处理后的上下文特征进行分类,并对分类结果进行加权输出,能够对分类结果进行归一化,进而有利于提高意图识别的准确性。
在一个实施例中,在药品词典库中识别问题信息中的药品实体包括:提取问题信息中的药品特征信息;将药品特征信息与药品词典库进行精确匹配;当精确匹配无法识别药品实体时,将药品特征信息与药品词典库进行模糊匹配,确定问题信息对应的药品实体。
当意图类型为与药品相关的意图类型时。计算机设备在药品词典库中识别问题信息中的药品实体。与药品相关的意图类型包括药品的适应症、药品的不良反应、药品的用法用量、药品的注意事项、药物之间的相互作用等。药品词典库中包括药品的通用名以及药品商品名。药品商品名是指可以准确定位到对应商品的标识信息。例如,批准文号、药品本位码等。
计算机设备对问题信息进行特征提取,将提取的药品特征信息与药品词典库进行精确匹配。精确匹配可以是字符匹配。当精确匹配无法识别药品实体时,计算机设备可以通过提取药品特征信息中的语义关键词,将语义关键词与药品词典库中的关键词进行匹配。计算机设备根据相似度最大的关键词确定药品信息对应的药品实体。
在本实施例中,计算机设备通过将问题信息中的药品信息与药品词典库进行匹配,由于药品词典库相比于现有的词典库内容更为全面,因此能够匹配出更全面的药品实体。计算机设备通过将精确匹配方式与模糊匹配方式进行结合,来识别问题信息中的药品实体,能够提高药品实体识别的准确性。
在一个实施例中,调用线程扫描数据库,确定药品实体对应的药品级别包括:将药品实体与数据库中的药品级别进行字符匹配;当字符匹配未成功时,将药品实体与对应的药品级别进行拼音匹配;选取拼音匹配概率最高的药品级别,作为药品实体对应的药品级别。
计算机设备在识别问题信息中的药品实体后,调用线程扫描数据库,确定药品实体对应的药品级别。药品级别包括通用名级别、通用名及剂型级别和商品级别。具体地,计算机设备判断药品实体中是否存在药品通用名、药品剂型以及商品信息。若药品实体只存在药品通用名,则药品实体对应的药品级别为通用名级别。若存在药品通用名以及剂型,则药品实体对应的药品级别为通用名及剂型级别。若存在商品信息,则药品实体对应的药品级别为商品级别。商品信息包括厂家信息、药品商品名称、批准文号、药品本位码等。
例如,药品实体中只存在阿卡波糖,阿卡波糖为药品通用名,则药品实体对应的药品级别为通用名级别。药品实体中存在阿卡波糖片,阿卡波糖片既包括药品通用名,又包括剂型,则药品实体对应的药品级别为通用名及剂型级别药品。药品实体中存在拜耳生产的阿卡波糖片,包含药品通用名、剂型以及厂家信息,则药品实体对应的药品级别为商品级别。药品实体中存在拜糖萍,包含药品商品名称,则药品实体对应的药品级别为商品级别。
在本实施例中,计算机设备通过将药品实体与药品级别进行字符匹配以及拼音匹配,能够确定药品实体对应的药品粒度,从而提高药品信息匹配的准确性。
在一个实施例中,根据药品级别在数据库中进行药品信息匹配包括:调用线程扫描配置文件,配置文件中记录有多个药品级别以及对应的匹配顺序;根据药品级别对应的匹配顺序将药品实体与数据库进行字符匹配,得到问题信息对应的药品答复信息。
计算机设备在确定药品实体对应的药品级别后,根据药品级别在数据库中进行药品信息匹配。计算机设备通过调用线程扫描配置文件,获取药品级别对应的匹配顺序。数据库中包括常见的药品说明书信息或者是药品处方信息。匹配顺序可以是优先匹配数据库中常见的药品说明书信息,再匹配数据库中的药品处方信息。计算机设备根据匹配顺序将药品级别与数据库进行字符匹配,获取对应的药品答复信息,并将药品答复信息返回至终端。
例如,当药品级别为通用名级别时,其匹配顺序可以是先与药品处方信息进行匹配,得到对应的第一处方药品信息。若药品处方信息中不存在对应的药品答复信息,则将药品实体与药品说明书信息进行匹配,得到对应的说明书药品信息。若药品说明书信息中不存在对应的药品答复信息,则在药品实体的同类药品类型的药品处方信息中查找下一级别的药品通用名。将查找到的下一级别的药品通用名与对应的药品处方信息进行匹配,得到对应的第二处方药品信息。
当药品级别为通用名及剂型级别时,其匹配顺序可以是优先匹配药品说明书信息,并通过多次药品信息匹配处理的方式获取对应的厂家信息。如果药品说明书信息中不存在对应的药品答复信息,则与药品处方信息进行匹配,后续的匹配顺序与通用名级别药品的匹配顺序相同。
当药品级别为商品级别时,其匹配顺序可以是优先匹配药品说明书信息,若药品说明书信息不存在对应的药品答复信息,则根据通用名及剂型级别药品的匹配顺序进行药品信息匹配。
在本实施例中,计算机设备根据药品级别获取对应的匹配顺序,根据匹配顺序将药品实体与数据库进行字符匹配,获取对应的答复信息,能够根据问题信息中的药品粒度来进行药品信息匹配,从而进一步提高药品信息匹配的准确性。
应该理解的是,虽然图1至2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图3所示,提供了一种药品信息匹配处理装置,包括:通信模块302、分词模块304、第一识别模块306、第二识别模块308、确定模块310和匹配模块312,其中:
通信模块302,用于接收终端上传的问题信息。
分词模块304,用于调用线程对问题信息进行分词处理,得到对应的向量矩阵。
第一识别模块306,用于将向量矩阵输入至训练后的分类模型中,计算向量矩阵对应的多个上下文向量,根据上下文向量识别问题信息对应的意图类型。
第二识别模块308,用于当意图类型为与药品相关的意图类型时,在药品词典库中识别问题信息中的药品实体。
确定模块310,用于利用线程扫描数据库,确定药品实体对应的药品级别。
匹配模块312,用于根据药品级别在数据库中进行药品匹配,输出与问题信息对应的药品答复信息。
在一个实施例中,第一识别模块306还用于将分词序列输入至训练后的分类模型中,通过分类模型的输入层提取向量矩阵中的多个词向量;将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果;将第一提取结果输入卷积层,提取上下文向量对应的上下文特征,生成第二提取结果;将第二提取结果输入池化层,对第二提取结果进行降维处理;将降维处理后的第二提取结果输入全连接层,对降维处理后的第二提取结果进行分类得到分类结果,通过输出层将分类结果进行加权后输出;选取加权后输出的分类结果中权重最大的意图类型作为问题信息对应的意图类型。
在一个实施例中,第二识别模块308还用于提取问题信息中的药品特征信息;将药品特征信息与药品词典库进行精确匹配;当精确匹配无法识别药品实体时,将药品特征信息与药品词典库进行模糊匹配,确定问题信息对应的药品实体。
在一个实施例中,确定模块310还用于将药品实体与数据库中的药品级别进行字符匹配;当字符匹配未成功时,将药品实体与对应的药品级别进行拼音匹配;选取拼音匹配概率最高的药品级别,作为药品实体对应的药品级别。
在一个实施例中,匹配模块312还用于调用线程扫描配置文件,配置文件中记录有多个药品级别以及对应的匹配顺序;根据药品级别对应的匹配顺序将药品实体与数据库进行字符匹配,得到问题信息对应的药品答复信息。
关于药品信息匹配处理装置的具体限定可以参见上文中对于药品信息匹配处理方法的限定,在此不再赘述。上述药品匹配装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是计算机设备,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储问题信息、药品答复信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种药品信息匹配处理方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个实施例中提供的药品信息匹配处理方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种药品信息匹配处理方法,所述方法包括:
接收终端上传的问题信息;
调用线程对所述问题信息进行分词处理,得到对应的向量矩阵;
将所述向量矩阵输入至训练后的分类模型中,计算所述向量矩阵对应的多个上下文向量,根据所述上下文向量识别所述问题信息对应的意图类型;
当所述意图类型为与药品相关的意图类型时,在药品词典库中识别所述问题信息中的药品实体;
调用线程扫描数据库,确定所述药品实体对应的药品级别;
根据所述药品级别在所述数据库中进行药品信息匹配,输出与所述问题信息对应的药品答复信息,将所述药品答复信息返回至终端。
2.根据权利要求1所述的方法,其特征在于,所述分类模型包括多个网络层,所述计算所述向量矩阵对应的多个上下文向量,根据所述上下文向量识别所述问题信息对应的意图类型包括:
将向量矩阵输入至训练后的分类模型中,通过所述分类模型的输入层提取所述向量矩阵中的多个词向量;
将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果;
将所述第一提取结果输入卷积层,提取所述上下文向量对应的上下文特征,生成第二提取结果;
将所述第二提取结果输入池化层,对所述第二提取结果进行降维处理;
将降维处理后的第二提取结果输入全连接层,对所述降维处理后的第二提取结果进行分类得到分类结果,通过输出层将所述分类结果进行加权后输出;
选取加权后输出的分类结果中权重最大的意图类型作为所述问题信息对应的意图类型。
3.根据权利要求1所述的方法,其特征在于,所述在药品词典库中识别所述问题信息中的药品实体包括:
提取所述问题信息中的药品特征信息;
将所述药品特征信息与药品词典库进行精确匹配;
当精确匹配无法识别药品实体时,将所述药品特征信息与药品词典库进行模糊匹配,确定所述问题信息对应的药品实体。
4.根据权利要求1所述的方法,其特征在于,所述调用线程扫描数据库,确定所述药品实体对应的药品级别包括:
将所述药品实体与数据库中的药品级别进行字符匹配;
当字符匹配未成功时,将所述药品实体与对应的药品级别进行拼音匹配;
选取拼音匹配概率最高的药品级别,作为所述药品实体对应的药品级别。
5.根据权利要求1所述的方法,其特征在于,所述根据所述药品级别在数据库中进行药品信息匹配包括:
调用线程扫描配置文件,所述配置文件中记录有多个药品级别以及对应的匹配顺序;
根据所述药品级别对应的匹配顺序将所述药品实体与数据库进行字符匹配,得到所述问题信息对应的药品答复信息。
6.一种药品信息匹配处理装置,其特征在于,所述装置包括:
通信模块,用于接收终端上传的问题信息;
分词模块,用于调用线程对所述问题信息进行分词处理,得到对应的向量矩阵;
第一识别模块,用于将所述向量矩阵输入至训练后的分类模型中,计算所述向量矩阵对应的多个上下文向量;根据所述上下文向量识别所述问题信息对应的意图类型;
第二识别模块,用于当所述意图类型为与药品相关的意图类型时,在药品词典库中识别所述问题信息中的药品实体;
确定模块,用于利用线程扫描数据库,确定所述药品实体对应的药品级别;
匹配模块,用于根据所述药品级别在数据库中进行药品匹配,输出与所述问题信息对应的药品答复信息。
7.根据权利要求6所述的装置,其特征在于,所述第一识别模块还用于将分词序列输入至训练后的分类模型中,通过所述分类模型的输入层提取所述向量矩阵中的多个词向量;将多个词向量输入注意力层,计算每个词向量对应的上下文向量以及权重,生成第一提取结果;将所述第一提取结果输入卷积层,提取所述上下文向量对应的上下文特征,生成第二提取结果;将所述第二提取结果输入池化层,对所述第二提取结果进行降维处理;将降维处理后的第二提取结果输入全连接层,对所述降维处理后的第二提取结果进行分类得到分类结果,通过输出层将所述分类结果进行加权后输出;选取加权后输出的分类结果中权重最大的意图类型作为所述问题信息对应的意图类型。
8.根据权利要求6所述的装置,其特征在于,所述第二识别模块还用于提取所述问题信息中的药品特征信息;将所述药品特征信息与药品词典库进行精确匹配;当精确匹配无法识别药品实体时,将所述药品特征信息与药品词典库进行模糊匹配,确定所述问题信息对应的药品实体。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述方法的步骤。
CN201910969896.7A 2019-10-12 2019-10-12 药品信息匹配处理方法、装置、计算机设备和存储介质 Active CN110781677B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910969896.7A CN110781677B (zh) 2019-10-12 2019-10-12 药品信息匹配处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910969896.7A CN110781677B (zh) 2019-10-12 2019-10-12 药品信息匹配处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110781677A true CN110781677A (zh) 2020-02-11
CN110781677B CN110781677B (zh) 2023-02-07

Family

ID=69385264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910969896.7A Active CN110781677B (zh) 2019-10-12 2019-10-12 药品信息匹配处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110781677B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985224A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 用药说明文本处理方法、装置、设备及存储介质
CN113130038A (zh) * 2021-04-30 2021-07-16 康键信息技术(深圳)有限公司 药品数据匹配方法、装置、设备及存储介质
CN113223657A (zh) * 2021-06-01 2021-08-06 联仁健康医疗大数据科技股份有限公司 药品信息的处理方法、装置、电子设备及存储介质
CN113742454A (zh) * 2021-09-09 2021-12-03 平安科技(深圳)有限公司 基于人工智能的应答语料生成方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810135A (zh) * 2012-09-17 2012-12-05 顾泰来 一种药品处方辅助处理系统
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
CN108986908A (zh) * 2018-05-31 2018-12-11 平安医疗科技有限公司 问诊数据处理方法、装置、计算机设备和存储介质
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
US20190095432A1 (en) * 2017-09-26 2019-03-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for building text classification model, and text classification method and apparatus
CN110176315A (zh) * 2019-06-05 2019-08-27 京东方科技集团股份有限公司 医疗问答方法及系统、电子设备、计算机可读介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102810135A (zh) * 2012-09-17 2012-12-05 顾泰来 一种药品处方辅助处理系统
CN106776711A (zh) * 2016-11-14 2017-05-31 浙江大学 一种基于深度学习的中文医学知识图谱构建方法
US20190095432A1 (en) * 2017-09-26 2019-03-28 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for building text classification model, and text classification method and apparatus
CN108986908A (zh) * 2018-05-31 2018-12-11 平安医疗科技有限公司 问诊数据处理方法、装置、计算机设备和存储介质
CN109522393A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 智能问答方法、装置、计算机设备和存储介质
CN110176315A (zh) * 2019-06-05 2019-08-27 京东方科技集团股份有限公司 医疗问答方法及系统、电子设备、计算机可读介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985224A (zh) * 2020-08-31 2020-11-24 平安医疗健康管理股份有限公司 用药说明文本处理方法、装置、设备及存储介质
CN113130038A (zh) * 2021-04-30 2021-07-16 康键信息技术(深圳)有限公司 药品数据匹配方法、装置、设备及存储介质
CN113223657A (zh) * 2021-06-01 2021-08-06 联仁健康医疗大数据科技股份有限公司 药品信息的处理方法、装置、电子设备及存储介质
CN113223657B (zh) * 2021-06-01 2024-07-19 联仁健康医疗大数据科技股份有限公司 药品信息的处理方法、装置、电子设备及存储介质
CN113742454A (zh) * 2021-09-09 2021-12-03 平安科技(深圳)有限公司 基于人工智能的应答语料生成方法及相关设备
CN113742454B (zh) * 2021-09-09 2023-07-21 平安科技(深圳)有限公司 基于人工智能的应答语料生成方法及相关设备

Also Published As

Publication number Publication date
CN110781677B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN110781677B (zh) 药品信息匹配处理方法、装置、计算机设备和存储介质
CN110021439B (zh) 基于机器学习的医疗数据分类方法、装置和计算机设备
CN108986908B (zh) 问诊数据处理方法、装置、计算机设备和存储介质
CN111160017B (zh) 关键词抽取方法、话术评分方法以及话术推荐方法
CN109729383B (zh) 双录视频质量检测方法、装置、计算机设备和存储介质
CN109960725B (zh) 基于情感的文本分类处理方法、装置和计算机设备
WO2021042503A1 (zh) 信息分类抽取方法、装置、计算机设备和存储介质
CN110674319B (zh) 标签确定方法、装置、计算机设备及存储介质
CN108595695B (zh) 数据处理方法、装置、计算机设备和存储介质
WO2020048264A1 (zh) 药品数据处理方法、装置、计算机设备和存储介质
CN110909137A (zh) 基于人机交互的信息推送方法、装置和计算机设备
CN110674684A (zh) 微表情分类模型生成、图像识别方法、装置、设备及介质
CN110569500A (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN110334179B (zh) 问答处理方法、装置、计算机设备和存储介质
US11164564B2 (en) Augmented intent and entity extraction using pattern recognition interstitial regular expressions
CN112015900B (zh) 医学属性知识图谱构建方法、装置、设备及介质
CN111445968A (zh) 电子病历查询方法、装置、计算机设备和存储介质
CN110008250B (zh) 基于数据挖掘的社保数据处理方法、装置和计算机设备
CN110377558A (zh) 文档查询方法、装置、计算机设备和存储介质
CN110362798B (zh) 裁决信息检索分析方法、装置、计算机设备和存储介质
CN111180086B (zh) 数据匹配方法、装置、计算机设备和存储介质
CN111783471A (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN112016318A (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
CN112488896A (zh) 应急预案生成方法、装置、计算机设备及存储介质
CN109033427B (zh) 股票的筛选方法及装置、计算机设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023191

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220520

Address after: 518048 China Aviation Center 2901, No. 1018, Huafu Road, Huahang community, Huaqiang North Street, Futian District, Shenzhen, Guangdong Province

Applicant after: Shenzhen Ping An medical and Health Technology Service Co.,Ltd.

Address before: Room 12G, Area H, 666 Beijing East Road, Huangpu District, Shanghai 200001

Applicant before: PING AN MEDICAL AND HEALTHCARE MANAGEMENT Co.,Ltd.

GR01 Patent grant
GR01 Patent grant