[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN109672554A - 确定故障根因的方法及装置 - Google Patents

确定故障根因的方法及装置 Download PDF

Info

Publication number
CN109672554A
CN109672554A CN201811245846.6A CN201811245846A CN109672554A CN 109672554 A CN109672554 A CN 109672554A CN 201811245846 A CN201811245846 A CN 201811245846A CN 109672554 A CN109672554 A CN 109672554A
Authority
CN
China
Prior art keywords
sample
feature
node
root
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811245846.6A
Other languages
English (en)
Inventor
杨辉
袁潮灏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Huawei Technologies Service Co Ltd
Original Assignee
Huawei Technologies Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Service Co Ltd filed Critical Huawei Technologies Service Co Ltd
Priority to CN201811245846.6A priority Critical patent/CN109672554A/zh
Publication of CN109672554A publication Critical patent/CN109672554A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种确定故障根因的方法及装置,旨在提高故障诊断的效率。该方法包括:根据故障树的根因判定规则确定多个第一样本;根据多个第一样本构造第一决策树,第一决策树中的根节点和中间节点代表m个特征中的特征,第一决策树中的叶子节点代表故障根因,根节点和中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第3分支表示不存在该节点代表的特征;在故障场景下获取至少一个特征,并根据至少一个特征和第一决策树确定产生故障场景的故障根因。

Description

确定故障根因的方法及装置
技术领域
本申请涉及故障诊断领域,尤其涉及一种确定故障根因的方法及装置。
背景技术
目前,在通信网络中,可以通过故障树自动化确定产生通信故障的根本原因(以下简称故障根因)。例如,如图1所示,基于规则的故障树中,一个根因判定规则可以对应一个故障根因,当在故障场景下获取到的数据的表现情况符合一个根因判定规则时,可以确定导致出现该故障场景的故障根因为该根因判定规则对应的故障根因。其中,一个根因判定规则可以为通过与门和或门对多个单规则的组合,该情况下,在用于确定是否满足一个单规则的数据未被获取到的情况下,可能无法得到故障根因,降低了故障诊断的效率。
发明内容
本申请实施例提供了一种确定故障根因的方法及装置,旨在提高故障诊断的效率。
为达到上述目的,本申请实施例提供如下技术方案:
第一方面,提供了一种确定故障根因的方法,包括:根据故障树的根因判定规则确定多个第一样本,一个第一样本包括故障根因和m个特征的值,一个第一样本中的用于确定该第一样本中的故障根因的必要特征在该第一样本中为第1数值,该第一样本中的其他特征在该第一样本中为第2数值,一个根因判定规则由至少一个单规则组成,根因判定规则中的全部的m个单规则与m个特征一一对应;根据多个第一样本构造第一决策树,第一决策树中的根节点和中间节点代表m个特征中的特征,第一决策树中的叶子节点代表故障根因,根节点和中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第1分支表示该节点代表的特征的值为第1数值,一个节点的第2分支表示该节点代表的特征的值为第2数值,一个节点的第3分支表示不存在该节点代表的特征;在故障场景下获取至少一个特征,并根据至少一个特征和第一决策树确定故障场景的故障根因。第一方面提供的方法,可以将故障树转换为决策树,通过加入缺失值下的决策树分支(即第3分支),使得缺失单规则的情况,同样可以得到故障根因,提高故障诊断的效率。
在一种可能的设计中,第一决策树中的一个节点对应的特征产生的信息增益大于该节点的子节点对应的特征产生的信息增益,一个节点对应的特征产生的信息增益是指第一熵和该节点对应的第二熵的差值,其中,第一熵为根据多个第一样本计算得到的熵,该节点对应的第二熵为采用该节点对应的特征的值将多个第一样本划分为两部分后计算得到的熵,两部分中的一部分第一样本中的该节点对应的特征的值为第1数值,另一部分第一样本中的该节点对应的特征的值为第2数值,在根据多个第一样本构造第一决策树之前,该方法还包括:计算m个特征产生的信息增益;根据多个第一样本构造第一决策树,包括:根据多个第一样本和m个特征产生的信息增益构造第一决策树。该种可能的设计,可以通过计算各个节点的信息增益发现单规则的重要程度,只要重要的单规则存在,就可以判断出故障根因,不需要所有单规则都存在,提高故障诊断的效率。
在一种可能的设计中,该方法还包括:在至少一个故障场景下获取特征,根据在至少一个故障场景下获取的特征和用户在至少一个故障场景下反馈的实际故障根因生成至少一个第二样本;根据至少一个第二样本和多个第一样本构造第二决策树。该种可能的设计,引入了人工智能,根据用户在故障场景下反馈的实际故障根因对第一决策树进行更新得到第二决策树,从而使得第二决策树能够更加准确的确定故障根因。
在一种可能的设计中,根据至少一个第二样本和多个第一样本构造第二决策树,包括:将至少一个第二样本与多个第一样本进行组合,并根据组合后的样本和该样本中的特征产生的信息增益构造出多个决策树;计算多个决策树的损失函数;确定多个决策树中的损失函数最小的决策树为第二决策树。该种可能的设计,提供了一种构造第二决策树的方法。
在一种可能的设计中,根据至少一个第二样本和多个第一样本构造第二决策树,包括:将至少一个第二样本与多个第一样本进行合并;根据合并后的样本和合并后的样本中的特征产生的信息增益构造第二决策树。该种可能的设计,提供了又一种构造第二决策树的方法。
在一种可能的设计中,根据多个第一样本和m个特征产生的信息增益构造第一决策树,包括:确定第i个特征对应的节点的各个分支下的子节点,第i个特征是指m个特征产生的信息增益第i大的特征,m个特征产生的信息增益最大的特征对应第一决策树的根节点,i的初始值为1,i为大于0小于等于m的整数;判断i是否等于m,若否,令i=i+1,继续确定第i个特征对应的节点的各个分支下的子节点,若是,在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因,若第i个特征的值为第j数值的样本对应不同的故障根因,第i个特征对应的节点的第j分支和第3分支下的子节点对应第一故障根因,得到第一决策树;第一故障根因所属的第一样本在多个第一样本中的数量最多;其中,确定第i个特征对应的节点的各个分支下的子节点,包括:在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因;当第i个特征的值为第j数值的样本对应不同的故障根因时,第i个特征对应的节点的第j分支和第3分支下的子节点为第i+1个特征;j为1或2;当i=1时,目标第一样本为多个第一样本;当i大于1时,目标第一样本为多个第一样本中的、满足以下条件的全部第一样本:包含的第k个特征满足第k个特征对应的节点和第k+1个特征对应的节点之间的、且属于根节点和第i个特征对应的节点之间的路径上的分支的条件,k为1、2、…、i-1。该种可能的设计,提供了一种构造第一决策树的方法。
在一种可能的设计中,根据故障树的根因判定规则确定多个第一样本,包括:根据故障树的根因判定规则确定多个独立判定规则,一个独立判定规则对应一个故障根因,一个独立判定规则包括用于判定该独立判定规则对应的故障根因的必要单规则,独立判定规则为一个单规则或通过与门对多个单规则的组合;根据多个独立判定规则确定多个第一样本。该种可能的设计,提供了一种确定多个第一样本的方法。
第二方面,提供了一种确定故障根因的装置,该装置具有实现第一方面提供的任意一种方法的功能。该功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元。该装置可以以芯片的产品形态存在。
第三方面,提供了一种确定故障根因的装置,包括:存储器、处理器和通信总线;存储器用于存储计算机执行指令,处理器与存储器通过通信总线连接,处理器执行存储器存储的计算机执行指令,以使装置实现第一方面提供的任意一种方法。该装置可以以芯片的产品形态存在。
第四方面,提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行第一方面提供的任意一种方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面提供的任意一种方法。
第二方面至第五方面中任一种设计方式所带来的技术效果可参见第一方面中不同设计方式所带来的技术效果,此处不再赘述。
附图说明
图1提供了一种故障树的结构示意图;
图2为本申请实施例提供的一种确定故障根因的装置的硬件结构示意图;
图3为本申请实施例提供的一种确定故障根因的方法的流程图;
图4为本申请实施例提供的一种确定故障根因的方法的整体实现流程图;
图5为本申请实施例提供的一种故障树的结构示意图;
图6为本申请实施例构造的一种第一决策树的示意图;
图7为本申请实施例构造的又一种第一决策树的示意图;
图8为本申请实施例构造的一种第二决策树的示意图;
图9为本申请实施例提供的一种确定故障根因的装置的组成示意图;
图10为本申请实施例提供的又一种确定故障根因的装置的组成示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。其中,在本申请的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“多个”是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
本申请实施例的技术方案可以用于确定通信故障,具体可以用于以下通信系统:正交频分多址(orthogonal frequency-division multiple access,简称OFDMA)、单载波频分多址(single carrier FDMA,简称SC-FDMA)和其它系统等。术语“系统”可以和“网络”相互替换。OFDMA系统可以实现诸如演进通用无线陆地接入(evolved UTRA,简称E-UTRA)、超级移动宽带(ultra mobile broadband,简称UMB)等无线技术。E-UTRA是通用移动通信系统(universal mobile telecommunications system,简称UMTS)演进版本。第三代合作伙伴计划(3rd generation partnership project,简称3GPP)在长期演进(long termevolution,简称LTE)(即通常所说的4G系统)和基于LTE演进的各种版本是使用E-UTRA的新版本。第五代(5th-generation,简称5G)通信系统、新空口(new radio,简称NR)是正在研究当中的下一代通信系统。此外,通信系统还可以适用于面向未来的通信技术,都适用本申请实施例提供的技术方案。
为了更加清楚的理解本申请,首先对与本申请相关的内容作简单介绍。
故障树分析(fault tree analysis,简称FTA)法,是一种评价复杂系统可靠性与安全性的重要方法。对于一个故障场景(也可以称为故障现象),会对应多个故障根因,通过FTA法可以确定出现故障场景的故障根因。FTA法的一种方式是通过故障树确定故障根因。参见图1,基于规则的故障树中,一个根因判定规则(也可以称为关系表达式)可以对应一个故障根因,当在故障场景下获取到的数据的表现情况符合一个根因判定规则时,可以确定导致出现该故障场景的故障根因为该根因判定规则对应的故障根因。其中,一个根因判定规则可以为一个单规则、通过与门对多个单规则的组合、通过或门对多个单规则的组合,也可以为通过与门和或门对多个单规则的组合。
示例性的,如表1所示,编号为01_01_01的故障场景,对应编号为01_01_01_01_01的故障根因和编号为01_01_01_01_02的故障根因,2个故障根因分别对应一个根因判定规则,一个根因判定规则由多条单规则通过与门和或门进行组合而成。其中,编号为01_01_01的故障场景可以为4G用户接入失败,编号为01_01_01_01_01的故障根因可以为策略与计费规则功能(policy and charging rules function,简称PCRF)链路故障,编号为01_01_01_01_02的故障根因可以为OCS链路故障。
表1
在表1中,perf_0819、perf_0517、alarm_0501、perf_0821、perf_0518、syscount_0012、alarm_0500和perf_0501分别为一条单规则的标识。其中,“||”表示“或门”,“&&”表示“与门”。不同的单规则对应不同类数据的表现情况,当在故障场景下获取到的一类数据的表现情况满足对应的单规则要求的数据表现情况时,则该故障场景满足该单规则。
示例性的,如表2所示,表2示出了4个单规则对应的话统数据的表现情况,对于话统数据而言,数据的表现情况为突增、突降、缓慢降低等。当在故障场景下获取到的“业务流模版(traffic flow template,简称TFT)语义错误导致的分组报文协议(packet dataprotocol,简称PDP)上下文激活失败次数占比”同比突增7%,环比突增5%时,该故障场景满足perf_0822这条单规则。判断故障场景是否满足其他单规则的过程同理,不再一一阐述。
表2
但是,采用故障树确定故障根因的方法具有以下缺点:
(1)、当根因判定规则为通过与门对多个单规则进行的组合时,若在故障场景下获取不到用于确定是否满足其中一个单规则的数据时,无法根据故障树确定故障根因。
(2)需要人为的剖析某条故障根因具备的各种单规则,并进行组合,由于单规则整理以及组合较复杂,因此,需要耗费大量的人力资源。
(3)由于需要将整理的故障树(例如,手工整理的单规则表格、根因判定规则表格等)转换为代码实现,每当单规则或根因判定规则增加、删除或更新时,可能需要重新对单规则进行组合,从而导致故障树的代码实现较复杂。
本申请实施例提供了一种确定故障根因的方法,通过将故障树转换为决策树从而避免这些问题,具体参见下文中的描述。本申请实施例还提供了一种确定故障根因的装置,如图2所示,该确定故障根因的装置20包括至少一个处理器201和存储器202。图2中以确定故障根因的装置20中包括一个处理器201和存储器202为例进行绘制。其中,处理器201和存储器202通过通信总线互相通信;存储器202用于存储指令。处理器201执行指令时,执行下文中描述的方法。
处理器201可以是一个或多个通用中央处理器(central processing unit,简称CPU),微处理器,特定应用集成电路(application-specific integrated circuit,简称ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。处理器201可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。作为一种实施例,处理器201可以包括一个或多个CPU,例如图2中的CPU0和CPU1。
存储器202,用于存储执行本申请方案的计算机执行指令,并由处理器201来控制执行。处理器201用于执行存储器202中存储的计算机执行指令,从而实现本申请下述实施例提供的方法。存储器202可以是只读存储器(read-only memory,简称ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,简称RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,简称EEPROM)、只读光盘(compact disc read-only memory,简称CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
可选地,本申请实施例中的计算机执行的指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。
本申请实施例提供了一种确定故障根因的方法,如图3所示,包括:
301、根据故障树的根因判定规则确定多个第一样本,一个第一样本包括故障根因和m个特征的值,一个第一样本中的用于确定该第一样本中的故障根因的必要特征在该第一样本中为第1数值,该第一样本中的其他特征在该第一样本中为第2数值,一个根因判定规则由至少一个单规则组成,根因判定规则中的全部的m个单规则与m个特征一一对应。
本申请实施例的执行主体可以为确定故障根因的装置,具体可以为计算机。确定故障根因的装置也可以称为规则数字化装置、样本生成装置、新样本生成装置、决策树更新装置等。
其中,一个根因判定规则可以为一个单规则,通过与门对多个单规则的组合,通过或门对多个单规则的组合,也可以为通过与门和或门对多个单规则的组合。
m个特征可以为m个单规则,也可以为用于表示m个单规则的标识等。
可选地,步骤301在具体实现时可以包括:11)根据故障树的根因判定规则确定多个独立判定规则,一个独立判定规则对应一个故障根因,一个独立判定规则包括用于判定该独立判定规则对应的故障根因的必要单规则,独立判定规则为一个单规则或通过与门对多个单规则的组合;12)根据多个独立判定规则确定多个第一样本。
步骤11)在具体实现时,当一个根因判定规则为一个单规则或通过与门对多个单规则的组合时,根据该根因判定规则确定的独立判定规则与该根因判定规则相同;当一个根因判定规则为通过或门对多个单规则的组合时,根据该根因判定规则确定的多个独立判定规则为该多个单规则;当一个根因判定规则为通过与门和或门对多个单规则的组合时,根据该根因判定规则确定的多个独立判定规则为根据该根因判定规则拆分的通过与门对多个单规则的组合。
因此,可以理解的是,一个根因判定规则可以确定一个或多个独立判定规则,一个独立判定规则对应一个故障根因,但是一个故障根因可以对应多个独立判定规则,相应的,多个第一样本中包含的故障根因可以是相同的。
示例性的,若故障根因1对应的根因判定规则1为:(perf_0860||perf_1038)&&alarm_0106&&(perf_0734||perf_0912)。步骤11)在具体实现时,可以根据或门对根因判定规则1进行拆分,转换为通过与门组合的多个单规则组合,得到独立判定规则。根据根因判定规则1确定的独立判定规则以及独立判定规则对应的故障根因可参见表3。
表3
独立判定规则 故障根因
perf_0860&&alarm_0106&&perf_0734 故障根因1
perf_1038&&alarm_0106&&perf_0734 故障根因1
perf_0860&&alarm_0106&&perf_0912 故障根因1
perf_1038&&alarm_0106&&perf_0912 故障根因1
步骤12)在具体实现时,一个独立判定规则可以确定一个第一样本,其中,将一个独立判定规则中出现的单规则在该独立判定规则对应的第一样本中作为值为第1数值(例如,1)的特征,将未在该独立判定规则中出现的单规则在该独立判定规则对应的第一样本中作为值为第2数值(例如,0)的特征,得到该独立判定规则对应的第一样本。
该情况下,基于表3所示的独立判定规则确定的第一样本可参见表4。
表4
302、根据多个第一样本构造第一决策树,第一决策树中的根节点和中间节点代表m个特征中的特征,第一决策树中的叶子节点代表故障根因,根节点和中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第1分支表示该节点代表的特征的值为第1数值,一个节点的第2分支表示该节点代表的特征的值为第2数值,一个节点的第3分支表示不存在该节点代表的特征。
需要说明的是,第一决策树中的根节点和中间节点中的每个节点包括的分支数并不是由本申请实施例的方案设计所决定的,而是由多个第一样本所决定的。
可选地,第一决策树中的一个节点对应的特征产生的信息增益大于该节点的子节点对应的特征产生的信息增益,在步骤302之前,该方法还包括:21)计算m个特征产生的信息增益。该情况下,步骤302在具体实现时可以包括:根据多个第一样本和m个特征产生的信息增益构造第一决策树。
其中,一个节点对应的特征产生的信息增益是指第一熵和该节点对应的第二熵的差值,其中,第一熵为根据多个第一样本计算得到的熵,该节点对应的第二熵为采用该节点对应的特征的值将多个第一样本划分为两部分后计算得到的熵,两部分中的一部分第一样本中的该节点对应的特征的值为第1数值,另一部分第一样本中的该节点对应的特征的值为第2数值。
其中,信息增益是熵的差值,信息增益越大,表示系统的混乱程度变化越大,系统越趋于稳定。
第一熵的计算方式为:D是指多个第一样本,K为D中故障根因的个数,pk为D中的故障根因为第k个故障根因的样本所占的比例。Ent(D)的范围是[0,log|K|]。
特征α产生的信息增益为:其中,特征α为m个特征中的任意一个特征;Gain(α)是指特征α产生的信息增益;V表示特征α在第一样本中的取值个数,V=2,V的第v个取值为第v数值,v为1或2;|D|表示第一样本的数量;|Dν|表示第一样本中的特征α的值为第v数值的样本个数;Ent(Dν)表示根据Dν计算得到的熵,Dν是指第一样本中的特征α的值为第v数值的样本。Ent(Dν)的计算与Ent(D)的计算同理,在此不再赘述。
通过计算m个特征产生的信息增益,可以确定m个特征的重要程度,根据m个特征的重要程度构造第一决策树,从而使得第一决策树能够更加准确的确定故障根因。
一种可能的实现方式,根据多个第一样本和m个特征产生的信息增益构造第一决策树,包括:
31)确定第i个特征对应的节点的各个分支下的子节点,第i个特征是指m个特征产生的信息增益第i大的特征,m个特征产生的信息增益最大的特征对应第一决策树的根节点,i的初始值为1,i为大于0小于等于m的整数。
32)判断i是否等于m,若否,令i=i+1,继续确定第i个特征对应的节点的各个分支下的子节点,若是,在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因,若第i个特征的值为第j数值的样本对应不同的故障根因,第i个特征对应的节点的第j分支和第3分支下的子节点对应第一故障根因,得到第一决策树;第一故障根因所属的第一样本在多个第一样本中的数量最多。
示例性的,基于表7所示的示例,由于包含C1的第一样本最多,因此,第一故障根因为C1。
其中,确定第i个特征对应的节点的各个分支下的子节点,可以通过以下方式一或方式二实现:
方式一、在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因;当第i个特征的值为第j数值的样本对应不同的故障根因时,第i个特征对应的节点的第j分支和第3分支下的子节点为第i+1个特征;j为1或2。
方式二、在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因;当第i个特征的值为第j数值的样本对应不同的故障根因时,第i个特征对应的节点的第j分支下的子节点为第二故障根因,第i个特征对应的节点的第3分支下的子节点为第i+1个特征;j为1或2;第二故障根因所属的第一样本在目标第一样本中的数量与目标第一样本的数量的比值大于第一阈值。第一阈值可以根据实际应用场景确定,示例性的,第一阈值可以为0.8。
需要说明的是,两个不同的特征可以采用相同的方式(例如,均采用方式一)确定各自对应的节点的各个分支下的子节点,也可以采用不同的方式(例如,一个节点采用方式一,另一个节点采用方式二)确定各自对应的节点的各个分支下的子节点。
示例性的,基于表7所示的示例,若目标第一样本包括第一样本4至第一样本6,第i个特征为perf_0734,第j数值为0,第一阈值为0.6,则第二故障根因为C2。
当i=1时,目标第一样本为多个第一样本;
当i大于1时,目标第一样本为多个第一样本中的、满足以下条件的全部第一样本:包含的第k个特征满足第k个特征对应的节点和第k+1个特征对应的节点之间的、且属于根节点和第i个特征对应的节点之间的路径上的分支的条件,k为1、2、…、i-1。
需要说明的是,根节点和第i个特征对应的节点之间的路径可能有多条,例如,参见图7,图7中的alarm_0106和perf_0912之间的路径有两条,这两条路径包括的节点均为alarm_0106、alarm_0104、perf_0734和perf_0912,其中,一条路径中的alarm_0106和alarm_0104之间的分支为NA分支,alarm_0104和perf_0734之间的分支为NA分支,perf_0734和perf_0912之间的分支为0分支,该条路径可以简单记为:alarm_0106(NA)→alarm_0104(NA)→perf_0734(0)→perf_0912;另一条路径中的alarm_0106和alarm_0104之间的分支为NA分支,alarm_0104和perf_0734之间的分支为NA分支,perf_0734和perf_0912之间的分支为NA分支,该条路径可以简单记为:alarm_0106(NA)→alarm_0104(NA)→perf_0734(NA)→perf_0912。而本申请实施例中的根节点和第i个特征对应的节点之间的路径是指当前需要确定的第i个特征对应的节点的子节点的节点与根节点之间的路径,例如,若当前需要确定图7中的左边的perf_0912的各个分支下的子节点,则根节点和第i个特征对应的节点之间的路径是指alarm_0106和左边的perf_0912之间的路径。
示例性的,图7所示的第一决策树根据表7所示的第一样本构造得到,计算图7中的左边的perf_0912的各个分支下的子节点时的目标第一样本为第一样本3至第一样本6。
另一种可能的实现方式,根据多个第一样本和m个特征产生的信息增益构造第一决策树,包括:根据多个第一样本构造决策树;对该决策树进行剪枝得到新的决策树;计算剪枝后的决策树和剪枝前的决策树的损失函数,确定损失函数较小的决策树为第一决策树。
根据多个第一样本确定故障根因的方法与上文类似。
其中,对该决策树进行剪枝时,可以剪掉最后一个中间节点或最后多个中间节点,不同的剪枝方式可以得到不同的新的决策树。该种可能的实现方式,进行剪枝得到新的决策树可以有一个或多个。
303、在故障场景下获取至少一个特征,并根据至少一个特征和第一决策树确定产生故障场景的故障根因。
当用户需要使用本申请所构造的第一决策树进行故障根因诊断时,可以根据在故障场景下获取到的数据的表现情况匹配各个特征的值,然后将各个特征的值输入到第一决策树中,获取故障根因。
需要说明的是,在构造出第一决策树之后,可以将第一决策树作为一个整体配置在通信设备中用于确定通信故障,也就是说,本申请实施例中的构造第一决策树的设备和使用第一决策树的设备可以为不同的设备。
由于本申请是根据特征的重要程度进行决策树的构造的,使得构造出的决策树在数据不足时也可以使得给出的故障根因为实际的故障根因的概率较高。并且,由于少量数据就可以构造决策树,可以实现少样本下的机器学习,还能较大程度保留故障树中的原始根因判定规则的优势,实现传统故障树数字化的平滑过度,防止抛弃规则化的强硬数据挖掘式机器学习,减少了由于训练样本不足,导致传统机器学习不适用于通信故障根因诊断的问题。
本申请可以将故障树转换为决策树,可以发现单规则的重要程度,只要重要的单规则存在,就可以判断出故障根因,不需要所有单规则都存在。同时,加入缺失值下的决策树分支(即第3分支),使得缺失单规则的情况,同样可以得到一条最大概率的故障根因,提高故障诊断的效率。
并且,通过采用现有故障树的根因判定规则,可以沿用历史经验,实现数字化平衡过度,同时决策树代替故障树的方法,可以实现故障根因的可解释性,也防止人工智能大数据方法的概率难解释性,给用户指明依据。
可选地,该方法还包括:41)在至少一个故障场景下获取特征,根据在至少一个故障场景下获取的特征和用户在至少一个故障场景下反馈的实际故障根因生成至少一个第二样本;42)根据至少一个第二样本和多个第一样本构造第二决策树。
该可选的方法,引入了人工智能,根据用户在故障场景下反馈的实际故障根因对第一决策树进行更新得到第二决策树,从而使得第二决策树能够更加准确的确定故障根因。引入人工智能思想,通过用户使用过程中的实际故障根因反馈,从新的数据中不断的学习,不断修正决策树,实现决策树的自生长与剪枝,从而实现故障树的自更新,帮助故障根因识别率随问题的增长同步提升。解决了传统故障树不能快速生长和增强正确率的缺陷。并且,不需要人为的剖析某条故障根因具备的各种单规则,并进行组合,避免由于单规则整理以及组合的复杂性,耗费大量的人力资源。
具体的,可以在通信系统中增加用户标记反馈功能,用于用户标记导致出现故障场景的故障根因。需要说明的是,第二样本中的特征可以多于第一样本中的特征,也可以少于第一样本中的特征,第二样本中的故障根因可以与第一样本中的故障根因相同,也可以不相同。
其中,步骤42)在具体实现时可以通过以下两种方式中的任意一种方式实现:
方式一、将至少一个第二样本与多个第一样本进行组合,并根据组合后的样本和该样本中的特征产生的信息增益构造出多个决策树;计算多个决策树的损失函数;确定多个决策树中的损失函数最小的决策树为第二决策树。
在对至少一个第二样本与多个第一样本进行组合时,当至少一个第二样本为多个第二样本时,可以将多个第二样本中的每个第二样本与多个第一样本进行组合,当至少一个第二样本为一个第二样本时,可以将一个第二样本与多个第一样本中的部分样本进行组合,具体如何将至少一个第二样本与多个第一样本进行组合,可以根据实际的应用场景确定,本申请实施例对此不作具体限定。
其中,一个决策树T的损失函数可以为:
其中,Cα(T)表示决策树T的损失函数,|T|为决策树T的叶子节点的个数,Nt为用于构造决策树T的样本中的、故障根因为决策树T的第t个叶子节点对应的故障根因的样本的数目,Ht(T)为第t个叶子节点上的熵,t为大于0小于等于T的整数,α为大于等于0的参数。
方式二、将至少一个第二样本与多个第一样本进行合并;根据合并后的样本和合并后的样本中的特征产生的信息增益构造第二决策树。
构造第二决策树与构造第一决策树的方法类似,在此不再赘述。在构造出第二决策树之后,可以采用第二决策树对故障根因进行确定。
可选地,上述方法还可以包括:将第二决策树转换为故障树。将第二决策树转换为故障树之后,可以直接确定根因判定规则,不需要人为的对单规则进行组合,降低了人力资源的消耗,也降低了代码的实现复杂度。
图4对本申请实施例提供的方法的整体过程作了示意,其中,对故障树进行规则数字转化可以得到第一样本,根据第一样本可以构造出决策树,根据决策树可以进行根因判决得到故障根因,根据在故障场景下获取到的特征和用户标注反馈可以获取到第二样本,根据第二样本可以对决策树进行更新。另外,通过对决策树进行提取和数字规则转化还可以将决策树转换为故障树。
本申请实施例提供的方法可以适用于初始样本量少、已具备大量根因判定规则的故障树的故障诊断系统,不局限与通信行业,对于传统机械、电气等存在故障逻辑的行业同样适用。
为了使得上述实施例提供的方法更加的清楚,以下以一个具体的示例对上述实施例作说明。该实施例中的故障树可参见图5。其中,故障场景为UGW接入失败场景,该场景下有两个故障根因,分别为C1和C2,C1表示的故障根因为license(证书)资源不足,C2表示的故障根因为主机路由资源不足。当在UGW接入失败场景获取到的数据的表现情况满足根因判定规则A,则可以判定故障根因为C1,当在UGW接入失败场景获取到的数据的表现情况满足根因判定规则B,则可以判定故障根因为C2。其中,根因判定规则A为(perf_0860||perf_1038)&&alarm_0106&&(perf_0734||perf_0912),根因判定规则B为(perf_0860||perf_1038)&&alarm_0104。故障根因与根因判定规则的对应关系可参见表5。
表5
一、根据图5所示的故障树构造第一决策树
具体过程包括以下步骤51)-53):
51)根据根因判定规则A和根因判定规则B确定独立判定规则以及独立判定规则对应的故障根因。
具体的,得到的独立判定规则以及独立判定规则对应的故障根因可参见表6。
表6
故障根因 关系表达式
C1 perf_0860&&alarm_0106&&perf_0734
C1 perf_1038&&alarm_0106&&perf_0734
C1 perf_0860&&alarm_0106&&perf_0912
C1 perf_1038&&alarm_0106&&perf_0912
C2 perf_0860&&alarm_0104
C2 perf_1038&&alarm_0104
52)根据独立判定规则确定多个第一样本。
具体的,得到的多个第一样本可参见表7,其中,每个第一样本中包括6个特征,分别为perf_0860、perf_1038、perf_0734、perf_0912、alarm_0106和alarm_0104。
表7
53)根据6个特征产生的信息增益和6个第一样本构造第一决策树。
其中,6个特征产生的信息增益由大至小分别为:alarm_0106、alarm_0104、perf_0734、perf_0912、perf_0860、perf_1038,则根据6个特征产生的信息增益和6个第一样本构造的决策树可参见图6。该情况下,还可以对该决策树进行剪枝,将perf_1038的分支剪掉,得到图7所示的决策树,计算图6所示的决策树的损失函数和剪枝后的损失函数,发现剪枝后的决策树(即图7所示的决策树)的损失函数小于剪枝前的损失函数(即图6所示的决策树),则可以确定剪枝后的决策树为第一决策树。
二、根据第一决策树确定故障根因
示例性的,若一组数据的表现情况表示在一个故障场景下获取到的数据的表现情况,在UGW接入失败场景获取到的3组数据的表现情况,分别标记为工单1,工单2和工单3。三个工单对于故障树原有的单规则的命中情况如表8所示。其实,1代表单规则命中,0代表单规则未命中,NA代表当前工单缺失该类数据。
表8
使用第一决策树进行故障根因判决得到的故障根因结果如表9所示。
表9
工单 故障根因 决策树分支
工单1 C2 alarm_0106(0)
工单2 C1 alarm_0106(NA)→alarm_0104(NA)→perf_0734(1)
工单3 C2 alarm_0106(0)
若使用原始故障树进行故障根因判决的话,判断得到的故障根因结果如表10所示。其中,NA代表未找到结果。
表10
以上可以看出,由于本申请采用了人工智能分类方法,实现了基于重要特征的分类,本申请实施例提供的技术方案能够解决传统规则故障树匹配不出故障根因的问题,能在部分特征缺失的情况下得到最可能故障根因,并且还能给出推理逻辑。另外,可以将数字化转化前的规则呈现用户进行考虑。
三、第一决策树的更新(即计算第二决策树)
假设,经过用户确认后,反馈上述3个工单的实际故障根因如表11所示:
表11
如果用户没有在3个工单中标记除第一决策树涉及的特征之外的新特征的话,得到的3个新的样本(第二样本),如表12所示。
表12
根据6个第一样本和3个第二样本进行合并得到如表13所示的样本,根据该样本生成的第二决策树可以参见图8。
表13
如果用户在3个工单中,标记了一个新的特征Log_0101,得到的3个新的样本(第二样本)如表14所示。
表14
根据6个第一样本和3个第二样本进行合并得到如表15所示的样本,根据该样本生成的故障树经过剪枝之后也为图8所示的决策树,从而可以看出Log_0101并不是一个重要特征,对故障根因的判决起不到决定性的作用。
表15
四、决策树转换为故障树
根据图8所示的第二决策树,可以得到表16所示的独立判定规则以及独立判定规则对应的故障根因,进而可以确定表17所示的根因判定规则。
表16
序号 独立判定规则 故障根因
1 perf_0860&&alarm_0106&&perf_0734 C1
2 perf_1038&&alarm_0106&&perf_0734 C1
3 perf_0860&&alarm_0106&&perf_0912 C1
4 perf_1038&&alarm_0106&&perf_0912 C1
5 perf_0860&&alarm_0104 C2
6 perf_1038&&alarm_0104 C2
7 perf_0860&&perf_1038&&alarm_0104 C2
8 perf_1038&&perf_0734 C1
9 perf_1038&&perf_0734 C1
表17
本申请实施例提供的方法将传统的根因判定规则转化为数字化样本,实现了传统规则到数字化人工智能转化的基础。
本申请采用改造的决策树的方法,解决了原始传统故障规则方法导致的故障根因匹配不中的问题,同时也可以最大化找出决定故障根因分类的主要特征集合。这样也可以给用户呈现主要特征情况,帮助用户快速定位和发现问题的所在。将传统的规则匹配改成人工智能分类问题,从该场景下所有故障根因使用的特征集中找出最优特征,进行逐步分类,就可以发现不同故障根因之间的关键差异,达到数据源缺失特征或者匹配不中特征集的情况下,同样可以给出故障根因,指引用户定位问题方向。
上述主要从方法角度对本申请实施例提供的方案进行了介绍。可以理解的是,确定故障根因的装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对确定故障根因的装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
比如,在采用对应各个功能划分各个功能模块的情况下,图9示出了上述实施例中所涉及的确定故障根因的装置90的一种可能的结构示意图,参见图9,确定故障根因的装置90可以包括:
确定单元901,用于根据故障树的根因判定规则确定多个第一样本,一个第一样本包括故障根因和m个特征的值,一个第一样本中的用于确定该第一样本中的故障根因的必要特征在该第一样本中为第1数值,该第一样本中的其他特征在该第一样本中为第2数值,一个根因判定规则由至少一个单规则组成,根因判定规则中的全部的m个单规则与m个特征一一对应;
构造单元902,用于根据多个第一样本构造第一决策树,第一决策树中的根节点和中间节点代表m个特征中的特征,第一决策树中的叶子节点代表故障根因,根节点和中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第1分支表示该节点代表的特征的值为第1数值,一个节点的第2分支表示该节点代表的特征的值为第2数值,一个节点的第3分支表示不存在该节点代表的特征;
获取单元903,用于在故障场景下获取至少一个特征;
确定单元901,还用于根据至少一个特征和第一决策树确定产生故障场景的故障根因。
可选地,第一决策树中的一个节点对应的特征产生的信息增益大于该节点的子节点对应的特征产生的信息增益,一个节点对应的特征产生的信息增益是指第一熵和该节点对应的第二熵的差值,其中,第一熵为根据多个第一样本计算得到的熵,该节点对应的第二熵为采用该节点对应的特征的值将多个第一样本划分为两部分后计算得到的熵,两部分中的一部分第一样本中的该节点对应的特征的值为第1数值,另一部分第一样本中的该节点对应的特征的值为第2数值,如图10所示,该装置还包括:计算单元904;
计算单元904,用于计算m个特征产生的信息增益;
构造单元902,具体用于根据多个第一样本和m个特征产生的信息增益构造第一决策树。
可选地,如图10所示,该装置还包括:生成单元905;
获取单元903,用于在至少一个故障场景下获取特征;
生成单元905,用于根据在至少一个故障场景下获取的特征和用户在至少一个故障场景下反馈的实际故障根因生成至少一个第二样本;
构造单元902,用于根据至少一个第二样本和多个第一样本构造第二决策树。
可选地,构造单元902,具体用于:将至少一个第二样本与多个第一样本进行组合,并根据组合后的样本和该样本中的特征产生的信息增益构造出多个决策树;计算多个决策树的损失函数;确定多个决策树中的损失函数最小的决策树为第二决策树。
可选地,构造单元902,具体用于:将至少一个第二样本与多个第一样本进行合并;根据合并后的样本和合并后的样本中的特征产生的信息增益构造第二决策树。
可选地,构造单元902,具体用于:
确定第i个特征对应的节点的各个分支下的子节点,第i个特征是指m个特征产生的信息增益第i大的特征,m个特征产生的信息增益最大的特征对应第一决策树的根节点,i的初始值为1,i为大于0小于等于m的整数;
判断i是否等于m,若否,令i=i+1,继续确定第i个特征对应的节点的各个分支下的子节点,若是,在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因,若第i个特征的值为第j数值的样本对应不同的故障根因,第i个特征对应的节点的第j分支和第3分支下的子节点对应第一故障根因,得到第一决策树;第一故障根因所属的第一样本在多个第一样本中的数量最多;
其中,确定第i个特征对应的节点的各个分支下的子节点,包括:在目标第一样本中,当第i个特征的值为第j数值的样本全部对应同一个故障根因时,第i个特征对应的节点的第j分支下的子节点为该故障根因;当第i个特征的值为第j数值的样本对应不同的故障根因时,第i个特征对应的节点的第j分支和第3分支下的子节点为第i+1个特征;j为1或2;
当i=1时,目标第一样本为多个第一样本;
当i大于1时,目标第一样本为多个第一样本中的、满足以下条件的全部第一样本:包含的第k个特征满足第k个特征对应的节点和第k+1个特征对应的节点之间的、且属于根节点和第i个特征对应的节点之间的路径上的分支的条件,k为1、2、…、i-1。
可选地,确定单元901,具体用于:根据故障树的根因判定规则确定多个独立判定规则,一个独立判定规则对应一个故障根因,一个独立判定规则包括用于判定该独立判定规则对应的故障根因的必要单规则,独立判定规则为一个单规则或通过与门对多个单规则的组合;根据多个独立判定规则确定多个第一样本。
若将上述确定单元901、构造单元902、获取单元903、计算单元904和生成单元905的功能集成在一个处理单元中,则上述确定单元901、构造单元902、获取单元903、计算单元904和生成单元905执行的动作可以均由处理单元执行。
本申请实施例还提供了一种确定故障根因的装置,该装置包括:存储器、处理器和通信总线;存储器用于存储计算机执行指令,处理器与存储器通过通信总线连接,处理器执行存储器存储的计算机执行指令,以使装置实现上述方法。具体的,该装置的结构示意图可以参见图2。其中,确定单元901、构造单元902、获取单元903、计算单元904和生成单元905可以为处理器201。
本申请实施例还提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得所述计算机执行上述方法。
本申请实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得所述计算机执行上述方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,简称DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,简称SSD))等。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看所述附图、公开内容、以及所附权利要求书,可理解并实现所述公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (15)

1.一种确定故障根因的方法,其特征在于,包括:
根据故障树的根因判定规则确定多个第一样本,一个第一样本包括故障根因和m个特征的值,一个第一样本中的用于确定该第一样本中的故障根因的必要特征在该第一样本中为第1数值,该第一样本中的其他特征在该第一样本中为第2数值,一个根因判定规则由至少一个单规则组成,所述根因判定规则中的全部的m个单规则与所述m个特征一一对应;
根据所述多个第一样本构造第一决策树,所述第一决策树中的根节点和中间节点代表所述m个特征中的特征,所述第一决策树中的叶子节点代表故障根因,所述根节点和所述中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第1分支表示该节点代表的特征的值为第1数值,一个节点的第2分支表示该节点代表的特征的值为第2数值,一个节点的第3分支表示不存在该节点代表的特征;
在故障场景下获取至少一个特征,并根据所述至少一个特征和所述第一决策树确定产生所述故障场景的故障根因。
2.根据权利要求1所述的方法,其特征在于,所述第一决策树中的一个节点对应的特征产生的信息增益大于该节点的子节点对应的特征产生的信息增益,一个节点对应的特征产生的信息增益是指第一熵和该节点对应的第二熵的差值,其中,所述第一熵为根据所述多个第一样本计算得到的熵,该节点对应的第二熵为采用该节点对应的特征的值将所述多个第一样本划分为两部分后计算得到的熵,两部分中的一部分第一样本中的该节点对应的特征的值为第1数值,另一部分第一样本中的该节点对应的特征的值为第2数值,在所述根据所述多个第一样本构造第一决策树之前,所述方法还包括:
计算所述m个特征产生的信息增益;
所述根据所述多个第一样本构造第一决策树,包括:根据所述多个第一样本和所述m个特征产生的信息增益构造第一决策树。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在至少一个故障场景下获取特征,根据在所述至少一个故障场景下获取的特征和用户在所述至少一个故障场景下反馈的实际故障根因生成至少一个第二样本;
根据所述至少一个第二样本和所述多个第一样本构造第二决策树。
4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个第二样本和所述多个第一样本构造第二决策树,包括:
将所述至少一个第二样本与所述多个第一样本进行组合,并根据组合后的样本和该样本中的特征产生的信息增益构造出多个决策树;
计算所述多个决策树的损失函数;
确定所述多个决策树中的损失函数最小的决策树为所述第二决策树。
5.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个第二样本和所述多个第一样本构造第二决策树,包括:
将所述至少一个第二样本与所述多个第一样本进行合并;
根据合并后的样本和合并后的样本中的特征产生的信息增益构造所述第二决策树。
6.根据权利要求2-5任一项所述的方法,其特征在于,所述根据所述多个第一样本和所述m个特征产生的信息增益构造第一决策树,包括:
确定第i个特征对应的节点的各个分支下的子节点,所述第i个特征是指所述m个特征产生的信息增益第i大的特征,所述m个特征产生的信息增益最大的特征对应所述第一决策树的根节点,i的初始值为1,i为大于0小于等于m的整数;
判断i是否等于m,若否,令i=i+1,继续确定第i个特征对应的节点的各个分支下的子节点,若是,在目标第一样本中,当所述第i个特征的值为第j数值的样本全部对应同一个故障根因时,所述第i个特征对应的节点的第j分支下的子节点为该故障根因,若所述第i个特征的值为第j数值的样本对应不同的故障根因,所述第i个特征对应的节点的第j分支和第3分支下的子节点对应第一故障根因,得到所述第一决策树;所述第一故障根因所属的第一样本在所述多个第一样本中的数量最多;
其中,确定第i个特征对应的节点的各个分支下的子节点,包括:在目标第一样本中,当所述第i个特征的值为第j数值的样本全部对应同一个故障根因时,所述第i个特征对应的节点的第j分支下的子节点为该故障根因;当所述第i个特征的值为第j数值的样本对应不同的故障根因时,所述第i个特征对应的节点的第j分支和第3分支下的子节点为第i+1个特征;j为1或2;
当i=1时,所述目标第一样本为所述多个第一样本;
当i大于1时,所述目标第一样本为所述多个第一样本中的、满足以下条件的全部第一样本:包含的第k个特征满足第k个特征对应的节点和第k+1个特征对应的节点之间的、且属于所述根节点和所述第i个特征对应的节点之间的路径上的分支的条件,k为1、2、…、i-1。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据故障树的根因判定规则确定多个第一样本,包括:
根据所述故障树的根因判定规则确定多个独立判定规则,一个独立判定规则对应一个故障根因,一个独立判定规则包括用于判定该独立判定规则对应的故障根因的必要单规则,所述独立判定规则为一个单规则或通过与门对多个单规则的组合;
根据所述多个独立判定规则确定所述多个第一样本。
8.一种确定故障根因的装置,其特征在于,包括:
确定单元,用于根据故障树的根因判定规则确定多个第一样本,一个第一样本包括故障根因和m个特征的值,一个第一样本中的用于确定该第一样本中的故障根因的必要特征在该第一样本中为第1数值,该第一样本中的其他特征在该第一样本中为第2数值,一个根因判定规则由至少一个单规则组成,所述根因判定规则中的全部的m个单规则与所述m个特征一一对应;
构造单元,用于根据所述多个第一样本构造第一决策树,所述第一决策树中的根节点和中间节点代表所述m个特征中的特征,所述第一决策树中的叶子节点代表故障根因,所述根节点和所述中间节点中的每个节点包括第1分支、第2分支和第3分支中的一个或多个分支,一个节点的第1分支表示该节点代表的特征的值为第1数值,一个节点的第2分支表示该节点代表的特征的值为第2数值,一个节点的第3分支表示不存在该节点代表的特征;
获取单元,用于在故障场景下获取至少一个特征;
所述确定单元,还用于根据所述至少一个特征和所述第一决策树确定产生所述故障场景的故障根因。
9.根据权利要求8所述的装置,其特征在于,所述第一决策树中的一个节点对应的特征产生的信息增益大于该节点的子节点对应的特征产生的信息增益,一个节点对应的特征产生的信息增益是指第一熵和该节点对应的第二熵的差值,其中,所述第一熵为根据所述多个第一样本计算得到的熵,该节点对应的第二熵为采用该节点对应的特征的值将所述多个第一样本划分为两部分后计算得到的熵,两部分中的一部分第一样本中的该节点对应的特征的值为第1数值,另一部分第一样本中的该节点对应的特征的值为第2数值,所述装置还包括:计算单元;
所述计算单元,用于计算所述m个特征产生的信息增益;
构造单元,具体用于根据所述多个第一样本和所述m个特征产生的信息增益构造第一决策树。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:生成单元;
所述获取单元,用于在至少一个故障场景下获取特征;
所述生成单元,用于根据在所述至少一个故障场景下获取的特征和用户在所述至少一个故障场景下反馈的实际故障根因生成至少一个第二样本;
所述构造单元,用于根据所述至少一个第二样本和所述多个第一样本构造第二决策树。
11.根据权利要求10所述的装置,其特征在于,所述构造单元,具体用于:
将所述至少一个第二样本与所述多个第一样本进行组合,并根据组合后的样本和该样本中的特征产生的信息增益构造出多个决策树;
计算所述多个决策树的损失函数;
确定所述多个决策树中的损失函数最小的决策树为所述第二决策树。
12.根据权利要求10所述的装置,其特征在于,所述构造单元,具体用于:
将所述至少一个第二样本与所述多个第一样本进行合并;
根据合并后的样本和合并后的样本中的特征产生的信息增益构造所述第二决策树。
13.根据权利要求9-12任一项所述的装置,其特征在于,所述构造单元,具体用于:
确定第i个特征对应的节点的各个分支下的子节点,所述第i个特征是指所述m个特征产生的信息增益第i大的特征,所述m个特征产生的信息增益最大的特征对应所述第一决策树的根节点,i的初始值为1,i为大于0小于等于m的整数;
判断i是否等于m,若否,令i=i+1,继续确定第i个特征对应的节点的各个分支下的子节点,若是,在目标第一样本中,当所述第i个特征的值为第j数值的样本全部对应同一个故障根因时,所述第i个特征对应的节点的第j分支下的子节点为该故障根因,若所述第i个特征的值为第j数值的样本对应不同的故障根因,所述第i个特征对应的节点的第j分支和第3分支下的子节点对应第一故障根因,得到所述第一决策树;所述第一故障根因所属的第一样本在所述多个第一样本中的数量最多;
其中,确定第i个特征对应的节点的各个分支下的子节点,包括:在目标第一样本中,当所述第i个特征的值为第j数值的样本全部对应同一个故障根因时,所述第i个特征对应的节点的第j分支下的子节点为该故障根因;当所述第i个特征的值为第j数值的样本对应不同的故障根因时,所述第i个特征对应的节点的第j分支和第3分支下的子节点为第i+1个特征;j为1或2;
当i=1时,所述目标第一样本为所述多个第一样本;
当i大于1时,所述目标第一样本为所述多个第一样本中的、满足以下条件的全部第一样本:包含的第k个特征满足第k个特征对应的节点和第k+1个特征对应的节点之间的、且属于所述根节点和所述第i个特征对应的节点之间的路径上的分支的条件,k为1、2、…、i-1。
14.根据权利要求8-13任一项所述的装置,其特征在于,所述确定单元,具体用于:
根据所述故障树的根因判定规则确定多个独立判定规则,一个独立判定规则对应一个故障根因,一个独立判定规则包括用于判定该独立判定规则对应的故障根因的必要单规则,所述独立判定规则为一个单规则或通过与门对多个单规则的组合;
根据所述多个独立判定规则确定所述多个第一样本。
15.一种确定故障根因的装置,其特征在于,包括:存储器和处理器;
所述存储器用于存储计算机执行指令,所述处理器执行所述存储器存储的所述计算机执行指令,以使所述装置实现如权利要求1-7中任意一项所述的方法。
CN201811245846.6A 2018-10-24 2018-10-24 确定故障根因的方法及装置 Pending CN109672554A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811245846.6A CN109672554A (zh) 2018-10-24 2018-10-24 确定故障根因的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811245846.6A CN109672554A (zh) 2018-10-24 2018-10-24 确定故障根因的方法及装置

Publications (1)

Publication Number Publication Date
CN109672554A true CN109672554A (zh) 2019-04-23

Family

ID=66141808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811245846.6A Pending CN109672554A (zh) 2018-10-24 2018-10-24 确定故障根因的方法及装置

Country Status (1)

Country Link
CN (1) CN109672554A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147387A (zh) * 2019-05-08 2019-08-20 腾讯科技(上海)有限公司 一种根因分析方法、装置、设备及存储介质
CN110162422A (zh) * 2019-04-30 2019-08-23 阿里巴巴集团控股有限公司 一种基于决策树的问题定位方法和装置
CN110351136A (zh) * 2019-07-04 2019-10-18 阿里巴巴集团控股有限公司 一种故障定位方法和装置
CN111722058A (zh) * 2020-06-17 2020-09-29 国网甘肃省电力公司信息通信公司 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN113296485A (zh) * 2020-02-24 2021-08-24 北京国电智深控制技术有限公司 一种故障根源获取方法及装置
CN116155692A (zh) * 2023-02-24 2023-05-23 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080178161A1 (en) * 2007-01-23 2008-07-24 Sas Institute Inc. System and method for determining execution path difference in program
US20090161560A1 (en) * 2006-08-30 2009-06-25 Huawei Technologies Co., Ltd. Node, method and system of fault localization in multicast mpls networks
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN108345723A (zh) * 2018-01-24 2018-07-31 江苏新中天塑业有限公司 一种基于决策树和贝叶斯网络的电机故障诊断系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090161560A1 (en) * 2006-08-30 2009-06-25 Huawei Technologies Co., Ltd. Node, method and system of fault localization in multicast mpls networks
US20080178161A1 (en) * 2007-01-23 2008-07-24 Sas Institute Inc. System and method for determining execution path difference in program
CN104537010A (zh) * 2014-12-17 2015-04-22 温州大学 基于决策树的网构软件中的构件分类方法
CN107171819A (zh) * 2016-03-07 2017-09-15 北京华为数字技术有限公司 一种网络故障诊断方法及装置
CN108345723A (zh) * 2018-01-24 2018-07-31 江苏新中天塑业有限公司 一种基于决策树和贝叶斯网络的电机故障诊断系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162422A (zh) * 2019-04-30 2019-08-23 阿里巴巴集团控股有限公司 一种基于决策树的问题定位方法和装置
CN110147387A (zh) * 2019-05-08 2019-08-20 腾讯科技(上海)有限公司 一种根因分析方法、装置、设备及存储介质
CN110351136A (zh) * 2019-07-04 2019-10-18 阿里巴巴集团控股有限公司 一种故障定位方法和装置
CN110351136B (zh) * 2019-07-04 2022-06-28 创新先进技术有限公司 一种故障定位方法和装置
CN113296485A (zh) * 2020-02-24 2021-08-24 北京国电智深控制技术有限公司 一种故障根源获取方法及装置
CN111722058A (zh) * 2020-06-17 2020-09-29 国网甘肃省电力公司信息通信公司 基于知识图谱的电力信息系统故障检测方法、装置及介质
CN116155692A (zh) * 2023-02-24 2023-05-23 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质
CN116155692B (zh) * 2023-02-24 2023-11-24 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109672554A (zh) 确定故障根因的方法及装置
He et al. Block modeling-guided graph convolutional neural networks
US20190286504A1 (en) Graph-based root cause analysis
US20190286757A1 (en) Reducing search space for graph similarity calculations
CN103699541B (zh) 用于提高分类精度的交互式可视数据挖掘
CN107871216A (zh) 一种配电网脆弱节点的识别方法
CN106326585A (zh) 基于贝叶斯网络推理的预测分析方法以及装置
CN109086182A (zh) 数据库自动告警的方法及终端设备
CN110188834A (zh) 一种电力通信网的故障诊断方法、装置及设备
CN109670611A (zh) 一种电力信息系统故障诊断方法及装置
CN105630797B (zh) 数据处理方法及系统
Acampora et al. A comparison of multi-objective evolutionary algorithms for the ontology meta-matching problem
WO2020015625A1 (zh) 电力系统脆弱性评估方法及终端设备
CN107729939A (zh) 一种面向新增电网资源的cim模型扩展方法及装置
CN105812280B (zh) 一种分类方法及电子设备
CN115840738A (zh) 一种数据迁移方法、装置、电子设备及存储介质
CN108574594A (zh) 一种网络业务传输的方法及系统
CN109409411B (zh) 基于运维管理的问题定位方法、装置及存储介质
Zhang et al. Root cause analysis of concurrent alarms based on random walk over anomaly propagation graph
WO2023143570A1 (zh) 一种连接关系预测方法及相关设备
Cai et al. Tracemodel: An automatic anomaly detection and root cause localization framework for microservice systems
CN106550387B (zh) 一种无线传感器网络路由层服务质量评价方法
CN115412401B (zh) 训练虚拟网络嵌入模型及虚拟网络嵌入的方法和装置
CN113572639B (zh) 一种载波网络故障的诊断方法、系统、设备和介质
CN109558464A (zh) 网络性能分级表示方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20220909

AD01 Patent right deemed abandoned