[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN104537010A - 基于决策树的网构软件中的构件分类方法 - Google Patents

基于决策树的网构软件中的构件分类方法 Download PDF

Info

Publication number
CN104537010A
CN104537010A CN201410789471.5A CN201410789471A CN104537010A CN 104537010 A CN104537010 A CN 104537010A CN 201410789471 A CN201410789471 A CN 201410789471A CN 104537010 A CN104537010 A CN 104537010A
Authority
CN
China
Prior art keywords
attribute
decision tree
entropy
component
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410789471.5A
Other languages
English (en)
Inventor
相徐斌
叶修梓
洪振杰
张三元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201410789471.5A priority Critical patent/CN104537010A/zh
Publication of CN104537010A publication Critical patent/CN104537010A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于决策树的网构软件中的构件分类方法。在网构软件的构件库中新加入构件,对于新加入构件的分类使用数据挖掘中的决策树技术;使用基于信息增益的ID3算法对新加入构件的推荐度进行分析,建立决策树,完成构件分类。本方法将决策树技术应用于网构软件中的构件分类中,利用信息增益用来衡量构件属性的值为整个分类所能提供的信息量,分类规则直观,易于理解实现,且分类效率高。

Description

基于决策树的网构软件中的构件分类方法
技术领域
本发明涉及一种对网构软件的构件库中的构件分类方法,尤其涉及一种基于决策树的网构软件中的构件分类方法。
背景技术
大量的非结构化的信息分散在整个Internet中,在给人们带来方便的同时也带来了许多问题:信息过量,难以消化;信息真假难以辨识;信息安全难以保证;信息形式不一致,难以统一处理。建立在Internet上的网构软件的构件库也存在同样的困惑,所以在构件的提供者与构件的消费者之间应有一个中间环节,通过这个环节,需要对构件信息进行一些预处理,使得构件消费者能够快捷方便地得到想要的构件。
数据挖掘技术能够满足这一需求。数据挖掘是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。它包括问题定义,数据准备,挖掘操作和结果解释几个主要的部分。对一个数据挖掘系统而言,问题定义和数据准备很重要,是系统能否达到预期目的的关键。挖掘算法的选择和挖掘模型的建立是一个数据挖掘系统的核心部分。算法的合理选择和组织是建立良好的挖掘模型的基础。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于决策树的网构软件中的构件分类方法。
本发明的技术方案如下:
一种基于决策树的网构软件中的构件分类方法包括如下:
1)在网构软件的构件库中新加入构件,对于新加入构件的分类使用数据挖掘中的决策树技术;
2)使用基于信息增益的ID3算法对新加入构件的推荐度进行分析,建立决策树,完成构件分类。
所述的决策树技术为:决策树技术是用于分类和预测的技术,决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则,它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较并根据不同属性判断从该节点向下的分支,然后进行剪枝,最后在决策树的叶节点得到结论;决策树的根节点是整个数据集合空间,即网构软件构件库中所有的构件,每个分节点是对一个单一属性的测试,该测试将数据集合空间分割成两个或更多块,每个叶节点是属于单一类别的记录。
所述的基于信息增益的ID3算法具体为:在决策树各级结点上选择属性时,通过计算信息增益来选择属性,以使得在每一个非叶结点进行测试时,能获得关于被测试记录最大的类别信息,实现方法为:检测所有的属性,选择信息增益最大的属性产生决策树结点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有子集仅包含同一类别的数据为止,最后得到一棵决策树,它用来对新的样本进行分类。
所述的基于信息增益的ID3算法的信息增益,具体为:信息增益用来衡量某个属性中的值为整个分类所能提供的信息量,在决策树算法中,信息增益量越大,这个属性作为一棵树的根节点就能使这棵树更简洁,在信息增益计算方面,使用3个公式;信息增益需要使用到熵的概念,熵的概念如公式(1)所示:
Entropy ( S ) = - Σ i = 1 k P ( i ) * log 2 P ( i ) - - - ( 1 )
在公式(1)中,S表示样本集合,k是样本数量,P(i)是属于分类i的样本与整个样本集合的比例,熵的取值范围是0~1,如果所有S属于相同的类,则熵为0,即数据分类完毕;如果熵取值为1,则代表S中样本是完全随机的选自不同的类;
Entropy(S,A)=Σ(|Sv|/|S|)*Entropy(Sv)  (2)
Entropy(S,A)是属性A在集合S上的熵,Sv是属性A对应的有v值的子集,公式(2)是把属性A的所有可能的值都分别作了运算,并把结果相加,|Sv|指集合Sv中的元素个数,|S|指集合S中的元素个数;
Gain(S,A)是属性A在集合S上的信息增益,Gain(S,A)的值越大,说明选择测试属性A对分类提供的信息越多,如公式(3)所示:
Gain(S,A)=Entropy(S)-Entropy(S,A)  (3)。
所述的建立决策树的方法具体为:首先寻找初始分裂,整个训练集作为产生决策树的集合,训练集每个记录必须是已经分好类的,决定哪个属性域作为目前最好的分类指标,做法是穷尽所有的属性域,对每个属性域分裂的好坏做出量化,计算出最好的一个分裂;建决策树,就是根据记录字段的不同取值建立树的分支,以及在每个分支子集中重复建立下层结点和分支,建决策树的关键在于建立分支时对记录字段不同取值的选择,选择不同的字段值,会使划分出来的记录子集不同,影响决策树生长的快慢以及决策树结构的好坏,从而导致找到的规则信息的优劣,构件检索使用的决策树算法具体为:
1)初始化决策树T为只含一个树根(X,Q),其中X是全体样本集,Q为全体属性集;
2)如果T中所有叶结点(X’,Q’)都满足X’属于同一类或Q’为空,那么算法停止;否则执行步骤3);
3)计算Q中每个属性的信息增益,选择信息增益最高的属性作为节点的测试属性,记该属性为A;
4)从信息增益最高的属性所对应的节点出发,在X’中求得属性A的值等于给定值的子集,并生成相应的叶结点;
5)重复步骤2)~步骤4),直到T中所有叶结点(X’,Q’)都满足X’属于同一类或Q’为空。
所述的穷尽所有的属性域,对每个属性域分裂的好坏做出量化,计算出最好的一个分裂,具体为:
1)利用公式(1),计算决策属性的熵,
2)计算条件属性的熵,样本集共有多个条件属性,使用公式(2)分别计算条件属性的熵,计算分两个过程,首先利用公式(1)计算属性值的熵,然后再用公式(2)计算属性的熵;
3)使用公式(3)分别计算条件属性的信息增益:
选择信息增益最大的条件属性作为决策树的根节点,进行支节点的选取。
所述的进行支节点的选取,具体为:使用样本所有条件属性中信息增益最大的条件属性为根节点,用剩余的条件属性重复权利要求6中步骤1)~步骤3)的操作,选取增益最大的条件属性作为支节点;并对选取支节点后的剩余条件属性重复权利要求6中步骤1)~步骤3)的操作,直到剩余的属性数量为1为止。
数据挖掘是指从大量的不完全的,有噪声的,模糊的数据中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式。决策树是一种简单的数据挖掘方法,本发明把决策树技术用于网构软件的构件库中,使用了基于信息增益的ID3算法对已有构件的推荐度进行分析,建立决策树,进而为新加入构件库的构件进行分类。
本方法将决策树技术应用于网构软件中的构件分类中,利用信息增益用来衡量构件属性的值为整个分类所能提供的信息量,分类规则直观,易于理解实现,且分类效率高。
附图说明
图1为网构软件构件库中构件的主要属性;
图2为四个条件属性的熵;
图3构件检索使用的决策树算法;
图4构件的条件属性以及属性值。
具体实施方式
把整个构件库的所有已知构件作为训练集,通过决策树来决定新加入的构件的推荐分类(用是/否来标志是否是系统推荐的构件)。网构软件构件库中的构件主要属性如图1所示。可见,并非所有的属性都对建立决策树有用,因此我们选取了4个属性:ComType(构件类型)、ValidTime(有效时间)、EntityType(实体类型)以及RepCount(复本个数)来描述构件,目的是找出这4个属性和推荐度(推荐/不推荐)的关系。
决策树技术是用于分类和预测的主要技术,决策树学习是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较并根据不同属性判断从该节点向下的分支,然后进行剪枝,最后在决策树的叶节点得到结论。决策树作为一棵树,树的根节点是整个数据集合空间(即网构软件构件库中所有的构件),每个分节点是对一个单一变量的测试,该测试将数据集合空间分割成两个或更多块。每个叶节点是属于单一类别的记录。构造决策树的过程为:首先寻找初始分裂。整个训练集作为产生决策树的集合,训练集每个记录必须是已经分好类的。决定哪个属性域作为目前最好的分类指标。一般的做法是穷尽所有的属性域,对每个属性域分裂的好坏做出量化,计算出最好的一个分裂。建决策树,就是根据记录字段的不同取值建立树的分支,以及在每个分支子集中重复建立下层结点和分支。建决策树的关键在于建立分支时对记录字段不同取值的选择。选择不同的字段值,会使划分出来的记录子集不同,影响决策树生长的快慢以及决策树结构的好坏,从而导致找到的规则信息的优劣。图3说明了构造决策树算法。
对决策树决策结果的好坏有三种评价或比较尺度:
(1)预测准确度:预测准确度是用得最多的一种比较尺度,特别是对于预测型分类任务,目前公认的方法是10番分层交叉验证法。
(2)计算复杂度:计算复杂度依赖于具体的实现细节和硬件环境,在数据挖掘中,由于操作对象是巨量的数据库,因此空间和时间的复杂度问题将是非常重要的一个环节。
(3)模型描述的简洁度:对于描述型的分类任务,模型描述越简洁越受欢迎;例如,采用规则表示的分类器构造法就更有用。
本发明利用ID3算法构造决策树,ID3算法的核心是:在决策树各级结点上选择属性时,通过计算信息增益来选择属性,以使得在每一个非叶结点进行测试时,能获得关于被测试记录最大的类别信息。其具体方法是:检测所有的属性,选择信息增益最大的属性产生决策树结点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有子集仅包含同一类别的数据为止。最后得到一棵决策树,它可以用来对新的样本进行分类。
算法中涉及信息增益的计算。信息增益(Information Gain,简称IG)用来衡量某个属性中的值为整个分类所能提供的信息量,在决策树算法中,信息增益量越大,这个属性作为一棵树的根节点就能使这棵树更简洁。
本发明在信息增益计算方面,主要使用了3个公式。由于信息增益需要使用到“熵”(Entropy),因此首先来定义熵的概念,如公式(1)所示。
Entropy ( S ) = - Σ i = 1 k P ( i ) * log 2 P ( i ) - - - ( 1 )
在公式(1)中,S表示样本集合,k是样本数量,P(i)是属于分类i的样本与整个样本集合的比例。如果所有S属于相同的类,则熵为0(数据分类完毕)。熵的取值范围是0(分类完毕)到1(完全随机)。
Entropy(S,A)=Σ(|Sv|/|S|)*Entropy(Sv)  (2)
Sv是属性A对应的有v值的子集,公式(2)是把属性A的所有可能的值都分别作了运算,并把结果相加。|Sv|指集合Sv中的元素个数,|S|指集合S中的元素个数。
Gain(S,A)是属性A在集合S上的信息增益,Gain(S,A)的值越大,说明选择测试属性A对分类提供的信息越多,如公式(3)所示。
Gain(S,A)=Entropy(S)-Entropy(S,A)  (3)
当一个构件加入构件库的时候,构件库便根据现有的样本数据生成决策树,为新加入的构件分类。之后系统会进一步根据实际使用情况调整推荐度的具体数值,因此,决策树仅仅在对构件初始化的时候使用。
实例中,构件库中已有构件100个,当一个新的构件请求加入构件库时,决策树程序启动,目标是“新加入的构件是系统推荐的构件吗?”。它有两种选择,是或者否。构件用四个属性来刻画,它们的属性值如图4所示。
注意,有效时间和复本个数在构件库的数据库中存放的都是具体的数值,而这里却需要一个定性的值,因此在构造决策树之前需要转换这里的值,例如,有效时间是1000小时之内的认为有效时间的值为“短”,否则有效时间的值为“长”。接下来,进行根节点的选择。
第一步,利用公式(1),计算决策属性的熵。实例中,样本集有100个构件的记录,其中65个记录的推荐属性为“是”,35个为“否”,则:Entropy(推荐)=‐(65/100)*log2(65/100)‐(35/100)*log2(35/100)=0.934。
第二步,计算条件属性的熵。样本集共有四个条件属性,使用公式(2)分别计算条件属性的熵。计算分两个过程,首先利用公式(1)计算属性值的熵,然后再用公式(2)计算属性的熵。计算结果见图2。样本集合中,在线构件25个,其中推荐的有10个,离线构件75个,其中推荐的有55个;有效时间长的构件81个,其中推荐的有60个,有效时间短的构件19个,推荐的5个;实体类型为文件实体的构件69个,推荐的为45个,实体类型为逻辑服务的构件31个,推荐的为20个;复本个数多的构件60个,推荐的为45个,复本个数少的构件个数是40个,推荐的为20个。
第三步,使用公式(3)分别计算条件属性的信息增益:
Gain(S,构件类型)=Entropy(推荐)‐Entropy(S,构件类型)=0.934‐0.871=0.063
Gain(S,有效时间)=Entropy(推荐)‐Entropy(S,有效时间)=0.934‐0.827=0.107
Gain(S,实体类型)=Entropy(推荐)‐Entropy(S,实体类型)=0.934‐0.934=0
Gain(S,复本个数)=Entropy(推荐)‐Entropy(S,复本个数)=0.934‐0.887=0.047
可以发现,条件属性“有效时间”有最大的增益,所以它用于决策树的根节点。接着,进行支节点的选取。因为有效时间有两种类型,因此根节点就有两个分支(长,短),接下来的问题是“在有效时间长的支节点处应该检验什么属性?”,“在有效时间短的支节点处又应该检验什么属性?”。因为已经使用了有效时间为根节点,只能用剩余的三个变量:构件类型,实体类型或复本个数。算法和选取根节点类似,这里就不再赘述了。

Claims (7)

1.一种基于决策树的网构软件中的构件分类方法,其特征在于包括如下:
1)在网构软件的构件库中新加入构件,对于新加入构件的分类使用数据挖掘中的决策树技术;
2)使用基于信息增益的ID3算法对新加入构件的推荐度进行分析,建立决策树,完成构件分类。
2.如权利要求1所述的网构软件中的构件分类方法,其特征在于所述的决策树技术为:决策树技术是用于分类和预测的技术,决策树学习是以实例为基础的归纳学习算法,它着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则,它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较并根据不同属性判断从该节点向下的分支,然后进行剪枝,最后在决策树的叶节点得到结论;决策树的根节点是整个数据集合空间,即网构软件构件库中所有的构件,每个分节点是对一个单一属性的测试,该测试将数据集合空间分割成两个或更多块,每个叶节点是属于单一类别的记录。
3.如权利要求1所述的网构软件中的构件分类方法,其特征在于所述的基于信息增益的ID3算法具体为:在决策树各级结点上选择属性时,通过计算信息增益来选择属性,以使得在每一个非叶结点进行测试时,能获得关于被测试记录最大的类别信息,实现方法为:检测所有的属性,选择信息增益最大的属性产生决策树结点,由该属性的不同取值建立分支,再对各分支的子集递归调用该方法建立决策树结点的分支,直到所有子集仅包含同一类别的数据为止,最后得到一棵决策树,它用来对新的样本进行分类。
4.如权利要求3所述的网构软件中的构件分类方法,其特征在于所述的基于信息增益的ID3算法的信息增益,具体为:信息增益用来衡量某个属性中的值为整个分类所能提供的信息量,在决策树算法中,信息增益量越大,这个属性作为一棵树的根节点就能使这棵树更简洁,在信息增益计算方面,使用3个公式;信息增益需要使用到熵的概念,熵的概念如公式(1)所示:
Entropy ( S ) = - Σ i = 1 k P ( i ) * log 2 P ( i ) - - - ( 1 )
在公式(1)中,S表示样本集合,k是样本数量,P(i)是属于分类i的样本与整个样本集合的比例,熵的取值范围是0~1,如果所有S属于相同的类,则熵为0,即数据分类完毕;如果熵取值为1,则代表S中样本是完全随机的选自不同的类;
Entropy(S,A)=Σ(|Sv|/|S|)*Entropy(Sv)       (2)
Entropy(S,A)是属性A在集合S上的熵,Sv是属性A对应的有v值的子集,公式(2)是把属性A的所有可能的值都分别作了运算,并把结果相加,|Sv|指集合Sv中的元素个数,|S|指集合S中的元素个数;
Gain(S,A)是属性A在集合S上的信息增益,Gain(S,A)的值越大,说明选择测试属性A对分类提供的信息越多,如公式(3)所示:
Gain(S,A)=Entropy(S)-Entropy(S,A)        (3)。
5.如权利要求1所述的网构软件中的构件分类方法,其特征在于所述的建立决策树的方法具体为:首先寻找初始分裂,整个训练集作为产生决策树的集合,训练集每个记录必须是已经分好类的,决定哪个属性域作为目前最好的分类指标,做法是穷尽所有的属性域,对每个属性域分裂的好坏做出量化,计算出最好的一个分裂;建决策树,就是根据记录字段的不同取值建立树的分支,以及在每个分支子集中重复建立下层结点和分支,建决策树的关键在于建立分支时对记录字段不同取值的选择,选择不同的字段值,会使划分出来的记录子集不同,影响决策树生长的快慢以及决策树结构的好坏,从而导致找到的规则信息的优劣,构件检索使用的决策树算法具体为:
1)初始化决策树T为只含一个树根(X,Q),其中X是全体样本集,Q为全体属性集;
2)如果T中所有叶结点(X’,Q’)都满足X’属于同一类或Q’为空,那么算法停止;否则执行步骤3);
3)计算Q中每个属性的信息增益,选择信息增益最高的属性作为节点的测试属性,记该属性为A;
4)从信息增益最高的属性所对应的节点出发,在X’中求得属性A的值等于给定值的子集,并生成相应的叶结点;
5)重复步骤2)~步骤4),直到T中所有叶结点(X’,Q’)都满足X’属于同一类或Q’为空。
6.如权利要求5所述的所述的网构软件中的构件分类方法,其特征在于所述的穷尽所有的属性域,对每个属性域分裂的好坏做出量化,计算出最好的一个分裂,具体为:
1)利用公式(1),计算决策属性的熵,
2)计算条件属性的熵,样本集共有多个条件属性,使用公式(2)分别计算条件属性的熵,计算分两个过程,首先利用公式(1)计算属性值的熵,然后再用公式(2)计算属性的熵;
3)使用公式(3)分别计算条件属性的信息增益:
选择信息增益最大的条件属性作为决策树的根节点,进行支节点的选取。
7.如权利要求6所述的所述的网构软件中的构件分类方法,其特征在于所述的进行支节点的选取,具体为:使用样本所有条件属性中信息增益最大的条件属性为根节点,用剩余的条件属性重复权利要求6中步骤1)~步骤3)的操作,选取增益最大的条件属性作为支节点;并对选取支节点后的剩余条件属性重复权利要求6中步骤1)~步骤3)的操作,直到剩余的属性数量为1为止。
CN201410789471.5A 2014-12-17 2014-12-17 基于决策树的网构软件中的构件分类方法 Pending CN104537010A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410789471.5A CN104537010A (zh) 2014-12-17 2014-12-17 基于决策树的网构软件中的构件分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410789471.5A CN104537010A (zh) 2014-12-17 2014-12-17 基于决策树的网构软件中的构件分类方法

Publications (1)

Publication Number Publication Date
CN104537010A true CN104537010A (zh) 2015-04-22

Family

ID=52852538

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410789471.5A Pending CN104537010A (zh) 2014-12-17 2014-12-17 基于决策树的网构软件中的构件分类方法

Country Status (1)

Country Link
CN (1) CN104537010A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488413A (zh) * 2015-06-19 2016-04-13 哈尔滨安天科技股份有限公司 一种基于信息增益的恶意代码检测方法及系统
CN106355209A (zh) * 2016-09-07 2017-01-25 国网电力科学研究院武汉南瑞有限责任公司 基于决策树算法的窃电诊断系统及方法
CN106452825A (zh) * 2016-07-20 2017-02-22 国网江苏省电力公司南京供电公司 一种基于改进决策树的配用电通信网告警关联分析方法
CN106529416A (zh) * 2016-10-18 2017-03-22 国网山东省电力公司电力科学研究院 基于毫米波雷达决策树分类的电力线检测方法及系统
CN106899440A (zh) * 2017-03-15 2017-06-27 苏州大学 一种面向云计算的网络入侵检测方法及系统
CN107894827A (zh) * 2017-10-31 2018-04-10 广东欧珀移动通信有限公司 应用清理方法、装置、存储介质及电子设备
CN108183496A (zh) * 2017-12-20 2018-06-19 艾思玛新能源技术(扬中)有限公司 一种光伏储能系统的能量管理方法
CN108241866A (zh) * 2016-12-26 2018-07-03 中国移动通信有限公司研究院 一种对驾驶行为进行引导的方法、装置和车辆
CN108573198A (zh) * 2017-03-14 2018-09-25 优信互联(北京)信息技术有限公司 一种根据车架号识别车型信息的方法及装置
CN109146569A (zh) * 2018-08-30 2019-01-04 昆明理工大学 一种基于决策树的通信用户退网预测方法
CN109672554A (zh) * 2018-10-24 2019-04-23 华为技术服务有限公司 确定故障根因的方法及装置
CN111641624A (zh) * 2020-05-25 2020-09-08 西安电子科技大学 基于决策树的网络协议报头压缩方法
CN111832485A (zh) * 2020-07-14 2020-10-27 深圳市法本信息技术股份有限公司 一种用于识别场景的深度学习方法及自动学习巡检方法
CN116016303A (zh) * 2022-12-05 2023-04-25 浪潮通信信息系统有限公司 一种基于人工智能的核心网业务质量问题识别方法
CN118365464A (zh) * 2024-04-23 2024-07-19 北京中天华胜科技有限公司 一种基于人工智能的自动开票与发票管理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101174316A (zh) * 2006-11-02 2008-05-07 中国移动通信集团公司 一种基于案例树进行案例推理的装置及方法
US20080301211A1 (en) * 2007-06-01 2008-12-04 United States of America as represented by the Administrator of the National Aeronautics and Systems, methods and apparatus for d-dimensional formulation and implementation of recursive hierarchical segmentation
CN101751399A (zh) * 2008-12-12 2010-06-23 中国移动通信集团河北有限公司 决策树优化方法和优化系统
CN103106340A (zh) * 2013-01-21 2013-05-15 天津大学 基于数据挖掘和数据融合的游戏关卡自动生成系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101174316A (zh) * 2006-11-02 2008-05-07 中国移动通信集团公司 一种基于案例树进行案例推理的装置及方法
US20080301211A1 (en) * 2007-06-01 2008-12-04 United States of America as represented by the Administrator of the National Aeronautics and Systems, methods and apparatus for d-dimensional formulation and implementation of recursive hierarchical segmentation
CN101751399A (zh) * 2008-12-12 2010-06-23 中国移动通信集团河北有限公司 决策树优化方法和优化系统
CN103106340A (zh) * 2013-01-21 2013-05-15 天津大学 基于数据挖掘和数据融合的游戏关卡自动生成系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李冬: "ID3算法的优化研究及其在构件库中的应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488413A (zh) * 2015-06-19 2016-04-13 哈尔滨安天科技股份有限公司 一种基于信息增益的恶意代码检测方法及系统
CN106452825A (zh) * 2016-07-20 2017-02-22 国网江苏省电力公司南京供电公司 一种基于改进决策树的配用电通信网告警关联分析方法
CN106355209A (zh) * 2016-09-07 2017-01-25 国网电力科学研究院武汉南瑞有限责任公司 基于决策树算法的窃电诊断系统及方法
CN106355209B (zh) * 2016-09-07 2019-10-25 国网电力科学研究院武汉南瑞有限责任公司 基于决策树算法的窃电诊断系统及方法
CN106529416A (zh) * 2016-10-18 2017-03-22 国网山东省电力公司电力科学研究院 基于毫米波雷达决策树分类的电力线检测方法及系统
CN108241866A (zh) * 2016-12-26 2018-07-03 中国移动通信有限公司研究院 一种对驾驶行为进行引导的方法、装置和车辆
CN108573198A (zh) * 2017-03-14 2018-09-25 优信互联(北京)信息技术有限公司 一种根据车架号识别车型信息的方法及装置
CN106899440A (zh) * 2017-03-15 2017-06-27 苏州大学 一种面向云计算的网络入侵检测方法及系统
CN107894827A (zh) * 2017-10-31 2018-04-10 广东欧珀移动通信有限公司 应用清理方法、装置、存储介质及电子设备
CN108183496A (zh) * 2017-12-20 2018-06-19 艾思玛新能源技术(扬中)有限公司 一种光伏储能系统的能量管理方法
CN109146569A (zh) * 2018-08-30 2019-01-04 昆明理工大学 一种基于决策树的通信用户退网预测方法
CN109672554A (zh) * 2018-10-24 2019-04-23 华为技术服务有限公司 确定故障根因的方法及装置
CN111641624A (zh) * 2020-05-25 2020-09-08 西安电子科技大学 基于决策树的网络协议报头压缩方法
CN111832485A (zh) * 2020-07-14 2020-10-27 深圳市法本信息技术股份有限公司 一种用于识别场景的深度学习方法及自动学习巡检方法
CN116016303A (zh) * 2022-12-05 2023-04-25 浪潮通信信息系统有限公司 一种基于人工智能的核心网业务质量问题识别方法
CN118365464A (zh) * 2024-04-23 2024-07-19 北京中天华胜科技有限公司 一种基于人工智能的自动开票与发票管理系统及方法

Similar Documents

Publication Publication Date Title
CN104537010A (zh) 基于决策树的网构软件中的构件分类方法
Zeng et al. Forecasting the output of shale gas in China using an unbiased grey model and weakening buffer operator
Berkes et al. Detecting changes in the mean of functional observations
CN103902816A (zh) 基于数据挖掘技术的带电检测数据处理方法
CN104572449A (zh) 一种基于用例库的自动化测试方法
Chakraborty et al. On the categorization of scientific citation profiles in computer science
CN102073708A (zh) 面向大规模不确定图数据库的子图查询方法
CN106199174A (zh) 基于迁移学习的挤压机能耗异常预测方法
CN107491508A (zh) 一种基于循环神经网络的数据库查询时间预测方法
CN104809066A (zh) 一种通过代码质量评估预测开源软件维护工作量的方法
CN106022352A (zh) 基于支持向量机的潜油柱塞泵故障诊断方法
CN107633294A (zh) 一种应用于RBF 神经网络的改进Sobol 敏感性分析方法
RU2610287C1 (ru) Способ контроля состояния сети передачи данных
CN104636834A (zh) 一种改进的联合概率规划模型系统优化方法
CN109285219A (zh) 一种基于dem的网格型水文模型网格演算次序编码方法
CN110033126A (zh) 基于注意力机制与逻辑回归的长短期记忆网络预测方法
Huang et al. Evaluation of rock quality of tunnel wall rock based on rough set theory and unascertained measurement theory
Zheng et al. Porosity prediction based on GS+ GA-XGBoost
CN100349135C (zh) 一种测试向量的产生方法
CN114764546A (zh) 基于生成对抗神经网络的断块油藏剩余油预测方法
Zhao et al. Data analysis and knowledge mining of machine learning in soil corrosion factors of the pipeline safety
Zhang et al. Improved global sensitivity analysis for critical factor analysis with intercorrelated inputs: Power plant cost example
CN109739950A (zh) 筛选适用法律条文的方法及装置
CN110032780A (zh) 基于机器学习的工业装置能耗基准值计算方法和系统
CN115994231B (zh) 稠油配汽优化的知识图谱优化方法

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150422

WD01 Invention patent application deemed withdrawn after publication