CN112861692B - 一种房间分类模型构建方法及装置、房间分类方法及装置 - Google Patents
一种房间分类模型构建方法及装置、房间分类方法及装置 Download PDFInfo
- Publication number
- CN112861692B CN112861692B CN202110139999.8A CN202110139999A CN112861692B CN 112861692 B CN112861692 B CN 112861692B CN 202110139999 A CN202110139999 A CN 202110139999A CN 112861692 B CN112861692 B CN 112861692B
- Authority
- CN
- China
- Prior art keywords
- room
- data
- type
- branch
- root node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013145 classification model Methods 0.000 title claims abstract description 56
- 238000012549 training Methods 0.000 claims abstract description 84
- 238000003066 decision tree Methods 0.000 claims abstract description 38
- 238000010276 construction Methods 0.000 claims description 26
- 238000005192 partition Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 14
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种房间分类模型构建方法及装置、房间分类方法及装置,该方法包括:获取训练样本集,所述训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,所述房间的多个属性包括房间的几何信息和门窗信息;根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种房间分类模型构建方法及装置、房间分类方法及装置。
背景技术
目前对户型图的房间类型识别一般是对平面图像进行处理,然后对平面图像中的文字所在区域进行定位,将文字区域和每个字符分割出来,利用机器学习或深度学习方法完成文字识别,获得房间的语义表示,但当户型图中不具有文本信息时,现有的房间分类方法存在着无法对没有文本信息的户型图的房间进行识别的问题。
发明内容
本申请实施例的目的在于提供一种房间分类模型构建方法及装置、房间分类方法及装置,用以现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题。
第一方面,本发明提供一种房间分类模型构建方法,包括:获取训练样本集,所述训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,所述房间的多个属性包括房间的几何信息和门窗信息;根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
在上述设计的房间分类模型构建方法中,利用房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建决策树模型,进而使得构建的决策树模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
在第一方面的可选实施方式中,所述根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,包括:根据所述训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率;将信息增益率最大的属性作为根节点;根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得所述根节点的每一分支;根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集;根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
在第一方面的可选实施方式中,所述数据类型包括离散型和连续型,所述根据所述根节点对应的数据类型对所述根节点进行分支划分,包括:判断所述根节点对应的数据类型是否为连续型;若是,则对所述根节点对应属性的多个房间数据样本的数据进行依次排序,以获得数据排序集合;根据所述数据排序集合确定所述数据排序集合对应的分割点;根据所述分割点将所述数据排序集合划分为第一集合和第二集合;根据所述第一集合和第二集合确定待分割集合,并对所述待分割集合进行分割,直至分割点达到预设个数,以获得所述根节点的每一分支。
在第一方面的可选实施方式中,所述数据排序集合为按照多个房间数据样本的数据的数值由小到大进行排序,所述根据所述数据排序集合确定所述数据排序集合对应的分割点,包括:记录所述数据排序集合中数值最大的样本对应的房间类型;按照数值由大到小依次遍历所述数据排序集中的每一样本对应的房间类型,判断遍历的样本对应的房间类型与所述数值最大的样本对应的房间类型是否一致;在遍历的样本对应的房间类型与所述数值最大的样本对应的房间类型不一致时,获取不一致时遍历的样本对应的数值;根据所述不一致时遍历的样本对应的数值确定所述数据排序集合对应的分割点。
在第一方面的可选实施方式中,所述根据所述不一致时遍历的样本对应的数值确定所述数据排序集合对应的分割点,包括:根据不一致时遍历的样本对应的数值Vf和公式Tj确定所述数据排序集合对应的分割点,其中,公式Tj为:
在上述设计的实施方式中,在对连续型数据类型的根节点进行划分时,通过将连续型数据类型的根节点分割多次,进而解决现有的将连续型数据分割成两半并且连续型属性数量较多、连续型属性中任一属性取值较多时存在的决策树的生成效率低及分类准确率低的问题,提高连续型属性数量较多时决策树的生成效率以及分类准确率。
在第一方面的可选实施方式中,所述根据所述第一集合和第二集合确定待分割集合,并对所述待分割集合进行分割,直至分割点达到预设个数,以获得所述根节点的每一分支,包括:判断分割点的个数是否达到预设个数;若是,则执行根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集的步骤;若否,则计算所述第一集合和第二集合分别对应的信息熵;选择信息熵最大的集合作为所述待分割集合;根据所述待分割集合确定所述待分割集合对应的分割点;根据所述待分割集合对应的分割点对所述待分割集合进行分割并执行所述判断分割点的个数是否达到预设个数的步骤。
在第一方面的可选实施方式中,所述根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建,包括:计算每一分支对应的更新训练样本集中除所述根节点对应的属性以外的每一属性对应的信息增益率;将信息增益率最大的属性作为当前分支的根节点并执行所述根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得所述根节点的每一分支的步骤,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
第二方面,本发明提供一种房间分类方法,包括:获取待识别的户型图;提取所述待识别的户型图的多个房间中每一房间对应的多个属性,每一房间的多个属性包括每一房间的几何信息和门窗信息;将所述待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得所述房间分类模型输出的每一房间的类型,其中,所述房间分类模型为第一方面中任一项可选实施方式构建得到的房间分类模型。
在上述设计的房间分类方法中,由于前述的房间分类模型是通过房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建的,因此将待识别的户型图输入该房间分类模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
第三方面,本申请提供一种房间分类模型构建装置,包括:第一获取模块,用于获取训练样本集,所述训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,所述房间的多个属性包括房间的几何信息和门窗信息;构建模块,用于根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
在上述设计的房间分类模型构建装置,利用房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建决策树模型,进而使得构建的决策树模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
在第三方面的可选实施方式中,所述构建模块,具体用于根据所述训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率;将信息增益率最大的属性作为根节点;根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得所述根节点的每一分支;根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集;根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
第四方面,本申请提供一种房间分类装置,包括:第二获取模块,用于获取待识别的户型图;提取模块,用于提取所述待识别的户型图的多个房间中每一房间对应的多个属性,每一房间的多个属性包括每一房间的几何信息和门窗信息;输入模块,用于将所述待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得所述房间分类模型输出的每一房间的类型,其中,所述房间分类模型为第一方面中任一项可选实施方式构建得到的房间分类模型。
在上述设计的房间分类装置中,由于前述的房间分类模型是通过房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建的,因此将待识别的户型图输入该房间分类模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
第五方面,实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时执行第一方面、第一方面的任一可选的实现方式或第二方面、第二方面的任一可选的实现方式中的所述方法。
第六方面,实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时执行第一方面、第一方面的任一可选的实现方式、第二方面、第二方面的任一可选的实现方式中的所述方法。
第七方面,实施例提供了一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行第一方面、第一方面的任一可选的实现方式、第二方面、第二方面的任一可选的实现方式中的所述方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的房间分类模型构建方法第一流程图;
图2为本申请实施例提供的房间分类模型构建方法第二流程图;
图3为本申请实施例提供的房间分类模型构建方法第三流程图;
图4为本申请实施例提供的房间分类模型构建方法第四流程图;
图5为本申请实施例提供的房间分类模型构建方法第五流程图;
图6为本申请实施例提供的房间分类模型构建方法第六流程图;
图7为本申请实施例提供的房间分类方法第一流程图;
图8为本申请实施例提供的房间分类模型构建装置第一结构图;
图9为本申请实施例提供的房间分类装置第一结构图;
图10为本申请实施例提供的电子设备结构示意图。
图标:800-第一获取模块;801-构建模块;900-第二获取模块;901-提取模块;902-输入模块;10-电子设备;1001-处理器;1002-存储器;1003-通信总线。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
本申请实施例提供的一种房间分类模型构建方法,该方法可应用于计算设备,该计算设备具体可为计算机或服务器等设备,如图1所示,该房间分类模型构建方法,其具体可包括如下步骤:
步骤S100:获取训练样本集,该训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型。
步骤S101:根据训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
在步骤S100中,训练样本集中包含有若干个房间数据样本,每一房间数据样本包括有该房间的多个属性、每一个属性对应的数据类型以及房间类型,房间的多个属性包含有房间的几何信息和门窗信息,其中,几何信息具体可为房间的面积比,即房间面积占户型总面积的比率;房间的窗口比率,即房间窗户与房间总边长的比率;房间的边数,即房间的侧面数;门窗信息具体可包括房间的门的数量以及房间的窗户的数量;每个属性对应的数据类型包含有连续型和离散型,例如,前述所说的面积比和窗口比率对应的数据类型就是连续型,边数、门的数量以及窗户数量对应的数据类型就是离散型;另外,房间类型具体可为如下8种类型:厨房、浴室、储藏室、阳台、主卧、次卧、客厅、书房。
作为一种可能的实施方式,步骤S100中的若干个房间数据样本可通过多个矢量化户型图得到,该矢量化户型图为平面户型图的矢量图形,其可通过将平面户型图输入现有的门窗检测模型后得到,该矢量化户型图包含有墙体的坐标以及门窗的类型、位置和坐标,进而可以得到每个户型图中墙体划分的房间,每个墙体的边长、门窗边长、房间总边长以及墙体的个数,进而可以得到如上的多个属性;当然除了上述方式以外,还可以直接获得平面户型图的矢量化户型图,进而对墙体划分的房间、每个房间的类型、每个墙体的边长、门窗边长、房间总边长以及墙体的个数进行标注即可。
在执行步骤S100获取上具有多个房间数据样本的训练样本集之后,即可执行步骤S101根据训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,作为一种可能的实施方式,构建决策树的过程如图2所示,具体包括如下步骤:
步骤S200:根据训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率。
步骤S201:将信息增益率最大的属性作为根节点。
步骤S202:根据根节点对应的数据类型对根节点进行分支划分,以获得根节点的每一分支。
步骤S203:根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集。
步骤S204:根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
在步骤S200中,计算每一属性对应的信息增益率可通过该训练样本集对应的信息熵以及每一属性对应的条件熵计算得到,其中,该训练样本集对应的信息熵可通过如下方式进行计算:
假设训练样本集为D,训练样本集中的房间类型为n类,其中属于第i类样本数据的数量是Ci,D中总的样本数据的数量是d,则某一个样本数据属于第i类的概率P(i)=Ci/d,此时的信息熵H(D)计算如下:
每一属性对应的条件熵可通过如下方式进行计算:
假设有属性A,它有v个不同的值,因此属性A可以将数据集D划分为v个子集{D1,D2,D3…Dv}。当选择属性A对数据集D进行划分时,每个子集对应的样本数是d1(i=1,2,…,v),则属性A的条件熵H(A|D)定义为:
由上述的信息熵以及条件熵可以计算得到每个属性对应的信息增益I(A),其具体为如下公式:
I(A)=H(D)-H(A|D);
然后基于上述计算得到的每个属性对应的信息增益即可计算得到每个属性对应的信息增益率GainRatio,其具体为如下公式:
通过上述方法计算得到每一属性对应的信息增益率之后,即可执行步骤S201将信息增益率最大的属性作为根节点。
在步骤S201中,本方案会将信息增益率最大的属性作为当前根节点,例如,依照前述的属性举例,在执行步骤S200计算的信息增益率中,面积比对应的信息增益率最大,那么则将面积比作为根节点,进而执行步骤S202。
在步骤S202中,本方案会对步骤S201确定的根节点进行分支划分,具体的划分方法是根据该根节点的数据类型对该根节点进行属性划分,如果该根节点对应的数据类型是离散型,那么则将每一个离散点都作为该根节点的一个分支,进而划分成与离散点数量相同个数的分支;如果该根节点对应的数据类型是连续型,那么可将该连续型的中间点作为分割点,进而将连续型分割成两个分支,但这样的方式当决策树的节点数量较多或连续型属性数量较多或者连续型属性中任一属性取值较多时,会影响到决策树的生成效率及分类准确率,因此,本申请方案针对连续型数据类型的根节点可进行如下的分支划分方式,如图3所示,其具体包括如下步骤:
步骤S300:判断根节点对应的数据类型是否为连续型,若是,则执行步骤S301。
步骤S301:对根节点对应属性的多个房间数据样本的数据进行依次排序,以获得数据排序集合。
步骤S302:根据数据排序集合确定数据排序集合对应的分割点。
步骤S303:根据分割点将数据排序集合划分为第一集合和第二集合。
步骤S304:判断分割点的个数是否达到预设个数,若是,则转到步骤S203;若否,则转到步骤S305;
步骤S305:根据第一集合和第二集合确定待分割集合,并对待分割集合进行分割,直至分割点达到预设个数,以获得根节点的每一分支。
在步骤S300中,依照前述所说,是在为连续型数据类型时才进行如下的阈值分割方式,因此,可首先判断步骤S201确定出的根节点对应的数据类型是离散型还是连续型,当确定为连续型时则执行步骤S301到步骤S304。
在步骤S301中,本方案会将该根节点对应属性的多个房间数据样本的数据进行依次排序进而得到数据排序集合进而执行步骤S302,其中,依次排序可为按照该根节点对应属性的多个房间数据样本的数据的数值由小到大进行排序,进而可以得到数据按照数值升序的数据排序集合;当然,也可以由大到小进行排序得到数据按照数值降序的数据排序集合;下面以由小到大的排序为例进行说明。
在步骤S302中,本方案可根据得到的数据排序集合来确定该数据排序集合的分割点,具体的,当数据排序集合为前述的按照数值升序的数据排序集合时,步骤S302确定分割点的步骤具体可为如下步骤:
步骤S400:记录数据排序集合中数值最大的样本对应的房间类型。
步骤S401:按照数值由大到小依次遍历数据排序集中的每一样本对应的房间类型,判断遍历的样本对应的房间类型与数值最大的样本对应的房间类型是否一致,在遍历的样本的房间类型与数值最大的样本对应的房间类型不一致时,转到步骤S402。
步骤S402:获取不一致时遍历的样本对应的数值。
步骤S403:根据不一致时遍历的样本对应的数值确定数据排序集合对应的分割点。
在上述步骤中,当数据排序集合为前述的按照数值升序的数据排序集合时,可记录该数据排序集合中数值最大的样本对应的房间类型,进而按照数值由大到小地在该数据排序集合中遍历每一数据,进而在遍历的数据对应的房间类型与步骤S400记录的数值最大的样本对应的房间类型不一致时,记录该遍历的数据的数值,进而根据不一致时遍历的样本对应的数值确定数据排序集合对应的分割点。
作为一种可能的实施方式,为了使得确定的分割点更加准确,可基于不一致时遍历的样本对应的数值通过如下方式来计算得到分割点,具体是,假设不一致时遍历的样本对应的数值为Vf,那么确定的分割点Tj可通过如下方式计算得到:
通过上述方式确定数据排序集合的分割点之后,即可执行步骤S303根据该分割点将该数据排序集合进行分割进而分割成第一集合和第二集合,然后执行步骤S304。
在步骤S304中,本方案会判断得到的分割点的个数是否达到预设个数,若达到预设个数,那么则说明对数据排序集合的分割已经完成,进而执行步骤S203,若没有达到预设个数,则说明当前分割还没有完成,那么则执行步骤S305根据第一集合和第二集合确定待分割集合,并对待分割集合进行分割,直至分割点达到预设个数,以获得根节点的每一分支。
对于步骤S305,本方案通过如下步骤具体实现:
步骤S500:计算第一集合和第二集合分别对应的信息熵。
步骤S501:选择信息熵最大的集合作为待分割集合。
步骤S502:根据待分割集合确定待分割集合对应的分割点。
步骤S503:根据待分割集合对应的分割点对待分割集合进行分割,转到步骤S304。
在上述步骤中,本方案会分别计算对数据排序集合分割后得到的第一集合和第二集合分别对应的信息熵,然后选择信息熵较大的集合作为下一次分割的集合,进而再次根据待分割集合确定待分割集合对应分割点,进而根据确定出的分割点对待分割集合进行分割,然后再转到步骤S304判断得到分割点个数是否满足要求,若还不满足,则重复执行步骤S500到S503再进行分割。其中,步骤S502确定待分割集合的分割点的方式与前述确定数据排序集合的分割点的方式一致,在这里不再赘述。
依照前述所说,在确定分割点的个数达到预设个数之后,则说明对该连续型数据类型的根节点已经划分完成,得到了该根节点的多个分支,进而执行步骤S203根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集。这里需要说明的是,上述只是采用了根节点为连续型数据类型的属性进行说明,当数据类型为离散型时,可将每一离散数据作为一个分支对离散型数据类型的属性的根节点划分完毕之后即可执行步骤S203。
步骤S203会根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集,以连续型数据类型为例,假设其面积比的属性作为根节点,其通过前述步骤划分成三个分支,分别得到分支A对应的集合为[0.1~0.3]、分支B对应的集合为(0.3~0.6]、分支C对应的集合为(0.6~1],那么本步骤得到的三个分支A、B、C对应的更新训练样本集分别为面积比为[0.1~0.3]的所有房间数据样本、面积比为(0.3~0.6]的所有房间数据样本以及面积比为(0.6~1]的所有房间数据样本,进而执行步骤S204根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
在步骤S204中,本方案可以通过如下步骤来具体实现,包括:
步骤S600:计算每一分支对应的更新训练样本集中除根节点对应的属性以外的每一属性对应的信息增益率。
步骤S601:将信息增益率最大的属性作为当前分支的根节点并执行根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得根节点的每一分支的步骤,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
在上述步骤中,在确定出每一分支对应的更新训练样本集之后,本方案会计算每一分支对应的更新训练样本集中除了根节点对应的属性以外的每一属性对应的信息增益率,依照前述的举例,面积比的分支A对应的更新训练样本集分别为面积比为[0.1~0.3]的所有房间数据样本,那么在步骤S600中,本方案会根据面积比为[0.1~0.3]的所有房间数据样本计算除了面积比这个属性以外的每一属性对应的信息增益率,分支B以及分支C同样如此,进而针对每一分支,选择信息增益率最大的属性作为该分支下的根节点进而再来进行划分,重复如上的根节点划分步骤直到直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,例如,假设分支A对应的更新训练样本集分别为面积比为[0.1~0.3]的所有房间数据样本,但面积比为[0.1~0.3]的所有房间数据样本对应的房间类型都是厨房,那么则不再进行根节点划分,进而在所有分支下的房间数据样本对应的房间类型均为同一种类型时,完成决策树的构建;当然除了所有的样本都为同一房间类型以外,还可以满足一定的预设比例,假设预设比例为同一房间类型的样本比例大于等于80%即可不再进行根节点划分,那么,在前述的举例基础上面积比为[0.1~0.3]的所有房间数据样本中房间类型均为厨房的样本比例只要大于或等于80%,即可不再进行根节点划分。
在上述设计的房间分类模型构建方法中,利用房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建决策树模型,进而使得构建的决策树模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
在构建得到上述的房间分类模型之后,本申请提供一种房间分类方法,该方法也可以应用于计算设备中,该方法包括如下步骤:
步骤S700:获取待识别的户型图。
步骤S701:提取待识别的户型图的多个房间中每一房间对应的多个属性。
步骤S702:将待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得房间分类模型输出的该户型图中每一房间的类型。
在上述步骤中,待识别的户型图可为待识别的矢量化户型图,进而可以根据矢量化户型图计算得到该待识别的户型图中房间的各个属性,然后输入前述训练完成的房间分类模型中,进而基于房间分类模型中的决策树即可确定出每一房间的类型;这里需要说明的是当本申请还具备前述所说的门窗识别模型时,该待识别的户型图可为原始户型图,然后将原始户型图首先输入门窗识别模型,进而得到原始户型图中墙体的坐标、门窗的坐标、位置以及类型,进而得到待识别的户型图的各个房间的多个属性,其中,该多个属性为前述构建房间分类模型时每个房间的多个属性,然后执行步骤S701即可得到每一房间的类型。
在上述设计的房间分类方法中,由于前述的房间分类模型是通过房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建的,因此将待识别的户型图输入该房间分类模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
图8出示了本申请提供的一种房间分类模型构建装置的示意性结构框图,应理解,该装置与上述图1至图6中执行的方法实施例对应,能够执行前述实施方式中执行的方法涉及的步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。具体地,该装置包括:第一获取模块800,用于获取训练样本集,该训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,房间的多个属性包括房间的几何信息和门窗信息;构建模块801,用于根据训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
在上述设计的房间分类模型构建装置中,通过利用房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建决策树模型,进而使得构建的决策树模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
在本实施例的可选实施方式中,构建模块801,具体用于根据训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率;将信息增益率最大的属性作为根节点;根据根节点对应的数据类型对根节点进行分支划分,以获得根节点的每一分支;根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集;根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
图9出示了本申请提供的一种房间分类装置的示意性结构框图,应理解,该装置与上述图7中执行的方法实施例对应,能够执行前述实施方式中执行的方法涉及的步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system,OS)中的软件功能模块。具体地,该装置包括:第二获取模块900,用于获取待识别的户型图;提取模块901,用于提取待识别的户型图的多个房间中每一房间对应的多个属性,每一房间的多个属性包括每一房间的几何信息和门窗信息;输入模块902,用于将待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得房间分类模型输出的每一房间的类型,其中,该房间分类模型为前述任一项可选实施方式构建得到的房间分类模型。
在上述设计的房间分类装置中,由于前述的房间分类模型是通过房间的几何信息和门窗信息组成的房间属性以及具有房间类型标识的多个房间数据样本组成训练样本集,进而通过具有房间的几何信息和门窗信息的房间属性的训练样本集来构建的,因此将待识别的户型图输入该房间分类模型能够基于户型图的房间的几何信息和门窗信息即可对户型图的房间进行分类,解决了现有的房间分类方法存在的无法对没有文本信息的户型图的房间进行识别的问题,进而使得没有文本信息的户型图的房间也能够进行自动分类,实现无文本信息的户型图的房间自动分类,提高无文本信息的户型图的房间分类的效率以及准确率。
如图10所示,本申请提供一种电子设备10,包括:处理器1001和存储器1002,处理器1001和存储器1002通过通信总线1003和/或其他形式的连接机构(未标出)互连并相互通讯,存储器1002存储有处理器1001可执行的计算机程序,当计算设备运行时,处理器1001执行该计算机程序,以执行时执行前述任一实现方式中的方法过程,例如步骤S100至步骤S101:获取训练样本集,该训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型;根据训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型。
本申请提供一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前述任一实现方式中的方法过程。
其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-OnlyMemory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请提供一种计算机程序产品,该计算机程序产品在计算机上运行时,使得计算机执行前述任一实现方式中的方法过程。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
需要说明的是,功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种房间分类模型构建方法,其特征在于,包括:
获取训练样本集,所述训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,所述房间的多个属性包括房间的几何信息和门窗信息;
根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型;
所述根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,包括:
根据所述训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率;
将信息增益率最大的属性作为根节点;
根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得所述根节点的每一分支;
根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集;
根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建;
所述数据类型包括离散型和连续型,所述根据所述根节点对应的数据类型对所述根节点进行分支划分,包括:
判断所述根节点对应的数据类型是否为连续型;
若是,则对所述根节点对应属性的多个房间数据样本的数据进行依次排序,以获得数据排序集合;
根据所述数据排序集合确定所述数据排序集合对应的分割点;
根据所述分割点将所述数据排序集合划分为第一集合和第二集合;
判断分割点的个数是否达到预设个数;
若是,则执行根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集的步骤;
若否,则根据所述第一集合和第二集合确定待分割集合,并对所述待分割集合进行分割,直至分割点达到预设个数,以获得所述根节点的每一分支。
2.根据权利要求1所述的方法,其特征在于,所述数据排序集合为按照多个房间数据样本的数据的数值由小到大进行排序,所述根据所述数据排序集合确定所述数据排序集合对应的分割点,包括:
记录所述数据排序集合中数值最大的样本对应的房间类型;
按照数值由大到小依次遍历所述数据排序集中的每一样本对应的房间类型,判断遍历的样本对应的房间类型与所述数值最大的样本对应的房间类型是否一致;
在遍历的样本对应的房间类型与所述数值最大的样本对应的房间类型不一致时,获取不一致时遍历的样本对应的数值;
根据所述不一致时遍历的样本对应的数值确定所述数据排序集合对应的分割点。
3.根据权利要求2所述的方法,其特征在于,所述根据所述不一致时遍历的样本对应的数值确定所述数据排序集合对应的分割点,包括:
根据不一致时遍历的样本对应的数值Vf确定所述数据排序集合对应的分割点Tj,其中,公式为:
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一集合和第二集合确定待分割集合,并对所述待分割集合进行分割,直至分割点达到预设个数,以获得所述根节点的每一分支,包括:
计算所述第一集合和第二集合分别对应的信息熵;
选择信息熵最大的集合作为所述待分割集合;
根据所述待分割集合确定所述待分割集合对应的分割点;
根据所述待分割集合对应的分割点对所述待分割集合进行分割并返回所述判断分割点的个数是否达到预设个数的步骤。
5.根据权利要求1所述的方法,其特征在于,所述根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建,包括:
计算每一分支对应的更新训练样本集中除所述根节点对应的属性以外的每一属性对应的信息增益率;
将信息增益率最大的属性作为当前分支的根节点并返回执行所述根据所述根节点对应的数据类型对所述根节点进行分支划分,以获得所述根节点的每一分支的步骤,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
6.一种房间分类方法,其特征在于,包括:
获取待识别的户型图;
提取所述待识别的户型图的多个房间中每一房间对应的多个属性,每一房间的多个属性包括每一房间的几何信息和门窗信息;
将所述待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得所述房间分类模型输出的每一房间的类型,其中,所述房间分类模型为权利要求1-5中任一项构建得到的房间分类模型。
7.一种房间分类模型构建装置,其特征在于,包括:
第一获取模块,用于获取训练样本集,所述训练样本集包括多个房间数据样本,每一房间数据样本包括房间的多个属性、每一属性对应的数据类型以及房间类型,所述房间的多个属性包括房间的几何信息和门窗信息;
构建模块,用于根据所述训练样本集中每一房间数据样本的多个属性、每一属性对应的数据类型以及房间类型构建决策树,以获得构建完成的房间分类模型;
所述构建模块,具体用于根据所述训练样本集中每一房间数据样本的多个属性和房间类型计算每一属性对应的信息增益率;
将信息增益率最大的属性作为根节点;
所述数据类型包括离散型和连续型,判断所述根节点对应的数据类型是否为连续型;
若是,则对所述根节点对应属性的多个房间数据样本的数据进行依次排序,以获得数据排序集合;
根据所述数据排序集合确定所述数据排序集合对应的分割点;
根据所述分割点将所述数据排序集合划分为第一集合和第二集合;
判断分割点的个数是否达到预设个数;
若是,则执行根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集的步骤;
若否,则根据所述第一集合和第二集合确定待分割集合,并对所述待分割集合进行分割,直至分割点达到预设个数,以获得所述根节点的每一分支;
根据每一分支对应的房间数据样本生成每一分支对应的更新训练样本集;
根据每一分支对应的更新训练样本集确定每一分支对应的根节点,直至每一分支对应的房间数据样本中属于同一房间类型的样本比例满足预设比例,以完成决策树的构建。
8.一种房间分类装置,其特征在于,包括:
第二获取模块,用于获取待识别的户型图;
提取模块,用于提取所述待识别的户型图的多个房间中每一房间对应的多个属性,每一房间的多个属性包括每一房间的几何信息和门窗信息;
输入模块,用于将所述待识别的户型图中每一房间对应的多个属性输入预先训练完成的房间分类模型中,以获得所述房间分类模型输出的每一房间的类型,其中,所述房间分类模型为权利要求1-5中任一项构建得到的房间分类模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110139999.8A CN112861692B (zh) | 2021-02-01 | 2021-02-01 | 一种房间分类模型构建方法及装置、房间分类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110139999.8A CN112861692B (zh) | 2021-02-01 | 2021-02-01 | 一种房间分类模型构建方法及装置、房间分类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112861692A CN112861692A (zh) | 2021-05-28 |
CN112861692B true CN112861692B (zh) | 2024-03-15 |
Family
ID=75987685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110139999.8A Active CN112861692B (zh) | 2021-02-01 | 2021-02-01 | 一种房间分类模型构建方法及装置、房间分类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112861692B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113591177B (zh) * | 2021-07-05 | 2024-05-31 | 成都云中楼阁科技有限公司 | 一种基于住宅建筑平面图自动识别户型的方法 |
CN113516188B (zh) * | 2021-07-16 | 2024-04-12 | 北京上格云智能技术有限公司 | 一种预测空调提前开机时长的方法、装置、设备及介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102049420A (zh) * | 2009-11-05 | 2011-05-11 | 刘斌 | 基于决策树的精轧温控过程关键特征变量提取方法 |
CN105808582A (zh) * | 2014-12-30 | 2016-07-27 | 华为技术有限公司 | 基于分层策略的决策树并行生成方法和装置 |
CN105824813A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团江苏有限公司 | 一种挖掘核心用户的方法及装置 |
CN107947874A (zh) * | 2017-11-21 | 2018-04-20 | 太原理工大学 | 基于WiFi信道状态信息的室内地图语义标识方法 |
CN110084377A (zh) * | 2019-04-30 | 2019-08-02 | 京东城市(南京)科技有限公司 | 用于构建决策树的方法和装置 |
CN110717787A (zh) * | 2019-10-08 | 2020-01-21 | 恩亿科(北京)数据科技有限公司 | 一种用户的分类方法及装置 |
CN111091618A (zh) * | 2019-12-17 | 2020-05-01 | 吉林吉动盘古网络科技股份有限公司 | 基于户型数据驱动的组合式室内布局方法和系统 |
CN111815488A (zh) * | 2020-06-30 | 2020-10-23 | 安徽工程大学 | 基于决策树的光伏发电助学方法 |
CN112132187A (zh) * | 2020-08-27 | 2020-12-25 | 上海大学 | 基于随机森林快速判断钙钛矿结构稳定性的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11461985B2 (en) * | 2019-01-30 | 2022-10-04 | Mosaic, Ltd | Methods and systems for rendering and modifying three-dimensional models for interior design |
-
2021
- 2021-02-01 CN CN202110139999.8A patent/CN112861692B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102049420A (zh) * | 2009-11-05 | 2011-05-11 | 刘斌 | 基于决策树的精轧温控过程关键特征变量提取方法 |
CN105808582A (zh) * | 2014-12-30 | 2016-07-27 | 华为技术有限公司 | 基于分层策略的决策树并行生成方法和装置 |
CN105824813A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团江苏有限公司 | 一种挖掘核心用户的方法及装置 |
CN107947874A (zh) * | 2017-11-21 | 2018-04-20 | 太原理工大学 | 基于WiFi信道状态信息的室内地图语义标识方法 |
CN110084377A (zh) * | 2019-04-30 | 2019-08-02 | 京东城市(南京)科技有限公司 | 用于构建决策树的方法和装置 |
CN110717787A (zh) * | 2019-10-08 | 2020-01-21 | 恩亿科(北京)数据科技有限公司 | 一种用户的分类方法及装置 |
CN111091618A (zh) * | 2019-12-17 | 2020-05-01 | 吉林吉动盘古网络科技股份有限公司 | 基于户型数据驱动的组合式室内布局方法和系统 |
CN111815488A (zh) * | 2020-06-30 | 2020-10-23 | 安徽工程大学 | 基于决策树的光伏发电助学方法 |
CN112132187A (zh) * | 2020-08-27 | 2020-12-25 | 上海大学 | 基于随机森林快速判断钙钛矿结构稳定性的方法 |
Non-Patent Citations (4)
Title |
---|
Multi-interval discretization of continuous-valued attributes for classification learning;Usama M. Fayyad等;《Machine Learning》;1022-1027 * |
Wei Wang等.Room Classification in Floor Plan Recognition.《ICAIP '20: Proceedings of the 4th International Conference on Advances in Image Processing》.2021,48-54. * |
一种建筑信息模型分类方法;樊永生等;《计算机工程与应用》;第51卷(第4期);148-153 * |
通用数据挖掘系统平台的设计与实现;郭文政;中国优秀硕士学位论文全文数据库 信息科技辑》(第10期);正文第31-32页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112861692A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109190023B (zh) | 协同推荐的方法、装置及终端设备 | |
CN110457404B (zh) | 基于复杂异质网络的社交媒体账户分类方法 | |
CN112818690B (zh) | 结合知识图谱实体信息的语义识别方法、装置及相关设备 | |
CN108733976B (zh) | 基于融合生物与拓扑特征的关键蛋白质识别方法 | |
CN110442702B (zh) | 搜索方法、装置、可读存储介质和电子设备 | |
CN112861692B (zh) | 一种房间分类模型构建方法及装置、房间分类方法及装置 | |
CN112116613A (zh) | 模型训练方法、图像分割方法、图像矢量化方法及其系统 | |
CN105740651A (zh) | 一种特定癌症差异表达基因调控网络的构建方法 | |
Liu et al. | Dynamic local search based immune automatic clustering algorithm and its applications | |
CN112528022A (zh) | 主题类别对应的特征词提取和文本主题类别识别方法 | |
CN113111185A (zh) | 一种用于知识图谱补全任务的关键路径构建方法和系统 | |
CN110956248A (zh) | 一种基于隔离森林的海量数据异常值检测算法 | |
CN108647739B (zh) | 一种基于改进的密度峰值聚类的社交网络社区发现方法 | |
CN113094448B (zh) | 住宅空置状态的分析方法及分析装置、电子设备 | |
Ding et al. | Dirichlet process mixture models with shrinkage prior | |
CN113779520A (zh) | 基于多层属性分析的跨空间目标虚拟身份关联方法 | |
WO2024012179A1 (zh) | 模型训练方法、目标检测方法及装置 | |
CN117556287A (zh) | 一种基于鲸鱼优化改进k均值的台区线损精益化管理方法 | |
CN113807316B (zh) | 烟雾浓度估计模型的训练方法、装置、电子设备及介质 | |
CN116720009A (zh) | 一种社交机器人检测方法、装置、设备及存储介质 | |
CN112651590B (zh) | 一种指令处理流程推荐的方法 | |
CN111860441B (zh) | 基于无偏深度迁移学习的视频目标识别方法 | |
CN113888342A (zh) | 社区发现方法、电子设备、存储介质以及程序产品 | |
CN111309854B (zh) | 一种基于文章结构树的文章评价方法及系统 | |
CN112604297B (zh) | 游戏外挂的检测方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |