CN115034839A - 办公区域状态的检测方法、装置和存储介质及电子设备 - Google Patents
办公区域状态的检测方法、装置和存储介质及电子设备 Download PDFInfo
- Publication number
- CN115034839A CN115034839A CN202111663263.7A CN202111663263A CN115034839A CN 115034839 A CN115034839 A CN 115034839A CN 202111663263 A CN202111663263 A CN 202111663263A CN 115034839 A CN115034839 A CN 115034839A
- Authority
- CN
- China
- Prior art keywords
- classification
- characteristic values
- utilization characteristic
- data
- electricity utilization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 238000003860 storage Methods 0.000 title claims abstract description 19
- 230000005611 electricity Effects 0.000 claims abstract description 418
- 230000002159 abnormal effect Effects 0.000 claims abstract description 139
- 238000000034 method Methods 0.000 claims abstract description 90
- 230000008569 process Effects 0.000 claims description 41
- 230000006399 behavior Effects 0.000 claims description 29
- 230000015654 memory Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 238000010801 machine learning Methods 0.000 abstract description 7
- 235000019580 granularity Nutrition 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 238000012549 training Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 238000005520 cutting process Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000009423 ventilation Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000005612 types of electricity Effects 0.000 description 3
- 239000010754 BS 2869 Class F Substances 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0645—Rental transactions; Leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种办公区域状态的检测方法、装置和存储介质及电子设备。其中,该方法包括:在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值;对N个用电特征值进行迭代分类,直至达到迭代收敛条件;根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数;在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态。本发明解决了办公区域状态的检测效率较低的技术问题,可应用于人工智能领域中的机器学习等场景。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种办公区域状态的检测方法、装置和存储介质及电子设备。
背景技术
近些年在一些发达城市,办公区域的灵活办公的兴起,由于办公区域是通过将整栋办公区域划分成建成若干小间分别按间出租或按工位出租,由于发达城市的面积大、人口多,若依靠人力进行调查,这显然是不现实的。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种办公区域状态的检测方法、装置和存储介质及电子设备,以至少解决办公区域状态的检测效率较低的技术问题。
根据本发明实施例的一个方面,提供了一种办公区域状态的检测方法,包括:在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对上述N组参考数据中的每组参考数据分别进行统计,以获取上述N个待检测办公区域分别对应的N个用电特征值,其中,上述用电特征值用于表示上述待检测办公区域中用户的用电行为特征,N为大于等于3的整数;对上述N个用电特征值进行迭代分类,直至达到迭代收敛条件;根据在达到上述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,上述离群指示系数用于表示每个用电特征值远离上述N个用电特征值中正常用电特征值的程度,在上述N个用电特征值中上述正常用电特征值的数量大于异常用电特征值的数量;在上述N个统计数据用电特征值中确定出异常用电特征值的情况下,确定上述异常用电特征值对应的目标办公区域处于特定状态,其中,上述异常用电特征值为上述离群指示系数达到异常阈值的用电特征值。
根据本发明实施例的另一方面,还提供了一种办公区域状态的检测装置,包括:统计单元,用于在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对上述N组参考数据中的每组参考数据分别进行统计,以获取上述N个待检测办公区域分别对应的N个用电特征值,其中,上述用电特征值用于表示上述待检测办公区域中用户的用电行为特征,N为大于等于3的整数;分类单元,用于对上述N个用电特征值进行迭代分类,直至达到迭代收敛条件;第一确定单元,用于根据在达到上述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,上述离群指示系数用于表示每个用电特征值远离上述N个用电特征值中正常用电特征值的程度,在上述N个用电特征值中上述正常用电特征值的数量大于异常用电特征值的数量;第二确定单元,用于在上述N个统计数据用电特征值中确定出异常用电特征值的情况下,确定上述异常用电特征值对应的目标办公区域处于特定状态,其中,上述异常用电特征值为上述离群指示系数达到异常阈值的用电特征值。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述办公区域状态的检测方法。
根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的办公区域状态的检测方法。
在本发明实施例中,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对上述N组参考数据中的每组参考数据分别进行统计,以获取上述N个待检测办公区域分别对应的N个用电特征值,其中,上述用电特征值用于表示上述待检测办公区域中用户的用电行为特征,N为大于等于3的整数;对上述N个用电特征值进行迭代分类,直至达到迭代收敛条件;根据在达到上述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,上述离群指示系数用于表示每个用电特征值远离上述N个用电特征值中正常用电特征值的程度,在上述N个用电特征值中上述正常用电特征值的数量大于异常用电特征值的数量;在上述N个统计数据用电特征值中确定出异常用电特征值的情况下,确定上述异常用电特征值对应的目标办公区域处于特定状态,其中,上述异常用电特征值为上述离群指示系数达到异常阈值的用电特征值,利用迭代分类的方式,在用于表征办公区域中用户用电行为特征的多个用电特征值中,确定正常用电特征值以及异常用电特征值,进而达到了在保证一定检测准确性的前提下,无需样本训练,也可检测出办公区域状态的技术目的,从而实现了提高办公区域状态的检测效率的技术效果,进而解决了办公区域状态的检测效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选地办公区域状态的检测方法的应用环境的示意图;
图2是根据本发明实施例的一种可选地办公区域状态的检测方法的流程图的示意图;
图3是根据本发明实施例的一种可选地办公区域状态的检测方法的示意图;
图4是根据本发明实施例的另一种可选地办公区域状态的检测方法的示意图;
图5是根据本发明实施例的另一种可选地办公区域状态的检测方法的示意图;
图6是根据本发明实施例的另一种可选地办公区域状态的检测方法的示意图;
图7是根据本发明实施例的一种可选地办公区域状态的检测装置的示意图;
图8是根据本发明实施例的另一种可选地办公区域状态的检测装置的示意图;
图9是根据本发明实施例的另一种可选地办公区域状态的检测装置的示意图;
图10是根据本发明实施例的一种可选地电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的机器学习等技术,具体通过如下实施例进行说明:
根据本发明实施例的一个方面,提供了一种办公区域状态的检测方法,可选地,作为一种可选地实施方式,上述办公区域状态的检测方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102、网络110及服务器112,其中,该用户设备102上可以但不限于包括显示器108、处理器106及存储器104。
具体过程可如下步骤:
步骤S102,用户设备102获取N个待检测办公区域在一段时间内分别产生的N组参考用电数据,其中,图1所示的一个待检测办公区域仅为示例;
步骤S104-S106,用户设备102通过网络110将N组参考用电数据发送给服务器112;
步骤S108,服务器112通过处理引擎116对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,进一步对N个用电特征值进行迭代分类以确定每个用电特征值各自对应的离群指示系数,再者根据离群指示系数确定检测结果,其中,检测结果用于指示离群指示系数达到异常阈值的用电特征值对应的目标办公区域;
步骤S110-S112,服务器112通过网络110将检测结果发送给用户设备102,用户设备102中的处理器106将检测结果对应的目标办公区域的相关信息显示在显示器108中,并将目标办公区域的相关信息存储在存储器104中。
除图1示出的示例之外,上述步骤可以由用户设备102独立完成,即由用户设备102执行N组参考数据中的每组参考数据的统计、对N个用电特征值进行迭代分类以确定每个用电特征值各自对应的离群指示系数等步骤,从而减轻服务器的处理压力。该用户设备102包括但不限于手持设备(如手机)、笔记本电脑、台式电脑、车载设备等,本发明并不限制用户设备102的具体实现方式。
可选地,作为一种可选地实施方式,如图2所示,办公区域状态的检测方法包括:
S202,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
S204,对N个用电特征值进行迭代分类,直至达到迭代收敛条件;
S206,根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;
S208,在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值。
可选地,在本实施例中,办公区域状态的检测方法可以但不限于应用在检测居住由办公区域异常用户的异常办公区域的应用场景,具体的,考虑到办公区域异常用户所在的异常办公区域,由于用户因为增加房间及卫生间、部分房间无窗通风等,造成多个商户同时累加使用电器的现象,因此办公区域异常用户所在的异常办公区域最明显的特征就是办公区域产生的用电数据会明显异常于同面积的其他用户,并且由于办公区域异常用户的异常办公区域在大环境下还是处于少数部分,或者说普通用户的正常办公区域的数量远远高于办公区域异常用户的异常办公区域的数量,进而异常用电数据在整体数据中自然也属于少数部分。那么在确定出属于少数部分的异常用电数据的情况下,就可以确定出对应的异常办公区域。基于此,上述办公区域状态的检测方法利用迭代分类的方式,将少数部分的异常用电数据以较高离群指示系数的用电特征值表征出来,进而在没有训练样本的情况下,也实现了准确确定出少数部分的异常用电数据对应的异常办公区域的效果。
可选地,在本实施例中,待检测办公区域可以但不限于为预设范围内全部或抽查的办公区域,例如将目标小区的全部或抽查的办公区域作为待检测办公区域;也可以但不限于为预设范围内面积相似度达到面积阈值的办公区域,例如考虑到处于特定状态的目标办公区域多为方便于分割为多个房间的大面积办公区域,进而将目标小区中面积在80㎡以上的办公区域作为待检测办公区域;也可以但不限于为面积相似度在面积范围内的办公区域,例如将目标小区中面积在40-50㎡的办公区域作为待检测办公区域;还可以但不限于为指定调查的办公区域。
可选地,在本实施例中,参考用电数据可以但不限于为不同粒度的数据,例如参考用电数据为日粒度用电数据,即表示将每天的用电数据作为参考用电数据;再例如参考用电数据为月粒度用电数据,即表示将每月的用电数据作为参考用电数据。此外,参考用电数据也可以但不限与为不同粒度的数据集合,在此不做限定。
可选地,在本实施例中,参考用电数据可以但不限于为不同类型的用电数据,以日粒度用电数据为例说明,包括以下至少之一:每天的用电日总电量、日平电总电量、日峰电总电量、谷电总电量、日尖电量总电量;再以月粒度用电数据为例说明,包括以下至少之一:按月统计的月总电量、月平电总电量、月谷电总电量,
可选地,在本实施例中,用电特征值可以但不限用于表示相比于正常办公区域的用户的用电行为,更能体现异常办公区域的用户的异常用电行为的用电特征,或者说用电特征值可以但不限用于体现异常办公区域的用户和正常办公区域的用户之间的用电行为模式的差别,例如异常办公区域的用户因为增加房间及卫生间、部分房间无窗通风等,造成“麻雀虽小五脏俱全”的多个商户同时累加使用电器的现象,因此异常办公区域的用户最明显的特征就是用户的用电总量会明显高于同面积的其他用户;再例如,正常用户在用电行为上存在一定稳定性和周期性,因此在一段时间窗之类,异常办公区域的用户和正常办公区域的用户在用电统计特征,用电曲线的变化周期性上存在较大差别;再例如异常办公区域的用户和正常用户由于人员流动性上存在较大差别,因此用电模式上也存在较大的差别。
可选地,在本实施例中,用电特征值可以但不限于为多个维度的数值,迭代分类可以但不限于包括对同一维度的数值大小进行分类,例如用电特征值包括同一维度的数值1、2、3、4,则迭代分类可以但不限于按照大小对该数值进行一次或多次分类,直至达到迭代收敛条件。可选的,分类方式可以但不限于为二分类、多分类等,再次不做限定。
进一步以迭代分类的分类方式为二分类为例说明,假设包括同一纬度的测试样本a、b、c、d,则对上述测试样本a、b、c、d执行迭代分类即表示依次执行二分类操作,例如第一次二分类操作,将a分为A类,将b、c、d分为B类,其中,由于A类下只有测试样本a,即表示A类无法再次执行二分类;进一步,继续对B类执行第二次二分类操作,将B类下的b、c、d分为C类以及D类,其中,C类下包括b、c,D类下包括d,其中,同理D类也无法再次执行二分类;再者,继续对C类执行第三次二分类操作,将C类下的b、c分为E类和F类,其中,E类下包括b,F类下包括c,且E类以及F类都无法再次执行二分类,即可以但不限于表示达到迭代收敛条件,迭代分类结束。
可选地,在本实施例中,分类信息可以但不限用于表示用电特征值在迭代分类过程中的分类情况,例如分类次序、分类次序、分类类型、分类规律、分类频率等。
可选地,在本实施例中,迭代收敛条件可以但不限于为每个用电特征值都完成分类,和/或每个分类结果都确定好各自的离群指示系数,和/或迭代分类的分类次序达到次序阈值,和/或迭代分类的分类数目达到数目阈值等。
可选地,在本实施例中,由于处于特定状态的办公区域在仅为整体办公区域较少一部分,且处于特定状态的办公区域产生的参考用电数据和正常办公区域产生的参考用电数据差别较大,进而可以但不限于采用无需标签样本且训练高效的孤立森林算法(iForest,Isolation Forest)来计算离群指示系数的方式,确定出处于特定状态的目标办公区域。
可选地,在本实施例中,孤立森林算法是一个基于Ensemble的快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的state-of-the-art算法,且孤立森林算法还适用于连续数据的异常检测,将异常定义为“容易被孤立的离群点”,可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释,在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因而可以认为落在这些区域里的数据是异常的,进而孤立森林算法不再是描述正常的样本点,而是要孤立异常点,该异常点需满足两个特点,即异常数据只占据很少量、异常数据特征值和正常数据差别很大,例如图3所示的孤立森林算法场景,将密集区域306中的点视为群体,即正常点304,将密集区域306外的点视为远离群体,即为异常点302。
进一步举例说明,在本实施例中,孤立森林算法主要包括训练iForest和计算离群指示系数两步,具体如下:
(1)训练iForest:从训练集(即N个用电特征值)中进行采样,构建孤立树,对森林中的每棵孤立树进行测试,记录路径长度。具体步骤如下:
步骤1、从训练数据中随机选择Ψ个点作为子样本,放入一棵孤立树的根节点;
步骤2、随机指定一个维度,在当前节点数据范围内,随机产生一个切割点p——切割点产生于当前节点数据中指定维度的最大值与最小值之间;
步骤3、此切割点的选取生成了一个超平面,将当前节点数据空间切分为2个子空间:把当前所选维度下小于p的点放在当前节点的左分支,把大于等于p的点放在当前节点的右分支;
步骤4、在节点的左分支和右分支节点递归步骤2、3,不断构造新的叶子节点,直到叶子节点上只有一个数据(无法再继续切割)或树已经生长到了所设定的高度。
(2)计算离群指示系数:根据离群指示系数计算公式,计算每个样本点的离群指示系数anomaly score。由于切割过程是完全随机的,因此需要利用ensemble的方法来使结果收敛,即反复从头开始进行平面切割,然后计算每次切分结果的平均值。在获得t个孤立树后,单棵树的训练就结束了。接下来就可以用生成的孤立树来评估测试数据了,即计算离群指示系数s。对于每个样本x,需要对其综合计算每棵树的结果,通过下述公式(1)计算离群指示系数:
其中,h(x)为x在每棵树的高度,c(Ψ)为给定样本数Ψ时路径长度的平均值,用来对样本x的路径长度h(x)进行标准化处理。
最终将每棵树的高度做归一化处理,并得出一个0到1的离群指示系数,进而根据离群指示系数判断是否为异常点,如果离群指示系数接近1,那么一定是异常点;如果离群指示系数远小于0.5,那么一定不是异常点;如果离群指示系数所有点的得分都在0.5左右,那么样本中很可能不存在异常点,例如包括4个测试样本,分别为a、b、c、d,其中,a的离群指示系数为0.9,b和c的离群指示系数为0.3,d的离群指示系数为0.2,那么在上述4个测试样本中,可以将a确定为最有可能异常,也最能体现孤立的测试样本。
需要说明的是,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个用电特征值来期望细致的刻画出异常办公区域和正常办公区域在用电行为模式上的差别,并通过对N个用电特征值进行迭代分类,以及根据在达到迭代收敛条件时分类产生的分类信息,智能高效率的输出每个用电特征值各自对应的离群指示系数,利于治理异常办公区域的难题,提高抽样排查的准确性。
进一步举例说明,可选地假设将上述办公区域状态的检测方法应用在检测办公区域异常的应用场景中,该方法的执行载体如图4所示,包括检测系统402,以及数据接入模块4022、数据预处理模块4024、特征提取模块4026、异常检测模块4028以及告警展示模块4040,其中,数据接入模块4022主要负责将电力系统采集到的电力输入数据接入检测系统402;由于电力数据在采集、存储和传输的过程中,可能部分数据值存在异常,因此需要数据预处理模块4024来剔除、替换预处理掉这部分异常数据;在数据接入检测系统402并预处理好之后,由特征提取模块4026提取用户使用电量的日电量行为特征以及月电量行为特征用于后续的模型模块;通过异常检测模块4028基于用户粒度的用户用电行为特征,训练异常检测检测模型,产出用户为异常用户的概率值(即离群指示系数);告警展示模块4040基于输出的用户为异常办公区域异常用户的概率值,筛选疑似办公区域异常的用户,并输出到告警展示平台上展示办公区域异常用户在地域、时间等各个维度上的分布,输出办公区域异常风险指数数字产品。
通过本申请提供的实施例,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;对N个用电特征值进行迭代分类,直至达到迭代收敛条件;根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值,利用迭代分类的方式,在用于表征办公区域中用户用电行为特征的多个用电特征值中,确定正常用电特征值以及异常用电特征值,进而达到了在保证一定检测准确性的前提下,无需样本训练,也可检测出办公区域状态的技术目的,从而实现了提高办公区域状态的检测效率的技术效果。
作为一种可选地方案,根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,包括:
在获取到达到迭代收敛条件时分类产生的第一分类信息以及第二分类信息的情况下,整合计算第一分类信息以及第二分类信息,以确定每个用电特征值各自对应的离散指示系数,其中,第一分类信息为对N个用电特征值中的第一类数据进行迭代分类过程中所产生的分类信息,第二分类信息为对N个用电特征值中的第二类数据进行迭代分类过程中所产生的分类信息。
可选地,在本实施例中,用电特征值可以但不限于包括多维度的特征值,进而在用电特征值包括多维度的情况下,对每一维度的用电特征值分别进行分类处理,以得到各自的分类信息。
需要说明的是,在获取到达到迭代收敛条件时分类产生的第一分类信息以及第二分类信息的情况下,整合计算第一分类信息以及第二分类信息,以确定每个用电特征值各自对应的离散指示系数,其中,第一分类信息为对N个用电特征值中的第一类数据进行迭代分类过程中所产生的分类信息,第二分类信息为对N个用电特征值中的第二类数据进行迭代分类过程中所产生的分类信息。此处的第一、第二仅用于表示多个或多类,并不做数量上的限定。
通过本申请提供的实施例,在获取到达到迭代收敛条件时分类产生的第一分类信息以及第二分类信息的情况下,整合计算第一分类信息以及第二分类信息,以确定每个用电特征值各自对应的离散指示系数,其中,第一分类信息为对N个用电特征值中的第一类数据进行迭代分类过程中所产生的分类信息,第二分类信息为对N个用电特征值中的第二类数据进行迭代分类过程中所产生的分类信息,达到了利用更加全面的分类信息确定离散指示系数的目的,实现了提高离散指示系数的准确性的效果。
作为一种可选地方案,整合计算第一分类信息以及第二分类信息,以确定每个用电特征值各自对应的离散指示系数,包括:
S1,在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第一平均值,其中,第一次序数据用于表示每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示每个第二类数据在迭代分类过程中的分类次序;
S2,在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第二平均值,其中,第一次序数据用于表示用于分类每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示用于分类每个第二类数据在迭代分类过程中的分类次序;
S3,整合计算第一平均值以及第二平均值,以确定每个用电特征值对应的离群指示系数。
可选地,在本实施例中,迭代分类过程可以但不限于包括带有顺序的多代分类,例如先执行第一代分类,在未达到迭代收敛条件的情况下,继续执行下一代分类(第二代分类),依次同理。
可选地,在本实施例中,分类次序可以但不限于表示用电特征值在迭代分类过程中完成分类的代次,例如在第一代分类的执行过程中,将第一用电特征值进行分类,进而在第一用电特征值完成分类的情况下,确定第一用电特征值的分类次序为第一代;同理,在第一代分类的执行过程中,将第二用电特征值进行分类,进而在第二用电特征值未完成分类的情况下,继续执行第二代分类,假设第二用电特征值在第二代分类中完成分类,则确定第二用电特征的分类次序为第二代。
可选地,在本实施例中,整合计算第一平均值以及第二平均值可以但不限于对利用第一平均值对第二平均值进行标准化处理。
需要说明的是,在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第一平均值,其中,第一次序数据用于表示每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示每个第二类数据在迭代分类过程中的分类次序;在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第二平均值,其中,第一次序数据用于表示用于分类每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示用于分类每个第二类数据在迭代分类过程中的分类次序;整合计算第一平均值以及第二平均值,以确定每个用电特征值对应的离群指示系数。
进一步举例说明,可选地对N个用电特征值进行迭代分类的场景例如图5所示,包括5个用电特征值,分别是用电特征值502、用电特征值504、用电特征值506以及用电特征值508,进而对上述5个用电特征值进行第一代分类,以获得第一代分类结果510,其中,第一代分类结果510用于表示用电特征值502被分为一类,用电特征值504、用电特征值506以及用电特征值508被分为一类,可以看出的是,单独被分为一类的用电特征值502无法再继续分类,进而可以将用电特征值502视为完成分类,从而确定用电特征值502的分类信息包括次序数据(即分类一代);而对于还可继续分类的用电特征值504、用电特征值506以及用电特征值508,则继续执行下一代分类,直至达到迭代收敛条件,确定分类代数n,并将该分类代数作为当前迭代分类过程中所有用电特征值的次序数据(即分类n次),即用电特征值502的分类信息还包括次序数据(即分类n代)。
通过本申请提供的实施例,在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第一平均值,其中,第一次序数据用于表示每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示每个第二类数据在迭代分类过程中的分类次序;在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第二平均值,其中,第一次序数据用于表示用于分类每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示用于分类每个第二类数据在迭代分类过程中的分类次序;整合计算第一平均值以及第二平均值,以确定每个用电特征值对应的离群指示系数,达到了高效整合多个分类信息,以计算获取离群指示系数的目的,实现了提高离群指示系数的计算效率的效果。
作为一种可选地方案,对N个用电特征值进行迭代分类,直至达到迭代收敛条件,包括:
S1,在获取到分类阈值的情况下,按照分类阈值分类N个用电特征值中的每个用电特征值,以获取达到分类阈值的用电特征值以及未达到分类阈值的用电特征值,并确定达到分类阈值的用电特征值的第一数量,以及未达到分类阈值的用电特征值的第二数量;
S2,在第一数量以及第二数量小于等于目标阈值的情况下,确定达到收敛条件。
可选地,在本实施例中,分类阈值可以但不限于在目标阈值范围内随机选取的特征值,其中,目标阈值范围由N个用电特征值中的下限用电特征值以及下限用电特征值构成。
需要说明的是,在获取到分类阈值的情况下,按照分类阈值分类N个用电特征值中的每个用电特征值,如将达到分类阈值的用电特征值分为一类,将未达到分类阈值的用电特征值分为一类,如果哪一类的用电特征值的数量大于目标阈值,则继续对该类的用电特征值执行分类;反之,如果哪一类的用电特征值的数量小于等于目标阈值,则确定该类的用电特征值已达到收敛条件。
进一步举例说明,可选地对N个用电特征值进行迭代分类的场景例如图5所示,包括5个用电特征值,分别是用电特征值502、用电特征值504、用电特征值506以及用电特征值508,进而对上述5个用电特征值进行第一代分类,以获得第一代分类结果510,其中,第一代分类结果510用于表示用电特征值502被分为一类,用电特征值504、用电特征值506以及用电特征值508被分为一类,可以看出的是,单独被分为一类的用电特征值502无法再继续分类,进而可以将用电特征值502视为完成分类,从而确定用电特征值502的分类信息包括次序数据(即分类一代);而对于还可继续分类的用电特征值504、用电特征值506以及用电特征值508,则继续执行下一代分类,直至所有用电特征值都无法再继续分,可视为达到迭代收敛条件。
通过本申请提供的实施例,在获取到分类阈值的情况下,按照分类阈值分类N个用电特征值中的每个用电特征值,以获取达到分类阈值的用电特征值以及未达到分类阈值的用电特征值,并确定达到分类阈值的用电特征值的第一数量,以及未达到分类阈值的用电特征值的第二数量;在第一数量以及第二数量小于等于目标阈值的情况下,确定达到收敛条件,达到了按照分类阈值快速分类用电特征值的目的,实现了提高用电特征值的分类效率的效果。
作为一种可选地方案,在获取到分类阈值的情况下,按照分类阈值分类N个用电特征值中的每个用电特征值,以获取达到分类阈值的用电特征值以及未达到分类阈值的用电特征值,并确定达到分类阈值的用电特征值的第一数量,以及未达到分类阈值的用电特征值的第二数量,包括:
S1,在获取到第一分类阈值的情况下,按照第一分类阈值分类N个用电特征值中的每个用电特征值,以获取达到第一分类阈值的M个用电特征值以及未达到第一分类阈值的O个用电特征值,其中,M、O为大于等于1的整数,且M与O之和等于N;
S2,在M不等于1、O等于1,且获取到第二分类阈值的情况下,按照第二分类阈值分类M个用电特征值中的每个用电特征值,以获取达到第二分类阈值的P个用电特征值以及未达到第二分类阈值的Q个用电特征值,其中,P、Q为大于等于1的整数,且P与Q之和等于M。
需要说明的是,在获取到第一分类阈值的情况下,按照第一分类阈值分类N个用电特征值中的每个用电特征值,以获取达到第一分类阈值的M个用电特征值以及未达到第一分类阈值的O个用电特征值,其中,M、O为大于等于1的整数,且M与O之和等于N;在M不等于1、O等于1,且获取到第二分类阈值的情况下,按照第二分类阈值分类M个用电特征值中的每个用电特征值,以获取达到第二分类阈值的P个用电特征值以及未达到第二分类阈值的Q个用电特征值,其中,P、Q为大于等于1的整数,且P与Q之和等于M。同理,在用电特征值的数量不为1的情况下,即可视为该用电特征值仍可分类,进而对其继续执行分类,直至所有用电特征值的数量都为1,即可视为该用电特征值无法继续分类,进而确定达到迭代收敛条件。
通过本申请提供的实施例,在获取到第一分类阈值的情况下,按照第一分类阈值分类N个用电特征值中的每个用电特征值,以获取达到第一分类阈值的M个用电特征值以及未达到第一分类阈值的O个用电特征值,其中,M、O为大于等于1的整数,且M与O之和等于N;在M不等于1、O等于1,且获取到第二分类阈值的情况下,按照第二分类阈值分类M个用电特征值中的每个用电特征值,以获取达到第二分类阈值的P个用电特征值以及未达到第二分类阈值的Q个用电特征值,其中,P、Q为大于等于1的整数,且P与Q之和等于M,达到了合理分类用电特征值的目的,实现了提高用电特征值的分类准确性的效果。
作为一种可选地方案,在对N组参考数据中的每组参考数据分别进行统计之前,包括:
对N组参考用电数据进行预处理,以修正处于特定状态的参考用电数据,其中,特定状态包括以下至少之一:用电数据缺失、用电数据高出预设上限、用电数据低于预设下限、用电数据缺失重复。
可选地,在本实施例中,用电数据在采集、存储、传输的过程中,可能部分用电数据存在异常:比如用电数据缺失、用电数据变成负值、用电数据远大于正常用用电数据(比如日电量上万度)等;也有可能部分存储格式因为出错发生改变(例如一个电量存储了两个用电数据);进而针对这些异常用电数据可以但不限于采取如下处理措施:
1、对于缺失的用电数据和变成负值的用电数据统一替换成0;
2、对于用电数据超大的电量,首先计算用户总体用电数据的均值,如果用户某个时间的用电数据超过用电量的100倍以上,也将该异常用电数据替换为0;
3、对于因存储格式发生改变导致一个时间点存储了两个用电数据,则随机选择一个用电数据作为当前时间点的用电数据。
需要说明的是,对N组参考用电数据进行预处理,以修正处于特定状态的参考用电数据,其中,特定状态包括以下至少之一:用电数据缺失、用电数据高出预设上限、用电数据低于预设下限、用电数据缺失重复。
通过本申请提供的实施例,对N组参考用电数据进行预处理,以修正处于特定状态的参考用电数据,其中,特定状态包括以下至少之一:用电数据缺失、用电数据高出预设上限、用电数据低于预设下限、用电数据缺失重复,达到了降低因异常用电数据而导致根据用电数据得出的计算结果不准确的目的,实现了提高根据用电数据得出的计算结果准确性的效果。
作为一种可选地方案,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,包括以下至少之一:
S1,对N组参考数据中的每组参考数据分别进行第一类统计,以获取N个待检测办公区域分别对应的N个第一用电特征值,其中,第一用电特征值用于表示待检测办公区域中用户的用电消耗特征;
S2,对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个第二用电特征值,其中,第二用电特征值用于表示待检测办公区域中用户的用电频率特征;
S3,对N组参考数据中的每组参考数据分别进行第三类统计,以获取N个待检测办公区域分别对应的N个第三用电特征值,其中,第三用电特征值用于表示待检测办公区域中用户的用电频次特征;
S4,对N组参考数据中的每组参考数据分别进行第四类统计,以获取N个待检测办公区域分别对应的N个第四用电特征值,其中,第四用电特征值用于表示待检测办公区域中用户的用电周期特征。
可选地,在本实施例中,基于不同的构造思路可以对用电数据执行不同的计算方式,以获取用于表示待检测办公区域中用户的不同用电行为特征。此外,为提高用电特征值的准确性,还可以采用结合多种类型的用电特征值的方式,以获取组合用电特征值。
可选地,在本实施例中,考虑到办公区域异常会进行房屋改造,居住人数会增加,使用电器也会增加、用电量高,进而对N组参考数据中的每组参考数据分别进行第一类统计,以获取N个待检测办公区域分别对应的N个用于表示待检测办公区域中用户的用电消耗特征,例如用户平/谷用电量在对应小区的排序特征、用电平/谷值的统计特征、一整年用户用电平/谷/总点亮的统计特征、用户每个月用电平值小于A(例如50)且谷值小于B(例如10)的个数等。
再者,还考虑到办公区域异常的人员流动性会较强,房屋使用会存在空档期,因此用户用电量的波动会相对较大,进而对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个用于表示待检测办公区域中用户的用电频率特征,例如相邻年份对应月份平/谷/总电量变化特征相邻月份波动特征(例如1月和2月份用电量的差值等)等;
此外,还考虑到办公区域异常用户是上班族的概率会更大,上班族夜间用电更少,因此平值和谷值的用电差距会更大,进而对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个用于表示待检测办公区域中用户的用电频率特征,例如平谷电量差值和比值的统计值等;
进一步,还考虑到办公区域异常可能会存在空档期,但用电存在一定周期性和规律性,进而对N组参考数据中的每组参考数据分别进行第四类统计,以获取N个待检测办公区域分别对应的N个用于表示待检测办公区域中用户的用电周期特征,例如月份中电量为0的比例、电量高群的比例(超过均值与方差的关系)、提取相邻月份电量值的相似度特征、提取用户不同时间粒度的电量综合的统计特征等。
需要说明的是,对N组参考数据中的每组参考数据分别进行第一类统计,以获取N个待检测办公区域分别对应的N个第一用电特征值,其中,第一用电特征值用于表示待检测办公区域中用户的用电消耗特征;对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个第二用电特征值,其中,第二用电特征值用于表示待检测办公区域中用户的用电频率特征;对N组参考数据中的每组参考数据分别进行第三类统计,以获取N个待检测办公区域分别对应的N个第三用电特征值,其中,第三用电特征值用于表示待检测办公区域中用户的用电频次特征;对N组参考数据中的每组参考数据分别进行第四类统计,以获取N个待检测办公区域分别对应的N个第四用电特征值,其中,第四用电特征值用于表示待检测办公区域中用户的用电周期特征。
进一步举例说明,可选的例如结合日粒度用电数据以及月粒度用电数据,以完成办公区域状态的检测场景如图6所示,具体步骤如下:
S602,获取日粒度用电数据以及月粒度用电数据;
S604,对获取到的日粒度用电数据以及月粒度用电数据进行数据清洗,以清洗获取到的日粒度用电数据以及月粒度用电数据中的异常数据;
S606,对清洗后的日粒度用电数据以及月粒度用电数据进行数据统计以及特征提取,以获取到对应的用电特征值;
S608,将用电特征值输入检测模型中;
S610,获取检测模型输出的离群指示系数,并根据离群指示系数确定待检测办公区域是否处于特定状态。
通过本申请提供的实施例,对N组参考数据中的每组参考数据分别进行第一类统计,以获取N个待检测办公区域分别对应的N个第一用电特征值,其中,第一用电特征值用于表示待检测办公区域中用户的用电消耗特征;对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个第二用电特征值,其中,第二用电特征值用于表示待检测办公区域中用户的用电频率特征;对N组参考数据中的每组参考数据分别进行第三类统计,以获取N个待检测办公区域分别对应的N个第三用电特征值,其中,第三用电特征值用于表示待检测办公区域中用户的用电频次特征;对N组参考数据中的每组参考数据分别进行第四类统计,以获取N个待检测办公区域分别对应的N个第四用电特征值,其中,第四用电特征值用于表示待检测办公区域中用户的用电周期特征,达到了全面获取用电特征值的目的,实现了提高用电特征值的获取全面性的效果。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的另一个方面,还提供了一种用于实施上述办公区域状态的检测方法的办公区域状态的检测装置。如图7所示,该装置包括:
统计单元702,用于在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
分类单元704,用于对N个用电特征值进行迭代分类,直至达到迭代收敛条件;
第一确定单元706,用于根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;
第二确定单元708,用于在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值。
可选地,在本实施例中,办公区域状态的检测装置可以但不限于应用在检测居住由办公区域异常用户的异常办公区域的应用场景,具体的,考虑到办公区域异常用户所在的异常办公区域,由于用户因为增加房间及卫生间、非每户都具备厨房、部分房间无窗通风等,造成多个商户同时累加使用电器的现象,因此办公区域异常用户所在的异常办公区域最明显的特征就是办公区域产生的用电数据会明显异常于同面积的其他用户,并且由于办公区域异常用户的异常办公区域在大环境下还是处于少数部分,或者说普通用户的正常办公区域的数量远远高于办公区域异常用户的异常办公区域的数量,进而异常用电数据在整体数据中自然也属于少数部分。那么在确定出属于少数部分的异常用电数据的情况下,就可以确定出对应的异常办公区域。基于此,上述办公区域状态的检测装置利用迭代分类的方式,将少数部分的异常用电数据以较高离群指示系数的用电特征值表征出来,进而在没有训练样本的情况下,也实现了准确确定出少数部分的异常用电数据对应的异常办公区域的效果。
可选地,在本实施例中,待检测办公区域可以但不限于为预设范围内全部或抽查的办公区域,例如将目标小区的全部或抽查的办公区域作为待检测办公区域;也可以但不限于为预设范围内面积相似度达到面积阈值的办公区域,例如考虑到处于特定状态的目标办公区域多为方便于分割为多个房间的大面积办公区域,进而将目标小区中面积在80㎡以上的办公区域作为待检测办公区域;也可以但不限于为面积相似度在面积范围内的办公区域,例如将目标小区中面积在40-50㎡的办公区域作为待检测办公区域;还可以但不限于为指定抽查的办公区域,例如接到热心群众的举报,进而对被举报的办公区域进行针对性的检测。
可选地,在本实施例中,参考用电数据可以但不限于为不同粒度的数据,例如参考用电数据为日粒度用电数据,即表示将每天的用电数据作为参考用电数据;再例如参考用电数据为月粒度用电数据,即表示将每月的用电数据作为参考用电数据。此外,参考用电数据也可以但不限与为不同粒度的数据集合,在此不做限定。
可选地,在本实施例中,参考用电数据可以但不限于为不同类型的用电数据,以日粒度用电数据为例说明,包括以下至少之一:每天的用电日总电量、日平电总电量、日峰电总电量、谷电总电量、日尖电量总电量;再以月粒度用电数据为例说明,包括以下至少之一:按月统计的月总电量、月平电总电量、月谷电总电量,
可选地,在本实施例中,用电特征值可以但不限用于表示相比于正常办公区域的用户的用电行为,更能体现异常办公区域的用户的异常用电行为的用电特征,或者说用电特征值可以但不限用于体现异常办公区域的用户和正常办公区域的用户之间的用电行为模式的差别,例如异常办公区域的用户因为增加房间及卫生间、部分房间无窗通风等,造成“麻雀虽小五脏俱全”的多个商户同时累加使用电器的现象,因此异常办公区域的用户最明显的特征就是用户的用电总量会明显高于同面积的其他用户;再例如,正常用户在用电行为上存在一定稳定性和周期性,因此在一段时间窗之类,异常办公区域的用户和正常办公区域的用户在用电统计特征,用电曲线的变化周期性上存在较大差别;再例如异常办公区域的用户和正常用户由于人员流动性上存在较大差别,因此用电模式上也存在较大的差别。
可选地,在本实施例中,用电特征值可以但不限于为多个维度的数值,迭代分类可以但不限于包括对同一维度的数值大小进行分类,例如用电特征值包括同一维度的数值1、2、3、4,则迭代分类可以但不限于按照大小对该数值进行一次或多次分类,直至达到迭代收敛条件。可选的,分类方式可以但不限于为二分类、多分类等,再次不做限定。
可选地,在本实施例中,分类信息可以但不限用于表示用电特征值在迭代分类过程中的分类情况,例如分类次序、分类次序、分类类型、分类规律、分类频率等。
可选地,在本实施例中,迭代收敛条件可以但不限于为每个用电特征值都完成分类,和/或每个分类结果都确定好各自的离群指示系数,和/或迭代分类的分类次序达到次序阈值,和/或迭代分类的分类数目达到数目阈值等。
可选地,在本实施例中,由于处于特定状态的办公区域在仅为整体办公区域较少一部分,且处于特定状态的办公区域产生的参考用电数据和正常办公区域产生的参考用电数据差别较大,进而可以但不限于采用无需标签样本且训练高效的孤立森林算法(iForest,Isolation Forest)来计算离群指示系数的方式,确定出处于特定状态的目标办公区域。
可选地,在本实施例中,孤立森林算法是一个基于Ensemble的快速异常检测装置,具有线性时间复杂度和高精准度,是符合大数据处理要求的state-of-the-art算法,且孤立森林算法还适用于连续数据的异常检测,将异常定义为“容易被孤立的离群点”,可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释,在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因而可以认为落在这些区域里的数据是异常的,进而孤立森林算法不再是描述正常的样本点,而是要孤立异常点,该异常点需满足两个特点,即异常数据只占据很少量、异常数据特征值和正常数据差别很大;
需要说明的是,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个用电特征值来期望细致的刻画出异常办公区域和正常办公区域在用电行为模式上的差别,并通过对N个用电特征值进行迭代分类,以及根据在达到迭代收敛条件时分类产生的分类信息,智能高效率的输出每个用电特征值各自对应的离群指示系数,利于治理异常办公区域的难题,提高抽样排查的准确性办公区域。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
通过本申请提供的实施例,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;对N个用电特征值进行迭代分类,直至达到迭代收敛条件;根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值,利用迭代分类的方式,在用于表征办公区域中用户用电行为特征的多个用电特征值中,确定正常用电特征值以及异常用电特征值,进而达到了在保证一定检测准确性的前提下,无需样本训练,也可检测出办公区域状态的技术目的,从而实现了提高办公区域状态的检测效率的技术效果。
作为一种可选地方案,例如图8所示,第一确定单元706,包括:
计算模块802,用于在获取到达到迭代收敛条件时分类产生的第一分类信息以及第二分类信息的情况下,整合计算第一分类信息以及第二分类信息,以确定每个用电特征值各自对应的离散指示系数,其中,第一分类信息为对N个用电特征值中的第一类数据进行迭代分类过程中所产生的分类信息,第二分类信息为对N个用电特征值中的第二类数据进行迭代分类过程中所产生的分类信息。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
作为一种可选地方案,计算模块802,包括:
第一计算子模块,用于在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第一平均值,其中,第一次序数据用于表示每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示每个第二类数据在迭代分类过程中的分类次序;
第二计算子模块,用于在获取到第一分类信息中的第一次序数据,以及第二分类信息中的第二次序数据的情况下,计算第一次序数据和第二次序数据的第二平均值,其中,第一次序数据用于表示用于分类每个第一类数据在迭代分类过程中的分类次序,第二次序数据用于表示用于分类每个第二类数据在迭代分类过程中的分类次序;
确定子模块,用于整合计算第一平均值以及第二平均值,以确定每个用电特征值对应的离群指示系数。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
作为一种可选地方案,例如图9所示,分类单元704,包括:
第一确定模块902,用于在获取到分类阈值的情况下,按照分类阈值分类N个用电特征值中的每个用电特征值,以获取达到分类阈值的用电特征值以及未达到分类阈值的用电特征值,并确定达到分类阈值的用电特征值的第一数量,以及未达到分类阈值的用电特征值的第二数量;
第二确定模块904,用于在第一数量以及第二数量小于等于目标阈值的情况下,确定达到收敛条件。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
作为一种可选地方案,第一确定模块,包括:
第一分类子模块,用于在获取到第一分类阈值的情况下,按照第一分类阈值分类N个用电特征值中的每个用电特征值,以获取达到第一分类阈值的M个用电特征值以及未达到第一分类阈值的O个用电特征值,其中,M、O为大于等于1的整数,且M与O之和等于N;
第二分类子模块,用于在M不等于1、O等于1,且获取到第二分类阈值的情况下,按照第二分类阈值分类M个用电特征值中的每个用电特征值,以获取达到第二分类阈值的P个用电特征值以及未达到第二分类阈值的Q个用电特征值,其中,P、Q为大于等于1的整数,且P与Q之和等于M。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
作为一种可选地方案,包括:
处理单元,用于在对N组参考数据中的每组参考数据分别进行统计之前,对N组参考用电数据进行预处理,以修正处于特定状态的参考用电数据,其中,特定状态包括以下至少之一:用电数据缺失、用电数据高出预设上限、用电数据低于预设下限、用电数据缺失重复。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
作为一种可选地方案,统计单元,包括以下至少之一:
第一统计模块,用于对N组参考数据中的每组参考数据分别进行第一类统计,以获取N个待检测办公区域分别对应的N个第一用电特征值,其中,第一用电特征值用于表示待检测办公区域中用户的用电消耗特征;
第二统计模块,用于对N组参考数据中的每组参考数据分别进行第二类统计,以获取N个待检测办公区域分别对应的N个第二用电特征值,其中,第二用电特征值用于表示待检测办公区域中用户的用电频率特征;
第三统计模块,用于对N组参考数据中的每组参考数据分别进行第三类统计,以获取N个待检测办公区域分别对应的N个第三用电特征值,其中,第三用电特征值用于表示待检测办公区域中用户的用电频次特征;
第四统计模块,用于对N组参考数据中的每组参考数据分别进行第四类统计,以获取N个待检测办公区域分别对应的N个第四用电特征值,其中,第四用电特征值用于表示待检测办公区域中用户的用电周期特征。
具体实施例可以参考上述办公区域状态的检测方法中所示示例,本示例中在此不再赘述。
根据本发明实施例的又一个方面,还提供了一种用于实施上述办公区域状态的检测方法的电子设备,如图10所示,该电子设备包括存储器1002和处理器1004,该存储器1002中存储有计算机程序,该处理器1004被设置为通过计算机程序执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
S2,对N个用电特征值进行迭代分类,直至达到迭代收敛条件;
S3,根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;
S4,在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值。
可选地,本领域普通技术人员可以理解,图10所示的结构仅为示意,电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图10其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图10中所示更多或者更少的组件(如网络接口等),或者具有与图10所示不同的配置。
其中,存储器1002可用于存储软件程序以及模块,如本发明实施例中的办公区域状态的检测方法和装置对应的程序指令/模块,处理器1004通过运行存储在存储器1002内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的办公区域状态的检测方法。存储器1002可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1002可进一步包括相对于处理器1004远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中,存储器1002具体可以但不限于用于存储参考用电数据、用电特征值以及离群指示系数等信息。作为一种示例,如图10所示,上述存储器1002中可以但不限于包括上述办公区域状态的检测装置中的统计单元702、分类单元704、第一确定单元706及第二确定单元708。此外,还可以包括但不限于上述办公区域状态的检测装置中的其他模块单元,本示例中不再赘述。
可选地,上述的传输装置1006用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1006包括一个网络适配器(Network Interface Controller,NIC),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1006为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
此外,上述电子设备还包括:显示器1008,用于显示上述参考用电数据、用电特征值以及离群指示系数等信息;和连接总线1010,用于连接上述电子设备中的各个模块部件。
在其他实施例中,上述终端设备或者服务器可以是一个分布式系统中的一个节点,其中,该分布式系统可以为区块链系统,该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中,节点之间可以组成点对点(Peer To Peer,简称P2P)网络,任意形式的计算设备,比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述办公区域状态的检测方法,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对N组参考数据中的每组参考数据分别进行统计,以获取N个待检测办公区域分别对应的N个用电特征值,其中,用电特征值用于表示待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
S2,对N个用电特征值进行迭代分类,直至达到迭代收敛条件;
S3,根据在达到迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,离群指示系数用于表示每个用电特征值远离N个用电特征值中正常用电特征值的程度,在N个用电特征值中正常用电特征值的数量大于异常用电特征值的数量;
S4,在N个统计数据用电特征值中确定出异常用电特征值的情况下,确定异常用电特征值对应的目标办公区域处于特定状态,其中,异常用电特征值为离群指示系数达到异常阈值的用电特征值。
可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random Access Memory,RAM)、磁盘或光盘等。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种办公区域状态的检测方法,其特征在于,包括:
在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对所述N组参考数据中的每组参考数据分别进行统计,以获取所述N个待检测办公区域分别对应的N个用电特征值,其中,所述用电特征值用于表示所述待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
对所述N个用电特征值进行迭代分类,直至达到迭代收敛条件;
根据在达到所述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,所述离群指示系数用于表示每个用电特征值远离所述N个用电特征值中正常用电特征值的程度,在所述N个用电特征值中所述正常用电特征值的数量大于异常用电特征值的数量;
在所述N个统计数据用电特征值中确定出异常用电特征值的情况下,确定所述异常用电特征值对应的目标办公区域处于特定状态,其中,所述异常用电特征值为所述离群指示系数达到异常阈值的用电特征值。
2.根据权利要求1所述的方法,其特征在于,所述根据在达到所述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,包括:
在获取到达到所述迭代收敛条件时分类产生的第一分类信息以及第二分类信息的情况下,整合计算所述第一分类信息以及所述第二分类信息,以确定所述每个用电特征值各自对应的离散指示系数,其中,所述第一分类信息为对所述N个用电特征值中的第一类数据进行迭代分类过程中所产生的分类信息,所述第二分类信息为对所述N个用电特征值中的第二类数据进行迭代分类过程中所产生的分类信息。
3.根据权利要求2所述的方法,其特征在于,所述整合计算所述第一分类信息以及所述第二分类信息,以确定所述每个用电特征值各自对应的离散指示系数,包括:
在获取到所述第一分类信息中的第一次序数据,以及所述第二分类信息中的第二次序数据的情况下,计算所述第一次序数据和所述第二次序数据的第一平均值,其中,所述第一次序数据用于表示每个所述第一类数据在迭代分类过程中的分类次序,所述第二次序数据用于表示每个所述第二类数据在迭代分类过程中的分类次序;
在获取到所述第一分类信息中的第一次序数据,以及所述第二分类信息中的第二次序数据的情况下,计算所述第一次序数据和所述第二次序数据的第二平均值,其中,所述第一次序数据用于表示用于分类每个所述第一类数据在迭代分类过程中的分类次序,所述第二次序数据用于表示用于分类每个所述第二类数据在迭代分类过程中的分类次序;
整合计算所述第一平均值以及所述第二平均值,以确定所述每个用电特征值对应的离群指示系数。
4.根据权利要求1所述的方法,其特征在于,所述对所述N个用电特征值进行迭代分类,直至达到迭代收敛条件,包括:
在获取到分类阈值的情况下,按照所述分类阈值分类所述N个用电特征值中的每个用电特征值,以获取达到所述分类阈值的用电特征值以及未达到所述分类阈值的用电特征值,并确定达到所述分类阈值的用电特征值的第一数量,以及未达到所述分类阈值的用电特征值的第二数量;
在所述第一数量以及所述第二数量小于等于目标阈值的情况下,确定达到所述收敛条件。
5.根据权利要求4所述的方法,其特征在于,所述在获取到分类阈值的情况下,按照所述分类阈值分类所述N个用电特征值中的每个用电特征值,以获取达到所述分类阈值的用电特征值以及未达到所述分类阈值的用电特征值,并确定达到所述分类阈值的用电特征值的第一数量,以及未达到所述分类阈值的用电特征值的第二数量,包括:
在获取到第一分类阈值的情况下,按照所述第一分类阈值分类所述N个用电特征值中的每个用电特征值,以获取达到所述第一分类阈值的M个用电特征值以及未达到所述第一分类阈值的O个用电特征值,其中,M、O为大于等于1的整数,且M与O之和等于N;
在M不等于1、O等于1,且获取到第二分类阈值的情况下,按照所述第二分类阈值分类所述M个用电特征值中的每个用电特征值,以获取达到所述第二分类阈值的P个用电特征值以及未达到所述第二分类阈值的Q个用电特征值,其中,P、Q为大于等于1的整数,且P与Q之和等于M。
6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述对所述N组参考数据中的每组参考数据分别进行统计之前,包括:
对所述N组参考用电数据进行预处理,以修正处于特定状态的所述参考用电数据,其中,所述特定状态包括以下至少之一:用电数据缺失、用电数据高出预设上限、用电数据低于预设下限、用电数据缺失重复。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述对所述N组参考数据中的每组参考数据分别进行统计,以获取所述N个待检测办公区域分别对应的N个用电特征值,包括以下至少之一:
对所述N组参考数据中的每组参考数据分别进行第一类统计,以获取所述N个待检测办公区域分别对应的N个第一用电特征值,其中,所述第一用电特征值用于表示所述待检测办公区域中用户的用电消耗特征;
对所述N组参考数据中的每组参考数据分别进行第二类统计,以获取所述N个待检测办公区域分别对应的N个第二用电特征值,其中,所述第二用电特征值用于表示所述待检测办公区域中用户的用电频率特征;
对所述N组参考数据中的每组参考数据分别进行第三类统计,以获取所述N个待检测办公区域分别对应的N个第三用电特征值,其中,所述第三用电特征值用于表示所述待检测办公区域中用户的用电频次特征;
对所述N组参考数据中的每组参考数据分别进行第四类统计,以获取所述N个待检测办公区域分别对应的N个第四用电特征值,其中,所述第四用电特征值用于表示所述待检测办公区域中用户的用电周期特征。
8.一种办公区域状态的检测装置,其特征在于,包括:
统计单元,用于在获取到N个待检测办公区域在一段时间内分别产生的N组参考用电数据的情况下,对所述N组参考数据中的每组参考数据分别进行统计,以获取所述N个待检测办公区域分别对应的N个用电特征值,其中,所述用电特征值用于表示所述待检测办公区域中用户的用电行为特征,N为大于等于3的整数;
分类单元,用于对所述N个用电特征值进行迭代分类,直至达到迭代收敛条件;
第一确定单元,用于根据在达到所述迭代收敛条件时分类产生的分类信息,确定每个用电特征值各自对应的离群指示系数,其中,所述离群指示系数用于表示每个用电特征值远离所述N个用电特征值中正常用电特征值的程度,在所述N个用电特征值中所述正常用电特征值的数量大于异常用电特征值的数量;
第二确定单元,用于在所述N个统计数据用电特征值中确定出异常用电特征值的情况下,确定所述异常用电特征值对应的目标办公区域处于特定状态,其中,所述异常用电特征值为所述离群指示系数达到异常阈值的用电特征值。
9.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7任一项中所述的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至7任一项中所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110247322 | 2021-03-05 | ||
CN2021102473226 | 2021-03-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115034839A true CN115034839A (zh) | 2022-09-09 |
Family
ID=83118377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111663263.7A Pending CN115034839A (zh) | 2021-03-05 | 2021-12-30 | 办公区域状态的检测方法、装置和存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115034839A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117411811A (zh) * | 2023-12-15 | 2024-01-16 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
-
2021
- 2021-12-30 CN CN202111663263.7A patent/CN115034839A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117411811A (zh) * | 2023-12-15 | 2024-01-16 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
CN117411811B (zh) * | 2023-12-15 | 2024-02-23 | 山西思极科技有限公司 | 一种电力通信设备的故障智能监测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | A comparative analysis of evolutionary and memetic algorithms for community detection from signed social networks | |
CN104408667B (zh) | 一种电能质量综合评估的方法和系统 | |
CN108733631A (zh) | 一种数据评估方法、装置、终端设备及存储介质 | |
CN102324038B (zh) | 一种基于数字图像的植物种类识别方法 | |
CN110377804A (zh) | 培训课程数据的推送方法、装置、系统及存储介质 | |
CN111260249A (zh) | 一种基于lstm和随机森林混合模型的电力通信业务可靠性评估预测方法及装置 | |
CN109636482B (zh) | 基于相似度模型的数据处理方法及系统 | |
CN112906790B (zh) | 一种基于用电数据的独居老人识别方法和系统 | |
CN104156403A (zh) | 一种基于聚类的大数据常态模式提取方法及系统 | |
Silva et al. | Novel features for time series analysis: a complex networks approach | |
CN107046557A (zh) | 移动云计算环境下动态Skyline查询的智能医疗呼叫查询系统 | |
CN111598337A (zh) | 一种分布式光伏短期出力预测的方法 | |
Erhan et al. | Analyzing objective and subjective data in social sciences: Implications for smart cities | |
Triantakonstantis et al. | A spatially heterogeneous expert based (SHEB) urban growth model using model regionalization | |
CN105426392A (zh) | 一种协同过滤推荐方法及系统 | |
CN115034839A (zh) | 办公区域状态的检测方法、装置和存储介质及电子设备 | |
Vega-Oliveros et al. | From spatio-temporal data to chronological networks: An application to wildfire analysis | |
CN115456093A (zh) | 一种基于注意力图神经网络的高性能图聚类方法 | |
CN113127464B (zh) | 农业大数据环境特征处理方法、装置及电子设备 | |
Wang et al. | Uncovering fuzzy communities in networks with structural similarity | |
CN106651630B (zh) | 关键用电行业识别方法和系统 | |
CN104281599A (zh) | 用于向社交网络中的用户推荐信息的方法和装置 | |
Xu | Analysis and comparison of forecasting algorithms for telecom customer churn | |
CN103365900A (zh) | 线上素材投放方法及装置 | |
CN113516200B (zh) | 模型训练方案生成的方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |