CN107870810A - 应用清理方法、装置、存储介质及电子设备 - Google Patents
应用清理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN107870810A CN107870810A CN201711046992.1A CN201711046992A CN107870810A CN 107870810 A CN107870810 A CN 107870810A CN 201711046992 A CN201711046992 A CN 201711046992A CN 107870810 A CN107870810 A CN 107870810A
- Authority
- CN
- China
- Prior art keywords
- application
- sample
- cleaning
- applications
- clear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004140 cleaning Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000003066 decision tree Methods 0.000 claims abstract description 82
- 238000012549 training Methods 0.000 claims abstract description 78
- 230000006870 function Effects 0.000 claims description 99
- 238000006243 chemical reaction Methods 0.000 claims description 28
- 230000015654 memory Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 8
- 230000009467 reduction Effects 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 41
- 241000196324 Embryophyta Species 0.000 description 15
- 230000008569 process Effects 0.000 description 8
- 238000011156 evaluation Methods 0.000 description 6
- 230000005611 electricity Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44594—Unloading
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/329—Power saving characterised by the action undertaken by task scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/48—Indexing scheme relating to G06F9/48
- G06F2209/482—Application
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Stored Programmes (AREA)
Abstract
本申请实施例公开了一种应用清理方法、装置、存储介质及电子设备,其中,本申请实施例获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。
Description
技术领域
本申请涉及通信技术领域,具体涉及一种应用清理方法、装置、存储介质及电子设备。
背景技术
目前,智能手机等电子设备上,通常会有多个应用同时运行,其中,一个应用在前台运行,其他应用在后台运行。如果长时间不清理后台运行的应用,则会导致电子设备的可用内存变小、中央处理器(central processing unit,CPU)占用率过高,导致电子设备出现运行速度变慢,卡顿,耗电过快等问题。因此,有必要提供一种方法解决上述问题。
发明内容
本申请实施例提供了一种应用清理方法、装置、存储介质及电子设备,能够提高电子设备的运行流畅度,降低功耗。
第一方面,本申请实施例了提供了的一种应用清理方法,包括:
获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
根据每个应用可清理的信息增益对所述待清理应用集合中相应的应用进行清理。
第二方面,本申请实施例了提供了的一种应用清理装置,包括:
特征获取单元,用于获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
训练单元,用于根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
增益获取单元,用于获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
清理单元,用于根据所述预测样本和所述分类回归树模型预测所述应用是否可清理。
第三方面,本申请实施例提供的存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行如本申请任一实施例提供的应用清理方法。
第四方面,本申请实施例提供的电子设备,包括处理器和存储器,所述存储器有计算机程序,所述处理器通过调用所述计算机程序,用于执行如本申请任一实施例提供的应用清理方法。
本申请实施例获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的应用清理方法的应用场景示意图。
图2是本申请实施例提供的应用清理方法的一个流程示意图。
图3是本申请实施例提供的应用清理方法的另一个流程示意图。
图4是本申请实施例提供的应用清理装置的一个结构示意图
图5是本申请实施例提供的应用清理装置的另一个结构示意图。
图6是本申请实施例提供的应用清理装置的另一个结构示意图。
图7是本申请实施例提供的电子设备的一个结构示意图。
图8是本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本文所使用的术语“模块”可看做为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看做为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例提供一种应用清理方法,该应用清理方法的执行主体可以是本申请实施例提供的应用清理装置,或者集成了该应用清理装置的电子设备,其中该应用清理装置可以采用硬件或者软件的方式实现。其中,电子设备可以是智能手机、平板电脑、掌上电脑、笔记本电脑、或者台式电脑等设备。
请参阅图1,图1为本申请实施例提供的应用清理方法的应用场景示意图,以应用清理装置集成在电子设备中为例,电子设备可以获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。
具体地,例如图1所示,以清理后台运行的后台应用程序为应用程序a、b、c(后台应用程序可以为邮箱应用、游戏应用等)为例,可以获取应用如应用a的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到应用如应用a的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;重复前述步骤可以得到其他应用如应用b、应用c的样本类别的最终估值模型函数。
然后,获取每个应用的多维特征作为每个应用的预测样本如获取应用a、b、c的当前多维特征分别作为应用a、b、c的预测样本。根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益,如根据应用a的预测样本以及应用a的样本类别的最终估值模型函数获取应用a可清理的信息增益,同理可以获取应用b、c可清理的信息增益。
最后,根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。如根据应用a、b、c可清理的信息增益对应用a、b、c中相应的应用进行清理。
请参阅图2,图2为本申请实施例提供的应用清理方法的流程示意图。本申请实施例提供的应用清理方法的具体流程可以如下:
201、获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本。
具体地,可以从特征数据库中获取应用的多维特征,其中,多维特征可以为历史时间采集到的多维特征,也即历史多维特征。特征数据库中存储有应用在历史时间的多种特征。
比如,待清理应用集合包括应用1、应用2……应用n,此时可以从特征数据库中获取应用1的多维特征,将该多维特征作为应用1的训练样本。
本实施例所提及的应用,可以是电子设备上安装的任何一个应用,例如办公应用、通信应用、游戏应用、购物应用等。该应用可以包括前台应用和/或后台应用。
其中,应用的多维特征具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征息由多个特征构成。该多个特征可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用处于后台的时间、应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用)等。
该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。
其中,应用的训练样本包括应用的多维特征。该多维特征可以是在历史时间段内,按照预设频率采集的多个特征。历史时间段,例如可以是过去7天、10天;预设频率,例如可以是每10分钟采集一次、每半小时采集一次。可以理解的是,一次采集的应用的多维特征数据构成一个样本。
在一实施例中,为便于应用清理,可以将应用的多维特征信息中,未用数值直接表示的特征信息用具体的数值量化出来,例如针对电子设备的无线网连接状态这个特征信息,可以用数值1表示正常的状态,用数值0表示异常的状态(反之亦可);再例如,针对电子设备是否在充电状态这个特征信息,可以用数值1表示充电状态,用数值0表示未充电状态(反之亦可)。
202、根据应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数。
其中,样本类别包括可清理、或不可清理。
比如,可以根据应用1的训练样本对梯度提升决策树模型进行训练,得到应用1的样本类别的最终估值模型函数,根据应用2的训练样本对梯度提升决策树模型进行训练,得到应用2的样本类别的最终估值模型函数……根据应用n的训练样本对梯度提升决策树模型进行训练,得到应用n的样本类别的最终估值模型函数。
其中,梯度提升决策树模型(Gradient Boosting Decision Tree,GBDT)是一种迭代的决策树算法,该算法由多棵决策树组成。该梯度提升决策树模型是机器学习算法的一种。本申请应用梯度提升决策树模型来实现对应用程序的清理预测。具体地,采用训练样本对梯度提升决策树模型进行训练,得到应用的样本类别的最终估值模型函数,基于最终估值模型函数来实现对应用清理的预测。
下面介绍对梯度提升决策树模型训练的过程,在一实施例中,根据应用的训练样本对梯度提升决策树模型进行训练的过程可以如下:
根据估值模型函数获取训练样本属于样本类别的初始概率;
对初始概率进行逻辑变换,得到变换后概率;
根据变换后概率和初始概率获取样本类别的梯度残差;
根据梯度残差构建相应的决策树;
根据决策树中叶子节点的信息增益,对估计值模型函数进行更新,并返回执行根据估值模型函数获取训练样本分别属于样本类别的初始概率的步骤,直到决策树数量等于预设数量为止。
其中,预设数量即是迭代的次数,可以根据时间需求设定,如可以为M,M为大于1的正整数。
本申请实施例可以通过重复或者迭代执行上述步骤,便可以得到每个应用的最终估值模型函数以及M个决策树。
其中,初始阶段的估值模型函数可以为零,比如可以初始化估值模型函数为Fk0(x)=0。
本申请实施例中,逻辑(logistic)变换是一个平滑且将数据规范化(使得向量的长度为1)的过程,可以便于模型训练。比如,可以通过如下公式进行逻辑变换:
其中,k为样本类别,Fk(x)为样本类别k的估值模型函数,pk(x)为样本x属于样本类别k的概率。
其中,残差其实就是真实值和预测值之间的差值,在学习的过程中,首先学习一颗决策树,然后将“真实值-预测值”得到残差,再把残差作为一个学习目标,学习下一棵决策树,依次类推,直到残差小于某个接近0的阀值或决策树数目达到某一阀值。其核心思想是每轮通过拟合残差来降低损失函数。
本申请实施例中,梯度残差可以基于变换后概率和变换前概率获得,如可以通过如下公式求得:
为梯度残差,yik为变换前的概率,pk(x)为变换后样本x属于样本类别k的概率;也即通过变换前概率减去变换后概率可以得到梯度残差。
例如,训练样本x可能属于可清理、不可清理两种类别,训练样本x属于可清理的概率为y=(0,0,1,0,0),假设估值模型函数估计得到的F(x)=(0,0.3,0.6,0,0),则经过Logistic变换后的概率p(x)=(0.16,0.21,0.29,0.16,0.16),y-p得到梯度g:(-0.16,-0.21,0.71,-0.16,-0.16)。
假设gk为样本当某一维(某一个分类)上的梯度:
gk>0时,越大表示其在这一维上的概率p(x)越应该提高,比如说上面的第三维的概率为0.29,就应该提高,属于应该往“正确的方向”前进越小表示这个估计越“准确”。
gk<0时,越小,负得越多表示在这一维上的概率应该降低,比如说第二维0.21就应该得到降低。属于应该朝着“错误的反方向”前进越大,负得越少表示这个估计越“不错误”。
总的来说,对于一个样本,最理想的梯度是越接近0的梯度。所以,我们要能够让函数的估计值能够使得梯度往反方向移动(>0的维度上,往负方向移动,<0的维度上,往正方向移动)最终使得梯度尽量=0),并且该算法在会严重关注那些梯度比较大的样本。
本申请实施例中,在得到梯度之后,就是如何让梯度减少了。这里是用的一个迭代+决策树的方法,当初始化的时候,随便给出一个估计函数F(x)(可以让F(x)是一个随机的值,也可以让F(x)=0),然后之后每迭代一步就根据当前每一个样本的梯度的情况,建立一棵决策树。就让函数往梯度的反方向前进,最终使得迭代N步后,梯度越小。
本申请实施例中建立的决策树和普通的决策树不太一样,首先,这个决策树是一个叶子节点数J固定的,当生成了J个节点后,就不再生成新的节点了。
因此,本申请实施例中,在得到梯度残差后,可以基于梯度残差构建相应的决策树,其中,决策树的叶子节点数量可以根据实际需求设定,如可以为J,该J可以为大于1的正整数,如2、3、4等等。
比如,在一实施例中,根据梯度残差减少的梯度方向以及预设叶子节点数量,构建相应的决策树。
本申请实施例中,在构建出决策树之后,为了减少梯度,可以计算出决策树中叶子节点的信息增益,然后,基于叶子节点的信息增益对估计值模型函数进行更新。比如,可以通过如下公式计算出决策树叶子节点的信息增益:
中,j表示叶子节点的数量,取值范围为1-J,γjkm为k类别下决策树叶子节点j的信息增益,为梯度残差,K为样本类别数量。
然后,基于如下公式获得新的估计值模型函数:
其中,Fk,m-1(x)更新前的估值模型函数,Fk,m(x)为更新后新的估值模型函数,γjkm为k类别下决策树叶子节点j的信息增益。
其中,信息增益是针对一个一个特征而言的,就是看一个特征t,系统有它和没有它时的信息量各是多少,两者的差值就是这个特征给系统带来的信息量,即信息增益。
下面以待清理应用集合为{应用1、应用2……应用C}为例,介绍GBDT模型的训练过程:
(1)、获取应用1的多维特征,构建应用1的训练样本。比如,可以从历史特征数据库中获取应用1的多维特征,其中,特征的维数可以根据实际需求设定,即特征数目N,如可以选取30维,也即获取应用1的30个不同的特征。
(2)、初始化估值模型函数为Fk0(x)=0,建立的决策树个数为M,每个决策树的叶子结点数目为J。
(3)、根据估值模型函数为Fk0(x)获取训练样本属于可清理类别的概率,然后,对概率进行逻辑变换。如,可以通过如下公式进行逻辑变换:
其中,k为样本类别(包括可清理或不可清理),Fk(x)为样本类别k的估值模型函数,pk(x)为样本x属于样本类别k的概率。
(4)、对于每个类别k如数值0表示的可清理,计算每个类别的梯度残差。如可以通过如下公式计算:
为梯度残差,yik为变换前的概率,pk(x)为变换后样本x属于样本类别k的概率。
(5)、根据构建相应的决策树,决策树的叶子节点数目为J。比如,可以将梯度残差大于0的归为一类,小于0的归为一类,以构建出相应决策树。
(6)、计算决策树叶子节点的信息增益,如可以通过如下公式计算得到:
中,j表示叶子节点的数量,取值范围为1-J,γjkm为k类别下决策树叶子节点j的信息增益,为梯度残差,K为样本类别数量。
(7)、根据叶子节点的信息增益更新估值模型函数,得到新的估值模型函数。比如,可以通过如下公式得到新的估值模型函数:
其中,x为训练样本,Fk,m-1(x)更新前的估值模型函数,Fk,m(x)为更新后新的估值模型函数,γjkm为k类别下决策树叶子节点j的信息增益。
(8)、重复执行(4)到(7)步骤可以计算出每个类别的估值函数模型,如可清理类别的估值函数模型、不可清理类别的估值函数模型。
(9)、重复执行(3)到(8)步骤,可以计算出应用1的M个决策树以及每个类别的最终估值模型函数。
(10)、重复执行(1)到(9)步骤,可以计算出每个应用,如应用1、应用2……应用C的M个决策树以及每个类别的最终估值模型函数。
203、获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益。
比如,可以根据预测时间获取每个应用的多维特征作为预测样本。
其中,预测时间可以根据需求设定,如可以为当前时间等。
比如,可以在预测时间点采集应用的多维特征作为预测样本。
本申请实施例中,步骤201和203中获取的多维特征是相同类型的特征,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用进入后台的方式。
例如,可以获取应用1、应用2、应用3……应用C当前时间的多维特征,分别作为应用1、应用2、应用3……应用C的预测样本。
在得到每个应用的预测样本后,可以根据每个应用的预测样本和最终估值模型函数获取每个应用可清理的信息增益。比如,根据应用1的预测样本和最终估值模型函数来计算出应用1的信息增益,根据应用2的预测样本和最终估值模型函数来计算出应用2的信息增益……依次类推得到每个应用的信息增益。
204、根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。
比如,根据应用1、应用2、应用3……应用C可清理的信息增益,对集合中应用2、应用3进行清理。
其中,基于信息增益清理应用的方式有多种,比如,确定应用可清理的信息增益是否大于预设增益,若是,则确定应用为可清理应用,并对该应用进行清理。例如,应用1的信息增益大于预设增益时,则确定应用1为可清理应用,然后对应用1进行清理。
为了提升应用清理的速度以及效率,在一实施例中,可以基于每个应用的信息增益对应用进行排序,然后,删除排序后某几个应用。比如,步骤“,根据应用可清理的信息增益对待清理应用集合中相应的应用进行清理”可以包括:
根据应用可清理的信息增益对待清理应用集合中应用进行排序,得到排序后应用集合;
根据预设应用清理比例对排序后应用集合中相应的应用进行清理。
其中,排序的方式有多种,比如,可以按照增益由大到小,或者由小到大进行排序。
其中,预设应用清理比例为应用集合中需要清理应用的数量占集合内应用总数量的百分比,该比例可以根据实际需求设定,如30%、40%等等。
例如,对于待清理应用集合{应用1、应用2……应用10},可以基于每个应用的信息增益按照从大到小排序,排序后集合为{应用10、应用9……应用1},然后,基于预设应用清理比例对排序后集合中相应的应用进行清理,如当预设应用清理比例为40%时,可以对排序后集合前4个应用,即应用10、应用9、应用8、应用7进行清理。
在一实施例中,步骤“根据预设应用清理比例对排序后应用集合中相应的应用进行清理”可以包括:
根据预设应用清理比例以及排序后应用集合中应用的数量,获取需要清理应用的目标数量;
以排序后应用集合的头部应用或者尾部应用为起点,选取目标数量的应用进行清理。
比如,以待清理应用集合为{应用1、应用2……应用C},预设应用清理比例30%,首先根据每个应用的信息增益进行应用排序,假设应用排序是按照增益从大到小的排序方式,排序后集合{应用C、应用C-1……应用1};然后根据应用数目C和应用清理比例30%计算出需要清理应用的数目C*30%,如C=10时,清理应用的数目为3;此时可以清理排序后集合前C*30%如3个应用,即从排序后集合头部应用(应用C)为起点向尾部应用(应用1)方向清理C*30%如3个应用。
又比如,应用排序是按照增益从小到到的排序方式时,根据应用数目C和应用清理比例30%计算出需要清理应用的数目C*30%,如C=10时,清理应用的数目为3;此时可以清理排序后集合后C*30%如3个应用,即从排序后集合尾部应用为起点向头部应用方向清理C*30%如3个应用。
由上可知,本申请实施例获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗以及提升了系统资源的利用率。
进一步地,由于训练样本中包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。
进一步地,基于GBDT模型来实现应用清理预测,可以提升用户行为预测的准确性,进而提高清理的准确度。并且,本申请实施例还可以基于应用的增益与清理比例来清理应用,无需一一预测应用是否可清理,相对于目前需要一一预测应用是否可清理的方式,可以提升应用清理的速度以及效率、节省了资源。
下面将在上述实施例描述的方法基础上,对本申请的清理方法做进一步介绍。参考图3,该应用清理方法可以包括:
301、当接收到应用清理请求时,根据应用清理请求确定当前待清理应用,得到待清理应用集合。
其中,当前待清理应用可以包括前台应用、后台应用等等。
比如,当电子设备接收到应用清理请求时,可以根据应用清理请求获取待清理应用集合{应用1、应用2……应用n}。
302、从历史特征数据库中获取待清理应用接中应用的多维特征,并将多维特征作为应用的训练样本。
其中,特征数据库中存储有应用在历史时间的多种特征。
其中,应用的多维特征具有一定长度的维度,其每个维度上的参数均对应表征应用的一种特征信息,即该多维特征息由多个特征构成。该多个特征可以包括应用自身相关的特征信息,例如:应用切入到后台的时长;应用切入到后台期间,电子设备的灭屏时长;应用进入前台的次数;应用处于前台的时间;应用处于后台的时间、应用进入后台的方式,例如被主页键(home键)切换进入、被返回键切换进入,被其他应用切换进入等;应用的类型,包括一级(常用应用)、二级(其他应用)等。
该多个特征信息还可以包括应用所在的电子设备的相关特征信息,例如:电子设备的灭屏时间、亮屏时间、当前电量,电子设备的无线网络连接状态,电子设备是否在充电状态等。
其中,应用的训练样本包括应用的多维特征。该多维特征可以是在历史时间段内,按照预设频率采集的多个特征。历史时间段,例如可以是过去7天、10天;预设频率,例如可以是每10分钟采集一次、每半小时采集一次。可以理解的是,一次采集的应用的多维特征数据构成一个样本。
在一实施例中,为便于应用清理,可以将应用的多维特征信息中,未用数值直接表示的特征信息用具体的数值量化出来,例如针对电子设备的无线网连接状态这个特征信息,可以用数值1表示正常的状态,用数值0表示异常的状态(反之亦可);再例如,针对电子设备是否在充电状态这个特征信息,可以用数值1表示充电状态,用数值0表示未充电状态(反之亦可)。
一个具体的样本可如下所示,包括多个维度的特征信息,如30维特征,需要说明的是,如下所示的特征信息仅为举例,实际中,一个样本所包含的特征信息的数量,可以多于比如下所示信息的数量,也可以少于如下所示信息的数量,所取的具体特征信息也可以与如下所示不同,此处不作具体限定。30维特征包括:
APP上一次切入后台到现在的时长;
APP上一次切入后台到现在的期间中,累计屏幕关闭时间长度;
APP一天里(按每天统计)进入前台的次数;
APP一天里(休息日按工作日、休息日分开统计)进入前台的次数,比如若当前预测时间为工作日,则该特征使用数值为工作日统计到的平均每个工作日在前台使用次数;
APP一天中(按每天统计)处于前台的时间;
该后台APP紧跟当前前台APP后被打开次数,不分工作日休息日统计所得;
该后台APP紧跟当前前台APP后被打开次数,分工作日休息日统计;
目标APP被切换的方式,分为被home键切换、被recent键切换、被其他APP切换;
目标APP一级类型(常用应用);
目标APP二级类型(其他应用);
手机屏幕灭屏时间;
手机屏幕亮屏时间;
当前屏幕亮灭状态;
当前的电量;
当前wifi状态;
App上一次切入后台到现在的时长;
APP上一次在前台被使用时长;
APP上上一次在前台被使用时长;
APP上上上一次在前台被使用时长;
若一天分了6个时间段,每段4小时,当前预测时间点为早上8:30,则处于第3段,则该特征表示的是目标app每天在8:00~12:00这个时段被使用的时间长度;
当前前台APP进入后台到目标APP进入前台按每天统计的平均间隔时间;
当前前台APP进入后台到目标APP进入前台期间按每天统计的平均屏幕熄灭时间;
目标APP在后台停留时间直方图第一个bin(0-5分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(5-10分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(10-15分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(15-20分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(25-30分钟对应的次数占比);
目标APP在后台停留时间直方图第一个bin(30分钟以后对应的次数占比);
当前是否有在充电。
303、根据应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数。
其中,样本类别包括可清理、或不可清理。
比如,可以根据应用1的训练样本对梯度提升决策树模型进行训练,得到应用1的样本类别的最终估值模型函数,根据应用2的训练样本对梯度提升决策树模型进行训练,得到应用2的样本类别的最终估值模型函数……根据应用n的训练样本对梯度提升决策树模型进行训练,得到应用n的样本类别的最终估值模型函数。
下面以待清理应用集合为{应用1、应用2……应用C}为例,介绍GBDT模型的训练过程:
(1)、获取应用1的多维特征,构建应用1的训练样本。比如,可以从历史特征数据库中获取应用1的多维特征,其中,特征的维数可以根据实际需求设定,即特征数目N,如可以选取30维,也即获取应用1的30个不同的特征。
(2)、初始化估值模型函数为Fk0(x)=0,建立的决策树个数为M,每个决策树的叶子结点数目为J。
(3)、根据估值模型函数为Fk0(x)获取训练样本属于可清理类别的概率,然后,对概率进行逻辑变换。如,可以通过如下公式进行逻辑变换:
其中,k为样本类别(包括可清理或不可清理),Fk(x)为样本类别k的估值模型函数,pk(x)为样本x属于样本类别k的概率。
(4)、对于每个类别k如数值0表示的可清理,计算每个类别的梯度残差。如可以通过如下公式计算:
为梯度残差,yik为变换前的概率,pk(x)为变换后样本x属于样本类别k的概率。
(5)、根据构建相应的决策树,决策树的叶子节点数目为J。比如,可以将梯度残差大于0的归为一类,小于0的归为一类,以构建出相应决策树。
(6)、计算决策树叶子节点的信息增益,如可以通过如下公式计算得到:
中,j表示叶子节点的数量,取值范围为1-J,γjkm为k类别下决策树叶子节点j的信息增益,为梯度残差,K为样本类别数量。
(7)、根据叶子节点的信息增益更新估值模型函数,得到新的估值模型函数。比如,可以通过如下公式得到新的估值模型函数:
其中,x为训练样本,Fk,m-1(x)更新前的估值模型函数,Fk,m(x)为更新后新的估值模型函数,γjkm为k类别下决策树叶子节点j的信息增益。
(8)、重复执行(4)到(7)步骤可以计算出每个类别的估值函数模型,如可清理类别的估值函数模型、不可清理类别的估值函数模型。
(9)、重复执行(3)到(8)步骤,可以计算出应用1的M个决策树以及每个类别的最终估值模型函数。
(10)、重复执行(1)到(9)步骤,可以计算出每个应用,如应用1、应用2……应用C的M个决策树以及每个类别的最终估值模型函数。
304、获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益。
比如,可以根据预测时间获取每个应用的多维特征作为预测样本。其中,预测时间可以根据需求设定,如可以为当前时间等。例如,可以获取应用1、应用2、应用3……应用C当前时间的多维特征,分别作为应用1、应用2、应用3……应用C的预测样本。
305、根据每个应用可清理的信息增益对待清理应用集合中应用进行排序,得到排序后应用集合。
其中,排序的方式有多种,比如,可以按照增益由大到小,或者由小到大进行排序。
306、根据预设应用清理比例对排序后应用集合中相应的应用进行清理。
其中,预设应用清理比例为应用集合中需要清理应用的数量占集合内应用总数量的百分比,该比例可以根据实际需求设定,如30%、40%等等。
比如,以待清理应用集合为{应用1、应用2……应用C},预设应用清理比例30%,首先根据每个应用的信息增益进行应用排序,假设应用排序是按照增益从大到小的排序方式,排序后集合{应用C、应用C-1……应用1};然后根据应用数目C和应用清理比例30%计算出需要清理应用的数目C*30%,如C=10时,清理应用的数目为3;此时可以清理排序后集合前C*30%如3个应用,即从排序后集合头部应用(应用C)为起点向尾部应用(应用1)方向清理C*30%如3个应用。
由上可知,本申请实施例获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗以及提升了系统资源的利用率。
进一步地,由于训练样本中包括了反映用户使用应用的行为习惯的多个特征信息,因此本申请实施例可以使得对对应应用的清理更加个性化和智能化。
进一步地,基于GBDT模型来实现应用清理预测,可以提升用户行为预测的准确性,进而提高清理的准确度。并且,本申请实施例还可以基于应用的增益与清理比例来清理应用,无需一一预测应用是否可清理,相对于目前需要一一预测应用是否可清理的方式,可以提升应用清理的速度以及效率、节省了资源。
在一实施例中还提供了一种应用清理装置。请参阅图4,图4为本申请实施例提供的应用清理装置的结构示意图。其中该应用清理装置应用于电子设备,该应用清理装置可以包括特征获取单元401、训练单元402、增益获取单元403、和清理单元404,如下:
特征获取单元401,用于获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
训练单元402,用于根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
增益获取单元403,用于获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
清理单元404,用于根据所述预测样本和所述分类回归树模型预测所述应用是否可清理。
在一实施例中,参考图5,训练单元402,可以包括:
概率获取子单元4021,用于根据估值模型函数获取所述训练样本属于所述样本类别的初始概率;
逻辑变换子单元4022,用于对所述初始概率进行逻辑变换,得到变换后概率;
残差获取子单元4023,用于根据所述变换后概率和所述初始概率获取所述样本类别的梯度残差;
树构建子单元4024,用于根据所述梯度残差构建相应的决策树;
更新子单元4025,用于根据所述决策树中叶子节点的信息增益,对所述估计值模型函数进行更新,并触发概率获取子单元4021执行根据估值模型函数获取所述训练样本分别属于样本类别的初始概率的步骤,直到决策树数量等于预设数量为止。
在一实施例中,残差获取子单元4023,可以用于根据所述梯度残差减少的梯度方向以及预设叶子节点数量,构建相应的决策树。
在一实施例中,参考图6,其中,清理单元404可以包括:
排序子单元4041,用于根据所述应用可清理的信息增益对所述待清理应用集合中应用进行排序,得到排序后应用集合;
清理子单元4042,用于根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理。
在一实施例中,所述清理子单元4042,可以用于:
根据所述预设应用清理比例以及排序后应用集合中应用的数量,获取需要清理应用的目标数量;
以所述排序后应用集合的头部应用或者尾部应用为起点,选取所述目标数量的应用进行清理。
其中,应用清理装置中各单元执行的步骤可以参考上述方法实施例描述的方法步骤。该应用清理装置可以集成在电子设备中,如手机、平板电脑等。
具体实施时,以上各个单元可以作为独立的实体实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单位的具体实施可参见前面的实施例,在此不再赘述。
由上可知,本实施例应用清理装置可以由特征获取单元401获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;训练单元402根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;由增益获取单元403获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;由清理单元404根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。
本申请实施例还提供一种电子设备。请参阅图7,电子设备500包括处理器501以及存储器502。其中,处理器501与存储器502电性连接。
所述处理器500是电子设备500的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器502内的计算机程序,以及调用存储在存储器502内的数据,执行电子设备500的各种功能并处理数据,从而对电子设备500进行整体监控。
所述存储器502可用于存储软件程序以及模块,处理器501通过运行存储在存储器502的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器501对存储器502的访问。
在本申请实施例中,电子设备500中的处理器501会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器502中,并由处理器501运行存储在存储器502中的计算机程序,从而实现各种功能,如下:
获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
根据每个应用可清理的信息增益对所述待清理应用集合中相应的应用进行清理。
在某些实施方式中,在根据所述应用的训练样本对梯度提升决策树模型进行训练时,处理器501可以具体执行以下步骤:
根据估值模型函数获取所述训练样本属于所述样本类别的初始概率;
对所述初始概率进行逻辑变换,得到变换后概率;
根据所述变换后概率和所述初始概率获取所述样本类别的梯度残差;
根据所述梯度残差构建相应的决策树;
根据所述决策树中叶子节点的信息增益,对所述估计值模型函数进行更新,并返回执行根据估值模型函数获取所述训练样本分别属于样本类别的初始概率的步骤,直到决策树数量等于预设数量为止。
在某些实施方式中,在根据所述梯度残差构建相应的决策树时,处理器501可以具体执行以下步骤:
根据所述梯度残差减少的梯度方向以及预设叶子节点数量,构建相应的决策树。
在某些实施方式中,在根据所述应用可清理的信息增益对所述待清理应用集合中相应的应用进行清理时,处理器501可以具体执行以下步骤:
根据所述应用可清理的信息增益对所述待清理应用集合中应用进行排序,得到排序后应用集合;
根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理。
在某些实施方式中,在根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理时,处理器501还可以具体执行以下步骤:
根据所述预设应用清理比例以及排序后应用集合中应用的数量,获取需要清理应用的目标数量;
以所述排序后应用集合的头部应用或者尾部应用为起点,选取所述目标数量的应用进行清理。
由上述可知,本申请实施例的电子设备,获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。该方案可以实现应用的自动清理,提高了电子设备的运行流畅度,降低了功耗。
请一并参阅图8,在某些实施方式中,电子设备500还可以包括:显示器503、射频电路504、音频电路505以及电源506。其中,其中,显示器503、射频电路504、音频电路505以及电源506分别与处理器501电性连接。
所述显示器503可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器503可以包括显示面板,在某些实施方式中,可以采用液晶显示器(Liquid CrystalDisplay,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
所述射频电路504可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
所述音频电路505可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
所述电源506可以用于给电子设备500的各个部件供电。在一些实施例中,电源506可以通过电源管理系统与处理器501逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图8中未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例还提供一种存储介质,所述存储介质存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述任一实施例中的应用清理方法,比如:获取待清理应用集合中应用的多维特征,并将多维特征作为应用的训练样本;根据训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,该样本类别包括可清理、或不可清理;获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;根据每个应用可清理的信息增益对待清理应用集合中相应的应用进行清理。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM,)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的应用清理方法而言,本领域普通测试人员可以理解实现本申请实施例的应用清理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,所述计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如应用清理方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的应用清理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,所述存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种应用清理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种应用清理方法,其特征在于,包括:
获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
根据每个应用可清理的信息增益对所述待清理应用集合中相应的应用进行清理。
2.如权利要求1所述的应用清理方法,其特征在于,根据所述应用的训练样本对梯度提升决策树模型进行训练,包括:
根据估值模型函数获取所述训练样本属于所述样本类别的初始概率;
对所述初始概率进行逻辑变换,得到变换后概率;
根据所述变换后概率和所述初始概率获取所述样本类别的梯度残差;
根据所述梯度残差构建相应的决策树;
根据所述决策树中叶子节点的信息增益,对所述估计值模型函数进行更新,并返回执行根据估值模型函数获取所述训练样本分别属于样本类别的初始概率的步骤,直到决策树数量等于预设数量为止。
3.如权利要求2所述的应用清理方法,其特征在于,根据所述梯度残差构建相应的决策树,包括:
根据所述梯度残差减少的梯度方向以及预设叶子节点数量,构建相应的决策树。
4.如权利要求1所述的应用清理方法,其特征在于,根据所述应用可清理的信息增益对所述待清理应用集合中相应的应用进行清理,包括:
根据所述应用可清理的信息增益对所述待清理应用集合中应用进行排序,得到排序后应用集合;
根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理。
5.如权利要求4所述的应用清理方法,其特征在于,根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理,包括:
根据所述预设应用清理比例以及排序后应用集合中应用的数量,获取需要清理应用的目标数量;
以所述排序后应用集合的头部应用或者尾部应用为起点,选取所述目标数量的应用进行清理。
6.一种应用清理装置,其特征在于,包括:
特征获取单元,用于获取待清理应用集合中应用的多维特征,并将所述多维特征作为所述应用的训练样本;
训练单元,用于根据所述应用的训练样本对梯度提升决策树模型进行训练,得到每个应用的样本类别的最终估值模型函数,所述样本类别包括可清理、或不可清理;
增益获取单元,用于获取每个应用的预测样本,并根据每个应用的预测样本、最终估值模型函数获取每个应用可清理的信息增益;
清理单元,用于根据所述预测样本和所述分类回归树模型预测所述应用是否可清理。
7.如权利要求6所述的应用清理装置,其特征在于,所述训练单元,包括:
概率获取子单元,用于根据估值模型函数获取所述训练样本属于所述样本类别的初始概率;
逻辑变换子单元,用于对所述初始概率进行逻辑变换,得到变换后概率;
残差获取子单元,用于根据所述变换后概率和所述初始概率获取所述样本类别的梯度残差;
树构建子单元,用于根据所述梯度残差构建相应的决策树;
更新子单元,用于根据所述决策树中叶子节点的信息增益,对所述估计值模型函数进行更新,并触发概率获取子单元执行根据估值模型函数获取所述训练样本分别属于样本类别的初始概率的步骤,直到决策树数量等于预设数量为止。
8.如权利要求7所述的应用清理装置,其特征在于,所述残差获取子单元,用于根据所述梯度残差减少的梯度方向以及预设叶子节点数量,构建相应的决策树。
9.如权利要求6所述的应用清理装置,其特征在于,所述清理单元,包括:
排序子单元,用于根据所述应用可清理的信息增益对所述待清理应用集合中应用进行排序,得到排序后应用集合;
清理子单元,用于根据预设应用清理比例对所述排序后应用集合中相应的应用进行清理。
10.如权利要求9所述的应用清理装置,其特征在于,所述清理子单元,用于:
根据所述预设应用清理比例以及排序后应用集合中应用的数量,获取需要清理应用的目标数量;
以所述排序后应用集合的头部应用或者尾部应用为起点,选取所述目标数量的应用进行清理。
11.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至5任一项所述的应用清理方法。
12.一种电子设备,包括处理器和存储器,所述存储器有计算机程序,其特征在于,所述处理器通过调用所述计算机程序,用于执行如权利要求1至5任一项所述的应用清理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711046992.1A CN107870810B (zh) | 2017-10-31 | 2017-10-31 | 应用清理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711046992.1A CN107870810B (zh) | 2017-10-31 | 2017-10-31 | 应用清理方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107870810A true CN107870810A (zh) | 2018-04-03 |
CN107870810B CN107870810B (zh) | 2020-05-12 |
Family
ID=61753545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711046992.1A Expired - Fee Related CN107870810B (zh) | 2017-10-31 | 2017-10-31 | 应用清理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107870810B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084429A (zh) * | 2019-04-29 | 2019-08-02 | 东软医疗系统股份有限公司 | 扫描时间的预测方法、装置、存储介质及电子设备 |
CN110263783A (zh) * | 2019-05-27 | 2019-09-20 | 华东师范大学 | 基于深度学习的多特征充电选址影响因素分析方法及系统 |
CN112256354A (zh) * | 2020-11-25 | 2021-01-22 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN113050783A (zh) * | 2019-12-26 | 2021-06-29 | Oppo广东移动通信有限公司 | 终端控制方法、装置、移动终端及存储介质 |
US11568317B2 (en) * | 2020-05-21 | 2023-01-31 | Paypal, Inc. | Enhanced gradient boosting tree for risk and fraud modeling |
CN117827112A (zh) * | 2024-01-04 | 2024-04-05 | 上海源斌电子科技有限公司 | 一种基于人工智能的电子元件存储数据分析系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106980623A (zh) * | 2016-01-18 | 2017-07-25 | 华为技术有限公司 | 一种数据模型的确定方法及装置 |
CN107133094A (zh) * | 2017-06-05 | 2017-09-05 | 努比亚技术有限公司 | 应用管理方法、移动终端及计算机可读存储介质 |
CN107169534A (zh) * | 2017-07-04 | 2017-09-15 | 北京京东尚科信息技术有限公司 | 模型训练方法及装置、存储介质、电子设备 |
-
2017
- 2017-10-31 CN CN201711046992.1A patent/CN107870810B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106980623A (zh) * | 2016-01-18 | 2017-07-25 | 华为技术有限公司 | 一种数据模型的确定方法及装置 |
CN107133094A (zh) * | 2017-06-05 | 2017-09-05 | 努比亚技术有限公司 | 应用管理方法、移动终端及计算机可读存储介质 |
CN107169534A (zh) * | 2017-07-04 | 2017-09-15 | 北京京东尚科信息技术有限公司 | 模型训练方法及装置、存储介质、电子设备 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110084429A (zh) * | 2019-04-29 | 2019-08-02 | 东软医疗系统股份有限公司 | 扫描时间的预测方法、装置、存储介质及电子设备 |
CN110263783A (zh) * | 2019-05-27 | 2019-09-20 | 华东师范大学 | 基于深度学习的多特征充电选址影响因素分析方法及系统 |
CN113050783A (zh) * | 2019-12-26 | 2021-06-29 | Oppo广东移动通信有限公司 | 终端控制方法、装置、移动终端及存储介质 |
CN113050783B (zh) * | 2019-12-26 | 2023-08-08 | Oppo广东移动通信有限公司 | 终端控制方法、装置、移动终端及存储介质 |
US11568317B2 (en) * | 2020-05-21 | 2023-01-31 | Paypal, Inc. | Enhanced gradient boosting tree for risk and fraud modeling |
US11893465B2 (en) | 2020-05-21 | 2024-02-06 | Paypal, Inc. | Enhanced gradient boosting tree for risk and fraud modeling |
CN112256354A (zh) * | 2020-11-25 | 2021-01-22 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN112256354B (zh) * | 2020-11-25 | 2023-05-16 | Oppo(重庆)智能科技有限公司 | 应用启动方法、装置、存储介质及电子设备 |
CN117827112A (zh) * | 2024-01-04 | 2024-04-05 | 上海源斌电子科技有限公司 | 一种基于人工智能的电子元件存储数据分析系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107870810B (zh) | 2020-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107870810A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107678845A (zh) | 应用程序管控方法、装置、存储介质及电子设备 | |
CN107678799B (zh) | 应用程序管控方法、装置、存储介质及电子设备 | |
CN107704070A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN108337358A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107632697B (zh) | 应用程序的处理方法、装置、存储介质及电子设备 | |
CN109714395A (zh) | 云平台资源使用预测方法及终端设备 | |
CN107678531A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107894827A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107943582A (zh) | 特征处理方法、装置、存储介质及电子设备 | |
CN108694673A (zh) | 一种保险业务风险预测的处理方法、装置及处理设备 | |
CN107748697A (zh) | 应用关闭方法、装置、存储介质及电子设备 | |
CN108108743A (zh) | 异常用户识别方法和用于识别异常用户的装置 | |
CN107885545A (zh) | 应用管理方法、装置、存储介质及电子设备 | |
CN107402809A (zh) | 应用程序的管控方法、装置、存储介质及电子设备 | |
CN108108455A (zh) | 目的地的推送方法、装置、存储介质及电子设备 | |
CN107835311A (zh) | 应用管理方法、装置、存储介质及电子设备 | |
CN107832132A (zh) | 应用控制方法、装置、存储介质及电子设备 | |
CN107943534A (zh) | 后台应用程序的关闭方法、装置、存储介质及电子设备 | |
CN107643925A (zh) | 后台应用清理方法、装置、存储介质及电子设备 | |
CN107704289A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN107861769A (zh) | 应用清理方法、装置、存储介质及电子设备 | |
CN110502739A (zh) | 结构化输入的机器学习模型的构建 | |
CN107704364B (zh) | 后台应用程序管控方法、装置、存储介质及电子设备 | |
CN107870809A (zh) | 应用关闭方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. Address before: Changan town in Guangdong province Dongguan 523860 usha Beach Road No. 18 Applicant before: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200512 |
|
CF01 | Termination of patent right due to non-payment of annual fee |