CN109669779B - 用于确定数据的清理路径、清理数据的方法和设备 - Google Patents
用于确定数据的清理路径、清理数据的方法和设备 Download PDFInfo
- Publication number
- CN109669779B CN109669779B CN201811587961.1A CN201811587961A CN109669779B CN 109669779 B CN109669779 B CN 109669779B CN 201811587961 A CN201811587961 A CN 201811587961A CN 109669779 B CN109669779 B CN 109669779B
- Authority
- CN
- China
- Prior art keywords
- data
- cleaning
- path information
- application
- cleaning path
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004140 cleaning Methods 0.000 title claims abstract description 308
- 238000000034 method Methods 0.000 title claims abstract description 67
- 238000012549 training Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000007477 logistic regression Methods 0.000 claims description 10
- 238000007476 Maximum Likelihood Methods 0.000 claims description 7
- 230000004044 response Effects 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 51
- 230000006870 function Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 239000000835 fiber Substances 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013501 data transformation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5011—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resources being hardware resources other than CPUs, Servers and Terminals
- G06F9/5022—Mechanisms to release resources
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了用于确定数据的清理路径、清理数据的方法和设备。用于确定数据的清理路径的方法的一具体实施方式包括:获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;基于第一行为数据确定第一特征值,其中,第一特征值用于表征应用的使用情况;将第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,数据清理模型用于确定清理路径信息;向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。该实施方式基于用户的行为数据确定清理路径,无需逐个扫描客户端上安装的应用,大大缩短了确定清理路径的时间,有助于提高数据清理效率。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于确定数据的清理路径、清理数据的方法和设备。
背景技术
手机等客户端中的功能越来越多,为人们的生活和工作提供了便利。人们可以在客户端上安装各式各样的应用,来支持客户端不同功能的实现。安装在客户端上的应用在运行的过程中,会生成一些临时数据,并保存在客户端的存储空间内的指定路径下。临时数据长期积累会占用客户端中大量的存储空间,导致客户端运行缓慢。因此,需要对临时数据进行及时清理,以释放客户端的存储空间。
现有的数据清理方式通常是利用客户端上安装的数据清理应用逐个扫描客户端上安装的应用,以确定每个应用产生的数据的存储路径和占用空间。待扫描完毕,将每个应用产生的数据的占用空间呈现给用户。当用户选择对某些应用产生的数据进行清理时,会对这些应用产生的数据的存储路径下存储的数据进行清理。
发明内容
本申请实施例提出了用于确定数据的清理路径、清理数据的方法和设备。
第一方面,本申请的一些实施例提供了一种用于确定数据的清理路径的方法,应用于服务端,包括:获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;基于第一行为数据确定第一特征值,其中,第一特征值用于表征应用的使用情况;将第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,数据清理模型用于确定清理路径信息;向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。
在一些实施例中,该方法还包括:接收客户端基于第一清理路径信息进行数据清理后发送的数据清理信息;基于数据清理信息确定清理比率;若清理比率大于预设比率阈值,将第一特征值和第一清理路径信息作为训练样本对数据清理模型进行优化,得到优化后的数据清理模型。
在一些实施例中,该方法还包括:若清理比率小于或等于预设比率阈值,获取用户在第二时间段内使用应用所生成的第二行为数据;将第一行为数据和第二行为数据合并,以及基于合并后的行为数据确定合并特征值;将合并特征值输入到数据清理模型,得到合并清理路径信息;向客户端发送合并清理路径信息,以使客户端基于合并清理路径信息再次进行数据清理。
在一些实施例中,第一行为数据包括应用的标识和使用时长。
在一些实施例中,第一特征值包括以下至少一项:应用的使用频率、应用的清理路径、应用产生数据的速度、应用产生数据的占用空间。
在一些实施例中,第一清理路径信息包括应用的清理路径,或者包括应用的清理置信度和清理路径。
在一些实施例中,数据清理模型通过如下步骤训练得到:获取训练样本,其中,训练样本包括样本特征值和样本清理路径信息;以样本特征值为自变量构造线性回归方程,其中,线性回归方程的每个自变量对应一个权重系数;以线性方程为自变量构造逻辑回归函数;将样本特征值作为输入,将样本清理路径信息作为输出,对逻辑回归函数进行训练,得到数据清理模型。
在一些实施例中,权重系数的数值是通过最大似然估计方法求解出的。
第二方面,本申请的一些实施例提供了一种用于清理数据的方法,应用于客户端,包括:收集并上报用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;响应于接收到服务端发送的基于第一行为数据确定的第一清理路径信息,对第一清理路径信息对应的第一清理路径下存储的数据进行清理。
在一些实施例中,在对第一清理路径信息所指示的第一清理路径下存储的数据进行清理之后,还包括:生成数据清理信息,并发送至服务端。
第三方面,本申请的一些实施例提供了一种用于确定数据的清理路径的装置,设置于服务端,包括:获取单元,被配置成获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;确定单元,被配置成基于第一行为数据确定第一特征值,其中,第一特征值用于表征应用的使用情况;输入单元,被配置成将第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,数据清理模型用于确定清理路径信息;发送单元,被配置成向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。
第四方面,本申请的一些实施例提供了一种用于清理数据的装置,设置于客户端,包括:上报单元,被配置成收集并上报用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;清理单元,被配置成响应于接收到服务端发送的基于第一行为数据确定的第一清理路径信息,对第一清理路径信息对应的第一清理路径下存储的数据进行清理。
第五方面,本申请的一些实施例提供了一种计算机设备,该计算机设备包括:一个或多个处理器;存储装置,其上存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法或者实现如第二方面中任一实现方式描述的方法。
第六方面,本申请的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法或者实现如第二方面中任一实现方式描述的方法。
本申请的上述实施例提供的用于确定数据的清理路径、清理数据的方法和设备,首先获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;之后基于第一行为数据确定第一特征值;然后将第一特征值输入至预设的数据清理模型,以得到第一清理路径信息;最后向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。基于用户的行为数据确定清理路径,大大缩短了确定清理路径的时间,有助于提高数据清理效率。同时,也避免了现有技术中在扫描客户端上安装的应用的过程中用户需要经历长时间的等待而中断扫描,导致数据清理失败的情况的发生。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请一些实施例可以应用于其中的示例性系统架构图;
图2是根据本申请的用于确定数据的清理路径的方法的一个实施例的流程图;
图3是根据本申请的用于确定数据的清理路径的方法的又一个实施例的流程图;
图4是根据本申请的用于清理数据的方法的一个实施例的流程图;
图5是适于用来实现本申请实施例的计算机设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于确定数据的清理路径信息、清理数据的方法的示例性系统架构100。
如图1所示,系统架构100可以包括设备101、102和网络103。网络103用以在设备101、102之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
设备101、102可以是支持网络连接从而提供各种网络服务的硬件设备或软件。当设备为硬件时,其可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和服务器等等。这时,作为硬件设备,其可以实现成多个设备组成的分布式设备群,也可以实现成单个设备。当设备为软件时,可以安装在上述所列举的设备中。这时,作为软件,其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
在实践中,设备可以通过安装相应的客户端应用或服务端应用来提供相应的网络服务。设备在安装了客户端应用之后,其可以在网络通信中体现为客户端。相应地,在安装了服务端应用之后,其可以在网络通信中体现为服务端。
作为示例,在图1中,设备101体现为客户端,而设备102体现为服务端。具体地,设备101可以是安装有数据清理应用的客户端,设备103可以是数据清理应用的后台服务器。数据清理应用的后台服务器可以获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;基于第一行为数据确定第一特征值;将第一特征值输入至预设的数据清理模型,得到第一清理路径信息;向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。
需要说明的是,本申请实施例所提供的用于确定数据的清理路径的方法可以由设备102执行,用于清理数据的方法可以由设备101执行。
应该理解,图1中的网络和设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的网络和设备。
继续参考图2,其示出了根据本申请的用于确定数据的清理路径的方法的一个实施例的流程200。该用于确定数据的清理路径的方法应用于服务端,包括以下步骤:
步骤201,获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据。
在本实施例中,用于确定数据的清理路径的方法的执行主体(例如图1所示的设备102)可以获取用户使用客户端(例如图1所示的设备101)上安装的应用所生成的行为数据。在一些实施例中,在用户授权的情况下,上述执行主体才会获取第一行为数据。通常,当用户需要对客户端中存储的临时数据进行清理时,可以利用客户端向上述执行主体发送数据清理请求。例如,当用户点击客户端上安装的数据清理应用中的数据清理按钮时,客户端可以向上述执行主体发送数据清理请求。若接收到客户端发送的数据清理请求,可以认为上述执行主体得到用户授权,此时才会获取第一行为数据。其中,在第一时间段内所生成的行为数据可以作为第一行为数据。其中,第一时间段可以是预先设定的任一时间区间,例如,第一时间段可以是当前时间之前的一个星期所对应的时间区间。
通常,客户端上可以安装有各种应用,例如数据清理应用、购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。对于客户端上安装的任意一个应用,当用户使用该应用时,可以生成该应用的行为数据。其中,该应用的行为数据可以包括该应用的标识和该应用的使用时长。因此,第一行为数据可以包括用户在第一时间段内使用的应用的标识和使用时长。
在一些实施例中,客户端可以实时收集行为数据,并实时或定时地上传至上述执行主体。
在一些实施例中,客户端可以集成SDK(Software Development Kit,软件开发工具包)模块。这样,每当客户端收集到行为数据,均可以实时上报至SDK平台。SDK平台可以通过提供上报的RESTful API将客户端上报的行为数据实时地发送至数据存储平台进行存储。上述执行主体可以通过与数据存储平台的接口或消息队列获取行为数据。其中,RESTful API是指REST(REpresentational State Transfer,表现层状态转移)风格的API(Application Programming Interface,应用程序编程接口)。
步骤202,基于第一行为数据确定第一特征值。
在本实施例中,上述执行主体可以对第一行为数据进行分析,确定第一特征值。其中,第一特征值可以用于表征应用的使用情况,包括但不限于以下至少一项:应用的使用频率、应用的清理路径、应用产生数据的速度、应用产生数据的占用空间等等。
通常,第一行为数据可以包括用户在第一时间段内使用的应用的标识和使用时长。这里,对于用户在第一时间段内使用的每个应用,上述执行主体可以基于第一行为数据统计该应用的使用次数和使用总时长,从而计算出该应用的使用频率。上述执行主体还可以预先对多个应用进行分析,确定出多个应用的清理路径、产生数据的速度、产生数据的占用空间,然后进行存储。对于用户在第一时间段内使用的每个应用,上述执行主体可以将从预先存储的多个应用的清理路径、产生数据的速度、产生数据的占用空间中确定出该应用的清理路径、产生数据的速度、产生数据的占用空间。
步骤203,将第一特征值输入至预设的数据清理模型,得到第一清理路径信息。
在本实施例中,上述执行主体可以将第一特征值输入至预设的数据清理模型,从而得到第一清理路径信息。在一些实施例,第一清理路径信息可以仅包括应用的清理路径。此时,第一清理路径信息包括的清理路径通常是客户端上安装的、用户在第一时间段内使用频率较高的应用的清理路径。在一些实施例中,第一清理路径信息可以既包括应用的清理路径,又包括对应应用的清理置信度。此时,第一清理路径信息包括的清理路径通常是客户端上安装的、用户在第一时间段内使用的应用的清理路径。应用的清理置信度可以是应用所产生的数据需要被清理的概率。通常,应用的使用频率越高、产生数据的速度越快,产生数据的占用空间越大,其需要被清理的概率就越大,反之,被清理的概率就越小。
这里,数据清理模型可以用于确定清理路径信息,表征特征值与清理路径信息之间的对应关系。
在一些实施例中,数据清理模型可以是本领域技术人员可以对大量特征值和对应的清理路径信息进行统计分析,而得到的存储有多个特征值与对应的清理路径信息的对应关系表。这样,上述执行主体可以计算第一特征值与对应关系表中的每个特征值之间的相似度,并基于相似度结果,从该对应关系表中查询出第一清理路径信息。例如,从对应关系表中查询出与第一特征值相似度最高的特征值对应的清理路径信息,作为第一清理路径信息。
在一些实施例中,数据清理模型可以是利用各种机器学习方法和训练样本对现有的机器学习模型(例如各种神经网络)进行有监督训练而得到的。例如,数据清理模型可以通过如下步骤训练得到:
首先,获取训练样本。
其中,训练样本可以包括样本特征值和样本清理路径信息。样本特征值可以包括但不限于以下至少一项:样本应用的使用频率、样本应用的清理路径、样本应用产生数据的速度、样本应用产生数据的占用空间等等。样本清理路径信息可以包括样本应用的清理置信度和样本应用的清理路径。
之后,以样本特征值为自变量构造线性回归方程。
其中,线性回归方程的每个自变量可以对应一个权重系数。作为一个示例,当样本特征值仅包括样本应用的使用频率这一个特征值时,构造的线性回归方程可以是:z=b+ax。其中,x是线性回归方程的自变量,表征应用的使用频率,a是与x对应的权重系数,b也是权重系数。作为另一个示例,当样本特征值包括样本应用的使用频率、样本应用的清理路径、样本应用产生数据的速度、样本应用产生数据的占用空间等n(n为大于1的整数)个特征值时,构造的线性回归方程可以是:z=β0+β1×x1+β2×x2+β3×x3+...+βn×xn。其中,x1、x2、x3…xn是线性回归方程的自变量,表征n个特征值,β1、β2、β3…βn是与x1、x2、x3…xn对应的权重系数,β0也为权重系数。
然后,以线性方程为自变量构造逻辑回归函数。
最后,将样本特征值作为输入,将样本清理路径信息作为输出,对逻辑回归函数进行训练,得到数据清理模型。
这里,可以将样本特征值作为自变量的值,将样本清理路径信息作为因变量的值带入逻辑回归函数,求出逻辑函数中的权重系数的数值,将求出的权重系数的数值带入逻辑回归函数即可得到数据清理模型。在一些实施例中,权重系数的数值可以是通过最大似然估计方法求解出的。其中,最大似然估计(maximum likelihood estimation,MLE)是一种重要而普遍的求估计量的方法。最大似然估计方法明确地使用概率模型,其目标是寻找能够以较高概率产生观察数据的系统发生树。这里,最大似然估计方法就是使训练样本中的数据出现的概率尽可能的大。
步骤204,向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。
在本实施例中,上述执行主体可以将第一清理路径信息发送给客户端,例如通过API将第一清理路径信息发送给客户端。这样,客户端就可以根据第一清理路径信息进行数据清理。在一些实施例中,当第一清理路径信息仅包括应用的清理路径的情况下,客户端可以对第一清理路径信息所包括的应用的清理路径下存储的数据进行清理。在一些实施例中,在第一清理路径信息既包括应用的清理路径,又包括应用的清理置信度的情况下,,客户端可以选取出清理置信度大于预设清理置信度阈值(例如60%)的应用,并对所选取出的应用的清理路径下存储的数据进行清理。
本申请的上述实施例提供的用于确定数据的清理路径的方法,首先获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;之后基于第一行为数据确定第一特征值;然后将第一特征值输入至预设的数据清理模型,以得到第一清理路径信息;最后向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。基于用户的行为数据确定清理路径,大大缩短了确定清理路径的时间,有助于提高数据清理效率。同时,也避免了现有技术中在扫描客户端上安装的应用的过程中用户需要经历长时间的等待而中断扫描,导致数据清理失败的情况的发生。
进一步参考图3,其示出了根据本申请的用于确定数据的清理路径的方法的又一个实施例的流程300。该用于确定数据的清理路径的方法应用于服务端,包括以下步骤:
步骤301,获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据。
步骤302,基于第一行为数据确定第一特征值。
步骤303,将第一特征值输入至预设的数据清理模型,得到第一清理路径信息。
步骤304,向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。
在本实施例中,步骤301-304的具体操作与图2所示的实施例中步骤201-204的操作基本相同,在此不再赘述。
步骤305,接收客户端基于第一清理路径信息进行数据清理后发送的数据清理信息。
在本实施例中,客户端(例如图1所示的设备101)基于第一清理路径信息进行数据清理后可以向用于确定数据的清理路径的执行主体(例如图1所示的设备102)发送数据清理信息。其中,数据清理信息可以包括数据清理后释放出的存储空间和数据清理所花费的时间。需要说明的是,第一清理路径信息已在参照图2所示实施例中予以详述,在此不再赘述。
步骤306,基于数据清理信息确定清理比率。
在本实施例中,上述执行主体可以基于数据清理信息确定清理比率。例如,上述执行主体可以首先获取在过去的时间段内客户端产生数据的平均速度,然后将客户端产生数据的平均速度与第一时间段的乘积作为客户端在第一时间段内产生数据的占用空间,最后将数据清理后释放出的存储空间与客户端在第一时间段内产生数据的占用空间的比值作为清理比率。
步骤307,确定清理比率是否大于预设比率阈值。
在本实施例中,上述执行主体可以将清理比率与预设比例阈值(例如80%)进行比较,若清理比率大于预设比率阈值,则说明已达到清理效果,继续执行步骤308;若清理比率小于或等于预设比率阈值,则说明尚未达到清理效果,继续执行步骤309。
步骤308,将第一特征值和第一清理路径信息作为训练样本对数据清理模型进行优化,得到优化后的数据清理模型。
在本实施例中,若清理比率大于预设比率阈值,上述执行主体可以将第一特征值作为输入,将第一清理路径信息作为输入对数据清理模型进行优化,以调整数据清理模型的权重系数的数值,从而得到优化后的数据清理模型。通常,优化后的数据清理模型确定出的清理路径信息精准度更高。需要说明的是,第一特征值和数据清理模型已在参照图2所示实施例中予以详述,在此不再赘述。
步骤309,获取用户在第二时间段内使用应用所生成的第二行为数据。
在本实施例中,若清理比率小于或等于预设比率阈值,上述执行主体可以获取用户在第二时间段内使用应用所生成的第二行为数据。其中,第二时间段通常是第一时间段之后的一个时间段。在第二时间段内所生成的行为数据可以作为第二行为数据。需要说明的是,行为数据已在参照图2所示实施例中予以详述,在此不再赘述。
步骤310,将第一行为数据和第二行为数据合并,以及基于合并后的行为数据确定合并特征值。
在本实施例中,上述执行主体可以将第一行为数据和第二行为数据合并,以及基于合并后的行为数据确定合并特征值。这里,确定合并特征值的操作与确定第一特征值的操作基本相同,在此不再赘述。
步骤311,将合并特征值输入到数据清理模型,得到合并清理路径信息。
在本实施例中,上述执行主体可以将合并特征值输入至数据清理模型,从而得到合并清理路径信息。这里,得到合并清理路径信息的操作与得到第一清理路径信息的操作基本相同,在此不再赘述。
步骤312,向客户端发送合并清理路径信息,以使客户端基于合并清理路径信息再次进行数据清理。
在本实施例中,上述执行主体可以将合并清理路径信息发送给客户端。这样,客户端就可以根据合并清理路径信息进行数据清理。这里,客户端根据合并清理路径信息进行数据清理的操作与客户端根据第一清理路径信息进行数据清理的操作基本相同,在此不再赘述。
需要说明的是,在客户端基于合并清理路径信息再次进行数据清理之后,可以返回继续执行步骤305,以继续对数据清理模型进行优化,或者使客户端再次进行数据清理。如此循环往复,不断提高数据清理模型确定清理路径信息的精准度。
从图3中可以看出,与图2对应的实施例相比,本实施例中的用于推送信息的方法的流程300增加了步骤305-312。由此,本实施例描述的方案在达到清理效果的情况下,将第一特征值和第一清理路径信息作为训练样本对数据清理模型继续进行优化,以提高数据清理模型确定清理路径信息的精准度。在未达到清理效果的情况下,收集更多的行为数据重新确定清理路径信息,使客户端再次进行数据清理。如此循环往复,不断提高数据清理模型确定清理路径信息的精准度。
继续参考图4,其示出了根据本申请的用于清理数据的方法的一个实施例的流程400。该用于清理数据的方法应用于客户端,包括以下步骤:
步骤401,收集并上报用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据。
在本实施例中,用于清理数据的方法的执行主体(例如图1所示的设备101)可以收集用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据,并进行上报。其中,第一行为数据可以被直接上报至服务端(例如图1所示的设备102),也可以上报至SDK平台,由SDK平台发送至数据存储平台进行存储。这样,服务端可以通过与数据存储平台的接口或消息队列获取第一行为数据。需要说明的是,第一时间段和第一行为数据已在参照图2所示实施例中予以详述,在此不再赘述。
步骤402,响应于接收到服务端发送的基于第一行为数据确定的第一清理路径信息,对第一清理路径信息对应的第一清理路径中存储的数据进行清理。
在本实施例中,服务端可以基于第一行为数据确定的第一清理路径信息,并发送至上述执行主体。上述执行主体在接收到第一清理路径信息之后,可以对第一清理路径信息对应的第一清理路径中存储的数据进行清理。在一些实施例中,当第一清理路径信息仅包括应用的清理路径的情况下,客户端可以对第一清理路径信息所包括的应用的清理路径下存储的数据进行清理。在一些实施例中,在第一清理路径信息既包括应用的清理路径,又包括应用的清理置信度的情况下,客户端可以选取出清理置信度大于预设清理置信度阈值(例如60%)的应用,并对所选取出的应用的清理路径下存储的数据进行清理。
在一些实施例中,在进行数据清理之后,上述执行主体还可以生成数据清理信息,并发送至服务端。需要说明的是,数据清理信息已在参照图2所示实施例中予以详述,在此不再赘述。
本申请的上述实施例提供的用于清理数据的方法,首先收集并上报用户在第一时间段内使用客户端上安装的应用所产生的第一行为数据;然后在接收到服务端发送的基于第一行为数据确定的第一清理路径信息的情况下,对第一清理路径信息对应的第一清理路径下存储的数据进行清理。由服务端基于用户的行为数据确定清理路径,大大缩短了确定清理路径的时间,有助于提高数据清理效率。同时,也避免了现有技术中在扫描客户端上安装的应用的过程中用户需要经历长时间的等待而中断扫描,导致数据清理失败的情况的发生。
下面参考图5,其示出了适于用来实现本申请实施例的计算机设备(例如图1所示的设备101或者设备102)的计算机系统500的结构示意图。图5示出的计算机设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读介质或者是上述两者的任意组合。计算机可读介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,所述程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、确定单元、输入单元和发送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据的单元”。又例如,可以描述为:一种处理器包括上报单元和清理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,上报单元还可以被描述为“收集并上报用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的计算机设备中所包含的;也可以是单独存在,而未装配入该计算机设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该计算机设备执行时,使得该计算机设备:获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;基于第一行为数据确定第一特征值,其中,第一特征值用于表征应用的使用情况;将第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,数据清理模型用于确定清理路径信息;向客户端发送第一清理路径信息,以使客户端基于第一清理路径信息进行数据清理。或者使得该计算机设备:收集并上报用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;响应于接收到服务端发送的基于第一行为数据确定的第一清理路径信息,对第一清理路径信息对应的第一清理路径中存储的数据进行清理。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种用于确定数据的清理路径的方法,应用于服务端,包括:
获取用户在第一时间段内使用客户端上安装的应用所生成的第一行为数据;
基于所述第一行为数据确定第一特征值,其中,所述第一特征值用于表征所述应用的使用情况;
将所述第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,所述数据清理模型用于确定清理路径信息;
向所述客户端发送所述第一清理路径信息,以使所述客户端基于所述第一清理路径信息进行数据清理;
其中,所述方法还包括:
接收所述客户端基于所述第一清理路径信息进行数据清理后发送的数据清理信息;
基于所述数据清理信息确定清理比率;
若所述清理比率大于预设比率阈值,将所述第一特征值和所述第一清理路径信息作为训练样本对所述数据清理模型进行优化,得到优化后的数据清理模型。
2.根据权利要求1所述的方法,其中,所述方法还包括:
若所述清理比率小于或等于所述预设比率阈值,获取用户在第二时间段内使用所述应用所生成的第二行为数据;
将所述第一行为数据和所述第二行为数据合并,以及基于合并后的行为数据确定合并特征值;
将所述合并特征值输入到所述数据清理模型,得到合并清理路径信息;
向所述客户端发送所述合并清理路径信息,以使所述客户端基于所述合并清理路径信息再次进行数据清理。
3.根据权利要求1所述的方法,其中,所述第一行为数据包括所述应用的标识和使用时长。
4.根据权利要求1所述的方法,其中,所述第一特征值包括以下至少一项:所述应用的使用频率、所述应用的清理路径、所述应用产生数据的速度、所述应用产生数据的占用空间。
5.根据权利要求1所述的方法,其中,所述第一清理路径信息包括所述应用的清理路径,或者包括所述应用的清理置信度和清理路径。
6.根据权利要求1-5之一所述的方法,其中,所述数据清理模型通过如下步骤训练得到:
获取训练样本,其中,所述训练样本包括样本特征值和样本清理路径信息;
以所述样本特征值为自变量构造线性回归方程,其中,所述线性回归方程的每个自变量对应一个权重系数;
以所述线性方程为自变量构造逻辑回归函数;
将所述样本特征值作为输入,将所述样本清理路径信息作为输出,对所述逻辑回归函数进行训练,得到所述数据清理模型。
7.根据权利要求6所述的方法,其中,所述权重系数的数值是通过最大似然估计方法求解出的。
8.一种用于清理数据的方法,应用于客户端,包括:
收集并上报用户在第一时间段内使用所述客户端上安装的应用所生成的第一行为数据;
响应于接收到服务端发送的基于所述第一行为数据确定的第一清理路径信息,对所述第一清理路径信息对应的第一清理路径下存储的数据进行清理,其中,所述服务端基于所述第一行为数据确定第一特征值,其中,所述第一特征值用于表征所述应用的使用情况;将所述第一特征值输入至预设的数据清理模型,得到第一清理路径信息,其中,所述数据清理模型用于确定清理路径信息;
生成数据清理信息,并发送至所述服务端,其中,所述服务端基于所述数据清理信息确定清理比率;若所述清理比率大于预设比率阈值,将所述第一特征值和所述第一清理路径信息作为训练样本对所述数据清理模型进行优化,得到优化后的数据清理模型。
9.一种计算机设备,包括:
一个或多个处理器;
存储装置,其上存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法或者实现如权利要求8所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的方法或者实现如权利要求8所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811587961.1A CN109669779B (zh) | 2018-12-25 | 2018-12-25 | 用于确定数据的清理路径、清理数据的方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811587961.1A CN109669779B (zh) | 2018-12-25 | 2018-12-25 | 用于确定数据的清理路径、清理数据的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109669779A CN109669779A (zh) | 2019-04-23 |
CN109669779B true CN109669779B (zh) | 2023-05-26 |
Family
ID=66146062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811587961.1A Active CN109669779B (zh) | 2018-12-25 | 2018-12-25 | 用于确定数据的清理路径、清理数据的方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109669779B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112632051B (zh) * | 2020-12-25 | 2024-06-14 | 中国工商银行股份有限公司 | 基于神经网络的数据库清理方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646086B (zh) * | 2013-12-13 | 2017-01-25 | 北京奇虎科技有限公司 | 一种垃圾文件的清理方法和装置 |
CN105868367B (zh) * | 2016-03-30 | 2019-06-18 | 北京奇虎科技有限公司 | 一种清理安卓设备中的根路径的方法、服务器和系统 |
CN106202166B (zh) * | 2016-06-24 | 2020-08-18 | 北京奇虎技术服务有限公司 | 文件的清理方法、装置及相应的客户端 |
CN106201601B (zh) * | 2016-06-30 | 2019-11-26 | 北京奇虎科技有限公司 | 一种文件清理方法、电子设备及服务器 |
CN108337358B (zh) * | 2017-09-30 | 2020-01-14 | Oppo广东移动通信有限公司 | 应用清理方法、装置、存储介质及电子设备 |
CN108427737B (zh) * | 2018-02-28 | 2020-10-30 | 上海连尚网络科技有限公司 | 一种数据清理方法、设备及计算机可读介质 |
CN108932140A (zh) * | 2018-07-13 | 2018-12-04 | 重庆邮电大学 | 基于安卓用户行为习惯的清理后台应用程序的方法 |
-
2018
- 2018-12-25 CN CN201811587961.1A patent/CN109669779B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109669779A (zh) | 2019-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109460513B (zh) | 用于生成点击率预测模型的方法和装置 | |
CN109460514B (zh) | 用于推送信息的方法和装置 | |
CN109492772B (zh) | 生成信息的方法和装置 | |
CN105808652B (zh) | 在线客服的实现方法和装置 | |
CN111125574B (zh) | 用于生成信息的方法和装置 | |
CN108520470B (zh) | 用于生成用户属性信息的方法和装置 | |
CN110866040B (zh) | 用户画像生成方法、装置和系统 | |
CN111488517A (zh) | 用于训练点击率预估模型的方法和装置 | |
CN109669779B (zh) | 用于确定数据的清理路径、清理数据的方法和设备 | |
CN113793160B (zh) | 投放数据处理方法、装置、设备及存储介质 | |
CN109408716B (zh) | 用于推送信息的方法和设备 | |
CN111506643B (zh) | 用于生成信息的方法、装置和系统 | |
CN112783754B (zh) | 一种对页面进行测试的方法和装置 | |
CN113362097B (zh) | 一种用户确定方法和装置 | |
CN111949860B (zh) | 用于生成相关度确定模型的方法和装置 | |
CN110795424B (zh) | 特征工程变量数据请求处理方法、装置及电子设备 | |
US20230053859A1 (en) | Method and apparatus for outputting information | |
CN113762581A (zh) | 活动人数预测模型生成方法、装置、电子设备和介质 | |
WO2020078049A1 (zh) | 用户信息处理方法和装置、服务器及可读介质 | |
CN111131354A (zh) | 用于生成信息的方法和装置 | |
CN111753111A (zh) | 图片搜索方法和装置 | |
CN111125501A (zh) | 用于处理信息的方法和装置 | |
CN113282471B (zh) | 设备性能测试方法、装置、终端设备 | |
CN111125572B (zh) | 用于处理信息的方法和装置 | |
CN111475630B (zh) | 一种信息处理的方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |