CN115689626B - 一种终端设备的用户属性确定方法及电子设备 - Google Patents
一种终端设备的用户属性确定方法及电子设备 Download PDFInfo
- Publication number
- CN115689626B CN115689626B CN202211348747.7A CN202211348747A CN115689626B CN 115689626 B CN115689626 B CN 115689626B CN 202211348747 A CN202211348747 A CN 202211348747A CN 115689626 B CN115689626 B CN 115689626B
- Authority
- CN
- China
- Prior art keywords
- data
- model
- terminal device
- terminal equipment
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000013145 classification model Methods 0.000 claims abstract description 12
- 230000004913 activation Effects 0.000 claims description 40
- 230000015654 memory Effects 0.000 claims description 30
- 238000009434 installation Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000009795 derivation Methods 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 28
- 238000004891 communication Methods 0.000 description 24
- 238000013461 design Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 238000007726 management method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 238000010295 mobile communication Methods 0.000 description 13
- 230000003796 beauty Effects 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 6
- 230000002354 daily effect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052573 porcelain Inorganic materials 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Telephone Function (AREA)
Abstract
本申请实施例提供一种终端设备的用户属性确定方法及电子设备,涉及数据处理领域,能够根据终端设备的基础参数和使用数据确定终端设备的用户属性,且准确性较高。该方法包括:获取第一终端设备的第一数据。将第一终端设备的第一数据输入属性确定模型。属性确定模型为预先使用样本数据对预设模型训练生成。样本数据包括多个终端设备的第一数据以及用户属性。预设模型为分类模型。根据属性确定模型的输出结果确定第一终端设备的用户属性。
Description
技术领域
本申请实施例涉及数据处理领域,尤其涉及一种终端设备的用户属性确定方法及电子设备。
背景技术
随着终端设备的普及,对终端设备的用户属性的研究也越来越多。终端设备的用户属性包括该终端设备的用户性别,用户年龄,兴趣偏好,消费偏好等。可以理解,终端设备的用户属性在统计该类终端设备的用户分布,精准营销等方面具有很高的价值。例如,某产品提供商,其产品的主要营销目标为某品牌终端设备的用户中的女性群体。如果该产品提供商可以先通过该品牌终端设备的用户属性圈定目标群体,则可以大大减小营销成本。
终端设备的用户属性可以由用户自行输入保存于终端设备中,以便于产品提供商在经过用户同意后获取使用。然而,并非所有用户都会将用户属性输入到终端设备中,使得很多终端设备中没有存储用户属性,产品提供商也无法获取到这部分终端设备的用户属性。
因此,如何确定终端设备的用户属性成为亟待解决的问题。
发明内容
本申请实施例提供一种终端设备的用户属性确定方法及电子设备,能够根据终端设备的基础参数和使用数据确定终端设备的用户属性,且准确性较高。
为了达到上述目的,本申请实施例采用如下技术方案。
第一方面,提供一种终端设备的用户属性确定方法,用于根据第一终端设备的第一数据确定第一终端设备的用户属性。第一数据包括对应的终端设备的基础参数以及对应的终端设备被激活且被使用后产生的使用数据。用户属性至少包括以下一种:用户性别,用户年龄段。方法包括:获取第一终端设备的第一数据。将第一终端设备的第一数据输入属性确定模型。属性确定模型为预先使用样本数据对预设模型训练生成。样本数据包括多个终端设备的第一数据以及用户属性。预设模型为分类模型。根据属性确定模型的输出结果确定第一终端设备的用户属性。
基于该方案,通过使用样本数据训练出的机器学习模型,实现了在终端设备中不包括用户属性的情况下,仍然能够根据终端设备的基础参数和使用数据确定出终端设备的用户属性,且具有较高的准确性。
在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型之前,方法还包括:分别对第一终端设备的第一数据中的基础参数进行特征衍生,对第一终端设备的第一数据中的使用数据进行聚类,得到第一终端设备的特征数据。将第一终端设备的第一数据输入属性确定模型,包括:将第一终端设备的特征数据输入属性确定模型。样本数据包括多个终端设备的特征数据以及用户属性。终端设备的特征数据通过对各终端设备的第一数据中的基础参数进行特征衍生,对各终端设备的第一数据中的使用数据进行聚类得到。基于该方案,对第一数据进行特征衍生和特征提取生成更具有代表性的特征数据,可以有效提高确定出的用户属性的准确性。
在一种可能的设计中,第一数据还包括对应的终端设备的激活时长。获取第一终端设备的第一数据之前,方法还包括:获取样本数据。获取样本数据中的第一样本。第一样本对应的各终端设备的激活时长大于第一时长。使用第一样本对预设模型中的第一模型进行训练,生成属性确定模型中的第二模型。第一模型为树模型分类器或线性分类模型。基于该方案,在模型训练阶段,可以采用对样本数据中的第一样本进行训练。在模型使用阶段,在第一终端设备激活时长与第一样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第一样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型,包括:在第一终端设备的激活时长大于第一时长时,将第一终端设备的特征数据输入第二模型。根据属性确定模型的输出结果确定第一终端设备的用户属性,包括:根据第二模型的输出结果确定第一终端设备的用户属性。基于该方案,在模型训练阶段,可以采用对样本数据中的第一样本进行训练。在模型使用阶段,在第一终端设备激活时长与第一样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第一样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
在一种可能的设计中,获取样本数据之后,方法还包括。获取样本数据中的第二样本。第二样本对应的各终端设备的激活时长小于或等于第一时长。将第二样本输入树模型分类器进行多次迭代,得到树模型分类器中各个弱分类器的叶子节点数据。叶子节点数据为第二样本中各特征数据的特征组合。对各叶子节点数据进行一位有效编码,得到编码数据。将编码数据与第二样本中的各特征数据进行合并,得到第三样本。使用第三样本对预设模型中的第三模型进行训练,生成属性确定模型中的第四模型。第四模型为线性分类模型。基于该方案,在模型训练阶段,可以采用对样本数据中的第二样本进行训练。在模型使用阶段,在第一终端设备激活时长与第二样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第二样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
在一种可能的设计中,将第一终端设备的第一数据输入属性确定模型,包括:在第一终端设备的激活时长小于或等于第一时长时,将第一终端设备的特征数据输入树模型分类器,得到特征分类结果。对特征分类结果进行一位有效编码,得到特征编码结果。将特征编码结果与第一终端设备的特征数据合并,得到特征合并结果。以第三样本中编码数据的顺序以及特征数据的顺序为参考,对特征合并结果进行特征对齐,得到特征对齐结果。将特征对齐结果输入第四模型。根据属性确定模型的输出结果确定第一终端设备的用户属性,包括:根据第四模型的输出结果确定第一终端设备的用户属性。基于该方案,在模型训练阶段,可以采用对样本数据中的第二样本进行训练。在模型使用阶段,在第一终端设备激活时长与第二样本对应的终端设备的激活时长相同时,将第一终端设备的特征数据输入经过第二样本训练的模型中,以得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
在一种可能的设计中,树模型分类器为梯度提升决策树。
在一种可能的设计中,在第一终端设备的第一数据中的基础参数包括终端设备每天被使用的时间段时,对第一终端设备的第一数据中的基础参数进行特征衍生,包括:根据终端设备每天被使用的时间段确定终端设备每天被使用的最早时间和最晚时间。
在一种可能的设计中,在第一终端设备的第一数据中的使用数据包括应用安装信息时,对第一终端设备的第一数据中的使用数据进行聚类,包括:对应用市场中安装数量大于第一阈值的应用进行分类,得到多个应用类别。根据应用安装信息确定第一终端设备所包括的应用类别。
在一种可能的设计中,终端设备的基础参数至少包括以下一种:颜色,型号,系统版本。
在一种可能的设计中,终端设备的使用数据至少包括以下一种:应用安装信息,应用使用信息,使用时间段,相机使用频率,相机设置参数,系统设置参数。
第二方面,提供一种电子设备,电子设备包括一个或多个处理器和一个或多个存储器。一个或多个存储器与一个或多个处理器耦合,一个或多个存储器存储有计算机指令。当一个或多个处理器执行计算机指令时,使得电子设备执行如第一方面中任一项的终端设备的用户属性确定方法。
第三方面,提供一种计算机可读存储介质,计算机可读存储介质包括计算机指令,当计算机指令运行时,执行如第一方面中任一项的终端设备的用户属性确定方法。
第四方面,提供一种计算机程序产品,计算机程序产品中包括指令,当计算机程序产品在计算机上运行时,使得计算机可以根据指令执行如第一方面中任一项的终端设备的用户属性确定方法。
第五方面,提供一种芯片系统,芯片包括处理电路和接口。处理电路用于从存储介质中调用并运行存储介质中存储的计算机程序,以执行如第二方面中任一项的终端设备的用户属性确定方法。
应当理解的是,上述第二方面,第三方面,第四方面以及第五方面提供的技术方案,其技术特征均可对应到第一方面及其可能的设计中提供的终端设备的用户属性确定方法,因此能够达到的有益效果类似,此处不再赘述。
附图说明
图1为本申请实施例提供的一种终端设备的结构示意图;
图2为本申请实施例提供的一种终端设备的用户属性确定方法的流程图;
图3为本申请实施例提供的一种模型训练方法的流程图;
图4为本申请实施例提供的又一种模型训练方法的流程图;
图5为本申请实施例提供的又一种终端设备的用户属性确定方法的流程图;
图6为本申请实施例提供的又一种模型训练方法的流程图;
图7为本申请实施例提供的一种树模型分类器的示意图;
图8为本申请实施例提供的又一种终端设备的用户属性确定方法的流程图;
图9为本申请实施例提供的一种电子设备的组成示意图;
图10为本申请实施例提供的一种芯片系统的组成示意图。
具体实施方式
本申请实施例中的“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于限定特定顺序。此外,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
为了便于理解本申请实施例,以下首先对本申请实施例的背景技术予以介绍。
需要说明,在本申请实施例中,使用用户属性来统称该终端设备的用户的性别,年龄段,兴趣偏好,消费偏好等。在一些其他的实施例中,也可以将用户属性称作用户画像中的标签,后续不做赘述。
容易理解,用户属性在统计终端设备的用户分布,产品营销等方面具有很高的价值。例如,终端设备的用户性别分布可以为厂商确定后续的营销策略偏向男性还是女性提供非常重要的参考,终端产品的用户年龄段分布可以为厂商确定后续的营销策略偏向年轻人还是中年人提供重要的参考。
部分终端设备的用户会将用户性别,年龄段等信息自行输入终端设备。如此,产品提供商即可在用户同意的前提下便捷地得到用户属性。然而,更多的用户出于隐私,数据安全等角度的考量,不会将用户属性输入终端设备。如此,产品提供商便没有途径获取终端设备的用户属性,导致很多业务场景无法展开。
为了解决上述问题,本申请实施例提供了一种终端设备的用户属性确定方法,能够根据终端设备的基础参数和使用数据确定终端设备的用户属性,且准确性较高。
其中,终端设备的基础参数至少包括以下一种:颜色,型号,系统版本。需要说明,终端设备的基础参数在出厂时即已存储于终端设备中。换句话说,在终端设备被激活之前,终端设备中即已经存储有颜色,型号,系统版本等信息。
在本申请实施例中,终端设备的颜色可以是指其厂商的命名,如某品牌手机的颜色可以包括亮黑,釉白,瓷青,流金等。终端设备的型号也可以是指厂商的命名,如品牌名+X40,品牌名+X50等。终端设备的系统版本可以是指终端设备中所安装的操作系统的版本,如的版本号、/>的版本号,厂商提供的第三方操作系统的版本号等。需要说明的是,以上均只是示例性地说明,并不代表本申请局限于此。
终端设备的使用数据至少包括以下一种:应用安装信息,应用使用信息,使用时间段,相机使用频率,相机设置参数,系统设置参数。需要说明,终端设备的使用数据是指终端设备被激活且被使用后产生的数据。
其中,应用安装信息可以包括终端设备中安装的应用数量,应用名称等。应用使用信息可以包括应用使用次数,应用使用时长等。使用时间段可以是指终端设备被使用的时间段。相机使用频率可以是指终端设备的相机运行的频率。相机设置参数可以包括焦距参数,快门参数,光圈参数,感光度参数等。系统设置参数可以包括屏幕刷新率,壁纸,字体等。应当理解,以上对使用数据的说明也只是示例性说明,并不代表本申请局限于此。
本申请用于确定终端设备的用户属性,终端设备可以是便携式终端,诸如手机、平板电脑、可穿戴设备(如智能手表)、车载设备等。便携式终端的示例性实施例包括但不限于搭载或者其它操作系统的便携式终端。上述便携式终端也可以是诸如具有触敏表面(例如触控面板)的膝上型计算机(Laptop)等。作为一种示例,请参考图1,为本申请实施例提供的一种终端设备的结构示意图。本申请实施例提供的终端设备的用户属性确定方法均可应用于如图1所示的终端设备100中。
如图1所示,该终端设备100可以包括处理器101,显示屏103,通信模块102等。
其中,处理器101可以包括一个或多个处理单元,例如:处理器101可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频流编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器101中。
控制器可以是终端设备100的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
处理器101中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器101中的存储器为高速缓冲存储器。该存储器可以保存处理器101刚用过或循环使用的指令或数据。如果处理器101需要再次使用该指令或数据,可从所述存储器中直接调用。避免了重复存取,减少了处理器101的等待时间,因而提高了系统的效率。
在一些实施例中,处理器101可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口111等。
终端设备100通过GPU,显示屏103,以及应用处理器等实现显示功能。GPU为图像处理的微处理器,连接显示屏103和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器101可包括一个或多个GPU,其执行程序指令以生成或改变显示信息。
显示屏103用于显示图像,视频流等。
通信模块102可以包括天线1,天线2,移动通信模块102A,和/或无线通信模块102B。以通信模块102同时包括天线1,天线2,移动通信模块102A和无线通信模块102B为例。
终端设备100的无线通信功能可以通过天线1,天线2,移动通信模块102A,无线通信模块102B,调制解调处理器以及基带处理器等实现。
天线1和天线2用于发射和接收电磁波信号。终端设备100中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块102A可以提供应用在终端设备100上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块102A可以包括至少一个滤波器,开关,功率放大器,低噪声放大器(low noise amplifier,LNA)等。移动通信模块102A可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块102A还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块102A的至少部分功能模块可以被设置于处理器101中。在一些实施例中,移动通信模块102A的至少部分功能模块可以与处理器101的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器106A,受话器106B等)输出声音信号,或通过显示屏103显示图像或视频流。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器101,与移动通信模块102A或其他功能模块设置在同一个器件中。
无线通信模块102B可以提供应用在终端设备100上的包括无线局域网(wirelesslocal area networks,WLAN)(如无线保真(wireless fidelity,Wi-Fi)网络),蓝牙(bluetooth,BT),全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),近距离无线通信技术(near field communication,NFC),红外技术(infrared,IR)等无线通信的解决方案。无线通信模块102B可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块102B经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器101。无线通信模块102B还可以从处理器101接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端设备100的天线1和移动通信模块102A耦合,天线2和无线通信模块102B耦合,使得终端设备100可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,GSM),通用分组无线服务(general packet radio service,GPRS),码分多址接入(codedivision multiple access,CDMA),宽带码分多址(wideband code division multipleaccess,WCDMA),时分码分多址(time-division code division multiple access,TD-SCDMA),长期演进(long term evolution,LTE),BT,GNSS,WLAN,NFC,FM,和/或IR技术等。所述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
如图1所示,在一些实现方式中,该终端设备100还可以包括外部存储器接口110,内部存储器104,通用串行总线(universal serial bus,USB)接口,充电管理模块112,电源管理模块113,电池114,音频模块106,扬声器106A,受话器106B,麦克风106C,耳机接口106D,传感器模块105,按键109,马达,指示器108,摄像头107,以及用户标识模块(subscriber identification module,SIM)卡接口等。
充电管理模块112用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块112可以通过USB接口111接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块112可以通过终端设备100的无线充电线圈接收无线充电输入。充电管理模块112为电池114充电的同时,还可以通过电源管理模块113为终端设备100供电。
电源管理模块113用于连接电池114,充电管理模块112与处理器101。电源管理模块113接收电池114和/或充电管理模块112的输入,为处理器101,内部存储器104,外部存储器,显示屏103,摄像头107,和无线通信模块102B等供电。电源管理模块113还可以用于监测电池114容量,电池114循环次数,电池114健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块113也可以设置于处理器101中。在另一些实施例中,电源管理模块113和充电管理模块112也可以设置于同一个器件中。
外部存储器接口110可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端设备100的存储能力。外部存储卡通过外部存储器接口110与处理器101通信,实现数据存储功能。例如将音乐,视频流等文件保存在外部存储卡中。
内部存储器104可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。处理器101通过运行存储在内部存储器104的指令,从而执行终端设备100的各种功能应用以及数据处理。
内部存储器104还可以存储本申请实施例提供的终端设备的用户属性确定方法对应的一个或多个计算机程序。
终端设备100可以通过音频模块106,扬声器106A,受话器106B,麦克风106C,耳机接口106D,以及应用处理器101等实现音频功能。例如音乐播放,录音等。
按键109包括开机键,音量键等。按键109可以是机械按键109。也可以是触摸式按键109。终端设备100可以接收按键109输入,产生与终端设备100的用户设置以及功能控制有关的键信号输入。
指示器108可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口用于连接SIM卡。SIM卡可以通过插入SIM卡接口,或从SIM卡接口拔出,实现和终端设备100的接触和分离。终端设备100可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口也可以兼容不同类型的SIM卡。SIM卡接口也可以兼容外部存储卡。终端设备100通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端设备100采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端设备100中,不能和终端设备100分离。
终端设备100中的传感器模块105可以包括触摸传感器、压力传感器、陀螺仪传感器、气压传感器、磁传感器、加速度传感器、距离传感器、接近光传感器、环境光传感器、指纹传感器、温度传感器、骨传导传感器等部件,以实现对于不同信号的感应和/或获取功能。
可以理解的是,本实施例示意的结构并不构成对终端设备100的具体限定。在另一些实施例中,终端设备100可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件,软件或软件和硬件的组合实现。
以上通过图1介绍了本申请实施例提供的终端设备的硬件结构。下面对本申请实施例提供的终端设备的用户属性确定方法进行具体介绍。
需要说明,该终端设备的用户属性确定方法用于根据第一终端设备的第一数据确定第一终端设备的用户属性。第一数据包括对应的终端设备的基础参数以及对应的终端设备被激活且被使用后产生的使用数据。用户属性至少包括以下一种:用户性别,用户年龄段。
请参考图2,为本申请实施例提供的一种终端设备的用户属性确定方法的流程图。如图2所示,该方法包括S201-S203。
S201、获取第一终端设备的第一数据。
如上所述,终端设备的基础参数至少包括以下一种:颜色,型号,系统版本。终端设备的使用数据至少包括以下一种:应用安装信息,应用使用信息,使用时间段,相机使用频率,相机设置参数,系统设置参数。此处不再赘述。
需要说明,本申请实施例中所提及的获取数据都是在经过用户同意的前提下进行的,后续不再对此问题进行赘述。
S202、将第一终端设备的第一数据输入属性确定模型。其中,属性确定模型为预先使用样本数据对预设模型训练生成。样本数据包括多个终端设备的第一数据以及用户属性。预设模型为分类模型。
S203、根据属性确定模型的输出结果确定第一终端设备的用户属性。
换句话说,本申请实施例会预先使用样本数据对预设模型进行训练,得到属性确定模型。再将第一终端设备的第一数据输入属性确定模型以得到第一终端设备的用户属性。
在一些实施例中,预设模型可以为线性分类模型,即决策边界为线性边界的分类模型。在另一些实施例中,预设模型也可以为树模型分类器,如GBDT(Gradient BoostingDecison Tree,梯度提升决策树)。
在本申请实施例中,使用样本数据对预设模型训练的过程可以包括超参选择和离线评估。下面具体说明。
请参考图3,为本申请实施例提供的一种模型训练方法的流程图。如图3所示,该模型训练方法可以包括S301-S306。
S301、将样本数据分为训练集和测试集。
其中,训练集可以包括一部分终端设备的第一数据和用户属性,测试集可以包括另一部分终端设备的第一数据和用户属性。本申请实施例对划分训练集和测试集的方法不做限定。
S302、选择一组新的超参数在训练集上训练预设模型。
超参数是指,在开始训练预设模型之前人工设置的参数。需要说明的是,本申请实施例提供的模型训练方法在训练过程中会不断优化超参数组合,以得到在训练集上表现最好的超参数组合。
S303、将测试集输入训练后的预设模型,得到测试结果。
S304、在离线环境下对测试结果进行评估,得到评估结果。
其中,评估指标可以为准确度,平均绝对误差等,在此不做限定。
S305、判断迭代次数是否满足预设次数。若是,执行S306;若否,执行S301。
在本示例中,执行一次S301-S304可以称作迭代一次。也就是说,迭代次数可以是指执行S301-S304的次数。预设次数和预设条件可以预先输入。示例性地,预设次数可以为一百,三百等,预设条件可以为准确度大于百分之七十等,本申请对此不作限定。
需要说明的是,在本申请实施例中,判断条件也可以是其它条件,此处只是示例性说明,并不代表本申请局限于此。
S306、将最优评估结果对应的一组超参数应用于预设模型,得到属性确定模型。
以上为本申请实施例提供的一种使用样本数据对预设模型训练的过程。后续实施例中对模型训练包括超参选择和离线评估时,其过程可以参考上述S301-S306。
基于以上说明可以看出,本申请实施例提供的终端设备的用户属性确定方法,通过使用样本数据训练出的机器学习模型,实现了在终端设备中不包括用户属性的情况下,仍然能够根据终端设备的基础参数和使用数据确定出终端设备的用户属性,且具有较高的准确性。
为减小数据处理的压力以及数据处理的效率,本申请实施例提供的终端设备的用户属性确定方法在模型训练阶段,可以采用对第一数据处理后的特征数据进行训练。在模型使用阶段,可以对第一终端设备的第一数据进行特征提取得到第一终端设备的特征数据,再将第一终端设备的特征数据输入模型得到第一终端设备的用户属性。如此,可以提高确定用户属性的准确率以及效率。
其中,特征提取可以包括特征衍生与聚类,下面分别说明。
为便于理解,下述说明中,本申请实施例提供的终端设备的用户属性确定方法所要确定的用户属性为用户性别。终端设备为手机。第一终端设备的第一数据中的基础参数包括终端设备每天被使用的时间段。
首先对特征衍生进行说明。特征衍生也可以称作特征构建,是指从原始数据中构建新的特征。在本申请实施例中,对第一终端设备的第一数据的基础参数进行特征提取或对样本数据中各第一数据的基础参数进行特征提取的过程均可以是指特征衍生。为避免赘述,后续说明中将第一终端设备的第一数据的基础参数称作第一终端设备的基础参数。
例如,第一终端设备的基础参数包括终端设备每天被使用的时间段。该基础参数与该终端设备的用户是男性还是女性关系并不大。换句话说,终端设备每天被使用的时间段和终端设备的用户性别之间的相关性很小。而终端设备每天被使用的最早时间和最晚时间与终端设备的用户性别具有一定的相关性。因此,可以对“终端设备每天被使用的时间段”进行特征衍生,得到“终端设备每天被使用的最早时间和最晚时间”。当然,这里只是一种示例,并不代表本申请局限于此。
下面对聚类进行说明。聚类是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。在本申请实施例中,对第一终端设备的第一数据中的使用数据进行特征提取或对样本数据中各第一数据的使用数据进行特征提取均可以是指聚类。为避免赘述,后续说明中将第一终端设备的第一数据中的使用数据称作第一终端设备的使用数据。
示例性地,第一终端设备的使用数据包括应用安装信息。应用安装信息可以包括终端设备中安装的应用数量,应用名称等。可以理解,应用市场的应用数量非常多,若直接使用应用安装信息对模型进行训练或输入训练好的模型,数据处理量可能会较大。因此,本申请实施例提供的终端设备的用户属性确定方法,可以预先对应用市场中安装数量大于第一阈值的应用进行分类,得到多个应用类别。再根据应用安装信息确定第一终端设备所包括的应用类别,各应用类别下的应用安装数量,应用使用次数,应用使用时长等。如此,即可将应用安装信息聚类为不同应用类别的信息,大大减小了数据处理量和处理复杂度。
在本申请实施例中,训练模型时,还可以根据终端设备的激活时长选择不同的训练策略。例如,激活时长较长的终端设备,其第一数据或特征数据的数据量较大,因此可以采用复杂度以及算力需求较小的策略进行模型训练。而激活时长较短的终端设备,其第一数据或特征数据的数据量较小,因此可以采用复杂度及算力需求较大的策略进行模型训练。
在本申请实施例中,激活时长较长的终端设备可以是指激活时间大于14天的终端设备。激活时长较短的终端设备可以是指激活时间小于14天的终端设备。
下面示例性说明训练模型时对激活时长较长的终端设备的第一数据所采用的训练策略。应当理解,该训练模型的过程在上述S201之前进行。
请参考图4,为本申请实施例提供的又一种模型训练方法的流程图。如图4所示,该方法包括S401-S403。
S401、获取样本数据。
其中,样本数据包括多个终端设备的第一数据以及用户属性。如上所述,本申请实施例可以对各终端设备的第一数据进行特征提取,得到各终端设备的特征数据,以减小数据处理量,提高数据处理效率。
因此,在一种可能的设计中,样本数据还可以包括多个终端设备的特征数据以及用户属性。其中特征数据即对终端设备的第一数据进行特征提取后生成的数据。
另外,在本申请实施例中,样本数据中,激活时长较长的终端设备的第一数据,其时间尺度可以为获取时间点之前的60天至90天。激活时长较短的终端设备的第一数据,其时间尺寸可以为获取时间点之前的7天至14天。如此,有利于提高获取到的第一数据的可靠性。
S402、获取样本数据中的第一样本。第一样本对应的各终端设备的激活时长大于第一时长。
也就是说,可以通过判断样本数据中各第一数据对应的终端设备的激活时长是否大于第一时长,从样本数据中得到第一样本。
可以理解,第一样本中包括激活时间较长的终端设备的特征数据以及用户属性。
S403、使用第一样本对预设模型中的第一模型进行训练,生成属性确定模型中的第二模型。其中,第一模型为树模型分类器或线性分类模型。
也就是说,本申请实施例中的预设模型中可以包括多个模型,第一模型为其中之一。属性确定模型也可以包括多个模型,第二模型为其中之一。使用第一样本对第一模型进行训练的过程可以参考上述S301-S306,此处不做赘述。
需要说明的是,由于第一样本对应激活时长较长的终端设备,这一部分终端设备的特征数据具有数据量大,数据分布稳定的特点。因此,可以采用hive+MMLSpark架构对第一模型进行训练,以兼顾模型训练的算力需求,效率,资源消耗以及耗时。
在上述S401-S403的基础上,对第一终端设备的第一数据的处理过程可以如图5所示。请参考图5,为本申请实施例提供的又一种终端设备的用户属性确定方法的流程图。如图5所示,该方法包括S501-S503。
S501、对第一终端设备的第一数据进行特征提取,得到第一终端设备的特征数据。
对特征提取的说明可参见前述实施例,此处不做赘述。
S502、在第一终端设备的激活时长大于第一时长时,将第一终端设备的特征数据输入第二模型。
也就是说,第一终端设备的激活时长大于第一时长时,采用通过激活时长大于第一时长的终端设备的特征数据所训练出的第二模型处理第一终端设备的特征数据。如此,有利于提高所确定的用户属性的准确率。
S503、根据第二模型的输出结果确定第一终端设备的用户属性。
如此,即可得到第一终端设备的用户属性。
以上即为对激活时长较长的终端设备的第一数据所采用的训练策略的示例性说明。下面再示例性说明对激活时长较长的终端设备的第一数据所采用的训练策略。应当理解,该训练模型的过程同样在上述S201之前进行。
请参考图6,为本申请实施例提供的又一种模型训练方法的流程图。如图6所示,该方法包括S601-S606。
S601、获取样本数据。
对样本数据的说明可以参见上述S401,此处不再做赘述。
S602、获取样本数据中的第二样本。第二样本对应的各终端设备的激活时长小于或等于第一时长。
也就是说,可以通过判断样本数据中各第一数据对应的终端设备的激活时长是否小于或等于第一时长,从样本数据中得到第二样本。
可以理解,第二样本中包括激活时间较短的终端设备的特征数据以及用户属性。
S603、将第二样本输入树模型分类器进行多次迭代,得到树模型分类器中各个弱分类器的叶子节点数据。叶子节点数据为第二样本中各特征数据的特征组合。
树模型分类器是一种需要通过多级判别确定数据所属类别的分类模型。在一种可能的设计中,树模型分类器为GBDT,即梯度提升决策树。
请参考图7,为本申请实施例提供的一种树模型分类器的示意图。如图7所示,该树模型分类器包括m棵树,每棵树包括n个叶子。其中,每个虚线框即代表1棵树的结构。除最后一行的圆圈外,其它不同的圆圈代表不同的特征判别条件。最后一行,即Leaf1_1至Leafm_n的圆圈代表叶子节点数据。
第二样本输入树模型分类器的数据入口后,该树模型分类器首先会将第二样本中的各特征数据分类至对应的树上,再根据对应树中的特征判别条件,逐级对特征数据中的各项特征进行组合,最终得到叶子节点数据。
以特征数据中包括终端设备的使用时间段,应用使用信息为例,图7中的tree1的根节点,即判别条件1可以为是否使用出行导航类应用,若是,则落在判别条件2上。若否,则落在判别条件3上。判别条件2可以为是否使用音乐应用,若是,落在Leaf1_1上,若否,落在Leaf1_2上。判别条件3可以是是否使用相机应用,若是,落在判别条件4上,若否,不做处理,即不输出分类结果。判别条件4可以是使用相机应用时设置的美颜等级,若较高,落在Leaf1_3,若否,不做处理,即不输出分类结果。
若某一终端设备的特征数据输入树模型分类器后,最终输出Leaf1_3,则说明用户未使用出行导航类应用,使用了相机应用,且使用相机应用时设置的美颜等级较高。
可以看出,将特征数据输入树模型分类器后得到的叶子节点数据是特征数据中各类不同特征的组合。也就是说,树模型分类器可以用于对特征数据中的各不同特征进行特征组合。如此,有利于提高模型训练效率。
应当理解,在本申请实施例中,若第二样本中包括p条训练数据,对具有m棵树,每棵树n个叶子的树模型分类器进行训练,可以得到每条训练数据落在每棵树的哪个叶子节点数据上,由此可以得到的p*m个叶子节点数据。
需要说明的是,此处的叶子节点数据仅用于指示第几棵树的第几个叶子数据,其中并不包括实际的特征,因此需要进一步对该叶子节点数据编码后才能使用其对预设模型进行训练。
示例性地,得到的叶子节点数据可以构成一个p*m的矩阵如下:
S604、对各叶子节点数据进行一位有效编码,得到编码数据。
其中,一位有效编码也可以称作one-hot编码,是指用N位状态寄存器对N个状态进行编码,每各状态都有其独立的寄存器位,并且在任意时候,其中只有一位有效。
沿用上述举例,输出的叶子节点数据为Leaf1_3,即该终端设备的用户未使用出行导航类应用,使用了相机应用,且使用相机应用时设置的美颜等级较高。
其中终端设备的用户是否使用出行导航类应用有是和否两种取值。是否使用了相机应用有是和否两种取值,使用相机应用时设置的美颜等级有低,较高,高三种取值。下面示例性说明one-hot编码过程。
对于使用期间是否使用出行导航类应用,用10代表是,01代表否。对于是否使用了相机应用,用10代表是,01代表否。对于使用相机应用时设置的美颜等级,用100代表低,010代表较高,001代表高。则叶子节点数据Leaf1_3经过one-hot编码后可以为0110010。从最高位至最低位的顺序,01代表未使用出行导航类应用,10代表使用了相机应用,010代表设置的美颜等级较高。
当然,也可以采用其它取值进行one-hot编码,以上只是示例性说明,并不代表本申请局限于此。
示例性地,one-hot编码的过程还可以为,特征数据输入树模型分类器后落在某一棵树的叶子节点数据之后,如第一棵树的f00叶子节点数据,可以建立一个代表该棵树的n个叶子的n维向量。将该向量中f00维设置为1,除f00维之外全部设置为0。如此,若第二样本中包括p条训练数据,对具有m棵树,每棵树n个叶子的树模型分类器进行训练,则每条训练数据对应的叶子节点数据,其特征维数为m*n。
对各叶子节点数据进行编码后,即可得到编码数据。可以理解,该编码数据相比于第二样本的特征数据进行全量排列组合之后的数据,数据量会小很多。如此,有利于提高数据的处理效率。
S605、将编码数据与第二样本中的各特征数据进行合并,得到第三样本。
如此,可以进一步提高样本数据的维度,有利于提高模型的训练效率。
S606、使用第三样本对预设模型中的第三模型进行训练,生成属性确定模型中的第四模型。第四模型为线性分类模型。
也就是说,本申请实施例中的预设模型中可以包括多个模型,第三模型为其中之一。属性确定模型也可以包括多个模型,第四模型为其中之一。使用第三样本对第三模型进行训练的过程可以参考上述S301-S306,此处不做赘述。
需要说明的是,由于第二样本对应激活时长较短的终端设备,这一部分终端设备的特征数据具有数据量小,数据分布随使用时间变化较大的特点。因此,可以采用hive分块转化数据结构+python架构,对通过树模型分类器进行特征交叉,将交叉后的新特征(即叶子节点数据)进行one-hot编码后,转换成新的特征(即编码数据)。将编码数据和原始特征(即第二样本中的各特征数据)合并后,构造出新训练特征(即第三样本),再训练第三模型。如此,可以提高模型训练的效率以及模型的准确率。
以上即为对激活时长较短的终端设备的第一数据所采用的训练策略的示例性说明。
在上述S601-S606的基础上,对第一终端设备的第一数据的处理过程可以如图8所示。请参考图8,为本申请实施例提供的又一种终端设备的用户属性确定方法的流程图。如图8所示,该方法包括S801-S807。
S801、对第一终端设备的第一数据进行特征提取,得到第一终端设备的特征数据。
对特征提取的说明可参见前述实施例,此处不做赘述。
S802、在第一终端设备的激活时长小于或等于第一时长时,将第一终端设备的特征数据输入树模型分类器,得到特征分类结果。
树模型分类器的工作原理可以参见前述实施例,在此不再做赘述。需要说明的是,此处的特征分类结果即为前述叶子节点数据。
S803、对特征分类结果进行一位有效编码,得到特征编码结果。
对一位有效编码的说明可以参见前述实施例,此处不再赘述。
S804、将特征编码结果与第一终端设备的特征数据合并,得到特征合并结果。
S805、以第三样本中编码数据的顺序以及特征数据的顺序为参考,对特征合并结果进行特征对齐,得到特征对齐结果。
由于样本数据的数据量有限,第一终端设备的特征数据中可能会包括样本数据中没有的特征。因此,再将特征合并结果输入第四模型之前,可以先以第三样本中编码数据的顺序以及特征数据的顺序为参考,对特征合并结果进行特征对齐。
其中,可以将特征合并结果中,未在第二样本的编码数据和特征数据中出现的特征删除,与第二样本的编码数据和特征数据相比缺失的特征补0,从而完成特征对齐的过程。
S806、将特征对齐结果输入第四模型。
在本申请实施例中,特征对齐结果通常情况下是高维稀疏特征,因此输入第四模型时可以加入正则项对特征进行拟合。其中,各正则项可以为使用第二样本对第三模型进行训练时生成的各项高维稀疏特征对应的权重,此处不做具体限定。
S807、根据第四模型的输出结果确定第一终端设备的用户属性。
如此,即可得到第一终端设备的用户属性。
在一些其它的实施例中,上述使用样本数据对预设模型进行训练的过程和使用属性确定模型对第一终端设备的用户属性进行确定的过程可以同时进行。示例性地,接收到全量数据包后,可以从全量数据包中分离出样本数据和待确定用户属性的数据;使用样本数据训练的模型对待确定用户属性的数据进行处理,从而提高数据处理的效率。
本申请实施例提供的终端设备的用户属性确定方法,通过使用样本数据训练出的机器学习模型,实现了在终端设备中不包括用户属性的情况下,仍然能够根据终端设备的基础参数和使用数据确定出终端设备的用户属性,且具有较高的准确性。
请参考图9,为本申请实施例提供的一种电子设备900的组成示意图。该电子设备900可以为上述示例中的任一种电子设备,例如,该电子设备900可以为手机、电脑等。示例性的,如图9所示,该电子设备900可以包括:处理器901和存储器902。该存储器902用于存储计算机执行指令。示例性的,在一些实施例中,当该处理器901执行该存储器902存储的指令时,可以使得该电子设备900执行上述实施例中电子设备的任一种功能,以实现以上示例中的任一种终端设备的用户属性确定方法。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
图10示出了的一种芯片系统1000的组成示意图。该芯片系统1000可以设置于电子设备中。例如该芯片系统1000可以设置于手机中。示例性的,该芯片系统1000可以包括:处理器1001和通信接口1002,用于支持电子设备实现上述实施例中所涉及的功能。在一种可能的设计中,芯片系统1000还包括存储器,用于保存电子设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包含芯片和其他分立器件。需要说明的是,在本申请的一些实现方式中,该通信接口1002也可称为接口电路。
需要说明的是,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。
本申请实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在终端设备上运行时,使得终端设备执行上述相关方法步骤实现上述实施例中的方法。
本申请实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的方法。
另外,本申请的实施例还提供一种装置,这个装置具体可以是芯片,组件或模块,该装置可包括相连的处理器和存储器;其中,存储器用于存储计算机执行指令,当装置运行时,处理器可执行存储器存储的计算机执行指令,以使芯片执行上述各方法实施例中的方法。
其中,本申请实施例提供的终端设备、计算机存储介质、计算机程序产品或芯片均用于执行上文所提供的对应的方法,因此,其所能达到的有益效果可参考上文所提供的对应的方法中的有益效果,此处不再赘述。
上述主要从电子设备的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对其中涉及的设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在上述实施例中的功能或动作或操作或步骤等,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可以用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包括这些改动和变型在内。
Claims (9)
1.一种终端设备的用户属性确定方法,其特征在于,包括:
获取第一终端设备的第一数据;所述第一数据包括所述第一终端设备的基础参数以及所述第一终端设备被激活且被使用后产生的使用数据;所述第一终端设备的基础参数包括所述第一终端设备的激活时长;
分别对所述第一终端设备的第一数据中的基础参数进行特征衍生,对所述第一终端设备的第一数据中的使用数据进行聚类,得到第一终端设备的特征数据;
在所述第一终端设备的激活时长大于第一时长时,将所述第一终端设备的特征数据输入第二模型;根据所述第二模型的输出结果确定所述第一终端设备的用户属性;其中,所述第二模型为预先使用第一样本对第一模型训练生成,所述第一样本对应的终端设备的激活时长大于所述第一时长,所述第一模型为树模型分类器或线性分类模型;所述用户属性至少包括以下一种:用户性别,用户年龄段;
在所述第一终端设备的激活时长小于所述第一时长时,将所述第一终端设备的特征数据输入树模型分类器,得到特征分类结果;对所述特征分类结果进行一位有效编码,得到特征编码结果;将所述特征编码结果与所述第一终端设备的特征数据合并,得到特征合并结果;以第三样本中编码数据的顺序以及特征数据的顺序为参考,对所述特征合并结果进行特征对齐,得到特征对齐结果;将所述特征对齐结果输入第四模型;根据所述第四模型的输出结果确定所述第一终端设备的用户属性;
其中,所述第三样本为预先使用第二样本进行第一训练生成;所述第二样本对应的终端设备的激活时长小于所述第一时长;所述第一训练包括将所述第二样本输入树模型分类器进行多次迭代,得到所述树模型分类器中各个弱分类器的叶子节点数据;所述叶子节点数据为所述第二样本中各特征数据的特征组合;对各叶子节点数据进行一位有效编码,得到编码数据;将所述编码数据与所述第二样本中的各特征数据进行合并;
所述第四模型为预先使用所述第三样本对第三模型进行训练生成;所述第四模型为线性分类模型。
2.根据权利要求1所述的方法,其特征在于,所述树模型分类器为梯度提升决策树。
3.根据权利要求1所述的方法,其特征在于,在所述第一终端设备的第一数据中的基础参数包括终端设备每天被使用的时间段时,所述对所述第一终端设备的第一数据中的基础参数进行特征衍生,包括:
根据所述终端设备每天被使用的时间段确定所述终端设备每天被使用的最早时间和最晚时间。
4.根据权利要求1所述的方法,其特征在于,在所述第一终端设备的第一数据中的使用数据包括应用安装信息时,所述对所述第一终端设备的第一数据中的使用数据进行聚类,包括:
对应用市场中安装数量大于第一阈值的应用进行分类,得到多个应用类别;
根据所述应用安装信息确定所述第一终端设备所包括的应用类别。
5.根据权利要求1所述的方法,其特征在于,所述终端设备的基础参数至少包括以下一种:颜色,型号,系统版本。
6.根据权利要求1所述的方法,其特征在于,所述终端设备的使用数据至少包括以下一种:应用安装信息,应用使用信息,使用时间段,相机使用频率,相机设置参数,系统设置参数。
7.一种电子设备,其特征在于,所述电子设备包括一个或多个处理器和一个或多个存储器;所述一个或多个存储器与所述一个或多个处理器耦合,所述一个或多个存储器存储有计算机指令;
当所述一个或多个处理器执行所述计算机指令时,使得所述电子设备执行如权利要求1-6中任一项所述的终端设备的用户属性确定方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括计算机指令,当所述计算机指令运行时,执行如权利要求1-6中任一项所述的终端设备的用户属性确定方法。
9.一种计算机程序产品,其特征在于,所述计算机程序产品中包括指令,当所述计算机程序产品在计算机上运行时,使得所述计算机可以根据所述指令执行如权利要求1-6中任一项所述的终端设备的用户属性确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211348747.7A CN115689626B (zh) | 2022-10-31 | 2022-10-31 | 一种终端设备的用户属性确定方法及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211348747.7A CN115689626B (zh) | 2022-10-31 | 2022-10-31 | 一种终端设备的用户属性确定方法及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115689626A CN115689626A (zh) | 2023-02-03 |
CN115689626B true CN115689626B (zh) | 2024-03-01 |
Family
ID=85046901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211348747.7A Active CN115689626B (zh) | 2022-10-31 | 2022-10-31 | 一种终端设备的用户属性确定方法及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115689626B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726764A (zh) * | 2018-12-29 | 2019-05-07 | 北京航天数据股份有限公司 | 一种模型选择方法、装置、设备和介质 |
CN109885834A (zh) * | 2019-02-18 | 2019-06-14 | 中国联合网络通信集团有限公司 | 一种用户年龄性别的预测方法及装置 |
CN110012060A (zh) * | 2019-02-13 | 2019-07-12 | 平安科技(深圳)有限公司 | 移动终端的信息推送方法、装置、存储介质和服务器 |
CN111078742A (zh) * | 2019-12-09 | 2020-04-28 | 秒针信息技术有限公司 | 用户分类模型训练方法、用户分类方法及装置 |
CN112183208A (zh) * | 2020-08-27 | 2021-01-05 | 华为技术有限公司 | 一种身份识别方法及设备 |
CN112734570A (zh) * | 2020-12-31 | 2021-04-30 | 北京知因智慧科技有限公司 | 信用违约预测方法、装置及电子设备 |
CN113660369A (zh) * | 2021-09-22 | 2021-11-16 | 展讯通信(天津)有限公司 | 来电处理及模型训练方法、装置、终端设备和存储介质 |
CN113707249A (zh) * | 2021-03-25 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 医疗影像处理方法、装置和存储介质 |
CN114358807A (zh) * | 2021-03-12 | 2022-04-15 | 上海序言泽网络科技有限公司 | 基于可预测用户特征属性的用户画像方法及系统 |
-
2022
- 2022-10-31 CN CN202211348747.7A patent/CN115689626B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109726764A (zh) * | 2018-12-29 | 2019-05-07 | 北京航天数据股份有限公司 | 一种模型选择方法、装置、设备和介质 |
CN110012060A (zh) * | 2019-02-13 | 2019-07-12 | 平安科技(深圳)有限公司 | 移动终端的信息推送方法、装置、存储介质和服务器 |
CN109885834A (zh) * | 2019-02-18 | 2019-06-14 | 中国联合网络通信集团有限公司 | 一种用户年龄性别的预测方法及装置 |
CN111078742A (zh) * | 2019-12-09 | 2020-04-28 | 秒针信息技术有限公司 | 用户分类模型训练方法、用户分类方法及装置 |
CN112183208A (zh) * | 2020-08-27 | 2021-01-05 | 华为技术有限公司 | 一种身份识别方法及设备 |
CN112734570A (zh) * | 2020-12-31 | 2021-04-30 | 北京知因智慧科技有限公司 | 信用违约预测方法、装置及电子设备 |
CN114358807A (zh) * | 2021-03-12 | 2022-04-15 | 上海序言泽网络科技有限公司 | 基于可预测用户特征属性的用户画像方法及系统 |
CN113707249A (zh) * | 2021-03-25 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 医疗影像处理方法、装置和存储介质 |
CN113660369A (zh) * | 2021-09-22 | 2021-11-16 | 展讯通信(天津)有限公司 | 来电处理及模型训练方法、装置、终端设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115689626A (zh) | 2023-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113163470B (zh) | 对特定路线上的特定位置进行识别的方法及电子设备 | |
CN111178546B (zh) | 机器学习模型的搜索方法及相关装置、设备 | |
WO2020056647A1 (zh) | 一种ai模型的开发方法及装置 | |
CN114005016A (zh) | 一种图像处理方法、电子设备、图像处理系统及芯片系统 | |
CN111176465A (zh) | 使用状态识别方法、装置、存储介质与电子设备 | |
CN112040333B (zh) | 视频发布方法、装置、终端及存储介质 | |
CN114723987B (zh) | 图像标签分类网络的训练方法、图像标签分类方法及设备 | |
CN113468929A (zh) | 运动状态识别方法、装置、电子设备和存储介质 | |
CN113438643B (zh) | 终端能力上报系统、方法、电子设备及存储介质 | |
CN118153110B (zh) | 一种数据处理方法及相关装置 | |
CN115689626B (zh) | 一种终端设备的用户属性确定方法及电子设备 | |
CN116049535B (zh) | 信息推荐方法、装置、终端装置及存储介质 | |
CN111626035B (zh) | 一种版面分析方法及电子设备 | |
CN114444705A (zh) | 模型更新方法及装置 | |
CN114443109B (zh) | 补丁修复方法、电子设备及存储介质 | |
CN114943976A (zh) | 模型生成的方法、装置、电子设备和存储介质 | |
CN115633114A (zh) | 通信录字母的显示方法、装置和终端设备 | |
CN115995236A (zh) | 音色提取、模型训练方法、装置、设备、介质及程序 | |
CN114093368A (zh) | 跨设备声纹注册方法、电子设备及存储介质 | |
CN116437293B (zh) | 地理围栏的建立方法、服务器及通信系统 | |
CN117131213B (zh) | 图像处理方法及相关设备 | |
CN117271170B (zh) | 活动事件处理方法及相关设备 | |
CN117130765B (zh) | 计算资源的配置方法和电子设备 | |
CN112070025B (zh) | 图像识别方法、装置、电子设备和计算机可读介质 | |
CN116821399A (zh) | 照片处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |