一种用户标签权重评估方法
技术领域
本发明涉及权重评估技术领域,尤其涉及一种用户标签权重评估方法。
背景技术
CRM一般指客户关系管理。客户关系管理是指企业为提高核心竞争力,利用相应的信息技术以及互联网技术协调企业与顾客间在销售、营销和服务上的交互,从而提升其管理方式,向客户提供创新式的个性化的客户交互和服务的过程。其最终目标是吸引新客户、保留老客户以及将已有客户转为忠实客户,增加市场。
现有CRM系统中,构建用户标签的方法一般是根据用户在站内的行为,如将访问的媒体类目、商品类目等行为日志保存下来,然后,在一定时间窗口内,遍历所有的用户行为日志,按照某种权重衰减函数对其进行计算,得到当前最新的用户画像——该方式存在的问题是获取的数据非常片面,用户打标签往往比较单一且对于标签的区分度不高。无法做到根据标签权重准确营销。
发明内容
针对现有技术中存在的上述问题,现提供一种用户标签权重评估方法,具体技术方案如下所示:
一种用户标签权重评估方法,预先构建一病症标签集合,一行为执行集合和一执行渠道集合;
病症标签集合包括多个疾病种类,行为执行集合包括多种不同的用户行为,执行渠道集合包括多种用户行为分别对应的执行渠道;
用户标签权重评估方法包括如下步骤:
步骤S1,分别计算病症标签集合、行为执行集合和执行渠道集合中,每个疾病种类、每个用户行为和每个执行渠道的独立客观权重:
其中:
P为病症标签集合中的任意一个疾病种类,
为疾病种类相对应的第一客观权重;
A为行为执行集合中的任意一个用户行为,
为用户行为相对应的第二客观权重;
Q为执行渠道集合中的任意一个执行渠道,
为执行渠道相对应的第三客观权重;
第一客观权重,第二客观权重和第三客观权重均基于多维度TF-IDF算法获得;
步骤S2,对病症标签集合中的全部疾病种类进行划分,划分结果分别为急性疾病和慢性疾病;
步骤S3,根据划分结果,逐一计算每个疾病种类对应的每个用户行为和每个执行渠道的综合权重:
其中:
为疾病种类为P,用户行为为A,执行渠道为Q时与时间相关联的综合权重;
为疾病种类为P时,通过执行渠道Q执行用户行为为A的次数;
当疾病种类为急性疾病时:
其中t为实时时刻,
为起始时刻,k为一预设的衰减系数;
当疾病种类为慢性疾病时:
其中
为疾病种类为P时的药品复购周期,M为一正整数且需保证
;
步骤S4,根据综合权重由高到低进行降序排序,根据综合权重最高的对应的疾病种类、用户行为和执行渠道生成相应的最优用户标签。
优选的,该种用户标签权重评估方法,其中于多维度TF-IDF算法中,
为疾病种类为P时于全部执行渠道中用户行为为A的次数的占比,其中:
优选的,该种用户标签权重评估方法,其中于多维度TF-IDF算法中,
为疾病种类为P时于全部疾病种类中的稀缺程度,其中:
优选的,该种用户标签权重评估方法,其中执行渠道集合包括电商平台、应用程序、网络推广页面、线下门店活动和智能问诊。
优选的,该种用户标签权重评估方法,其中行为执行集合包括搜索、浏览、下单、续方、问诊、收藏、咨询、参与活动和评价。
优选的,该种用户标签权重评估方法,其中于步骤S3和步骤S4之间还包括一步骤S40;
步骤S40,当任意两个疾病种类之间存在关联性时,需对计算得到的综合权重进行关联性修正:
其中:
为疾病种类为A时的综合权重,
为用户具有疾病种类A时同时具有疾病种类B的概率,
为疾病种类为A时经修正的综合权重;
为疾病种类为B时的综合权重,
为用户具有疾病种类B时同时具有疾病种类A的概率,
为疾病种类为B时经修正的综合权重。
优选的,该种用户标签权重评估方法,其中于步骤S40中:
其中:
为疾病种类为A对应的治疗药品,
为疾病种类为B对应的治疗药品;
为疾病种类为A的出现次数,
为疾病种类为B的出现次数,
为疾病种类为A和疾病种类为B同时出现的次数;
本技术方案具有如下优点及有益效果:
通过本技术方案,基于用户的标签权重,行为权重,渠道权重的多维度根据TF-IDF算法及时间衰减函数模型综合计算的用户综合权重值,同时充分考虑医药领域疾病标签的特点,构造了带有方向性的标签相关性算法,以及基于标签相关性的权值修正函数对综合权重值进行修正更新,能够得到更为精准的动态化用户标签权重排名,能够帮助企业实现精准营销。
附图说明
图1为本发明一种用户标签权重评估方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
针对现有技术中存在的上述问题,现提供一种用户标签权重评估方法,具体技术方案如下所示:
一种用户标签权重评估方法,预先构建一病症标签集合,一行为执行集合和一执行渠道集合;
病症标签集合包括多个疾病种类,行为执行集合包括多种可能的用户行为,执行渠道集合包括多种用户行为对应的执行渠道;
如图1所示,用户标签权重评估方法包括如下步骤:
步骤S1,分别计算病症标签集合、行为执行集合和执行渠道集合中,每个疾病种类、每个用户行为和每个执行渠道的独立客观权重:
其中:
P为病症标签集合中的任意一个疾病种类,
为疾病种类相对应的第一客观权重;
A为行为执行集合中的任意一个用户行为,
为用户行为相对应的第二客观权重;
Q为执行渠道集合中的任意一个执行渠道,
为执行渠道相对应的第三客观权重;
第一客观权重,第二客观权重和第三客观权重均基于多维度TF-IDF算法获得;
步骤S2,对病症标签集合中的全部疾病种类进行划分,划分结果分别为急性疾病和慢性疾病;
步骤S3,根据划分结果,逐一计算每个疾病种类对应的每个用户行为和每个执行渠道的综合权重:
其中:
为疾病种类为P,用户行为为A,执行渠道为Q时与时间相关联的综合权重;
为疾病种类为P时,通过执行渠道Q执行用户行为为A的次数;
当疾病种类为急性疾病时:
其中t为实时时刻,
为起始时刻,k为一预设的衰减系数;
当疾病种类为慢性疾病时:
其中
为疾病种类为P时的药品复购周期,M为一正整数且需保证
;
步骤S4,根据综合权重由高到低进行降序排序,根据综合权重最高的对应的疾病种类、用户行为和执行渠道生成相应的最优用户标签。
在本发明的一较佳实施例中,用户标签的权重与实时时刻相关联,但由于医疗领域标签的特殊性,对于急性病/慢性病不同属性的标签,需要建立差异化的时间函数模型——急性病一般会减轻或治愈,而慢性病需要坚持用药,且时间上呈现明显的周期性。
于上述较佳实施例中,当疾病类型为急性病时,相应的时间衰减函数模型基于牛顿冷却定律制定,其中k为自行设定的衰减系数,经过t时间后,物体当前的温度是由初始温度和衰减速率的乘积——同样的随着用户的治疗,用户的症状一般会趋于一个良好的状态发展,那么随之用户的行为次数就会降低,所以对于用户行为权重我们可以根据建立时间衰减模型适时调正权重。
于上述较佳实施例中,当疾病类型为慢性病时,需要根据购买量和单天用量计算该用户购买病症标签P的药品的复购周期
,用户在复购周期内的复购模型为U字形变化,前期牛顿冷却定律指数变化较快,发挥主要作用,整体时间模型呈下降趋势;而后期复购需求指数变化加快,发挥主要作用,整体时间模型呈上升趋势。
于上述较佳实施例中,综合权重值统筹考虑了标签权重、行为权重、渠道权重和时间衰减权重,同时根据医药领域疾病标签的特点,针对慢性病和急性病的不同属性构造带有差异性的时间衰减权重模型,基于上述多维度考虑所得出的综合权重值能够全方位涵盖了营销所需,综合权重值最高的对应的疾病种类、用户行为和执行渠道所生成的用户标签具有最高的综合营销价值。
作为优选的实施方式,该种用户标签权重评估方法,其中于多维度TF-IDF算法中,
为疾病种类为P时于全部执行渠道中用户行为为A的次数的占比,其中:
作为优选的实施方式,该种用户标签权重评估方法,其中于多维度TF-IDF算法中,
为疾病种类为P时于全部疾病种类中的稀缺程度,其中:
作为优选的实施方式,该种用户标签权重评估方法,其中执行渠道集合包括电商平台、应用程序、网络推广页面、线下门店活动和智能问诊等。
作为优选的实施方式,该种用户标签权重评估方法,其中行为执行集合包括搜索、浏览、下单、续方、问诊、收藏、咨询、参与活动和评价。
作为优选的实施方式,该种用户标签权重评估方法,其中于步骤S3和步骤S4之间还包括一步骤S40;
步骤S40,当任意两个疾病种类之间存在关联性时,需对计算得到的综合权重进行关联性修正:
其中:
为疾病种类为A时的综合权重,
为用户具有疾病种类A时同时具有疾病种类B的概率,
为疾病种类为A时经修正的综合权重;
为疾病种类为B时的综合权重,
为用户具有疾病种类B时同时具有疾病种类A的概率,
为疾病种类为B时经修正的综合权重。
作为优选的实施方式,该种用户标签权重评估方法,其中于步骤S40中:
其中:
为疾病种类为A对应的治疗药品,
为疾病种类为B对应的治疗药品;
为疾病种类为A的出现次数,
为疾病种类为B的出现次数,
为疾病种类为A和疾病种类为B同时出现的次数;
在本发明的另一较佳实施例中,由于该种用户标签权重评估方法应用于医疗领域的标签,考虑到一种疾病往往可以通过多种药品治疗且存在并发症,疾病标签之间往往存在着特殊的彼此之间相关性,因此可以根据药品重合度、患病客群重合度以及同时出现概率这三个元素来对于标签的相关性进行修正。
于上述较佳实施例中,需要注意的是,标签的相关性是带有方向性的,例如肥胖症用户同时患高血脂症的概率与高血脂症同时患有肥胖症的概率即存在差异性;在获得修正参数后采用前述互验修正算法于步骤S4前对于综合权重进行适应性修正以进一步提升营销精确性。
综上所述,通过本技术方案,基于用户的标签权重,行为权重,渠道权重的多维度根据TF-IDF算法及时间衰减函数模型综合计算的用户综合权重值,同时充分考虑医药领域疾病标签的特点,构造了带有方向性的标签相关性算法,以及基于标签相关性的权值修正函数对综合权重值进行修正更新,能够得到更为精准的动态化用户标签权重排名,能够帮助企业实现精准营销。
以上所述仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书及图示内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。