CN116644184A - 基于数据聚类的人力资源信息管理系统 - Google Patents
基于数据聚类的人力资源信息管理系统 Download PDFInfo
- Publication number
- CN116644184A CN116644184A CN202310933469.XA CN202310933469A CN116644184A CN 116644184 A CN116644184 A CN 116644184A CN 202310933469 A CN202310933469 A CN 202310933469A CN 116644184 A CN116644184 A CN 116644184A
- Authority
- CN
- China
- Prior art keywords
- dimension
- resource information
- human resource
- keyword
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008901 benefit Effects 0.000 claims abstract description 108
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 42
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000010606 normalization Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 238000007726 management method Methods 0.000 description 25
- 230000007115 recruitment Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 230000000694 effects Effects 0.000 description 8
- 239000013598 vector Substances 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000003064 k means clustering Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
- G06F18/256—Fusion techniques of classification results, e.g. of results related to same input data of results relating to different input data, e.g. multimodal recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Human Resources & Organizations (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及基于数据聚类的人力资源信息管理系统。该系统包括:数据获取模块,用于获取人力资源信息的各维度的关键词区域,并设置对应维度权值;综合优势分析模块,用于获取关键词区域中的不重复的文本,获取每份人力资源信息中各维度的综合优势参数;维度优势分析模块,用于根据人力资源信息的相同维度的层次权重获取各维度的同维度优势参数;结合每份人力资源信息中任意维度的综合优势参数、同维度优势参数与维度权值对人力资源信息进行聚类管理。本发明通过对人力资源信息的不同维度的文本信息,及同维度的优势进行分析,使人力资源信息聚类更加准确,提高了人力资源信息的管理效率。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于数据聚类的人力资源信息管理系统。
背景技术
人力资源管理是指企业或组织对其人力资源的规划、招募、培训、评估和激励等一系列管理活动的总称。人力资源中人才招募主要是通过筛选求职者投递的简历进行判断,人才培训主要是从网上获取相关的培训内容等。各种求职者能力层次不齐,导致岗位的分配以及求职者的录取效率底下,所以企业的人力资源信息管理十分重要。
现有技术利用潜在语义模型获取人力资源信息中不同类型的关键词的词向量,根据词向量的求和因子,分别对重复关键词的词向量与非重复关键词的词向量进行加权求和,得到人力资源信息的特征向量,并基于特征向量对人力资源信息进行管理。由于人力资源信息中包含多种不同类型的信息,且不同类型的信息中可能存在重复信息,重复信息会导致特征向量无法准确表征人力资源信息,从而导致聚类结果不准确,进而降低人力人力资源信息的管理效率。
发明内容
为了解决人力资源信息的不同类型内容中存在重复信息,导致聚类结果不准确的技术问题,本发明的目的在于提供一种基于数据聚类的人力资源信息管理系统,所采用的技术方案具体如下:
本发明提出了一种基于数据聚类的人力资源信息管理系统,所述系统包括:
数据获取模块,用于依据不同类别的预设关键词将每份人力资源信息划分为至少两个维度,一个维度对应一类预设关键词;设置每份人力资源信息的各维度的维度权值;根据人力资源信息中预设关键词的位置获取每个维度的关键词区域;
综合优势分析模块,用于获取所述关键词区域中不重复的文本;根据每份人力资源信息中任意一个维度与其他任意维度的关键词区域中不重复的文本的分布混乱情况,与不重复的文本个数差异,获取每份人力资源信息中每个维度的综合优势参数;
维度优势分析模块,用于获取每份人力资源信息的每个维度的层次权重;根据任意一份人力资源信息的任意一个维度的所述层次权重与其他人力资源信息的对应维度的所述层次权重,获取每份人力资源信息的每个维度的同维度优势参数;
资源信息管理模块,用于结合每份人力资源信息的任意维度的所述综合优势参数、所述同维度优势参数与所述维度权值,对人力资源信息进行聚类管理。
进一步地,所述关键词区域的获取方法,包括:
遍历每份人力资源信息中的所有文本;若每类预设关键词在人力资源信息中不存在相同的文本,则对应类别的预设关键词对应维度的关键词区域中不存在文本,设置对应维度的标签值为第一标签值;
若每类预设关键词在人力资源信息中存在相同的文本,将所述文本作为对应类别的预设关键词在人力资源信息中对应维度的关键词文本,设置对应类别的预设关键词对应维度的标签值为第二标签值;在每份人力资源信息中,将相邻的两类关键词文本中前一类关键词文本中第一个关键词文本之后,直至后一类关键词文本中第一个关键词文本之前的区域中的所有文本,作为前一类关键词文本对应维度的关键词区域;将最后一类关键词文本中第一个关键词文本之后直至人力资源信息结束的区域中的所有文本,作为最后一类关键词文本对应维度的关键词区域。
进一步地,所述综合优势参数的获取方法,包括:
对于每份人力资源信息的任意两个维度,分别将其中一个维度的关键词区域与另一个维度的关键词区域中每个不重复的文本出现的概率代入信息熵公式中,依次得到对应两个维度的文本混乱度;将任意两个维度对应的两个关键词区域中每个不重复的文本出现的概率代入信息熵公式中,得到对应两个维度的文本联合混乱度;将任意两个维度对应的所述文本混乱度之和与所述文本联合混乱度的比值作为对应两个维度的联合影响参数;
统计每个关键词区域中各不重复的文本的个数;
将任意两个维度的关键词区域内不重复的文本的个数之和作为分子,个数的差值绝对值与预设常数的和作为分母得到的比值作为对应两个维度的数量调整值;将任意两个维度的所述数量调整值作为所述联合影响参数的权重进行调整,得到对应两个维度的数量影响参数;
当人力资源信息的维度的标签值为第一标签值时,则对应维度的所述综合优势参数为0;将标签值为第二标签值的任意一个维度与其他任意维度的所述数量影响参数的均值进行负相关并归一化映射,得到对应维度的所述综合优势参数。
进一步地,所述同维度优势参数的获取方法,包括:
将每份人力资源信息的任意一个维度的所述层次权重与其他人力资源信息的相同维度的所述层次权重的均值之间的差值,作为每份人力资源信息的对应维度的同维度优势参数。
进一步地,所述结合每份人力资源信息的任意维度的所述综合优势参数、所述同维度优势参数与所述维度权值,对人力资源信息进行聚类管理的方法,为:
将所述综合优势参数与所述同维度优势参数分别进行归一化处理,依次得到归一综合优势参数和归一单维优势参数;
以预设第一调整系数作为所述归一综合优势参数的权重,以预设第二调整系数作为所述归一单维优势参数的权重,将每份人力资源信息的每个维度的所述归一综合优势参数与所述归一单维优势参数加权求和,得到每份人力资源信息的每个维度的加权影响参数;将每份人力资源信息的每个维度的所述加权影响参数与对应维度的维度权值的乘积,得到每份人力资源信息的每个维度的最终维度值;
将每份人力资源信息的各维度的所述最终维度值进行累加,得到对应人力资源信息的聚类参数;
利用聚类算法对所述聚类参数进行聚类,得到预设数量个聚类簇;将不同聚类簇内所述聚类参数对应的人力资源信息进行展示。
进一步地,所述不重复的文本的获取方法,包括:
利用文本去重算法去除每个所述关键词区域中重复的文本,得到对应关键词区域中不重复的文本。
进一步地,所述层次权重的获取方法,包括:
当人力资源信息的维度的标签值为第一标签值时,则对应维度的层次权重为0;
基于每个维度的预设筛选内容,利用层次分析法对所有人力资源信息的任意相同维度的关键词区域中文本进行分析,得到每份人力资源信息的每个维度的所述层次权重。
本发明具有如下有益效果:
在本发明实施例中,对人力资源信息的聚类是基于各维度的文本信息进行分析,则维度的关键词区域是对人力资源信息进行聚类分析的前提,人力资源信息中各维度即不同类型的关键词区域中重复信息不能为聚类过程提供有效信息,影响人力资源信息的聚类效果,同一人力资源信息的不同维度的关键词区域中不重复的文本的分布混乱情况,呈现不重复的文本的分布情况对维度间信息的影响,因不同维度的不重复的文本个数差异可能会影响聚类效果,通过不重复的文本的个数差异对维度间影响情况进行调整,使综合优势参数能更准确地反映综合维度的优势信息;层次权重呈现人力资源信息中某维度的内容与企业相关内容的适配程度,对所有人力资源信息中同一维度的层次权重进行比较,使同维度优势参数更加准确呈现单一维度的优势;基于同一简历中不同维度间重复内容的相互影响情况得到的综合优势参数,能衡量简历内各维度的综合能力,同维度优势参数呈现不同人力资源信息中同一维度的重要程度,维度权值衡量人力资源信息中各维度信息对于企业相关内容的重要程度,综合三种因素能够准确表征人力资源信息的特征,基于人力资源信息的特征对各人力资源信息进行聚类,避免了“维度诅咒”现象,增加对人力资源信息聚类的准确性,进而提高人力资源信息的管理效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明一个实施例所提供的一种基于数据聚类的人力资源信息管理系统的系统框图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种建筑吊篮的智能监控系统及监控方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
本发明所针对的具体场景:在对人力资源信息进行管理的时候,往往需要进行人力资源信息的分类,但是现有K均值聚类算法对于人力资源信息进行聚类时因为人力资源信息中所包含的不同类型的信息过多,容易使得“维度诅咒”现象的发生,从而导致聚类结果不准确。本发明在对简历信息进行基于携带信息量以及个人能力优势特征进行量化的基础上,结合简历信息中的不同类型的信息对每一份简历生成聚类参数,来实现人力资源管理信息的聚类管理。
下面结合附图具体的说明本发明所提供的一种基于数据聚类的人力资源信息管理系统的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种基于数据聚类的人力资源信息管理系统的系统框图,该系统包括:数据获取模块101,综合优势分析模块102,维度优势分析模块103,资源信息管理模块104。
数据获取模块101,用于依据不同类别的预设关键词将每份人力资源信息划分为至少两个维度,一个维度对应一类预设关键词;设置每份人力资源信息的各维度的维度权值;根据人力资源信息中预设关键词的位置获取每个维度的关键词区域。
人力资源中的人才招募为企业和公司注入新鲜血液,有着极其重要的影响。人力资源中人才招募主要是通过筛选求职者投递的简历进行判断,对于公司而言,各种求职者能力层次不齐,且求职人数较多,导致岗位的分配以及求职者的录取效率低下,所以简历的分类对于企业人力人力资源信息管理十分重要。
企业收集到简历的信息是非结构且混乱的,对简历进行聚类时容易受到多余无关信息的影响,使每份简历的整体信息分析以及获得聚类参数的过程增加了计算量,所以需要对每份简历进行多维度信息的提取,使得简历信息具有结构化的统一分析特征。本发明实施例针对具有固定模板格式的简历进行聚类分析。
具体的,本发明实施例中对一天内企业收到的n份简历进行分析。现有技术中可以通过文本检测算法获取简历数据库中每份简历中的标题信息,通过对标题信息统计内容,企业可根据自我需求限定具体的预设关键词,例如教育经历、工作经验和项目经历等。本发明实施例中企业限定了M个预设关键词,每个预设关键词在简历中对应一个维度,即每份简历中有M个维度。
由于企业招聘对每个预设关键词的重视程度不同,即需求性不同,则需要设置每份简历中各维度的维度权值。具体维度权值可根据企业的人力资源部门进行研究确定,实施者可根据实际情况自行设定。本发明中所有维度对应的预设关键词对于企业招聘同等重要,故设置简历中所有维度的维度权值相等,即,其中,/>为简历中第1个维度的维度权值,/>为简历中第m个维度的维度权值,/>为第M个维度的维度权值,M为每份简历中维度的个数。
对简历进行聚类是基于各维度对应的文本信息进行分析,则简历中维度的关键词区域是对简历进行聚类分析的前提。
优选地,关键词区域的获取方法为:遍历每份人力资源信息中的所有文本;若每类预设关键词在人力资源信息中不存在相同的文本,则对应类别的预设关键词对应维度的关键词区域中不存在文本,设置对应维度的标签值为第一标签值;若每类预设关键词在人力资源信息中存在相同的文本,将文本作为对应类别的预设关键词在人力资源信息中对应维度的关键词文本,设置对应类别的预设关键词对应维度的标签值为第二标签值;在每份人力资源信息中,将相邻的两类关键词文本中前一类关键词文本中第一个关键词文本之后,直至后一类关键词文本中第一个关键词文本之前的区域中的所有文本,作为前一类关键词文本对应维度的关键词区域;将最后一类关键词文本中第一个关键词文本之后直至人力资源信息结束的区域中的所有文本,作为最后一类关键词文本对应维度的关键词区域。
作为一个示例,预设关键词的类别数量等于简历中维度的数量。若简历中找不到与每类预设关键词相同的文本,将该类别的预设关键词在简历中对应维度的标签值设置为第一标签值,则简历中预设关键词对应维度的关键词区域中不存在文本信息;若找到相同文本,将对应类别的预设关键词在简历中对应维度的标签值设置为第二标签值,则简历中该类别的预设关键词对应维度有关键词区域。本发明实施例中分别设置第一标签值和第二标签值依次为0与1,实施者可自行设置。为了便于描述用数字代替简历中的文本,假设简历中的文本信息为12135121356789,其中,简历中第1个维度的关键词文本为1,第2个维度的关键词文本为4,第3个维度的关键词文本为5;此时,关键词文本1对应的第1个维度的关键词区域为121351213,维度的标签值为第二标签值1;关键词文本4对应的第2个维度的关键词区域中不存在文本,维度的标签值为第一标签值0;关键词文本5对应的第3个维度的关键词区域为56789,维度的标签值为第二标签值1。由于预设关键词的选取是基于简历中某部分内容的简述,关键词不可能为相邻的文本或者简历的最后一个文本,则简历中每个关键词均有对应的关键词区域。
至此,获取每份简历的每个维度的关键词区域。
综合优势分析模块102,用于获取关键词区域中不重复的文本;根据每份人力资源信息中任意一个维度与其他任意维度的关键词区域中不重复的文本的分布混乱情况,与不重复的文本个数差异,获取每份人力资源信息中每个维度的综合优势参数。
简历中携带的信息量越大越能帮助企业对求职者进行了解,并且相对于其余简历在不同的维度中更具有优势越能体现求职者的差距,那么简历对于人力资源管理而言越是一份好的简历。
简历中携带的信息可能存在重复信息,简历中不同维度的重复信息会影响聚类效果,因此,需要针对关键词区域中不重复的文本进行分析。不重复的文本的获取方法为:利用文本去重算法去除每个关键词区域中重复的文本,得到对应关键词区域中不重复的文本。本发明实施中选用最小哈希(MinHash)算法对关键词区域的文本进行去重,进而获取关键词区域的不重复的文本。其中,最小哈希算法为本领域技术人员公知技术,在此不做赘述。
企业对于简历进行聚类评判的时候,简历中所携带的信息越全面越详细越好,因求职者个人生平履历的不同,导致简历中不同维度的内容之间可能具有大量的重复信息,使得简历中的某些维度在简历聚类的过程中不能提供较多的有效信息,导致进行简历聚类时容易相互影响。
关键词区域中的重复文本容易使某维度在简历聚类过程不能提供较多有效信息,基于同一简历的不同维度的关键词区域中不重复的文本的分布混乱情况,呈现不重复的文本的分布情况对维度间信息的影响,不同维度的不重复的文本个数差异可能会影响聚类效果,通过不重复的文本的个数差异对维度间影响情况进行调整,使综合优势参数能更准确的反映维度的优势信息。
优选地,综合优势参数的获取方法为:对于每份人力资源信息的任意两个维度,分别将其中一个维度的关键词区域与另一个维度的关键词区域中每个不重复的文本出现的概率代入信息熵公式中,依次得到对应两个维度的文本混乱度;将任意两个维度对应的两个关键词区域中每个不重复的文本出现的概率代入信息熵公式中,得到对应两个维度的文本联合混乱度;将任意两个维度对应的文本混乱度之和与文本联合混乱度的比值作为对应两个维度的联合影响参数;统计每个关键词区域中各不重复的文本的个数;将任意两个维度的关键词区域内不重复的文本的个数之和作为分子,个数的差值绝对值与预设常数的和作为分母得到的比值作为对应两个维度的数量调整值;将任意两个维度的数量调整值作为联合影响参数的权重进行调整,得到对应两个维度的数量影响参数;当人力资源信息的维度的标签值为第一标签值时,则对应维度的综合优势参数为0;将标签值为第二标签值的任意一个维度与其他任意维度的数量影响参数的均值进行负相关并归一化映射,得到对应维度的综合优势参数。
作为一个示例,为了便于理解用数字代替简历中的文本,假设简历中第m个维度的关键词区域中文本为1、1、2、3、4、5,第个维度的关键词区域中文本为2、2、3、4、5、6,则简历中第m个维度与第/>个维度的关键词区域中不重复的文本个数依次为5和5;第m个维度和第/>个维度的两个关键词区域中不重复的文本为1、2、3、4、5、6,不重复的文本个数为6。当两个维度的关键词区域内重复的文本越多时,即两个维度的文本联合混乱度越小,使联合影响参数越大,说明第/>个维度对第m个维度影响越大。当第m个维度存在且第/>个维度不存在时,两个维度的关键词区域的不重复的文本的信息熵等于第m个维度的关键词区域的不重复的文本的信息熵,此时,两个维度的联合影响参数/>等于1;当第m个维度和第/>个维度两个关键词区域的文本内容完全相同时,则两个维度的联合影响参数/>等于2。在两个维度的关键词区域内不重复的文本个数相差较大的情况下,即使联合影响系数很大,其对于整体简历进行聚类的影响也是较小的。例如,第m个维度区域的不重复的文本的个数/>,第/>个维度区域的不重复的文本的个数/>,即使第/>个维度的关键词区域的不重复的文本为第m个维度的关键词区域的不重复的文本的子集,也不能说明第/>个维度对第m个维度的影响较大,所以在联合影响系数/>的基础上,利用两个维度区域不重复的文本个数的差异进行约束,得到对应两个维度的数量影响参数/>。当第/>个维度与第m个维度的维度区域对应的不重复文本的总个数差距越小,数量影响参数/>越大,则第/>个维度对于第m个维度影响越严重,进而说明第m个维度的综合程度越弱。需要说明的是,当简历的第m个维度的标签值为第一标签值0,第m个预设关键词在简历中没有相同的文本,即第m个维度不存在关键词区域,说明第m个维度没有综合优势,则令综合优势参数为0;对于标签值为第二标签值1的第m个维度,获取简历的其他维度与第m个维度的数量影响参数,并将所有数量影响参数的均值进行负相关并归一化映射,则其他维度对第m个维度内容影响越严重,综合程度越差,在进行负相关映射后说明第m个维度的综合能力越强,即第m个维度的综合优势参数/>越大。
结合简历的第m个维度与其他维度的关键词区域中不重复的文本的分布混乱情况,与不重复的文本的个数差异,获取简历的第m个维度的综合优势参数。综合优势参数的计算公式如下:
式中,为每份简历的第m个维度的综合优势参数;M为每份简历中维度的个数,即预设关键词的类别个数;/>为每份简历的第m个维度与第/>个维度的数量影响参数,其中,/>且/>;/>为第m个维度的关键词区域中不重复的文本的个数;/>为第个维度的关键词区域中不重复的文本的个数;/>为第/>个维度对第m个维度的联合影响参数;/>为第m个维度的关键词区域中第/>个不重复的文本出现的概率;/>为第/>个维度的关键词区域中第/>个不重复的文本出现的概率;/>为第m个维度与第/>个维度对应的两个关键词区域中不重复的文本的个数;/>为第m个维度与第/>个维度对应的两个关键词区域中第/>个不重复的文本出现的概率;/>为预设常数,取经验值1,作用为防止公式无意义;/>为以常数2为底数的对数函数;/>为绝对值函数;e为自然常数。
需要说明的是,当简历的第m个维度和第个维度的关键词区域中重复内容较多,则两个维度的文本联合混乱度相比较于两个维度的文本混乱度之和越小,导致两个维度的联合影响参数/>越大;当两个维度的关键词区域中不重复文本的个数的差异情况,会影响两个维度对应关键词区域中文本内容的相互影响情况,进而影响整体简历的聚类,以数量调整值/>对联合影响参数/>进行调整,提高联合影响参数的准确性;当简历的其他维度与第m维度的关键词区域内重复文本越多,则/>越大,说明其他维度对第m维度内容影响越严重,综合程度越差,在进行负相关映射后说明第m个维度的综合能力越强,即第m个维度的综合优势参数/>越大,说明其余维度因重复文本对于第m个维度的影响较小,第m个维度在进行聚类时提供的信息越多;由于计算联合影响参数时,分子与分母均为信息熵公式,则分子和分母中信息熵公式中的负号被约分。
根据上述计算简历的第m个维度的相互影响参数的方法,获取其他每个简历的每个维度的综合优势参数。
至此,每份简历的每个维度均有对应的综合优势参数。
维度优势分析模块103,用于获取每份人力资源信息的每个维度的层次权重;根据任意一份人力资源信息的任意一个维度的层次权重与其他人力资源信息的对应维度的层次权重,获取每份人力资源信息的每个维度的同维度优势参数。
企业筛选简历时,某一份简历中的某一维度能力十分突出,在企业通过简历筛选专业性人才时是十分必要的,所以需要获取每份简历中每个维度的层次权重,以层次权重作为每个简历中相同维度中个人能力的衡量指标。
优选地,层次权重的获取方法为:当人力资源信息的维度的标签值为第一标签值时,则对应维度的层次权重为0;基于每个维度的预设筛选内容,利用层次分析法对所有人力资源信息的任意相同维度的关键词区域中文本进行分析,得到每份人力资源信息的每个维度的层次权重。
作为一个示例,以第个关键词为“工作经验”为例进行分析,简历中每个维度的关键词区域应对应企业岗位招聘相应内容要求,每个维度的预设筛选内容即为企业岗位招聘相应的内容要求。若第1份简历中“工作经验”维度的关键词区域的内容为:具有3年的服务行业的工作经验,第2份简历中“工作经验”维度的关键词区域的内容为:具有/>年的计算机行业的工作经验,假设企业岗位招聘要求中“工作经验”维度的预设筛选内容为“计算机”,则在“工作经验”维度的预设筛选内容上结合层次分析法,可以获得第1份和第2份简历相对于企业岗位招聘的权值即层次权重,层次权重越大说明越适合,则对于“工作经验”维度中第1份的层次权重小于第2份的层次权重。其中,层次分析法是本领域技术人员公知技术,在此不做赘述。
某一简历中维度的同类优势参数是相对于其他简历中相同维度而言,层次权重呈现简历中某维度的内容与企业招聘内容的适配程度,根据简历中同一维度的层次权重进行比较,使简历中维度的优势更加准确的呈现。
优选地,同维度优势参数的获取方法为:将每份人力资源信息的任意一个维度的层次权重与其他人力资源信息的相同维度的层次权重的均值之间的差值,作为每份人力资源信息的对应维度的同维度优势参数。
第n份简历的第m个维度的同维度优势参数的计算公式如下:
其中,为第n份简历的第m个维度的同维度优势参数;/>为第n份简历的第m个维度的层次权重;/>为第j份简历的第m个维度的层次权重,其中,/>且/>;n为一天内公司获取的简历的总份数。
需要说明的是,某份简历中某维度能力十分突出,则通过层次分析法分析得到维度的层次权重较大,为比较多份简历的同一维度的优势情况,计算其他简历的同一维度的层次权重的均值,当第n份简历的某维度相较于其他简历的对应维度的信息较为突出,则为正数且越大;当第n份简历的某维度没有其他简历的对应维度的信息突出,则/>为负数且越小。
根据第n份简历的第m维度的同维度优势参数的计算方法,获取每份简历的每个维度的同维度优势参数。
至此,每份简历的每个维度均有对应的同维度优势参数。
资源信息管理模块104,用于结合每份人力资源信息的任意维度的综合优势参数、同维度优势参数与维度权值,对人力资源信息进行聚类管理。
基于同一简历中不同维度间重复内容的相互影响情况得到的综合优势参数,能衡量简历内各维度的综合能力,同维度优势参数呈现不同简历中同一维度的重要程度,维度权值衡量简历中各维度信息对于企业招聘的重要程度,结合三个因素对简历中任意维度进行分析,最终维度值呈现适合企业要求的维度信息的重要程度。
优选地,每份简历的每个维度的最终维度值的获取方法为:将综合优势参数与同维度优势参数分别进行归一化处理,依次得到归一综合优势参数和归一单维优势参数;以预设第一调整系数作为归一综合优势参数的权重,以预设第二调整系数作为归一单维优势参数的权重,将每份人力资源信息的每个维度的归一综合优势参数与归一单维优势参数加权求和,得到每份人力资源信息的每个维度的加权影响参数;将每份人力资源信息的每个维度的加权影响参数与对应维度的维度权值的乘积,得到每份人力资源信息的每个维度的最终维度值。
需要注意的是,预设第一调整参数与预设第二调整参数/>之和为整数1,其中,,/>。预设第一调整参数/>与预设第二调整参数/>的具体大小根据企业注重的实际情况进行调节,具体调节方法为:若企业注重综合能力,则预设第一调整参数/>较大,预设第二调整参数/>较小;若企业注重单一领域突出能力,则预设第一调整参数/>较小,预设第二调整参数/>较大;若企业对于综合能力和单一领域突出能力均注重。则预设第一调整参数/>与预设第二调整参数/>均为0.5。在本发明实施例中,预设第一调整参数/>与预设第二调整参数/>依次取经验值0.5和0.5。在本发明实施例中使用归一化函数分别对综合优势参数与同维度优势参数进行归一化处理,在本发明实施例中也可选择其他对综合优势参数与同维度优势参数进行归一化的方法,例如函数转化、最大最小规范化等归一化方法,在此不做限定。
结合每份简历的每个维度的综合优势参数和同维度优势参数对层次权重进行调整,得到每份简历的每个维度的最终维度值。最终维度值的计算公式如下:
式中,为第n份简历的第m个维度的最终维度值;/>为第n份简历的第m维度的综合优势参数;/>为第n份简历的第m维度的同维度优势参数;/>为第n份简历的第m个维度的维度权值;/>为预设第一调整系数;/>为预设第二调整系数;/>为第n份简历的第m个维度的加权影响参数;Norm为归一化函数。
需要说明的是,根据企业注重综合能力和单一领域优势情况,对预设第一调整系数和预设第二调整系数进行调整,并对归一综合优势参数和归一单维优势参数加权求和,使简历中对应维度的加权影响参数呈现企业的招聘要求;基于加权影响参数对简历中维度的维度权值进行调整,使表示简历的维度的最终维度值更加符合企业的招聘要求。
最终维度值呈现适合企业要求的维度信息的重要程度,基于最终维度值获取的聚类参数考虑到简历中每个维度的综合优势和单一优势,提高聚类参数表征简历特征的准确率。聚类参数的获取方法为:将每份人力资源信息的各维度的最终维度值进行累加,得到对应人力资源信息的聚类参数。每份简历的聚类参数的计算公式如下:
式中,为第n份简历的聚类参数;/>第n份简历的第m个维度的最终维度值;M为每份简历的维度的个数。
需要说明的是,当同一份简历中每个维度均对应由关键词,且各维度的最终维度值的越大,说明该简历的聚类特征越明显,且该简历的各维度更加具有优势,其整体携带的信息量越多。
利用聚类算法对聚类参数进行聚类,得到预设数量个聚类簇;将不同聚类簇内聚类参数对应的人力资源信息进行展示。本发明实施例中选用K均值聚类算法对聚类参数进行聚类,K取经验值3,实施者可根据实际情况自行设置;将聚类参数划分为3个类别,即将每个聚类簇内聚类参数对应的简历划分为一个类别,将每个类别的简历传送至人力资源信息管理系统中的展示模块进行展示。
其中,K均值聚类算法为本领域技术人员公知技术,在此不做赘述。
至此,本发明完成。
综上所述,本发明实施例中,数据获取模块,用于获取人力资源信息的各维度的关键词区域,并设置对应维度权值;综合优势分析模块,用于获取关键词区域中的不重复的文本,获取每份人力资源信息中各维度的综合优势参数;维度优势分析模块,用于根据人力资源信息的相同维度的层次权重获取各维度的同维度优势参数;结合每份人力资源信息中任意维度的综合优势参数、同维度优势参数与维度权值对人力资源信息进行聚类管理。本发明通过对人力资源信息的不同维度的文本信息,及同维度的优势进行分析,使人力资源信息聚类更加准确,提高了人力资源信息的管理效率。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于数据聚类的人力资源信息管理系统,其特征在于,该系统包括:
数据获取模块,用于依据不同类别的预设关键词将每份人力资源信息划分为至少两个维度,一个维度对应一类预设关键词;设置每份人力资源信息的各维度的维度权值;根据人力资源信息中预设关键词的位置获取每个维度的关键词区域;
综合优势分析模块,用于获取所述关键词区域中不重复的文本;根据每份人力资源信息中任意一个维度与其他任意维度的关键词区域中不重复的文本的分布混乱情况,与不重复的文本个数差异,获取每份人力资源信息中每个维度的综合优势参数;
维度优势分析模块,用于获取每份人力资源信息的每个维度的层次权重;根据任意一份人力资源信息的任意一个维度的所述层次权重与其他人力资源信息的对应维度的所述层次权重,获取每份人力资源信息的每个维度的同维度优势参数;
资源信息管理模块,用于结合每份人力资源信息的任意维度的所述综合优势参数、所述同维度优势参数与所述维度权值,对人力资源信息进行聚类管理。
2.根据权利要求1所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述关键词区域的获取方法,包括:
遍历每份人力资源信息中的所有文本;若每类预设关键词在人力资源信息中不存在相同的文本,则对应类别的预设关键词对应维度的关键词区域中不存在文本,设置对应维度的标签值为第一标签值;
若每类预设关键词在人力资源信息中存在相同的文本,将所述文本作为对应类别的预设关键词在人力资源信息中对应维度的关键词文本,设置对应类别的预设关键词对应维度的标签值为第二标签值;在每份人力资源信息中,将相邻的两类关键词文本中前一类关键词文本中第一个关键词文本之后,直至后一类关键词文本中第一个关键词文本之前的区域中的所有文本,作为前一类关键词文本对应维度的关键词区域;将最后一类关键词文本中第一个关键词文本之后直至人力资源信息结束的区域中的所有文本,作为最后一类关键词文本对应维度的关键词区域。
3.根据权利要求2所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述综合优势参数的获取方法,包括:
对于每份人力资源信息的任意两个维度,分别将其中一个维度的关键词区域与另一个维度的关键词区域中每个不重复的文本出现的概率代入信息熵公式中,依次得到对应两个维度的文本混乱度;将任意两个维度对应的两个关键词区域中每个不重复的文本出现的概率代入信息熵公式中,得到对应两个维度的文本联合混乱度;将任意两个维度对应的所述文本混乱度之和与所述文本联合混乱度的比值作为对应两个维度的联合影响参数;
统计每个关键词区域中各不重复的文本的个数;
将任意两个维度的关键词区域内不重复的文本的个数之和作为分子,个数的差值绝对值与预设常数的和作为分母得到的比值作为对应两个维度的数量调整值;将任意两个维度的所述数量调整值作为所述联合影响参数的权重进行调整,得到对应两个维度的数量影响参数;
当人力资源信息的维度的标签值为第一标签值时,则对应维度的所述综合优势参数为0;将标签值为第二标签值的任意一个维度与其他任意维度的所述数量影响参数的均值进行负相关并归一化映射,得到对应维度的所述综合优势参数。
4.根据权利要求1所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述同维度优势参数的获取方法,包括:
将每份人力资源信息的任意一个维度的所述层次权重与其他人力资源信息的相同维度的所述层次权重的均值之间的差值,作为每份人力资源信息的对应维度的同维度优势参数。
5.根据权利要求1所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述结合每份人力资源信息的任意维度的所述综合优势参数、所述同维度优势参数与所述维度权值,对人力资源信息进行聚类管理的方法,为:
将所述综合优势参数与所述同维度优势参数分别进行归一化处理,依次得到归一综合优势参数和归一单维优势参数;
以预设第一调整系数作为所述归一综合优势参数的权重,以预设第二调整系数作为所述归一单维优势参数的权重,将每份人力资源信息的每个维度的所述归一综合优势参数与所述归一单维优势参数加权求和,得到每份人力资源信息的每个维度的加权影响参数;将每份人力资源信息的每个维度的所述加权影响参数与对应维度的维度权值的乘积,得到每份人力资源信息的每个维度的最终维度值;
将每份人力资源信息的各维度的所述最终维度值进行累加,得到对应人力资源信息的聚类参数;
利用聚类算法对所述聚类参数进行聚类,得到预设数量个聚类簇;将不同聚类簇内所述聚类参数对应的人力资源信息进行展示。
6.根据权利要求1所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述不重复的文本的获取方法,包括:
利用文本去重算法去除每个所述关键词区域中重复的文本,得到对应关键词区域中不重复的文本。
7.根据权利要求1所述的一种基于数据聚类的人力资源信息管理系统,其特征在于,所述层次权重的获取方法,包括:
当人力资源信息的维度的标签值为第一标签值时,则对应维度的层次权重为0;
基于每个维度的预设筛选内容,利用层次分析法对所有人力资源信息的任意相同维度的关键词区域中文本进行分析,得到每份人力资源信息的每个维度的所述层次权重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310933469.XA CN116644184B (zh) | 2023-07-27 | 2023-07-27 | 基于数据聚类的人力资源信息管理系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310933469.XA CN116644184B (zh) | 2023-07-27 | 2023-07-27 | 基于数据聚类的人力资源信息管理系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116644184A true CN116644184A (zh) | 2023-08-25 |
CN116644184B CN116644184B (zh) | 2023-10-20 |
Family
ID=87623379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310933469.XA Active CN116644184B (zh) | 2023-07-27 | 2023-07-27 | 基于数据聚类的人力资源信息管理系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116644184B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116934284A (zh) * | 2023-09-15 | 2023-10-24 | 济南市人力资源社会保障智慧服务中心 | 基于大数据的人力资源数据管理方法 |
CN117828002A (zh) * | 2024-03-04 | 2024-04-05 | 济宁蜗牛软件科技有限公司 | 一种土地资源信息数据智能管理方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080077570A1 (en) * | 2004-10-25 | 2008-03-27 | Infovell, Inc. | Full Text Query and Search Systems and Method of Use |
CN107766323A (zh) * | 2017-09-06 | 2018-03-06 | 淮阴工学院 | 一种基于互信息和关联规则的文本特征提取方法 |
CN110580286A (zh) * | 2019-08-09 | 2019-12-17 | 中山大学 | 一种基于类间信息熵的文本特征选择方法 |
CN110610446A (zh) * | 2019-07-25 | 2019-12-24 | 东南大学 | 一种基于两步聚类思路的县域城镇分类方法 |
CN110659801A (zh) * | 2019-08-19 | 2020-01-07 | 万马奔腾(上海)数据有限公司 | 一种基于大数据算法的人才测评系统 |
CN111125086A (zh) * | 2018-10-31 | 2020-05-08 | 北京国双科技有限公司 | 获取数据资源的方法、装置、存储介质及处理器 |
CN111461637A (zh) * | 2020-02-28 | 2020-07-28 | 平安国际智慧城市科技股份有限公司 | 简历筛选方法、装置、计算机设备和存储介质 |
CN112001438A (zh) * | 2020-08-19 | 2020-11-27 | 四川大学 | 聚类数目自动选择的多模态数据聚类方法 |
CN112162972A (zh) * | 2020-05-06 | 2021-01-01 | 西安电子科技大学 | 一种基于数据挖掘与隐私保护技术的人力资源双向推荐系统 |
CN115879901A (zh) * | 2023-02-22 | 2023-03-31 | 陕西湘秦衡兴科技集团股份有限公司 | 一种智能人事自助服务平台 |
-
2023
- 2023-07-27 CN CN202310933469.XA patent/CN116644184B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080077570A1 (en) * | 2004-10-25 | 2008-03-27 | Infovell, Inc. | Full Text Query and Search Systems and Method of Use |
CN107766323A (zh) * | 2017-09-06 | 2018-03-06 | 淮阴工学院 | 一种基于互信息和关联规则的文本特征提取方法 |
CN111125086A (zh) * | 2018-10-31 | 2020-05-08 | 北京国双科技有限公司 | 获取数据资源的方法、装置、存储介质及处理器 |
CN110610446A (zh) * | 2019-07-25 | 2019-12-24 | 东南大学 | 一种基于两步聚类思路的县域城镇分类方法 |
CN110580286A (zh) * | 2019-08-09 | 2019-12-17 | 中山大学 | 一种基于类间信息熵的文本特征选择方法 |
CN110659801A (zh) * | 2019-08-19 | 2020-01-07 | 万马奔腾(上海)数据有限公司 | 一种基于大数据算法的人才测评系统 |
CN111461637A (zh) * | 2020-02-28 | 2020-07-28 | 平安国际智慧城市科技股份有限公司 | 简历筛选方法、装置、计算机设备和存储介质 |
WO2021169111A1 (zh) * | 2020-02-28 | 2021-09-02 | 平安国际智慧城市科技股份有限公司 | 简历筛选方法、装置、计算机设备和存储介质 |
CN112162972A (zh) * | 2020-05-06 | 2021-01-01 | 西安电子科技大学 | 一种基于数据挖掘与隐私保护技术的人力资源双向推荐系统 |
CN112001438A (zh) * | 2020-08-19 | 2020-11-27 | 四川大学 | 聚类数目自动选择的多模态数据聚类方法 |
CN115879901A (zh) * | 2023-02-22 | 2023-03-31 | 陕西湘秦衡兴科技集团股份有限公司 | 一种智能人事自助服务平台 |
Non-Patent Citations (2)
Title |
---|
NADIA MAMMONE,等: "Analysis of absence seizure EEG via Permutation Entropy spatio-temporal clustering", 《2011 IEEE INTERNATIONAL SYMPOSIUM ON MEDICAL MEASUREMENTS AND APPLICATIONS》, pages 532 - 535 * |
罗有志;陈征明;陈明;梅文涛;: "一种基于自适应关联熵的关键字提取算法", 计算机与现代化, no. 04, pages 71 - 75 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116934284A (zh) * | 2023-09-15 | 2023-10-24 | 济南市人力资源社会保障智慧服务中心 | 基于大数据的人力资源数据管理方法 |
CN116934284B (zh) * | 2023-09-15 | 2023-12-12 | 济南市人力资源社会保障智慧服务中心 | 基于大数据的人力资源数据管理方法 |
CN117828002A (zh) * | 2024-03-04 | 2024-04-05 | 济宁蜗牛软件科技有限公司 | 一种土地资源信息数据智能管理方法及系统 |
CN117828002B (zh) * | 2024-03-04 | 2024-05-10 | 济宁蜗牛软件科技有限公司 | 一种土地资源信息数据智能管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116644184B (zh) | 2023-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116644184B (zh) | 基于数据聚类的人力资源信息管理系统 | |
CN111324642A (zh) | 一种面向电网大数据分析的模型算法选型与评价方法 | |
KR101681109B1 (ko) | 대표 색인어와 유사도를 이용한 문서 자동 분류 방법 | |
CN104077407B (zh) | 一种智能数据搜索系统及方法 | |
CN110297988A (zh) | 基于加权LDA和改进Single-Pass聚类算法的热点话题检测方法 | |
CN109657011B (zh) | 一种筛选恐怖袭击事件犯罪团伙的数据挖掘系统 | |
CN111738589B (zh) | 基于内容推荐的大数据项目工作量评估方法、装置及设备 | |
CN111680225A (zh) | 基于机器学习的微信金融消息分析方法及系统 | |
WO2021128523A1 (zh) | 一种基于科技大数据的技术成熟度判断方法和系统 | |
CN116739541B (zh) | 一种基于ai技术的智能人才匹配方法及系统 | |
WO2024131524A1 (zh) | 一种基于食物图像分割的抑郁症膳食管理方法 | |
CN109726918A (zh) | 基于生成式对抗网络和半监督学习的个人信用确定方法 | |
CN104850868A (zh) | 一种基于k-means和神经网络聚类的客户细分方法 | |
CN111625578B (zh) | 适用于文化科技融合领域时间序列数据的特征提取方法 | |
CN112529638A (zh) | 基于用户分类和深度学习的服务需求动态预测方法及系统 | |
Gajowniczek et al. | Whole time series data streams clustering: dynamic profiling of the electricity consumption | |
CN113095604B (zh) | 产品数据的融合方法、装置、设备及存储介质 | |
CN114912798A (zh) | 一种基于随机森林和震害大数据的地震损失评估系统 | |
CN109582743A (zh) | 一种针对恐怖袭击事件的数据挖掘方法 | |
CN115146890A (zh) | 企业运营风险告警方法、装置、计算机设备和存储介质 | |
CN116127194A (zh) | 一种企业推荐方法 | |
CN115879901A (zh) | 一种智能人事自助服务平台 | |
CN114971711A (zh) | 业务数据处理方法、装置、设备及存储介质 | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 | |
CN113988149A (zh) | 一种基于粒子群模糊聚类的服务聚类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhang Ling Inventor after: Pan Shuojie Inventor after: Zhu Tiandian Inventor before: Zhu Tiandian |
|
CB03 | Change of inventor or designer information |