CN111598462A - 一种面向校园招聘的简历筛选方法 - Google Patents
一种面向校园招聘的简历筛选方法 Download PDFInfo
- Publication number
- CN111598462A CN111598462A CN202010423601.9A CN202010423601A CN111598462A CN 111598462 A CN111598462 A CN 111598462A CN 202010423601 A CN202010423601 A CN 202010423601A CN 111598462 A CN111598462 A CN 111598462A
- Authority
- CN
- China
- Prior art keywords
- index
- practice
- calculating
- score
- project
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/194—Calculation of difference between files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/105—Human resources
- G06Q10/1053—Employment or hiring
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种面向校园招聘的简历筛选方法,具体方法包括:制定校招简历模板,确立组成模块与指标;导入简历数据与评估数据;模块内分数计算,对应聘者的客观能力进行分段评估或线性评估,使用TF‑IDF法对应聘者的主观描述文字,包括项目工作描述以及实习工作描述进行文本匹配度计算;使用层次分析法(AHP)设定指标间的标度值,并计算各模块与指标的权重;使用TOPSIS法计算应聘者得分与理想解的距离,并依此对应聘者的匹配度进行排序。
Description
技术领域
本发明涉及信息技术领域,具体地,涉及一种面向校园招聘的简历筛选方法。
背景技术
传统的招聘流程中,需要大量的招聘官人工地负责多次面试与筛选的流程,这会耗费大量的人力与时间。
为了使得简历筛选流程更加智能化,一些学者采用了不同的筛选模型来进行简历的信息提取与分数计算,但是都有一定的欠缺:有些模型没有详细指出简历中所有指标的计算方法,因而无法计算最终匹配结果;有些模型仅仅对简历中的长文本描述计分,或仅仅对客观指标进行计分,考量内容不够全面;有的模型采用直接设定权重的方法,缺乏客观科学性;有的模型仅建立针对某个特定岗位的筛选模型,缺乏普遍应用性;多数模型的指标建立不适用于校招的人才招聘需求。
发明内容
鉴于现有技术中的上述缺陷或不足,提供一种面向校园招聘的简历筛选模型与算法。本发明采用的方案如下所述:
第一,制定校招简历模板。包括制定各组成模块与模块内指标。简历模板包含个人信息、教育背景、项目经历、实习经历、个人荣誉、技能水平、学生工作共七个主要构成模块,各模块内部包含若干项具体考察指标。
第二,导入简历数据与评估数据。
第三,模块内分数计算。其中包括:
若该指标为客观填空项,则依据评估数据,实行分层计分或线性计分。
若该指标为主观描述项,则采用TF-IDF算法,计算公司岗位要求与应聘者描述文本的文本相似度。
对项目经历与实习经历模块,通过线性加权综合法计算模块总分。
第四,进行模块与指标权重计算,其中包括:采用层次分析法(AHP)进行模块与指标权重计算,其中包括:建立层次结构模型;采用1-9分标度法制定指标间标度;构造判断(成对比较)矩阵;进行层次排序及其一致性检验,若通过检验则计算生成权重,否则重新构造判断矩阵并再次进行一致性检验,直至检验通过为止;对项目经历与实习经历模块,通过线性加权综合法计算模块总分;
第五,进行匹配度计算与排序,其中包括:将每个应聘者的指标分数排列成向量;向量规范化,计算规范决策矩阵;构造加权规范阵;确定正理想解和负理想解;计算各应聘者分数向量到正理想解和负理想解的距离;计算各分数向量的排序指标值,并由大到小排列优劣次序,即为应聘者匹配度排序。
本发明的有益效果为:提供一种面向校园招聘的简历筛选方法,设立适合校招综合人才筛选规则的、详细到每个指标的简历模板与计分方法,采用AHP使得权重值设定更加合理,采用TOPSIS使得匹配度计算结果更加合理。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出了本申请实施例提供的校园招聘简历筛选方法的流程示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
请参考图1,图1示出了本申请实施例提供的校园招聘简历筛选模型与算法的流程示意图。
如图1所示,该方法包括:
1)制定校招简历模板。模板包括个人信息、教育背景、项目经历、实习经历、个人荣誉、技能水平、学生工作共七个主要构成模块,其中除个人信息模块外,其余六个模块均为参与评估与计分的模块。各模块内部由细分指标组成,计分均以指标为最小单位。
2)简历数据导入。导入用于测试评估结果的校招简历15份。每份简历都依照简历模板的模块与指标进行填写。
3)评估数据导入。导入作为评估依据的所有数据,包括:①教育背景模块:《2020年QS世界大学排名》、《软科2019中国最好大学排名》、《2019全国高等院校名单》、《普通高等学校本科专业目录(2020年版)》;②项目经历模块:《厦门大学核心学术刊物目录(2013年版)》;③实习经历模块:《2019年《财富》世界500强排行榜》、《2019福布斯全球数字经济100强榜》、BOSS直聘岗位分类表;④其他数据:来源于BOSS直聘网的4000份各行各业招聘要求。
4)模块内分数计算。在说明模块内计算规则前,首先界定关于模块内指标的若干概念。指标分为两种类型:客观性指标和主观性指标。客观性指标指具有固定答案集,而不包含主观描述的填写指标,如就读学校、绩点等。该类指标的计分方式分为两种:对于数值型指标,如绩点,直接记录数值,待进入下一步的规范化操作;对于非数值型的指标,如就读学校,查找其在相应数据库中的位置,而后采取分层赋分或线性赋分。
主观性指标指包含主观描述的填写指标,在本发明中只有项目工作描述和实习工作描述为主观性指标。对于主观性指标,采用TF-IDF算法。首先导入公司岗位要求文本以及应聘者工作描述文本,进行分词处理与停用词过滤,并计算每个词的词频。然后以BOSS直聘网的4000份各行各业招聘要求作为文档库,分别计算上述两个文本中每个词的逆文档频率,从大到小排列得到词频向量。最后计算二者词频向量的余弦相似度得到匹配度,即为该指标最终得分。
主观性指标,使用如下步骤提取其包含的客观性因素,避免主观因素影响,从而计算指标得分,具体步骤如下:
导入公司岗位要求文本以及应聘者项目工作描述文本;
采用HanLP进行分词处理与停用词过滤;
分别计算两个文本中每个词的TF值,计算公式为:
其中ni,j为该词在该文本段中的出现次数,∑r nk,j为该文本段的总词数;
载入各行业招聘要求作为文本库,利用TF-IDF算法降低所有岗位要求中模糊性主观性常用词的重要度,提升具体技能、专业术语关键词的重要度;
计算两个文本中每个词的IDF值,并将所有词按照TF-IDF值从大到小的顺序排列,其中IDF值计算公式为:
其中|D|为文本库的文件总数,|{j:ti∈dj}|为包含词语ti的文件数量,
TF-IDF值计算公式为:
tfidfi,j=tfi,j×idfi;
从两段文本分别提取排于前20位的词,合并起来得到关键词字典,分别将两段文本的词及TF-IDF值对照该字典,生成二者的词频向量,若某文本的词汇数不到20,则提取所有词汇,若两段文本有相同词汇,则合并字典时归为同一个词汇;
计算二者词频向量的余弦相似度得到匹配度,即为该指标最终得分,计算方法为:
其中A,B为两个向量,Ai,Bi分别为A,B的分量。
下面以简历模块为单位,对所有计分指标的计分规则进行说明。
教育背景模块共包含4个计分指标:就读学校、专业、绩点、学历。
就读学校采用《2020年QS世界大学排名》、《软科2019中国最好大学排名》、《2019全国高等院校名单》作为评估数据。首先参照评估数据与表1,得出应聘者就读学校所属的学校档位。若其属于排名外高等院校或专科及以下院校,则直接赋予相应分数;否则根据该学校的具体的排名计算分数。计算公式为
其中S为就读学校指标分数,r为学校在该档位数据库下的排名,Smax,Smin分别为该档位分数的最大值、最小值,rmax,rmin分别为该档位排名数值的最大值、最小值。
学校档位 | 分数段 |
QS世界排名1-500名 | 71-100 |
QS世界排名501-600 | 61-70 |
QS世界排名601-800 | 51-60 |
QS世界排名801-1000 | 41-50 |
QS世界排名外,软科中国大学排名1-600名 | 31-40 |
软科中国大学排名外,高等院校(本科) | 20 |
专科及以下 | 10 |
表1
专业采用《普通高等学校本科专业目录(2020年版)》作为评估数据。参照专业目录,得出应聘者专业与公司期望专业的关系,并参照表2赋予相应分数。
关系 | 分数 |
同一专业名称 | 100 |
同一专业类 | 80 |
同一门类 | 50 |
其他 | 30 |
表2
绩点为数据型指标,直接记录为分数。
学历为系数,分为“博士”、“硕士”、“本科”、“本科以下”四种类型,系数取值分别为1.5,1.2,1,0.8。学历系数分别乘以就读学校、专业、绩点的分数,为就读学校、专业、绩点三个指标的最终分数。
项目经历模块共包含6个计分指标:项目等级、项目工作描述、奖项、论文、专利、软件著作权。需要指出,每段项目经历的指标分数采用单独计分。
项目等级分为国际级、国家级、省市级、校级/单位级、院级/部门级、个人级,共六个等级,赋予分数参见表3。
项目等级 | 分数 |
国际级 | 6 |
国家级 | 5 |
省市级 | 4 |
校级/单位级 | 3 |
院级/部门级 | 2 |
个人级 | 1 |
表3
项目工作描述为主观性指标,计分算法采用TF-IDF方法,具体实施流程请参照上文主观性指标计分说明。
奖项指标内含奖项级别、奖项等级两个计分相关指标。奖项级别分为国际级、国家级、区域级、省市级、校级/单位级、院级/部门级,共六个级别,奖项等级分为一等奖、二等奖、其余,共三个等级。根据奖项级别、奖项等级的类别来赋予奖项指标分数,计分方法参见表4。
表4
论文指标内含收录情况、期刊全称、作者身份三个计分相关指标,采用《厦门大学核心学术刊物目录(2013年版)》作为评估数据。若该论文被《厦门大学核心学术刊物目录(2013年版)》中列举的会议所收录,则为一类核心学术刊物;否则,若该论文刊登于《厦门大学核心学术刊物目录(2013年版)》中列举的二类期刊,则为二类核心学术刊物;否则为其他公开出版的学术刊物(含学术会议论文集)。作者身份分为第一作者、第二作者、第三作者、第四作者,共四个等级。根据论文类别、作者身份来赋予论文指标分数,计分方法参见表5。
表5
专利指标内含专利类型、作者身份两个计分相关指标。专利类型分为发明专利、实用新型专利,共两种类型,作者身份分为第一专利人、第二专利人、第三专利人、第四专利人,共四个等级。根据专利类型、作者身份来赋予专利指标分数,计分方法参见表6。
专利类型\作者身份 | 第一专利人 | 第二专利人 | 第三专利人 | 第四专利人 |
发明专利 | 5 | 3 | 2 | 1 |
实用新型专利 | 3 | 2 | 1 | 1 |
表6
软件著作权指标内含作者身份一个计分相关指标。作者身份分为第一著作权人、第二著作权人、第三、第四著作权人,共三个等级。根据作者身份来赋予软件著作权指标分数,计分方法参见表7。
表7
实习经历模块共包含5个计分指标:实习单位综合排名、实习单位行业排名、实习岗位、实习工作描述、实习时长。需要指出,每段实习经历的指标分数采用单独计分。
实习单位综合排名采用《2019年《财富》世界500强排行榜》作为评估数据。若该单位不在排名内,则赋予70分;否则根据该单位的具体的排名计算分数。计算公式为
其中S为实习单位综合排名指标分数,r为该单位在排行榜中的排名,Smax,Smin分别为分数的最大值、最小值,取值分别为100,80。rmax,rmin分别为排名数值的最大值、最小值,取值分别为500,1。
实习单位行业排名采用《2019福布斯全球数字经济100强榜》作为评估数据。需要指出,此数据为适用于IT行业的排名数据,在此仅作为IT岗位的校招演示例。若要将此方法应用到其他行业的校招,则需另选取该行业的排名数据作为评估数据。若该单位不在排名内,则赋予70分;否则根据该单位的具体的排名计算分数。计算公式为
其中S为实习单位行业排名指标分数,r为该单位在排行榜中的排名,Smax,Smin分别为分数的最大值、最小值,取值分别为100,80。rmax,rmin分别为排名数值的最大值、最小值,取值分别为100,1。
实习岗位指标采用BOSS直聘岗位分类表作为评估数据。岗位分类表中,每个岗位具有类别、子分类、岗位名称三个属性。参照岗位分类表,得出应聘者实习岗位与公司招聘岗位的关系,并参照表8赋予相应分数。
关系 | 分数 |
相同 | 100 |
同一子分类 | 70 |
同一类别 | 40 |
非同类别 | 0 |
表8
实习工作描述为主观性指标,计分算法采用TF-IDF方法,具体实施流程请参照上文主观性指标计分说明。
实习时长为系数,单位为年。实习时长系数分别乘以实习单位综合排名、实习单位行业排名、实习岗位、实习工作描述,为实习单位综合排名、实习单位行业排名、实习岗位、实习工作描述四个指标的最终分数。
个人荣誉模块共包含1个计分指标:个人荣誉。需要指出,个人荣誉模块的总分为所有个人荣誉分数的总和。
个人荣誉指标内含荣誉级别、荣誉等级两个计分相关指标。荣誉级别分为国际级、国家级、省市级、校级/单位级、院级/部门级,共五个级别,荣誉等级分为一等奖、二等奖、其他,共三个等级。根据荣誉级别、荣誉等级的类别来赋予个人荣誉分数,计分方法参见表9。
荣誉级别/荣誉等级 | 一等奖 | 二等奖 | 其他 |
国际级 | 6分 | 5 | 4 |
国家级 | 5分 | 4 | 3 |
省市级 | 4分 | 3 | 2 |
校级/单位级 | 3分 | 2 | 1 |
院级/部门级 | 2分 | 1 | 0 |
表9
技能水平模块共包含4个计分指标:基本技能、附加技能、四六级、托福雅思。
基本技能、附加技能为掌握技能模块的两个计分指标。基本技能指公司要求应聘者掌握的技能。附加技能包含推荐技能和非推荐技能。推荐技能指公司希望应聘者具有的技能。公司某岗位需求的基本技能、推荐技能包含哪些,由公司内部自行制定。
应聘者填写掌握技能模块时,仅填写技能名称及各技能的熟练程度。熟练程度分为“精通”、“熟练”、“一般”三个等级。
在计分时,首先对应聘者填写的掌握技能进行分类。若其在公司的基本技能集合内,则按照基本技能计分标准计分;否则按照附加技能计分标准计分。
对于属于基本技能的技能,计分规则见表10。基本技能指标总分为属于基本技能的分数总和。
熟练程度 | 得分 |
精通 | 10 |
熟练 | 8 |
一般 | 6 |
表10
对于属于附加技能的技能,计分规则见表11。附加技能指标总分为属于附加技能的分数总和。
熟练程度 | 得分(推荐技能) | 得分(非推荐技能) |
精通 | 6 | 3 |
掌握 | 4 | 2 |
一般 | 3 | 1 |
表11
四六级指标计分规则见表12。若应聘者同时填写了四级成绩和六级成绩,则指标分数只取四六级分数按照表12计算后得分较高的一项。
分数 | CET4 | CET6 |
<420 | 4 | 5 |
420-500 | 6 | 8 |
500-600 | 8 | 9 |
600+ | 9 | 10 |
表12
托福雅思指标计分方法见表13。若应聘者同时填写了雅思成绩和托福成绩,则指标分数只取雅思托福分数按照表13计算后得分较高的一项。
雅思分数 | 托福分数 | 指标分数 |
0-4 | 0-31 | 4 |
4.5 | 32-34 | 4.5 |
5 | 35-45 | 5 |
5.5 | 46-59 | 5.5 |
6 | 60-78 | 6 |
6.5 | 79-93 | 6.5 |
7 | 94-101 | 7 |
7.5 | 102-109 | 7.5 |
8 | 110-114 | 8 |
8.5 | 115-117 | 8.5 |
9 | 118-120 | 9 |
表13
学生工作模块共包含1个计分指标:学生工作。需要指出,学生工作模块的总分为所有学生工作分数的总和。
学生工作指标内含工作级别、职位类型两个计分相关指标。工作级别分为班级、院级、校级、省市级及以上,共四个级别,职位类型分为主席、副主席、部长、副部长、干事,共五个等级。根据工作级别、职位类型的类别来赋予学生工作分数,计分方法参见表14。
工作级别/职位类型 | 主席 | 副主席 | 部长 | 副部长 | 干事 |
班级 | 3 | 2 | 2 | 1 | 0 |
院级 | 4 | 3 | 3 | 2 | 1 |
校级 | 5 | 4 | 3 | 2 | 1 |
省市级及以上 | 6 | 5 | 4 | 3 | 2 |
表14
5)采用层次分析法(AHP)进行模块与指标权重计算。表15示出了简历筛选模型的层次结构模型图。
表15
以每个指标(最后一层除外)及其下一层隶属的指标为单位,依据1-9分标度法,构造判断矩阵。共计构造9个判断矩阵:判断矩阵Z-A,判断矩阵A1-B1B2B3,判断矩阵A2-B4B5B6,判断矩阵A3-B7B8B9,判断矩阵A5-B10B11,判断矩阵B6-C1C2C3C4,判断矩阵B7-C5C6,判断矩阵B10-C7C8,判断矩阵B11-C9C10。
针对每个判断矩阵计算权重,并进行一致性检验。若检验通过,则设定相应权重;若某判断矩阵检验未通过,则重新构造该矩阵,并重新进行权重计算及一致性检验,直至检验通过。
对于项目经历、实习经历两个模块,由于经历个数不定,有不定数的指标数量,因此无法直接进入TOPSIS运算。故需对项目经历、实习经历两个模块的总分分别进行计算。首先汇总所有应聘者项目经历的B4、B5、C1、C2、C3、C4指标,以及实习经历的C5、C6、B8、B9指标分数,对这些指标分别运用极值标准化法进行规范化,然后采用线性加权综合法计算总分。
项目经历的总分为
其中SA2为项目经历总分,i为项目的序数,j为C级指标(第四层指标)的下标,wB4,wB5,wB6分别为项目等级、项目工作描述、项目成果的权重,SB4i,SB5i分别为第i个项目的项目等级、项目工作的分数,cji代表第i个项目的cj指标。
实习经历的总分为
其中SA3为实习经历总分,i为实习经历的序数,j为C级指标(第四层指标)的下标,ti为第i个实习经历的时长,wB7,wB8,wB9分别为实习单位、实习岗位、实习工作描述的权重,SB8i,SB9i分别为第i个项目的实习岗位、实习工作描述的分数,cji代表第i个实习经历的cj指标。
6)采用TOPSIS法进行匹配度计算与排序。除项目经历、实习经历以模块总分为指标外,其他模块均取最末端层的指标进入匹配度计算。进入计算的指标及其对应权重见表16。
指标 | 权重 |
就读学校 | w<sub>A1</sub>·w<sub>B1</sub> |
专业 | w<sub>A1</sub>·w<sub>B2</sub> |
绩点 | w<sub>A1</sub>·w<sub>B3</sub> |
项目经历 | w<sub>A2</sub> |
实习经历 | w<sub>A3</sub> |
个人荣誉 | w<sub>A4</sub> |
基本技能 | w<sub>A5</sub>·w<sub>B10</sub>·w<sub>C7</sub> |
附加技能 | w<sub>A5</sub>·w<sub>B10</sub>·w<sub>C8</sub> |
四六级 | w<sub>A5</sub>·w<sub>B11</sub>·w<sub>C9</sub> |
托福雅思 | w<sub>A5</sub>·w<sub>B11</sub>·w<sub>C10</sub> |
学生工作 | w<sub>A6</sub> |
表16
匹配度计算方法遵循TOPSIS常规计算方法:第一步,将每个应聘者的上述指标分数排列成向量,并进行向量规范化,求得规范决策矩阵;第二步;构造加权规范阵;第三步,确定正理想解和负理想解;第四步,计算各应聘者分数向量到正理想解和负理想解的距离;第五步,计算各分数向量的排序指标值,并由大到小排列优劣次序,即为应聘者匹配度排序。
由于TOPSIS的评判是基于多指标的,且是按照离群体最优解最接近、最劣解最远的原理进行决策的优劣分析,因此适用于本项目中基于多指标对应聘者进行评估的情境。计算步骤如下:
数据预处理,对于项目经历、实习经历两个模块,由于经历个数不定,有不定数的指标数量,先对项目经历、实习经历两个模块的总分分别进行计算,首先汇总所有应聘者项目经历的项目等级、项目工作描述、奖项、论文、专利、软件著作权指标,以及实习经历的综合排名、行业排名、实习岗位、实习工作描述指标分数,对这些指标分别运用极值标准化法进行规范化,极值标准化后的分数为
其中xij为第i个应聘者在第j个指标的分数值,mj=mini{xij},Mj=maxi{xij}。
然后采用线性加权综合法计算总分,项目经历的总分为
其中SA2为项目经历总分,i为项目的序数,j为第四层指标的下标,wB4,wB5,wB6分别为项目等级、项目工作描述、项目成果的权重,SB4i,SB5i分别为第i个项目的项目等级、项目工作的分数,SCji代表第i个项目的Cj指标的分数。
实习经历的总分为
其中SA3为实习经历总分,i为实习经历的序数,j为第四层指标的下标,ti为第i个实习经历的时长,wB7,wB8,wB9分别为实习单位、实习岗位、实习工作描述的权重,SB8i,SB9i分别为第i个项目的实习岗位、实习工作描述的分数,SCji代表第i个实习的Cj指标的分数。
确定进入TOPSIS计算的指标与权重,除项目经历、实习经历以模块总分为指标外,其他模块均取最末端层的指标进入TOPSIS计算,通过AHP计算出各指标在各自层的权重后,需要计算其在总体模型中的权重,各指标的权重为
步骤c、将样本的指标的得分组成决策矩阵,并计算规范化决策矩阵,生成的规范化决策矩阵;
步骤d、进行TOPSIS匹配度计算。
以上方法还可以进一步的用于团队式招聘,包括:
招聘单位某项目需要若干岗位,这些岗位组成一个团队,输入一个项目团队的岗位需求组合;
将团队的岗位需求组合分解成指标集合;
对应聘者进行评估,进行匹配度计算后,输出符合招聘单位最低要求的应聘者集合;
将团队岗位需求组合的指标集合与应聘者集合进行双向匹配,求出满足团队所有岗位需求的应聘者组合,使得应聘者组合能覆盖团队岗位需求组合的指标集合,并且使得应聘者组合的成员数量最少。这样使得招聘单位以最少的应聘者完成一个项目。
以上内容是结合具体的优选实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。
Claims (5)
1.一种面向校园招聘的简历筛选方法,其特征在于,包括:
步骤1、制定校招简历模板,包括制定各组成模块与模块内指标;
步骤2、导入简历数据与评估数据;
步骤3、模块内分数计算,其中包括:
若该指标为客观填空项,则依据评估数据,实行分层计分或线性计分;
若该指标为主观描述项,计算公司岗位要求与应聘者描述文本的文本相似度;
步骤4、进行模块与指标权重计算,具体包括:
步骤4.1、建立层次结构模型;
步骤4.2、采用1-9分标度法制定指标间标度;
步骤4.3、构造判断矩阵;
步骤4.4、进行层次排序及其一致性检验,若通过检验则计算生成权重,否则重新构造判断矩阵并再次进行一致性检验,直至检验通过为止;
步骤4.5、对项目经历与实习经历模块,通过线性加权综合法计算模块总分;
步骤5、进行匹配度计算与排序,其中包括:
步骤5.1、将每个应聘者的指标分数排列成向量;
步骤5.2、向量规范化,计算规范决策矩阵;
步骤5.3、构造加权规范阵;
步骤5.4、确定正理想解和负理想解;
步骤6、计算各应聘者分数向量到正理想解和负理想解的距离;
步骤7、计算各分数向量的排序指标值,并由大到小排列优劣次序,即为应聘者匹配度排序。
2.根据权利要求1所述的方法,其特征在于,对主观性指标,使用如下步骤提取其包含的客观性因素,避免主观因素影响,从而计算指标得分,具体步骤如下:
导入公司岗位要求文本以及应聘者项目工作描述文本;
采用HanLP进行分词处理与停用词过滤;
分别计算两个文本中每个词的TF值,计算公式为:
其中ni,j为该词在该文本段中的出现次数,∑knk,j为该文本段的总词数;
载入各行业招聘要求作为文本库,利用TF-IDF算法降低所有岗位要求中模糊性主观性常用词的重要度,提升具体技能、专业术语关键词的重要度;
计算两个文本中每个词的IDF值,并将所有词按照TF-IDF值从大到小的顺序排列,其中IDF值计算公式为:
其中|D|为文本库的文件总数,|{j:ti∈dj}|为包含词语ti的文件数量,
TF-IDF值计算公式为:
tfidfi,j=tfi,j×idfi;
从两段文本分别提取排于前20位的词,合并起来得到关键词字典,分别将两段文本的词及TF-IDF值对照该字典,生成二者的词频向量,若某文本的词汇数不到20,则提取所有词汇,若两段文本有相同词汇,则合并字典时归为同一个词汇;
计算二者词频向量的余弦相似度得到匹配度,即为该指标最终得分,计算方法为:
其中A,B为两个向量,Ai,Bi分别为A,B的分量。
3.根据权利要求1所述的方法,其特征在于,在简历筛选环节适合采用AHP进行模块与指标权重计算,计算步骤如下:
建立层次结构模型;
构造判断矩阵;
层次单排序;
一致性检验。
4.根据权利要求3所述的方法,其特征在于,基于多指标对应聘者进行评估,步骤如下:
步骤a、数据预处理,对于项目经历、实习经历两个模块,由于经历个数不定,有不定数的指标数量,先对项目经历、实习经历两个模块的总分分别进行计算,首先汇总所有应聘者项目经历的项目等级、项目工作描述、奖项、论文、专利、软件著作权指标,以及实习经历的综合排名、行业排名、实习岗位、实习工作描述指标分数,对这些指标分别运用极值标准化法进行规范化,极值标准化后的分数为
然后采用线性加权综合法计算总分,项目经历的总分为
其中SA2为项目经历总分,i为项目的序数,j为第四层指标的下标,wB4,wB5,wB6分别为项目等级、项目工作描述、项目成果的权重,SB4i,SB5i分别为第i个项目的项目等级、项目工作的分数,SCji代表第i个项目的Cj指标的分数;
实习经历的总分为
其中SA3为实习经历总分,i为实习经历的序数,j为第四层指标的下标,ti为第i个实习经历的时长,wB7,wB8,wB9分别为实习单位、实习岗位、实习工作描述的权重,SB8i,SB9i分别为第i个项目的实习岗位、实习工作描述的分数,SCji代表第i个实习的Cj指标的分数;
步骤b、确定进入TOPSIS计算的指标与权重,除项目经历、实习经历以模块总分为指标外,其他模块均取最末端层的指标进入TOPSIS计算,通过AHP计算出各指标在各自层的权重后,需要计算其在总体模型中的权重,各指标的权重为
步骤c、将样本的指标的得分组成决策矩阵,并计算规范化决策矩阵,生成的规范化决策矩阵;
步骤d、进行TOPSIS匹配度计算。
5.根据权利要求4所述的方法,其特征在于,还可以用于团队式招聘,包括:
招聘单位某项目需要若干岗位,这些岗位组成一个团队,输入一个项目团队的岗位需求组合;
将团队的岗位需求组合分解成指标集合;
对应聘者进行评估,进行匹配度计算后,输出符合招聘单位最低要求的应聘者集合;
将团队岗位需求组合的指标集合与应聘者集合进行双向匹配,求出满足团队所有岗位需求的应聘者组合,使得应聘者组合能覆盖团队岗位需求组合的指标集合,并且使得应聘者组合的成员数量最少。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010423601.9A CN111598462B (zh) | 2020-05-19 | 2020-05-19 | 一种面向校园招聘的简历筛选方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010423601.9A CN111598462B (zh) | 2020-05-19 | 2020-05-19 | 一种面向校园招聘的简历筛选方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111598462A true CN111598462A (zh) | 2020-08-28 |
CN111598462B CN111598462B (zh) | 2022-07-12 |
Family
ID=72188965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010423601.9A Active CN111598462B (zh) | 2020-05-19 | 2020-05-19 | 一种面向校园招聘的简历筛选方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111598462B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541691A (zh) * | 2020-12-21 | 2021-03-23 | 合肥和创讯为智能科技有限公司 | 一种基于ai的动态任职资格评定方法及系统 |
CN113902290A (zh) * | 2021-09-14 | 2022-01-07 | 中国人民解放军军事科学院评估论证研究中心 | 一种面向评估任务的专家匹配效度测算方法 |
CN113988825A (zh) * | 2021-12-28 | 2022-01-28 | 深圳共链科技有限公司 | 基于用户画像的职位推荐方法、装置、终端及可读存储介质 |
CN114239901A (zh) * | 2021-10-15 | 2022-03-25 | 成都精诚睿软件有限责任公司 | 一种用于干部动议的人岗适配度预估方法 |
CN115293131A (zh) * | 2022-09-29 | 2022-11-04 | 广州万维视景科技有限公司 | 数据匹配方法、装置、设备及存储介质 |
CN116452163A (zh) * | 2023-02-14 | 2023-07-18 | 广东尊一互动科技有限公司 | 一种基于大数据的人才招聘管理系统及方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110078154A1 (en) * | 2009-09-28 | 2011-03-31 | Accenture Global Services Gmbh | Recruitment screening tool |
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN106447285A (zh) * | 2016-09-12 | 2017-02-22 | 北京大学 | 基于多维度领域关键知识的招聘信息匹配方法 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及系统 |
CN107862079A (zh) * | 2017-11-29 | 2018-03-30 | 四川九鼎智远知识产权运营有限公司 | 一种在线简历匹配平台 |
CN109165295A (zh) * | 2018-09-27 | 2019-01-08 | 天涯社区网络科技股份有限公司 | 一种智能简历评估方法 |
CN109345198A (zh) * | 2018-09-17 | 2019-02-15 | 平安科技(深圳)有限公司 | 简历筛选方法、装置、计算机设备及存储介质 |
KR101964632B1 (ko) * | 2017-12-26 | 2019-04-02 | (주)사람인에이치알 | 구인 구직 서비스에서의 이력서 양식 제공 방법 |
WO2019108133A1 (en) * | 2017-11-30 | 2019-06-06 | X0Pa Ai Pte Ltd | Talent management platform |
CN110442841A (zh) * | 2019-06-20 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别简历的方法及装置、计算机设备、存储介质 |
CN110909120A (zh) * | 2018-09-14 | 2020-03-24 | 阿里巴巴集团控股有限公司 | 简历搜索/投递方法、装置、系统及电子设备 |
-
2020
- 2020-05-19 CN CN202010423601.9A patent/CN111598462B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110078154A1 (en) * | 2009-09-28 | 2011-03-31 | Accenture Global Services Gmbh | Recruitment screening tool |
CN105159962A (zh) * | 2015-08-21 | 2015-12-16 | 北京全聘致远科技有限公司 | 职位推荐方法与装置、简历推荐方法与装置、招聘平台 |
CN106447285A (zh) * | 2016-09-12 | 2017-02-22 | 北京大学 | 基于多维度领域关键知识的招聘信息匹配方法 |
CN107590133A (zh) * | 2017-10-24 | 2018-01-16 | 武汉理工大学 | 基于语义的招聘职位与求职简历匹配的方法及系统 |
CN107862079A (zh) * | 2017-11-29 | 2018-03-30 | 四川九鼎智远知识产权运营有限公司 | 一种在线简历匹配平台 |
WO2019108133A1 (en) * | 2017-11-30 | 2019-06-06 | X0Pa Ai Pte Ltd | Talent management platform |
KR101964632B1 (ko) * | 2017-12-26 | 2019-04-02 | (주)사람인에이치알 | 구인 구직 서비스에서의 이력서 양식 제공 방법 |
CN110909120A (zh) * | 2018-09-14 | 2020-03-24 | 阿里巴巴集团控股有限公司 | 简历搜索/投递方法、装置、系统及电子设备 |
CN109345198A (zh) * | 2018-09-17 | 2019-02-15 | 平安科技(深圳)有限公司 | 简历筛选方法、装置、计算机设备及存储介质 |
CN109165295A (zh) * | 2018-09-27 | 2019-01-08 | 天涯社区网络科技股份有限公司 | 一种智能简历评估方法 |
CN110442841A (zh) * | 2019-06-20 | 2019-11-12 | 平安科技(深圳)有限公司 | 识别简历的方法及装置、计算机设备、存储介质 |
Non-Patent Citations (1)
Title |
---|
李成铭: ""基于文本特征提取技术的在线人职匹配研究及应用"", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112541691A (zh) * | 2020-12-21 | 2021-03-23 | 合肥和创讯为智能科技有限公司 | 一种基于ai的动态任职资格评定方法及系统 |
CN113902290A (zh) * | 2021-09-14 | 2022-01-07 | 中国人民解放军军事科学院评估论证研究中心 | 一种面向评估任务的专家匹配效度测算方法 |
CN114239901A (zh) * | 2021-10-15 | 2022-03-25 | 成都精诚睿软件有限责任公司 | 一种用于干部动议的人岗适配度预估方法 |
CN113988825A (zh) * | 2021-12-28 | 2022-01-28 | 深圳共链科技有限公司 | 基于用户画像的职位推荐方法、装置、终端及可读存储介质 |
CN113988825B (zh) * | 2021-12-28 | 2022-04-12 | 深圳共链科技有限公司 | 基于用户画像的职位推荐方法、装置、终端及可读存储介质 |
CN115293131A (zh) * | 2022-09-29 | 2022-11-04 | 广州万维视景科技有限公司 | 数据匹配方法、装置、设备及存储介质 |
CN115293131B (zh) * | 2022-09-29 | 2023-01-06 | 广州万维视景科技有限公司 | 数据匹配方法、装置、设备及存储介质 |
CN116452163A (zh) * | 2023-02-14 | 2023-07-18 | 广东尊一互动科技有限公司 | 一种基于大数据的人才招聘管理系统及方法 |
CN116452163B (zh) * | 2023-02-14 | 2023-11-28 | 广东尊一互动科技有限公司 | 一种基于大数据的人才招聘管理系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111598462B (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111598462B (zh) | 一种面向校园招聘的简历筛选方法 | |
CN111401040B (zh) | 一种适用于word文本的关键词提取方法 | |
CN111709575A (zh) | 基于c-lstm的学业成绩预测方法 | |
CN116362699A (zh) | 一种岗位匹配报告生成方法 | |
Grinäv | The disadvantages of using scientometric indicators in the digital age | |
Yarotskaya et al. | Reviewing learning and teaching content in the scope of artificial intelligence: For humanities and social sciences majors | |
Crowley-Vigneau et al. | World-class universities in Russia: a contested norm and its implementation | |
Reyes | Social research: A deductive approach | |
CN112685470B (zh) | 基于学分银行和大数据分析的终身学习资源智能推送方法 | |
Taleby et al. | Financial Assessment using a Fuzzy Analytical Hierarchical Process Method | |
Siddiqui et al. | Deep learning model for automated trainee assessment during high-fidelity simulation | |
Aleynikova et al. | Learning and teaching in the contexts of artificial intelligence: Transforming content for the humanities | |
Wahid et al. | The Decision Support System of Students Recruitment as Teacher Candidates using Multilevel Multi Attribute Utility Theory (MAUT) | |
Nassa et al. | Five Years of India Rankings and its Impact on Performance Parameters of Engineering Educational Institutions in India. Pt. 1. Teaching, Learning and Resources, Graduate Outcome, Outreach and Inclusivity and Perception. | |
Jeyapragash et al. | An Analysis of UGC Approved Library and Information Science Journals | |
Kaibassova et al. | Data Acquisition Model for an Intelligent System Integrating the Creation of Educational Programs and Professional Standards | |
Casamonti et al. | Gendered Language in Academic Evaluations: Evidence from the Italian University System | |
Guo | Decision support system for manuscript submissions to academic journals: An example of submitting an enterprise resource planning manuscript | |
Chukwuma et al. | Exploring Behavioral Competencies for Effective Medical Practice in Nigeria | |
Gao | Evaluation of Intelligent Student (Work) Management and Evaluation Information System Based on K-means Algorithm | |
Huang | The Factors Influencing Chinese Students to Study in Thailand During Covid-19 Pandemic | |
Menekşe et al. | EXAMINATION OF HIGH SCHOOL ENTRANCE SYSTEM (LGS) SCIENCE TEST “MATTER AND ITS NATURE” AND “PHYSICAL PHENOMENA” SUBJECT AREA EXAM QUESTIONS IN TERMS OF REVISED BLOOM’S TAXONOMY | |
Liu et al. | Data-Driven Discriminable Factors Analytics of Teaching Performance Ratings for College Teachers | |
Al-Fadl | Corpus linguistics approach to in-service teacher development | |
Jassim et al. | Evaluating Teaching Methods Articles Published in First Quartile Journals in the Light of Suggested Criteria |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |