一种基于多维度画像的高层次人才推荐方法、系统及介质与流程
未命名
09-17
阅读:128
评论:0

1.本发明涉及人才推荐技术领域,特别涉及一种基于多维度画像的高层次人才推荐方法、系统及介质。
背景技术:
2.目前,随着人工智能技术的发展和应用,高层次人才推荐已经逐渐从传统的人工筛选向智能化推荐转变。然而,现有的高层次人才推荐方法和系统仍然存在着一定的局限性和不足。第一,推荐结果不够准确:传统的算法模型主要是基于人才的职位和简历信息进行推荐,没有考虑用户的地理位置和行业背景等因素,导致推荐结果不够准确。第二,用户画像不够精细:传统的人才画像技术主要基于用户填写的信息,而往往存在填写不全或者填写不真实的情况,导致用户画像不够精细。
技术实现要素:
3.本发明要解决的技术问题,在于提供一种基于多维度画像的高层次人才推荐方法、系统及介质,通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,提高高层次人才招聘的匹配度。
4.第一方面,本发明提供了一种基于多维度画像的高层次人才推荐方法,包括:
5.数据获取过程:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;
6.画像建立过程:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;
7.推荐模型构建过程:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
8.职位推荐过程:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
9.进一步地,所述基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:
10.步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
11.步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样
本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
12.步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
13.步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
14.步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
[0015][0016]
其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
[0017]
进一步地,推荐模型构建过程中,基于职位画像的推荐模型公式如下:
[0018][0019]
其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,...,hn}表示学术特征向量,r={r1,r2,r3,
…
,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
[0020]
基于地理区域画像的推荐模型公式如下:
[0021][0022]
其中,g={g1,g2,g3,
…
,gm}表示求职区域的地理特征向量,e={e1,e2,e3,
…
,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。
[0023]
进一步地,所述多维度用户画像中,基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。
[0024]
第二方面,本发明提供了一种基于多维度画像的高层次人才推荐系统,包括:
[0025]
数据获取模块:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;
[0026]
画像建立模块:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;
[0027]
推荐模型构建模块:采用聚类算法和相似度算法构建基于用户画像的推荐模型,
用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
[0028]
职位推荐模块:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
[0029]
进一步地,所述推荐模型构建模块中,基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:
[0030]
步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
[0031]
步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
[0032]
步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
[0033]
步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
[0034]
步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
[0035][0036]
其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
[0037]
进一步地,推荐模型构建模块中,基于职位画像的推荐模型公式如下:
[0038][0039]
其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,
…
,hn}表示学术特征向量,r={r1,r2,r3,
…
,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
[0040]
基于地理区域画像的推荐模型公式如下:
[0041][0042]
其中,g={g1,g2,g3,
…
,gm}表示求职区域的地理特征向量,e={e1,e2,e3,
…
,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似
度。
[0043]
进一步地,所述画像建立模块中,多维度用户画像的基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。
[0044]
第三方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
[0045]
本发明实施例中提供的方案,至少具有如下优点:
[0046]
1、提高高层次人才招聘的匹配度:通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,能够提高高层次人才招聘的匹配度。
[0047]
2、提高招聘效率和准确度:通过采用自动化推荐系统,实现了高效快捷的招聘过程,减少了招聘人员的人力资源投入,从而提高了招聘效率和准确度。
[0048]
3、降低人力资源成本:通过自动化推荐系统,减少了人力资源投入,从而降低了人力资源成本。
[0049]
4、实现个性化推荐:通过采用机器学习算法,建立了个性化推荐模型,能够实现针对每个用户的个性化推荐,提高了推荐的准确度。
[0050]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0051]
下面参照附图结合实施例对本发明作进一步的说明。
[0052]
图1为本发明实施例一中方法的流程图;
[0053]
图2为本发明实施例一中两用户的相似度计算原理示意图;
[0054]
图3为本发明实施例二中系统的结构示意图;
[0055]
图4为本发明实施例三中介质的结构示意图。
具体实施方式
[0056]
本技术实施例通过提供一种基于多维度画像的高层次人才推荐方法、系统及介质,通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,提高高层次人才招聘的匹配度。
[0057]
本技术实施例中的技术方案,总体思路如下:
[0058]
通过对用户、职位和地理区域的信息进行分析和挖掘,建立多维度用户、职位和地理区域的画像;然后基于用户、职位和地理区域的画像,设计机器学习算法,建立推荐模型,包括基于用户画像的推荐模型、基于职位画像的推荐模型和基于地理画像的推荐模型等;最后通过综合利用用户、职位和地理区域的信息,实现对高层次人才的智能化推荐,相较于传统的推荐模型,更加精准和有效。
[0059]
实施例一
[0060]
本实施例提供一种多维度画像的高层次人才推荐方法,如图1所示,包括;
[0061]
数据获取过程:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;用户数据可以通过爬虫技术从百度百科、百度学术、学者库以及学者个人主页采集相应数据;职位数据可以通过爬虫技术从人才招聘网站和企业网站上采集职位信息,同时获取地理信息构成地理区域数据。由于采集的数据是静态页面,对于获取网页中的信息,可以使用较为简单的方法,比如利用xpath、css、正则表达式,手工编写对应的提取规则来实现对页面中信息的抽取,该方法根据需求对网页中的目标信息进行精确定位与获取,能够确保数据的质量和可用性。
[0062]
画像建立过程:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;基础维度可以包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。职位画像可以包括职位名称、职位描述、薪资待遇、所属行业、所在地。地理区域画像可以包括各地区的行业分布、各行业的薪资范围。
[0063]
推荐模型构建过程:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
[0064]
职位推荐过程:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
[0065]
具体算法可以如下;
[0066][0067]
代入上面模型算法得:
[0068][0069]
其中,score是给用户(u)推荐职位(s)的得分,l代表模型的个数,β
l
是模型的权重,rec是模型l得到的用户(u)对职位(s)的推荐得分。
[0070]
对于一个职位共有三种评分模式,即用户相似度评分、职位相似度评分和地理相似度评分。总共有两种情况:
[0071]
1、当该职位有存在相似用户在岗时,多维度用户模型权重:地理区域模型权重:职位模型权重=8:1:1;
[0072]
2、当该职位为新职位时,地理区域模型权重:职位模型权重=2:8;
[0073]
结合两种情况最终得到职位推荐列表。
[0074]
在一种可能的实现方式中,所述基于用户画像的推荐模型使用k-means算法(也可
以采用其它可以实现类似功能的算法,比如k-means++算法)进行用户聚类,然后使用simrank进行相似度的计算,如图2所示,具体包括如下步骤:
[0075]
步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
[0076]
步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
[0077]
步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
[0078]
步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
[0079]
步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
[0080][0081]
其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
[0082]
进一步地,推荐模型构建过程中,基于职位画像的推荐模型公式如下:
[0083][0084]
其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,
…
,hn}表示学术特征向量,r={r1,r2,r3,
…
,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
[0085]
基于地理区域画像的推荐模型公式如下:
[0086][0087]
其中,g={g1,g2,g3,
…
,gm}表示求职区域的地理特征向量,e={e1,e2,e3,
…
,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。
[0088]
较佳地,还可以通过对推荐结果进行评估和反馈,不断优化推荐模型和算法,提高推荐的准确度和效率。
[0089]
基于同一发明构思,本技术还提供了与实施例一中的方法对应的系统,详见实施例二。
[0090]
实施例二
[0091]
在本实施例中提供了一种基于多维度画像的高层次人才推荐系统,如图3所示,包
括:
[0092]
数据获取模块:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;
[0093]
画像建立模块:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;
[0094]
推荐模型构建模块:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
[0095]
职位推荐模块:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
[0096]
进一步地,所述推荐模型构建模块中,基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:
[0097]
步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
[0098]
步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
[0099]
步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
[0100]
步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
[0101]
步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
[0102][0103]
其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
[0104]
在一种可能的实现方式中,所述推荐模型构建模块中,基于职位画像的推荐模型公式如下:
[0105]
[0106]
其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,
…
,hn}表示学术特征向量,r={r1,r2,r3,
…
,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
[0107]
基于地理区域画像的推荐模型公式如下:
[0108][0109]
其中,g={g1,g2,g3,
…
,gm}表示求职区域的地理特征向量,e={e1,e2,e3,
…
,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。
[0110]
在一种可能的实现方式中,所述画像建立模块中,多维度用户画像的基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。
[0111]
由于本发明实施例二所介绍的系统,为实施本发明实施例一的方法所采用的系统,故而基于本发明实施例一所介绍的方法,本领域所属人员能够了解该的具体结构及变形,故而在此不再赘述。凡是本发明实施例一的方法所采用的系统都属于本发明所欲保护的范围。
[0112]
基于同一发明构思,本技术提供了实施例一对应的存储介质,详见实施例三。
[0113]
实施例三
[0114]
本实施例提供一种计算机可读存储介质,如图4所示,其上存储有计算机程序,该计算机程序被处理器执行时,可以实现实施例一中任一实施方式。
[0115]
由于本实施例所介绍的计算机可读存储介质为实施本技术实施例一中方法所采用的计算机可读存储介质,故而基于本技术实施例一中所介绍的方法,本领域所属技术人员能够了解本实施例的计算机可读存储介质的具体实施方式以及其各种变化形式,所以在此对于该计算机可读存储介质如何实现本技术实施例中的方法不再详细介绍。只要本领域所属技术人员实施本技术实施例中的方法所采用的计算机可读存储介质,都属于本技术所欲保护的范围。
[0116]
本发明通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,能够提高高层次人才招聘的匹配度;通过采用自动化推荐系统,实现了高效快捷的招聘过程,减少了招聘人员的人力资源投入,从而提高了招聘效率和准确度;通过自动化推荐系统,减少了人力资源投入,从而降低了人力资源成本;通过采用机器学习算法,建立了个性化推荐模型,能够实现针对每个用户的个性化推荐,提高了推荐的准确度。
[0117]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0118]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流
程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0119]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0120]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0121]
虽然以上描述了本发明的具体实施方式,但是熟悉本技术领域的技术人员应当理解,我们所描述的具体的实施例只是说明性的,而不是用于对本发明的范围的限定,熟悉本领域的技术人员在依照本发明的精神所作的等效的修饰以及变化,都应当涵盖在本发明的权利要求所保护的范围内。
技术特征:
1.一种基于多维度画像的高层次人才推荐方法,其特征在于,包括:数据获取过程:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;画像建立过程:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;推荐模型构建过程:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;职位推荐过程:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。2.根据权利要求1所述的方法,其特征在于:所述基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(i
i
(a),i
j
(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。3.根据权利要求1或2所述的方法,其特征在于:推荐模型构建过程中,基于职位画像的推荐模型公式如下:
其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,
…
,h
n
}表示学术特征向量,r={r1,r2,r3,
…
,r
n
}表示职位特征向量,sim(h,r)表示职位和学术的相似度;基于地理区域画像的推荐模型公式如下:其中,g={g1,g2,g3,
…
,g
m
}表示求职区域的地理特征向量,e={e1,e2,e3,
…
,e
m
}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。4.根据权利要求1所述的方法,其特征在于:所述多维度用户画像中,基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。5.一种基于多维度画像的高层次人才推荐系统,其特征在于,包括:数据获取模块:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;画像建立模块:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;推荐模型构建模块:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;职位推荐模块:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。6.根据权利要求5所述的系统,其特征在于:所述推荐模型构建模块中,基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类
簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(i
i
(a),i
j
(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。7.根据权利要求5或6所述的系统,其特征在于:推荐模型构建模块中,基于职位画像的推荐模型公式如下:其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,
…
,h
n
}表示学术特征向量,r={r1,r2,r3,
…
,r
n
}表示职位特征向量,sim(h,r)表示职位和学术的相似度;基于地理区域画像的推荐模型公式如下:其中,g={g1,g2,g3,
…
,g
m
}表示求职区域的地理特征向量,e={e1,e2,e3,...,e
m
}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。8.根据权利要求5所述的系统,其特征在于:所述画像建立模块中,多维度用户画像的基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4任一项所述的方法。
技术总结
本发明公开了提供一种基于多维度画像的高层次人才推荐方法、系统及介质,涉及人才推荐技术领域。本发明实施例通过对用户、职位和地理区域的信息进行分析和挖掘,建立多维度用户、职位和地理区域的画像;然后基于用户、职位和地理区域的画像,设计机器学习算法,建立推荐模型,包括基于用户画像的推荐模型、基于职位画像的推荐模型和基于地理画像的推荐模型等;最后根据用户、职位和地理区域的画像以及推荐模型,实现对高层次人才的智能化推荐,推荐匹配度高的人才给职位招聘方,提高招聘效率和准确度。和准确度。和准确度。
技术研发人员:林卓 张福山 方延风 陈晓婉
受保护的技术使用者:福建省科学技术信息研究所(福建省生产力促进中心)
技术研发日:2023.05.10
技术公布日:2023/9/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/