一种基于显隐式的融合辅助信息的填充方法
未命名
08-22
阅读:243
评论:0
1.本发明涉及一种基于显隐式的融合辅助信息的填充方法,属于计算机信息技术领域。
背景技术:
2.随着中国经济的快速发展,企业为提高经济效益,推动员工工作积极性,设置多种企业绩效作为考核企业经济价值的指标。政府部门基于当地企业的绩效数值信息评判当地企业发展情况,然而企业绩效类型种类繁多,各企业为达到其经济目的选择的绩效指标并不统一,政府部门难以基于统一的评判标准度量企业的经济价值。因此亟需一种可以有效填充企业绩效信息的现代技术解决这类问题。
技术实现要素:
3.本发明目的在于针对上述企业绩效信息不统一存在缺失信息问题,提供了一种基于显隐式的融合辅助信息的填充方法,该方法通过融合企业绩效隐式的偏好考核项,利用现代深度学习降噪编码器模型,精准预测缺失的企业绩效信息。
4.本发明为实现上述发明目的采用如下技术方案:一种基于显隐式的融合辅助信息的填充方法,该方法包括如下步骤:
5.步骤1:建立企业绩效与考核项的权重矩阵w=(w
ei
)m×n,m为企业绩效数量,n为构建绩效的考核项的数量,权重数值w
ei
等于考核项占企业绩效比重。此处的考核项指的是组成企业绩效的若干评判标准(见表1)。
6.步骤2:构建概率矩阵z=(z
ei
)m×n,若企业绩效e包含考核项x1,x2,
…
,xn,则其余为0,此处以盈利能力e为例,其考核项包含生产成本、净利润率和销售量三项(见表1),此考核项分别对应x1,x7,x8,因此概率矩阵的相关元素值具体公式如下:
[0007][0008]
其中w
ei
为权重矩阵的值,表示企业绩效e中考核项i的数值信息;ne表示企业绩效e中的考核项的数量。
[0009]
步骤3:构建基于企业绩效丰富度和考核项流行度的偏好权重矩阵m=(m
ei
)m×n。对于已有权值的企业绩效的考核项,设置对应的m
ei
=1。这里引入隐式考核项的概念,所谓隐式考核项是指没有被公司选入构建企业绩效的指标类型。企业设置若干考核项作为考核标准,但是这些考核项未必是最合理的,本发明旨在找出与该企业的管理目标最合理的隐式考核项。对于偏好权重矩阵m中的隐式考核项,其权重代表它为相关性的置信度,权重越高,其相关性越高。对于未有权值的企业绩效的考核项,即隐式考核项,本发明结合企业绩效丰
富度ke和考核项的流行度gi,以ε作为权重系数,计算隐式考核项与企业绩效的相关度,公式如下所示:
[0010][0011]
其中,ε是权重系数,用来调节企业绩效丰富度和考核项流行度的占比,ε∈[0,1]。
[0012]
步骤4:基于贝叶斯概率矩阵分解(bayesian probabilistic matrix factorization)估计矩阵中的缺失元素,该方法能够很好地利用贝叶斯推断进行参数估计。由贝叶斯准则可知,只要给出模型参数和超参数的后验分布的形式,模型就能够基于现有的参数和超参数进行采样更新。构建偏好权重概率矩阵q=zm
t
,将偏好权重概率矩阵q分解成u和v两个特征矩阵,其中观测值q
ei
被假设为正态分布,其形式如下所示:
[0013][0014]
其中q
ei
表示偏好权重概率矩阵q中的元素;ue表示u矩阵中的向量;vi表示v矩阵中的向量;表示高斯方差的逆,τ
∈
表示精度项。
[0015]
假设τ
∈
~gamma(a0,b0),其中伽马分布的形式为:
[0016][0017]
在伽马分布中,a0是形状参数,b0是比率参数。
[0018]
基于高斯假设,对贝叶斯矩阵分解模型的参数和超参数做共轭先验处理。随后对模型参数和超参数求后验分布,交替更新即可完成贝叶斯概率矩阵分解。此时令而矩阵中每个元素表示企业绩效e对考核项i相关的概率,越接近1,考核项i越有可能是企业绩效e的相关隐式考核项。
[0019]
步骤5:利用上述方法获得的相关概率可以进一步识别隐式考核项与企业绩效的相关性。将每一个企业绩效的所有隐式考核项的相关概率从大到小排序,前θ%的隐式考核项被认为是该企业绩效相关性较强的隐式考核项,后γ%的隐式考核项被认为是该企业绩效相关性较弱的隐式考核项,为了确保隐式考核项划分的唯一性,应该确保θ%和γ%的总和小于等于1。
[0020]
步骤6:通过以上方式即构建了企业绩效的隐式考核项偏好矩阵,本发明结合隐式考核项偏好矩阵和企业绩效的数值信息,利用降噪编码器(denoising autoencoder)强大的特征提取能力,将企业绩效转化为特征向量。企业绩效作为数值信息需要做标准化处理,公式如下:
[0021][0022]
其中ri表示企业绩效i的数值信息;μ表示总体企业绩效的均值;σ表示总体企业绩效的方差。
[0023]
本发明使用平滑的l1损失函数(smooth l1 loss),平滑的l1损失函数通过综合mae和mse的优点,在0点处附近采用了mse中的平方函数,解决了mae在0点处梯度不可导的问题,使其更加平滑易于收敛。此外,在|x|》1的区间上,它又采用了mae中的线性函数,使得梯度能够快速下降。此处的x代表预测值和真实值之间的数值差异,具体公式如下:
[0024][0025]
其中n表示输入层和输出层的维度;表示降噪编码器输出的高阶向量;f
ui
表示真实的企业绩效数值信息向量。
[0026]
平滑的l1损失函数如下所示:
[0027][0028]
步骤7:假设和分别表示企业绩效i和企业绩效j经过降噪编码器学习到的特征向量,基于欧式距离相似度对企业绩效i和企业绩效j进行相似性度量,计算公式如下所示:
[0029][0030]
其中xi表示特征向量中的元素;yj表示特征向量中的元素。
[0031]
度量企业绩效相似性后,选择基于topn的方法选择前n个与当前企业绩效最相似的企业绩效,并综合这些企业绩效集合进行预测,预测公式如下所示:
[0032][0033]
其中表示预测的企业e的企业绩效i的数值数据,分别表示企业e的企业绩效向量的平均值,企业绩效向量由降噪编码器得出;r
vj
表示企业v的企业绩效j的数值数据;表示企业绩效j的平均数值;sim(i,j)表示企业绩效i和企业绩效j的相似度;ni表示与企业绩效i的最相似的前n个企业绩效。
[0034]
有益效果:
[0035]
1、本发明利用企业绩效的显示数值信息,融合企业绩效的隐式偏好考核项构建隐式数据,基于降噪编码器提取更高维度的企业绩效特征向量,并结合前n个最相似的企业绩效数值信息填充缺失的企业绩效数据,很好地解决了固定值填充的弊端,基于固定值填充的方法将所有缺失的企业绩效信息视为一致,忽略了企业绩效信息的个性化差异。
[0036]
2、本发明充分利用企业绩效中存在的隐式信息,使得预测的填充数据可以更好的代表企业绩效数据,降低预测数据与真实的企业绩效数据的偏差。
[0037]
3、本发明通过抽取出与企业绩效相关的隐式偏好考核项,融合隐式偏好考核项和企业绩效数据信息,利用深度学习模型降噪编码器构建高阶的企业绩效特征向量,基于特征向量的相似性为缺失的企业绩效信息做填充操作。
附图说明
[0038]
图1为本发明基于显隐式的融合辅助信息的填充方法的方法流程图。
[0039]
图2为本发明融合企业绩效隐式偏好考核项的降噪编码器框架示意图。
具体实施方式
[0040]
下面结合说明书附图对本发明创造作进一步地详细说明。
[0041]
如图1所示,本发明提供了一种基于显隐式的融合辅助信息的填充方法,该方法具体步骤包括如下:
[0042]
此处构建表1中的数据信息用户方法展示。为保证数据的直观性和清晰性,此处仅以某米公司的数据作为展示实验方法的例子。
[0043]
表1
[0044][0045][0046]
步骤1:建立企业绩效与考核项的权重矩阵w,数据如表2所示:
[0047]
表2
[0048]
[0049]
步骤2:根据企业绩效包含的考核项构建概率矩阵z(如表3所示)。
[0050]
表3
[0051][0052]
步骤3:此处以ε=0.2为例,基于企业绩效丰富度和考核项流行度的偏好权重矩阵m(如表4所示)表4
[0053][0054][0055]
步骤4:本发明基于贝叶斯概率矩阵算法分解矩阵,本发明利用tensorflow框架搭建分解模型,利用循环遍历的方式对模型参数进行采样和更新,得到新的概率矩阵
[0056]
步骤5:新的概率矩阵中其行代表公司的企业绩效,列代表考核项,为每个企业绩效的考核项按权值从大到小排序,每个企业绩效选择前θ%的考核项作为该企业绩效的隐式偏好考核项。
[0057]
步骤6:将企业绩效的数值信息和上述步骤5中得出的隐式考核项融合,并将二者作为降噪编码器模型的输入数据,得出数据集中所有企业绩效特征向量。此处的降噪编码器模型同样由深度学习框架tensorflow搭建。
[0058]
步骤7:根据得到的企业绩效特征向量,选择最相似的前n个企业绩效信息为缺失的企业绩效数据进行有效填充。
[0059]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
技术特征:
1.一种基于显隐式的融合辅助信息的填充方法,其特征在于,所述方法包括如下步骤:步骤1:建立企业绩效与考核项的权重矩阵w=(w
ei
)
m
×
n
,m为企业绩效数量,n为构建绩效的考核项的数量,权重数值w
ei
等于考核项占企业绩效比重,所述考核项指的是组成企业绩效的若干评判标准;步骤2:构建概率矩阵z=(z
ei
)
m
×
n
,若企业绩效e包含考核项x1,x2,
…
,x
n
,则其余为0,此处以盈利能力e为例,其考核项包含生产成本、净利润率和销售量三项(见表1),此考核项分别对应x1,x7,x8,因此概率矩阵的相关元素值具体公式如下:其中w
ei
为权重矩阵的值,表示企业绩效e中考核项i的数值信息;n
e
表示企业绩效e中的考核项的数量;步骤3:构建基于企业绩效丰富度和考核项流行度的偏好权重矩阵m=(m
ei
)
m
×
n
,对于已有权值的企业绩效的考核项,设置对应的m
ei
=1,引入隐式考核项的概念,所述隐式考核项是指没有被公司选入构建企业绩效的指标类型,企业设置若干考核项作为考核标准,找出与该企业的管理目标最合理的隐式考核项,对于偏好权重矩阵m中的隐式考核项,其权重代表它为相关性的置信度,权重越高,其相关性越高,对于未有权值的企业绩效的考核项,即隐式考核项,结合企业绩效丰富度k
e
和考核项的流行度g
i
,以ε作为权重系数,计算隐式考核项与企业绩效的相关度,公式如下所示:其中,ε是权重系数,用来调节企业绩效丰富度和考核项流行度的占比,ε∈[0,1];步骤4:基于贝叶斯概率矩阵分解估计矩阵中的缺失元素,利用贝叶斯推断进行参数估计,由贝叶斯准则可知,只要给出模型参数和超参数的后验分布的形式,模型就能够基于现有的参数和超参数进行采样更新,构建偏好权重概率矩阵q=zm
t
,将偏好权重概率矩阵q分解成u和v两个特征矩阵,其中观测值q
ei
被假设为正态分布,其形式如下所示:其中q
ei
表示偏好权重概率矩阵q中的元素;u
e
表示u矩阵中的向量;v
i
表示v矩阵中的向量;表示高斯方差的逆,τ
∈
表示精度项;假设τ
∈
~gamma(a0,b0),其中伽马分布的形式为:在伽马分布中,a0是形状参数,b0是比率参数;基于高斯假设,对贝叶斯矩阵分解模型的参数和超参数做共轭先验处理,随后对模型参数和超参数求后验分布,交替更新即可完成贝叶斯概率矩阵分解,此时令而矩阵中每个元素表示企业绩效e对考核项i相关的概率,越接近1,考核项i越
有可能是企业绩效e的相关隐式考核项;步骤5:将每一个企业绩效的所有隐式考核项的相关概率从大到小排序,前θ%的隐式考核项被认为是该企业绩效相关性较强的隐式考核项,后γ%的隐式考核项被认为是该企业绩效相关性较弱的隐式考核项,使得θ%和γ%的总和小于等于1;步骤6:结合隐式考核项偏好矩阵和企业绩效的数值信息,利用降噪编码器强大的特征提取能力,将企业绩效转化为特征向量,企业绩效作为数值信息需要做标准化处理,公式如下:其中r
i
表示企业绩效i的数值信息;μ表示总体企业绩效的均值;σ表示总体企业绩效的方差;使用平滑的l1损失函数,平滑的l1损失函数通过综合mae和mse的优点,在0点处附近采用了mse中的平方函数,使其更加平滑易于收敛,在|x|>1的区间上,采用了mae中的线性函数,使得梯度能够快速下降,x表示预测值和真实值之间的数值差异,具体公式如下:其中n表示输入层和输出层的维度;表示降噪编码器输出的高阶向量;f
ui
表示真实的企业绩效数值信息向量;平滑的l1损失函数如下所示:步骤7:假设和分别表示企业绩效i和企业绩效j经过降噪编码器学习到的特征向量,基于欧式距离相似度对企业绩效i和企业绩效j进行相似性度量,计算公式如下所示:其中x
i
表示特征向量中的元素;y
i
表示特征向量中的元素;度量企业绩效相似性后,选择基于topn的方法选择前n个与当前企业绩效最相似的企业绩效,并综合这些企业绩效集合进行预测,预测公式如下所示:其中表示预测的企业e的企业绩效i的数值数据,分别表示企业e的企业绩效向量的平均值,企业绩效向量由降噪编码器得出;r
vj
表示企业v的企业绩效j的数值数据;表示企业绩效j的平均数值;sim(i,j)表示企业绩效i和企业绩效j的相似度;n
i
表示与企业绩效i的最相似的前n个企业绩效。2.根据权利要求1所述的一种基于显隐式的融合辅助信息的填充方法,其特征在于,所述步骤1包括:建立企业绩效与考核项的权重矩阵w,数据如表2所示:
表2。3.根据权利要求1所述的一种基于显隐式的融合辅助信息的填充方法,其特征在于,所述步骤2包括:根据企业绩效包含的考核项构建概率矩阵z,如表3所示:表3。4.根据权利要求1所述的一种基于显隐式的融合辅助信息的填充方法,其特征在于,所述步骤3包括:ε=0.2,基于企业绩效丰富度和考核项流行度的偏好权重矩阵m,如表4所示:表4。
技术总结
本发明公开了一种基于显隐式的融合辅助信息的填充方法,该方法通过融合企业绩效隐式的偏好考核项,利用现代深度学习降噪编码器模型,精准预测缺失的企业绩效信息。本发明利用企业绩效的显示数值信息,融合企业绩效的隐式偏好考核项构建隐式数据,基于降噪编码器提取更高维度的企业绩效特征向量,并结合前N个最相似的企业绩效数值信息填充缺失的企业绩效数据,很好地解决了固定值填充的弊端,基于固定值填充的方法将所有缺失的企业绩效信息视为一致,忽略了企业绩效信息的个性化差异。本发明充分利用企业绩效中存在的隐式信息,使得预测的填充数据可以更好的代表企业绩效数据,很好地降低预测数据与真实的企业绩效数据的偏差。偏差。偏差。
技术研发人员:焦永纪 张丽莹 江游 张超 张晓曼
受保护的技术使用者:南京邮电大学
技术研发日:2023.04.11
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
