一种处理方法、装置及存储介质与流程
未命名
09-08
阅读:89
评论:0

1.本技术涉及数据处理技术领域,特别涉及一种处理方法、装置及存储介质。
背景技术:
2.对象推荐功能是从海量对象(例如,商品、文章、音视频和节目等)中主动挖掘用户喜好或平台需求,并将其推荐给用户或平台的功能。对象推荐功能能够实现信息过滤,来帮助用户或平台快速发现自身的需求信息,从而避免用户或平台淹没在庞大而杂乱无序的网络内容中。然而,目前均采用单向推荐将商品推荐给一类对象,比如仅推荐给用户或仅推荐给商家,更加大了用户与平台间的信息差,从而影响用户体验并让平台产生损失。
技术实现要素:
3.根据本技术一方面,提供了一种处理方法,所述方法包括:
4.获得第一数据集;
5.基于智能引擎处理所述第一数据集,确定目标对象;
6.其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;
7.所述目标对象属于所述第一数据集;
8.所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。
9.在一些实施例中,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习确定;
10.其中,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习确定,包括:
11.所述智能引擎中的第一模型处理第一类数据,并确定划分所述第一类数据的第一条件参数;其中,所述第一模型与所述第一类对象的类别对应;
12.所述智能引擎中的第二模型处理第二类数据,并确定划分所述第二类数据的第二条件参数;其中,所述第二模型与所述第二类对象的类别对应;
13.根据所述第一条件参数和所述第二条件参数,确定所述目标条件参数。
14.在一些实施例中,根据所述第一条件参数和所述第二条件参数,确定所述目标条件参数,包括:
15.根据所述第一模型和所述第二模型,利用神经网络确定第三模型;
16.根据所述第一条件参数和第二条件参数,利用所述第三模型确定所述目标条件参数。
17.在一些实施例中,根据所述第一模型和所述第二模型,利用神经网络确定第三模型,包括:
18.利用神经网络算法,将所述第一模型的结构和参数与所述第二模型的结构和参数
进行调整,并将调整后的所述第一模型和所述第二模型合并,得到所述第三模型。
19.在一些实施例中,确定划分所述第一类数据的第一条件参数,包括:
20.确定所述第一类数据的第一度量值;
21.根据至少一个预设数值对所述第一类数据进行划分,分别确定所述第一类数据划分后各部分的第二度量值;
22.根据所述第一类数据各部分的所述第二度量值,确定所述第一类数据的所述第三度量值;
23.当所述第三度量值小于所述第一度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第一条件参数。
24.在一些实施例中,确定划分所述第二类数据的第二条件参数,包括:
25.确定所述第二类数据的第四度量值;
26.根据至少一个预设数值对所述第二类数据进行划分,分别确定所述第二类数据划分后各部分的第五度量值;
27.根据所述第二类数据各部分的所述第五度量值,确定所述第二类数据的所述第六度量值;
28.当所述第六度量值小于所述第四度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第二条件参数。
29.在一些实施例中,对目标数据集进行预处理,得到所述第一数据集;
30.其中,对目标数据集进行预处理,得到所述第一数据集,包括:
31.根据所述目标数据集与所述目标数据集平均值的差值,确定协方差矩阵;
32.根据所述协方差矩阵,确定所述目标数据集中各个数据的特征值和对应的特征向量;
33.根据所述特征值,从大到小选取至少一个所述特征值,并结合所述特征值对应的特征向量组成特征向量矩阵;
34.根据所述目标数据集和所述特征向量矩阵,确定所述第一数据集。
35.在一些实施例中,根据对象类别,将第一数据集分为第一类数据和第二类数据;
36.根据所述第一类数据,创建所述第一模型;
37.根据所述第二类数据,创建所述第二模型。
38.本技术实施例另一方面提供了一种信息处理装置,所述装置包括:
39.获取模块,获得第一数据集;
40.处理模块,基于智能引擎处理所述第一数据集,确定目标对象;
41.其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;
42.所述目标对象属于所述第一数据集;
43.所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。
44.本技术实施例又一方面提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在被处理器运行时使得所述处理器执行如上所述的信息处理方法。
45.本技术实施例的信息处理方法,通过基于智能引擎处理第一数据集,来确定目标
对象,其中,目标对象属于第一数据集,且目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象。
附图说明
46.图1示出根据本技术实施例的信息处理方法的示意性流程图;
47.图2示出根据本技术实施例的信息处理方法的示意性流程图;
48.图3示出根据本技术实施例的步骤a1的示意性流程图;
49.图4示出根据本技术实施例的智能引擎基于第一数据集利用机器学习确定所述目标条件参数的示意性流程图;
50.图5示出根据本技术实施例的步骤c1的示意性流程图;
51.图6示出根据本技术实施例的步骤c2的示意性流程图;
52.图7示出根据本技术实施例的第一模型和第二模型的创建过程的示意性流程图;
53.图8示出根据本技术实施例的决策树算法的示意图;
54.图9示出根据本技术实施例的步骤c3的示意性流程图;
55.图10示出根据本技术实施例的步骤f1的示意性流程图;
56.图11示出根据本技术实施例的神经网络学习算法的示意性流程图;
57.图12示出根据本技术实施例的信息处理方法的示意性流程图;
58.图13示出根据本技术实施例的信息处理装置的示意性框图。
具体实施方式
59.为使本领域技术人员更好的理解本技术实施例的技术方案,下面结合附图和具体实施方式对本技术作详细说明。
60.传统技术中等待用户主动购买的模式已经不能满足零售业发展的需求。由于多数普通的用户并不能很清楚的知道哪些商品会更符合自身的需求,从而因为购买错误的商品而影响了使用感受,而零售商也由于不清楚用户的需求,从而错失了用户需求动向和相对竞争力,常见的单向推荐的方法无法填补用户和零售商间的信息差,导致效率低,进一步不能进行精准推荐。比如,如果以采样数据1(用户行为数据)经过单一智能模型1处理获得是结果1,只能使用适用于第一类对象。例如,获得的结果是用于单向推荐给用户一个商品。如果以采样数据2(商家库存)经过单一智能模型2处理获得是结果2,只能使用适用于第二类对象。例如,获得的结果是用于单向推荐给商户一个商品的补货。单向推荐所采用的采样数据是不同的,且获得的结果也只能适用单一对象。导致效率低,由于用户与商家使用的是割裂的两个智能模型,导致商家补充的商品与用户所期望购买的商品不匹配,给商户也造成了损失。通过本技术所提供的实施例能为用户和商家双向推荐用户和商家都期望的商品,用户能够进一步了解自己期望的商品,商户能补货能够增加销量的期望的商品。
61.基于前述的至少一个技术问题,本技术提供了一种信息处理方法,所述方法包括:获得第一数据集;基于智能引擎处理所述第一数据集,确定目标对象;其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;所述目标对象属于所述第一数据集;所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。本技术实施例的信息处理方法,通过基于智能引擎处
理第一数据集,来确定目标对象,其中,目标对象属于第一数据集,且目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,本技术实施例的目标对象来自于第一数据集,且所述目标对象既满足推荐给第一类型对象,又满足推荐给第二类型对象。也就是说基于智能引擎对第一数据集的处理获得的目标对象,能够达到针对两类不同的对象(例如用户和商家)双向推荐同一类商品的效果,提升了效率。另外,还可以消除不同类型对象间的信息差,精准提供推荐方案,优化每类对象的体验。
62.图1示出根据本技术实施例的信息处理方法的示意性流程图;如图1所示,根据本技术实施例的信息处理方法100可以包括如下步骤s101、步骤s102和步骤s103:
63.在步骤s101,获得第一数据集。
64.本技术可以适用于各种需要双向推荐或多向的场景。例如,可以适用于商品双向推荐,也可以用于媒体信息双向推荐,还可以用于供销链双向推荐等。在商品双向推荐的应用场景下,被推荐的对象可以包括用户和商家;在媒体信息双向推荐的应用场景下,被推荐的对象可以包括用户和平台;在供销链多向推荐的应用场景下,被推荐的对象可以包括用户、商家和供应商等。本技术实施例以商品双向推荐为例,进行介绍。
65.由于不同地域或地区、不同群体的用户有自身的特定的购买习惯或使用习惯,同时不同的零售企业、线下或线上店面也都拥有不同的用户群体,可以对这些信息加以采集并记录。这些信息可以是虚拟用户提供的信息,也可以是根据用户授权获得的信息,并且不涉及任何隐私数据。在这一场景下,第一数据集可以包括购买习惯、店铺环境、浏览习惯、常用商品、产品信息和销售数据等。
66.本技术实施例具有泛用性,对不同类型的商品均可适用。而且由于所采集的数据可以既可以是比较整齐的数据,也可以是比较琐碎的数据,因此对于小样本场景同样适用。
67.在本技术的一个实施例中,如图2所示,所述方法还包括步骤a1:
68.在步骤a1,对目标数据集进行预处理,得到所述第一数据集。
69.一般地,目标数据集可能包含许多难以处理的变量。特别是在数据量较大,数据种类较多的情况下,所采集的目标数据将非常详细。在这种情况下,目标数据集可能包含数千个变量,有些变量也可能是不必要的。在这种情况下,如果将目标数据集中的数据全部用来计算,计量算大,对资源也是一种消耗,而且对本技术方案的数据处理结果也可能会产生负面影响,因此需要对目标数据集预处理,以从中提炼出更有用的第一数据集。
70.在一个可能的实施方式中,可以对目标数据集进行降维处理,也可以使用其他预处理方法减少目标数据集中的不必要数据。在机器学习和统计学领域,降维是指在限定条件下,降低随机变量个数,得到一组“不相关”主变量的过程,降维算法可以进一步包括为特征选择和特征提取等方法。
71.在一个示例中,如图3所示,步骤a1的对目标数据集进行预处理,得到所述第一数据集,包括步骤b1、步骤b2、步骤b3和步骤b4:
72.在步骤b1,根据所述目标数据集与所述目标数据集平均值的差值,确定协方差矩阵。
73.首先,根据最大方差理论的降维原理,可以将一组n维向量降为k维(其中,n>k>0),其目标是选择k个单位正交基,各字段两两间的cov(x,y)=0,而字段的方差则尽可能大。因此,最大方差使得投影数据的方差被最大化。在这过程中,需要确定目标数据集xmxn
的最佳的投影空间wnxk、协方差矩阵等。
74.首先,输入目标数据集xmxn。其次,按列计算目标数据集xmxn的平均值xmean,然后求解目标数据集与目标数据集平均值的差值,即令xnew=x-xmean。最后,求解矩阵xnew的协方差矩阵,并将其记为cov,这时可以得到协方差矩阵。
75.在步骤b2,根据所述协方差矩阵,确定所述目标数据集中各个数据的特征值和对应的特征向量。
76.在一个可能的实施方式中,根据上述协方差矩阵cov,可以计算协方差矩阵cov的特征值和相应的特征向量。该计算过程可以根据传统技术中相应算法进行计算,在此不再赘述。
77.在步骤b3,根据所述特征值,从大到小选取至少一个所述特征值,并结合所述特征值对应的特征向量组成特征向量矩阵。
78.在一个可能的实施方式中,将特征值按照从大到小的顺序进行排序,然后选择其中最大的a个特征值,然后将其对应的a个特征向量分别作为列向量组成特征向量矩阵wnxk。
79.在步骤b4,根据所述目标数据集和所述特征向量矩阵,确定所述第一数据集。
80.本技术实施例中,可以将数据集xnew投影到选取的特征向量wnxk上,这样就得到了降维的数据集xneww。
81.在步骤s102,基于智能引擎处理所述第一数据集,确定目标对象。
82.本技术实施例可以应用于诸如商品双向推荐等应用场景下。在商品双向推荐的应用场景下,目标对象可以为要向用户和商家推荐的商品。
83.其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象。
84.其中,所述目标对象属于所述第一数据集。
85.其中,所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。
86.在商品双向推荐的应用场景下,第一类对象可以为用户,第二类对象为商家。
87.在本技术的一个实施例中,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习算法来确定。
88.在本技术的一个实施例中,如图4所示,所述智能引擎基于第一数据集利用机器学习确定所述目标条件参数包括步骤c1、步骤c2和步骤c3:
89.在步骤c1,所述智能引擎中的第一模型处理第一类数据,并确定划分所述第一类数据的第一条件参数。
90.其中,所述第一模型与所述第一类对象的类别对应。
91.例如,第一类对象可以包括用户,第一模型表示用户偏好模型,第一条件参数则可以为用户偏好模型的阈值。可以根据第一条件参数确定用户偏好。这里第一模型用于确定第一条件参数。下面将介绍确定第一条件参数的方法。
92.如图5所示,步骤c1的确定划分所述第一类数据的第一条件参数,包括步骤d1、步骤d2、步骤d3和步骤d4:
93.在步骤d1,确定所述第一类数据的第一度量值。
94.在步骤d2,根据至少一个预设数值对所述第一类数据进行划分,分别确定所述第一类数据划分后各部分的第二度量值。
95.在步骤d3,根据所述第一类数据各部分的所述第二度量值,确定所述第一类数据的所述第三度量值。
96.在步骤d4,当所述第三度量值小于所述第一度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第一条件参数。
97.上述度量值可以为一种熵值,用于表征随机变量分布的混乱程度,且随机变量分布越混乱,则熵值越大。下文以使用信息熵作为度量值为例进行介绍。
98.信息熵(entropy)是用来度量样本集合“纯度”最常用的一种指标。当样本均匀分布时,不确定度最大,此时熵就最大。当选择某个特征对数据集进行分类时,分类后的数据集信息熵会比分类前的小。其差值表示为信息增益,信息增益可以衡量某个特征对分类结果的影响大小。
99.假设在样本数据集d中,混有c种类别的数据。在构建决策树时,根据给定的样本数据集选择某个特征值作为树的节点。在数据集中,可以计算出该数据中的信息熵。其中,信息熵的计算公式如下:
[0100][0101]
其中d表示训练数据集,pk表示类别k样本数量占所有样本的比例。
[0102]
若p=0,则p log2p=0。ent(d)的最小值为0,最大值为log2|y|。ent(d)的值越小,则d的纯度越高。
[0103]
结合本技术实施例,首先根据上述公式,计算出第一类数据中的第一信息熵(第一度量值)。然后根据至少一个预设数值对第一类数据进行划分,分别确定所述第一类数据划分后各部分的第二信息熵(第二度量值)。根据所述第一类数据各部分的第二信息熵(第二度量值),确定所述第一类数据的第三信息熵(第三度量值)。当第三信息熵(第三度量值)小于所述第一信息熵(第一度量值)时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第一条件参数。
[0104]
在步骤c2,所述智能引擎中的第二模型处理第二类数据,并确定划分所述第二类数据的第二条件参数。
[0105]
其中,所述第二模型与所述第二类对象的类别对应。
[0106]
例如,第二类对象可以包括商家,第二模型表示商家偏好模型,第二条件参数则可以为商家偏好模型的阈值。这里第二模型用于确定第二条件参数。下面介绍确定基于信息熵的方法确定第二条件参数的方法。
[0107]
进一步地,在一个示例中,如图6所示,步骤c2的确定划分所述第二类数据的第二条件参数,包括步骤e1、步骤e2、步骤e3和步骤e4:
[0108]
在步骤e1,确定所述第二类数据的第四度量值;
[0109]
在步骤e2,根据至少一个预设数值对所述第二类数据进行划分,分别确定所述第二类数据划分后各部分的第五度量值;
[0110]
在步骤e3,根据所述第二类数据各部分的所述第五度量值,确定所述第二类数据的所述第六度量值;
[0111]
在步骤e4,当所述第六度量值小于所述第四度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第二条件参数。
[0112]
根据上述信息熵的计算方法,结合本技术实施例,可以首先确定第二类数据的第四信息熵(第四度量值)。然后根据至少一个预设数值对第二类数据进行划分,分别确定第二类数据划分后各部分的第五信息熵(第五度量值)。根据第二类数据各部分的所述第五信息熵(第五度量值),确定第二类数据的所述第六信息熵(第六度量值)。当第六信息熵(第六度量值)小于所述第四信息熵(第四度量值)时为信息增益,将信息增益最大时对应的预设数值确定为第二条件参数。
[0113]
下面将介绍本技术实施例中的第一模型和第二模型的创建方法,如图7所示,所述方法还包括步骤i1、步骤i2和步骤i3:
[0114]
在步骤i1,根据对象类别,将第一数据集分为第一类数据和第二类数据。
[0115]
在一个示例中,这里的对象类别可以包括至少两种对象类别,也就是说将某一类物品或信息推荐给多类对象。例如,在商品双向推荐应用场景下,对象可以包括用户和商家两种类别;在媒体信息双向推荐应用场景下,对象可以包括用户和媒体两种类别的数据;在供销链多向推荐应用场景下,对象可以包括用户、商家和供应商三种类别,而且如果在供销环节中,存在其他中间商的情况下,对象类别还可以包括中间商。在此不再一一举例。
[0116]
关于本技术实施例,以商品的双向推荐为例,其中第一类数据可以为第一数据集中与用户兴趣相关的数据,第二类数据可以为第一数据集中与商家兴趣相关的数据。
[0117]
在步骤i2,根据第一类数据,创建所述第一模型。
[0118]
在步骤i3,根据第二类数据,创建所述第二模型。
[0119]
在一个可能的实施方式中,在步骤i2和步骤i3中,可以利用决策树算法,基于第一类数据创建第一模型,以及基于第二类数据创建第二模型,来划分商品、顾客和商家的类属。树中每一内部节点对应一个物体属性,而每一边对应于这些属性的可选值,树的叶节点则对应于商品、顾客、商家的每个基本分类。
[0120]
如图8所示,为了更清楚地介绍决策树算法,下面对一示例性数据集划分学生、年龄、信用等级的类属的过程为例,进行介绍。图11中的树中每个内部节点,即学生、年龄、信用等级对应一个物体属性,每一边对应于这些属于可选值。树的叶节点对应于学生、年龄、信用等级的每个基本分类,即是学生、年龄在30-40范围之间、信用等级一般。
[0121]
然后对第一模型和第二模型进行泛化,其公式如下:
[0122][0123]
其中,d表示训练数据集,c表示数据类别数,pi表示类别i样本数量占所有样本的比例。
[0124]
进一步地,关于第一模型和第二模型的创建方法,在一个示例中,首先对第一数据集的数据进行分类,例如,分为第一类数据和第二类数据。然后再根据第一类数据和第二类数据分别创建第一模型和第二模型。
[0125]
在另一个示例中,可以根据第一数据集确定偏好模型,然后将偏好模型根据对象类别分为第一模型和第二模型。然后根据对象类别将第一数据集中的数据分为第一类数据和第二类数据。
[0126]
在步骤c3,根据所述第一条件参数和第二条件参数,确定目标条件参数。
[0127]
例如,目标条件参数可以表示最佳阈值。
[0128]
在一个示例中,如图9所示,步骤c3的根据所述第一条件参数和第二条件参数,确定目标条件参数,包括步骤f1和步骤f2:
[0129]
在步骤f1,根据所述第一模型和所述第二模型,利用神经网络确定第三模型。
[0130]
例如,第三模型可以利用模糊神经网络算法合并第一模型和第二模型而得到。下文中将介绍如何利用模糊神经网络算法合并第一模型和第二模型得到第三模型。
[0131]
其中,如图10所示,步骤f1的根据所述第一模型和所述第二模型,利用神经网络确定第三模型,包括步骤g1:
[0132]
在步骤g1,利用神经网络算法,将所述第一模型的结构和参数与所述第二模型的结构和参数进行调整,并将调整后的所述第一模型和所述第二模型合并,得到所述第三模型。
[0133]
在步骤f2,根据所述第一条件参数和第二条件参数,利用所述第三模型确定所述目标条件参数。
[0134]
如图11所示,本技术实施例采用神经网络学习算法,寻求和调整自适应神经模糊控制系统(adaptive neuro fuzzy inference system,anfis)的参数和结构。其中的模糊控制器(即anfis控制器或anfis模型)需要两种类型的调整:结构调整和参数调整。结构调整包括变量数目、输入输出变量论域的划分、规则的数目等。一旦获得了满意的结构后,就需要对参数进行调整。利用最小均方算法(least mean square algorithm,lms)和最小二乘法来完成输入/输出数据对的建模,anfis控制器由于采用了苏格诺(sugeno)型模糊规则和加权求和法计算总输出,省去了常规模糊系统用重心法进行清晰化的大量计算工作,使得数据处理最大限度地简化,使得模糊推理系统能模拟出希望或实际的推荐方案关系。
[0135]
anfis模型计算主要采用takagi-sugeno(t-s)模糊模型,假设该模型拥有x,y两个输入量与一个输出量z,形成2个if then语言规则。其中x和y分别为上述的第一模型和第二模型的结构和参数,z为第三模型的结构和参数。上述语言规则可以表示为:
[0136]
规则1:if x=a
1 y=b1,then f1=p1z+q1y+r1[0137]
规则2:if x=a
2 y=b2,then f2=p2z+q2y+r2[0138]
式中:fi为规则i所对应的输出结果,ai,bi为规则i对应的非线性参数。pi,qi,ri为规则1的结论参数,p2为规则2的结论参数,x,y两个输入量形成的anfis模型计算结构如下所示,共包含5层结构,其中前3层为规则前件,后2层为规则后件,每层结构功能及计算公式为:
[0139]
第一层(输入层),将输入变量模糊化,转换为不同模糊集的隶属度,其公式为:
[0140]
其中i=1,2;
[0141]
其中i=3,4。
[0142]
式中:i为节点;x,y分别表示节点的输入变量;μai(z),μbi(y)为x,y输入变量的隶属函数;为第一层节点对应的隶属度值。
[0143]
第二层:计算各模规则的触发强度,由不同模糊集的隶属度相乘所得,其公式如下:
[0144][0145]
第三层:将第二层所得的触发强度归一化,为第i个规则在所有规则库中的触发比值,即在整个推理过程中使用到第i个规则的程度,其公式如下:
[0146][0147]
第四层:计算规则输出,其公式如下:
[0148][0149]
第五层:去模糊化,得到确切的输出,计算公式为每条规则的结果加权平均(权重为规则的归一化触发程度,理解为计算期望),其公式如下:
[0150][0151]
上述公式中的即为输出量z,此处为了表明anfis模型的层数关系,因此用表示输出量。
[0152]
在一个示例中,基于前述步骤中的第一条件参数和第二条件参数,可以利用第三模型得到目标条件参数,其计算过程如下:
[0153]
(1)获得输入:假设p1,p2,
…
代表第一条件参数和第二条件参数的r个输入,可用rx1维的矢量p来示:
[0154]
p=[p1,p2,
…
,pr]
t
[0155]
其中,p表示输入量,p1,p2,...表示第一条件参数和第二条件参数的r个输入,t表示整数。
[0156]
(2)假设w1,w2,...表示输入与神经元间的连接强度;b为神经元的域值,即可以看作是一个输入恒为1的网络权值,神经元的权值可用一个1*r维的行量w来表示:
[0157]
w=[w1,w2,
…
,wr]
[0158]
其中,w表示神经元的权值,w1,w2,
…
表示输入与神经元间的连接强度。
[0159]
(3)求和单元:求和单元完成对偏好模型的加权求和,即
[0160][0161]
其中,p表示输入量,w表示神经元的权值,b表示神经元的域值。
[0162]
(4)获得输出:输入信号经神经元加权求和及传递阈值函数作用后,得到的最终输出如下:
[0163]
(w*p+n)=a
[0164]
其中,w表示神经元权值的矢量集合;p表示阈值的矢量集合,即第一条件参数和第二条件参数;n表示神经元权值的矢量与域值的矢量的乘积的加权和;a表示输出,即目标条件参数。
[0165]
结合本技术实施例,其中,第一模型的结构和参数与第二模型的结构和参数可以作为anfis模型的两个输入量x和y,经过anfis模型的5层计算对第一模型和第二模型的结构和参数进行调整,最后合并得到输出量z,即第三模型。将前文中的阈值(第一条件参数和
第二条件参数)输入至第三模型,经过计算后可以输出目标条件参数。
[0166]
进而,可以利用目标条件参数划分第一数据集,将第一数据集划分为不同类属。然后再根据第一数据集中的不同类属确定每一类属所对应的条件参数。最后结合每一类属所对应的条件参数据确定目标条件参数,确定用于推荐的目标对象,比如可以获得针对用户和针对商家的最优推荐方案。
[0167]
在本技术的一个示例中,根据第一数据集中的数据类属创建第一模型(用户偏好模型)和第二模型(商家偏好模型)。根据第一模型和第二模型,利用神经网络确定第三模型。基于训练好的第三模型,以及基于第一数据集中每个类属对应的条件参数,确定目标条件参数。再由目标条件参数确定目标对象。本技术实施例可以针对双向推荐中的各个被推荐对象,为每个被推荐对象量身定制推荐方案,最终根据目标条件参数能较为准确的确定的目标对象,并将目标对象双向或多向推荐给推荐对象,使得被推荐者获得更佳的体验。
[0168]
在本技术的另一个示例中,根据第一数据集中的数据类属创建第一模型(用户偏好模型)和第二模型(商家偏好模型)。根据第一模型和第二模型,利用神经网络确定第三模型。根据每个类属(例如,用户和商家)对应的条件参数确定目标条件参数,将目标条件参数输入第三模型得到输出结果,该输出结果即为目标对象。在本技术实施例中还包括反哺过程。例如然后将输出结果反哺给第一数据集,作为第一数据集中的样本再次进行迭代训练第三模型,由于经过多次迭代训练,最终输出的结果准确度更高。
[0169]
在本技术的一个示例中,在商品双向推荐场景下,将用户分为喜欢黑衣服的和喜欢白衣服的,商家也分为常卖黑衣服的和常卖白衣服的。根据智能引擎中的第一模型(用户偏好模型)处理与用户相关的数据,即喜欢黑衣服和白衣服这类数据,并根据信息熵的计算方法确定第一条件参数。智能引擎中的第二模型(商家偏好模型)处理第二类数据,即常卖黑衣服的和常卖白衣服的。并根据信息熵的计算方法确定第二条件参数。根据第一条件参数和第二条件参数,得到目标条件参数。然后利用目标条件参数划分第一数据集。例如可以划分为两部分,第一部分为用户喜欢买白衣服,商家也经常卖白衣服,将目标对象(白衣服)双向推荐给用户和商家后,这一部分的用户会被推荐买某款白衣服,这一部分的商家也会被推荐上架或进货某款白衣服以增加收益。第二部分用户喜欢买黑衣服,商家也经常卖黑衣服,将目标对象(黑衣服)双向推荐给用户和商家后,这一部分用户会被推荐卖某款黑衣服,这一部分商家也会被推荐上架或进货某款黑衣服以增加收益。
[0170]
在本技术的另一个示例中,在媒体双向推荐场景下,例如,在需要推送信息、推送视频、推送文章等情况下,需要将信息、视频、文章等作品双向推荐给信息接收方和发布方。比如,读者有的喜欢现代题材,有的喜欢历史题材,平台中的作者也有各自的偏向,有的偏向创作现代题材作品,有的偏向创作历史题材作品。双向推荐后分为两部分,第一部分用户喜欢现代题材的作品,将现代题材的作品推荐给喜欢现代题材的用户,同时这一部分作者也会被建议多发布些现代题材的作品。第二部分用户喜欢历史题材作品,将历史题材的作品推荐给喜欢历史题材的用户,同时这一部分作者也会被推荐多发布些历史题材的作品以增加阅读量。
[0171]
本技术实施例的信息处理方法,通过基于智能引擎处理第一数据集,来确定目标对象,其中,目标对象属于第一数据集,且目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,本技术实施例的目标对象来自于第一数据集,且所述目标对象
既满足推荐给第一类型对象,又满足推荐给第二类型对象。也就是说基于智能引擎对第一数据集的处理获得的目标对象,能够达到针对两类不同的对象(例如用户和商家)双向推荐同一类商品的效果,提升了效率。另外,还可以克服不同类型对象存在信息差的问题,能精准提供推荐方案,优化每类对象的体验。
[0172]
在本技术的另一个实施例中,如图12所示,所述信息处理方法包括步骤s1201、步骤s1202、步骤s1203、步骤s1204、步骤s1205和步骤s1206:
[0173]
在步骤s1201,采集第一数据集。本技术实施例的第一数据集可以包括购买习惯、店铺环境、浏览习惯、常用商品、产品信息和销售数据等。本技术实施例具有泛用性,对不同类型的商品均可适用。而且由于所采集的数据可以既可以是比较整齐的数据,也可以是比较琐碎的数据,因此对于小样本场景同样适用。
[0174]
这里的第一数据集为预处理后的数据集。
[0175]
在步骤s1202,样本学习。本技术实施例中可以基于决策树算法对于第一数据集中的数据进行分类,并创建第一模型和第二模型。其中第一模型表征用户偏好模型,第二模型表征商家偏好模型。
[0176]
在步骤s1203,分类评估。本技术实施例的第一数据集别可以包括用户和商家两种类别的数据,其中第一类数据为第一数据集中与用户兴趣相关的数据,第二类数据为第一数据集中与商家兴趣相关的数据。可以基于第一类数据和第二类数据分别对用户感兴趣的数据和商家感兴趣的类别的数据进行评估。
[0177]
在步骤s1204,第二模型计算。可以根据第二类数据创建第二模型。
[0178]
在步骤s1205,第一模型计算。其中第一类数据为第一数据集中与用户兴趣相关的数据,可以根据第一类数据,创建所述第一模型。
[0179]
在步骤s1206,最佳推荐。基于模糊神经网络算法,根据第一模型和第二模型合并可以得到第三模型。根据第三模型可以获得第一条件参数和第二条件参数,由第一条件参数和第二条件参数计算可以获得针对用户和针对商家的双向最优推荐方案。
[0180]
本技术实施例的信息处理方法可以应用于小样本场景下,通过对商品数据进行处理,提高推荐的精准性;而且在制定推荐方案时,为每个用户量身定制商品推荐方案,为每个商家量身定制销售方案,可以获得最优的用户使用感受,让商家获得最佳的利润,让推荐方案更智慧。另外,本技术实施例通过深入了解用户流量大的通道、停留时间和人口统计数据,商家可以改善推销效果和在店内举行实时促销活动,以增加收入并提供更好的体验;同时通过需求预测使用来自各种来源的数据,以确保在合适的时间和合适的商店发售合适的产品,改进预测,增加收入,减少紧缩。
[0181]
下面结合图13对本技术的信息处理装置进行描述,其中,图13示出根据本技术实施例的信息处理装置的示意性框图。
[0182]
如图13所示,信息处理装置1300包括:
[0183]
获取模块1301,获得第一数据集。
[0184]
本技术实施例的第一数据集可以包括购买习惯、店铺环境、浏览习惯、常用商品、产品信息和销售数据等。本技术实施例具有泛用性,对不同类型的商品均可适用。而且由于所采集的数据可以既可以是比较整齐的数据,也可以是比较琐碎的数据,因此对于小样本场景同样适用。
[0185]
处理模块1302,基于智能引擎处理所述第一数据集,确定目标对象。
[0186]
本技术实施例可以应用于诸如商品双向推荐等应用场景下。在商品双向推荐的应用场景下,目标对象可以为要向用户和商家推荐的商品。
[0187]
其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象。
[0188]
其中,所述目标对象属于所述第一数据集。
[0189]
其中,所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。
[0190]
在商品双向推荐的应用场景下,第一类对象可以为用户,第二类对象为商家。
[0191]
在本技术的一个实施例中,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习算法来确定。
[0192]
此外,根据本技术实施例,还提供了一种存储介质,在所述存储介质上存储了程序指令,在所述程序指令被计算机或处理器运行时用于执行本技术实施例的信息处理方法的相应步骤。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(rom)、可擦除可编程只读存储器(eprom)、便携式紧致盘只读存储器(cd-rom)、usb存储器、或者上述存储介质的任意组合。
[0193]
本技术实施例的信息处理装置和存储介质,由于能够实现前述的信息处理方法,因此具有和前述的信息处理方法相同的优点。
[0194]
尽管这里已经参考附图描述了示例实施例,应理解上述示例实施例仅仅是示例性的,并且不意图将本技术的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改,而不偏离本技术的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本技术的范围之内。
[0195]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0196]
在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个设备,或一些特征可以忽略,或不执行。
[0197]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本技术的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0198]
类似地,应当理解,为了精简本技术并帮助理解各个申请方面中的一个或多个,在对本技术的示例性实施例的描述中,本技术的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该本技术的方法解释成反映如下意图:即所要求保护的本技术要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如相应的权利要求书所反映的那样,在于可以用少于某个公开的单个实施例的所有特征的特征来解决
相应的技术问题。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本技术的单独实施例。
[0199]
本领域的技术人员可以理解,除了特征之间相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0200]
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本技术的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0201]
本技术的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本技术实施例的一些模块的一些或者全部功能。本技术还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如,计算机程序和计算机程序产品)。这样的实现本技术的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0202]
应该注意的是上述实施例对本技术进行说明而不是对本技术进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本技术可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0203]
以上所述,仅为本技术的具体实施方式或对具体实施方式的说明,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种信息处理方法,所述方法包括:获得第一数据集;基于智能引擎处理所述第一数据集,确定目标对象;其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;所述目标对象属于所述第一数据集;所述目标对象用于作为第一类对象的推荐对象且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。2.根据权利要求1所述的方法,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习确定;其中,所述目标条件参数为所述智能引擎基于第一数据集利用机器学习确定,包括:所述智能引擎中的第一模型处理第一类数据,并确定划分所述第一类数据的第一条件参数;其中,所述第一模型与所述第一类对象的类别对应;所述智能引擎中的第二模型处理第二类数据,并确定划分所述第二类数据的第二条件参数;其中,所述第二模型与所述第二类对象的类别对应;根据所述第一条件参数和所述第二条件参数,确定所述目标条件参数。3.根据权利要求2所述的方法,根据所述第一条件参数和所述第二条件参数,确定所述目标条件参数,包括:根据所述第一模型和所述第二模型,利用神经网络确定第三模型;根据所述第一条件参数和第二条件参数,利用所述第三模型确定所述目标条件参数。4.根据权利要求3所述的方法,根据所述第一模型和所述第二模型,利用神经网络确定第三模型,包括:利用神经网络算法,将所述第一模型的结构和参数与所述第二模型的结构和参数进行调整,并将调整后的所述第一模型和所述第二模型合并,得到所述第三模型。5.根据权利要求2所述的方法,确定划分所述第一类数据的第一条件参数,包括:确定所述第一类数据的第一度量值;根据至少一个预设数值对所述第一类数据进行划分,分别确定所述第一类数据划分后各部分的第二度量值;根据所述第一类数据各部分的所述第二度量值,确定所述第一类数据的所述第三度量值;当所述第三度量值小于所述第一度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第一条件参数。6.根据权利要求2所述的方法,确定划分所述第二类数据的第二条件参数,包括:确定所述第二类数据的第四度量值;根据至少一个预设数值对所述第二类数据进行划分,分别确定所述第二类数据划分后各部分的第五度量值;根据所述第二类数据各部分的所述第五度量值,确定所述第二类数据的所述第六度量值;当所述第六度量值小于所述第四度量值时为信息增益,将信息增益最大时对应的所述预设数值确定为所述第二条件参数。
7.根据权利要求1所述的方法,所述方法还包括:对目标数据集进行预处理,得到所述第一数据集;其中,所述对目标数据集进行预处理,得到所述第一数据集,包括:根据所述目标数据集与所述目标数据集平均值的差值,确定协方差矩阵;根据所述协方差矩阵,确定所述目标数据集中各个数据的特征值和对应的特征向量;根据所述特征值,从大到小选取至少一个所述特征值,并结合所述特征值对应的特征向量组成特征向量矩阵;根据所述目标数据集和所述特征向量矩阵,确定所述第一数据集。8.根据权利要求1所述的方法,所述方法还包括:根据对象类别,将第一数据集分为第一类数据和第二类数据;根据所述第一类数据,创建所述第一模型;根据所述第二类数据,创建所述第二模型。9.一种信息处理装置,所述装置包括:获取模块,获得第一数据集;处理模块,基于智能引擎处理所述第一数据集,确定目标对象;其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;所述目标对象属于所述第一数据集;所述目标对象用于作为第一类对象的推荐对象且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。10.一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在被处理器运行时使得所述处理器至少执行:获得第一数据集;基于智能引擎处理所述第一数据集,确定目标对象;其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;所述目标对象属于所述第一数据集;所述目标对象用于作为第一类对象的推荐对象且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。
技术总结
本申请提供一种信息处理方法、装置及存储介质。所述方法包括:获得第一数据集;基于智能引擎处理所述第一数据集,确定目标对象;其中,所述智能引擎包括目标条件参数,所述目标条件参数用于确定所述目标对象;所述目标对象属于所述第一数据集;所述目标对象用于作为第一类对象的推荐对象,且作为第二类对象的推荐对象,所述第一类对象与第二类对象不同。本申请实施例的信息处理方法,通过基于智能引擎处理第一数据集,来确定目标对象,且目标对象用于作为第一类对象的推荐对象且作为第二类对象的推荐对象。的推荐对象。的推荐对象。
技术研发人员:王汉
受保护的技术使用者:联想(北京)有限公司
技术研发日:2023.05.30
技术公布日:2023/9/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/