一种在推荐中解决长尾效应的方法和装置与流程

未命名 10-18 阅读:84 评论:0


1.本发明涉及电子商务技术领域,特别涉及一种在推荐中解决长尾效应的方法和装置。


背景技术:

2.电子商务平台作为主要的商品销售渠道之一,具有低销售成本和齐全的商品种类,因此在消费者中广受欢迎。然而,由于电子商务平台上的商品数量庞大,用户想要快速找到所需商品非常困难,为了解决这个问题,人们研究出了各种商品推荐算法,可以根据用户的偏好、历史浏览记录和社交关系等信息为用户提供个性化的商品推荐。然而目前的商品推荐算法主要关注热门商品和新品的推荐,这就导致了冷门商品被用户关注到的概率更低。但提高冷门商品的曝光率是非常有必要的,冷门商品数量庞大,单个冷门商品虽然销量较低,但冷门商品的总体销量却是远超热门商品的,即通常所称的长尾效应。目前的商品推荐算法对冷门商品的关注度不高,即使有些电子商务平台考虑到了冷门商品的推荐,一般也是采用乱序或随机算法向用户进行随机推荐,这种推荐方式对成交率的提高效果不佳,使得电子商务平台的交易量的提升面临着较大的瓶颈问题。


技术实现要素:

3.本发明正是基于上述问题,提出了一种在推荐中解决长尾效应的方法和装置,能够有效促进电子商务平台的交易量的提升。
4.有鉴于此,本发明的第一方面提出了一种在推荐中解决长尾效应的方法,包括:
5.获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;
6.根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;
7.基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;
8.构建对应所述词向量的维度的向量空间;
9.将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;
10.将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;
11.当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;
12.从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;
13.生成所述推荐冷门商品的商品推荐列表;
14.向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。
15.进一步的,在上述的在推荐中解决长尾效应的方法中,将所述热门商品词向量列
表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:
16.遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:
17.将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,n
clist
],n
clist
为所述冷门商品词向量列表中的词向量的数量;
[0018]
计算当前词向量与第j个热门词向量的距离d
ij
,其中j∈[1,n
hlist
],n
glist
为所述热门商品词向量列表中的词向量的数量;
[0019]
确定与当前词向量距离最小的热门词向量使得d
ik
满足:
[0020][0021]
其中k∈[1,n
hlist
];
[0022]
将当前词向量与第k个热门词向量归到同一个簇。
[0023]
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:
[0024]
对于同一个冷门词向量存在多个k
x
使得均满足时,将当前词向量同时与第k
x
个热门词向量归到同一个簇,其中x∈(1,n
min
],n
min
为满足上述条件的热门词向量的数量。
[0025]
进一步的,在上述的在推荐中解决长尾效应的方法中,确定所述用户的至少一个关联热门商品的步骤具体包括:
[0026]
获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
[0027]
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;
[0028]
构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;
[0029]
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。
[0030]
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
[0031]
记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,n
rehlist
],n
rehlist
为所述关联热门商品列表中的热门商品的数量;
[0032]
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
[0033]
判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;
[0034]
判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;
[0035]
将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。
[0036]
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐
列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
[0037]
检测用户点击所述商品推荐列表中的冷门商品的操作;
[0038]
记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数
[0039]
基于所述推荐点击次数计算所述热门商品的推荐权重:
[0040][0041]
其中uplim为所述推荐权重的求和上限。
[0042]
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
[0043]
使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;
[0044]
计算所述关联次热门商品列表中的热门商品的推荐权重总和:
[0045][0046]
在[0,total_weight]的区间范围内生成一个随机数random_num;
[0047]
遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:
[0048][0049]
其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;
[0050]
当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;
[0051]
将当前的k值对应的热门商品确定为所述关联热门商品。
[0052]
进一步的,在上述的在推荐中解决长尾效应的方法中,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:
[0053]
获取所述电商网站页面上的商品推荐列表的长度n
relist
以及所述关联热门商品的数量n
reh

[0054]
计算所述推荐冷门商品的数量:
[0055][0056]
从所述关联热门商品所在的簇中确定数量为n
rec
的推荐冷门商品。
[0057]
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:
[0058]
将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;
[0059]
使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。
[0060]
本发明的第二方面提出了一种在推荐中解决长尾效应的装置,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如本发明第一方面任一项所述的在推荐中解决长尾效应的方法。
[0061]
本发明提出了一种在推荐中解决长尾效应的方法和装置,根据预设的热门商品的销量阈值将商品列表划分为热门商品列表和冷门商品列表,基于预先训练好的词向量模型生成热门商品词向量列表和冷门商品词向量列表,将每一个词向量映射到向量空间中,将每一个热门词向量确定为聚类中心对冷门商品词向量进行聚类,当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品,生成所述推荐冷门商品的商品推荐列表,向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据,能够有效促进电子商务平台的交易量的提升。
附图说明
[0062]
图1是本发明一个实施例提供的一种在推荐中解决长尾效应的方法的流程图;
[0063]
图2是本发明一个实施例提供的商品销量曲线图。
具体实施方式
[0064]
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
[0065]
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
[0066]
在本发明的描述中,术语“多个”则指两个或两个以上,除非另有明确的限定,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。术语“连接”、“安装”、“固定”等均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0067]
在本说明书的描述中,术语“一个实施例”、“一些实施方式”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0068]
下面参照附图来描述根据本发明一些实施方式提供的一种在推荐中解决长尾效应的方法和装置。
[0069]
如图1所示,本发明的第一方面提出了一种在推荐中解决长尾效应的方法,包括:
[0070]
获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;
[0071]
根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;
[0072]
基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;
[0073]
构建对应所述词向量的维度的向量空间;
[0074]
将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;
[0075]
将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;
[0076]
当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;
[0077]
从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;
[0078]
生成所述推荐冷门商品的商品推荐列表;
[0079]
向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。
[0080]
具体的,所述预设的统计周期可以为三天、一周或者一个月等。所述综合商品列表中不包含上线时间小于所述统计周期的商品,避免新品的低销量数据影响销量统计的准确性。
[0081]
图2是所述综合商品列表的商品销量曲线,y轴表示销量,x轴表示商品,y轴自下而上表示销量从低到高,商品根据销量从高到低在x轴自左向右排列。从图2可以看到,以所述销量阈值为界限,销量大于所述销量阈值的商品为热门商品,销量小于所述销量阈值的商品为冷门商品,所述热门商品列表由所述综合商品列表中的热门商品组成,所述冷门商品列表由所述综合商品列表中的冷门商品组成。
[0082]
所述词向量模型是使用预先准备的与商品名称相关的语料库训练得到,所述的与商品名称相关的语料库包括电商网站数据、新闻数据、社交媒体数据、维基百科数据等,所述电商网站数据包括各大电商平台的商品列表、商品描述、用户评价等数据,所述新闻数据包括涵盖了各行各业的商品信息的大量的新闻报道数据,所述社交媒体数据包括社交媒体上用户对商品的评价和意见数据,所述维基百科数据包括大量用于描述不同领域和商品的文本数据。
[0083]
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:
[0084]
遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:
[0085]
将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,n
clist
],n
clist
为所述冷门商品词向量列表中的词向量的数量;
[0086]
计算当前词向量与第j个热门词向量的距离d
ij
,其中j∈[1,n
hlist
],n
hlist
为所述热门商品词向量列表中的词向量的数量;
[0087]
确定与当前词向量距离最小的热门词向量使得d
ik
满足:
[0088]
[0089]
其中k∈[1,n
hlist
];
[0090]
将当前词向量与第k个热门词向量归到同一个簇。
[0091]
具体的,在聚类迭代的过程中始终以热门词向量列表中的词向量作为聚类中心,使得聚类结果保持与热门词向量的强关联性。在本发明的技术方案中,所述热门词向量列表中的词向量为热门词向量,所述冷门词向量列表中的词向量为冷门词向量。通过所述词向量模型所生成的词向量包括所述热门词向量和所述冷门词向量,均具有相同的维数,例如所生成的词向量具有n个维度,则构建对应所述词向量的维度的向量空间的步骤具体为构建一个n维向量空间。在所述向量空间中,可以采用余弦距离、欧氏距离、曼哈顿距离或者切比雪夫距离之中的任一种来衡量词向量之间的距离。
[0092]
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:
[0093]
对于同一个冷门词向量存在多个k
x
使得均满足时,将当前词向量同时与第k
x
个热门词向量归到同一个簇,其中x∈(1,n
min
],n
min
为满足上述条件的热门词向量的数量。
[0094]
具体的,对于同一个冷门词向量存在多个k
x
表示同时存在多个热门词向量与该冷门词向量的距离相同,且这个距离d
ik
为该冷门词向量与所有热门词向量的距离值d
ij
中的最小值。
[0095]
在上述实施方式的技术方案中,同一个冷门词向量可以与多个热门词向量存在于同一个簇中,即对于以这些热门词向量为聚类中心的簇,该冷门词向量为其交集数据。
[0096]
进一步的,在上述的在推荐中解决长尾效应的方法中,确定所述用户的至少一个关联热门商品的步骤具体包括:
[0097]
获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
[0098]
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;
[0099]
构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;
[0100]
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。
[0101]
具体的,所述用户的交易商品列表为所述用户在电子商务平台上的历史交易订单中的商品的合集。在本发明的一些实施方式中,所述用户的关联商品列表还可以包括用户曾经评论过或者浏览过的商品的列表。
[0102]
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
[0103]
记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,n
rehlist
],n
rehlist
为所述关联热门商品列表中的热门商品的数量;
[0104]
从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步
骤具体包括:
[0105]
判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;
[0106]
判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;
[0107]
将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。
[0108]
在上述实施方式的技术方案中,记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数具体为针对每一个用户,其关联热门商品列表中的每一个热门商品作为关联热门商品执行一次对应的冷门商品推荐后,在所述统计周期内累加记录其推荐次数。
[0109]
在从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表的步骤中,当推荐次数最多的热门商品为多个时,将推荐次数最多的多个热门商品从所述关联热门商品列表中剔除。当所述关联热门商品列表中的热门商品的推荐次数全部相同时,不执行从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表的步骤。
[0110]
进一步的,在上述的在推荐中解决长尾效应的方法中,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:
[0111]
检测用户点击所述商品推荐列表中的冷门商品的操作;
[0112]
记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数
[0113]
基于所述推荐点击次数计算所述热门商品的推荐权重:
[0114][0115]
其中uplim为所述推荐权重的求和上限。
[0116]
具体的,对于作为聚类中心对应的热门商品,其推荐点击次数为其所在簇的所有冷门商品在所述统计周期内被点击的次数之和。
[0117]
进一步的,在上述的在推荐中解决长尾效应的方法中,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:
[0118]
使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;
[0119]
计算所述关联次热门商品列表中的热门商品的推荐权重总和:
[0120][0121]
在[0,total_weight]的区间范围内生成一个随机数random_num;
[0122]
遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:
[0123][0124]
其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;
[0125]
当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;
[0126]
将当前的k值对应的热门商品确定为所述关联热门商品。
[0127]
在上述实施方式的技术方案中,可以使用费雪耶茨算法和萨托洛算法等随机排序算法、克努特德斯特内夫算法等洗牌算法或者使用冒泡排序算法、希尔排序算法等实现对所述关联次热门商品列表中的商品进行乱序排列。
[0128]
进一步的,在上述的在推荐中解决长尾效应的方法中,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:
[0129]
获取所述电商网站页面上的商品推荐列表的长度n
relist
以及所述关联热门商品的数量n
reh

[0130]
计算所述推荐冷门商品的数量:
[0131][0132]
从所述关联热门商品所在的簇中确定数量为n
rec
的推荐冷门商品。
[0133]
在本发明的一些实施方式中,根据所述电商网站页面上的商品推荐列表的长度确定所述推荐冷门商品的数量,所述电商网站页面上的商品推荐列表的长度指的是所述商品推荐列表能够容纳的推荐商品的数量。当所述关联热门商品的数量为1时,则从所述关联热门商品所在的簇中确定与所述商品推荐列表的长度相等数量的冷门商品作为所推荐冷门商品。
[0134]
在本发明的一些实施方式中,从所述关联热门商品所在的簇中确定数量为n
rec
的推荐冷门商品的步骤之后,还包括:
[0135]
记录所述统计周期内每个簇中每个冷门商品被确定推荐冷门商品的次数;
[0136]
在从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤中还包括:
[0137]
判断所述关联热门商品的词向量为聚类中心的簇中的冷门商品被确定推荐冷门商品的次数是否全部相同;
[0138]
判断为否时,从所述关联热门商品的词向量为聚类中心的簇中剔除被确定推荐冷门商品次数最多的冷门商品后生成拟推荐冷门商品列表;
[0139]
将所述拟推荐冷门商品列表中的商品进行乱序排列后利用随机算法从所述拟推荐冷门商品列表中确定n
rec
个冷门商品作为所述推荐冷门商品。
[0140]
进一步的,在上述的在推荐中解决长尾效应的方法中,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:
[0141]
将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;
[0142]
使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。
[0143]
具体的,一个关联热门商品对应的推荐冷门商品是指从该关联热门商品所在簇中确定的推荐冷门商品。
[0144]
本发明的第二方面提出了一种在推荐中解决长尾效应的装置,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如本发明第一方面任一项所述的在推荐中解决长尾效应的方法。
[0145]
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0146]
依照本发明的实施例如上文所述,这些实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施例。显然,根据以上描述,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地利用本发明以及在本发明基础上的修改使用。本发明仅受权利要求书及其全部范围和等效物的限制。

技术特征:
1.一种在推荐中解决长尾效应的方法,其特征在于,包括:获取预设的统计周期的综合商品列表以及所述综合商品列表中每种商品的销量;根据预设的热门商品的销量阈值将所述综合商品列表划分为热门商品列表和冷门商品列表;基于预先训练好的词向量模型将所述热门商品列表和所述冷门商品列表中的商品名称转化为词向量以生成热门商品词向量列表和冷门商品词向量列表;构建对应所述词向量的维度的向量空间;将所述热门商品词向量列表和所述冷门商品词向量列表中的每一个词向量映射到所述向量空间中;将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类;当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品;从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品;生成所述推荐冷门商品的商品推荐列表;向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据。2.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,将所述热门商品词向量列表中的每一个词向量确定为聚类中心对所述冷门商品词向量列表中的词向量进行聚类的步骤具体包括:遍历所述冷门商品词向量列表以对每个冷门词向量执行以下步骤:将遍历到的冷门词向量即第i个冷门词向量确定为当前词向量其中i∈[1,n
clist
],n
clist
为所述冷门商品词向量列表中的词向量的数量;计算当前词向量与第j个热门词向量的距离d
ij
,其中j∈[1,n
hlist
],n
hlist
为所述热门商品词向量列表中的词向量的数量;确定与当前词向量距离最小的热门词向量使得d
ik
满足:其中k∈[1,n
hlist
];将当前词向量与第k个热门词向量归到同一个簇。3.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,在确定与当前词向量距离最小的热门词向量的步骤之后,还包括:对于同一个冷门词向量存在多个k
x
使得均满足时,将当前词向量同时与第k
x
个热门词向量归到同一个簇,其中x∈(1,n
min
],n
min
为满足上述条件的热门词向量的数量。4.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,确定所述用户的至少一个关联热门商品的步骤具体包括:获取所述用户的交易商品列表、购物车商品列表以及收藏商品列表;
将所述用户的交易商品列表、购物车商品列表以及收藏商品列表合并为所述用户的关联商品列表;构建所述用户的关联热门商品列表,所述热门商品列表为所述用户的关联商品列表与所述热门商品列表的交集;从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品。5.根据权利要求4所述的在推荐中解决长尾效应的方法,其特征在于,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:记录所述统计周期内所述热门商品作为所述关联热门商品的推荐次数其中i∈[1,n
rehlisy
],n
rehlist
为所述关联热门商品列表中的热门商品的数量;从所述关联热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:判断所述关联热门商品列表中的热门商品的推荐次数是否全部相同;判断为否时,从所述关联热门商品列表中剔除推荐次数最多的热门商品后生成关联次热门商品列表;将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品。6.根据权利要求4所述的在推荐中解决长尾效应的方法,其特征在于,在向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据的步骤之后,还包括:检测用户点击所述商品推荐列表中的冷门商品的操作;记录所述统计周期内所述冷门商品所在簇的聚类中心对应的热门商品的推荐点击次数基于所述推荐点击次数计算所述热门商品的推荐权重:其中uplim为所述推荐权重的求和上限。7.根据权利要求6所述的在推荐中解决长尾效应的方法,其特征在于,将所述关联次热门商品列表中的商品进行乱序排列后利用随机算法从所述关联次热门商品列表中确定至少一个热门商品作为所述关联热门商品的步骤具体包括:使用乱序算法对所述关联次热门商品列表中的热门商品进行乱序排列;计算所述关联次热门商品列表中的热门商品的推荐权重总和:在[0,total_weight]的区间范围内生成一个随机数random_num;遍历所述关联次热门商品列表中的热门商品以计算临时累加权重:其中k为当前遍历到的热门商品在乱序排列后的所述关联次热门商品列表中的位置;当遍历到第一个满足cumulative_weight≥random_num的热门商品时,停止遍历;将当前的k值对应的热门商品确定为所述关联热门商品。8.根据权利要求1所述的在推荐中解决长尾效应的方法,其特征在于,从以所述关联热
门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品的步骤具体包括:获取所述电商网站页面上的商品推荐列表的长度n
relist
以及所述关联热门商品的数量n
reh
;计算所述推荐冷门商品的数量:从所述关联热门商品所在的簇中确定数量为n
rec
的推荐冷门商品。9.根据权利要求8所述的在推荐中解决长尾效应的方法,其特征在于,在确定所述用户的至少一个关联热门商品的步骤中确定多个关联热门商品,生成所述推荐冷门商品的商品推荐列表的步骤具体包括:将每个关联热门商品对应的推荐冷门商品合并到一个推荐冷门商品列表;使用乱序算法对所述推荐冷门商品列表中的冷门商品进行乱序排列得到所述推荐冷门商品的商品推荐列表。10.一种在推荐中解决长尾效应的装置,其特征在于,包括存储器和处理器,所述处理器执行所述存储器中存储的计算机程序实现如权利要求1-9任一项所述的在推荐中解决长尾效应的方法。

技术总结
本发明提出了一种在推荐中解决长尾效应的方法和装置,根据预设的热门商品的销量阈值将商品列表划分为热门商品列表和冷门商品列表,基于预先训练好的词向量模型生成热门商品词向量列表和冷门商品词向量列表,将每一个词向量映射到向量空间中,将每一个热门词向量确定为聚类中心对冷门商品词向量进行聚类,当用户请求访问包含推荐列表栏目的电商网站页面数据时,确定所述用户的至少一个关联热门商品,从以所述关联热门商品的词向量为聚类中心的簇中确定至少一个推荐冷门商品,生成所述推荐冷门商品的商品推荐列表,向所述用户返回在推荐列表栏目中包含所述商品推荐列表的电商网站页面数据,能够有效促进电子商务平台的交易量的提升。易量的提升。易量的提升。


技术研发人员:张翼 严波 张敏 吴伟森
受保护的技术使用者:深圳丰享信息技术有限公司
技术研发日:2023.07.24
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐