商品搜索方法、装置、设备及存储介质与流程

未命名 08-26 阅读:70 评论:0


1.本技术涉及人工智能和医疗技术领域,尤其涉及一种商品搜索方法、装置、设备及存储介质。


背景技术:

2.目前,对于医疗平台的商品搜索场景,如搜索医药商品或者医疗服务商品,商品数据可能是几十万量级甚至是百万量级的,然而,传统的搜索大部分都是简单的根据用户提供检索文本与商品标题进行匹配,通过这种方式返回的商品结果集非常庞大,并且与用户的购物需求的匹配度比较低,此时,用户需要花费大量的时间从海量信息中去筛选自己真正需要的商品,影响用户的购物体验。


技术实现要素:

3.本技术的主要目的在于提供一种商品搜索方法、装置、设备及存储介质,旨在解决现有的商品搜索方式得到的搜索结果与用户的购物需求匹配度低,影响用户购物体验的问题。
4.第一方面,本技术提供一种商品搜索方法,包括:
5.当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;
6.对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;
7.计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;
8.利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;
9.根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。
10.第二方面,本技术还提供一种商品搜索装置,所述商品搜索装置包括:
11.请求接收模块,用于当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;
12.分词模块,用于对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;
13.第一匹配模块,用于计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;
14.第二匹配模块,用于利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;
15.排序模块,用于根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。
16.第三方面,本技术还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上所述的商品搜索方法的步骤。
17.第四方面,本技术还提供一种存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上所述的商品搜索方法的步骤。
18.本技术提供一种商品搜索方法、装置、设备及存储介质,本技术中,从商品搜索请求中提取用于搜索商品的描述信息后,根据描述信息的分词从倒排索引中选取与描述信息关联度高的第一匹配商品,并根据描述信息的向量从第二比对字典中筛选与描述信息关联度高的第二匹配商品,且根据商品热度对根据第一匹配商品以及第二匹配商品构建商品列表进行排序,得到目标商品列表,解决了现有的商品搜索方式得到的搜索结果与用户的购物需求匹配度低,用户购物体验差的问题,可以让用户更好更快的从搜索中定位到自己想要医药商品或者医疗服务商品。
附图说明
19.为了更清楚地说明本技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1为本技术实施例提供的一种商品搜索方法的步骤流程示意图;
21.图2为本技术实施例提供的一种商品搜索装置的示意性框图;
22.图3为本技术实施例提供的一种计算机设备的结构示意性框图。
23.本技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
24.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
25.附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
26.本技术实施例提供一种商品搜索方法、装置、设备及存储介质。其中,该方法可应用于终端设备或服务器中,该终端设备可以为手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备;该服务器可以为单台的服务器,也可以为由多台服务
器组成的服务器集群。以下以该方法应用于服务器为例进行解释说明。
27.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
28.请参照图1,图1为本技术实施例提供的一种商品搜索方法的步骤流程示意图。
29.如图1所示,该商品搜索方法包括步骤s10至步骤s15。
30.步骤s10、当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息。
31.可以理解,商品搜索请求可以为服务器接收到的用户利用终端设备发送的网络请求,也可以为终端设备与服务器建立全双工通讯连接后,服务器接收到的用户通过终端设备发送的即时通讯消息,当然,商品搜索请求还可以为服务器接收到并可以识别的其他形式的控制指令,在此不做限制。另外,本技术所指的商品搜索请求,包括医药商品搜索请求或者医疗服务商品搜索请求。
32.其中,用户通过描述信息来表述自身的购物需求,服务器从商品搜索请求中提取到描述信息后,即可根据描述信息进行商品搜索。
33.步骤s11、对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引。
34.可以理解,对描述信息进行分词处理时,可以使用(nlp,natural language processing)自然语言处理技术来实现,也可以根据情况需要采用其他方法来对描述信息进行分词处理,在此不做限制。另外,对描述信息进行分词处理后即可得到分词结果,分词结果中可以包括一个分词,亦可以包括多个分词,具体情况视描述信息而定。
35.在一些实施方式中,在商家通过服务器上架新的商品时,服务器会对商家上架的商品信息进行分词处理,并根据商品信息所包含的分词与商品信息构建或者更新倒排索引;另外,还可以通过使用es(elasticsearch)数据模型来对商品信息进行批量处理,以生成或更新倒排索引;最终所得到的的倒排索引结果即为第一比对字典。
36.从第一比对字典中获取包括分词结果中的任一分词的商品信息,即得到第一商品信息,其中,第一商品信息的数量可以为任意个,每一个第一商品信息皆为一个商品对应的信息。
37.示例性的,假设商品信息所包括的分词如下表一所示。
38.表一、
39.商品分词商品一品牌a、xx药丸商品二品牌b、xx药丸商品三品牌b、xx胶囊
40.则根据表一构建的第一比对字典如下表二所示。
41.表二、
42.分词商品品牌a商品一xx药丸商品一、商品二
品牌b商品二、商品三xx胶囊商品三
43.假设分词结果中的分词包括“xx药丸”,则根据第一比对字典所获取到的与分词结果相匹配的第一商品信息为“商品一”以及“商品二”对应的商品信息。
44.在一些实施方式中,所述对所述描述信息进行分词处理以得到分词结果,包括:对所述描述信息进行分词处理,得到第一分词集合;对所述第一分词集合中的分词进行拼写纠错,得到第二分词集合;对所述第二分词集合中的分词进行同义词扩展,得到分词结果。
45.可以理解,对描述信息进行分词处理后,利用所得到的分词组成的集合,即为第一分词集合。另外,发起商品搜索的用户在输入描述信息时,可能会因为不小心或者不了解而输入错别字,当识别到第一分词集合中存在拼写错误的错误分词时,将第一分词集合中的错误分词替换为拼写正确的分词,即得到第二分词集合。识别第二分词集合中的各个分词的同义词,并将识别得到的同义词加入到第二分词集合中,即得到分词结果。
46.在一些实施方式中,在对第一分词集合中的分词进行拼写纠错时,可以采用预构建好的纠错字典来识别并替换第一分词集合中的错误分词。
47.示例性的,假设第一分词集合包括“aa品牌”和“xx药丸”两个分词,而对应的纠错字典如下表三所示。
48.表三、
49.正确分词错误分词aa品牌aa品牌xx药丸xx药丸
50.则将第一分词集合中的“xx药丸”替换为“xx药丸”,并将第一分词集合中的“aa品牌”替换为“aa品牌”,即可得到第二分词集合。
51.本实施方式中,通过对第一分词集合中的分词进行拼写纠错,提高了商品搜索的准确度,另外,通过对第二分词集合中的分词进行同义词扩展,提高了商品搜索的匹配范围。
52.在一些实施方式中,所述根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,包括:根据预设的分词意图匹配表识别所述分词结果中的各个分词对应的分词意图,并从数据库中获取意图类型对应所述分词意图的倒排索引作为第一比对字典;根据所述第一比对字典获取所述分词结果中的各个分词对应的商品信息作为第一商品信息。
53.可以理解,在描述信息中,不同的分词都有其对应的意图类型。示例性的,假设描述信息中包括“xxx旗舰店”,则分词“xxx旗舰店”的意图类型为“搜索商家”;假设描述信息中包括“xxx品牌”,则分词“xxx品牌”的意图类型为“搜索品牌”。
54.分词对应的意图类型,即为该分词对应的分词意图。另外,分词意图匹配表中记录了各种分词与分词意图的映射关系,通过分词意图匹配表即可确定分词结果中的各个分词对应的分词意图。
55.并且,服务器在构建分词到商品信息的倒排索引时,根据分词对应的意图类型对倒排索引进行了分组。具体的,服务器在数据库中建立了多个倒排索引,不同的倒排索引中的分词对应的意图类型不同。
56.示例性的,假设分词的意图类型有两种,分别为“搜索商家”以及“搜索品牌”,则服务器分别构建两个倒排索引,其中一个倒排索引用于记录意图类型为“搜索商家”的分词以及该分词对应的商品信息,另一个倒排索引则用于记录意图类型为“搜索品牌”的分词以及该分词对应的商品信息。
57.确定分词结果中的各个分词对应的分词意图后,即可从数据库中获取意图类型对应分词意图的倒排索引作为第一比对字典,并通过第一比对字典来获取与分词结果中的各个分词对应的商品信息作为第一商品信息,其中,第一商品信息为集合类型,可以包括任意个商品信息。
58.本实施方式中,通过识别分词结果中的各个分词的分词意图,再匹配意图类型对应分词意图的第一比对字典,并根据第一比对字典来筛选第一商品信息,不仅缩小了从海量数据中搜索匹配商品的范围,还提高了搜索商品的搜索效率以及精确度。
59.步骤s12、计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品。
60.可以理解,在第一商品信息中,有的商品信息仅包含了分词结果中的一个分词,而有的商品信息则包含了分词结果中的多个分词,因此,不同的商品信息与描述信息的匹配程度不同。
61.通过计算第一商品信息中包含的分词结果中的分词的个数可以确定商品信息与描述信息的匹配度,匹配度越高,则该商品信息的第一匹配得分也越高。从第一商品信息中选取第一匹配得分高的商品,即得到第一匹配商品。
62.在一些实施方式中,所述计算所述第一商品信息与所述描述信息的第一匹配得分,包括:对所述第一商品信息进行分词处理,得到第三分词集合;
63.滤除掉所述第三分词集合中的无用分词,得到第四分词集合;获取所述第四分词集合与所述分词结果的共同分词作为匹配分词;根据所述第四分词集合计算所述匹配分词的词频,并根据所述词频确定所述第一商品信息与所述描述信息的第一匹配得分。
64.可以理解,对第一商品信息进行分词处理后,利用所得到的分词构成的集合即为第三分词集合。滤除掉第三分词集合中的这些无用分词后,即得到第四分词集合。另外,同时出现在第四分词集合以及分词结果中的分词即为匹配分词。
65.其中,第三分词集合中可能会存在一些无用分词,比如说“可以”、“我们”、“通常”等,这些词语在人们日常说话的过程中出现频率较高,但是对商品而言没有多少表征意义。
66.在一些实施方式中,在滤除第三分词集合中的无用分词时,可以通过预设的无用词滤除模型进行无用分词滤除,也可以采用预构建的无用分词词典对第三分词集合进行比对滤除。
67.可以理解,在计算第一商品信息与描述信息的第一匹配得分之前,先滤除掉第三分词集合中的无用分词,不仅可以减少后续计算第一匹配得分的计算量,还可以提高计算第一匹配得分的准确率。
68.确定匹配分词后,通过累加各个匹配分词在第四分词集合中的词频,再利用词频累加结果除以第四分词集合中的分词总数,即可确定第一商品信息与描述信息的第一匹配得分。
69.步骤s13、利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预
构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量。
70.在一些实施方式中,向量获取模型可以为dssm(deep structured semantic models)模型,也可以为其他类型的向量获取模型,在此不做限制。当使用dssm模型作为向量获取模型时,向dssm模型输入描述信息,可以获取对应描述信息的64维的向量作为比对向量,当然,dssm模型除了可以输出64维的向量外,还可以输出其他更高或者更低维度的向量,在此不走限制。
71.另外,预先使用向量获取模型来获取各个商品信息对应的商品向量,并根据商品信息与商品向量建立映射关系,即得到第二比对字典。其中,第二比对字典中各个商品信息的商品向量的维度与比对向量的维度相同。示例性的,假设比对向量为64维的向量,则第二比对字典中的各个商品信息的商品向量也为64维的向量。
72.通过使用比对向量与从第二比对字典中获取各个商品信息对应的商品向量计算相似度,即可通过相似度确定商品向量对应的商品信息与描述信息是否匹配。从第二比对字典中选取与描述信息匹配度达到预设阀值的商品信息,即得到第二匹配商品。
73.在一些实施方式中,所述根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,包括:从预构建好的第二比对字典中获取各个商品信息的商品向量,并计算所述商品向量与所述比对向量的相似度作为第一相似度;根据所述第一相似度从所述第二比对字典中筛选商品信息,得到第一匹配集合;获取发起所述商品搜索请求的用户的用户信息,并将所述用户信息输入所述向量获取模型以得到用户向量;计算所述第一匹配集合中的各个商品信息对应的商品向量与所述用户向量的相似度作为第二相似度;根据所述第二相似度从所述第一匹配结合中筛选商品信息,得到第二匹配商品。
74.在一些实施方式中,第一相似度可以通过计算商品向量与比对向量的余弦相似度来确定,也可以通过计算商品向量与比对向量的曼哈顿距离等方式来确定,在此不做限制。
75.其中,从第二比对字典中筛选第一相似度达到预设相似阀值的商品信息,利用这些商品信息构建集合即得到第一匹配集合。
76.在一些实施方式中,商品搜索请求中还包括了提交该请求的用户的身份标识信息,通过用户的身份标识信息可以从数据库中提取用户信息。其中,用户信息包括但不限定于用户的购物倾向,将用户信息输入向量获取模型后,即可用用户向量来表征用户的购物倾向。
77.可以理解,不同的用户的购物倾向不同,示例性的,有的用户喜欢买性价比高的商品,有的用户喜欢买品牌口碑好的商品等等。本实施方式中,从第二比对字典中选取出与比对向量相似度高的商品信息以得到第一匹配集合后,再从第一匹配集合中选取与用户向量相似度高的商品信息,则最终所得到的的第二匹配商品可以同时兼顾用户的购物倾向以及购物需求。
78.步骤s14、根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。
79.可以理解,去除掉第一匹配商品以及第二匹配商品中的重复商品,即可得到商品列表。商品列表中的商品皆为匹配商品,计算商品列表中的各个匹配商品的商品热度,并根据商品热度从高到低对匹配商品进行排序,即可得到目标商品列表。确定目标商品列表后,
将目标商品列表返回给发起该商品搜索请求的用户,用户即可通过目标商品列表更快更好的选购商品。
80.在一些实施方式中,所述根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表,包括:根据所述商品列表中的匹配商品的属性信息计算所述匹配商品对应的商品热度,其中,所述属性信息包括所述匹配商品的浏览次数、收藏次数、加入购物车次数、好评率以及曝光次数;根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表。
81.其中,根据属性信息来计算匹配商品的商品热度的方式有很多种,在一些实施方式中,假设x、y、z为预设系数,可以通过以下公式来计算商品热度:商品热度=[x*浏览次数+y*(收藏次数+加入购物车次数)-z*好评率]*浏览次数/曝光次数。
[0082]
当然,匹配商品的属性信息还可以包括其他维度的商品信息,并且计算商品热度的公式也可以采用其他公式,在此不做限制。
[0083]
本实施方式提供了一种计算商品热度的方法,利用本方法计算出来的商品热度对商品列表中的各个匹配商品进行排序,可以让用户从热度最高的一批商品开始商品选购,可以提高用户的购物体验。
[0084]
在一些实施方式中,所述根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表,包括:从所述商品列表中筛选商品销量大于预设数值的目标匹配商品,并根据预设算法降低所述目标匹配商品对应的商品热度;根据所述商品热度对所述商品列表中的各个匹配商品按热度等级进行分组,并对归属于同一分组内的匹配商品进行随机排序,得到分组结果;对所述分组结果中的各个分组按热度等级从高到低进行拼接处理,得到目标商品列表。
[0085]
可以理解,根据商品热度对商品列表中的各个匹配商品进行排序后,热门榜单上的热门商品很容易同时排在目标商品列表的前面,从而引发头部效应,本实施方式中,通过选取商品销量大于预设数值的目标匹配商品,并降低目标匹配商品的商品热度,可以解决商品搜索中的长尾曝光的问题,让长尾商品更有竞争力。
[0086]
在一些实施方式中,用于降低目标匹配商品的商品热度的算法如下所示:
[0087][0088]
其中,r是匹配商品的调整后的商品热度,s是匹配商品在调整前的原始商品热度,m是匹配商品的销量,a是一个可以根据情况需要进行调节的参数,在此不做限制,通过上述公式可以解决目标商品列表出现头部效应的问题,同时可以保护销量小于a的匹配商品的商品热度不被降低。
[0089]
本实施方式在降低商品列表中的匹配商品的商品热度,并根据预设的热度等级对匹配商品进行分组且打乱分组内的排序后,按热度等级从高到低拼接各个分组,可以解决相同类型的商品连续不断的返回给用户的问题。
[0090]
本技术中,从商品搜索请求中提取用于搜索商品的描述信息后,根据描述信息的分词从倒排索引中选取与描述信息关联度高的第一匹配商品,并根据描述信息的向量从第二比对字典中筛选与描述信息关联度高的第二匹配商品,且根据商品热度对根据第一匹配
商品以及第二匹配商品构建商品列表进行排序,得到目标商品列表,解决了现有的商品搜索方式得到的搜索结果与用户的购物需求匹配度低,用户购物体验差的问题,可以让用户更好更快的从搜索中定位到自己想要医药商品或者医疗服务商品。
[0091]
请参照图2,图2为本技术实施例提供的一种商品搜索装置的示意性框图。
[0092]
如图2所示,该商品搜索装置201,包括:
[0093]
请求接收模块2011,用于当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;
[0094]
分词模块2012,用于对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;
[0095]
第一匹配模块2013,用于计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;
[0096]
第二匹配模块2014,用于利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;
[0097]
排序模块2015,用于根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。
[0098]
在一些实施方式中,所述分词模块2012在对所述描述信息进行分词处理以得到分词结果时,包括:
[0099]
对所述描述信息进行分词处理,得到第一分词集合;
[0100]
对所述第一分词集合中的分词进行拼写纠错,得到第二分词集合;
[0101]
对所述第二分词集合中的分词进行同义词扩展,得到分词结果。
[0102]
在一些实施方式中,所述分词模块2012在根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息时,包括:
[0103]
根据预设的分词意图匹配表识别所述分词结果中的各个分词对应的分词意图,并从数据库中获取意图类型对应所述分词意图的倒排索引作为第一比对字典;
[0104]
根据所述第一比对字典获取所述分词结果中的各个分词对应的商品信息作为第一商品信息。
[0105]
在一些实施方式中,所述第一匹配模块2013在计算所述第一商品信息与所述描述信息的第一匹配得分时,包括:
[0106]
对所述第一商品信息进行分词处理,得到第三分词集合;
[0107]
滤除掉所述第三分词集合中的无用分词,得到第四分词集合;
[0108]
获取所述第四分词集合与所述分词结果的共同分词作为匹配分词;
[0109]
根据所述第四分词集合计算所述匹配分词的词频,并根据所述词频确定所述第一商品信息与所述描述信息的第一匹配得分。
[0110]
在一些实施方式中,所述第二匹配模块2014在根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品时,包括:
[0111]
从预构建好的第二比对字典中获取各个商品信息的商品向量,并计算所述商品向量与所述比对向量的相似度作为第一相似度;
[0112]
根据所述第一相似度从所述第二比对字典中筛选商品信息,得到第一匹配集合;
[0113]
获取发起所述商品搜索请求的用户的用户信息,并将所述用户信息输入所述向量获取模型以得到用户向量;
[0114]
计算所述第一匹配集合中的各个商品信息对应的商品向量与所述用户向量的相似度作为第二相似度;
[0115]
根绝所述第二相似度从所述第一匹配结合中筛选商品信息,得到第二匹配商品。
[0116]
在一些实施方式中,所述排序模块2015在根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表时,包括:
[0117]
根据所述商品列表中的匹配商品的属性信息计算所述匹配商品对应的商品热度,其中,所述属性信息包括所述匹配商品的浏览次数、收藏次数、加入购物车次数、好评率以及曝光次数;
[0118]
根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表。
[0119]
在一些实施方式中,所述排序模块2015在根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表时,包括:
[0120]
从所述商品列表中筛选商品销量大于预设数值的目标匹配商品,并根据预设算法降低所述目标匹配商品对应的商品热度;
[0121]
根据所述商品热度对所述商品列表中的各个匹配商品按热度等级进行分组,并对归属于同一分组内的匹配商品进行随机排序,得到分组结果;
[0122]
对所述分组结果中的各个分组按热度等级从高到低进行拼接处理,得到目标商品列表。
[0123]
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块及单元的具体工作过程,可以参考前述商品搜索方法实施例中的对应过程,在此不再赘述。
[0124]
上述实施例提供的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
[0125]
请参阅图3,图3为本技术实施例提供的一种计算机设备的结构示意性框图。该计算机设备包括但不限定于服务器。
[0126]
如图3所示,该计算机设备301包括通过系统总线连接的处理器3011、存储器和网络接口,其中,存储器可以包括存储介质3012和内存储器3015,存储介质3012可以是非易失性的,也可以是易失性的。
[0127]
存储介质3012可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器3011执行任意一种商品搜索方法。
[0128]
处理器3011用于提供计算和控制能力,支撑整个计算机设备的运行。
[0129]
内存储器3015为存储介质3012中的计算机程序的运行提供环境,该计算机程序被处理器3011执行时,可使得处理器3011执行任意一种商品搜索方法。
[0130]
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部
件,或者组合某些部件,或者具有不同的部件布置。
[0131]
应当理解的是,处理器3011可以是中央处理单元(central processing unit,cpu),该处理器3011还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0132]
其中,在一些实施方式中,所述处理器3011用于运行存储在存储器中的计算机程序,以实现如下步骤:
[0133]
当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;
[0134]
对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;
[0135]
计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;
[0136]
利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;
[0137]
根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。
[0138]
在一些实施方式中,所述处理器3011在对所述描述信息进行分词处理以得到分词结果时,用于实现:
[0139]
对所述描述信息进行分词处理,得到第一分词集合;
[0140]
对所述第一分词集合中的分词进行拼写纠错,得到第二分词集合;
[0141]
对所述第二分词集合中的分词进行同义词扩展,得到分词结果。
[0142]
在一些实施方式中,所述处理器3011在根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息时,用于实现:
[0143]
根据预设的分词意图匹配表识别所述分词结果中的各个分词对应的分词意图,并从数据库中获取意图类型对应所述分词意图的倒排索引作为第一比对字典;
[0144]
根据所述第一比对字典获取所述分词结果中的各个分词对应的商品信息作为第一商品信息。
[0145]
在一些实施方式中,所述处理器3011在计算所述第一商品信息与所述描述信息的第一匹配得分时,用于实现:
[0146]
对所述第一商品信息进行分词处理,得到第三分词集合;
[0147]
滤除掉所述第三分词集合中的无用分词,得到第四分词集合;
[0148]
获取所述第四分词集合与所述分词结果的共同分词作为匹配分词;
[0149]
根据所述第四分词集合计算所述匹配分词的词频,并根据所述词频确定所述第一商品信息与所述描述信息的第一匹配得分。
[0150]
在一些实施方式中,所述处理器3011在根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品时,用于实现:
[0151]
从预构建好的第二比对字典中获取各个商品信息的商品向量,并计算所述商品向量与所述比对向量的相似度作为第一相似度;
[0152]
根据所述第一相似度从所述第二比对字典中筛选商品信息,得到第一匹配集合;
[0153]
获取发起所述商品搜索请求的用户的用户信息,并将所述用户信息输入所述向量获取模型以得到用户向量;
[0154]
计算所述第一匹配集合中的各个商品信息对应的商品向量与所述用户向量的相似度作为第二相似度;
[0155]
根绝所述第二相似度从所述第一匹配结合中筛选商品信息,得到第二匹配商品。
[0156]
在一些实施方式中,所述处理器3011在根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表时,用于实现:
[0157]
根据所述商品列表中的匹配商品的属性信息计算所述匹配商品对应的商品热度,其中,所述属性信息包括所述匹配商品的浏览次数、收藏次数、加入购物车次数、好评率以及曝光次数;
[0158]
根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表。
[0159]
在一些实施方式中,所述处理器3011在根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表时,用于实现:
[0160]
从所述商品列表中筛选商品销量大于预设数值的目标匹配商品,并根据预设算法降低所述目标匹配商品对应的商品热度;
[0161]
根据所述商品热度对所述商品列表中的各个匹配商品按热度等级进行分组,并对归属于同一分组内的匹配商品进行随机排序,得到分组结果;
[0162]
对所述分组结果中的各个分组按热度等级从高到低进行拼接处理,得到目标商品列表。
[0163]
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述计算机设备的具体工作过程,可以参考前述商品搜索方法实施例中的对应过程,在此不再赘述。
[0164]
本技术实施例还提供一种存储介质,该存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本技术商品搜索方法的各个实施例。
[0165]
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
[0166]
应当理解,在此本技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本技术。如在本技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0167]
还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关
联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0168]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种商品搜索方法,其特征在于,所述方法包括:当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。2.根据权利要求1所述的方法,其特征在于,所述对所述描述信息进行分词处理以得到分词结果,包括:对所述描述信息进行分词处理,得到第一分词集合;对所述第一分词集合中的分词进行拼写纠错,得到第二分词集合;对所述第二分词集合中的分词进行同义词扩展,得到分词结果。3.根据权利要求1所述的方法,其特征在于,所述根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,包括:根据预设的分词意图匹配表识别所述分词结果中的各个分词对应的分词意图,并从数据库中获取意图类型对应所述分词意图的倒排索引作为第一比对字典;根据所述第一比对字典获取所述分词结果中的各个分词对应的商品信息作为第一商品信息。4.根据权利要求3所述的方法,其特征在于,所述计算所述第一商品信息与所述描述信息的第一匹配得分,包括:对所述第一商品信息进行分词处理,得到第三分词集合;滤除掉所述第三分词集合中的无用分词,得到第四分词集合;获取所述第四分词集合与所述分词结果的共同分词作为匹配分词;根据所述第四分词集合计算所述匹配分词的词频,并根据所述词频确定所述第一商品信息与所述描述信息的第一匹配得分。5.根据权利要求1所述的方法,其特征在于,所述根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,包括:从预构建好的第二比对字典中获取各个商品信息的商品向量,并计算所述商品向量与所述比对向量的相似度作为第一相似度;根据所述第一相似度从所述第二比对字典中筛选商品信息,得到第一匹配集合;获取发起所述商品搜索请求的用户的用户信息,并将所述用户信息输入所述向量获取模型以得到用户向量;计算所述第一匹配集合中的各个商品信息对应的商品向量与所述用户向量的相似度作为第二相似度;
根绝所述第二相似度从所述第一匹配结合中筛选商品信息,得到第二匹配商品。6.根据权利要求1所述的方法,其特征在于,所述根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表,包括:根据所述商品列表中的匹配商品的属性信息计算所述匹配商品对应的商品热度,其中,所述属性信息包括所述匹配商品的浏览次数、收藏次数、加入购物车次数、好评率以及曝光次数;根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表。7.根据权利要求6所述的方法,其特征在于,所述根据所述商品热度对所述商品列表中的各个匹配商品进行排序,得到目标商品列表,包括:从所述商品列表中筛选商品销量大于预设数值的目标匹配商品,并根据预设算法降低所述目标匹配商品对应的商品热度;根据所述商品热度对所述商品列表中的各个匹配商品按热度等级进行分组,并对归属于同一分组内的匹配商品进行随机排序,得到分组结果;对所述分组结果中的各个分组按热度等级从高到低进行拼接处理,得到目标商品列表。8.一种商品搜索装置,其特征在于,包括:请求接收模块,用于当接收到商品搜索请求时,从所述商品搜索请求中提取用于搜索商品的描述信息;分词模块,用于对所述描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与所述分词结果相匹配的第一商品信息,其中,所述第一比对字典为根据分词与商品信息构建的倒排索引;第一匹配模块,用于计算所述第一商品信息与所述描述信息的第一匹配得分,并根据所述第一匹配得分从各个所述第一商品信息中筛选第一匹配商品;第二匹配模块,用于利用预设的向量获取模型获取所述描述信息对应的比对向量,并根据预构建好的第二比对字典获取与所述比对向量相匹配的第二匹配商品,其中,所述第二比对字典记录有商品信息以及所述商品信息对应的商品向量;排序模块,用于根据所述第一匹配商品以及所述第二匹配商品构建商品列表,并根据商品热度对所述商品列表的各个匹配商品进行排序,得到目标商品列表。9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的商品搜索方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的商品搜索方法的步骤。

技术总结
本申请涉及人工智能和医疗技术领域,公开了一种商品搜索方法、装置、设备及存储介质,方法包括:当接收到商品搜索请求时,从商品搜索请求中提取用于搜索商品的描述信息;对描述信息进行分词处理以得到分词结果,并根据预构建好的第一比对字典获取与分词结果相匹配的第一商品信息;计算第一商品信息与描述信息的第一匹配得分,并根据第一匹配得分从各个第一商品信息中筛选第一匹配商品;利用预设的向量获取模型获取描述信息对应的比对向量,并根据预构建好的第二比对字典获取与比对向量相匹配的第二匹配商品;根据第一匹配商品以及第二匹配商品构建商品列表,并根据商品热度对商品列表的各个匹配商品进行排序,得到目标商品列表。表。表。


技术研发人员:曾虎彪 江霆
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.05.23
技术公布日:2023/8/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐