评论处理方法、评论精选显示方法、电子设备及存储介质与流程
未命名
07-15
阅读:103
评论:0

1.本技术涉及计算机技术领域,特别是涉及评论处理方法、评论精选显示方法、电子设备及存储介质。
背景技术:
2.随着互联网技术的发展,互联网平台得到了用户的广泛使用。用户可以在不同互联网平台中发表评论来对互联网平台、如应用程序提供的内容、产品、服务进行评价。例如,用户在音乐(播放)平台中对歌曲或mv表达收听感受。
3.随着评论数量的爆炸性增长,用户会希望能从大量评论快速了解其他用户对相关内容、产品、服务的评价、如对歌曲或mv等音乐的收听感受。因此,从大量评论中提取具有简洁性、概括性、优美性的评论精选(tips)、如音乐评论精选能激发当前用户的兴趣,帮助用户选择自己心怡的内容,有效提升用户使用该互联网平台的使用体验。然而,网络用语并非正式文本,可能存在表达不规范的情况,也存在诸如辱骂、抄袭等负面信息需要剔除,而且大量评论可能语言表达不够优美,而且相关评论也不够独特,甚至可能与主题无关。这些因素给提取评论精选带来了困难。
4.本背景技术描述的内容仅为了便于了解本领域的相关技术,不视作对现有技术的承认。
技术实现要素:
5.基于此,有必要针对上述技术问题,提供一种处理评论的解决方案,它能够从大量评论、尤其是音乐评论中获取兼具优美性和独特性的评论精选,以便互联网平台的用户能够快速了解其他用户对于相关产品、服务或内容的评价、如对歌曲或mv等音乐的收听感受,可以激发当前用户的兴趣,帮助当前用户选择自己喜欢的内容、如歌曲或mv。另外,还可以通过呈现根据本技术的方案所获得的评论精选、如音乐评论精选,使其能广泛应用于互联网平台、如应用(app)的搜索、推荐、排行榜等内容型平台核心功能中。
6.在第一方面,提供一种评论处理方法,其可包括:
7.由对应目标对象的多个评论划分得到多个第一评论句子,所述目标对象为互联网平台提供的内容、产品和/或服务;
8.预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子;
9.将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子;
10.将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选。
11.在本技术实施例中,该评论处理方法具体为评论精选提取方法。
12.在一些实施例中,所述由对应目标对象的多个评论划分得到多个第一评论句子,
包括:
13.遮蔽所述多个评论的所有原标点;
14.将遮蔽原标点的所述多个评论输入标点预测子模型得到对应遮蔽位置的预测标点,以给所述多个评论重打标点;
15.根据表征句末的标点,将重打标点后的多个评论划分成所述多个第一评论句子。
16.在一些实施例中,所述预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子,包括:
17.获取所述多个第一评论句子对应的各自评论的关注度特征值,所述关注度特征值包括点赞数、回复数、转发数、收藏数、阅读数和/或点踩数;
18.根据所述关注度特征值,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分;
19.筛选出概括性评分高于给定第二阈值的第一评论短语作为所述经过滤的多个第二评论句子。
20.在一些实施例中,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,包括:
21.根据所述多个第一评论句子对应的各自评论的关注度特征值确定所述多个第一评论句子各自的节点拷贝数;
22.利用所述文本摘要算法,以所述第一评论句子为节点且以第一评论句子各自的节点拷贝数复制相应的节点来构造句子图,其中节点之间的权重边表征相应两个节点之间的相似度;
23.根据所述句子图的节点所连接的所有权重边的权重总和,确定节点对应的第一评论句子各自的概括性得分。
24.在一些实施例中,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,还包括:
25.在确定节点对应的第一评论句子的所述概括性得分之前,去除权重小于给定第三阈值的权重边。
26.在一些实施例中,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,还包括:
27.在确定节点对应的第一评论句子的所述概括性得分之前,利用图卷积网络和/或图注意力网络来处理所述句子图。
28.在一些实施例中,预过滤步骤可以包括过滤掉字数大于预定最大字数阈值、如大于20字的第一评论句子。
29.在一些实施例中,预过滤步骤可以包括过滤掉字数小于预定最小字数阈值、如小于3字的第一评论句子。
30.在一些实施例中,过滤掉字数大和/或小的第一评论句子的步骤可以独立于其他的预过滤步骤、如利用文本摘要算法所实施的预过滤步骤或与其相结合。例如,过滤掉字数大和/或小的第一评论句子的步骤可以在利用文本摘要算法所实施的预过滤步骤之前实施。
31.在一些实施例中,所述将所述多个第三评论句子输入评论统计语言子模型中进行
关联度评分,包括:
32.针对每个第三评论句子依次切分出待评估字节片段;
33.由所述评论统计语言子模型依次确定当前切分出的待评估字节片段与之前的字节片段间的共现概率;
34.根据每个第三评论句子的全部待评估字节片段的共现概率,确定该第三评论句子的关联度评分。
35.在一些实施例中,所述评论统计语言子模型为基于n-gram的统计语言模型。
36.在一些实施例中,所述评论统计语言子模型为经与所述多个评论同源的评论训练数据训练好的统计语言模型。
37.在一些实施例中,所述评论句子分类子模型为经与所述多个评论同源的带标签评论句子训练数据训练好的二分类模型。
38.在一些实施例中,所述标点预测子模型为经与所述多个评论非同源的文章或散文训练数据训练好的预训练语言模型。
39.在一些实施例中,所述目标对象为音乐内容,所述评论为音乐评论。
40.在第二方面,提供一种评论精选显示方法,其可包括:
41.利用根据本技术任一实施例所述的评论处理方法得到对应目标对象的评论精选;
42.与所述目标对象关联地显示所述评论精选。
43.可选地,评论精选的显示可以是响应于用户获取或访问该目标对象或者通过主动推送实现的,这可以根据涉及的功能确定。
44.在一些实施例中,所述与所述目标对象关联地显示所述评论精选,包括:
45.响应于用户搜索所述目标对象,在搜索结果区同时显示包括目标对象信息和所述评论精选的搜索结果。
46.在一些实施例中,所述与所述目标对象关联地显示所述评论精选,包括:
47.主动推送并显示涉及所述目标对象的推荐内容,所述推荐内容包括目标对象信息和所述评论精选。
48.在一些实施例中,所述与所述目标对象关联地显示所述评论精选,包括:
49.显示含有所述目标对象的排行榜,在所述排行榜中的目标对象排行位置中同时显示目标对象信息和所述评论精选。
50.在一些实施例中,所述与所述目标对象关联地显示所述评论精选,包括:
51.响应于用户进入所述目标对象的显示页面,在所述显示页面中同时显示所述目标对象的多个评论和所述评论精选。
52.在第三方面,提供一种评论处理装置,其包括:
53.划分单元,配置成由对应目标对象的多个评论划分得到多个第一评论句子,所述目标对象为互联网平台提供的内容、产品和/或服务;
54.预过滤单元,配置成预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子;
55.分类单元,配置成将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子;
56.关联度评分单元,配置成将所述多个第三评论句子输入评论统计语言子模型中进
行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选。
57.在第四方面,提供一种评论精选显示装置,其包括:
58.评论处理单元,配置成根据本技术任一实施例所述的评论处理方法得到对应目标对象的评论精选;
59.显示单元,配置成与所述目标对象关联地显示所述评论精选。
60.可选地,所述评论处理单元为根据本技术任一实施例所述的评论处理装置。
61.在第五方面,提供一种电子设备,其包括:处理器和存储有计算机程序的存储器,所述处理器被配置成运行所述计算器程序时实现本技术任一实施例所述的方法。
62.在第六方面,提供一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序配置成被运行时实现本技术任一实施例所述的方法。
63.在本技术实施例中,通过由对应目标对象的多个评论划分得到多个第一评论句子;预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子;将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子;将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选,实现了评论句子(短句)优美性和独特性识别。当前已有得到一些方案,以语言值打分的高低判断一个语言片段是不是完整的一句话,或者给语言片段打分来提取表征评论的语言片段,或者根据打分来自动生成与评论不是逐字相同的摘要性文字。相比之下,本技术实施例的评论处理方法,特别是通过分类和统计关联度处理完整的句子(短句)以使其同时兼具优美性和独特性。作为解释而非限制,本发明人意识到,优选在用同源数据进行分类和统计关联度处理的情况下,本技术实施例以貌似相互矛盾、但令人意想不到的方式,用正分类值(肯定值)来进行分类,同时通过与关联度评分负相关地来筛选出评论精选短句,前者可以通过正分类值实现有效分类来得到优美的短句且可过滤掉可能有的无意义、辱骂、抄袭等句子,后者则通过关联度评分的负相关筛选确保了选择出更具独特性的精选短句。换言之,本技术实施例认为评论统计语言模型的值约低,则句子可能含有越独特的表达。这样的配置尤其适合于对内容型目标对象,例如音乐内容,如歌曲的评论进行精选短句提取。
64.在进一步的实施例中,还在划分多个评论的步骤中对评论重新打标点,尤其是借助于标点预测子模型、如预训练语言模型对评论重打标点,可使潜在的可召回的句子变多,提高抽取评论精选(tips)的成功率和质量。本发明人意识到,当前网络用语存在标点不规范的问题,经常出现滥用标点或者是缺乏标点的情况,对抽取优美独特的评论精选(tips)带来困难。该进一步的实施例能够有效解决评论标点不当造成的难以抽取评论精选(tips)的问题。
65.在另外的实施例中,还在预筛选步骤中,获取所述多个第一评论句子对应的各自评论的关注度特征值,根据所述关注度特征值,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,根据概括性评分得到经过滤的多个第二评论句子,这通过在文本摘要算法中充分融合重要性权重有效提高了后续获取评论精选(tips)的效率,并且也有助于获得更高质量的评论精选(tips)。本发明人意识到,评论、如音乐评论除了评论文本本身,还存在额外的关注度信息,如点赞数,回复数等。这些关注度信息对于判断评论的质量
以及表征大量用户的兴趣点所在有着至关重要的作用。当前通常使用文本摘要算法来对评论提出摘要或关键词等或者基于此来生成摘要性文本。相比之下,该另外的实施例通过在文本摘要算法中融入文本以外的关注度信息用作评论句子的预过滤,获得了优异的技术效果。
66.简言之,在本技术实施例中,基于预训练和统计语言模型的句子优美和独特性识别手段,在保证句子简洁性和概括性的同时选出更加优美的句子,使得精选评论在特别是内容型平台的核心功能、如推荐、搜索具有高可用性;在进一步的实施例中,对评论重新打标点解决了由于标点不规范带来的句子抽取成功率低的问题,提高了评论精选的提取质量;在另外的实施例中,融合重要性权重、特别是评论关注度特征的文本摘要算法相比传统文本摘要方法中加入文本重要性特征,使得高赞或者高回复的评论更具有代表性,提高了评论精选的提取效率和质量。本技术内容是为了以简化形式介绍一些概念,这些概念将在下面的描述中进一步描述,本技术内容不打算标识所要求保护技术方案的必要特征。此外,要求保护的技术方案不限于解决在本文任何部分中指出的所有缺点的实施方式。
67.本技术实施例的其他可选特征和技术效果一部分在下文描述,一部分可通过阅读本文而明白。
附图说明
68.以下,结合附图来详细说明本技术的实施例,所示出的元件不受附图所显示的比例限制,附图中相同或相似的附图标记表示相同或类似的元件,其中:
69.图1示出了本技术实施例的评论处理方法的示例性流程图;
70.图2示出了本技术实施例的评论处理方法的示例性流程图;
71.图3示出了本技术实施例的评论处理方法的示例性流程图;
72.图4示出了本技术实施例的评论处理方法的示例性流程图;
73.图5示出了本技术实施例的评论处理方法的示例性流程图;
74.图6a示出了本技术实施例的评论处理方法的示例性流程图;
75.图6b示出了本技术实施例的评论处理方法的另一示例性流程图;
76.图7示出了本技术实施例的评论精选显示方法的示例性流程图;
77.图8示出了本技术实施例的评论处理装置的结构示意图;
78.图9示出了本技术实施例的评论精选显示装置的结构示意图;
79.图10示出了能实施本技术实施例的方法的电子设备的结构示意图;
80.图11示出了本技术实施例中对评论标点的进行遮蔽和预测的示意图;
81.图12示出了本技术实施例中利用文本摘要算法得到的句子图的示意图;
82.图13示出了本技术实施例中利用基于n-gram的统计语言模型确定字节片段的共现概率的示意图;
83.图14a至图14d示出了在音乐应用中显示音乐评论精选的多个示例。
具体实施方式
84.为使本技术的目的、技术方案和优点更加清楚明白,下面结合具体实施方式和附图,对本技术做进一步详细说明。在此,本技术的示意性实施方式及其说明用于解释本申
请,但并不作为对本技术的限定。
85.在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
86.在本技术实施例中,“句子”或“句”将具有本领域理解的常规含义。一个评论中可能含有多个句子。在本技术实施例中,“句子”涵盖“短句”,在本文某些合适的场合,两者可以替代使用。优选地,短句可以为字数相对较少的句子,例如在一个实施例中,短句可以为字数在20个字以内、优选15个字以内的句子。
87.在本技术实施例中,评论精选(tips)涉及从评论中精选的短句,本文也可以称为精选短句或精选句,即在本文中所述的精选为句子(短句),有时可以与精选句子或精选短句替换使用。人们将明白,这样的评论精选往往希望其具有兼具简洁性、概括性、优美性,尤其是针对内容类对象、如音乐内容,还希望具有独特性。
88.当前评论精选、如音乐评论精选能激发当前用户的兴趣,帮助用户选择自己心怡的内容,有效提升用户使用该互联网平台的使用体验。然而,然而,网络用语并非正式文本,可能存在表达不规范的情况,也存在诸如辱骂、抄袭等负面信息需要剔除,而且大量评论可能语言表达不够优美,而且相关评论也不够独特,甚至可能与主题无关。这些因素给提取评论精选带来了困难。
89.本技术实施例的评论处理方法、更优选为评论精选(短句)提取方法,通过将由评论、如音乐评论划分并进行预过滤后的评论句子输入评论句子分类子模型,以得到经分类的评论句子;并将经分类的评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定阈值的评论句子或选择关联度评分最低的一个或多个评论句子作为评论精选。由此而可高效且高质量地从评论中抽取出兼具优美性和独特性的评论精选短句,有效地克服了当前的问题。
90.下面将参照附图,对本技术的具体实施例进行详细说明。
91.图1示出了根据本技术一个实施例的评论处理方法。在本技术实施例所述的评论处理方法更具体地为评论精选(tips)提取方法。
92.该评论处理方法可包括步骤s110至s140:
93.s110:由对应目标对象的多个评论划分得到多个第一评论句子。
94.在本技术实施例中,目标对象为互联网平台提供的内容、产品和/或服务。在本技术实施例中,互联网平台可以有多种实现形式,包括但不限于例如在不同类型的设备、操作系统中实现的应用程序(app)、在浏览器中呈现的网站。本技术实施例所述的应用程序可以具有本领域技术人员理解的正常含义,有时也可以称作软件或软件应用。本技术实施例所述的应用程序可以是各种类型的应用程序,包括但不限于音乐应用、视频/短视频/直播应用、社交应用、购物应用或者游戏应用等。
95.在一个优选实施例中,所述互联网平台为音乐应用。在一个优选实施例中,该目标对象为音乐内容,包括但不限于在音乐平台、如音乐应用(app)中提供的歌曲、(歌曲)专辑、mv、伴奏、k歌等。相应地,所述评论为音乐评论,如歌曲评论。
96.在图示的示例中,将以歌曲为例子描述用户对于歌曲的评论的处理,但人们可以想到,根据本技术实施例所述的目标对象可以是互联网平台提供的其他内容、产品和/或服务。
97.作为一个简化的实施例,可以根据该多个评论本身的表征句末的标点,如句号、问号、感叹号来划分得到多个第一评论句子。
98.作为一个替代的优选实施例,可以通过对该多个评论的标点进行重打后,再基于重打的标点来划分得到所述多个第一评论句子。
99.例如图2所示的实施例中,该步骤s110可包括步骤s111至s113:
100.s111:遮蔽所述多个评论的所有原标点。
101.在此,可以用统一的掩码遮蔽原标点。
102.s112:将遮蔽原标点的所述多个评论输入标点预测子模型得到对应遮蔽位置的预测标点,以给所述多个评论重打标点。
103.s113:根据表征句末的标点,将重打标点后的多个评论划分成所述多个第一评论句子。
104.在本技术实施例中,标点也可称为标点符号,可以包括各种用于标明句读和语气的符号。所述标点可以包括中文标点符号,包括但不限于句号、问号、感叹号、逗号、顿号、分号、冒号、引号、括号、破折号、省略号、连接号、间隔号、书名号、专名号、着重号等。根据评论的语言,所述标点还可以包括英文标点符号,包括但不限于句点、问号、感叹号、逗号、冒号、省略号、分号、连字符、连接号、破折号、括号(小括号、中括号、大括号)、引号(双引号、单引号)、缩写及所有格符号、斜杠等;还可以想到,所述标点还可以包括其他语言标点符号。
105.在一个优选实施例中,被遮蔽的“原标点”可包括常规意义上的标点符号、空格(符)和换行(符)。本发明人意识到,虽然空格(符)和换行(符)按照通常含义不被视作标点符号,但特别是因为移动互联网的兴起,越来越多的用户可能习惯用空格来表示句读或断句,或者通过回车换行来标示句读或短句。因此,在该优选实施例中,被遮蔽的“原标点”明确涵盖空格(符)和换行(符)。
106.在一个优选实施例中,被遮蔽的“原标点”可涵盖与评论语言一致的标点符号,也可涵盖与评论语言不一致的“非规范格式”标点符号。例如,在中文表达的评论中,使用英文格式的标点符号、如句点(.)时,或者反过来,其仍将作为“原标点”被遮蔽。本发明人意识到,随着当前口语化的盛行,越来越多用户可能不能正确使用标点符号格式,导致标点符号格式与评论语言不一致。
107.而在另外的优选实施例中,所述“预测标点”将可包括常规意义上的标点符号和空串(长度为0的字符串),但不含空格(符)和换行(符)。本发明人意识到,虽然空串按照通常含义不被视作标点符号,由于评论中标点不规范,有些评论的原标点可能无需标注。因此,在该优选实施例中,所述“预测标点”明确涵盖空串。人们将明白,在原标点被空串替代后,该原标点前后的短语将连在一起。
108.在一个优选实施例中,所述“预测标点”可涵盖完整的标点符号。但可以想到,在一个简化实施例中,所述“预测标点”可涵盖特定标点符号类型,例如仅包括表示句末的句号、表示句中断句的逗号和空串,这同样落在本技术范围内。
109.在一个优选实施例中,所述“预测标点”为“规范格式”标点符号(除空串外)。例如
对于中文表达的评论,仅预测、重打中文标点符号(除空串外)。
110.结合图2和图11所示,在(a)中,示例性的原评论的原标点(涵盖常规标点1101、1101’、空格1102和换行1103)被统一的掩码(如图11中斜杠示意性示出)遮蔽。在所示的实施例中,该中文评论中含有非规范格式的英文标点1101’、空格1102和换行1103。相应地,在(b)中,标点预测子模型预测得到预测标点(涵盖常规标点1111和空串1112)将用于替代原标点。在图11所示的示例中,可召回供后续使用的第一评论句子从原评论的2句变成重打标点后的5句。
111.在本技术实施例中,标点预测子模型为基于自然语言处理(nlp)的模型。优选地,标点预测子模型为预训练语言模型,所述预训练语言模型可以包括但不限于elmo、gpt、bert等。
112.在一些实施例中,所述标点预测子模型为经与所述多个评论非同源的文章或散文训练数据训练好的预训练语言模型。在此,与评论同源的数据指与同类评论或者从同类评论中提取或加工而成的数据;相应地,与评论非同源的数据指不来自于同类评论的数据。例如,对于音乐内容、如歌曲而言,与所述多个评论同源数据,可以是其他音乐、如歌曲的评论数据或者由该评论数据提取或加工而成的数据,下文还将继续提供示例。在该优选实施例中,用于训练标点预测子模型的数据并非是任何评论数据,而是文章或散文训练数据,例如由名家散文获得的训练数据或者其他表达较规范的文章获得的数据。
113.在一个示例性实施例中,用文章或散文训练数据训练标点预测子模型包括:提供预训练语言模型;提供文章或散文训练数据,文章或散文训练数据中的标点被遮蔽;将遮蔽标点的训练数据输入待训练的预训练语言模型中,预测被遮蔽的标点符号;以被遮蔽的标点符号作为标签,校验预训练语言模型的输出并迭代更新该预训练语言模型,直至达到迭代退出条件(如收敛)。
114.s120:预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子。
115.在本技术实施例中,可以通过对第二评论句子进行概括性评分而实现对评论句的预过滤,例如可以通过构建句子级图网络对句子节点进行概括性排序来获得该概括性评分。
116.在如图3所示的实施例中,该步骤s120可包括:
117.s121:获取所述多个第一评论句子对应的各自评论的关注度特征值。
118.在本技术实施例中,关注度可以一定程度上体现评论的重要性。
119.在一些实施例中,关注度特征值可包括点赞数、回复数、转发数、收藏数、阅读数和/或点踩数等。在一些实施例中,关注度特征值可包括正(+)关注度特征值,如点赞数、回复数、转发数、收藏数、阅读数,也可包括负(-)关注度特征值,如点踩数。
120.在一些实施例中,所获取的关注度特征值可以为一种或多种,例如关注度特征值包括点赞数和回复数,并且可以对关注度特征值进行平滑处理。
121.s122:根据所述关注度特征值,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分。
122.在一些实施例中,可以使用各种文本摘要算法融入重要性权重、如关注度来实现本技术实施例的获得概括性评分的处理。在一些实施例中,该文本摘要算法可以为textrank算法,但可以想到其他文本摘要算法。
123.在如图4所示的实施例中,该步骤s122可包括步骤s1221、s1222、s1225:
124.s1221:根据所述多个第一评论句子对应的各自评论的关注度特征值确定所述多个第一评论句子各自的节点拷贝数。
125.在一些实施例中,可以以关注度特征值(或其总和)作为节点拷贝数,也可以对关注度特征值进行处理获得与关注度特征值正相关的节点拷贝数。例如,当关注度特征值包括点赞数和评论数时,可以直接采用点赞数和评论数之和作为节点拷贝数。
126.s1222:利用所述文本摘要算法,以所述第一评论句子为节点且以第一评论句子各自的节点拷贝数复制相应的节点来构造句子图,其中节点之间的权重边表征相应两个节点之间的相似度。
127.s 1225:根据所述句子图的节点所连接的所有权重边的权重总和,确定节点对应的第一评论句子各自的概括性得分。
128.结合图12所示,多个不同的第一评论句子被作为句子图1200或者称句子级图网络的节点1201、1202、1203、1204来构建该句子图。如图12所示的实施例中,该句子图1200或者称句子级图网络可以为有权无向图。
129.同时,如图12还示意性地示出,节点1201还可以以其对应的节点拷贝数复制相应的节点1201’(以斜线示意性表示复制了3个)。人们将明白,本技术实施例中,以节点拷贝数(n)复制节点可以不包括原始节点(n+1个节点)或包括原始节点(n个节点),优选为前者。
130.如图12所示,节点1201、1202、1203、1204之间的权重(w)边1211或者说边权(边的权重)表征相应的两个节点之间的相似度。如图12所示,复制节点1201’与其他节点以及复制节点之间也有权重边1211。
131.具体地,两个节点之间的词袋相似度或边权、节点权重以及概括性评分等公式如下所示:
[0132][0133][0134][0135]
其中,式(1)sim(
·
,
·
)表示两个句子(节点)的相似度,即边权,si表示第i个句子,|si|表示第i个句子中词的数量,wk表示第k个词;d为超参数,代表指向其他节点的概率,在一个实例中设置为0.85。in(vi)和out(vi)代表以结点vi为出发点和接收点的结点集合。式(2)w(vi)为结点i得到的权值,该式(2)为迭代公式,可以通过迭代直至收敛。式(3)score(i)为收敛后,与句子i对应的节点所连线的权重边的权值(边权)相加,作为该句子(节点)的概括性得分。
[0136]
在本技术实施例中,对应同一句子的多个节点(例如复制节点)通常具有大致相同的权值和,因此当同一句子对应多个节点时,可以任选其中一个节点确定该句子的概括性得分。作为替代,可以用多个节点的概括性得分均值作为该句子的概括性得分。
[0137]
在如图5所示的实施例中,该步骤s122可选地还可包括s1223:在确定节点对应的第一评论句子的所述概括性得分之前,去除权重小于给定第三阈值的权重边。
[0138]
如图12示意性地示出,当权重边1212的权重小于给定的第三阈值时,将被去除。
[0139]
本领域技术人员将明白,该步骤s1223可以与步骤s1222相结合或者独立于步骤s1222。例如,可以在步骤s1222中构建图时即融入权重边的权重大小判断,当不符合规定标准时,构建的句子图中将不含该边。或者,可以在步骤s1222构建了图之后,进行权重边的权重大小判断,以删除某些权重边。
[0140]
在如图5所示的实施例中,该步骤s122可选地还可包括s1224:在确定节点对应的第一评论句子的所述概括性得分之前,利用图卷积网络和/或图注意力网络来处理所述句子图。
[0141]
在该实施例中的图卷积网络中,将以句子图作为输入,经过中间的多个卷积网络的隐藏层,得到相应输出的图,该输出的图将可用于后续的使用,例如用于概括性评分的确定。该图卷积网络可以是经迭代训练好的网络。
[0142]
图注意力网络是指将注意力机制引入到基于空间域的图神经网络。类似地,可以将句子图作为输入,将其输入到引入注意力机制的图神经网络中,并得到相应输出的图,该输出的图将可用于后续的使用,例如用于概括性评分的确定。该图注意力网络可以是经迭代训练好的网络。
[0143]
在一些实施例中,步骤s1223和s1224可以择一实施或者共同实施。在一些优选实施例中,可以在实施例步骤s1223后实施步骤s1224。
[0144]
s123:筛选出概括性评分高于给定第二阈值的第一评论短语作为所述经过滤的多个第二评论句子。
[0145]
作为图3至图5所示实施例的补充或替代,预过滤步骤还可以包括过滤掉字数大于预定最大字数阈值、如大于20字、如大于15字的第一评论句子。由此,经筛选后的所有句子(短句)将具有小于或等于预定字数阈值的字数,使得满足简洁性的句子(短句)
[0146]
作为图3至图5所示实施例的补充或替代,预过滤步骤可以包括过滤掉字数小于预定最小字数阈值、如小于3字的第一评论句子。由此,经筛选后的所有句子将符合最低文字要求以构成句子(短句),而非词或词组。
[0147]
相应地,过滤掉字数大和/或小的第一评论句子的步骤可以独立于其他的预过滤步骤、如利用文本摘要算法所实施的预过滤步骤或与其相结合。例如,过滤掉字数大和/或小的第一评论句子的步骤可以在利用文本摘要算法所实施的预过滤步骤之前实施。
[0148]
但在一些优选实施例中,可以通过根据本技术实施例的文本摘要算法处理即可以实现经过滤的第二评论句子符合简洁性的要求,也符合最低文字要求。
[0149]
s130:将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子。
[0150]
在一些实施例中,该评论句子分类子模型包括二分类模型。该分类模型可以是机器学习模型或深度学习模型。
[0151]
在一些实施例中,所述评论句子分类子模型为经与所述多个评论同源的带标签评论句子训练数据训练好的二分类模型。当评论的目标对象例如为音乐是,该带标签评论句子训练数据例如为由音乐评论所得到的句子数据,这些句子数据例如可以通过人工标注得到标签。该二分类标签例如包括正/是标签(经分类选用)和负/否标签(经分类淘汰)。在该实施例中,该正/是标签表征该句子复合优美性要求且不是无意义、辱骂、抄袭的句子。作为
替代,也可以是其他分类模型。
[0152]
在一个示例中,可以使用人工标注多条(如8000条)音乐评论短句得到二分类数据集,通过在预训练语言模型上进行调整得到该二分类模型。该用于二分类模型的预训练语言模型可以为本文所述的或其他预训练语言模型。
[0153]
s140:将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选。
[0154]
在如图6a所示的实施例中,所述将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,可包括:
[0155]
s141:针对每个第三评论句子依次切分出待评估字节片段;
[0156]
s142:由所述评论统计语言子模型依次确定当前切分出的待评估字节片段与之前的字节片段间的共现概率;
[0157]
s143:根据每个第三评论句子的全部待评估字节片段的共现概率,确定该第三评论句子的关联度评分。
[0158]
在一些实施例中,所述评论统计语言子模型为基于n-gram的统计语言模型。n-gram是一种基于统计语言模型的算法,具体是将文本(如第三评论句子)里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n的字节片段序列。根据n的大小可以使用1元模型(1-gram或unigram)、2元模型(2-gram或bigram)或3元模型(3-gram或trigram),如图13使用3元模型。该字节片段可以包括词组,在某些合适的位置两者可以互换。
[0159]
结合图6a和图13所示,n=3的滑动窗口1301沿着示例性的评论句子滑动来切分出各待评估的n=3的字节片段,并相应地确定当前字节片段/词组(n=3)与该句话之前词组间的共现概率。在一些可选实施例中,对于首个待评估字节片段/词组,可以前填充若干字节。
[0160]
在一些实施例中,共现概率可以基于链式规则计算或者马尔科夫链计算。
[0161]
尽管在所示的实施例中,滑动步长也为3,即与字节片段大小相等,但可以想到滑动补偿小于字节片段大小。
[0162]
尽管在所示实施例中,字节片段大小或者说滑动窗口是固定的,如n=3,但可以想到其可以是变化的,例如按照词组n在2、3、4间变动。
[0163]
尽管在所示实施例中,评论统计语言子模型为基于n-gram的统计语言模型,但可以想到其他的统计语言模型。
[0164]
在一些实施例中,所述评论统计语言子模型为经与所述多个评论同源的评论训练数据训练好的统计语言模型。例如,当被处理的评论为音乐评论时,可以用大量(如100万条)音乐评论(同源数据)来训练统计语言模型。
[0165]
在本技术实施例中使用的评论统计语言模型,并非如当前那样用于预测当前最有可能出现(最高共现概率)的字节片段(如用于预测下一个字节片段/词组),而是利用统计语言模型确定第三评论句子中的当前待评估字节片段(词组)与之前的字节片段间的共现概率。更重要的是,不同于当前利用统计语言模型依次预测最高概率的字节片段,本技术实施例中,由全部字节片段的共现概率确定的关联度被负相关地用于选择评论精选,即评论精选中的字节片段(词组)将整体具有低共现概率。
[0166]
在步骤s144中,可以通过共现概率的乘积(对数和)来得到每个第三评论句子的全部待评估字节片段的共现概率,以确定该第三评论句子的关联度评分。在此,该关联度评分也可以称为组合共现概率。
[0167]
在优选实施例中,在确定关联度评分时,还可以考虑句子字数的多寡。本发明人发现通过考虑句子字数的多寡,能够更有效获得具有独特性的评论精选。在如图6b所示的实施例中,所述将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,可包括:
[0168]
s141:针对每个第三评论句子依次切分出待评估字节片段;
[0169]
s142:由所述评论统计语言子模型依次确定当前切分出的待评估字节片段与之前的字节片段间的共现概率;
[0170]
s143:根据每个第三评论句子的字数确定该第三评论句子的基准组合共现概率;
[0171]
s144’:根据每个第三评论句子的全部待评估字节片段的共现概率和基准组合共现概率,确定该第三评论句子的关联度评分。
[0172]
由此,在步骤s143中可以根据句子的字数获得基准组合共现概率,其例如是具有该字数的句子的平均组合共现概率(字节片段共现概率乘积或对数和)。相应地,在步骤s144’中,可以基于全部待评估字节片段的共现概率和基准组合共现概率两者来确定关联度评分。例如,可以由字节片段共现概率乘积除以基准组合共现概率(对数差)来确定关联度评分。
[0173]
进一步地,如图7所示,本技术实施例还提供一种评论精选显示方法,其可包括:
[0174]
s710:利用评论处理方法得到对应目标对象的评论精选;
[0175]
在本技术实施例中,该评论处理方法优选可以为根据本技术任一实施例所述的评论处理方法。
[0176]
s720:与所述目标对象关联地显示所述评论精选。
[0177]
可选地,评论精选的显示可以是响应于用户获取或访问该目标对象或者通过主动推送实现的,这可以根据涉及的功能确定。
[0178]
在一些实施例中,根据本技术实施例的评论处理方法所获得的评论精选可以与互联网平台、如app的搜索功能相结合。在此,步骤s720可包括:响应于用户搜索所述目标对象,在搜索结果区同时显示包括目标对象信息和所述评论精选的搜索结果。如图14a示出的音乐应用的用户界面1400中,在搜索结果区同时显示了被搜索歌曲的信息(如歌曲标题和歌曲图)以及对应该歌曲的评论精选。
[0179]
在一些实施例中,根据本技术实施例的评论处理方法所获得的评论精选可以与互联网平台、如app的推荐功能相结合。在此,步骤s720可包括:主动推送并显示涉及所述目标对象的推荐内容,所述推荐内容包括目标对象信息和所述评论精选。如图14b示出的音乐应用的用户界面1400中,在推荐区中显示的歌曲,同时显示了该歌曲的歌曲信息(如歌曲标题和歌曲图)以及对应该歌曲的评论精选。
[0180]
在一些实施例中,根据本技术实施例的评论处理方法所获得的评论精选可以与互联网平台、如app的排行榜功能相结合。在此,步骤s720可包括:显示含有所述目标对象的排行榜,在所述排行榜中的目标对象排行位置中同时显示目标对象信息和所述评论精选。如图14c示出的音乐应用的用户界面1400中,显示了歌曲排行榜,可以在相应歌曲的排行位置
直接显示或通过点击歌曲(图中未示出)显示该歌曲的评论精选。
[0181]
在一些实施例中,根据本技术实施例的评论处理方法所获得的评论精选可以与互联网平台、如app中提供目标对象的评论/评论区相结合或作为其补充。在此,步骤s720可包括:响应于用户进入所述目标对象的显示页面,在所述显示页面中同时显示所述目标对象的多个评论和所述评论精选。如图14d示出的音乐应用的用户界面1400中的歌曲页面,可以该歌曲页面的评论区之外的其他区域、如图14d所示的顶部区域(评论精选区)中显示该歌曲的评论精选,以便当前用户不用翻看大量评论也能快速了解其他用户对于歌曲的收听感受,可以激发当前用户的兴趣,帮助当前用户了解歌曲。也可以想到,评论精选可以被放置到评论区中与评论相融合(未示出)。
[0182]
在本技术实施例中,还提供了一种评论精选提取模型,其可包括标点预测子模型、文本摘要子模型(或者称为文本摘要算法模块)、评论句子分类子模型和评论统计语言子模型。
[0183]
在本技术实施例中,还提供了一种评论精选提取模型的训练方法,其可包括其他实施例所述的训练标点预测子模型、评论句子分类子模型和评论统计语言子模型的相关步骤。
[0184]
如图8示出了根据本技术实施例的评论处理装置800,也可称为评论精选提取装置。该评论处理装置800可包括划分单元810、预过滤单元820、分类单元830和关联度评分单元840。该划分单元810配置成由对应目标对象的多个评论划分得到多个第一评论句子,所述目标对象为互联网平台提供的内容、产品和/或服务。该预过滤单元820配置成预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子。该分类单元830配置成将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子。该关联度评分单元840配置成将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选(tips)。
[0185]
在一些实施例中,该评论处理装置800可以安装在服务端上。
[0186]
如图9示出了根据本技术实施例的评论精选显示装置900。该评论精选显示装置900可包括评论处理单元910和显示单元920。该评论处理单元910配置成根据本技术任一实施例所述的评论处理方法得到对应目标对象的评论精选。优选地,该评论处理单元910为根据本技术实施例的评论处理装置800。该显示单元920配置成与所述目标对象关联地显示所述评论精选。
[0187]
在一些实施例中,该显示单元920可以安装在客户端上。
[0188]
在本技术的教导下,方法实施例的特征可以以不矛盾的方式结合到装置、设备或存储介质实施例或其他方法实施例中以获得新的实施例,装置实施例的特征也可以以不矛盾的方式结合方法、设备或存储介质实施例或其他装置实施例中以获得新的实施例,这落入本技术的范围中。
[0189]
在一些实施例中,提供了一种电子设备,其可包括处理器和存储有计算机程序的存储器,所述处理器被配置为在运行计算机程序时执行本技术任一实施例的方法。图10示出了一种可以实施本技术实施例的方法的示例性电子设备1000的示意图,在一些实施例中可以包括比图示更多或更少的电子设备。在一些实施例中,可以利用单个或多个电子设备
实施。在一些实施例中,可以利用云端或分布式的电子设备实施。
[0190]
如图10所示,电子设备1000包括处理器1001,其可以根据存储在只读存储器(rom)1002中的程序和/或数据或者从存储部分1008加载到随机访问存储器(ram)1003中的程序和/或数据而执行各种适当的操作和处理。处理器1001可以为单核或多核的处理器,也可以包含多个处理器。在一些实施例中,处理器1001可以包括通用的主处理器(如cpu)以及一个或多个特殊的协处理器,例如图形处理器(gpu)、神经网络处理器(npu)、数字信号处理器(dsp)或其他通用或专用集成电路等。在ram1003中,还存储有电子设备1000操作所需的各种程序和数据。处理器1001、rom 1002以及ram 1003通过总线1004彼此相连。输入/输出(i/o)接口1005也连接至总线1004。
[0191]
上述处理器与存储器共同用于执行存储在存储器中的程序,所述程序被计算机执行时能够实现上述各实施例描述的模型生成方法、识别方法的步骤或功能。
[0192]
以下部件连接至i/o接口1005:包括键盘、鼠标等的输入部分1006;包括诸如显示器以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至i/o接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
[0193]
图10仅示意性示出示意性的电子设备,但根据本技术实施例的电子设备可以包括比图10所示电子设备更多或更少的组件或者具有与图10所示实施例设备相同、部分相同或不相同的架构。
[0194]
尽管未示出,在一些实施例中还提供一种计算机可读存储介质,存储有计算机程序,计算机程序配置成被运行时执行任一本技术实施例的方法。该计算机程序包含组成根据本技术实施例的装置的各个程序模块/单元,各个程序模块/单元构成的计算机程序被执行时能够实现与上述实施例中描述的方法中的各个步骤所对应的功能。该计算机程序还可在如本技术实施例所述的电子设备上运行。
[0195]
在本技术的实施例的存储介质包括非易失性和/或易失性的可以由任何方法或技术来实现信息存储的物品。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0196]
本领域技术人员应明白,本说明书的实施例可以以方法、系统或计算机程序产品等多种形式实施。因此,本领域技术人员可想到,上述实施例阐明的功能模块/单元或控制器以及相关方法步骤的实现,可以用软件、硬件和软/硬件结合的方式实现。
[0197]
除非明确指出,根据本技术实施例记载的方法、程序的动作或步骤并不必须按照特定的顺序来执行并且仍然可以实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0198]
在本文中,针对多个实施例进行了描述,但为简明起见,各实施例的描述并不是详
尽的,各个实施例之间相同或相似的特征或部分可能会被省略。在本文中,“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”意指适用于根据本技术的至少一个实施例或示例中,而非所有实施例。上述术语并不必然意味着指代相同的实施例或示例。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0199]
已参考上述实施例具体示出并描述了本技术的示例性系统及方法,其仅为实施本系统及方法的最佳模式的示例。本领域的技术人员可以理解的是可以在实施本系统及/或方法时对这里描述的系统及方法的实施例做各种改变而不脱离界定在所附权利要求中的本技术的精神及范围。
技术特征:
1.一种评论处理方法,其特征在于,包括:由对应目标对象的多个评论划分得到多个第一评论句子,所述目标对象为互联网平台提供的内容、产品和/或服务;预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子;将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子;将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选。2.根据权利要求1所述的评论处理方法,其特征在于,所述由对应目标对象的多个评论划分得到多个第一评论句子,包括:遮蔽所述多个评论的所有原标点;将遮蔽原标点的所述多个评论输入标点预测子模型得到对应遮蔽位置的预测标点,以给所述多个评论重打标点;根据表征句末的标点,将重打标点后的多个评论划分成所述多个第一评论句子。3.根据权利要求1所述的评论处理方法,其特征在于,所述预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子,包括:获取所述多个第一评论句子对应的各自评论的关注度特征值,所述关注度特征值包括点赞数、回复数、转发数、收藏数、阅读数和/或点踩数;根据所述关注度特征值,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分;筛选出概括性评分高于给定第二阈值的第一评论短语作为所述经过滤的多个第二评论句子。4.根据权利要求3所述的评论处理方法,其特征在于,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,包括:根据所述多个第一评论句子对应的各自评论的关注度特征值确定所述多个第一评论句子各自的节点拷贝数;利用所述文本摘要算法,以所述第一评论句子为节点且以第一评论句子各自的节点拷贝数复制相应的节点来构造句子图,其中节点之间的权重边表征相应两个节点之间的相似度;根据所述句子图的节点所连接的所有权重边的权重总和,确定节点对应的第一评论句子各自的概括性得分。5.根据权利要求4所述的评论处理方法,其特征在于,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,还包括:在确定节点对应的第一评论句子的所述概括性得分之前,去除所述句子图中权重小于给定第三阈值的权重边。6.根据权利要求4或5所述的评论处理方法,其特征在于,所述根据所述关注度特征,利用文本摘要算法确定所述多个第一评论句子各自的概括性评分,还包括:在确定节点对应的第一评论句子的所述概括性得分之前,利用图卷积网络和/或图注
意力网络来处理所述句子图。7.根据权利要求1所述的评论处理方法,其特征在于,所述将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,包括:针对每个第三评论句子依次切分出待评估字节片段;由所述评论统计语言子模型依次确定当前切分出的待评估字节片段与之前的字节片段间的共现概率;根据每个第三评论句子的全部待评估字节片段的共现概率,确定该第三评论句子的关联度评分。8.根据权利要求7所述的评论处理方法,其特征在于,所述评论统计语言子模型为基于n-gram的统计语言模型。9.根据权利要求1、7或8所述的评论处理方法,其特征在于,所述评论统计语言子模型为经与所述多个评论同源的评论训练数据训练好的统计语言模型。10.根据权利要求1所述的评论处理方法,其特征在于,所述评论句子分类子模型为经与所述多个评论同源的带标签评论句子训练数据训练好的二分类模型。11.根据权利要求1或2所述的评论处理方法,其特征在于,所述标点预测子模型为经与所述多个评论非同源的文章或散文训练数据训练好的预训练语言模型。12.根据权利要求1所述的评论处理方法,其特征在于,所述目标对象为音乐内容,所述评论为音乐评论。13.一种评论精选显示方法,其特征在于,包括:利用根据权利要求1至12中任一项所述的评论处理方法得到对应目标对象的评论精选;与所述目标对象关联地显示所述评论精选。14.根据权利要求13所述的评论精选显示方法,其特征在于,所述与所述目标对象关联地显示所述评论精选,包括:响应于用户搜索所述目标对象,在搜索结果区同时显示包括目标对象信息和所述评论精选的搜索结果。15.根据权利要求13所示的评论精选显示方法,其特征在于,所述与所述目标对象关联地显示所述评论精选,包括:主动推送并显示涉及所述目标对象的推荐内容,所述推荐内容包括目标对象信息和所述评论精选。16.根据权利要求13所述的评论精选显示方法,其特征在于,所述与所述目标对象关联地显示所述评论精选,包括:显示含有所述目标对象的排行榜,在所述排行榜中的目标对象排行位置中同时显示目标对象信息和所述评论精选。17.根据权利要求13所述的评论精选显示方法,其特征在于,所述与所述目标对象关联地显示所述评论精选,包括:响应于用户进入所述目标对象的显示页面,在所述显示页面中同时显示所述目标对象的多个评论和所述评论精选。18.一种电子设备,其特征在于,包括:处理器和存储有计算机程序的存储器,所述处理
器被配置成运行所述计算器程序时实现根据权利要求1至17中任一项所述的方法。19.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序配置成被运行时实现根据权利要求1至17中任一项所述的方法。
技术总结
本申请公开评论处理方法、评论精选显示方法、电子设备及存储介质。该评论处理方法包括:由对应目标对象的多个评论划分得到多个第一评论句子,所述目标对象为互联网平台提供的内容、产品和/或服务;预过滤所述多个第一评论句子,以得到经过滤的多个第二评论句子;将所述多个第二评论句子输入评论句子分类子模型,以得到经分类的多个第三评论句子;将所述多个第三评论句子输入评论统计语言子模型中进行关联度评分,以关联度评分低于给定第一阈值的第三评论句子或选择关联度评分最低的至少一个第三评论句子作为评论精选。这样的评论处理方案能够从互联网平台提供的内容、产品、服务的大量评论中提取出具有优美、独特表达的评论精选句子。选句子。选句子。
技术研发人员:周蓝珺
受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司
技术研发日:2023.02.01
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/