文本分类方法及制冷设备系统与流程
未命名
07-20
阅读:87
评论:0

1.本发明涉及制冷设备技术领域,尤其涉及一种文本分类方法及制冷设备系统。
背景技术:
2.随着人工智能的进步,人们希望将人工智能引入冰箱领域,使冰箱更加智能化。在冰箱智能化的过程中,涉及大量的针对冰箱场景的优化过程,这种优化包括用户与冰箱的口语的、文本的、视频的各种类型的交互的优化,如果这些优化的效果不好,无法准确回答用户的问题,将导致冰箱无法满足用户的使用预期,用户对冰箱的智能场景使用频率低,用户的交互体验不好。在实现本发明过程中,发明人发现优化效果不好的主要原因包括文本分类的准确率低,引起文本分类的准确率低的原因,进一步是由于现有技术只考虑对单一文本的数据,没有结合用户与冰箱的交互是多模态数据交互的过程。
技术实现要素:
3.为解决上述的现有技术问题中的至少其一,本发明的目的在于提供一种文本分类方法及制冷设备系统
。
4.为实现上述发明目的,本发明一实施方式提供一种文本分类方法,包括如下步骤:
5.将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据;
6.对所述总文本数据中可标注的文本进行标注,并将标注后的文本分别存储为训练数据和测试数据;
7.将所述总文本数据通过深度融合网络模型进行特征提取,用所述训练数据训练所述深度融合网络模型,用所述测试数据通过所述深度融合网络模型预测结果,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征;
8.基于提取的特征计算文本分类的匹配结果。
9.作为本发明的进一步改进,所述步骤对所述总文本数据中可标注的文本进行标注包括:
10.对可标注的文本依次进行预标注、正式标注和标注质检,其中,当文本经过正式标注的值经过标注质检判断低于预设阈值时,将该文本返回预标注中重新标注。
11.为实现上述发明目的之一,本发明一实施例提供了一种文本分类方法,包括如下步骤:
12.将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据;
13.对所述总文本数据中不可标注的文本进行数据清洗;
14.将所述总文本数据通过深度融合网络模型进行特征提取,采用无监督学习算法用所述不可标注的文本训练所述深度融合网络模型,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征;
15.基于提取的特征计算文本分类的匹配结果。
16.作为本发明的进一步改进,所述步骤将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据包括:
17.采集多模态数据和/或多源异构数据并预处理,其中,所述多模态数据包括与文本、音频和视频数据;
18.将视频数据转写为文本数据;
19.将音频数据转写为文本数据;
20.获取历史文本数据;
21.将所述多模态数据中的文本数据、所述音频数据转写的文本数据、所述视频数据转写的文本数据、以及所述历史文本数据汇总为所述总文本数据。
22.作为本发明的进一步改进,所述预处理包括对所述多模态数据的清洗、格式转化和存储。
23.作为本发明的进一步改进,所述步骤将视频数据转写为文本数据包括:
24.将所述视频数据中的音频和图像分离,得到音频数据和图像数据;
25.识别所述图像数据中的文字信息,转写为文本数据;
26.基于时空和长距离依赖特征识别图像数据,转写为文本数据。
27.作为本发明的进一步改进,所述步骤基于时空和长距离依赖特征识别图像,转写为文本数据包括:
28.将基于时空和长距离依赖特征识别图像通过知识蒸馏和扩散模型的融合模型生成学生模型,通过所述学生模型将图像数据转写为文本数据。
29.作为本发明的进一步改进,所述步骤将视频数据转写为文本数据包括:
30.通过扩散网络模型获取所述视频数据中的关键帧图像;
31.识别所述关键帧图像生成文本数据。
32.作为本发明的进一步改进,所述步骤将音频数据转写为文本数据包括:
33.结合的获取数据的场景下的语音时空特性和上下文关系特征,建立基于融合神经网络mmcnn-rnn、ctc、以及attention的深度循环卷积网络模型将音频数据转写为文本数据。
34.作为本发明的进一步改进,述历史文本数据包括历史记录数据和历史交互数据,其中,所述历史记录数据包括用户的食材偏好数据、兴趣数据和评论数据,所述历史交互数据包括从客户端或制冷设备的交互端获取的交互记录。
35.作为本发明的进一步改进,所述文本向量化模型对字、词、短语、句子层级文本编码。
36.作为本发明的进一步改进,所述多维度特征提取模型使用多头注意力机制,分别提取字、词、词语、句子交互与关联特征、上下文语义信息。
37.作为本发明的进一步改进,所述步骤基于提取的特征计算文本分类的匹配结果包括:
38.将特征提取后的向量依次经过全连接层和自注意力机制计算得到文本分类结果。
39.作为本发明的进一步改进,还包括步骤:
40.将计算出的文本分类结果结果触达。
41.为实现上述发明目的之一,本发明一实施例提供了一种制冷设备系统,包括:
42.存储模块,存储计算机程序;
43.处理模块,执行所述计算机程序时可实现上述的文本分类方法中的步骤。
44.与现有技术相比,本发明具有以下有益效果:该文本分类方法充分利用了多模态和多源异构数据,并充分地挖掘了数据本身及数据间的自然语言理解的语义、语法及语境信息,文本分类的准确率高,提高了数据的价值,且提高了用户反馈信息准确率,为制冷设备上的人工智能的应用和推广提供了更好的前景。
附图说明
45.图1是本发明一实施例的制冷设备系统的结构示意图;
46.图2是本发明一实施例的文本分类方法的流程图;
47.图3是本发明一实施例的文本分类方法的数据流图;
48.图4是本发明第一实施例的文本分类方法的流程图;
49.图5是本发明第二实施例的文本分类方法的流程图;
50.图6是本发明一实施例的文本分类装置的模块示意图;
51.图7是本发明一实施例的制冷设备系统的结构框图;
52.其中,100、制冷设备;10、交互屏幕;20、摄像头;30、麦克风;40、扬声器;50、处理模块;60、存储模块;70、通信总线;200、客户端。
具体实施方式
53.以下将结合附图所示的具体实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
54.本发明一实施例提供一种文本分类方法及制冷设备系统,运用该方法利用多种模态的数据充分训练,使得文本分类的准确率更高。
55.制冷设备系统可以包括制冷设备100、以及与该制冷设备100对应的客户端200,制冷设备100可以是一种冰箱,客户端200可以是手机,或者是手机上的app端。制冷设备系统参图1所示,制冷设备100与客户端200之间可以通过无线信号连接。下文以冰箱为例说明制冷设备100。
56.继续如图1所示,制冷设备100可以是一种具有音频采集、视频采集、与用户界面交互的冰箱,冰箱上设置可采集音频的麦克风30、可以拍摄视频的摄像头20、可以与用户语音交互的扬声器40、可以与用户文字或图形界面交互的交互屏幕10,交互屏幕10可以设置在冰箱的门体上;用户打开冰箱门体后,摄像头20记录用户的操作,形成视频数据;扬声器40和麦克风30组合,以问答形式与用户交互音频。
57.客户端200以手机为例,用户可以通过手机端与冰箱进行文字或语音的交流,或者通过手机管理冰箱内的食材信息,以及控制冰箱的运行状态。
58.另外制冷设备系统还可以包括外界的其他器件,例如外界的温度传感器、其他设备自带的摄像头20或麦克风30和扬声器40、智能音箱等,这些设备可以通过无线信号与制冷设备100或客户端200连接。
59.制冷设备系统内各个设备的数据,形成了多源异构数据,多设备采集的多源异构数据可以经由有线、wifi、蓝牙等形式传输。文本、音频、视频等各种类型的数据构成了多模态数据,这些数据可以是实时在线或离线数据,这些数据也可以是存储下来的历史数据。
60.制冷设备场景包括了用户与制冷设备100的交互、用户与制冷设备100的对应的客户端200的交互,例如食材的交互、指令的交互、用户操作制冷设备100时的视频的记录、用户对制冷设备100内部温度湿度的控制,以及用户在客户端200上对食材的点评、用户的偏好等,这些直接操作制冷设备100产生的数据、以及与制冷设备100相关的客户端200产生的数据,都是制冷设备场景下的数据。
61.本实施例利用制冷设备使用场景下产生的多模态实时、离线数据、积累海量文本历史数据充分挖掘了数据本身及数据间等自然语言理解的语义、语法及语境信息,使制冷设备场景下的文本分类结果更加准确。
62.下面结合图2和图5,说明本发明一实施例提供的一种文本分类方法,虽然本技术提供了如下述实施方式或流程图所示的方法操作步骤,但是基于常规或者无需创造性的劳动,所述方法在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本技术实施方式中所提供的执行顺序。例如下文的步骤s20、s30和s40的获取顺序可以任意调整或同时进行,不区分时间顺序上的先后。
63.具体的,该文本分类方法包括如下步骤:
64.步骤s100:将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据。
65.多模态数据和/或多源异构数据的构成参上文,具体的采集和转写步骤可以包括如下步骤s10~步骤s40。
66.步骤s10:采集多模态和/或多源异构数据并预处理,其中,所述多模态数据包括与制冷设备场景相关的文本、音频和视频数据。
67.其中,所述预处理包括对所述多模态数据的清洗、格式转化和存储。格式转化包括了对数据格式的解析。
68.文本通过客户端200和或冰箱端的交互屏幕10采集,客户端200可以包括手机、pad、pc端等设备,除了应用程序上产生的文本数据,还包括客服的文本、web端、以及小程序或公众号上的文本,文本数据的预处理可采用如停用词、去重等。
69.音频数据可以由手机端和或冰箱端的麦克风30采集,也可以经wifi等无线连接至其他采音单元,获取其他设备上的采音单元的语音,麦克风30可以是单一麦克风30或者麦克风30阵列。
70.视频数据可以由客户端200和或冰箱端的摄像头20采集,例如通过手机的app、摄像头20、蓝牙等采集,另外也可以由脚本进行语音、视频的分离,然后得到有效的语音和视频数据。
71.通过上述诸多方式完成多种渠道及终端等多模态数据采集任务,保证数据完整性及多模态认知特性。
72.现有技术大多只采用文本这一单一数据,导致后期的数据学习中忽视了其他数据,进一步地用户以其他形式与冰箱交互时识别准确率低。本发明的文本来源包括了用户产生的各种模态的数据,对其进一步训练和文本分类,准确率更高。
73.步骤s20:将视频数据转写为文本数据。
74.该步骤包括如下两个实施例,在其一实施例中,包括如下步骤:
75.将所述视频数据中的音频和图像分离,得到音频数据和图像数据;
76.识别所述图像数据中的文字信息,转写为文本数据;
77.基于时空和长距离依赖特征识别图像数据,转写为文本数据。
78.识别图像数据中的文字可以直接将其转写为文本数据,而对图像非文字的识别,可以是根据用户嘴部的动作的变化的多张图像识别用户所说的内容。且本发明考虑到如果只根据说话人的图像特征,可能识别出的句子会较复杂,所以本发明同时结合了句子长度因素和上下文关联性进行识别,句子长度因素包括了句子长度不一和单词构成不一的特征,采用基于时空和长距离依赖特征进行识别,挖掘句子序列丰富的语义特征信息。
79.此外,为了加快模型的响应速度,将基于时空和长距离依赖特征识别图像通过知识蒸馏和扩散模型的融合模型生成学生模型,将原先大模型的知识迁移到学生网络中,通过所述学生模型将图像数据转写为文本数据。学生模型是一个离散时间步且步数短的模型,学生模型可以蒸馏为教师模型步数的一半。
80.在另一实施例中,可以通过扩散模型获取所述视频数据中的关键帧图像;
81.识别所述关键帧图像生成文本数据。
82.这里,通过识别图像的含义,以文本的形式将图像的内容说明出来,完成图像数据到文本数据的转写。
83.步骤s30:结合制冷设备100的语音时空特性和上下文关系特征,将音频数据转写为文本数据。
84.该步骤的音频数据,一方面可以是直接采集到的音频数据,还可以包括由视频数据分割出的音频数据。
85.本实施例结合了制冷设备100如冰箱的使用场景的语音数据时空特性,通过端到端学习方法,建立基于融合神经网络mmcnn-rnn、ctc、以及attention的深度循环卷积网络模型将音频数据转写为文本数据,获得丰富的高层语音特征信息,提高了模型语音转写文本的精度。
86.步骤s40:获取历史文本数据,其中,所述历史文本数据包括历史记录数据和历史交互数据。
87.与历史文本数据相对的,上述步骤s10采集到的多模态数据是实时的数据,步骤s40获取的是历史的数据,通过获取历史文本数据,一方面可以利用历史文本数据自身的信息,另一方面可以与实时的数据形成互补、关联的关系,充分获取文本数据的语义信息。
88.历史文本数据可以是在制冷设备100或客户端200上积累的很多未经标注的文本,获取历史文本数据后可以将采集到的数据进行清洗、格式转化等统一处理,使历史文本数据与实时采集的数据转写的文本格式统一,保证了数据特性的全面性与特殊性等特点。
89.进一步的,所述历史记录数据包括用户的食材偏好数据、兴趣数据和评论数据;所述历史交互数据包括从客户端200或制冷设备100的交互端获取的交互记录。历史文本数据同样包括了制冷设备100采集的数据、制冷设备100对应的客户端200上的数据。
90.步骤s50:预处理总文本数据。
91.步骤s60:将所述总文本数据通过深度融合模型进行特征提取,其中,所述深度融
合模型是文本向量化模型和多维度特征提取模型的融合模型。
92.将所述多模态数据中的文本数据、所述音频数据转写的文本数据、所述视频数据转写的文本数据、以及所述历史文本数据汇总为总文本数据。
93.汇总为总文本数据体现了本实施例采用了多源异构数据,实时、离线的语音、视频、图像、文本及用户历史评论、食材偏好、食材兴趣等文本数据。
94.步骤s60的深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征;
95.总文本数据中可以包括两类数据,第一类是可以进行预先标注的数据,第二类是不能被标注的数据,这两类数据在步骤s50和s60中以不同的处理方式分别处理,下文对第一类数据的处理为实施例1,第二类数据的处理为实施例2。
96.实施例1
97.参图4所示,所述步骤s50和步骤s60分别包括:
98.步骤s51:对所述总文本数据中可标注的文本进行标注,并将标注后的文本分别存储为训练数据和测试数据。
99.步骤s61:将所述总文本数据通过深度融合网络模型进行特征提取,用所述训练数据训练所述深度融合网络模型,用所述测试数据通过所述深度融合网络模型预测结果。
100.步骤s51可以进一步包括步骤:对可标注的文本依次进行预标注、正式标注、标注质检和数据存储,其中,当文本经过正式标注的值经过标注质检判断低于预设阈值时,将该文本返回预标注中重新标注。标注后的数据可以包括训练数据和测试数据,实现后续步骤s61的有监督或者半监督。
101.结合上文步骤s51的被标注的数据可以包括训练数据和测试数据,步骤s61可以基于训练数据对所构建的深度融合模型进行预训练任务,再基于测试数据进行结果预测,获得丰富的语义特征信息,从而得到最佳有效的模型,保障了预测结果最优,用户反馈信息准确率更高。
102.实施例2
103.参图5所示,所述步骤s50和步骤s60分别包括:
104.步骤s52:对所述总文本数据中不可标注的文本进行数据清洗。
105.步骤s62:将所述总文本数据通过深度融合网络模型进行特征提取,采用无监督学习算法用所述不可标注的文本训练所述深度融合网络模型。
106.步骤s52中,将这些无法被标注的文本数据直接进行数据清洗、格式转化等任务,然后不经标注直接参与到后续步骤s62中,这些不能被标注的数据,在后续步骤中以无监督或未标注的数据形式进行文本分析。
107.步骤s60的所述文本向量化模型对字、词、短语、句子层级文本编码;所述多维度特征提取模型使用多头注意力机制,分别提取字、词、词语、句子交互与关联特征、上下文语义信息。
108.步骤s70:基于提取的特征计算文本分类的匹配结果,实现文本分类匹配任务。
109.步骤s70中,将特征提取后的向量依次经过全连接层和自注意力机制计算得到文本分类结果,这里,先通过全连接层计算分类结果,再通过自注意力机制计算得到文本交互
性更强的语义关系量化结果,
110.另外,步骤s70还可以采用带有消岐的文本相似度进行计算,基于词项与词项间的距离的阈值大小控制来实现,这样可以去除文本中的一些冗余信息。
111.以及,为了使模型的参数和权重最优,将步骤s70的结果再次返回到步骤s50中,其中可以被标注的执行步骤s51,不可以被标注的执行步骤s52,循环多次运行,直到文本分类效果达到最优为止。
112.步骤s80:结果触达。
113.将上述步骤运行完成后的文本分类结果进行触达任务,结果触达方法可以采用自带或外带的多种形式,如外呼、短信触达、邮件通知、大屏展现、语音播报、文本输出、智能音箱、弹窗ui、app端、pad、web端等多种结果触达方式,满足了结果展现方式的需求及数字化显示。
114.与现有技术相比,本实施例具有以下有益效果:
115.该文本分类方法充分利用了多模态和多源异构数据,并充分地挖掘了数据本身及数据间的自然语言理解的语义、语法及语境信息,文本分类的准确率高,提高了数据的价值,且提高了用户反馈信息准确率,为制冷设备100上的人工智能的应用和推广提供了更好的前景。
116.在一个实施例中,本发明还提出了一种制冷设备系统,其包括存储模块60和处理模块50,处理模块50执行所述计算机程序时可实现上述的文本分类方法中的步骤,也就是说,实现上述文本分类方法中的任意一个技术方案中的步骤。
117.制冷设备系统还可以如图6所示,包括如下多个模块,各模块具体功能如下:
118.采集模块,用于采集多模态数据和/或多源异构数据并预处理,其中,所述多模态数据包括与制冷设备场景相关的文本、音频和视频数据;
119.视频转写模块,用于将视频数据转写为文本数据;
120.音频转写模块,用于结合制冷设备100的语音时空特性和上下文关系特征,将音频数据转写为文本数据;
121.获取模块,用于获取历史文本数据,其中,所述历史文本数据包括历史记录数据和历史交互数据;
122.智能标注模块,用于将所述多模态数据中的文本数据、所述音频数据转写的文本数据、所述视频数据转写的文本数据、以及所述历史文本数据汇总为总文本数据,并对所述总文本数据中可标注的文本进行标注;
123.特征提取模块,用于将所述总文本数据通过深度融合模型进行特征提取,其中,所述深度融合模型是文本向量化模型和多维度特征提取模型的融合模型;
124.文本分类模块,用于计算文本分类结果;
125.触达模块,用于结果触达。
126.需要说明的是,本发明实施例的制冷设备系统中未披露的细节,请参照本发明实施例的文本分类方法中所披露的细节。
127.制冷设备系统还可以包括制冷设备100、手机、计算机、笔记本、掌上电脑及云端服务器等计算设备,以及包括但不限于处理模块50、存储模块60、以及存储在存储模块60中并可在处理模块50上运行的计算机程序,例如上述的文本分类方法程序。所述处理模块50执
memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
136.应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
137.上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。
技术特征:
1.一种文本分类方法,其特征在于,包括如下步骤:将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据;对所述总文本数据中可标注的文本进行标注,并将标注后的文本分别存储为训练数据和测试数据;将所述总文本数据通过深度融合网络模型进行特征提取,用所述训练数据训练所述深度融合网络模型,用所述测试数据通过所述深度融合网络模型预测结果,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征;基于提取的特征计算文本分类的匹配结果。2.根据权利要求1所述的文本分类方法,其特征在于,所述步骤对所述总文本数据中可标注的文本进行标注包括:对可标注的文本依次进行预标注、正式标注和标注质检,其中,当文本经过正式标注的值经过标注质检判断低于预设阈值时,将该文本返回预标注中重新标注。3.一种文本分类方法,其特征在于,包括如下步骤:将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据;对所述总文本数据中不可标注的文本进行数据清洗;将所述总文本数据通过深度融合网络模型进行特征提取,采用无监督学习算法用所述不可标注的文本训练所述深度融合网络模型,所述深度融合网络模型是文本向量化模型和多维度特征提取模型的融合模型,所述文本向量化模型将文本数据向量化,所述多维度特征提取模型提取多维度交互特征和关联特征;基于提取的特征计算文本分类的匹配结果。4.根据权利要求1或3所述的文本分类方法,其特征在于,所述步骤将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据包括:采集多模态数据和/或多源异构数据并预处理,其中,所述多模态数据包括与文本、音频和视频数据;将视频数据转写为文本数据;将音频数据转写为文本数据;获取历史文本数据;将所述多模态数据中的文本数据、所述音频数据转写的文本数据、所述视频数据转写的文本数据、以及所述历史文本数据汇总为所述总文本数据。5.根据权利要求4所述的文本分类方法,其特征在于,所述预处理包括对所述多模态数据的清洗、格式转化和存储。6.根据权利要求4所述的文本分类方法,其特征在于,所述步骤将视频数据转写为文本数据包括:将所述视频数据中的音频和图像分离,得到音频数据和图像数据;识别所述图像数据中的文字信息,转写为文本数据;基于时空和长距离依赖特征识别图像数据,转写为文本数据。7.根据权利要求6所述的文本分类方法,其特征在于,所述步骤基于时空和长距离依赖特征识别图像,转写为文本数据包括:
将基于时空和长距离依赖特征识别图像通过知识蒸馏和扩散模型的融合模型生成学生模型,通过所述学生模型将图像数据转写为文本数据。8.根据权利要求4所述的文本分类方法,其特征在于,所述步骤将视频数据转写为文本数据包括:通过扩散网络模型获取所述视频数据中的关键帧图像;识别所述关键帧图像生成文本数据。9.根据权利要求4所述的文本分类方法,其特征在于,所述步骤将音频数据转写为文本数据包括:结合的获取数据的场景下的语音时空特性和上下文关系特征,建立基于融合神经网络mmcnn-rnn、ctc、以及attention的深度循环卷积网络模型将音频数据转写为文本数据。10.根据权利要求4所述的文本分类方法,其特征在于,述历史文本数据包括历史记录数据和历史交互数据,其中,所述历史记录数据包括用户的食材偏好数据、兴趣数据和评论数据,所述历史交互数据包括从客户端或制冷设备的交互端获取的交互记录。11.根据权利要求1或3所述的文本分类方法,其特征在于,所述文本向量化模型对字、词、短语、句子层级文本编码。12.根据权利要求1或3所述的文本分类方法,其特征在于,所述多维度特征提取模型使用多头注意力机制,分别提取字、词、词语、句子交互与关联特征、上下文语义信息。13.根据权利要求1或3所述的文本分类方法,其特征在于,所述步骤基于提取的特征计算文本分类的匹配结果包括:将特征提取后的向量依次经过全连接层和自注意力机制计算得到文本分类结果。14.根据权利要求1或3所述的文本分类方法,其特征在于,还包括步骤:将计算出的文本分类结果结果触达。15.一种制冷设备系统,其特征在于,包括:存储模块,存储计算机程序;处理模块,执行所述计算机程序时可实现权利要求1至14中任意一项所述的文本分类方法中的步骤。
技术总结
本发明揭示了一种文本分类方法及制冷设备系统,方法包括:将多模态数据和/或多源异构数据全部转写为文本数据并汇总为总文本数据;对总文本数据中可标注的文本进行标注;将总文本数据通过深度融合网络模型进行特征提取;基于提取的特征计算文本分类的匹配结果。该文本分类方法充分利用了多模态和多源异构数据,并充分地挖掘了数据本身及数据间的自然语言理解的语义、语法及语境信息,文本分类的准确率高,提高了数据的价值,且提高了用户反馈信息准确率,为制冷设备上的人工智能的应用和推广提供了更好的前景。提供了更好的前景。提供了更好的前景。
技术研发人员:李华刚 曾谁飞 孔令磊 张景瑞 李敏 刘卫强
受保护的技术使用者:青岛海尔智能技术研发有限公司 海尔智家股份有限公司
技术研发日:2023.03.15
技术公布日:2023/7/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/