信息识别方法、装置、设备、介质及产品与流程

未命名 09-18 阅读:163 评论:0


1.本公开涉及人工智能技术领域,可以应用于金融科技技术领域,特别涉及一种信息识别方法、装置、设备、介质及产品。


背景技术:

2.随着深度学习技术的深入,自然语言处理也进入了一个蓬勃发展的阶段。现如今,多种自然语言处理技术已于生产、工作中使用,以大大降低人工成本。随着金融服务业务的高速发展,多项服务业务应运而生,例如诸如客户之声等自然语言处理技术,客户之声通过对客户的来电语音进行识别,以使得银行能够根据识别结果为客户提供服务。
3.然而,现有客户之声对客户来电的文本数据的识别准确度不高,影响机构对于客户需求的准确判定,从而影响机构为客户服务的精准度,降低了客户体验。


技术实现要素:

4.有鉴于此,本公开的主要目的是提供一种信息识别方法、装置、设备、介质及产品,旨在至少部分解决现有客户之声对客户来电的文本数据的识别准确度不高等技术问题。
5.为实现上述目的,本公开实施例的第一方面提供一种信息识别方法,包括:获取待识别的文本数据;对所述待识别的文本数据进行预处理,得到第一文本特征;将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息,其中,所述识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,所述识别模型的识别标签是根据业务属性信息配置的。
6.根据本公开的实施例,所述信息识别方法还包括:对所述第一文本特征依次进行降维和升维,以过滤所述第一文本特征中的无效信息,得到第二文本特征;将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息。
7.根据本公开的实施例,其中,所述对所述待识别的文本数据进行预处理,得到第一文本特征包括:确定所述文本数据中每个文本的长度;将每个文本的长度与预设长度阈值进行比较,确定长度大于预设长度阈值的文本;从所述长度大于预设长度阈值的文本中截取一部分,得到预设维度的所述第一文本特征。
8.根据本公开的实施例,所述信息识别方法还包括:训练所述识别模型,包括:获取历史文本数据;基于所述历史文本数据确定训练数据集和测试数据集;根据所述识别标签对所述训练数据集进行标注,根据所述识别标签对所述测试数据集的部分测试数据进行标注;以所述训练数据集所在的源域与所述测试数据集所在的目标域之间的统计距离为损失函数,将标注后的所述训练数据集和标注后的部分所述测试数据输入所述空间变换网络模型进行异构迁移学习,得到训练好的识别模型。
9.根据本公开的实施例,所述基于所述历史文本数据确定训练数据集和测试数据集包括:对所述历史文本数据中的一部分数据进行下采样,得到训练数据集;对所述历史文本数据中的另一部分数据进行随机抽样,得到测试数据集。
10.根据本公开的实施例,在将标注后的所述训练数据集和标注后的部分所述部分测试数据输入所述空间变换网络模型进行异构迁移学习之前,所述方法还包括:将所述训练数据集和所述测试数据集映射到同一维度。
11.根据本公开的实施例,其中,将所述训练数据集和所述测试数据集映射到再生核希尔伯特空间,以使所述训练数据集和所述测试数据集处于同一维度。
12.根据本公开的实施例,其中,所述识别标签包括:账务查询标签、开户行及网点信息查询标签、账户及借记卡标签、转账汇款标签、个人信贷标签、存款标签、理财标签、基金标签、贵金属标签、个人手机银行标签、个人网上银行标签、自助机具标签、信使标签以及综合标签,其中,所述综合标签用于表征除账务查询、开户行及网点信息查询、账户及借记卡、转账汇款、个人信贷、存款、理财、基金、贵金属、个人手机银行、个人网上银行、自助机具、信使之外的业务属性信息对应的标签。
13.本公开实施例的第二方面提供一种信息识别装置,包括:获取模块,用于获取待识别的文本数据;预处理模块,用于对所述待识别的文本数据进行预处理,得到第一文本特征;识别模块,用于将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息,其中,所述识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,所述识别模型的识别标签是根据业务属性信息配置的。
14.本公开实施例第三方面提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据上述信息识别方法。
15.本公开实施例第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器执行根据上述信息识别方法。
16.本公开实施例第五方面提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据上述信息识别方法。
17.根据本公开实施例提供的信息识别方法、装置、设备、介质及产品,至少具备以下有益效果:
18.由于根据业务的属性信息来配置识别标签,结合基于域适应且采用异构迁移学习的方式对空间变换网络模型进行训练得到的识别模型对待识别的文本数据进行识别,因此,使得该识别模型更能够适应于特定业务场景下的信息识别,从而提高了目标信息识别的准确性。
19.由于采用了对文本特征进行先升维再降维的处理方式,因此,能够滤第一文本特征中的无效信息,一方面,降低了识别过程中无效数据对目标信息识别的影响,提高了目标信息识别的准确性,另一方面,减少了识别过程中涉及的数据量,提高了识别的效率。
20.由于通过设置文本长度阈值对第一文本特征中长度过长的文本进行截取,在保证尽可能截取有效数据的前提下,降低计算的数据量,进一步提高识别效率。
21.在识别模型的训练过程中,由于基于识别标签,对全部的训练数据集和部分测试数据集进行标注,再利用目标域的一部分被标签的数据与源域同时作为训练集,结合训练数据集所在的源域与测试数据集所在的目标域之间的统计距离为损失函数进行训练,因此,能够更好地减少源域和目标域之间的差异,实现域适应,因此能够解决训练过程中并不是所有的源域与目标域有同样的特征导致的模型失效的问题,从而提高了目标信息识别的
准确性。
22.在获取确定训练数据集和测试数据集的过程中,由于对历史文本数据中的数据进行下采样,能够使得获取的各个类别的训练数据均衡,因此能够避免模型训练的正确率及结果的数据分布倾向于某些类导致目标信息识别的准确性低的问题,从而提高了目标信息识别的准确性。由于对历史文本数据中的数据进行随机抽样,能够使得获取的测试数据尽可能覆盖当前业务所涉及的文本数据,因此使得训练的识别模型更全面,从而使得识别模型的适用范围更全面,进而提高了目标信息的准确性。
23.由于将训练数据集和测试数据集映射到同一维度,因此能够解决训练过程中并不是所有的源域与目标域具有同样的特征导致的模型失效的问题,从而进一步地提高了目标信息识别的准确性。
24.通过定义识别标签的具体类型,使得该识别方法能够更好地适用于金融服务技术领域。
附图说明
25.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
26.图1示意性示出了根据本公开实施例的信息识别方法及装置的系统架构100;
27.图2示意性示出了根据本公开一实施例的信息识别方法的流程图;
28.图3示意性示出了根据本公开另一实施例的信息识别方法的流程图;
29.图4示意性示出了根据本公开实施例的图1所示的操作s202中对待识别的文本数据进行预处理的流程图;
30.图5示意性示出了根据本公开实施例的训练识别模型的流程图;
31.图6示意性示出了根据本公开实施例的图5所示的操作s502中基于历史文本数据确定训练数据集和测试数据集的流程图;
32.图7a示意性示出了根据本公开实施例的训练数据集和测试数据集分别对应的auc曲线图;
33.图7b示意性示出了根据本公开实施例的损失函数的曲线图;
34.图8示意性示出了根据本公开实施例的对于epoch为40的验证集,stn模型中的被标签的测试集上的结果的混淆矩阵图;
35.图9示意性示出了根据本公开实施例的对测试集的数据进行标签的标注结果图
36.图10示意性示出了根据本公开一实施例的信息识别装置的框图;
37.图11示意性示出了根据本公开另一实施例的信息识别装置的框图;
38.图12示意性示出了根据本公开又一实施例的信息识别装置的框图;
39.图13示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。
具体实施方式
40.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
41.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
42.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
43.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
44.附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据一致性修复装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读存储介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。
45.在本公开的技术方案中,所涉及的信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
46.在本公开的技术方案中,若需要获取用户个人信息,在获取或采集用户个人信息之前,均获取了用户的授权或同意。
47.针对相关技术中存在的技术问题,本公开实施例提供了一种信息识别方法,包括:获取待识别的文本数据;对待识别的文本数据进行预处理,得到第一文本特征。将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息,其中,识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,识别模型的识别标签是根据业务属性信息配置的。
48.图1示意性示出了根据本公开实施例的信息识别方法及装置的系统架构100。需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。
49.如图1所示,根据该实施例的系统架构100可以包括通信设备101,存储设备102,网络103和服务器104。网络103用于通信设备101,存储设备102与服务器104之间提供通信链路。
50.通信设备101例如可以是带有显示屏或触摸显示屏的电子设备,例如可以包括座机、手机、电脑等,通信设备101可以用来接收用户的来电语音数据并将语音数据转化为文本数据。
51.存储设备102可以是硬件存储设备,也可以是软件存储设备,本公开不做限制。存储设备102用于存储通信设备101接收用户的来电语音数据以及来电语音数据转化后的文本数据。
52.网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。其中有线方式例如可以是采用线缆及以下多种接口中的任一种连接:光纤通道、红外线接口、d型数据接口、串行接口、usb接口、usb type-c接口或dock接口,无线方式例如可以是采用无线通信方式连接的,其中的无线通信例如可采用蓝牙、wi-fi、infrared、zigbee等多个无线技术标准中的任一个。
53.服务器104通过网络103接收通信设备101当前获取的待识别的文本数据,对待识别的文本数据进行预处理,得到第一文本特征,再将第一文本特征输入服务器104上存储的训练好的识别模型,识别出待识别的文本数据包括的目标信息。在训练识别模型的过程中,服务器104通过网络103从存储设备102获取历史文本数据,基于历史文本数据确定训练数据集和测试数据集,根据识别标签对训练数据集进行标注,根据识别标签对测试数据集的部分测试数据进行标注,以训练数据集所在的源域与测试数据集所在的目标域之间的统计距离为损失函数,将标注后的训练数据集和标注后的部分测试数据输入空间变换网络模型进行异构迁移学习,得到训练好的识别模型。
54.需要说明的是,本公开实施例所提供的信息识别方法可以由服务器104执行。相应地,本公开实施例所提供的转信息识别装置可以设置于服务器104中。或者,本公开实施例所提供的信息识别方法也可以由不同于服务器104且能够与通信设备101和/或存储设备102和/或服务器104通信的服务器或服务器集群执行。相应地,本公开实施例所提供的信息识别装置也可以设置于不同于服务器104且能够与通信设备101和/或存储设备102和/或转服务器104通信的服务器或服务器集群中。或者,本公开实施例所提供的信息识别方法也可以部分由服务器104执行,部分由通信设备101执行,部分由存储设备102执行。相应的,本公开实施例所提供的信息识别装置也可以部分设置于服务器104中,部分设置于通信设备101中,部分设置于存储设备102中。
55.应该理解,图1中的通信设备、存储设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的通信设备、存储设备、网络和服务器。
56.本公开实施例提供的信息识别方法,可以应用于金融科技领域。例如,对于银行而言,为进一步挖掘不同层级的价值客户提供了业务支持以及吸纳更多的优质客户,为客户提供精准地服务尤为重要。例如,银行一般都会设有专门的客诉部对客户来电的诉求做出精准的服务,但由于客户群体的基数大,客诉部的工作人员有限,为了减少人工成本,提高客服咨询效率,利用聊天机器人(chat generative pre-trained transformer,chatgpt)(例如客户之声)来处理客户来电语音数据或文本数据的技术已逐渐被应用。在该场景下,
如何精准地识别来电语音数据或文本数据中的目标信息是能够最客户进行对点精准服务的关键。如果能够准确地识别来电语音数据或文本数据中目标信息,则在后续的服务中,可以将其快速地分配给所涉及的相关部门,例如零售部/营业部等,甚至可以细化到客户经理,让银行可以对来电客户进行一对一的服务。而采用本公开实施例提供的信息识别方法可以实现来电语音数据或文本数据中的目标信息的准确识别。
57.应当理解是,本公开实施例提供的信息识别方法不仅限于应用于金融科技领域,也可用于除金融领域之外的任意领域。上述描述只是示例性的,对于涉及任何具有来电语音数据或文本数据中的目标信息识别的领域,例如电子商务、物流等其他技术领域,都可以应用本公开实施例的信息识别方法。
58.以下将基于图1描述信息识别的场景,通过图2~图9对本公开实施例的信息识别方法进行详细描述。
59.图2示意性示出了根据本公开一实施例的信息识别方法的流程图。
60.如图2所示,该信息识别方法例如可以包括操作s201~操作s203。
61.在操作s201,获取待识别的文本数据。
62.在本公开的实施例中,用户当前可能是通过电话的方式反馈包含诉求的语音数据,也可以是通过手机银行、网上银行手动输入的包含诉求的文本数。为了便于采用自然语言处理数据进行目标信息的识别,服务端可以将语音数据转化为文本数据。
63.在操作s202,对待识别的文本数据进行预处理,得到第一文本特征。
64.在本公开的实施例中,不同待识别的文本数据包含的文本长度并不相同,考虑到由于算力的限制,无法使用大规模的识别模型对文本数据进行识别,可以采用预处理的方式对待识别的文本数据的长度进行处理。
65.在操作s203,将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息。
66.在本公开的实施例中,识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,识别模型的识别标签是根据业务属性信息配置的。
67.可以理解的是,不同的文本数据包含的目标信息不同,例如,文本数据为“我想查询开户行信息”,包含的目标信息可以是“查询开户行”,文本数据为“我想贷款”,包含的目标信息可以是“个人信贷”。由此可知,为了准确识别各种类型的文本数据,需要识别模型具有较高的适配性。
68.根据本公开的实施例,由于根据业务的属性信息来配置识别标签,结合基于域适应且采用异构迁移学习的方式对空间变换网络模型进行训练得到的识别模型对待识别的文本数据进行识别,因此,使得该识别模型更能够适应于特定业务场景下的信息识别,从而提高了目标信息识别的准确性。
69.图3示意性示出了根据本公开另一实施例的信息识别方法的流程图。
70.如图3所示,该信息识别方法例如还可以包括操作s301~操作s303。
71.在操作s301,对第一文本特征依次进行降维和升维,以过滤第一文本特征中的无效信息,得到第二文本特征。
72.在操作s302,将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息。
73.例如,服务端当前接收到用户发送的语音数据中包含一些环境噪声(例如路上车辆行驶的声音,风吹的声音,下雨的声音等等),这部分环境噪声的存在一方面会增加后续信息识别的计算量,降低识别效率,另一方面可能会影响目标信息识别的准确性。又例如,用户表达自己诉求的语音数据或文本数据不简洁,有重复的语句或者与最终诉求关联不大的一些信息,这些信息对目标信息的识别并不积极作用,反而增加计算量,降低识别效率。
74.根据本公开的实施例,由于采用了对文本特征进行先升维再降维的处理方式,因此,能够滤第一文本特征中的无效信息,一方面,降低了识别过程中无效数据对目标信息识别的影响,提高了目标信息识别的准确性,另一方面,减少了识别过程中涉及的数据量,提高了识别的效率。
75.图4示意性示出了根据本公开实施例的图1所示的操作s202中对待识别的文本数据进行预处理的流程图。
76.如图4所示,操作s202中对待识别的文本数据进行预处理可以包括操作s401~操作s403。
77.在操作s401,确定文本数据中每个文本的长度。
78.在操作s402,将每个文本的长度与预设长度阈值进行比较,确定长度大于预设长度阈值的文本。
79.在操作s403,从长度大于预设长度阈值的文本中截取一部分,得到预设维度的第一文本特征。
80.在本公开的实施例中,文本数据的长度可以理解为文本数据包含的字符数。预设长度阈值可以根据识别模型的计算能力确定,例如,预设长度阈值取10个字符、15个字符等。应当立即,前述预设长度阈值的取值只是示例性的,并不用于限制本公开。
81.根据本公开的实施例,由于通过设置文本长度阈值对第一文本特征中长度过长的文本进行截取,在保证尽可能截取有效数据的前提下,降低计算的数据量,进一步提高识别效率。
82.进一步地,在上述实施例的基础上,信息识别方法还可以包括训练识别模型。
83.图5示意性示出了根据本公开实施例的训练识别模型的流程图。
84.如图5所示,该训练识别模型例如可以包括操作s501~操作s504。
85.在操作s501,获取历史文本数据。
86.在操作s502,基于历史文本数据确定训练数据集和测试数据集。
87.在操作s503,根据识别标签对训练数据集进行标注,根据识别标签对测试数据集的部分测试数据进行标注。
88.在操作s504,以训练数据集所在的源域与测试数据集所在的目标域之间的统计距离为损失函数,将标注后的训练数据集和标注后的部分测试数据输入空间变换网络模型进行异构迁移学习,得到训练好的识别模型。
89.在本公开的实施例中,获取历史文本数据可以包括:获取历史工单数据,从历史工单数据中提取历史文本数据。
90.在本公开的实施例中,空间变换网络模型(spatial transformernetworks,stn)例如可以是基于bert(bidirectional encoder representations from transformers)模型迁移学习、域适应等人工智能技术构建,按来电客户潜在价值类型,重新对业务类型进行
了拆分,可以分为账务查询、开户行及网点信息查询、账户及借记卡、转账汇款、个人信贷、存款、理财、基金、贵金属、个人手机银行、个人网上银行、自助机具、工银信使、其他共14大类,实现了每笔工单按业务类型自动识别过程,为后续进一步挖掘我行不同层级的价值客户提供了业务支持。后续将进行详细介绍。
91.bert是一种深度双向transformer预训练模型,作为一种无监督学习,bert可以只使用纯文本语料库进行训练。与transformer相似,bert也是一种联系上下文的深层次网络模型,但是不同的是,bert仅使用了encoder部分,它将多层encoder搭建也在一起组成了它的基本网络结构。其中,transformer是一个作用于翻译模型的深度学习神经网络模型,其保留了encoder以及decoder的模块,对encoder内分为了两个模块,self-attention以及一层前馈神经网络层,对decoder在encoder的基础上,在self-attention层后增加了encoder-decoder attention层。
92.bert在输入时较transformer作了改动,在transformer的位置与词向量的基础上添加了段向量特征(segment embedding)。在transformer中提到位置信息可以被训练也可以直接使用函数,而bert中位置信息则直接使用训练的方式来获得。段向量则像是判断两个文本是否相似,这一个embedding只有两种元素,0和1,它会将两个相似的句子中相同的词向量部分设为0,而不同的部分设为1。最后将三者相加即可得到bert的输入。
93.在训练的过程中,bert会进行两个阶段的训练。第一个阶段为预训练(pre-training),它分为两个步骤,第一个步骤是遮盖,它会遮盖一定比例的词汇,让模型根据上下文全向地预测被遮盖的词。第二个步骤是训练连续参数中挑选若干万对语句,这些语句有一部分是连续的,一部分是不连续的,因此此时模型做的工作是做一个二分类模型,判断哪些语句是连续的,而哪些不是连续的。第二个部分阶段微调(fine-tuning)则可以根据不同的任务而适配不同的神经网络,例如分类模型,预测模型,甚至是聚类等非监督学习。
94.从模型的架构中,相比transformer的优点是bert克服了单向性局限,即bert融合左右两侧的语境,从而在实际上预训练了一个双向transformer的encoder模型。在实际的使用上,bert在诸多数据集上都展现了比其他模型,例如transformer,bi-lstm都要更好。在本公开实施例的模型中,利用预训练好的模型,对其中的参数进行再次训练以适应文本,最终架构为多层全连接层与decoder层。
95.进一步地,在实现本公开的过程中,申请人发现:在监督学习中,通过训练集所得到的模型会因为训练集与测试集的数据分布的不同而导致模型在测试集上表现不佳。例如,在图形分类模型中,若训练集的内容为白天的内容,它在图像上的rgb色的数值会因为光线的问题而导致数值较高,而若测试集在晚上,那么同样rgb色的数值会较低,从而使得在结果上形成了光线导致很多算法失效的情况。同样的情况也发生在循环神经网络的任务中,例如翻译模型等,会因为语言类型的差别,使用方式的不同而导致泛化误差较大,本公开实施例提供的识别模型的训练也会存在相应的问题。
96.由此,本公开实施例在识别模型的训练中引入了域适应(domain adaptation,da),域适应可以理解为一种为了减少泛化误差(generalization)的方法,其核心思想是通过变换以减少训练集所在的域(源域)与测试集所在域(目标域)之间的域距离(discrepancy),从而令训练的模型更好地适应测试集的数据。
97.实现域适应的方法通常分为两类,在训练过程中将域距离减小作为优化目标以及
利用对抗学习对数据进行生成和对抗以达成目标,其中域距离减小是比较常用且直观的方法。域距离是测试集所在的域与训练集所在的域的统计距离,在域适应中使用最大均值差异(maximum mean discrepancy,mmd)来进行衡量,可以定义为式(1):
[0098][0099]
其中,f(
·
)为样本空间上的连续函数,e
p
[f(x)]为测试集中的样本数据在连续函数f(
·
)的函数值的均值,eq[f(y)]为训练集中的样本数据在连续函数f(
·
)的函数值的均值。
[0100]
由于连续函数f(
·
)的任意性,直接对其进行计算比较困难,例如,因此,在执行操作s504中的将标注后的训练数据集和标注后的部分测试数据输入空间变换网络模型进行异构迁移学习之前,方法还包括:将训练数据和测试数据映射到同一维度。
[0101]
优选地,可以将训练数据集和测试数据集映射到再生核希尔伯特空间(reproducing kernel hilbert space,rkhs),以使训练数据集和测试数据集处于同一维度。具体的,利用rkhs的特性,即该空间中任何函数与其因变量均可以被表示为一组核函数的内积的形式。通过这个方式,mmd的计算方式可以为式(2):
[0102][0103]
其中,φ为高斯核(gbf kernel),即式(3):
[0104][0105]
需要说明的是,在此使用高斯核的原因有两个,一是它可以把函数的任意性通过指数函数在正区间上(0,1]的范围而将函数集(())的范数压缩到(0,1]上,为式(2)最后一步于号创造条件,二是它在一个不可数集上等同于傅里叶变换,它将数据映射到了一个正交空间上,使得域适应在分类问题上有着明显的优势。
[0106]
因此,在最后实际计算mmd的时候可以采用||μ
p-μq||h来进行计算。考虑到式(2)在使用中将数据映射到了rkhs,因此在实际计算中为了同时做到这样的映射,并保证核函数在使用上的正确性,使用中会利用其平方,即式(4):
[0107]
mmd[f,p,q]2=tr(kl)
[0108]
其中,矩阵为k为通过核函数k(
·

·
)而获得的矩阵,l为分段常数,tr为矩阵的迹,即式(5):
[0109]
[0110][0111]
由此,可以通过式(4)来计算两个域之间的差异,通过缩短得到的mmd来减少两者的统计距离。
[0112]
对于mmd的使用方法,通常是将其放置于全连接层(fully connected layers)中的瓶颈层(bottleneck)后,利用衡量提取出来的特征的域距离来达到最优解,此结论是通过微调(fine tuning)得到的。在数值上,通常会将mmd所计算出来的值作为损失函数的一部分,与原先的损失函数的值引入超参数后进行线性组合,从而实现减少域距离并提高泛化
[0113]
在本公开的实施例中,对于目前使用客户之声的数据集而言,与测试集并不完全相同,这就尤其凸显了迁移学习的必要性。并且,不同的方言会涉及不同词向量,例如方言“怎么回事”,可能会包含3个词或者4个词的情况,并且由于发音不同,会导致其在转化到文本上产生不同的文字,因此,可以通过异构迁移学习(hyterogeneous domain adaptation)对其进行转化,解决由于并不是所有的源域与目标域具有同样的特征的问题,从而提高泛化能力。因此,本公开使用了在迁移学习中正确率较高的stn模型。在迁移学习中,已有的知识称之为源域(source domain),要学习的新知识称之为目标域(target domain),迁移学习是把源域的知识迁移到目标域上。在本公开的实施例中,源域为训练集数据集所在的域,是与测试数据集不同的领域,但有丰富的监督信息,目标域为测试集数据集所在的域,具备少量的标签。
[0114]
在本公开的实施例中,stn模型的损失函数由两部分组成,margin mmd(mm)与conditional mmd(mc),它们的表达式分别为式(6)和式(7):
[0115][0116][0117]
其中,mm为上文定义的mmd,而在mc中,c为类别个数,ns与分别为源域数据的个数以及对类别k下的个数,n
t
与分别为目标域带标签的数据的个数以及对类别k下的个数,nu为目标域无标签数据的个数。并且被定义为式(8):
[0118][0119]
其中r为循环总数,r为当前循环数,而y则为模型使用自身参数生成的伪标签。这
个识别模型的优势是摒弃了原有mmd无视类别的缺陷,并且通过加入让识别模型可以逐步提高这些添加的伪标签的权重,从而近似地达到半监督学习的效果。
[0120]
由此,基于该识别模型,可以利用客户之声的数据作为训练集,对部分的数据进行人工标注,随后对原本无标注的模型进行训练,从而提高正确率。
[0121]
进一步地,在识别模型获得文本数据的特征向量之后需要对这些特征向量进行分析。类似于计算机视觉(computer vision,cv)领域中的多个全连接层,通过这样的全连接层对特征进行筛选。例如不同的口音,方言以及地域对话特征会对信息产生不同的影响,因此本公开在这部分添加stn的域适应并给出它的损失函数式(9):
[0122]
ζ
mmd
=mm+mc[0123]
域适应最佳的位置是添加在瓶颈处(bottlenect),意味着本公开实施例的全连接层需要首先对特征进行降维再进行升维以过滤一部分无效或影响很小的特征信息,在这样的瓶颈层之后,添加域适应层,再通过微调确定层数和维度,在完成域适应之后将维度缩减到本公开的实施例之前所确立的概率值。最后通过概率值以对类型进行确认,而这所涉及的损失函数定义为式(10):
[0124]
ζc=soft max(z-z
true
)
[0125]
其中,z为训练中最终得到的标签,z
true
为根据真实标注的标签。
[0126]
由此,识别模型最终的损失函数为式(11):
[0127]
ζ=ζc+λζ
mmd
[0128]
其中,λ为超参数。
[0129]
根据本公开的实施例,在识别模型的训练过程中,由于基于识别标签,对全部的训练数据集和部分测试数据集进行标注,再利用目标域的一部分被标签的数据与源域同时作为训练集,结合训练数据集所在的源域与测试数据集所在的目标域之间的统计距离为损失函数进行训练,因此,能够更好地减少源域和目标域之间的差异,实现域适应,因此能够解决训练过程中并不是所有的源域与目标域有同样的特征导致的模型失效的问题,从而提高了目标信息识别的准确性。由于将训练数据集和测试数据集映射到同一维度,因此能够解决训练过程中并不是所有的源域与目标域具有同样的特征导致的模型失效的问题,从而进一步地提高了目标信息识别的准确性。
[0130]
图6示意性示出了根据本公开实施例的图5所示的操作s502中基于历史文本数据确定训练数据集和测试数据集的流程图。
[0131]
如图6所示,操作s502中基于历史文本数据确定训练数据集和测试数据集例如可以包括操作s601~操作s602。
[0132]
在操作s601,对历史文本数据中的一部分数据进行下采样,得到训练数据集。
[0133]
在操作s602,对历史文本数据中的另一部分数据进行随机抽样,得到测试数据集。
[0134]
在本公开的实施例中,由于所提供的客户来电语音转文本数据并无提供分类标签,因硬件及软件设施的限制,直接使用该数据集进行分类或聚类操作很难实现。
[0135]
基于此,本公开的实施例选取了客户之声全量的数据作为初始预训练模型的训练集,选取work_order_biz_class_cd,work_order_biz_sub_class_cd,cust_opinion_idtfy_cd作为训练标签,work_order_cust_problem_desc作为训练数据集进行训练。
[0136]
然而,由于本身标签的内容不对应,因此,本公开的实施例根据业务的属性信息
(例如可以根据)重新配置了训练标签(在识别时称之为识别标签),表6.1给出了客户之声工单类别及本选题标签类别映射关系:
[0137]
表6.1
[0138][0139][0140]
如表6所示,识别标签包括:账务查询标签、开户行及网点信息查询标签、账户及借记卡标签、转账汇款标签、个人信贷标签、存款标签、理财标签、基金标签、贵金属标签、个人手机银行标签、个人网上银行标签、自助机具标签、信使标签以及综合标签,其中,综合标签用于表征除账务查询、开户行及网点信息查询、账户及借记卡、转账汇款、个人信贷、存款、理财、基金、贵金属、个人手机银行、个人网上银行、自助机具、信使之外的业务属性信息对应的标签。通过定义识别标签的具体类型,使得该识别方法能够更好地适用于金融服务技术领域。
[0141]
需要说明的是,由于每个类别上的数据量并不同,例如在客户之声中账户及借记卡的占比就非常大,这样会导致数据集样本不均衡,从而使得训练的正确率以及结果的数据分布倾向于这一类。
[0142]
例如,客户之声工单数据集非常大,超过了1300万,将数据完全训练在时间上也不允许,因此客户之声工单数据进行了下采样操作,使得各类别数据量均衡。本公开的实施例例如选取了14万数据,即每类1万的数据量进行训练。获得初始训练集之后,也对所提供客户来电文本数据进行了随机抽样,抽取多行数据进行人工标签标注,利用这一小型的数据集进行测试集,也可以再抽取多行数据进行人工标签标注作为验证集。例如,本公开的实施例对所提供的269万客户来电文本数据进行了随机抽样,抽取了510行数据进行人工标签标注,利用这一小型的数据集进行验证集。
[0143]
根据本公开的实施例,在获取确定训练数据集和测试数据集的过程中,由于对历史文本数据中的数据进行下采样,能够使得获取的各个类别的训练数据均衡,因此能够避免模型训练的正确率及结果的数据分布倾向于某些类导致目标信息识别的准确性低的问
题,从而提高了目标信息识别的准确性。由于对历史文本数据中的数据进行随机抽样,能够使得获取的测试数据尽可能覆盖当前业务所涉及的文本数据,因此使得训练的识别模型更全面,从而使得识别模型的适用范围更全面,进而提高了目标信息的准确性。
[0144]
进一步地,在识别模型的训练过程中,由于每个文本的长度并不相同,并且由于bert所提供的维度较高,所使用的minibert模型并不能涵盖所有的文本,对于长度过长的文本截取一部分。并且由于图形处理器(graphics processing unit,gpu)计算能力的限制,无法使用更大规模的模型对测试数据进行预测。因此,使用第40个循环所保存的数据特征,除去了该模型最后一层全连接层,得到新的维度(例如1024维)的特征维度作为新的预训练数据,对其进行迁移学习的训练,来减少源域和目标域之间的差异并提高正确率。
[0145]
为了进一步参数本公开实施例提供的识别模型的优势,下面提供一些数据予以支撑。
[0146]
图7a示意性示出了根据本公开实施例的训练数据集和测试数据集分别对应的auc曲线图。图7b示意性示出了根据本公开实施例的损失函数的曲线图。
[0147]
如图7a和7b所示,本公开实施例提供的识别模型识别的正确率较五mmd的模型提高了约10%,达了50.39%。同样的,正确率曲线上也可以看出过拟合对模型正确率的影响,因此,本公开的实施例选取了epoch为40的模型作为最终的模型,以作为预测测试集的方式。
[0148]
图8示意性示出了根据本公开实施例的对于epoch为40的验证集,stn模型中的被标签的测试集上的结果的混淆矩阵图。
[0149]
如图8所示,例如,依托工银图灵jupyter平台进行模型训练,并对验证集预测效果进行调优工作。通过accuracy,n维混淆矩阵,weighted-f1-score等指标对模型进行验证和评估,选择效果最好的识别模型结果作为客户来电信息业务识别的最终识别模型。通过取每个类别的f1score并取平均,这个模型对于验证集的f1 score为0.5055。
[0150]
本公开的实施例还对测试集的数据进行了标签的标注。
[0151]
图9示意性示出了根据本公开实施例的对测试集的数据进行标签的标注结果图。
[0152]
如图9所示,账户和借记卡的咨询是最多的,占到了约65%,其中大部分内容为客户对转账或者账户有疑问,那么客服经理可以对其进行相关的处理。而占比最少的是基金相关的咨询,在本公开实施例的预测结果中没有出现基金相关的结果。而这种不准确的结果可能是由于客户之声中本身基金相关的数据较少,造成了数据及不平衡的结果。值得一提的是,训练集的客户之声数据中大部分也为账户和借记卡的咨询。由于本公开实施例目前的模型已经证明了其收敛性和一定的准确性,如果本公开实施例的训练集标签被替换为人工标注标签的通话信息,那么准确率会进一步提高。
[0153]
综上所述,本公开实施例的识别方法能够准确全面的识别文本数据中的目标信息。将该识别方法应用到银行领域中,能够准确地对客户进行对点精准服务,从而提升来电服务的服务效率和服务质量,从而提升可客户的体验。
[0154]
基于图2~图9所示的信息识别方法,本公开实施例还提供一种信息识别装置,以下将基于图1描述的场景,通过图10~图12对本公开实施例的信息识别装置进行描述。
[0155]
图10示意性示出了根据本公开一实施例的信息识别装置的框图。
[0156]
如图10所示,信息识别装置1000可以包括获取模块1010、预处理模块1020以及识
别模块1030。
[0157]
获取模块1010,用于获取待识别的文本数据。获取模块1010可以用于执行前文描述的操作s201,在此不再赘述。
[0158]
预处理模块1020,用于对待识别的文本数据进行预处理,得到第一文本特征。预处理模块1020可以用于执行前文描述的操作s202,在此不再赘述。
[0159]
识别模块1030,用于将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息,其中,识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,识别模型的识别标签是根据业务属性信息配置的。识别模块1030可以用于执行前文描述的操作s203,在此不再赘述。
[0160]
图11示意性示出了根据本公开另一实施例的信息识别装置的框图。
[0161]
如图11所示,信息识别装置1000例如还可以包括过滤模块1040。
[0162]
过滤模块1040,用于,对第一文本特征依次进行降维和升维,以过滤第一文本特征中的无效信息,得到第二文本特征。过滤模块1040以用于执行前文描述的操作s301,在此不再赘述。
[0163]
识别模块1030还用于将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息。识别模块1030还可以用于执行前文描述的操作s302,在此不再赘述。
[0164]
图12示意性示出了根据本公开又一实施例的信息识别装置的框图。
[0165]
如图12所示,信息识别装置1000例如还可以包括训练模块1050。
[0166]
训练模块1050,用于训练识别模型,包括:获取历史文本数据。基于历史文本数据确定训练数据集和测试数据集。根据识别标签对训练数据集进行标注,根据识别标签对测试数据集的部分测试数据进行标注。以训练数据集所在的源域与测试数据集所在的目标域之间的统计距离为损失函数,将标注后的训练数据集和标注后的部分测试数据输入空间变换网络模型进行异构迁移学习,得到训练好的识别模型。训练模块1050可以用于执行前文描述的操作s501~操作s504,在此不再赘述。
[0167]
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0168]
例如,获取模块1010、预处理模块1020、识别模块1030、过滤模块1040以及训练模块1050中的任意多个可以合并在一个模块/单元/子单元中实现,或者其中的任意一个模块/单元/子单元可以被拆分成多个模块/单元/子单元。或者,这些模块/单元/子单元中的一个或多个模块/单元/子单元的至少部分功能可以与其他模块/单元/子单元的至少部分功能相结合,并在一个模块/单元/子单元中实现。根据本公开的实施例,获取模块1010、预
处理模块1020、识别模块1030、过滤模块1040以及训练模块1050中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,获取模块1010、预处理模块1020、识别模块1030、过滤模块1040以及训练模块1050中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0169]
需要说明的是,本公开的实施例中信息识别装置部分与本公开的实施例中信息识别方法部分是相对应的,其具体实施细节及带来的技术效果也是相同的,在此不再赘述。
[0170]
图13示意性示出了根据本公开实施例的适于实现上文描述的方法的电子设备的框图。图13示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0171]
如图13所示,根据本公开实施例的电子设备1300包括处理器1301,其可以根据存储在只读存储器(rom)1302中的程序或者从存储部分1308加载到随机访问存储器(ram)1303中的程序而执行各种适当的动作和处理。处理器1301例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器1301还可以包括用于缓存用途的板载存储器。处理器1301可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0172]
在ram 1303中,存储有电子设备1300操作所需的各种程序和数据。处理器1301、rom 1302以及ram1303通过总线1304彼此相连。处理器1301通过执行rom 1302和/或ram1303中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 1302和ram 1303以外的一个或多个存储器中。处理器1301也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0173]
根据本公开的实施例,电子设备1300还可以包括输入/输出(i/o)接口1305,输入/输出(i/o)接口1305也连接至总线1304。电子设备1300还可以包括连接至i/o接口1305的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1307;包括硬盘等的存储部分1308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至i/o接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。
[0174]
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被处理器1301执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0175]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0176]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质。例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0177]
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom1302和/或ram 1303和/或rom 1302和ram 1303以外的一个或多个存储器。
[0178]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。

技术特征:
1.一种信息识别方法,包括:获取待识别的文本数据;对所述待识别的文本数据进行预处理,得到第一文本特征;将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息,其中,所述识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,所述识别模型的识别标签是根据业务属性信息配置的。2.根据权利要求1所述的信息识别方法,所述信息识别方法还包括:对所述第一文本特征依次进行降维和升维,以过滤所述第一文本特征中的无效信息,得到第二文本特征;将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息。3.根据权利要求1或2所述的信息识别方法,其中,所述对所述待识别的文本数据进行预处理,得到第一文本特征包括:确定所述文本数据中每个文本的长度;将每个文本的长度与预设长度阈值进行比较,确定长度大于预设长度阈值的文本;从所述长度大于预设长度阈值的文本中截取一部分,得到预设维度的所述第一文本特征。4.根据权利要求1所述的信息识别方法,所述信息识别方法还包括:训练所述识别模型,包括:获取历史文本数据;基于所述历史文本数据确定训练数据集和测试数据集;根据所述识别标签对所述训练数据集进行标注,根据所述识别标签对所述测试数据集的部分测试数据进行标注;以所述训练数据集所在的源域与所述测试数据集所在的目标域之间的统计距离为损失函数,将标注后的所述训练数据集和标注后的部分所述测试数据输入所述空间变换网络模型进行异构迁移学习,得到训练好的识别模型。5.根据权利要求4所述的信息识别方法,其中,所述基于所述历史文本数据确定训练数据集和测试数据集包括:对所述历史文本数据中的一部分数据进行下采样,得到训练数据集;对所述历史文本数据中的另一部分数据进行随机抽样,得到测试数据集。6.根据权利要求4或5所述的信息识别方法,其中,在将标注后的所述训练数据集和标注后的部分所述部分测试数据输入所述空间变换网络模型进行异构迁移学习之前,所述方法还包括:将所述训练数据集和所述测试数据集映射到同一维度。7.根据权利要求6所述的信息识别方法,其中,将所述训练数据集和所述测试数据集映射到再生核希尔伯特空间,以使所述训练数据集和所述测试数据集处于同一维度。8.根据权利要求1所述的信息识别方法,其中,所述识别标签包括:账务查询标签、开户行及网点信息查询标签、账户及借记卡标签、转账汇款标签、个人信贷标签、存款标签、理财标签、基金标签、贵金属标签、个人手机银行标签、个人网上银行标签、自助机具标签、信使
标签以及综合标签,其中,所述综合标签用于表征除账务查询、开户行及网点信息查询、账户及借记卡、转账汇款、个人信贷、存款、理财、基金、贵金属、个人手机银行、个人网上银行、自助机具、信使之外的业务属性信息对应的标签。9.一种信息识别装置,包括:获取模块,用于获取待识别的文本数据;预处理模块,用于对所述待识别的文本数据进行预处理,得到第一文本特征;识别模块,用于将所述第一文本特征输入训练好的识别模型,识别出所述待识别的文本数据包括的目标信息,其中,所述识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,所述识别模型的识别标签是根据业务属性信息配置的。10.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~8中任一项所述的方法。11.一种计算机可读存储介质,所述计算机可读存储介质上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。12.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述的方法。

技术总结
本公开提供一种信息识别方法、装置、设备、介质及产品,涉及人工智能技术领域,可以应用于金融科技技术领域,方法包括:获取待识别的文本数据;对待识别的文本数据进行预处理,得到第一文本特征。将第一文本特征输入训练好的识别模型,识别出待识别的文本数据包括的目标信息,其中,识别模型是基于域适应,采用异构迁移学习的方式对空间变换网络模型进行训练得到的,识别模型的识别标签是根据业务属性信息配置的。该信息识别方法、装置、设备、介质及产品能够准确地识别待识别文本数据中的目标信息。息。息。


技术研发人员:王宁
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:2023.06.30
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐