查询方法、装置及电子设备与流程
未命名
09-13
阅读:80
评论:0

1.本技术涉及计算机技术领域,尤其涉及查询方法、装置及电子设备。
背景技术:
2.表格问答是基于自然语言技术根据表格内容给出答案的问答引擎。例如,基于用户的问询文本,在表格中查询问询文本的答案文本以回复用户。
3.目前,在表格中查询答案文本的方式是基于用户的问询文本,在表格中查询存在的答案文本。但是,在一些情况下,表格中并不直接保存有用户想要的数据,导致无法准确的回答用户的问题,进而限制了表格问答的应用。
技术实现要素:
4.本技术的多个方面提供查询方法、装置及电子设备,以提高表格问答的应用范围。
5.本技术实施例第一方面提供一种查询方法,包括:响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;在第一表格中查询符合条件文本的至少一行目标文本;根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的。
6.本技术实施例第二方面提供一种查询方法,应用于终端设备,包括:获取问询文本;向云端服务器发送问询文本,问询文本用于指示云端服务器将问询文本改写为查询文本;接收云端服务器发送的结果文本,结果文本是云端服务器根据第一方面的查询方法确定的。
7.本技术实施例第三方面提供一种查询装置,应用于云端服务器,包括:
8.获取模块,用于响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;
9.查询模块,用于在第一表格中查询符合条件文本的至少一行目标文本;
10.第一确定模块,用于根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;
11.第二确定模块,用于确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的。
12.本技术实施例第四方面提供一种电子设备,包括:处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面和/或第二方面的查询方法。
13.本技术实施例第五方面提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,当计算机程序被处理器执行时,致使处理器实现如第一方面和/或第二方面
的查询方法。
14.本技术实施例应用于基于表格的问答场景中,通过响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;在第一表格中查询符合条件文本的至少一行目标文本;根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的,可以基于用户各种类型的查询文本均可以得到对应的结果文本,提高了表格问答的应用范围。
附图说明
15.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
16.图1为本技术示例性实施例提供的一种应用场景图;
17.图2为本技术示例性实施例提供的一种查询方法的步骤流程图;
18.图3为本技术示例性实施例提供的另一种查询方法的步骤流程图;
19.图4为本技术示例性实施例提供的一种查询装置的结构框图;
20.图5为本技术示例性实施例提供的一种电子设备的结构示意图。
具体实施方式
21.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
22.目前,在表格中查询答案文本的方式是基于用户的问询文本,在第二表格中查询存在的答案文本。示例性地,参照表1,为一第二表格,用户基于该第二表格只能查询到报警时间、案件状态和报警地点。对其他查询内容,则无法直接从该第二表格中确定,示例性地,若用户的问询文本为“今天的有效报警是多少”,则将该问询文本改写为sql(structured query language,结构化查询语言),即本技术的查询文本,为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,其中“从表1中选择(数量)”为选择文本,“条件为案件状态=有效”和“日期=今天”均为条件文本,其中,由于表1中并没有“数量”列,因此无法从表1中直接确定结果文本,进而导致无法回复用户的问询。
23.表1
24.报警时间案件状态报警地点2022-07-01有效a区2022-07-09无效a区2022-07-10有效b区2022-07-11无效c区2022-07-28有效a区2022-07-28有效a区
2022-07-28有效b区
25.基于上述问题,其中一种解决方法是离线预先针对每个可能数据计算好结果,在第二表格中新增列,然后确定新增列的值填充在新增列对应的单元格中,但是在实际应用场景中,第二表格中单元格中的值的变化是很频繁的,尤其是数字类型相关的列,若每次变化都重新计算,这样既不能保证实时性,也会浪费比较大的重复的工作量。示例性地,参照表2,若第二表格中只有三列(商品名称、数量和单价),在第二表格的基础上新增一列“总价”,则需要计算第二表格中每一行对应的总价,若其中一行中的数量或单价发生变化,则需要重新计算对应的总价,然后填充在对应的总价列,工作量较大。
26.表2
[0027][0028][0029]
此外,参照表3,对于类似表1的表格,若新增列为“数量”,“数量”这一列的值也只能表达对应行是否为有效报警,并不能直接回答用户的类似“今天的有效报警是多少”的问题。因此,采用该方式也不能回复用户的问题,也限制了表格问答的应用。
[0030]
表3
[0031]
报警时间案件状态报警地点数量2022-07-01有效a区1 2022-07-09无效a区0 2022-07-10有效b区1 2022-07-11无效c区0 2022-07-28有效a区1 2022-07-28有效a区1 2022-07-28有效b区1
[0032]
基于上述问题,本技术提供一种查询方法,通过响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;在第一表格中查询符合条件文本的至少一行目标文本;根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的,可以基于用户各种类型的查询文本均可以得到对应的结果文本,提高了表格问答的应用范围。
[0033]
在本实施例中,并不限定训练查询方法的执行设备。可选地,训练查询方法应用在终端,也可以借助云计算系统实现整体的练查询方法。例如,训练查询方法可以应用于云服务器,以便借助于云上资源的优势运行各种模型;相对于应用于云端,训练查询方法也可以应用于常规服务器、云服务器或服务器阵列等服务端设备。
[0034]
此外,参照图1,为本技术的一种应用场景图。终端设备11向服务器12发送问询文本,服务器12改写问询文本得到结构化的查询文本,然后基于查询文本在第一表格中查询结果文本,将结果文本发送给终端设备11,以回答问询文本。
[0035]
其中,文本分类模型可以应用的分类任务中,如待分类文本是用户评论文本,将用户评论文本输入文本分类模型,以使文本分类模型确定该用户评论是正向的还是负向的。再例如,待分类文本是产品说明文本,将该产品说明文本输入文本分类模型中,以使文本分类模型确定该产品说明书对应的产品类目。
[0036]
图1只是本技术示例性的一种应用场景,本技术还可以应用在其他相关场景中,在此不加以限定。
[0037]
以下结合附图,详细说明本技术各实施例提供的技术方案。
[0038]
图2为本技术示例性实施例提供的一种查询方法的步骤流程图。如图2所示,该查询方法具体包括以下步骤:
[0039]
s201,响应获取到面向第一表格的查询文本,获取第一表格。
[0040]
其中,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析。
[0041]
在本技术实施例中,查询文本是根据用户输入的问询文本生成的,问询文本为自然预先,查询文本是结构化的,其中,查询文本包括选择文本和条件文本。在本技术实施例中,将问询文本改写成查询文本采用的技术为nltsql(natural language to sql,自然语言到结构化查询语言),即是将用户输入的自然语言文本转换为结构化语言的问询文本。
[0042]
示例性地,若用户的问询文本为“a商品的总价是多少”,则对应的查询文本为“选择(总价),条件为(商品名称=a)”,其中,选择文本为“选择(总价)”,条件文为“条件为(商品名称=a)”。若用户的问询文本为“低风险产品的日利率是多少”,则对应的查询文本为“选择(日利率),条件为(风险等级=低)”。
[0043]
在本技术中,查询文本是为了更便于在第一表格中查询到对应的结果文本,其中,条件文本可以在第一表格中查找符合该条件文本的各行文本,选择文本可以在各行文本中确定结果文本。
[0044]
在本技术实施例中,第一表格可以是预先基于第二表格生成的供用户查询,也可以是根据查询文本后实时生成的。
[0045]
s202,在第一表格中查询符合条件文本的至少一行目标文本。
[0046]
在本技术实施例中,先可以采用查询文本中的条件文本,确定符合该条件文本的至少一行目标文本。
[0047]
可选地,若条件文本中具有新增列名称,则将条件文本对应的新增列名称移除后,采用新的条件文本,第一表格中查询符合新的条件文本的至少一行目标文本。
[0048]
s203,根据选择文本,在第一表格中确定目标列。
[0049]
其中,目标列的列名称与选择文本属于同一语义。
[0050]
在本技术实施例中,先通过条件文本缩小数据范围,然后再通过选择文本找出满足查询文本的结果文本。
[0051]
s204,确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本。
[0052]
其中,目标值是根据表达式确定的。
[0053]
其中,第一表格在第二表格的基础上具有新增列,新增列具有对应的第一表达式,结果文本是根据第一表达式和第二表格文本确定的。
[0054]
示例性地,参照表1为第二表格,参照表4为第一表格。其中,表4中的新增列为新增列名称为“数量”对应的列,该新增列名称也可以是“有效报警数”,该新增列中的值均为空,该新增列具有对应的第一表达式。例如,该第一表达式可以是“计数(案件状态==有效?且报警时间==今天?1:0)”,该第一表达式表示“在案件状态有效且报警时间为今天时进行计数”。
[0055]
表4
[0056]
报警时间案件状态报警地点数量2022-07-01有效a区 2022-07-09无效a区 2022-07-10有效b区 2022-07-11无效c区 2022-07-28有效a区1 2022-07-28有效a区2 2022-07-28有效b区3
[0057]
基于表4,若查询文本为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,若今天是2022-07-28,则可以根据第一表达式“计数(案件状态==有效?且报警时间==今天?1:0)”和第二表格可以确定结果文本为3。
[0058]
在本技术实施例中,可以根据第一表达式和第二表格中的文本确定结果文本,其中,第一表达式和新增列具有对应关系。在本技术实施例中,第一表格相对于第二表格可以有一个或者多个新增列。
[0059]
进一步地,由于新增列只有新增列名称,没有对应的值。因此在第二表格中若有文本发生变化,也需要更改新增列中的值,并且也不影响第一表达式的使用,因此对于新增列配置第一表达式,可以保证表格的实时性,也不会浪费比较大的重复的工作量,并且可以实时准确的回复用户的各种类型的问题,提高了表格问答的应用范围。
[0060]
本技术实施例应用于基于表格的问答场景中,通过获取查询文本;根据查询文本,在第一表格中查询结果文本;其中,第一表格在第二表格的基础上具有新增列,新增列具有对应的第一表达式,结果文本是根据第一表达式和第二表格对应行的文本确定的,可以基于用户各种类型的查询文本均可以得到对应的结果文本,提高了表格问答的应用范围。
[0061]
参照图3,为本技术示例性实施例提供的另一种查询方法的步骤流程图。如图3所示该查询方法具体包括以下步骤:
[0062]
s301,获取查询文本。
[0063]
该步骤的具体实现过程参照s201,在此不再赘述。
[0064]
s302,根据查询文本和第二表格,确定新增列的新增列名称以及第一表达式。
[0065]
在本技术实施例中,具体为根据查询文本中的选择文本和条件文本以及第二表格中的各列名称,确定新增列的新增列名称,其中,新增列名称与第二表格中列名称表达不同的含义,并且新增列名称与查询文本中的部分文本表达相同的含义。
[0066]
示例性地,若查询文本为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,则新增列名称为“数量”,该新增列名称在第二表格中并不存在。再例如,若查询文本为“选择(总价),条件为“商品a”,参照表2,第二表格中的列名称只有“商品名称、数量和单价”,则新增列名称可以是“总价”。
[0067]
此外,通过以下方式生成第一表达式:根据查询文本和新增列名称生成第二表达式;校验第二表达式,并在第二表达式校验通过的情况下,确定第二表达式为第一表达式。
[0068]
在本技术实施例中,根据预设的规则,基于选择文本和条件文本生成第二表达式。进一步地,还需要对第二表达式进行校验,以校验第二表达式的可用性。
[0069]
进一步地,根据查询文本和新增列名称生成第二表达式,包括:根据查询文本的语义和新增列名称的语义,确定第二表达式。
[0070]
其中,其中,查询文本为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,新增列名称为“数量”,则第二表达式可以是“计数(案件状态==有效?且报警时间==今天?1:0)”,其中,第二表达式还可以是“计数”或“计数(案件状态==有效?1:0)”或“1:0计数(报警时间==今天?1:0”。其中,若第二表达式是“计数”,则基于表4,若查询文本为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,若今天是2022-07-28,则可以先根据条件文本“条件为案件状态=有效,日期=今天”,确定表4中最后三行文本符合条件文本,然后,根据选择文本“选择(数量)”,确定第二表格中“数量”为结果文本对应的列,对该表4中最后三行文本采用该第一表达式进行计数,可以得到结果文本为3。
[0071]
其中,第二表达式可以根据以下多种类型的计算元素或者这些类型的计算元素的组合确定。其中,计算元素包括:聚合函数、第二表格中列值和/或列名称、常量、三元运算符、四则运算符和内置函数等多种类型。具体地,聚合函数如确定最大、最小、平均和求和。常量如常量字符或数据。三元运算符如不大于、不小于、大于、小于等。四则运算符如加/减/乘/除等基础运算。内置函数如求余、取整等。
[0072]
在本技术实施例中,可以根据查询文本和新增列名称的语义,然后在上述多个计算元素中选择元素,组成第二表达式。
[0073]
可选地,根据查询文本和新增列名称生成第二表达式,包括:将查询文本和新增列名称输入预先训练的生成模型中进行处理,得到第二表达式。
[0074]
在本技术实施例中,可以预先训练生成模型,该生成模块可以基于查询文本和新增列名称生成第二表达式。
[0075]
其中,校验第二表达式,包括:校验第二表达式是否符合预设的表达式规则;若符合,则校验根据第二表达式确定的数据的数据类型与新增列的数据类型是否一致;若一致,确定第二表达式校验通过。
[0076]
具体地,表达式规则如,聚合函数不允许嵌套(例如,若表达式中在求完最大值后,又求和,这种表达式属于嵌套),新增列之间不能相互引用。如在计算新增列1的值时,不能使用新增列2的值。其中,若第二表达式不符合这些预设的表达式规则,则确定第二表达式校验不通过。反之则进行后续的校验。
[0077]
进一步地,若新增列的数据类型应为数值型,但是基于根据第二表达式确定的数据的数据类型字符型,则确定数据类型不一致,第二表达式校验不通过。
[0078]
在本技术实施例中,生成的第二表达式可以是代码格式的,可以对第二表达式翻
译后得到可便于理解的表达式。
[0079]
在本技术实施例中,新增列的值是指新增列名称对应的值,该值是采用第一表达式对第二表格中的多行文本进行计算得到的,可以实现实时计算得到对应的值,并不需要预先存储该值供用户查询。
[0080]
s302,在第二表格中增加新增列,并建立新增列和第一表达式的对应关系,得到第一表格。
[0081]
其中,新增列在第一表格中具有新增列名称。
[0082]
在本技术实施例中,在确定新增列名称和第一表达式后,即可以在第二表格中增加新增列。示例性地,第一表格如表4。
[0083]
进一步地,若条件文本中包含新增列名称,则根据查询文本的语义改写查询文本,得到新的查询文本。
[0084]
其中,条件文本中包含新增列名称包括:条件文本中包含与新增列名称同义的文本。例如,新增列名称为“报警数量”,条件文本为“报案数量”,二者为同义。
[0085]
示例性地,若查询文本为“从表1中选择(数量),条件为案件状态=有效,日期=今天”,则该查询文本中条件文本不包含新增列名称,则不需要改写查询文本。若问询文本为“2022年7月份有效报警数大于1的地方有哪些”,对应的查询文本为“选择(报警地点),条件为(报警时间≥2022-07-01且报警时间≤2022-07-31、数量>1)”,条件文本中包含新增列名称“数量”,则对该查询文本进行改写可得到“选择“报警地点”,条件(报警时间≥2022-07-01且报警时间≤2022-07-31、数量>1),从分组报警地点”。
[0086]
在本技术实施例中,可以根据实际需要确定是否对查询文本的改写,改写得到的新的查询文本和原查询文本的语义相同。改写后的查询文本可以更快速准确的在第一表格中查询到结果文本。
[0087]
s304,在第一表格中查询符合条件文本的至少一行目标文本。
[0088]
该步骤的具体实现过程参照s202,在此不再赘述。
[0089]
s305,根据选择文本,确定第一表格中目标列。
[0090]
该步骤的具体实现过程参照s203,在此不再赘述。
[0091]
s306,确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本。
[0092]
示例性地,若问询文本为“2022年7月份有效报警数大于1的地方有哪些”,转换为查询文本为“选择(报警地点),条件为(报警时间≥2022-07-01且报警时间≤2022-07-31、数量>1)”。然后根据查询文本和第二表格(如表1),生成第一表格(如表2)。然后对查询文本进行改写,得到新的查询文本“选择“报警地点”,条件(报警时间≥2022-07-01且报警时间≤2022-07-31、数量>1,对报警地点分组)”,然后执行部分条件文本((报警时间≥2022-07-01且报警时间≤2022-07-31,对报警地点分组),在第一表格中查找到符合该条件文本的至少一行目标文本(x),然后在至少一行目标文本(x)中,选择有效报警的数量大于1的至少一行目标文本(y),然后在至少一行目标文本(y),确定报警地点。
[0093]
在本技术实施例中,通过在第二表格中引入新增列得到第一表格,解决了目前的表格问答场景中无法查询表格中没有的数据的问题,增强了表格问答的能力,极大的降低了表格中不同列之间的数据有关联且数据频繁变更的维护成本,提高了结果文本的查询效
率。
[0094]
此外,本技术还提供一种查询方法,应用于终端设备,查询方法包括:获取问询文本;向云端服务器发送问询文本,问询文本用于指示云端服务器将问询文本改写为查询文本;接收云端服务器发送的结果文本,结果文本是云端服务器根据上述任一项的查询方法确定的。
[0095]
该实施例的具体实现过程参照上述实施例,再次不再赘述。
[0096]
在本技术实施例中,除了提供一种查询方法之外,还提供一种查询装置,如图4所示,该查询装置40包括:
[0097]
获取模块41,用于响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;
[0098]
查询模块42,用于在第一表格中查询符合条件文本的至少一行目标文本;
[0099]
第一确定模块43,用于根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;
[0100]
第二确定模块44,用于确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的。
[0101]
在一可选实施例中,获取模块41,具体用于在在第一表格中查询符合条件文本的至少一行目标文本之前,根据查询文本和第二表格,确定新增列的新增列名称以及第一表达式;在第二表格中增加新增列,并建立新增列和第一表达式的对应关系,得到第一表格,其中新增列在第一表格中具有新增列名称。
[0102]
在一可选实施例中,获取模块41,用于通过以下方式生成第一表达式:
[0103]
根据查询文本和新增列名称生成第二表达式;校验第二表达式,并在第二表达式校验通过的情况下,确定第二表达式为第一表达式。
[0104]
在一可选实施例中,获取模块41在根据查询文本和新增列名称生成第二表达式时,具体用于:根据查询文本的语义和新增列名称的语义,确定第二表达式。
[0105]
在一可选实施例中,获取模块41在根据查询文本和新增列名称生成第二表达式时,具体用于:将查询文本和新增列名称输入预先训练的生成模型中进行处理,得到第二表达式。
[0106]
在一可选实施例中,获取模块4在1校验第二表达式时,具体用于校验第二表达式,并在第二表达式校验通过的情况下,确定第二表达式为第一表达式之前,校验第二表达式是否符合预设的表达式规则;若符合,则校验根据第二表达式确定的数据的数据类型与新增列的数据类型是否一致;若一致,确定第二表达式校验通过。
[0107]
在一可选实施例中,新增列具有对应的新增列名称,还包括:改写模块(未示出),用于根据查询文本,在第一表格中查询结果文本之前,若条件文本中包含新增列名称,则根据查询文本的语义改写查询文本,得到新的查询文本。
[0108]
此外,本技术还提供另一种查询装置(未示出),包括:
[0109]
获取模块,用于获取问询文本;
[0110]
发送模块,用于向云端服务器发送问询文本,问询文本用于指示云端服务器将问询文本改写为查询文本;
[0111]
接收模块,用于接收云端服务器发送的结果文本,结果文本是云端服务器根据上述任一项的查询方法确定的。
[0112]
具体实现过程参照上述实施例,在此不再赘述。
[0113]
另外,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
[0114]
图5为本技术示例性实施例提供的一种电子设备的结构示意图。该电子设备用于运行上述查询方法和查询方法。如图5所示,该电子设备包括:存储器54和处理器55。
[0115]
存储器54,用于存储计算机程序,并可被配置为存储其它各种数据以支持在电子设备上的操作。该存储器54可以是对象存储(object storage service,oss)。
[0116]
存储器54可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
[0117]
处理器55,与存储器54耦合,用于执行存储器54中的计算机程序,以用于:响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;在第一表格中查询符合条件文本的至少一行目标文本;根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的。
[0118]
进一步可选地,处理器55在获取第一表格时,具体用于:根据查询文本和第二表格,确定新增列的新增列名称以及第一表达式;在第二表格中增加新增列,并建立新增列和第一表达式的对应关系,得到第一表格,其中新增列在第一表格中具有新增列名称。
[0119]
进一步可选地,处理器55用于通过以下方式生成第一表达式:根据查询文本和新增列名称生成第二表达式;校验第二表达式,并在第二表达式校验通过的情况下,确定第二表达式为第一表达式。
[0120]
在一可选实施例中,处理器55在根据查询文本和新增列名称生成第二表达式时,具体用于:根据查询文本的语义和新增列名称的语义,确定第二表达式。
[0121]
在一可选实施例中,处理器55在根据查询文本和新增列名称生成第二表达式时,具体用于:将查询文本和新增列名称输入预先训练的生成模型中进行处理,得到第二表达式。
[0122]
在一可选实施例中,处理器55在校验第二表达式时,具体用于:校验第二表达式是否符合预设的表达式规则;若符合,则校验根据第二表达式确定的数据的数据类型与新增列的数据类型是否一致;若一致,确定第二表达式校验通过。
[0123]
在一可选实施例中,新增列具有对应的新增列名称,处理器55在根据查询文本,在
第一表格中查询结果文本之前,还用于:若条件文本中包含新增列名称,则根据查询文本的语义改写查询文本,得到新的查询文本。
[0124]
一种可选实施例中,处理器55,与存储器54耦合,用于执行存储器54中的计算机程序,以还用于:获取问询文本;向云端服务器发送问询文本,问询文本用于指示云端服务器将问询文本改写为查询文本;接收云端服务器发送的结果文本,结果文本是云端服务器根据上述任一项的查询方法确定的。
[0125]
进一步,如图5所示,该电子设备还包括:防火墙51、负载均衡器52、通信组件56、电源组件53等其它组件。图5中仅示意性给出部分组件,并不意味着电子设备只包括图5所示组件。
[0126]
相应地,本技术实施例还提供一种存储有计算机程序的计算机可读存储介质,当计算机程序/指令被处理器执行时,致使处理器实现上述所示方法中的步骤。
[0127]
相应地,本技术实施例还提供一种计算机程序产品,包括计算机程序/指令,当计算机程序/指令被处理器执行时,致使处理器实现上述所示方法中的步骤。
[0128]
上述图5中的通信组件被配置为便于通信组件所在设备和其他设备之间有线或无线方式的通信。通信组件所在设备可以接入基于通信标准的无线网络,如wifi,2g、3g、4g/lte、5g等移动通信网络,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关文本。在一个示例性实施例中,通信组件还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
[0129]
上述图5中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。
[0130]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0131]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程文本处理设备的处理器以产生一个机器,使得通过计算机或其他可编程文本处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0132]
这些计算机程序指令也可存储在能引导计算机或其他可编程文本处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0133]
这些计算机程序指令也可装载到计算机或其他可编程文本处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0134]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu和/或gpu)、输入/输出接口、网络接口和内存。
[0135]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0136]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现文本存储。文本可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的文本。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0137]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0138]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:
1.一种查询方法,其特征在于,包括:响应获取到面向第一表格的查询文本,获取所述第一表格,所述查询文本包括选择文本和条件文本,所述第一表格在第二表格的基础上添加有新增列,所述新增列对应有第一表达式,所述第一表达式用于对第二表格中的多行文本归纳分析;在所述第一表格中查询符合所述条件文本的至少一行目标文本;根据所述选择文本,在所述第一表格中确定目标列,所述目标列的列名称与所述选择文本属于同一语义;确定所述至少一行目标文本中,所述目标列对应的目标值为所述查询文本对应的结果文本,其中,所述目标值是根据所述表达式确定的。2.根据权利要求1所述的查询方法,其特征在于,所述获取所述第一表格,包括:根据所述查询文本和所述第二表格,确定所述新增列的新增列名称以及第一表达式;在所述第二表格中增加新增列,并建立所述新增列和第一表达式的对应关系,得到所述第一表格,其中所述新增列在所述第一表格中具有所述新增列名称。3.根据权利要求2所述的查询方法,其特征在于,通过以下方式生成所述第一表达式:根据所述查询文本和所述新增列名称生成第二表达式;校验所述第二表达式,并在所述第二表达式校验通过的情况下,确定所述第二表达式为所述第一表达式。4.根据权利要求3所述的查询方法,其特征在于,所述根据所述查询文本和所述新增列名称生成第二表达式,包括:根据所述查询文本的语义和所述新增列名称的语义,确定所述第二表达式。5.根据权利要求3所述的查询方法,其特征在于,所述根据所述查询文本和所述新增列名称生成第二表达式,包括:将所述查询文本和所述新增列名称输入预先训练的生成模型中进行处理,得到所述第二表达式。6.根据权利要求3至5任一项所述的查询方法,其特征在于,所述校验所述第二表达式,包括:校验所述第二表达式是否符合预设的表达式规则;若符合,则校验根据所述第二表达式确定的数据的数据类型与所述新增列的数据类型是否一致;若一致,确定所述第二表达式校验通过。7.根据权利要求1至5任一项所述的查询方法,其特征在于,所述新增列具有对应的新增列名称,所述根据所述查询文本,在第一表格中查询结果文本之前,还包括:若所述条件文本中包含所述新增列名称,则根据所述查询文本的语义改写所述查询文本,得到新的查询文本。8.一种查询方法,其特征在于,应用于终端设备,所述查询方法包括:获取问询文本;向云端服务器发送所述问询文本,所述问询文本用于指示所述云端服务器将所述问询文本改写为查询文本;接收云端服务器发送的结果文本,所述结果文本是所述云端服务器根据权利要求1至7
任一项所述的查询方法确定的。9.一种查询装置,其特征在于,包括:获取模块,用于响应获取到面向第一表格的查询文本,获取所述第一表格,所述查询文本包括选择文本和条件文本,所述第一表格在第二表格的基础上添加有新增列,所述新增列对应有第一表达式,所述第一表达式用于对第二表格中的多行文本归纳分析;查询模块,用于在所述第一表格中查询符合所述条件文本的至少一行目标文本;第一确定模块,用于根据所述选择文本,在所述第一表格中确定目标列,所述目标列的列名称与所述选择文本属于同一语义;第二确定模块,用于确定所述至少一行目标文本中,所述目标列对应的目标值为所述查询文本对应的结果文本,其中,所述目标值是根据所述表达式确定的。10.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的查询方法。
技术总结
本申请提供一种查询方法、装置及电子设备。该方法包括:响应获取到面向第一表格的查询文本,获取第一表格,查询文本包括选择文本和条件文本,第一表格在第二表格的基础上添加有新增列,新增列对应有第一表达式,第一表达式用于对第二表格中的多行文本归纳分析;在第一表格中查询符合条件文本的至少一行目标文本;根据选择文本,在第一表格中确定目标列,目标列的列名称与选择文本属于同一语义;确定至少一行目标文本中,目标列对应的目标值为查询文本对应的结果文本,其中,目标值是根据表达式确定的,本申请基于用户各种类型的查询文本均可以得到对应的结果文本,提高了表格问答的应用范围。应用范围。应用范围。
技术研发人员:杨旭强 蒋宗亨 罗雪峰
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2023.05.24
技术公布日:2023/8/24
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/