一种基于服务事项要素的智能问答方法与流程
未命名
09-16
阅读:126
评论:0

1.本发明涉及智能问答技术领域,特别涉及一种基于服务事项要素的智能问答方法。
背景技术:
2.近年来,大力推进的互联网+政务服务,取得显著成效,对便利企业和群众办事发挥了重要作用。由于政务领域办事比较依赖人工,不仅工作量大,而且重复性高。因此如何准确定位具体办事事项返回给用户相关信息,减轻人工问答压力,提高办事效率,方便用户快速了解政务办事事项是非常必要的。
3.随着大数据和人工智能的快速发展,政务服务的治理变革迎来了重大机遇和全新途径。智能问答系统作为人工智能中的一个典型应用,因其实时对话、高效便捷、突破时空限制等优势,在实际应用中已取得一定成效,并且具有巨大的应用前景。
4.但是,在已开通的问答机器人中,除少数地区的政务服务网站问答机器人的答复质量较高外,绝大多数问答机器人的答复内容质量较低,往往“答非所问”,后台缺乏全面系统的信息资源梳理,没有将信息资源转化为知识,难以满足用户需求。
5.基于上述情况,本发明提出了一种基于服务事项要素的智能问答方法。
技术实现要素:
6.本发明为了弥补现有技术的缺陷,提供了一种简单高效的基于服务事项要素的智能问答方法。
7.本发明是通过如下技术方案实现的:
8.一种基于服务事项要素的智能问答方法,其特征在于:包括以下步骤:
9.步骤s1、基于历史语料的《问题,答案》对模型提炼;
10.筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;
11.步骤s2、基于问题模型的意图识别机器学习;
12.从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;
13.步骤s3、基于用户意图的数据检索;
14.对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;
15.步骤s4、基于问答模型的答案生成;
16.将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组合,形成便于用户理解的口语化表达;
17.最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题
进行解答。
18.所述步骤s1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。
19.所述步骤s1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。
20.所述步骤s2中,利用自然语言理解nlu的分词器tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。
21.所述步骤s2中,利用实体抽取器抽取特定类型的实体,利用意图分类器classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。
22.所述步骤s2中,实体抽取器包括但不限于mitie实体抽取器、spacy实体抽取器和crf实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。
23.所述步骤s3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;
24.再根据用户意图中包含的事项要素(如申请材料、是否收费、办理地点、办理流程等)确定对应的关联表;
25.最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
26.一种基于服务事项要素的智能问答设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
27.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
28.本发明的有益效果是:该基于服务事项要素的智能问答方法,可以利用生成模型自动、实时生成政务服务事项问答知识,避免了政务服务事项数据带来的不便,降低了人力、时间成本,保证了知识有效性及问答精准度。
附图说明
29.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
30.附图1为本发明基于服务事项要素的智能问答方法实现方法示意图。
具体实施方式
31.为了使本技术领域的人员更好的理解本发明中的技术方案,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚,完整的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员
在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
32.政务服务领域的智能问答核心是政务服务事项,政务服务事项数以千、万计,每个事项的要素信息多达数十甚至百余个,办事群众和企业在办事咨询时涉及的信息覆盖面较广,通过人工梳理根据政务服务事项要素生成《问题,答案》对用户问题进行解答的方式,一方面工作量巨大造成资源的浪费且效率低下,一方面由于政务服务事项的更新频率较高问答对的更新存在困难不够灵活。
33.该基于服务事项要素的智能问答方法,包括以下步骤:
34.步骤s1、基于历史语料的《问题,答案》对模型提炼;
35.筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;
36.所述步骤s1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。
37.所述步骤s1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。
38.示例如下:
39.表1历史问答语料分析与总结示例
40.[0041][0042]
步骤s2、基于问题模型的意图识别机器学习;
[0043]
从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;
[0044]
所述步骤s2中,利用自然语言理解nlu的分词器tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。
[0045]
所述步骤s2中,利用实体抽取器抽取特定类型的实体,利用意图分类器classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。
[0046]
所述步骤s2中,实体抽取器包括但不限于mitie实体抽取器、spacy实体抽取器和crf实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。
[0047]
步骤s3、基于用户意图的数据检索;
[0048]
对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;
[0049]
所述步骤s3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;
[0050]
再根据用户意图中包含的事项要素(如申请材料、是否收费、办理地点、办理流程等)确定对应的关联表;
[0051]
最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
[0052]
步骤s4、基于问答模型的答案生成;
[0053]
将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组
合,形成便于用户理解的口语化表达;
[0054]
最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题进行解答。
[0055]
该基于服务事项要素的智能问答设备,包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现上述的方法步骤。
[0056]
该可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
[0057]
以上所述的实施例,只是本发明具体实施方式的一种,本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。
技术特征:
1.一种基于服务事项要素的智能问答方法,其特征在于:包括以下步骤:步骤s1、基于历史语料的<问题,答案>对模型提炼;筛选出政务服务中的高频使用字段,并对包含高频使用字段的历史问答语料进行分析和总结,获取问答模型;步骤s2、基于问题模型的意图识别机器学习;从历史问答语料中提炼出问答模型后,通过深度学习的方式对意图识别算法进行训练;先对问答模型进行分词和特征化处理,以便计算机理解;再抽取实体,最后对用户输入的问题类型进行分类;步骤s3、基于用户意图的数据检索;对意图识别得出的问题类型进行判断,若问题属于政务服务事项类问题,则选择政务服务事项库作为答案数据来源,获取事项要素值;否则,确定并输出关联表;步骤s4、基于问答模型的答案生成;将获取的事项要素值导入答案模型,按照问答模型中对应的要素位置进行排列组合,形成便于用户理解的口语化表达;最后,将得到的包含事项要素信息的句子作为答案发送给用户,用于对用户问题进行解答。2.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s1中,高频使用字段是指政务服务事项要素中在用户问题中使用频率高于自定义阈值的字段,包括但不限于事项名称、设定依据、实施主体、法定办结时限、受理条件、办理流程、办理进程查询途径、办理时间、办理地点、是否收费、收费依据以及材料名称。3.根据权利要求2所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s1中,对包含高频使用字段的政务服务领域历史问答语料进行分析,结合智能问答意图识别算法所需要的语料特征,总结问题及问答模型。4.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s2中,利用自然语言理解nlu的分词器tokenizer对问答模型中语话逐一进行分词处理,将得到的分词标志tokens进行特征化,并将词语特征化转换成数字编码,以便计算机理解用户输入的问题语句。5.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s2中,利用实体抽取器抽取特定类型的实体,利用意图分类器classifier理解用户输入的整个问题语句的意图,并对用户意图进行分类,得到问题类型。6.根据权利要求5所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s2中,实体抽取器包括但不限于mitie实体抽取器、spacy实体抽取器和crf实体抽取器,综合利用上述实体抽取器抽取特定类型的实体。7.根据权利要求1所述的基于服务事项要素的智能问答方法,其特征在于:所述步骤s3中,首先根据用户意图中的政务服务事项名称实体在基本信息表中确定对应的政务服务事项,获取其关联信息项的值;再根据用户意图中包含的事项要素确定对应的关联表;最后,利用从基本信息表中获取的关联信息定位到事项在关联表中的值,作为答案生成的素材。
8.一种基于服务事项要素的智能问答设备,其特征在于:包括存储器和处理器;所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序时实现如权利要求1至7任意一项所述的方法步骤。9.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述的方法步骤。
技术总结
本发明特别涉及一种基于服务事项要素的智能问答方法。该基于服务事项要素的智能问答方法,先基于历史语料的<问题,答案>对模型提炼,再基于问题模型的意图识别机器学习,基于用户意图的数据检索,最后基于问答模型生成答案。该基于服务事项要素的智能问答方法,可以利用生成模型自动、实时生成政务服务事项问答知识,避免了政务服务事项数据带来的不便,降低了人力、时间成本,保证了知识有效性及问答精准度。精准度。精准度。
技术研发人员:代学彬 李娟 吴俊雄 杨春蕾
受保护的技术使用者:浪潮软件股份有限公司
技术研发日:2023.01.13
技术公布日:2023/9/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/