一种基于隐私保护的咨询信息管理方法及系统与流程
未命名
09-18
阅读:77
评论:0

1.本发明属于信息管理技术领域,具体涉及一种基于隐私保护的咨询信息管理方法及系统。
背景技术:
2.随着网络、通信及计算机技术的发展和成熟,越来越多的行业开启线上咨询业务,但是用户在进行线上咨询时,常遇到的问题是信息内容太多,不能快速找到自己所需要的回答,严重影响咨询效率和用户体验。
技术实现要素:
3.本发明为了解决上述问题,提出了一种基于隐私保护的咨询信息管理方法及系统。
4.本发明的技术方案是:一种基于隐私保护的咨询信息管理方法包括以下步骤:
5.s1、获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;
6.s2、对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;
7.s3、根据语义标签值,为加密语义报表匹配对应的咨询回答语句;
8.s4、将加密语义报表和咨询回答语句传输至用户终端。
9.本发明的有益效果是:
10.(1)该咨询信息管理方法通过构建并训练无向有权图,生成实时语义报表,可以形象地反映询问语句的字符情况;
11.(2)该咨询信息管理方法对语义报表进行加密,并生成对应的语义标签值,可以最大程度地保护用户隐私安全,保证咨询语句在传输过程中不被泄露;同时,对语义报表进行拆分,可以大大简化算法流程;
12.(3)该咨询信息管理方法将语义标签值与回答标签值进行大小比较,即可确定最合适且最准确的回答语句,方便用户进行快速多次提问。
13.进一步地,s1包括以下子步骤:
14.s11、获取用户输入的咨询语句,提取咨询语句中的字符,生成字符集合;
15.s12、根据字符集合,构建并训练字符无向有权图;
16.s13、在字符无向有权图中,计算各个节点的字符权重;
17.s14、根据各个节点的字符权重,生成实时语义报表。
18.进一步地,s12中,字符无向有权图g的表达式为:g=(v,e),式中,v表示字符节点的集合,e表示字符间的边集合;
19.s12中,训练字符无向有权图的具体方法为:利用滑动窗口遍历无向有权图的各个节点,使任一节点与其余节点的相似度均小于0.5,完成训练;
20.其中,节点i与节点j的相似度d
ij
的计算公式为:;式中,a
ij
表示节点i与节点j相连的边权值,m表示字符无向有权图的权值矩阵,l
in
表示节点i与除节点j外其余节点相连的边权值,n表示字符无向有权图的节点个数。
21.进一步地,s13中,节点i的字符权重σi的计算公式为:;式中,d
in
表示节点i与其余节点的相似度,n表示字符无向有权图的节点个数。
22.进一步地,s14中,生成实时语义报表的具体方法为:获取报表模板,按照节点的字符权重从大到小的排序,将节点对应的字符填入报表模板中,生成实时语义报表。
23.进一步地,s2包括以下子步骤:
24.s21、利用秘密共享算法对实时语义报表进行加密,生成加密语义报表;
25.s22、将加密语义报表拆分为若干个语义子报表,为各个语义子报表生成对应的密文和随机数;
26.s23、根据语义子报表的密文和随机数,计算各个语义子报表的标签值;
27.s24、将所有语义子报表的标签值均值作为加密语义报表的语义标签值。
28.进一步地,s23中,语义子报表的标签值ω的计算公式为:;式中,c表示语义子报表的随机数,t表示语义子报表的密文,h(
·
)表示碰撞哈希函数运算,xk表示语义子报表中第k个关键词的映射函数值,k表示语义子报表的关键词个数,αk表示语义子报表中第k个关键词的关键词值。
29.进一步地,s3包括以下子步骤:
30.s31、利用lda主题模型获取历史回答语句中的主题语句;
31.s32、计算各个主题语句的回答标签值;
32.s33、将与语义标签值最接近的回答标签值对应的历史回答语句作为咨询回答语句。
33.进一步地,s32中,主题语句的回答标签值λ的计算公式为:;式中,xg表示主题语句中第g个单词的one-hot向量,wg表示主题语句中第g个单词的词频,g表示主题语句的单词个数,ε表示极小值。
34.基于以上方法,本发明还提出一种基于隐私保护的咨询信息管理系统,包括语义报表生成单元、语义标签生成单元和咨询回答语句生成单元;
35.语义报表生成单元用于获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;
36.语义标签生成单元用于对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;
37.咨询回答语句生成单元用于根据语义标签值,为加密语义报表匹配对应的咨询回答语句,并将加密语义报表和咨询回答语句传输至用户终端。
38.本发明的有益效果是:该咨询信息管理系统通过对语义标签值与回答标签值进行大小比较,即可确定最合适且最准确的回答语句,方便用户进行快速多次提问。
附图说明
39.图1为基于隐私保护的咨询信息管理方法的流程图;
40.图2为基于隐私保护的咨询信息管理系统的结构图。
具体实施方式
41.下面结合附图对本发明的实施例作进一步的说明。
42.如图1所示,本发明提供了一种基于隐私保护的咨询信息管理方法,包括以下步骤:
43.s1、获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;
44.s2、对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;
45.s3、根据语义标签值,为加密语义报表匹配对应的咨询回答语句;
46.s4、将加密语义报表和咨询回答语句传输至用户终端。
47.在本发明实施例中,s1包括以下子步骤:
48.s11、获取用户输入的咨询语句,提取咨询语句中的字符,生成字符集合;
49.s12、根据字符集合,构建并训练字符无向有权图;
50.s13、在字符无向有权图中,计算各个节点的字符权重;
51.s14、根据各个节点的字符权重,生成实时语义报表。
52.咨询语句通常由若干个词汇构成,在提取字符时,默认将每个字作为一个字符,得到字符集合。利用任一字符与其他字符的相似度训练无向有权图,可以快速确定无向有权图中各个节点的所有邻接点,完成训练,并根据字符权重的大小顺序,直接将字符填入报表模板,即可生成实时语义报表。
53.在本发明实施例中,s12中,字符无向有权图g的表达式为:g=(v,e),式中,v表示字符节点的集合,e表示字符间的边集合;
54.s12中,训练字符无向有权图的具体方法为:利用滑动窗口遍历无向有权图的各个节点,使任一节点与其余节点的相似度均小于0.5,完成训练;
55.其中,节点i与节点j的相似度d
ij
的计算公式为:;式中,a
ij
表示节点i与节点j相连的边权值,m表示字符无向有权图的权值矩阵,l
in
表示节点i与除节点j外其余节点相连的边权值,n表示字符无向有权图的节点个数。
56.邻接矩阵可以反映无向有权图中各个顶点之间的相邻关系,通过邻接矩阵可以快速确定某一顶点的所有邻接点,因此利用邻接矩阵计算相似度来完成训练。
57.在本发明实施例中,s13中,节点i的字符权重σi的计算公式为:;式中,d
in
表示节点i与其余节点的相似度,n表示字符无向有权图的节点个数。
58.在本发明实施例中,s14中,生成实时语义报表的具体方法为:获取报表模板,按照节点的字符权重从大到小的排序,将节点对应的字符填入报表模板中,生成实时语义报表。
59.报表模板可由用户提前绘制或者使用历史报表。
60.在本发明实施例中,s2包括以下子步骤:
61.s21、利用秘密共享算法对实时语义报表进行加密,生成加密语义报表;
62.s22、将加密语义报表拆分为若干个语义子报表,为各个语义子报表生成对应的密文和随机数;
63.s23、根据语义子报表的密文和随机数,计算各个语义子报表的标签值;
64.s24、将所有语义子报表的标签值均值作为加密语义报表的语义标签值。
65.秘密共享算法:将秘密以适当的方式拆分,拆分后的每一个份额由不同的参与者管理,只有若干个参与者一同协作才能恢复秘密消息。
66.对加密语义报表进行拆分,可得到若干个子报表,在计算标签值时可以避免重复计算多个字符,再直接将所有子报表的标签值均值作为语义标签值即可,大大简化了算法流程。
67.在本发明实施例中,s23中,语义子报表的标签值ω的计算公式为:;式中,c表示语义子报表的随机数,t表示语义子报表的密文,h(
·
)表示碰撞哈希函数运算,xk表示语义子报表中第k个关键词的映射函数值,k表示语义子报表的关键词个数,αk表示语义子报表中第k个关键词的关键词值。
68.关键词可以表达语义子报表的中心内容,利用无监督关键词提取算法提取子报表的关键词。
69.在本发明实施例中,s3包括以下子步骤:
70.s31、利用lda主题模型获取历史回答语句中的主题语句;
71.s32、计算各个主题语句的回答标签值;
72.s33、将与语义标签值最接近的回答标签值对应的历史回答语句作为咨询回答语句。
73.在数据库中存储大量的历史回答语句,将此次咨询语句的语义标签值与历史回答语句进行分析比较,即可确定最合适的回答语句。历史回答语句根据所有历史咨询语句生成,其更全面的涵盖用户的咨询情况,因此进行匹配时更具普适性。
74.lda主题模型用于推测数据库中历史回答语句的主题分布,可以将数据中各个历史回答语句以概率的形式给出主题语句。
75.在本发明实施例中,s32中,主题语句的回答标签值λ的计算公式为:;式中,xg表示主题语句中第g个单词的one-hot向量,wg表示主题语句中第g个单词的词频,g表示主题语句的单词个数,ε表示极小值。
76.基于以上方法,本发明还提出一种基于隐私保护的咨询信息管理系统,如图2所示,包括语义报表生成单元、语义标签生成单元和咨询回答语句生成单元;
77.语义报表生成单元用于获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;
78.语义标签生成单元用于对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;
79.咨询回答语句生成单元用于根据语义标签值,为加密语义报表匹配对应的咨询回
答语句,并将加密语义报表和咨询回答语句传输至用户终端。
80.本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
技术特征:
1.一种基于隐私保护的咨询信息管理方法,其特征在于,包括以下步骤:s1、获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;s2、对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;s3、根据语义标签值,为加密语义报表匹配对应的咨询回答语句;s4、将加密语义报表和咨询回答语句传输至用户终端。2.根据权利要求1所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s1包括以下子步骤:s11、获取用户输入的咨询语句,提取咨询语句中的字符,生成字符集合;s12、根据字符集合,构建并训练字符无向有权图;s13、在字符无向有权图中,计算各个节点的字符权重;s14、根据各个节点的字符权重,生成实时语义报表。3.根据权利要求2所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s12中,字符无向有权图g的表达式为:g=(v,e),式中,v表示字符节点的集合,e表示字符间的边集合;所述s12中,训练字符无向有权图的具体方法为:利用滑动窗口遍历无向有权图的各个节点,使任一节点与其余节点的相似度均小于0.5,完成训练;其中,节点i与节点j的相似度d
ij
的计算公式为:;式中,a
ij
表示节点i与节点j相连的边权值,m表示字符无向有权图的权值矩阵,l
in
表示节点i与除节点j外其余节点相连的边权值,n表示字符无向有权图的节点个数。4.根据权利要求2所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s13中,节点i的字符权重σ
i
的计算公式为:;式中,d
in
表示节点i与其余节点的相似度,n表示字符无向有权图的节点个数。5.根据权利要求2所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s14中,生成实时语义报表的具体方法为:获取报表模板,按照节点的字符权重从大到小的排序,将节点对应的字符填入报表模板中,生成实时语义报表。6.根据权利要求1所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s2包括以下子步骤:s21、利用秘密共享算法对实时语义报表进行加密,生成加密语义报表;s22、将加密语义报表拆分为若干个语义子报表,为各个语义子报表生成对应的密文和随机数;s23、根据语义子报表的密文和随机数,计算各个语义子报表的标签值;s24、将所有语义子报表的标签值均值作为加密语义报表的语义标签值。7.根据权利要求6所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s23中,语义子报表的标签值ω的计算公式为:;式中,c表示语义子报表的随机数,t表示语义子报表的密文,h(
·
)表示碰撞哈希函数运算,x
k
表示语义子报表中第k个关键词的映射
函数值,k表示语义子报表的关键词个数,α
k
表示语义子报表中第k个关键词的关键词值。8.根据权利要求1所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s3包括以下子步骤:s31、利用lda主题模型获取历史回答语句中的主题语句;s32、计算各个主题语句的回答标签值;s33、将与语义标签值最接近的回答标签值对应的历史回答语句作为咨询回答语句。9.根据权利要求8所述的基于隐私保护的咨询信息管理方法,其特征在于,所述s32中,主题语句的回答标签值λ的计算公式为:;式中,x
g
表示主题语句中第g个单词的one-hot向量,w
g
表示主题语句中第g个单词的词频,g表示主题语句的单词个数,ε表示极小值。10.一种基于隐私保护的咨询信息管理系统,其特征在于,包括语义报表生成单元、语义标签生成单元和咨询回答语句生成单元;所述语义报表生成单元用于获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;所述语义标签生成单元用于对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;所述咨询回答语句生成单元用于根据语义标签值,为加密语义报表匹配对应的咨询回答语句,并将加密语义报表和咨询回答语句传输至用户终端。
技术总结
本发明公开了一种基于隐私保护的咨询信息管理方法及系统,属于信息管理技术领域,其方法包括以下步骤:S1、获取用户输入的咨询语句,并根据咨询语句生成实时语义报表;S2、对实时语义报表进行加密,生成加密语义报表,并为加密语义报表生成语义标签值;S3、根据语义标签值,为加密语义报表匹配对应的咨询回答语句;S4、将加密语义报表和咨询回答语句传输至用户终端。该咨询信息管理方法将语义标签值与回答标签值进行大小比较,即可确定最合适且最准确的回答语句,方便用户进行快速多次提问。方便用户进行快速多次提问。方便用户进行快速多次提问。
技术研发人员:陈刚 岳佳琦 杨帆 石慧馨 苑泽标 刘天威 武桂羽 孙涛
受保护的技术使用者:中联神帆(北京)科技有限公司
技术研发日:2023.08.18
技术公布日:2023/9/16
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/