一种用于司法类案匹配的因果表征学习框架
未命名
08-12
阅读:77
评论:0

1.本发明涉及人工智能技术领域,尤其涉及一种用于司法类案匹配的因果表征学习框架。
背景技术:
2.法律案件匹配在智能法律系统中发挥着重要作用。例如,在法律案件检索中,匹配模型有助于系统确定查询案件和候选案件之间的相关性。传统上,该任务被形式化为在语义级别上匹配两个长篇文本文档。一些通用文档匹配模型已经被用来解决这个问题,包括启发式方法,基于网络的方法和基于文本的方法。以上方案虽然有效,但仍有改进的空间,仅将法律案件视为一般的长篇文本文档有一个显著的问题,即:法律案件通常引用一些法律条文(法律条文是法规或书面法律的基础,通常由司法机关颁布(例如中国刑法))。这些法律条文是由法官从法律文书(例如中国刑法)中选出的,并提供了法律案件的背景和判决的重要知识。现有的研究表明,法律条文对许多与法律相关的任务有益。通常情况下,关键构成要素和关键情况为两个法律案件的匹配提供重要信号。关键构成要素是根据某些法律条款编写的高度概括的文本。另一方面,关键情况是详细的事实描述,通常在案件之间非常不同。它们与任何法律条款没有直接关系。因此,法律条款可以帮助匹配模型识别和分解这些关键信息。
3.法律案例匹配可以通过手动知识工程(ke)来解决。这些方法包括布尔搜索技术和手动分类。随着自然语言处理(nlp)的发展,深度学习已被应用于实现法律案例的语义级匹配。这些研究可以分为基于网络和基于文本的方法。基于网络的方法是针对普通法的,使用不同案例的引用来构建先例引用网络(pcnet)。例如使用基于pcnet的jaccard相似性来推断匹配的法律案例的相似性;使用node2vec将图的节点映射到向量空间,然后计算法律案例的余弦相似性。
4.近些年来,基于文本的方法计算法律案例之间的语义相似度。如利用bert在段落级别捕获语义关系,然后通过聚合段落级交互来推断两个案例之间的相关性;基于longformer的预训练语言模型,以获得长篇法律文件的更好表示;三阶段可解释的法律案例匹配模型等。
5.现有方法仅将法律案件视为一般的长篇文本文档有一个显著的问题,即:法律案件通常引用一些法律条文(法律条文是法规或书面法律的基础,通常由司法机关颁布(例如中国刑法))。这些法律条文是由法官从法律文书(例如中国刑法)中选出的,并提供了法律案件的背景和判决的重要知识,然而现有的方法并没有考虑到法条对类案匹配的重要作用。
技术实现要素:
6.为此,本发明首先提出一种用于司法类案匹配的因果表征学习框架,采用基于工具变量回归的因果表征学习框架,首先通过处理变量分解模块,采用两个架构相同
treatment重构模块分别处理源案例x和目标案例y,分别输出重建的嵌入向量e
re
(x)和e
re
(y),生成法律条文对于法律案件的直接因果效应,分别得到拟合部分和残差部分,之后采用处理变量重构模块,将拟合部分和残差部分通过注意权重重新组合在一起,最后通过下游应用模块,将每个输入文档表示为向量,并根据表示预测匹配得分,匹配得分可以用来指导类案检索系统对相关文档进行排序。
7.所述输出重建的嵌入向量e
re
(x)和e
re
(y)的具体方法为:首先使用预训练语言模型(bert)对文本进行编码,得到法律条文嵌入e(lx)与e(ly),以及法律案例嵌入e(x)和e(y),均为长度为n的向量。考虑到工具变量需要对处理变量有影响,并且通过处理变量中介影响输出结果,定义工具变量为e(l
x
)和e(ly),对输入法律案例x和y在因果图中分别是两个处理变量,分别表示为它们的嵌入e(x)和e(y),通过所述工具变量对e(x)与e(y)进行分解,得到拟合部分得到拟合部分以及残差部分
8.其中拟合部分可以通过如下方式计算:
9.其中将法律条文的向量空间映射到法律条文的向量空间,输入的cs(l
x
,ly)是e(l
x
)e(ly)的线性组合:cs(l
x
,ly)=ws·
e(l
x
)+(1-ws)
·
e(ly)
10.其中:
[0011][0012]
w与v是可学习的参数,代表了法律条文与法律文本的中介效应变量,
[0013]
得到拟合部分后,计算残差部分其中代表法律条文对于法律案件的直接因果效应。
[0014]
其中拟合部分通过如下方式计算:
[0015]
其中将法律条文的向量空间映射到法律条文的向量空间,输入的c
t
(l
x
,ly)是e(l
x
)e(ly)的线性组合:c
t
(l
x
,ly)=w
t
·
e(ly)+(1-w
t
)
·
e(l
x
)
[0016]
其中:
[0017][0018][0019]
w与v是可学习的参数,代表了法律条文与法律文本的中介效应变量,
[0020]
得到拟合部分后,计算残差部分其中代表法律条文对于法律案件的直接因果效应。
[0021]
所述处理变量重构模块的实现方式为:对于源案例和目标案例,把拟合部分和残差部分组合得到新的处理变量:差部分组合得到新的处理变量:
[0022]
其中αs∈[0,1]代表的权重:
[0023]
α
t
∈[0,1]代表的权重:
[0024]
与表示采用两层mlp将拟合和残差部分作为输入和输出的实值,σ表示sigmoid函数。
[0025]
所述下游应用模块的实现方式为,给定一对司法案例(x,y),两个处理变量重建模块分别输出重建的向量e
re
(x)和e
re
(y),得到x,y之间的匹配分数:
[0026][0027]
其中f
pred
可以是任意的匹配模型。
[0028]
本发明所要实现的技术效果在于:
[0029]
本发明提出了一种新颖的模型无关因果学习框架,以合理的方式将法律条文引入到法律案例匹配的过程中。采用回归方法,通过将法律条文视为工具变量,将法律案例视为处理变量,从而将中介效应和直接效应从法律案例中分解出来。
附图说明
[0030]
图1原始类案匹配因果图;
[0031]
图2工具变量解耦类案匹配因果图;
[0032]
图3law-match模型整体框架;
[0033]
图4elam,lecard,ecail数据上的实验结果
具体实施方式
[0034]
以下是本发明的优选实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于此实施例。
[0035]
本发明提出了一种用于司法类案匹配的因果表征学习框架。
[0036]
首先定义因果图的构建,采用多元因果图来形式化法律案件匹配。根据图1、2所示,两个输入法律案例x和y在因果图中分别是两个处理变量,分别表示为它们的嵌入e(x)和e(y)。结果变量z是匹配标签。因为预测是基于x和y之间的匹配信号,所以e(x)和z(路径e(x)
→
z)以及e(y)
→
z之间存在关联。
[0037]
根据观察表明,法律案件中的关键组成部分通常与引用的法律条文高度相关,而关键情况则不相关。在因果上,匹配标签沿着两条路径决定,包括法律条文的中介效应和关键情况的直接效应。更具体地,关键组成部分中介效应导致法律条文对匹配标签的影响,而关键情况对匹配标签有直接影响。因此,e(x)
→
z和e(y)
→
z之间的关联是两种不同类型因果路径的混合,即由中介效应引起的与法律相关的关联和由直接效应引起的与法律无关的关联。
[0038]
之后构建基于工具变量回归的因果表征学习框架:
[0039]
如图3左侧所示,law-match采用两个treatment重构模块来处理源案例x和目标案例y,分别输出重建的嵌入向量e
re
(x)和e
re
(y)。这两个模块共享相同的网络架构,但具有不同的参数。e
re
(x)可以通过以下方法得到,首先将e(x)回归到工具变量(ivs)e(l
x
)和e(ly)上,得到拟合部分和残差部分。我们称这个阶段为处理变量分解。然后,这两个部分将通过注意权重重新组合在一起,称为处理变量重建。
[0040]
对于处理变量分解模块的构建:我们使用e(l
x
)以及e(ly)作为工具变量对e(x)与e(y)进行分解,得到拟合部分以及残差部分具体来讲,可以通过如下方式计算:
[0041][0042][0043]
其中将法律条文的向量空间映射到法律条文的向量空间,输入的cs(l
x
,ly)(c
t
(l
x
,ly))是e(l
x
)e(ly)的线性组合:
[0044]cs
(l
x
,ly)=ws·
e(l
x
)+(1-ws)
·
e(ly)
[0045]ct
(l
x
,ly)=w
t
·
e(l
x
)+(1-w
t
)
·
e(ly)
[0046]
其中:
[0047][0048][0049][0050][0051]
其中w与v是可学习的参数,代表了法律条文与法律文本的中介效应变量。
[0052]
得到后,我们可以通过以下方法得到
[0053][0054][0055]
代表法律条文对于法律案件的直接因果效应。
[0056]
对于处理变量重构模块的过程:拟合部分和残差部分组合得到新的处理变量:
[0057]
其中αs∈[0,1]代表的权重:
[0058]
α
t
∈[0,1]代表的权重:
[0059]
与表示采用两层mlp将拟合和残差部分作为输入和输出的实值,σ表示sigmoid函数。
[0060]
对于下游应用模块的构建方式:许多类案匹配模型都具有类似的结构,我们将其称为基础模型。基础模型将每个输入文档表示为向量,并根据表示预测匹配得分。law-match是一个与模型无关的框架,在现有的文档匹配模型上实现,这些模型通过将重构的处理提供给匹配模型实现匹配。
[0061]
具体来讲,给定一对司法案例(x,y),两个处理变量重建模块分别输出重建的向量ere
(x)和e
re
(y)。最终我们可以得到x,y之间的匹配分数:
[0062][0063]
其中f
pred
可以是任意的匹配模型,例如sentence-bert、lawformer、bert-pli、iot-match等。
[0064]
模型的数据集使用elam,ecail和lecard三个数据集。
[0065]
elam是一个可解释的法律案件匹配数据集。它包含1250个源法律案件,每个与四个目标案件相关。每一个案件对的匹配的标签是匹配(2)、部分匹配(1)或不匹配(0)。
[0066]
ecail是cail(法律人工智能挑战赛)2021数据集的扩展。在cail数据中,每个法律案例都与有关私人借贷的标签相关联。遵循[9]中的实践,我们构建了1875个源案例,每个源案例都与四个目标案例相关联。根据重叠标签的数量,每个法律案例对都被分配一个匹配标签(如果重叠》10,则匹配;如果《1,则不匹配;否则部分匹配)。
[0067]
lecard是一个法律案例检索数据集,包含107个源(查询)案例和43,000个目标案例。所有刑事案件均由中国最高人民法院公布。对于每个查询,手动标注了30个目标案例,每个案例分配了4个级别的相关性(匹配)标签。
[0068]
对于评估指标,使用准确度、宏精度、宏召回率和宏f1来衡量匹配的准确性。
技术特征:
1.一种用于司法类案匹配的因果表征学习框架,其特征在于:采用基于工具变量回归的因果表征学习框架,首先通过处理变量分解模块,采用两个架构相同treatment重构模块分别处理源案例x和目标案例y,分别输出重建的嵌入向量e
re
(x)和e
re
(y),生成法律条文对于法律案件的直接因果效应,分别得到拟合部分和残差部分,之后采用处理变量重构模块,将拟合部分和残差部分通过注意权重重新组合在一起,最后通过下游应用模块,将每个输入文档表示为向量,并根据表示预测匹配得分,匹配得分用于对类案检索系统对相关文档进行排序。2.如权利要求1所述的一种用于司法类案匹配的因果表征学习框架,其特征在于:所述输出重建的嵌入向量e
re
(x)和e
re
(y)的具体方法为:首先使用预训练语言模型对文本进行编码,得到法律条文嵌入e(l
x
)与e(l
y
),以及法律案例嵌入e(x)和e(y),均为长度为n的向量,定义工具变量e(l
x
)和e(l
y
),对输入法律案例x和y在因果图中分别是两个处理变量,分别表示为它们的嵌入e(x)和e(y),通过所述工具变量对e(x)与e(y)进行分解,得到拟合部分以及残差部分其中拟合部分通过如下方式计算:其中将法律条文的向量空间映射到法律条文的向量空间,输入的c
s
(l
x
,l
y
)是e(l
x
)e(l
y
)的线性组合:c
s
(l
x
,l
y
)=w
s
·
e(l
x
)+(1-w
s
)
·
e(l
y
)其中:其中:w与v是可学习的参数,代表了法律条文与法律文本的中介效应变量,得到拟合部分后,计算残差部分其中代表法律条文对于法律案件的直接因果效应;其中拟合部分通过如下方式计算:其中将法律条文的向量空间映射到法律条文的向量空间,输入的c
t
(l
x
,l
y
)是e(l
x
)e(l
y
)的线性组合:c
t
(l
x
,l
y
)=w
t
·
e(l
y
)+(1-w
t
)
·
e(l
x
)其中:其中:w与v是可学习的参数,代表了法律条文与法律文本的中介效应变量,得到拟合部分后,计算残差部分其中代表法律条文对于法律案件的直接因果效应。3.如权利要求1所述的一种用于司法类案匹配的因果表征学习框架,其特征在于:所述处理变量重构模块的实现方式为:对于源案例和目标案例,把拟合部分和残差部分组合得到新的处理变量:到新的处理变量:
其中α
s
∈[0,1]代表的权重:α
t
∈[0,1]代表的权重:的权重:与表示采用两层mlp将拟合和残差部分作为输入和输出的实值,σ表示sigmoid函数。4.如权利要求1所述的一种用于司法类案匹配的因果表征学习框架,其特征在于:所述下游应用模块的实现方式为,给定一对司法案例(x,y),两个处理变量重建模块分别输出重建的向量e
re
(x)和e
re
(y),得到x,y之间的匹配分数:其中f
pred
可以是任意的匹配模型。
技术总结
本发明通过人工智能领域的方法,实现了一种用于司法类案匹配的因果表征学习框架。采用基于工具变量回归的因果表征学习框架,首先通过处理变量分解模块,采用两个架构相同treatment重构模块分别处理源案例和目标案例,分别输出重建的嵌入向量,生成法律条文对于法律案件的直接因果效应,分别得到拟合部分和残差部分,之后采用处理变量重构模块,将拟合部分和残差部分通过注意权重重新组合在一起,最后通过下游应用模块,将每个输入文档表示为向量,并根据表示预测匹配得分。本发明提供的方法以合理的方式将法律条文引入到法律案例匹配的过程中,通过将法律条文视为工具变量,将法律案例视为处理变量,从而将中介效应和直接效应从法律案例中分解出来。和直接效应从法律案例中分解出来。和直接效应从法律案例中分解出来。
技术研发人员:徐君 孙忠祥 宋阳秋 张骁 文继荣
受保护的技术使用者:中国人民大学
技术研发日:2023.04.26
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:现有船用发动机的结构改造方法和改造的船用发动机 下一篇:昆明假单胞菌及其应用