一种试卷对比方法、装置、设备及存储介质与流程
未命名
08-05
阅读:97
评论:0

1.本公开涉及计算机技术领域,尤其涉及一种试卷对比方法、装置、设备及存储介质。
背景技术:
2.试卷题库囊括了海量的试卷,为用户搜索试卷进行学习提供了极大的便利。并且,为了提高试卷题库的丰富性,试卷题库还会不断收录新的试卷。在将待收录试卷收录进试卷题库之前需要对待收录试卷进行试卷排重,即检测试卷题库中是否已收录相同的试卷,在该过程中需要将待收录试卷与试卷题库中的每个试卷进行对比,因此需要重复进行多次对两个试卷进行对比的操作。
3.目前,通常通过如下两种试卷对比方法对两个试卷进行对比。第一种是,对比两个试卷的试卷名称,若两个试卷的试卷名称相同则认为是相同试卷,否则认为是不同试卷。第二种是,对比两个试卷中的试题内容(即试卷中试题对应的文本),若两个试卷的试题内容相同则认为是相同试卷,否则认为是不同试卷。但是,采用第一种试卷对比方法进行试卷排重时的准确性较差,采用第二种试卷对比方法进行试卷排重时工作量较大,耗时较长。
技术实现要素:
4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种试卷对比方法、装置、设备及存储介质。
5.根据本公开的一方面,提供了一种试卷对比方法,包括:
6.获取第一试卷;
7.确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;
8.根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。
9.根据本公开的另一方面,提供了一种试卷对比装置,包括:
10.第一获取模块,用于获取第一试卷;
11.第一确定模块,用于确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;
12.第二确定模块,用于根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。
13.根据本公开的另一方面,提供了一种电子设备,所述电子设备包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据上述试卷对比方法。
14.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述试卷对比方法。
15.本公开实施例提供的试卷对比方法,能够获取第一试卷;确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。应用本公开实施例提供的试卷对比方法进行试卷排重,准确性较高且耗时较少。
附图说明
16.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
17.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
18.图1是本公开实施例提供的一种试卷对比方法的流程图;
19.图2是本公开实施例提供的一种试卷的示意图;
20.图3是本公开实施例提供的一种采用扫描框滑动试题内容所占用区域的示意图;
21.图4是本公开实施例提供的另一种试卷的示意图;
22.图5是对图4所示的试卷进行颜色分离的逻辑示意图;
23.图6是本公开实施例提供的另一种试卷对比方法的流程图;
24.图7为本公开实施例提供的试卷对比装置的结构示意图;
25.图8为本公开实施例提供的电子设备的结构示意图。
具体实施方式
26.为了能够更清楚地理解本公开的上述目的、特征和优点,下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
27.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
28.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
29.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
30.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
31.申请人通过对相关技术提供的两种试卷对比方法进行研究发现,该两种试卷对比方法均存在缺陷。具体地,对于基于试卷名称来对比的试卷对比方法,由于行业内试卷的命名方式基本上是这样拼装的:学年+省+市+区+学校(选)+年级+上/下+类型(期中/期末/自考/
……
)+科目+试卷+备注(五四学制),但是在具体的文字上会有不同,比如针对“市”,有的写xx市,有的只写xx不写市字,针对“类型”,有的写上学期,有的写(上),所以根据试卷名称来对比的话,会有分词和对比的工作量,并且误差较大,准确性低,因此,采用基于试卷名称来对比的试卷对比方法进行试卷排重准确性较低。对于基于试题内容来对比的试卷对比方法,首先,需要将试卷进行光学字符识别(optical character recognition,ocr),识别出试题1、试题2、试题3、
……
,然后将两个试卷逐题进行对比,即对比两个试卷的试题1(即试题1的文本)、对比两个试卷的试题2(即试题2的文本)、对比两个试卷的试题3(即试题3的文本)、
……
,如果两个试卷的试题相同并且试题顺序相同,就认为是相同试卷。但是,因为涉及到逐题进行试题对比,耗时较长,因此,采用基于试题内容来对比的试卷对比方法进行试卷排重,无法做到实时对比排重。如果只对比前几道题,只要前几道题的试题和顺序相同就认为是相同试卷,依然耗费了较长时间,此外,误差还比较大,准确性也不高。
32.有鉴于此,本公开提供了一种试卷对比方法、装置、设备及存储介质。下面,首先对本公开提供的试卷对比方法进行说明。
33.图1是本公开实施例提供的一种试卷对比方法的流程图,该方法可以由一种电子设备来执行。该电子设备可以示例性的理解为诸如手机、平板电脑、笔记本电脑、台式机、智能电视等设备。如图1所示,本实施例提供的方法包括如下步骤:
34.s110、获取第一试卷。
35.具体地,第一试卷可以为任意试卷。
36.例如,从应用场景来看,在一种应用场景中第一试卷可以为待收录进试卷题库的试卷,但并不限限于此。又例如,从试卷的文本格式来看,第一试卷的格式可以包括word、pdf、图片等,但并不限于此。再例如,从试题内容的类型来看,第一试卷的试题内容可以包括文字和/或附图等,但并不限于此。再例如,从试卷来源来看,第一试卷的来源可以包括网上下载、图像扫描、本地存储读取等,但并不限于此。
37.s120、确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值。
38.在本公开实施例中,考虑到试卷中对学生学习起作用的是试题内容,而非试题内容之外的试卷名称、备注等,因此,在对比两个试卷是否相同时应当将对比重点放在试题内容上。进一步地,考虑到直接对比试题内容本身工作量较大,耗费时间长,因此,可以不直接对试题内容本身进行对比,而是对比两个试卷的试题属性值,因此,需要确定第一试卷中各试题的试题属性值。
39.具体地,目标值为与试题内容所占区域相关的数值,其可以包括面积、像素数量、字符数量、文本行数量等,但并不限于此。
40.在一些实施例中,试题属性值用于表征试题内容所占用区域的目标值,可以包括:将第一试卷输入试题属性值生成模型,得到试题属性值生成模型输出的第一试卷中各试题的试题属性值,其中,试题属性值生成模型预先由样本试卷以及样本试卷中各试题的试题属性值训练完成。但并不限于此。
41.s130、根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。
42.具体地,第二试卷可以为任意试卷。
43.例如,从应用场景来看,在一种应用场景中第二试卷可以为试卷题库中的试卷,但并不限于此。从试卷的文本格式、试题内容的类型、试卷来源来看,与第一试卷类似,此处不再赘述。
44.具体地,在s130之前,还可以确定第二试卷中各试题的试题属性值。例如,可以采用与“确定第一试卷中各试题的试题属性值”类似的方式确定第二试卷中各试题的试题属性值。又例如,第二试卷中各试题的试题属性值已预先存储在预设存储模块中,比如预先存储在试卷题库中,则可以通过读取预设存储模块来获取第二试卷中各试题的试题属性值,如此,可快速获取第二试卷中各试题的试题属性值,缩短第一试卷和第二试卷的对比耗时。
45.在一些实施例中,s130可以包括:将第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,若不满足第一预设条件,则确定第一试卷和第二试卷为不同试卷,若满足第一预设条件,则确定第一试卷和第二试卷为相同试卷。
46.具体地,第一预设条件可以包括第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和相同。但并不限于此。
47.相应地,对第一试卷进行排重的过程可以如下:获取第一试卷;确定第一试卷中各试题的试题属性值;进行对比:针对试题题库中的每个第二试卷,将第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,若第一试卷中各试题的试题属性值之和与每个第二试卷中各试题的试题属性值之和均不同,则确定试题题库中不存在与第一试卷相同的试卷,否则确定试题题库中存在与第一试卷相同的试卷。
48.可以理解的是,由于试卷中各试题的试题属性值之和的对比为数值对比,相比于试题内容本身对比,数值对比工作量很小,因此,应用本公开实施提供的试卷对比方法进行排重,可大大减少对比工作量,从而大大缩短耗时。
49.当然,在另一些实施例中,为了提高准确性,还可以在第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和相同时,将第一试卷中各试题的试题内容和第二试卷中各试题的试题内容进行比较,若第一试卷中各试题的试题内容和第二试卷中各试题的试题内容相同,则确定第一试卷和第二试卷为相同试卷,否则确定第一试卷和第二试卷为不同试卷。
50.相应地,对第一试卷进行排重的过程可以如下:获取第一试卷;确定第一试卷中各试题的试题属性值;进行第一次对比:针对试题题库中的每个第二试卷,将第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,若第一试卷中各试题的试题属性值之和和每个中各试题的试题属性值之和均不同,则确定试题题库中不存在与第一试卷相同的试卷;若第一试卷中各试题的试题属性值之和和至少一个第二试卷中各试题的试题属性值之和相同,进行第二次对比:将与第一试卷中各试题的试题属性值之和相同的第二试卷作为第三试卷,并针对每个第三试卷,将第一试卷中各试题的试题内容和第三试卷中各试题的试题内容进行比较,若第一试卷中各试题的试题内容和每个第三试卷中各试题的试题内容均不同,则确定试题题库中不存在与第一试卷相同的试卷,否则确定试题题库中存在与第一试卷相同的试卷。
51.可以理解的是,即使存在与第一试卷中各试题的试题属性值之和相同的第三试卷,继续将第一试卷中各试题的试题内容和第三试卷中各试题的试题内容进行对比,仍旧可以减少排重过程中的工作量,原因在于:在第一次对比时,是基于试卷中各试题的试题属性值之和进行对比,属于数值对比,因此第一次对比耗时较少,在第二次对比时,由于参与第二次对比的第三试卷的数量较少,因此,即使基于试题内容本身进行对比,第二次对比耗时也相对较少,从而使得对第一试卷进行排重的总耗时较少。
52.本公开实施例提供的试卷对比方法,能够获取第一试卷;确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。应用本公开实施例提供的试卷对比方法进行试卷排重,准确性较高且耗时较少。
53.在本公开另一种实施方式中,试题属性值用于表征试题内容所占用区域的目标值,包括:
54.s1211、对试卷进行试题分割,得到试题内容的所占用区域。
55.具体地,可以采用任意可能的区域划分算法对试卷进行试题分割,本技术对此不作限定。例如,可以按照如下区域划分规则对试卷进行试题分割:试题内容的所占用区域的宽度=试题内容最长部分的宽度、或者试卷页面宽度,试题内容的所占用区域的高度=囊括试题内容的最小高度,但并不限于此。
56.示例性的,图2是本公开实施例提供的一种试卷的示意图。如图2所示,试卷中包括3道试题,对试卷进行试题分割,获取每道试题内容的所占用区域210。
57.s1212、确定试题内容所占用区域的面积,将试题内容的所占用区域的面积作为试题内容所占用区域的目标值。
58.在一些实施例中,确定试题内容所占用区域的面积可以包括:将试题内容所占用区域的高度和宽度进行相乘处理,得到试题内容所占用区域的试题面积。
59.在另一些实施例中,确定试题内容所占用区域的面积可以包括:
60.s12121、对试题内容所占用区域进行字符分割,得到字符区块。
61.s12122、对各字符区块的面积进行加和,得到试题内容所占用区域的面积。
62.在一个示例中,s12121可以包括:将试题内容所占用区域输入字符分割模型,得到字符分割模型输出的字符区块,其中,字符分割模型预先由样本试题内容所占用区域以及其包括的字符区块训练完成。相应地,s12122可以包括:确定各字符区块的面积,并对各字符区块的面积进行加和,得到试题内容所占用区域的面积。
63.在另一个示例中,s12121可以包括:采用预设的扫描框滑动扫描试题内容所占用区域,并将在滑动扫描时扫描框对应的灰度值大于预设阈值的扫描区块记为字符区块,其中,扫描框覆盖单个字符。相应地,s12122可以包括:将字符区块的数量与扫描框的面积进行相乘处理,得到试题内容所占用区域的面积。
64.具体地,扫描框为将单个字符包围起来的几何框,其中,扫描框的几何形状可以包括圆形、三角形、矩形、五边形等,但并不限于此。
65.试卷中各试题内容所占用区域可以采用相同的扫描框,此时,可以从任一试题内容所占用区域中识别出任一字符,针对识别出的字符生成围绕该字符的扫描框,但并不限于此。
66.试卷中每个试题内容所占用区域也可以采用各自对应的扫描框,此时,可以针对每个试题内容所占用区域,识别试题内容所占用区域中的首个字符,针对首个字符生成围绕该首个字符的扫描框,但并不限于此。
67.具体地,“扫描框对应的灰度值”的具体含义,可以是扫描框内所有像素的灰度值的平均值。此时,“将在滑动扫描时扫描框对应的灰度值大于预设阈值的扫描区块记为字符区块”可以包括:将在滑动扫描时扫描框内所有像素的灰度值的平均值大于预设阈值的扫描区域记为一个字符区块;
68.或者;
69.将在滑动扫描时扫描框内所有像素的灰度值的平均值大于第一预设阈值且小于第二预设阈值的扫描区域记为半个字符区块;将在滑动扫描时扫描框内所有像素的灰度值的平均值大于第二预设阈值的扫描区域记为一个字符区块,其中,第一预设阈值小于第二预设阈值。
70.示例性的,图3是本公开实施例提供的一种采用扫描框滑动试题内容所占用区域的示意图。参见图2和图3,针对第2题的试题内容所占用区域210,采用扫描框310滑动扫描该试题内容所占用区域210,并将在滑动扫描时扫描框310的灰度值大于预设阈值的扫描区域记为字符区块,得到90个字符区块;将90与扫描框的面积进行相乘处理,得到第2题的试题内容所占用区域的面积。同理,可得到第1题的试题内容所占用区域的面积和第3题的试题内容所占用区域的面积。
71.可以理解的是,通过对各字符区块的面积进行加和,得到试题内容所占用区域的面积,可使计算得到的试题内容所占用区域的面积与实际所占用区域的面积更接近,即可提高试题内容所占用区域的面积的准确性,如此,有利于提高根据面积判断两试卷是否为相同试卷的准确性。
72.还可以理解的是,通常情况下试卷的页面大小都是a4,因此当两个试卷相同时其中各试题内容所占用面积一般相同,因此,设置目标值包括面积,可提高试卷对比的准确性。
73.在本公开又一种实施方式中,试题属性值用于表征试题内容所占用区域的目标值,包括:
74.s1221、对试卷进行试题分割,得到试题内容的所占用区域。
75.具体地,s1221与s1211类似,此处不再赘述。
76.s1222、确定试题内容所占用区域中包含的像素的像素总数,并将像素总数作为试题内容所占用区域的目标值。
77.在一些实施例中,s1222可以包括:将试题内容所占用区域输入像素总数统计模型,得到像素总数统计模型输出的像素总数,其中,像素总数统计模型预先由样本试题内容所占用区域以及其包括的像素总数训练完成。
78.在另一些实施例中,s1222可以包括:
79.s12221、获取试题内容所在的目标图层。
80.具体地,可以对试卷进行颜色分离处理,得到多个图层,并从多个图层中筛选出试题内容所在的目标图层。
81.可以采用任意可能的颜色分离算法对试卷进行颜色分离处理,此处不作限定。
82.可以直接对试卷进行颜色分离处理,得到多个图层。也可以先对试卷进行边缘处理,区分试卷的边缘区域和内部区域,其中,边缘区域为不包括试题内容的区域,内部区域为包括试题内容的区域,边缘区域通常围绕或半围绕内部区域;对内部区域进行颜色分离处理,得到多个图层。
83.示例性的,图4是本公开实施例提供的另一种试卷的示意图。图5是对图4所示的试卷进行颜色分离的逻辑示意图。参见图4和图5,试卷的背景色为白色,试题内容的颜色为黑色,因此,对试卷进行边缘处理、以及对边缘处理后得到的内容区域进行颜色分离处理,可得到黑色图层510和白色图层520,从黑色图层610和白色图层620中获取试题内容所在的黑色图层610作为目标图层。
84.可以理解的是,仅对内部区域进行颜色分离处理,可减少需要进行颜色分离处理的部分的面积,进而减少颜色分离处理的工作量,缩短颜色分离耗时。
85.s12222、在目标图层中,统计试题内容所占用区域中包含的像素的像素总数。
86.示例性的,继续参见图4和图5,在黑色图层610中,统计第4题的试题内容所占用区域中包含的像素的像素总数。
87.还可以理解的是,试题内容的具体样式有多种,例如,有些试题的试题内容仅包括字符(如图3所示),有些试题的试题内容不仅包括字符还包括图片(如图4所示),而统计像素总数的准确性与试题内容的样式无关,换句话说,试题内容的样式不会影响像素总数的准确统计,因此,设置目标值包括像素总数,可使基于像素总数的试卷对比适用于具有各种样式的试题内容的试卷,即适用范围较广。并且,当两个试卷相同时,即使它们的页面大小不同,对应试题的试题内容所占用区域的像素总数也是相同的,因此,设置目标值包括像素总数,可提高试卷对比的准确性。
88.图6是本公开实施例提供的另一种试卷对比方法的流程图。本公开实施例在上述实施例的基础上进行优化,本公开实施例可以与上述一个或者多个实施例中各个可选方案结合。
89.如图6所示,该试卷对比方法可以包括如下步骤。
90.s610、获取第一试卷。
91.具体地,s610与s110类似,此处不再赘述。
92.s620、确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值。
93.具体地,s620与s120类似,此处不再赘述。
94.s630、若第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,不满足第一预设条件,则确定第一试卷和第二试卷为不同试卷。
95.具体地,第一预设条件可以包括第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和相同、或者第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和之间的差值小于第一预设差值阈值。但并不限于此。
96.在一些实施例中,该方法还包括:
97.若第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,满足第一预设条件、且至少一个试题对的试题属性值进行比较,不满足第二预设条件,则确定第一试卷和第二试卷为不同试卷,其中,试题对包括第一试卷中的一试题和第
二试卷中与其对应的一试题。
98.在另一些实施例中,该方法还包括:
99.若第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,满足第一预设条件、且各试题对的试题属性值进行比较,均满足第二预设条件,则确定第一试卷和第二试卷为相同试卷。
100.具体地,第二预设条件可以包括试题对中两试题的试题属性值相同、或者试题对中两试题的试题属性值之间的差值小于第二预设差值阈值。但并不限于此。
101.具体地,若第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,满足第一预设条件,则针对各试题对,逐一对比试题属性值,若对比过程中发现一个试题对的试题属性值不满足第二预设条件,则确定第一试卷和第二试卷为不同试卷,若各试题对的试题属性值均满足第二预设条件,则确定第一试卷和第二试卷为相同试卷。
102.可以理解的是,针对各试题对逐一对比试题属性值,并在对比过程中发现一个试题对的试题属性值不满足第二预设条件时,即确定第一试卷和第二试卷为不同试卷,可及时得到最终对比结果并结束对比,有利于缩短第一试卷和第二试卷的对比耗时。
103.在又一些实施例中,该方法还包括:
104.若第一试卷中各试题的试题属性值之和和第二试卷中各试题的试题属性值之和满足第一预设条件、且各试题对的试题属性值均满足第二预设条件,则针对各试题对,识别试题内容,逐一对比试题内容;
105.若至少一个试题对的试题内容不满足第三预设条件,则确定第一试卷和第二试卷为不同试卷;
106.若各试题对的试题内容均满足第三预设条件,则确定第一试卷和第二试卷为相同试卷。
107.具体地,第三预设条件可以包括试题对中两试题的试题内容相同。但并不限于此。
108.具体地,若第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较,满足第一预设条件,且针对各试题对,逐一对比试题属性值,各试题对的试题属性值均满足第二预设条件,则针对各试题对,识别试题内容,逐一对比试题内容,若对比过程中发现一个试题对的试题内容不满足第三预设条件,则确定第一试卷和第二试卷为不同试卷,若各试题对的试题内容均满足第三预设条件,则确定第一试卷和第二试卷为相同试卷。
109.可以理解的是,在第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值满足第一预设条件、且各试题对的试题属性值满足第二预设条件时,继续对比第一试卷中的试题内容和第二试卷中的试题内容来判断第一试卷和第二试卷是否为相同试卷,可提高第一试卷和第二试卷的准确性。
110.示例性的,对第一试卷进行排重的过程可以如下:获取第一试卷;确定第一试卷中各试题的试题属性值;进行第一次对比:针对试题题库中的每个第二试卷,将第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行比较;若第一试卷中各试题的试题属性值之和与每个第二试卷中各试题的试题属性值之和均不同,则确定试题题库中不存在与第一试卷相同的试卷。若第一试卷中各试题的试题属性值之和和至少一个第
二试卷中各试题的试题属性值之和相同,进行第二次对比:将与第一试卷中各试题的试题属性值之和相同的第二试卷作为第三试卷,并针对每个第三试卷进行如下对比,确定第一试卷和第三试卷的各试题对,并针对各试题对,逐一对比试题属性值,若至少一个试题对的试题属性值不相同,则确定第一试卷和第三试卷为不同试卷,若第一试卷与各第三试卷均为不同试卷,则确定试题题库中不存在与第一试卷相同的试卷。若至少一个第三试卷和第一试卷中各试题对的试题属性值相同,则将该第三试卷确定为第四试卷,并进行第三次对比:针对每个第四试卷进行如下对比,确定第一试卷和第四试卷的各试题对,并针对各试题对,逐一对比试题内容,若至少一个试题对的试题内容不相同,则确定第一试卷和第四试卷为不同试卷,若各试题对的试题内容不相同,则确定第一试卷和第四试卷为相同试卷。若第一试卷与各第四试卷均为不同试卷,则确定试题题库中不存在与第一试卷相同的试卷,否则确定试题题库中存在与第一试卷相同的试卷。
111.在确定试题题库中不存在与第一试卷相同的试卷时,可以将第一试卷以及第一试卷中各试题的试题属性值录入试卷题库中;在确定试题题库中存在与第一试卷相同的试卷时,可以不将第一试卷录入试卷题库。
112.例如,可以将第一试卷增加一个字段:area,对应字段可以通过以下json来进行存储:
[0113][0114]
本公开实施例,能够对第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和进行对比,并且,能够在第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和满足第一预设条件时,再进一步对第一试卷和第二试卷中试题对的属性值逐一进行对比,由于试题属性值之和的对比、试题对的属性值对比均为数值对比,因此工作量小,对比耗时较少。此外,相比于在第一试卷中各试题的试题属性值之和与第二试卷中各试题的试题属性值之和满足第一预设条件时直接确定第一试卷和第二试卷为相同试卷,进一步进行试题对的试题属性值对比,可提高对比准确性,因此,应用本公开实施例的试卷对比方法进行试卷排重,准确性较高且耗时较少。此外,在各试题对的试题属性值满足第二预设条件时再进一步对各试题对的试题内容进行对比,可进一步提高对比准确性。
[0115]
图7是本公开实施例提供的一种试卷对比装置的结构示意图,该试卷对比装置可以被理解为上述电子设备或者上述电子设备中的部分功能模块。如图7所示,该试卷对比装
置700包括:
[0116]
第一获取模块710,用于获取第一试卷;
[0117]
第一确定模块720,用于确定所述第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;
[0118]
第二确定模块730,用于根据所述第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定所述第一试卷和所述第二试卷是否为相同试卷。
[0119]
在本公开另一种实施方式中,第一确定模块720包括:
[0120]
第一分割子模块,用于对试卷进行试题分割,得到所述试题内容的所占用区域;
[0121]
第一确定子模块,用于确定所述试题内容所占用区域的面积,将所述试题内容的所占用区域的面积作为所述试题内容所占用区域的目标值。
[0122]
在本公开又一种实施方式中,第一确定子模块包括:
[0123]
分割单元,用于对所述试题内容所占用区域进行字符分割,得到字符区块;
[0124]
加和单元,用于对各所述字符区块的面积进行加和,得到所述试题内容所占用区域的面积。
[0125]
在本公开再一种实施方式中,第一分割单元具体用于,采用预设的扫描框滑动扫描所述试题内容所占用区域,并将在滑动扫描时所述扫描框对应的灰度值大于预设阈值的扫描区块记为所述字符区块,其中,所述扫描框覆盖单个字符。
[0126]
在本公开再一种实施方式中,第一确定模块720包括:
[0127]
第二分割子模块,用于对试卷进行试题分割,得到所述试题内容的所占用区域;
[0128]
第二确定子模块,用于确定所述试题内容所占用区域中包含的像素的像素总数,并将所述像素总数作为所述试题内容所占用区域的目标值。
[0129]
在本公开再一种实施方式中,第二确定子模块包括:
[0130]
获取单元,用于获取所述试题内容所在的目标图层;
[0131]
统计单元,用于在所述目标图层中,统计所述试题内容所占用区域中包含的像素的像素总数。
[0132]
在本公开再一种实施方式中,第二确定模块730包括:
[0133]
第一比较子模块,用于若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,不满足第一预设条件(例如不满足相同的条件),则确定所述第一试卷和所述第二试卷为不同试卷。
[0134]
在本公开再一种实施方式中,该装置还包括:
[0135]
第二比较子模块,用于若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,满足所述第一预设条件、且至少一个试题对的试题属性值进行比较,不满足第二预设条件,则确定所述第一试卷和所述第二试卷为不同试卷,其中,所述试题对包括所述第一试卷中的一试题和所述第二试卷中与其对应的一试题。
[0136]
在本公开再一种实施方式中,该装置还包括:
[0137]
第三比较子模块,用于若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,满足所述第一预设条件、且各所述试题对的试题属性值进行比较,均满足第二预设条件,则确定所述第一试卷和所述第二试卷为相同试卷。
[0138]
在本公开再一种实施方式中,该装置还包括:
[0139]
第四比较子模块,若所述第一试卷中各试题的试题属性值之和和所述第二试卷中各试题的试题属性值之和满足所述第一预设条件、且各所述试题对的试题属性值均满足第二预设条件,则针对各所述试题对,识别试题内容,逐一对比试题内容;若至少一个试题对的试题内容不满足第三预设条件,则确定所述第一试卷和所述第二试卷为不同试卷;若各所述试题对的试题内容均满足所述第三预设条件,则确定所述第一试卷和所述第二试卷为相同试卷。
[0140]
本实施例提供的装置能够执行上述任一实施例的方法,其执行方式和有益效果类似,在这里不再赘述。
[0141]
本实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
[0142]
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。
[0143]
本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
[0144]
参考图8,现将描述可以作为本公开的服务器或客户端的电子设备800的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0145]
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0146]
电子设备800中的多个部件连接至i/o接口805,包括:输入单元806、输出单元807、存储单元808以及通信单元809。输入单元806可以是能向电子设备800输入信息的任何类型的设备,输入单元806可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元807可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元804可以包括但不限于磁盘、光盘。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙tm设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。
[0147]
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工
智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理。例如,在一些实施例中,试卷对比方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到电子设备800上。在一些实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行试卷对比方法。
[0148]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0149]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0150]
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0151]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0152]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0153]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计
算机程序来产生客户端和服务器的关系。
[0154]
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
技术特征:
1.一种试卷对比方法,其特征在于,包括:获取第一试卷;确定所述第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;根据所述第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定所述第一试卷和所述第二试卷是否为相同试卷。2.根据权利要求1所述的方法,其特征在于,所述试题属性值用于表征试题内容所占用区域的目标值,包括:对试卷进行试题分割,得到所述试题内容的所占用区域;确定所述试题内容所占用区域的面积,将所述试题内容的所占用区域的面积作为所述试题内容所占用区域的目标值。3.根据权利要求2所述的方法,其特征在于,所述确定所述试题内容所占用区域的面积,包括:对所述试题内容所占用区域进行字符分割,得到字符区块;对各所述字符区块的面积进行加和,得到所述试题内容所占用区域的面积。4.根据权利要求3所述的方法,其特征在于,所述对所述试题内容所占用区域进行字符分割,得到字符区块,包括:采用预设的扫描框滑动扫描所述试题内容所占用区域,并将在滑动扫描时所述扫描框对应的灰度值大于预设阈值的扫描区块记为所述字符区块,其中,所述扫描框覆盖单个字符。5.根据权利要求1所述的方法,其特征在于,所述试题属性值用于表征试题内容所占用区域的目标值,包括:对试卷进行试题分割,得到所述试题内容的所占用区域;确定所述试题内容所占用区域中包含的像素总数,并将所述像素总数作为所述试题内容所占用区域的目标值。6.根据权利要求5所述的方法,其特征在于,所述确定所述试题内容所占用区域中包含的像素总数,包括:获取所述试题内容所在的目标图层;在所述目标图层中,统计所述试题内容所占用区域中包含的像素总数。7.根据权利要求1所述的方法,其特征在于,所述根据所述第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定所述第一试卷和所述第二试卷是否为相同试卷,包括:若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,不满足第一预设条件,则确定所述第一试卷和所述第二试卷为不同试卷。8.根据权利要求7所述的方法,其特征在于,还包括:若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,满足所述第一预设条件、且至少一个试题对的试题属性值进行比较,不满足第二预设条件,则确定所述第一试卷和所述第二试卷为不同试卷,其中,所述试题对包括所述第一试卷中的一试题和所述第二试卷中与其对应的一试题。
9.根据权利要求8所述的方法,其特征在于,还包括:若所述第一试卷中各试题的试题属性值之和与所述第二试卷中各试题的试题属性值之和进行比较,满足所述第一预设条件、且各所述试题对的试题属性值进行比较,均满足第二预设条件,则确定所述第一试卷和所述第二试卷为相同试卷。10.根据权利要求8所述的方法,其特征在于,还包括:若所述第一试卷中各试题的试题属性值之和和所述第二试卷中各试题的试题属性值之和满足所述第一预设条件、且各所述试题对的试题属性值均满足第二预设条件,则针对各所述试题对,识别试题内容,逐一对比试题内容;若至少一个所述试题对的试题内容不满足第三预设条件,则确定所述第一试卷和所述第二试卷为不同试卷;若各所述试题对的试题内容均满足所述第三预设条件,则确定所述第一试卷和所述第二试卷为相同试卷。11.一种试卷对比方法装置,其特征在于,包括:第一获取模块,用于获取第一试卷;第一确定模块,用于确定所述第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;第二确定模块,用于根据所述第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定所述第一试卷和所述第二试卷是否为相同试卷。12.一种电子设备,其特征在于,所述电子设备包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1至10任一所述的试卷对比方法。
技术总结
本公开涉及一种试卷对比方法、装置、设备及存储介质,其中,试卷对比方法包括:获取第一试卷;确定第一试卷中各试题的试题属性值,其中,试题属性值用于表征试题内容所占用区域的目标值;根据第一试卷中各试题的试题属性值和第二试卷中各试题的试题属性值,确定第一试卷和第二试卷是否为相同试卷。应用本公开实施例提供的试卷对比方法进行试卷排重,准确性较高且耗时较少。且耗时较少。且耗时较少。
技术研发人员:索浩森 罗帅 薛珺
受保护的技术使用者:北京新唐思创教育科技有限公司
技术研发日:2023.05.10
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/