一种题目与框题坐标映射的方法、存储介质及设备与流程

未命名 07-15 阅读:135 评论:0

1.本发明涉及智能教育技术领域,具体涉及一种题目与框题坐标映射的方法、存储介质及设备。


背景技术:

2.当前,智慧教育不断发展,目前的智慧作业采集方式一般是老师批改完纸质教辅材料后,拍照采集学生的作业信息,智慧作业系统对学生所做答题进行分析。为了更好地识别题目,需要预先对教辅材料进行题目信息录入,其中题目坐标信息非常关键。
3.当前教辅材料中的试题信息如题干、答案、知识点等可直接录入数据库,而坐标信息则需要导入原图并通过系统录入,录入后的题目坐标如何与试题进行对应绑定是十分重要的。当前常见方式是通过系统人工关联绑定,但是这种方法人工成本高,效率低。


技术实现要素:

4.针对现有技术的不足,本发明旨在提供一种题目与框题坐标映射的方法、存储介质及设备。
5.为了实现上述目的,本发明采用如下技术方案:
6.一种题目与框题坐标映射的方法,具体过程为:
7.s1、在数据库中,预先录入教辅材料各页中的各个试题的数据信息,包括页码和试题文本数据;对于具有多个小题的试题,分别存储该试题的题干文本数据以及小题文本数据;
8.s2、导入教辅材料的页面原图;
9.s3、手动采用矩形框在页面原图上框出各个试题题块;其中,对于不具有多个小题的试题,用一个矩形框框出,对于具有多个小题的试题,则用不同的矩形框分别将该试题的题干以及各个小题框出;
10.s4、获取各个试题题块的坐标数据;
11.s5、对各个试题题块进行ocr识别得到对应的题块文本数据,然后与数据库中各个试题的试题文本数据进行对比;
12.当某个试题题块的题块文本数据与数据库中某个试题的试题文本数据相似度超过设定的相似度阈值时,直接将该试题题块的坐标数据与该试题进行绑定并录入到数据库中,形成该试题的坐标数据;
13.当有连续多个试题题块的题块文本数据有超过设定百分比的数量被包含于数据库中同一道试题的试题文本数据中,判定该连续多个试题题块隶属于同一道试题,并将该连续多个试题题块的坐标数据,按顺序分别与所匹配到的题干文本数据或小题文本数据进行绑定并记录在数据库中,形成该试题的题干的坐标数据以及各个小题的坐标数据。
14.进一步地,所述坐标数据包括试题题块的左上角坐标和右下角坐标。
15.进一步地,步骤s5中,当某个试题题块的题块文本数据与数据库中多个试题的试
题文本数据相似度超过设定的相似度阈值,则将其坐标数据与数据库中相似度最高的试题进行绑定。
16.本发明还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。
17.本发明还提供一种计算机设备,包括处理器和存储器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序时,实现上述方法。
18.本发明的有益效果在于:本发明利用ocr识别技术,将框选的试题进行与数据库里已经录入的试题数据进行坐标绑定映射,并且对于多层级的试题还可以进行多层级的精细化坐标绑定,从而可以减少人工操作,有效地提高了工作效率,也有助于提高绑定准确率。
具体实施方式
19.以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。
20.本实施例提供一种题目与框题坐标映射的方法,具体过程为:
21.s1、在数据库中,预先录入教辅材料各页中的各个试题的数据信息,包括页码、试题文本数据、答案、知识点等;对于具有多个小题的试题,分别存储该试题的题干文本数据以及小题文本数据;
22.s2、导入教辅材料的页面原图;
23.s3、手动采用矩形框在页面原图上框出各个试题题块;其中,对于不具有多个小题的试题,用一个矩形框框出,对于具有多个小题的试题,则用不同的矩形框分别将该试题的题干以及各个小题框出;
24.s4、获取各个试题题块的坐标数据;
25.s5、对各个试题题块进行ocr识别得到对应的题块文本数据,然后与数据库中各个试题的试题文本数据进行对比;
26.当某个试题题块的题块文本数据与数据库中某个试题的试题文本数据相似度超过设定的相似度阈值时,直接将该试题题块的坐标数据与该试题进行绑定并录入到数据库中,形成该试题的坐标数据;
27.当有连续多个试题题块的题块文本数据有超过设定百分比的数量被包含于数据库中同一道试题的试题文本数据中,判定该连续多个试题题块隶属于同一道试题,并将该连续多个试题题块的坐标数据,按顺序分别与所匹配到的题干文本数据或小题文本数据进行绑定并记录在数据库中,形成该试题的题干的坐标数据以及各个小题的坐标数据。
28.需要说明的是,为了分层级建立大题中的题干和各个小题与对应坐标数据的绑定关系,以实现此后更准确的题目识别,本实施例方法中对具有多个小题的试题的题干和小题分别用矩形框框出。因此在匹配的阶段,如果发现有连续多个试题题块的文本数据均被包含在同一道试题中(考虑到ocr识别误差和比对误差,设置一个百分比阈值,如90%,当某个试题题块超过这个百分比数量的题块文本数据被包含在数据库中某道试题的文本数据中,则认为该试题题块的文本被包含在对应试题的文本数据中),则判定该连续多个试题题块隶属于同一道试题,则按顺序将该多个试题题块的坐标数据依次和其匹配到的题干文本数据或小题文本数据进行绑定,由此形成一个大题中题干的坐标数据和各个小题的坐标数
据。
29.在本实施例中,所述坐标数据包括试题题块的左上角坐标和右下角坐标。
30.在本实施例中,步骤s5中,当某个试题题块的题块文本数据与数据库中多个试题的试题文本数据相似度超过设定的相似度阈值,则将其坐标数据与数据库中相似度最高的试题进行绑定。
31.对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。


技术特征:
1.一种题目与框题坐标映射的方法,其特征在于,具体过程为:s1、在数据库中,预先录入教辅材料各页中的各个试题的数据信息,包括页码和试题文本数据;对于具有多个小题的试题,分别存储该试题的题干文本数据以及小题文本数据;s2、导入教辅材料的页面原图;s3、手动采用矩形框在页面原图上框出各个试题题块;其中,对于不具有多个小题的试题,用一个矩形框框出,对于具有多个小题的试题,则用不同的矩形框分别将该试题的题干以及各个小题框出;s4、获取各个试题题块的坐标数据;s5、对各个试题题块进行ocr识别得到对应的题块文本数据,然后与数据库中各个试题的试题文本数据进行对比;当某个试题题块的题块文本数据与数据库中某个试题的试题文本数据相似度超过设定的相似度阈值时,直接将该试题题块的坐标数据与该试题进行绑定并录入到数据库中,形成该试题的坐标数据;当有连续多个试题题块的题块文本数据有超过设定百分比的数量被包含于数据库中同一道试题的试题文本数据中,判定该连续多个试题题块隶属于同一道试题,并将该连续多个试题题块的坐标数据,按顺序分别与所匹配到的题干文本数据或小题文本数据进行绑定并记录在数据库中,形成该试题的题干的坐标数据以及各个小题的坐标数据。2.根据权利要求1所述的方法,其特征在于,所述坐标数据包括试题题块的左上角坐标和右下角坐标。3.根据权利要求1所述的方法,其特征在于,步骤s5中,当某个试题题块的题块文本数据与数据库中多个试题的试题文本数据相似度超过设定的相似度阈值,则将其坐标数据与数据库中相似度最高的试题进行绑定。4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-3任一所述的方法。5.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序;所述处理器用于执行所述计算机程序时,实现权利要求1-3任一所述的方法。

技术总结
本发明公开了一种题目与框题坐标映射的方法、存储介质及设备,利用OCR识别技术,将框选的试题进行与数据库里已经录入的试题数据进行坐标绑定映射,并且对于多层级的试题还可以进行多层级的精细化坐标绑定,从而可以减少人工操作,有效地提高了工作效率,也有助于提高绑定准确率。高绑定准确率。


技术研发人员:陈炳洁 王余 杨康 蔡伟谦
受保护的技术使用者:珠海读书郎软件科技有限公司
技术研发日:2023.04.06
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐