一种文本的标记方法、装置、电子设备及存储介质与流程
未命名
08-03
阅读:193
评论:0

1.本技术涉及文本标注技术领域,具体而言,涉及一种文本的标记方法、装置、电子设备及存储介质。
背景技术:
2.现有的文本标记方法中,通常使用line-height技术将文本中的行高撑开,以显示标记字段对应的标签。但line-height高度是基于文本baseline线确定的,会和文本有重合,从而导致标签不能完整的包住文本。现有的标签与标记字段的对应关系也不明确,尤其是在多个标记字段之间有重合的时候,不同字段所对应的标签在不同的行中显示,此时无法准确的确定出每个标签与字段之间的对应关系。
技术实现要素:
3.有鉴于此,本技术的目的在于提供一种文本的标记方法、装置、电子设备及存储介质,同时生成目标标签和标签线框来对目标字段进行标记,目标标签与目标字段之间的关系明确,且目标标签与标签线框将目标字段完全包住。
4.第一方面,本技术提供了一种文本的标记方法,方法包括:响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,文本显示界面中显示有文本内容;接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;在标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,标签线框与标签形成封闭区域,且目标字段位于该封闭区域内。
5.优选的,尺寸包括宽度值和高度值,通过以下方式确定目标字段对应的标签容器的尺寸:根据目标字段和至少一个已标记字段中每个字段所对应的字段起始索引或字段结束索引,确定出最小的字段起始索引作为容器起始索引,确定出最大的字段结束索引作为容器结束索引;根据文本中容器结束索引和容器起始索引之间每个字段的宽度值的总和,确定目标容器的宽度值;以及根据与目标字段重合和至少一个已标记字段所对应的容器的高度值,确定出最大高度值;将最大高度值与初始高度值的和,确定为目标容器的高度值。
6.优选的,通过以下方式确定出目标标签的尺寸:根据所选择的目标字段与文本内容中已存在的标记字段的位置关系,确定针对目标字段添加的目标标签在标签容器中的层数索引;根据目标标签在标签容器中的层数索引,分别确定目标标签的高度值;根据目标标签与标签容器之间的位置偏移,确定目标标签的宽度值。
7.优选的,通过以下方式确定针对目标字段添加的目标标签在标签容器中的层数索引:确定目标字段与已标记字段的位置是否重合;若目标字段与已标记字段的位置不重合,则将初始层数索引确定为目标字段在标签容器中的层数索引;若目标字段与已标记字段的
位置重合,则根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定针对目标字段添加的目标标签在标签容器中的层数索引。
8.优选的,字段起始索引和字段结束索引分别用于指示字段在文本中的起始位置和结束位置,通过以下方式确定目标字段与已标记字段的位置是否重合:按照从小到大的顺序,将所有已标记字段对应的层数索引进行分组;依次确定每一组中每个已标记字段所对应的字段起始索引或字段结束索引是否在目标字段所对应的字段起始索引和字段结束索引之间;若该已标记字段所对应的字段起始索引或字段结束索引在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段重合;若该已标记字段所对应的字段起始索引或字段结束索引中的任一个都不在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段不重合。
9.优选的,根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定目标字段在标签容器中的层数索引的步骤,具体包括:确定所有与目标字段重合的已标记字段所对应的层数索引中的最大层数索引;将最大层数索引加一,以作为目标字段在标签容器中的层数索引。
10.优选的,响应于在文本显示界面上执行的对目标标签的选择操作,确定目标标签的标签属性;确定标签属性的字段宽度值;若标签属性的字段宽度值大于目标标签的宽度值,则将标签属性动态展示在目标标签中;若标签属性的字段宽度值小于目标标签的宽度值,则将标签属性静态展示在目标标签中。
11.优选的,根据目标字段的字段起始索引和字段结束索引,确定目标字段是否跨行;若确定目标字段跨行,则将目标字段分为多个子字段,其中每个子字段对应一个子标签容器,子标签容器用于在文本显示界面中创建针对子字段所添加的子标签的显示区域;针对每个子字段,确定该子字段对应的目标标签的显示范围,以按照各自的显示范围在每个子标签容器中显示每个子字段对应的子标签。
12.第二方面,本技术提供了一种文本的标记装置,装置包括:
13.响应模块,用于响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,文本显示界面中显示有文本内容;
14.接收模块,用于接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;
15.显示模块,用于在标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,标签线框与标签形成封闭区域,且目标字段位于该封闭区域内。
16.第三方面,本技术还提供一种电子设备,包括:处理器、存储器和总线,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储器之间通过总线通信,机器可读指令被处理器执行时执行如上述的文本的标记方法的步骤。
17.第四方面,本技术还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的文本的标记方法的步骤。
18.本技术提供的文本的标记方法、装置、电子设备及存储介质,响应于在文本显示界
面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,文本显示界面中显示有文本内容;接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;在标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,标签线框与标签形成封闭区域,且目标字段位于该封闭区域内。通过标签和标签线框将目标文字包住,使字段与标签之间的对应关系更明确。
19.为使本技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
20.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
21.图1为本技术实施例所提供的一种文本的标记方法的流程图;
22.图2为本技术实施例所提供的一种层数索引确定的步骤的流程图;
23.图3为本技术实施例所提供的一种确定字段是否重合的步骤的流程图;
24.图4为本技术实施例所提供的一种标签和标签线框的结构示意图;
25.图5为本技术实施例所提供的一种标签显示的步骤的流程图;
26.图6为本技术实施例所提供的一种文本的标记装置的结构示意图;
27.图7为本技术实施例所提供的一种电子设备的结构示意图;
28.图8为本技术实施例所提供的一种确定层数索引的步骤的流程图;
29.图9为本技术实施例提供的另一种标签和标签线框的结构示意图;
30.图10为本技术实施例提供的另一种标签和标签线框的结构示意图。
具体实施方式
31.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本技术保护的范围。
32.首先,对本技术可适用的应用场景进行介绍。本技术可应用于文本标记。
33.现有的文本标记方法中,通常使用line-height技术将文本中的行高撑开,以显示标记字段对应的标签。但line-height高度是基于文本baseline线确定的,会和文本有重合,从而导致标签不能完整的包住文本。现有的标签与标记字段的对应关系也不明确,尤其
是在多个标记字段之间有重合的时候,不同字段所对应的标签在不同的行中显示,此时无法准确的确定出每个标签与字段之间的对应关系。
34.基于此,本技术实施例提供了一种文本的标记方法、装置、电子设备及存储介质。
35.请参阅图1,图1为本技术实施例所提供的一种文本的标记方法的流程图。所如图1中所示,本技术实施例提供的文本的标记方法,包括:
36.s101、响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,所述文本显示界面中显示有文本内容。
37.s102、接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域。
38.这里的文本显示界面上显示有待标记的文本内容,以及显示有预设好的标签。每个标签的标签属性不同,这里的标签属性用于表示所标记的字段的类别。例如将《三国演义》为书籍类别,则标签属性为书籍。在进行标注时,首先单击选择书籍标签。然后在文本中框选“《三国演义》”(相当于目标字段)六个字符。这里可以通过鼠标滑动进行选择。具体的,尺寸包括宽度值和高度值,通过以下方式确定目标字段对应的标签容器的尺寸:
39.根据目标字段和至少一个已标记字段中每个字段所对应的字段起始索引或字段结束索引,确定出最小的字段起始索引作为容器起始索引,确定出最大的字段结束索引作为容器结束索引。根据文本中容器结束索引和容器起始索引之间每个字段的宽度值的总和,确定目标容器的宽度值。
40.以及根据与目标字段重合和至少一个已标记字段所对应的容器的高度值,确定出最大高度值。将最大高度值与初始高度值的和,确定为目标容器的高度值。
41.可以理解的是,确定出所有标记字段(目标字段和已标记字段)的二维数组后,则对二维数组进行去重。当目标字段与已标记字段有重合时,则确定出重合部分的最大范围,作为目标容器的容器起始索引和容器结束索引。示例性的,若目标字段i与已标记字段a重合,且已标记字段a与已标记字段b也重合,则目标容器中需要包括这三个标记字段所对应的标签。目标容器的容器起始索引既为这三个标记字段中最小的字段起始索引,容器结束索引既为这三个标记字段中最大的字段结束索引。
42.示例性的,若确定容器起始索引和容器结束索引可以表示为{“start”:0,“end”:6},其中每个字符的宽度值为20px,则目标容器的宽度值为140px。
43.示例性的,已标记字段所对应的容器的高度可以为24px,此时新增加的目标字段的索引层数为1,已标记字段的索引层数为0,则新的目标容器的高度则为24+24=48px。这里目标容器的高度值还可以直接根据该容器所包括的所有标签最大索引层数来确定。
44.具体的,通过以下方式确定出目标标签的尺寸:
45.根据所选择的目标字段与文本内容中已存在的标记字段的位置关系,确定针对目标字段添加的目标标签在标签容器中的层数索引。根据目标标签在标签容器中的层数索引,分别确定目标标签的高度值。根据目标标签与标签容器之间的位置偏移,确定目标标签的宽度值。
46.请参阅图2,图2为本技术实施例所提供的一种层数索引确定的步骤的流程图。具体的,通过以下方式确定针对目标字段添加的目标标签在标签容器中的层数索引:
47.s201、确定目标字段与已标记字段的位置是否重合。
48.字段起始索引和字段结束索引分别用于指示字段在文本中的起始位置和结束位置,例如文本为“泉眼无声惜细流,树阴照水爱晴柔。小荷才露尖尖角,早有蜻蜓立上头。”共32个字符,其中蜻蜓分别为第27和28个字符,则蜻蜓的字段索引为{“start”:27,“end”:28},其中,start表示字段起始索引,end表示字段结束索引。
49.文本中添加的每个目标字段对应的标签都进行分层。分层的结果表示为二维数组的形式,二维数组包括层数索引、字段索引和标签属性。例如{“start”:27,“end”:28,“text”:“蜻蜓”,“label”:“动物”,“layerrowindex”:0}。其中text表示目标字段,label表示标签属性,layerrowindex表示层数索引。
50.请参阅图3,图3为本技术实施例所提供的一种确定字段是否重合的步骤的流程图。具体的,通过以下方式确定目标字段与已标记字段的位置是否重合:
51.s2010、按照从小到大的顺序,将所有已标记字段对应的层数索引进行分组。
52.s2012、依次确定每一组中每个已标记字段所对应的字段起始索引或字段结束索引是否在目标字段所对应的字段起始索引和字段结束索引之间。
53.s2014、若该已标记字段所对应的字段起始索引或字段结束索引在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段重合。
54.s2016、若该已标记字段所对应的字段起始索引或字段结束索引中的任一个都不在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段不重合。
55.示例性的,已标记字段“泉眼无声惜细流”对应的字段索引为{“start”:0,“end”:6},目标字段“泉眼”对应的字段索引为{“start”:0,“end”:1},则可以确定目标字段与该已标记字段重回。
56.s202、若目标字段与已标记字段的位置不重合,则将初始层数索引确定为目标字段在标签容器中的层数索引。
57.s203、若目标字段与已标记字段的位置重合,则根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定针对目标字段添加的目标标签在标签容器中的层数索引。
58.具体的,根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定目标字段在标签容器中的层数索引的步骤,具体包括:
59.确定所有与目标字段重合的已标记字段所对应的层数索引中的最大层数索引。将最大层数索引加一,以作为目标字段在标签容器中的层数索引。
60.如图8所示,图8为本技术实施例提供的一种确定层数索引的步骤的流程图。在该步骤中,首先确定文本中是否已经有字段被标记,若有已标记字段则内存中会存在对应的二维数组。若二维数组为空(既没有字段被标记),则可以直接确定目标字段对应的二维数组中layerrowindex(层数索引)的值为0。
61.若已经有字段被标记,则根据内存中所有已标记对应的二维数组的层数索引。首先和层数索引为0所对应的已标记字段进行判断。若目标字段与该层数索引对应的已标记字段都不重合,则可以确定目标字段的层数索引为0。若目标字段与该层数索引对应的已标记字段重合,则确定该层数索引是不是最后一层,若是最后一层,则确定目标字段的层数索
引为0+1=1。若确定该层数索引不是最后一层,则确定目标字段与下一层数索引对应的已标记字段是否重合,既与层数索引为1的所有已标记字段继续判断。
62.具体的,根据目标标签在标签容器中的层数索引,分别确定目标标签的高度值以及标签线框的高度值。
63.这里的目标标签的高度值可以通过目标标签的顶边与字段顶部之间的距离值来表示。每个标记字段所对应的标签的高度值通过层数索引确定。示例性的,目标标签层数索引为n,则目标标签的高度值为(n+1)
×
h。其中h为每个标签的初始高度值。这里的初始高度值就是标签在文本显示界面中实际显示的高度值,每个标签的初始高度值都是一致的,例如设置为24px。
64.标签线框的高度值表示的是标签线框的最顶端与文字底部之间的距离值。在实际渲染的过程中,标签线框是通过两个短边和一个长边组成的凹形,标签和标签线框的背景颜色是相同的。
65.具体的,根据目标标签与所述标签容器之间的位置偏移,确定目标标签的宽度值。
66.这里的位置偏移表示标签的左边与标签容器的左边之间的距离值。而目标标签的宽度值则是标签容器的宽度值与位置偏移之间的差值。
67.s103、在所述标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,标签线框与标签形成封闭区域,且目标字段位于该封闭区域内。
68.如图4所示,为本技术提供的一种标签和标签线框的结构示意图。其中,abcd和ef为同一标签容器内的两个标签。需要说明的是,实际渲染时abcd和ef之间没有缝隙,且是通过不同颜色显示的。
69.本技术提供的文本的标记方法,标签属性可以居中的显示在标签上,标签线框与标签形成封闭区域,且将目标字段完全包住。尤其在标记文字多次重复的时候,目标字段与标签之间的对应关系更明确。
70.如图9和图10所示,在本技术的一个实施例中,可以根据标签属性所对应的字段宽度值与目标字段的宽度值之间的大小关系,确定标签属性的显示方式。
71.具体的,响应于在文本显示界面上执行的对目标标签的选择操作,确定目标标签的标签属性。确定标签属性的字段宽度值,若标签属性的字段宽度值大于目标标签的宽度值,则将标签属性动态展示在目标标签中。若标签属性的字段宽度值小于目标标签的宽度值,则将标签属性静态展示在目标标签中。
72.可以理解的是,若标签属性所对应的字段宽度值大于目标标签的宽度值,则可以通过滚动显示的方式,在标签上显示标签属性。还可以将多余的字符用省略号来代替。
73.请参阅图5,图5为本技术实施例所提供的一种标签显示的步骤的流程图。在本技术的一个实施例中,文本显示界面上显示的文本内容通常是分行显示的,每行中显示预设数量的字符。若目标字段涉及到跨行显示,则可以通过以下方式进行显示对应的标签:
74.s301、根据目标字段的字段起始索引和字段结束索引,确定目标字段是否跨行。
75.在该步骤中,可以根据目标字段的字段起始索引和字段结束索引确定目标字段是否跨行。
76.可以通过minindex表示行起始索引,maxindex表示行结束索引。分别确定目标字段的字段起始索引和字段结束索引是否分别在不同的行所对应的行起始索引和行结束索引之间。这里的目标字段可能跨一行或两行等。
77.s302、若确定目标字段跨行,则将目标字段分为多个子字段,其中每个子字段对应一个子标签容器,子标签容器用于在文本显示界面中创建针对子字段所添加的子标签的显示区域。
78.若目标字段跨行,则按行将目标字段分成多个子字段。即跨一行则分为两个子字段,跨两行则分为三个子字段。每个子字段都对应一个子标签容器,子标签容器与目标字段的标签容器的参数相同。分别在每个子字段的指定方向上显示对应的子标签容器,区别在每个子标签容器的显示范围不同。
79.s303、针对每个子字段,确定该子字段对应的目标标签的显示范围,以按照各自的显示范围在每个子标签容器中显示每个子字段对应的子标签。
80.每个子标签容器仅显示与子字段对应的那一部分,其他地方则隐藏不显示。具体的,可以通过clip-path这一属性进行截断显示。
81.需要说明的是,每个子标签容器中显示的标签,对应显示有一个宽度值相同的标签线框。与现有技术中若目标字段换行的情况下,标签属性只保留在其中一个子字段所在行上,存在部分字段仅有背景而没有标签属性的情况相比,即使在分行的情况下,每个标签与目标字段之间的对应关系还是很清晰的。
82.在一具体实施例中,通过以下方式对文本进行标记:
83.1.在页面实际渲染所有的标签,计算出所有的标签属性宽度信息labeldimension。
84.2.把要标注的文章段落切割成一个一个的字体,在页面实际渲染,计算出每个字体的大小和位置信息,rowchartsposition表示每个字的大小位置和索引。rowsrangepositions表示每行字体开始索引和结束索引。
85.3.把关键词进行分层。关键词分层的最终结果是二维数组,二维数组名称layersarr[层数索引][关键词索引]。关键词索引格式是{start:'字段起始索引',end:'字段终止索引',label:'标签属性'}。
[0086]
当向最终的二维数组layersarr列表中添加一个新的目标字段时,从低到高检测现有的数组和目标字段是否重合,如果不重合直接添加到当前数组,如果重合,继续查找下一行数组,如果最终目标字段与所有的数组都重合,则添加一个新的数组放进去。
[0087]
4.获取高亮的单词重合区域的数组。
[0088]
比如三个标签“剧目”、“媒体”、“电影”存在重合,它们三个所对应的二维数组组合一个连续的并集mergelayers。mergelayers的字段起始索引start 125和字段终止索引end 134的区间包括三个它们重合的最小索引125和重合的最大索引134。这个区间必须是连续的。
[0089]
5.使用重合的数组mergelayers对整篇文章进行切割。再使用行数组rowsrangepositions对splitsarrbymerge进行切割形成结果splitsarrbyrow。
[0090]
例如当前文本共7行,标记有3个标签。其中有2个标签是重合的,则会被分为11个片段,没有标记的一行则是一个片段,有标记的行则会根据标记重合的范围被分为多个片
段。
[0091]
7.查找重合的数组里边包含的目标字段对应的数组作为子元素。
[0092]
例如,splitsarrbyrow是有一个数据为{"start":125,"end":131},那么生成带children的数据后这条数据变为splitsarrbyrowwithchildren,其中包括该区域内两个重合标签对应的数据。
[0093]
8.获取目标字段和标签的位置偏移。
[0094]
当标签说标注的内容跨行显示的时候,原来的一个容器被变为2个容器,children displaytext为标签可见的显示内容。因为换行显示标签的原理是每行都显示标签的一部分,隐藏标签的一部分。
[0095]
通过上述步骤计算出的结果就可以把目标字段对应的标签渲染出来,同时与标签对齐显示有标签线框。
[0096]
基于同一发明构思,本技术实施例中还提供了与文本的标记方法对应的文本的标记装置,由于本技术实施例中的装置解决问题的原理与本技术实施例上述文本的标记方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
[0097]
请参阅图6,图6为本技术实施例所提供的一种文本的标记装置的结构示意图,所述文本的标记装置600包括:
[0098]
响应模块610,用于响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,文本显示界面中显示有文本内容;
[0099]
接收模块620,用于接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;
[0100]
显示模块630,用于在标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,标签线框与标签形成封闭区域,且目标字段位于该封闭区域内。
[0101]
在一优选实施例中,尺寸包括宽度值和高度值,创建模块630还用于通过以下方式确定目标字段对应的标签容器的尺寸:根据目标字段和至少一个已标记字段中每个字段所对应的字段起始索引或字段结束索引,确定出最小的字段起始索引作为容器起始索引,确定出最大的字段结束索引作为容器结束索引;根据文本中容器结束索引和容器起始索引之间每个字段的宽度值的总和,确定目标容器的宽度值;以及根据与目标字段重合和至少一个已标记字段所对应的容器的高度值,确定出最大高度值;将最大高度值与初始高度值的和,确定为目标容器的高度值。
[0102]
在一优选实施例中,接收模块620具体用于通过以下方式确定出目标标签的尺寸:根据所选择的目标字段与文本内容中已存在的标记字段的位置关系,确定针对目标字段添加的目标标签在标签容器中的层数索引;根据目标标签在标签容器中的层数索引,分别确定目标标签的高度值;根据目标标签与标签容器之间的位置偏移,确定目标标签的宽度值。
[0103]
在一优选实施例中,接收模块620具体用于通过以下方式确定目标字段在标签容器中的层数索引:确定目标字段与已标记字段的位置是否重合;若目标字段与已标记字段的位置不重合,则将初始层数索引确定为目标字段在标签容器中的层数索引;若目标字段
与已标记字段的位置重合,则根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定目标字段在标签容器中的层数索引。
[0104]
在一优选实施例中,字段起始索引和字段结束索引分别用于指示字段在文本中的起始位置和结束位置,接收模块620具体用于通过以下方式确定目标字段与已标记字段的位置是否重合:按照从小到大的顺序,将所有已标记字段对应的层数索引进行分组;依次确定每一组中每个已标记字段所对应的字段起始索引或字段结束索引是否在目标字段所对应的字段起始索引和字段结束索引之间;若该已标记字段所对应的字段起始索引或字段结束索引在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段重合;若该已标记字段所对应的字段起始索引或字段结束索引中的任一个都不在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段不重合。
[0105]
在一优选实施例中,接收模块620具体用于确定所有与目标字段重合的已标记字段所对应的层数索引中的最大层数索引;将最大层数索引加一,以作为目标字段在标签容器中的层数索引。
[0106]
在一优选实施例中,还包括标签属性显示模块(图中未示出),用于响应于在文本显示界面上执行的对目标标签的选择操作,确定目标标签的标签属性;确定标签属性的字段宽度值;若标签属性的字段宽度值大于目标标签的宽度值,则将标签属性动态展示在目标标签中;若标签属性的字段宽度值小于目标标签的宽度值,则将标签属性静态展示在目标标签中。
[0107]
在一优选实施例中,还包括跨行显示模块(图中未示出),用于根据目标字段的字段起始索引和字段结束索引,确定目标字段是否跨行;若确定目标字段跨行,则将目标字段分为多个子字段,其中每个子字段对应一个子标签容器,子标签容器用于在文本显示界面中创建针对子字段所添加的子标签的显示区域;针对每个子字段,确定该子字段对应的目标标签的显示范围,以按照各自的显示范围在每个子标签容器中显示每个子字段对应的子标签。
[0108]
请参阅图7,图7为本技术实施例所提供的一种电子设备的结构示意图。如图7中所示,所述电子设备700包括处理器710、存储器720和总线730。
[0109]
所述存储器720存储有所述处理器710可执行的机器可读指令,当电子设备700运行时,所述处理器710与所述存储器720之间通过总线730通信,所述机器可读指令被所述处理器710执行时,可以执行如上述方法实施例中的文本的标记方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
[0110]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述方法实施例中的文本的标记方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
[0111]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0112]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可
以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0113]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0114]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0115]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0116]
最后应说明的是:以上所述实施例,仅为本技术的具体实施方式,用以说明本技术的技术方案,而非对其限制,本技术的保护范围并不局限于此,尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本技术实施例技术方案的精神和范围,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种文本的标记方法,其特征在于,所述方法包括:响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,所述文本显示界面中显示有文本内容;接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,所述标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;在所述标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,所述标签线框与标签形成封闭区域,且所述目标字段位于该封闭区域内。2.根据权利要求1所述的方法,其特征在于,尺寸包括宽度值和高度值,通过以下方式确定目标字段对应的标签容器的尺寸:根据目标字段和至少一个已标记字段中每个字段所对应的字段起始索引或字段结束索引,确定出最小的字段起始索引作为容器起始索引,确定出最大的字段结束索引作为容器结束索引;根据文本中所述容器结束索引和所述容器起始索引之间每个字段的宽度值的总和,确定目标容器的宽度值;以及根据与目标字段重合和至少一个已标记字段所对应的容器的高度值,确定出最大高度值;将最大高度值与初始高度值的和,确定为目标容器的高度值。3.根据权利要求2所述的方法,其特征在于,通过以下方式确定出目标标签的尺寸:根据所选择的目标字段与文本内容中已存在的标记字段的位置关系,确定针对目标字段添加的目标标签在标签容器中的层数索引;根据目标标签在标签容器中的层数索引,分别确定目标标签的高度值;根据目标标签与所述标签容器之间的位置偏移,确定目标标签的宽度值。4.根据权利要求3所述的方法,其特征在于,通过以下方式确定针对目标字段添加的目标标签在标签容器中的层数索引:确定目标字段与已标记字段的位置是否重合;若目标字段与已标记字段的位置不重合,则将初始层数索引确定为目标字段在标签容器中的层数索引;若目标字段与已标记字段的位置重合,则根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定针对目标字段添加的目标标签在标签容器中的层数索引。5.根据权利要求4所述的方法,其特征在于,字段起始索引和字段结束索引分别用于指示字段在文本中的起始位置和结束位置,通过以下方式确定目标字段与已标记字段的位置是否重合:按照从小到大的顺序,将所有已标记字段对应的层数索引进行分组;依次确定每一组中每个已标记字段所对应的字段起始索引或字段结束索引是否在目标字段所对应的字段起始索引和字段结束索引之间;若该已标记字段所对应的字段起始索引或字段结束索引在目标字段所对应的字段起
始索引和字段结束索引之间,则确定该已标记字段与目标字段重合;若该已标记字段所对应的字段起始索引或字段结束索引中的任一个都不在目标字段所对应的字段起始索引和字段结束索引之间,则确定该已标记字段与目标字段不重合。6.根据权利要求5所述的方法,其特征在于,所述根据与目标字段重合的至少一个已标记字段所对应的层数索引,确定目标字段在标签容器中的层数索引的步骤,具体包括:确定所有与目标字段重合的已标记字段所对应的层数索引中的最大层数索引;将所述最大层数索引加一,以作为目标字段在标签容器中的层数索引。7.根据权利要求6所述的方法,其特征在于,还包括:响应于在文本显示界面上执行的对目标标签的选择操作,确定目标标签的标签属性;确定所述标签属性的字段宽度值;若所述标签属性的字段宽度值大于所述目标标签的宽度值,则将所述标签属性动态展示在目标标签中;若所述标签属性的字段宽度值小于所述目标标签的宽度值,则将所述标签属性静态展示在目标标签中。8.根据权利要求7所述的方法,其特征在于,还包括:根据目标字段的字段起始索引和字段结束索引,确定目标字段是否跨行;若确定目标字段跨行,则将目标字段分为多个子字段,其中每个子字段对应一个子标签容器,所述子标签容器用于在文本显示界面中创建针对子字段所添加的子标签的显示区域;针对每个子字段,确定该子字段对应的目标标签的显示范围,以按照各自的显示范围在每个子标签容器中显示每个子字段对应的子标签。9.一种文本的标记装置,其特征在于,所述装置包括:响应模块,用于响应于在文本显示界面上执行的对目标标签的选择操作,确定用于对文本进行标记的目标标签,所述文本显示界面中显示有文本内容;接收模块,用于接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸,所述标签容器用于在文本显示界面中创建针对目标字段所添加的标签的显示区域;显示模块,用于在所述标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,所述标签线框与标签形成封闭区域,且所述目标字段位于该封闭区域内。10.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至8任一所述文本的标记方法的步骤。
技术总结
本申请提供了一种文本的标记方法、装置、电子设备及存储介质,确定用于对文本进行标记的目标标签;接收在文本显示界面上执行的对文本内容中的目标字段的选择操作,确定出标签容器的尺寸、标签的尺寸;在所述标签容器所创建的显示区域中,按照所确定出的尺寸显示与目标字段的目标标签和目标标签对应的标签线框,其中,目标标签与标签线框对齐显示,目标标签与对应的标签线框的宽度值相同,所述标签线框与标签形成封闭区域,且所述目标字段位于该封闭区域内。通过同时生成目标标签和标签线框来对目标字段进行标记,目标标签与目标字段之间的关系明确,且目标标签与标签线框将目标字段完全包住。全包住。全包住。
技术研发人员:郝海亮 吴明辉 李莹莹
受保护的技术使用者:北京明略昭辉科技有限公司
技术研发日:2023.06.02
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种黄花苜蓿抗低温基因MfJAZ1及其应用 下一篇:一种二次结构施工方法与流程