一种基于AI内容自动生成出版物的方法及系统与流程
未命名
08-15
阅读:87
评论:0
一种基于ai内容自动生成出版物的方法及系统技术领域
1.本技术涉及人工智能领域,尤其涉及一种基于ai内容自动生成出版物的方法。还涉及一种基于ai内容自动生成出版物的系统。
背景技术:
2.如今国内比较大的出版社很多排版的工作已经不是出版社内的人员完成,而是外包给排版公司。
3.目前,排版主要就是手工排版与智能排版了。随着科技的发展,快速智能排版逐渐出现在一些科技排版领域,这类出版物的版式相对规范,对内容更在意,而对排版的美化装饰等效果不太在意。
4.因此,现有技术中智能排版的成品观赏度不足。
技术实现要素:
5.本技术的目的在于克服现有技术中智能排版的成品观赏度不足的问题,提供一种基于ai内容自动生成出版物的方法。还涉及一种基于ai内容自动生成出版物的系统。
6.本技术还提供一种基于ai内容自动生成出版物的方法,包括:将待处理数据输入预处理内容模型,生成出版物内容;根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;根据所述出版物内容和所述辅助内容生成出版物预样;将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。
7.可选地,所述预处理模型包括:语音转换模块,或图像识别模块。
8.可选地,所述获得辅助内容包括:基于所述评分进行排序,表达式如下:
9.其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分。所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述是总关系数量;基于所述排序,进行内容关键词的确定。
10.可选地,所述出版物预样,包括图像数据和/或文本数据。
11.可选地,所述根据所述关键词生成辅助内容,包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
12.本技术还提供一种基于ai内容自动生成出版物的系统,包括:处理模块,用于将待处理数据输入预处理内容模型,生成出版物内容;
生成模块,用于根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;预样模块,用于根据所述出版物内容和所述辅助内容生成出版物预样;出版模块,用于将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。
13.可选地,所述预处理模型包括:语音转换模块,或图像识别模块。
14.可选地,所述生成模块获得辅助内容包括:基于所述评分进行排序,表达式如下:
15.其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分。所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述是总关系数量;基于所述排序,进行内容关键词的确定。
16.可选地,所述出版物预样,包括图像数据和/或文本数据。
17.可选地,所述预样模块根据所述关键词生成辅助内容,包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
18.本技术的优点和有益效果:发明点1,自动生成出版物。
19.发明点2,基于输入的图样关键词进行修饰后生成出版物。
20.发明点3,关键词生成辅助内容。
21.本技术提供一种基于ai内容自动生成出版物的方法,包括:将待处理数据输入预处理内容模型,生成出版物内容;根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;根据所述出版物内容和所述辅助内容生成出版物预样;将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。本技术通过智能ai,全过程进行排版,并进一步通过ai进行排版美化,有效提高了智能排版的成品观赏度。
附图说明
22.图1是本技术中基于ai内容自动生成出版物流程示意图。
23.图2是本技术中通用模版的排序和筛选示意图。
24.图3是本技术中执行的逻辑顺序示意图。
25.图4是本技术中基于ai内容自动生成出版物系统结构示意图。
具体实施方式
26.下面结合附图和具体实施例对本技术作进一步说明,以使本领域的技术人员可以更好地理解本技术并能予以实施。
27.本技术提供一种基于ai内容自动生成出版物的方法,包括:将待处理数据输入预
处理内容模型,生成出版物内容;根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;根据所述出版物内容和所述辅助内容生成出版物预样;将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。本技术通过智能ai,全过程进行排版,并进一步通过ai进行排版美化,有效提高了智能排版的成品观赏度。
28.图1是本技术中基于ai内容自动生成出版物流程示意图。
29.请参照图1和图3所示s101将待处理数据输入预处理内容模型,生成出版物内容;所述待处理数据包括:语音识别,图文识别。
30.语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
31.首先对输入语音进行预处理,包括分帧,加窗,预加重等。
32.其次进行特征提取,选择特征参数,包括:基音周期,共振峰,短时平均能量或幅度,线性预测系数(lpc),感知加权预测系数(plp),短时平均过零率,线性预测倒谱系数(lpcc),自相关函数,梅尔倒谱系数(mfcc),小波变换系数,经验模态分解系数(emd),伽马通滤波器系数(gfcc)等。
33.最后基于选择的特征参数进行特征提取,对测试语音按训练过程产生模板,最后根据失真判决准则进行识别。常用的失真判决准则有欧式距离,协方差矩阵与贝叶斯距离等。
34.所述图文识别是指通过ocr软件进行文字识别。
35.通过上述处理,获得出版物内容,所述出版物内容中,还需要进行内容关联,这是由于所述语音识别和图文识别只能将输入数据中的文字内容提取出来,因此还需要将所述文字内容与图片内容进行关联。
36.最后,将文字内容,图像内容以及所述文字和图像的关联合并为出版物内容。
37.请参照图1所示s102根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容。
38.所述出版板式,包括有排版、装帧等内容,是指根据所述出版物内容生成所述排版和装置。
39.具体的,所述排版和装帧是预先设置并存储起来的通用模版,对应于所述通用模版还设置有关联得关键词。
40.在进行所述排版和所述装帧的生成时,需要对所述出版物内容进行内容统计,并基于所述内容统计的结果进行通用模版的排序和筛选,在筛选出的结果基础上进行进一步处理,获得辅助内容。
41.图2是本技术中通用模版的排序和筛选示意图。
42.请参照图2所示,s201首先对所述内容进行内容关键词提取。
43.这些内容关键词可以通过预审的提取规范进行提取,例如只提取名词,只提取动词后的名词等。
44.对所述内容关键词提取完毕后,对所述关键词进行排序,例如根据所述关键词出现的数量进行关键词排序,或者基于所述关键词出现的位置进行关键词排序。优选的,基于位置进行关键词排序,可采用评分法进行:
设置位置权重,例如对段落进行评价,获得段落权重。所述段落权重如下:
45.其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分。所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述是总关系数量。
46.所述a、b和c是预设的大于1的数值,也可以是大于10的数值。然后基于所述评分进行排序,包括:进行排序时,首先进行分数对比,即当前排序排位置为:
47.其中,所述j是新的排序序号。
48.请参照图2所示,s202基于所述排序,进行内容关键词的确定。
49.所述内容关键词的确定就是将重新排序后的所述关键词序列中的前几位进行选择,获得最后的内容关键词。
50.请参照图2所示,s203基于所述内容关键词进行通用模版的排序和筛选。
51.具体的,将所述关键词与所述通用模版关联得关键词进行匹配,将匹配到的所述通用模版进行匹配度的排序,选择匹配度最高的通用模版。
52.请参照图2所示,s204基于所述通用模版生成辅助内容。
53.包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
54.具体的,基于所述通用模版进行模版格式内容的添加,例如添加名词,时间,地址等信息以及各种图像。具体可由工作人员根据实际情况进行确定,在此不再赘述。
55.请参照图1所示s103根据所述出版物内容和所述辅助内容生成出版物预样。
56.具体的,基于所述通用模版,以及所述出版物内容和辅助内容,生成出版物的预样,包括该出版物的全部信息的添加,以及根据所述出版物内容中与图像的关联关系添加图像,根据所述通用模版进行的所述图像的自适应大小,格式的修改等。
57.具体的,所述通用模版基于所述出版物内容是具有不同板块的,将不同板块基于所述出版物内容和出版物辅助内容进行添加,获得最终的出版物。
58.所述预样是由文本格式的一个或者多个文本文件组成,并基于所述通用模版的预设板块顺序进行排序和存储。
59.最后将所述预样输出,并由人工进行调整和进一步规范,生成待处理预的预样。
60.请参照图1所示s104将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。
61.将所述预样图像化,是将所述文本文件转化为图像文件,基于所述图像文件进行最终的修饰的成品输出。
62.具体的,所述图像文件输出后,其内容不能在修改,因此首先需要针对所述成品进行分类。具体的,基于所述通用模版生成的出版物,可分为两个大类,既可修饰部分和不可修饰部分。所述可修饰部分是与所述内容关联小的部分,不可修饰部分为所述关联大的部
分。具体的,进行选择时,根据所述通用模版中输入的所述出版物内容的多少进行确定。
63.基于所述可修饰的部分,首先进行图像识别,识别所述可修饰部分中的不可修改内容,例如文字。识别并提取所述不可修饰内容和可修饰内容,对所述不可修饰内容进行保存。
64.提取所述可修饰内容,计算所述可修饰内容与所述不可修饰内容的关联性,表达式如下:
65.其中,所述l是用于比较的关联性,所述x是所述不可修改内容的中心点横轴坐标,所述y是不可修改内容的中心点纵轴坐标,是可修改内容的多个横轴上的坐标,所述是可修改内容的多和纵轴上的点的坐标。
66.设置阈值,当所述l小于所述阈值时,将所述不可修改内容作为图样关键字进行所述可修改内容的修饰。
67.具体的,可以将所述可修改内容抠出,作为初始图像添加到图像生成网络中,并输入所述内容关键字进行修饰,并输出,包括; 基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
68.最后将所述输出的图像放置到原位置,将所述不可修改内容放置到原位置。
69.最后得到出版物。
70.本技术还提供一种基于ai内容自动生成出版物的系统,包括:处理模块301,生成模块302,预样模块303,出版模块304。
71.请参照图3所示处理模块301,用于将待处理数据输入预处理内容模型,生成出版物内容。
72.所述待处理数据包括:语音识别,图文识别。
73.语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
74.首先对输入语音进行预处理,包括分帧,加窗,预加重等。
75.其次进行特征提取,选择特征参数,包括:基音周期,共振峰,短时平均能量或幅度,线性预测系数(lpc),感知加权预测系数(plp),短时平均过零率,线性预测倒谱系数(lpcc),自相关函数,梅尔倒谱系数(mfcc),小波变换系数,经验模态分解系数(emd),伽马通滤波器系数(gfcc)等。
76.最后基于选择的特征参数进行特征提取,对测试语音按训练过程产生模板,最后根据失真判决准则进行识别。常用的失真判决准则有欧式距离,协方差矩阵与贝叶斯距离等。
77.所述图文识别是指通过ocr软件进行文字识别。
78.通过上述处理,获得出版物内容,所述出版物内容中,还需要进行内容关联,这是由于所述语音识别和图文识别只能将输入数据中的文字内容提取出来,因此还需要将所述文字内容与图片内容进行关联。
79.最后,将文字内容,图像内容以及所述文字和图像的关联合并为出版物内容。
80.请参照图1所示生成模块302,用于根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容。
81.所述出版板式,包括有排版、装帧等内容,是指根据所述出版物内容生成所述排版和装置。
82.具体的,所述排版和装帧是预先设置并存储起来的通用模版,对应于所述通用模版还设置有关联得关键词。
83.在进行所述排版和所述装帧的生成时,需要对所述出版物内容进行内容统计,并基于所述内容统计的结果进行通用模版的排序和筛选,在筛选出的结果基础上进行进一步处理,获得辅助内容。
84.图2是本技术中通用模版的排序和筛选示意图。
85.请参照图2所示,s201首先对所述内容进行内容关键词提取。
86.这些内容关键词可以通过预审的提取规范进行提取,例如只提取名词,只提取动词后的名词等。
87.对所述内容关键词提取完毕后,对所述关键词进行排序,例如根据所述关键词出现的数量进行关键词排序,或者基于所述关键词出现的位置进行关键词排序。优选的,基于位置进行关键词排序,可采用评分法进行:设置位置权重,例如对段落进行评价,获得段落权重。所述段落权重如下:
88.其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分。所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述是总关系数量。
89.所述a、b和c是预设的大于1的数值,也可以是大于10的数值。然后基于所述评分进行排序,包括:进行排序时,首先进行分数对比,即当前排序排位置为:
90.其中,所述j是新的排序序号。
91.请参照图2所示,s202基于所述排序,进行内容关键词的确定。
92.所述内容关键词的确定就是将重新排序后的所述关键词序列中的前几位进行选择,获得最后的内容关键词。
93.请参照图2所示,s203基于所述内容关键词进行通用模版的排序和筛选。
94.具体的,将所述关键词与所述通用模版关联得关键词进行匹配,将匹配到的所述通用模版进行匹配度的排序,选择匹配度最高的通用模版。
95.请参照图2所示,s204基于所述通用模版生成辅助内容。
96.包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
97.具体的,基于所述通用模版进行模版格式内容的添加,例如添加名词,时间,地址
等信息以及各种图像。具体可由工作人员根据实际情况进行确定,在此不再赘述。
98.请参照图1所示预样模块303,用于根据所述出版物内容和所述辅助内容生成出版物预样。
99.具体的,基于所述通用模版,以及所述出版物内容和辅助内容,生成出版物的预样,包括该出版物的全部信息的添加,以及根据所述出版物内容中与图像的关联关系添加图像,根据所述通用模版进行的所述图像的自适应大小,格式的修改等。
100.具体的,所述通用模版基于所述出版物内容是具有不同板块的,将不同板块基于所述出版物内容和出版物辅助内容进行添加,获得最终的出版物。
101.所述预样是由文本格式的一个或者多个文本文件组成,并基于所述通用模版的预设板块顺序进行排序和存储。
102.最后将所述预样输出,并由人工进行调整和进一步规范,生成待处理预的预样。
103.请参照图1所示出版模块304,用于将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。
104.将所述预样图像化,是将所述文本文件转化为图像文件,基于所述图像文件进行最终的修饰的成品输出。
105.具体的,所述图像文件输出后,其内容不能在修改,因此首先需要针对所述成品进行分类。具体的,基于所述通用模版生成的出版物,可分为两个大类,既可修饰部分和不可修饰部分。所述可修饰部分是与所述内容关联小的部分,不可修饰部分为所述关联大的部分。具体的,进行选择时,根据所述通用模版中输入的所述出版物内容的多少进行确定。
106.基于所述可修饰的部分,首先进行图像识别,识别所述可修饰部分中的不可修改内容,例如文字。识别并提取所述不可修饰内容和可修饰内容,对所述不可修饰内容进行保存。
107.提取所述可修饰内容,计算所述可修饰内容与所述不可修饰内容的关联性,表达式如下:
108.其中,所述l是用于比较的关联性,所述x是所述不可修改内容的中心点横轴坐标,所述y是不可修改内容的中心点纵轴坐标,是可修改内容的多个横轴上的坐标,所述是可修改内容的多和纵轴上的点的坐标。
109.设置阈值,当所述l小于所述阈值时,将所述不可修改内容作为图样关键字进行所述可修改内容的修饰。
110.具体的,可以将所述可修改内容抠出,作为初始图像添加到图像生成网络中,并输入所述内容关键字进行修饰,并输出,包括; 基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
111.最后将所述输出的图像放置到原位置,将所述不可修改内容放置到原位置。
112.最后得到出版物。
113.以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例
对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
技术特征:
1.一种基于ai内容自动生成出版物的方法,其特征在于,包括:将待处理数据输入预处理内容模型,生成出版物内容;根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;根据所述出版物内容和所述辅助内容生成出版物预样;将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。2.根据权利要求1所述的基于ai内容自动生成出版物的方法,其特征在于,所述预处理模型包括:语音转换模块,或图像识别模块。3.根据权利要求1所述基于ai内容自动生成出版物的方法,其特征在于,所述获得辅助内容包括:基于所述评分进行排序,表达式如下:;其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分;所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述是总关系数量;基于所述排序,进行内容关键词的确定。4.根据权利要求1所述基于ai内容自动生成出版物的方法,其特征在于,所述出版物预样,包括图像数据和/或文本数据。5.根据权利要求1所述基于ai内容自动生成出版物的方法,其特征在于,所述根据所述关键词生成辅助内容,包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。6.一种如权利要求1-5任一项所述的基于ai内容自动生成出版物的方法的系统,其特征在于,包括:处理模块,用于将待处理数据输入预处理内容模型,生成出版物内容;生成模块,用于根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;预样模块,用于根据所述出版物内容和所述辅助内容生成出版物预样;出版模块,用于将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。7.根据权利要求6所述的系统,其特征在于,所述预处理模型包括:语音转换模块,或图像识别模块。8.根据权利要求6所述的系统,其特征在于,所述生成模块获得辅助内容包括:基于所述评分进行排序,表达式如下:;其中,所述是评价的分数,所述a是字数总分,所述b是关系总分,所述c是赋分;所述h是关键词数量,所述i是关键词的序号,所述g是关系数量,所述是总关键词数量,所述
是总关系数量;基于所述排序,进行内容关键词的确定。9.根据权利要求6所述的系统,其特征在于,所述出版物预样,包括图像数据和/或文本数据。10.根据权利要求6所述的系统,其特征在于,所述预样模块根据所述关键词生成辅助内容,包括:基于一个或者多个关键词生成图像,根据一个或者多个关键词生成描述。
技术总结
本申请提供一种基于AI内容自动生成出版物的方法及系统,人工智能领域,该方法包括:将待处理数据输入预处理内容模型,生成出版物内容;根据所述内容匹配出版物板式,并提取基于所述板式预设的关键词,根据所述关键词生成辅助内容;根据所述出版物内容和所述辅助内容生成出版物预样;将所述预样图像化,并基于输入的图样关键词进行修饰后生成出版物。本申请通过智能AI,全过程进行排版,并进一步通过AI进行排版美化,有效提高了智能排版的成品观赏度。度。度。
技术研发人员:韩阳 付鹏 罗庚 齐书稳 王殿武 周彦彬 张文超 潘恒 张珂
受保护的技术使用者:中信联合云科技有限责任公司
技术研发日:2023.07.13
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
