夏季登陆中国台风数量预测模型的训练方法和预测方法
未命名
08-12
阅读:221
评论:0

1.本公开涉及气象观测技术领域,尤其涉及机器学习、人工智能等技术领域,尤其涉及一种夏季登陆中国台风数量预测模型的训练方法、夏季登陆中国台风数量的预测方法、装置、电子设备和存储介质。
背景技术:
2.台风经常在夏季(6-8月)登陆中国,造成了严重的气象灾害。登陆台风的季节预测不仅是中国防灾减灾的迫切需求,也是台风研究的热点和难点。夏季登陆中国台风的数量较多且登陆地点分布较广,不仅华南常有台风登陆,而且华北也时有台风登陆。目前,夏季登陆中国不同区域台风数量的预测技巧有待提高。
技术实现要素:
3.鉴于上述问题,本公开提供了一种夏季登陆中国台风数量预测模型的训练方法、夏季登陆中国台风数量的预测方法、装置、设备、介质和程序产品。
4.根据本公开的第一个方面,提供了一种夏季登陆中国台风数量预测模型的训练方法,包括:生成样本数据,所述样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;将所述样本数据输入初始夏季登陆中国台风数量预测模型,得到与所述样本数据对应的输出结果,所述输出结果包括第八数值和第九数值;以及根据所述输出结果、与所述输出结果对应的实际观测结果和损失函数值,调整所述初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型;其中,所述第一数值为:第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值;所述第二数值为:第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值;所述第三数值为:第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值;所述第四数值为:第八目标区域在第一预设时段的海表温度平均值;所述第五数值为:第九目标区域在第一预设时段的海冰浓度平均值;所述第六数值为:第二预设时段登陆第十目标区域的台风数量;所述第七数值为:第二预设时段登陆第十一目标区域的台风数量,所述第十一目标区域为所述第十目标区域的子区域;所述第八数值为第三预设时段登陆所述第十目标区域的台风数量,所述第九数值为第三预设时段登陆所述第十一目标区域的台风数量。
5.根据本公开的实施例,所述初始夏季登陆中国台风数量预测模型包括长短期记忆神经网络和全连接层。
6.根据本公开的实施例,所述模型参数包括:学习率、迭代运算次数、每次迭代运算的样本数据个数、所述长短期记忆神经网络的神经元权重、所述长短期记忆神经网络的偏置值、所述全连接层的神经元权重和所述全连接层的偏置值中的一种或多种。
7.根据本公开的实施例,所述方法还包括:利用正交矩阵初始化方法设置所述长短期记忆神经网络的神经元权重的初值;以及利用正态分布初始化方法设置所述全连接层的神经元权重的初值。
8.根据本公开的第二个方面,提供了一种夏季登陆中国台风数量的预测方法,包括:将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果;其中,所述输出结果包括第一输出值和第二输出值,所述第一输出值为所述第二目标时段登陆第一目的区域的台风数量,所述第二输出值为所述第二目标时段登陆第二目的区域的台风数量,所述第二目的区域为所述第一目的区域的子区域;所述目标夏季登陆中国台风数量预测模型是根据本公开提供的方法训练的。
9.根据本公开的实施例,所述夏季登陆中国台风数量的预测方法还包括:根据所述第一输出值和所述第二输出值,确定第三计算值;其中,所述第三计算值为所述第二目标时段登陆第三目的区域的台风数量,所述第三目的区域为所述第一目的区域的子区域。
10.本公开的第三方面提供了一种夏季登陆中国台风数量预测模型的训练装置,包括:生成模块,用于生成样本数据,所述样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;第一获得模块,用于将所述样本数据输入初始夏季登陆中国台风数量预测模型,得到与所述样本数据对应的输出结果,所述输出结果包括第八数值和第九数值;以及第二获得模块,用于根据所述输出结果、与所述输出结果对应的实际观测结果和损失函数值,调整所述初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型;其中,所述第一数值为:第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值;所述第二数值为:第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值;所述第三数值为:第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值;所述第四数值为:第八目标区域在第一预设时段的海表温度平均值;所述第五数值为:第九目标区域在第一预设时段的海冰浓度平均值;所述第六数值为:第二预设时段登陆第十目标区域的台风数量;所述第七数值为:第二预设时段登陆第十一目标区域的台风数量,所述第十一目标区域为所述第十目标区域的子区域;所述第八数值为第三预设时段登陆所述第十目标区域的台风数量,所述第九数值为第三预设时段登陆所述第十一目标区域的台风数量。
11.本公开的第四方面提供了一种夏季登陆中国台风数量的预测装置,包括:第三获得模块,用于将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果;其中,所述输出结果包括第一输出值和第二输出值,所述第一输出值为所述第二目标时段登陆第一目的区域的台风数量,所述第二输出值为所述第二目标时段登陆第二目的区域的台风数量,所述第二目的区域为所述第一目的区域的子区域;所述目标夏季登陆中国台风数量预测模型是根据本公开提供的装置训练的。
12.本公开的第五方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述公开的方法。
13.本公开的第六方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述公开的方法。
附图说明
14.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
15.图1示意性示出了根据本公开实施例的夏季登陆中国台风数量预测模型的训练方法的流程图;
16.图2示意性示出了根据本公开实施例的夏季登陆中国台风数量的预测方法的流程图;
17.图3示意性示出了根据本公开实施例的夏季登陆中国台风数量预测模型的训练装置的结构框图;
18.图4示意性示出了根据本公开实施例的夏季登陆中国台风数量的预测装置的结构框图;以及
19.图5示意性示出了根据本公开实施例的适于实现夏季登陆中国台风数量预测模型的训练方法和/或夏季登陆中国台风数量的预测方法的电子设备的方框图。
具体实施方式
20.以下,将参照附图来描述本公开的实施例。需要说明的是,台风在本公开中可以泛指热带气旋。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
21.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
22.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
23.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
24.本公开的实施例提供了一种夏季登陆中国台风数量预测模型的训练方法和装置,生成样本数据,样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;将样本数据输入初始夏季登陆中国台风数量预测模型,得到与样本数据对应的输出结果,输出结果包括第八数值和第九数值;以及根据输出结果、与输出结果对应的实际观测结果和损失函数值,调整初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模
型。通过图1对公开实施例的夏季登陆中国台风数量预测模型的训练方法进行详细描述。
25.图1示意性示出了根据本公开实施例的夏季登陆中国台风数量预测模型的训练方法的流程图。
26.如图1所示,该方法100可以包括操作s101~操作s103。
27.在操作s101,生成样本数据,样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值。
28.可以利用观测数据(如ibtracs台风数据,hadley海表温度和海冰浓度数据)生成样本数据,作为预测因子x1-xn的年际数据。如x1-x7,即第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值。
29.x1可以为第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值。例如,某一年的春季(3-5月)地理区域(60
°
e-90
°
e,15
°
s-25
°
s)海表温度平均值-春季(3-5月)地理区域(125
°
e-145
°
e,5
°
n-15
°
n)海表温度平均值。
30.x2可以为第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值。例如,某一年的春季(3-5月)地理区域(140
°
w-170
°
w,5
°
s-5
°
n)海表温度平均值-春季(3-5月)地理区域(125
°
e-145
°
e,5n
°‑
15
°
n)海表温度平均值。
31.x3可以为第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值。例如,某一年的春季(3-5月)地理区域(30
°
w-50
°
w,45
°
n-55
°
n)海表温度平均值+春季(3-5月)地理区域(25
°
w-45
°
w,5
°
n-15
°
n)海表温度平均值-春季(3-5月)地理区域(40
°
w-70
°
w,25
°
n-40
°
n)海表温度平均值
×
2。
32.x4可以为第八目标区域在第一预设时段的海表温度平均值。例如,某一年的春季(3-5月)地理区域(130
°
e-160
°
e,45
°
s-55
°
s)海表温度平均值。
33.x5可以为第九目标区域在第一预设时段的海冰浓度平均值。例如,某一年的春季(3-5月)地理区域(165
°
w-179
°
w,60
°
n-66
°
n)海冰浓度平均值。
34.x6可以为第二预设时段登陆第十目标区域的台风数量。例如,某一年的夏季(6-8月)登陆中国全域台风数量。
35.x7可以为第二预设时段登陆第十一目标区域的台风数量,第十一目标区域为第十目标区域的子区域。例如,某一年的夏季(6-8月)登陆中国厦门以北区域的台风数量。
36.需要说明的是,x1-x7这七个预测因子的年际数据可以为预测模型的输入样本数据。针对不同组的年际数据,可以理解,两组年际数据之间属于不同年份。多组年际数据如为2018年内的观测数据、2019年内的观测数据和2020年内的观测数据;多组年际数据也可以为2016年内的观测数据、2017年内的观测数据、2018年内的观测数据和2019年内的观测数据。在此对具体年份不作限定,多组年际数据为连续年份的数据。第三预设时段实际登陆第十目标区域的台风数量y1和第三预设时段实际登陆第十一目标区域的台风数量y2可以为训练时一并输入预测模型的标签数据。第三预设时段可以指相对于多组年际数据中最大年际数据(2020>2019>2018>2017>2016)的后(未来)一年的夏季(6-8月)。例如,若多组年际数据如为2018年内的观测数据、2019年内的观测数据和2020年内的观测数据;则第三
预设时段为2021年夏季。例如,多组年际数据也可以为2016年内的观测数据、2017年内的观测数据、2018年内的观测数据和2019年内的观测数据;则第三预设时段为2020年夏季。
37.在操作s102,将样本数据输入初始夏季登陆中国台风数量预测模型,得到与样本数据对应的输出结果,输出结果包括第八数值和第九数值。
38.在操作s103,根据输出结果、与输出结果对应的实际观测结果和损失函数值,调整初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型。
39.第八数值p1为第三预设时段登陆第十目标区域的台风数量,第九数值p2为第三预设时段登陆第十一目标区域的台风数量。
40.例如,模型参数可以包括:学习率、迭代运算次数、每次迭代运算的样本数据个数、长短期记忆神经网络的神经元权重、长短期记忆神经网络的偏置值、全连接层的神经元权重和全连接层的偏置值中的一种或多种。
41.例如,初始夏季登陆中国台风数量预测模型可以包括长短期记忆神经网络和全连接层。
42.例如,该长短期记忆神经网络设置隐含层和dropout等参数。例如,设置两个隐含层,第1和第2个隐含层分别有128和64个神经元;使用dropout方法,其随机丢失率设置为0.2;网络设置为单向。
43.例如,在长短期记忆神经网络的输出端接入该全连接层:设置全连接层结构。如设置二层,第1和第2层分别有32和2个神经元。设置激活函数,如激活函数为relu。设置正则化方法,如使用dropout方法,其随机丢失率设置为0.2。
44.例如,预处理时分别将输入数据x1-x7、y1和y2归一化。归一化计算公式为:其中u为归一化结果,s为输入数据,int()为获取数值整数部分的函数,se为s中的最大绝对值。
45.例如,得到人工神经网络输出数据o1和o2后,分别将它们反归一化。反归一化计算公式为:公式中,v为反归一化结果(预测模型的预测结果),r为人工神经网络输出数据,int()为获取数值整数部分的函数,pe为y1或y2中的最大绝对值。从而,得到预测模型的预测结果第八数值p1和第九数值p2。
46.针对调整初始夏季登陆中国台风数量预测模型的模型参数,举例来说。
47.如利用连续三年(2018、2019、2020)的预测因子x1-x7,来预测其后1年(2021)夏季登陆中国全域和中国厦门以北区域的台风数量。
48.可以将样本数据划分为训练集和测试集。如可以将时间较早且连续的较多组样本数据作为训练集,可以将时间较晚且连续的较少组样本数据作为测试集。如训练集有130组,测试集有5组。
49.s1、设置学习率(例如:初始学习率设置为0.01,并采用cosineannealinglr方法动态调整学习率,迭代运算次数(例如:300000)、每次迭代运算的batch_size(即每次迭代运算的样本数据组数,例如:130)、损失函数阈值(例如:0.001)、损失函数(例如:均方误差)、优化器(例如:ranger)等。可以令n1=0。
50.s2、设置长短期记忆神经网络的神经元权重和偏置的初值(例如:利用正交矩阵初
始化方法设置神经元权重初值,设置所有偏置初值为0);设置全连接层的神经元权重和偏置的初值(例如:利用kaiming正态分布初始化方法设置神经元权重初值,设置所有偏置初值为0)。可以令n2=0。
51.s3、利用训练集对预测模型进行多轮次的迭代训练(可以使用gpu加速训练)。
52.1):计算每次迭代训练的预测结果和台风观测数据(即与输出结果对应的实际观测结果)的相关系数和平均绝对误差:计算第八数值p1与观测的后一年夏季登陆中国全域台风数量的相关系数(c1)和平均绝对误差(e1),第九数值p2与观测的夏季登陆中国厦门以北区域台风数量的相关系数(c2)和平均绝对误差(e2)。进一步计算p3(夏季登陆中国厦门以南区域的预测结果:p1-p2)与观测的夏季登陆中国厦门以南区域台风数量的相关系数(c3)和平均绝对误差(e3)。
53.2):检查每次迭代训练的相关系数、平均绝对误差及对应的损失函数值:若上述相关系数大于一设定正数(例如c1、c2、c3的设定正数为0.9)、上述平均绝对误差小于一设定正数(例如e1、e2、e3的设定正数为1)且对应的损失函数值小于上述设定的损失函数阈值,则记录预测模型参数。
54.s4、利用测试集对训练后的预测模型进行测试。
55.1):逐个加载上一步记录的预测模型参数并计算得到预测结果pp1和pp2。计算pp1与观测的夏季登陆中国全域台风数量的相关系数(cc1)和平均绝对误差(ee1),pp2与观测的夏季登陆中国厦门以北区域台风数量的相关系数(cc2)和平均绝对误差(ee2),计算pp3(夏季登陆中国厦门以南区域的预测结果:pp1-pp2。)与观测的夏季登陆中国厦门以南区域台风数量的相关系数(cc3)和平均绝对误差(ee3);
56.2):检查上一步的相关系数、平均绝对误差:若上述相关系数大于一设定正数(实施例的cc1、cc2、cc3的设定正数为0.98)且上述平均绝对误差小于一设定正数(实施例的ee1、ee2、ee3的设定正数为0.85),则将预测模型的全部信息保存至1个文件且将n2的数值加1。
57.s5、检查n1和n2的数值。若n2大于或等于一设定正整数(如实施例为1),则将n1的数值加1。若n1小于一设定正整数(如实施例为1),则返回第s2步;否则,将s4步得到的预测模型作为训练好的夏季登陆中国台风数量的预测模型,以备预测。
58.本实施例提供的夏季登陆中国台风数量预测模型的训练方法,所得到的夏季登陆中国台风数量预测模型,可以用于得到5年的测试预测结果。例如,利用实施例的训练方法得到的1个夏季登陆中国台风数量预测模型可以用于得到2018-2022年测试预测结果,夏季登陆中国全域的预测结果与其对应的观测结果的相关系数为0.99、平均绝对误差约为0.82,夏季登陆中国厦门以北区域的预测结果与其相对应的观测结果的相关系数约为0.98、平均绝对误差约为0.52,夏季登陆中国厦门以南区域的预测结果与其相对应的观测结果的相关系数约为1、平均绝对误差约为0.57。因此,本发明对夏季登陆中国不同区域台风数量具有较高的预测技巧。
59.本实施例提供的夏季登陆中国台风数量预测模型的训练方法,可以提供一种夏季登陆中国台风数量的预测模型,该训练好的模型例如可以用于执行具体任务。如得到目标夏季登陆中国台风数量预测模型可以根据输入的7个预测因子自动化地执行第三预设时段登陆第十目标区域的台风数量和第三预设时段登陆第十一目标区域的台风数量的预测任
务,有利于提高任务执行的准确率和效率。
60.通过图2对公开实施例的夏季登陆中国台风数量的预测方法进行详细描述。
61.图2示意性示出了根据本公开实施例的夏季登陆中国台风数量的预测方法的流程图。
62.如图2所示,该方法200可以包括操作s201。
63.在操作s201,将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果。
64.例如,输出结果包括第一输出值和第二输出值,第一输出值为第二目标时段登陆第一目的区域的台风数量,第二输出值为第二目标时段登陆第二目的区域的台风数量,第二目的区域为第一目的区域的子区域。
65.例如预测2024年夏季登陆中国全域的台风数量和登陆中国厦门以北区域的台风数量。则第一目标时段可以为2021、2022和2023年的目标观测数据。目标观测数据可以包括预测因子x1-x7。
66.例如,目标夏季登陆中国台风数量预测模型是根据本公开提供的方法训练的。
67.例如,目标夏季登陆中国台风数量预测模型是根据本公开提供的方法100训练的。
68.由于目标夏季登陆中国台风数量预测模型是根据上述的夏季登陆中国台风数量预测模型的训练方法训练得到的,因此目标机器学习模型在执行夏季登陆中国台风数量的预测任务时可以得到夏季登陆中国不同区域台风数量的预测结果。本公开实施例提供的夏季登陆中国台风数量的预测方法通过将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的较为准确的夏季登陆中国不同区域台风数量的预测结果。相关的原理和技术效果可以参照上述夏季登陆中国台风数量预测模型的训练方法的实施例的说明,在此不再赘述。
69.夏季登陆中国台风数量的预测方法还包括:根据第一输出值和第二输出值,确定第三计算值;其中,第三计算值为第二目标时段登陆第三目的区域的台风数量,第三目的区域为第一目的区域的子区域。
70.可以理解,例如第一输出值与第二输出值的差值为第三计算值。
71.例如第一目的区域为中国全域,第二目的区域为中国厦门以北区域,则第三目的区域为中国厦门以南区域。
72.进一步的,针对调整初始夏季登陆中国台风数量预测模型的模型参数,可以保留多个目标夏季登陆中国台风数量预测模型。可以通过多个目标夏季登陆中国台风数量预测模型,得到多个与第二目标时段对应的输出结果。然后,计算平均数,将该平均数作为最终的预测结果。
73.本实施例提供的夏季登陆中国台风数量的预测方法,改进了以往登陆中国台风季节预测中缺乏分区域预测的不足之处,有助于促进台风季节预测的智能化,也有助于防灾减灾。
74.图3示意性示出了根据本公开实施例的夏季登陆中国台风数量预测模型的训练装置的结构框图。
75.如图3所示,该实施例的夏季登陆中国台风数量预测模型的训练装置300包括生成模块310、第一获得模块320和第二获得模块330。
76.生成模块310,用于生成样本数据,所述样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;第一获得模块320,用于将所述样本数据输入初始夏季登陆中国台风数量预测模型,得到与所述样本数据对应的输出结果,所述输出结果包括第八数值和第九数值;以及第二获得模块330,用于根据所述输出结果、与所述输出结果对应的实际观测结果和损失函数值,调整所述初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型;其中,所述第一数值为:第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值;所述第二数值为:第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值;所述第三数值为:第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值;所述第四数值为:第八目标区域在第一预设时段的海表温度平均值;所述第五数值为:第九目标区域在第一预设时段的海冰浓度平均值;所述第六数值为:第二预设时段登陆第十目标区域的台风数量;所述第七数值为:第二预设时段登陆第十一目标区域的台风数量,所述第十一目标区域为所述第十目标区域的子区域;所述第八数值为第三预设时段登陆所述第十目标区域的台风数量,所述第九数值为第三预设时段登陆所述第十一目标区域的台风数量。
77.在一些实施例中,所述初始夏季登陆中国台风数量预测模型包括长短期记忆神经网络和全连接层。
78.在一些实施例中,所述模型参数包括:学习率、迭代运算次数、每次迭代运算的样本数据个数、所述长短期记忆神经网络的神经元权重、所述长短期记忆神经网络的偏置值、所述全连接层的神经元权重和所述全连接层的偏置值中的一种或多种。
79.在一些实施例中,所述装置还包括:第一设置模块,用于利用正交矩阵初始化方法设置所述长短期记忆神经网络的神经元权重的初值;以及第二设置模块,用于利用正态分布初始化方法设置所述全连接层的神经元权重的初值。
80.根据本公开的实施例,生成模块310、第一获得模块320和第二获得模块330中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,生成模块310、第一获得模块320和第二获得模块330中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,生成模块310、第一获得模块320和第二获得模块330中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
81.图4示意性示出了根据本公开实施例的夏季登陆中国台风数量的预测装置的结构框图。
82.如图4所示,该实施例的夏季登陆中国台风数量的预测装置400包括第三获得模块410。
83.第三获得模块410,用于将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果;其中,所述输出结果包括第一输出值和第二输出值,所述第一输出值为所述第二目标时段登陆第一目的区域的台风数量,所述第二输出值为所述第二目标时段登陆第二目的区域的台风数量,所述第二目的区域为所述第一目的区域的子区域。
84.例如,所述夏季登陆中国台风数量预测模型是根据本公开提供的装置训练的。
85.在一些实施例中,所述装置还包括:计算模块,用于根据所述第一输出值和所述第二输出值,确定第三计算值;其中,所述第三计算值为所述第二目标时段登陆第三目的区域的台风数量,所述第三目的区域为所述第一目的区域的子区域。
86.根据本公开的实施例,第三获得模块410中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第三获得模块410中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第三获得模块410中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
87.图5示意性示出了根据本公开实施例的适于实现夏季登陆中国台风数量预测模型的训练方法和/或夏季登陆中国台风数量的预测方法的电子设备的方框图。
88.如图5所示,根据本公开实施例的电子设备500包括处理器501,其可以根据存储在只读存储器(rom)502中的程序或者从存储部分508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理。处理器501例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器501还可以包括用于缓存用途的板载存储器。处理器501可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
89.在ram 503中,存储有电子设备500操作所需的各种程序和数据。处理器501、rom502以及ram 503通过总线504彼此相连。处理器501通过执行rom 502和/或ram 503中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 502和ram 503以外的一个或多个存储器中。处理器501也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
90.根据本公开的实施例,电子设备500还可以包括输入/输出(i/o)接口505,输入/输出(i/o)接口505也连接至总线504。电子设备500还可以包括连接至i/o接口505的以下部件中的一项或多项:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至i/o接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
91.本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
92.根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 502和/或ram 503和/或rom 502和ram 503以外的一个或多个存储器。
93.本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的夏季登陆中国台风数量预测模型的训练方法和/或夏季登陆中国台风数量的预测方法。
94.在该计算机程序被处理器501执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
95.在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分509被下载和安装,和/或从可拆卸介质511被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
96.在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被处理器501执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
97.根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c++,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
98.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所
标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
99.本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
100.以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
技术特征:
1.一种夏季登陆中国台风数量预测模型的训练方法,包括:生成样本数据,所述样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;将所述样本数据输入初始夏季登陆中国台风数量预测模型,得到与所述样本数据对应的输出结果,所述输出结果包括第八数值和第九数值;以及根据所述输出结果、与所述输出结果对应的实际观测结果和损失函数值,调整所述初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型;其中,所述第一数值为:第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值;所述第二数值为:第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值;所述第三数值为:第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值;所述第四数值为:第八目标区域在第一预设时段的海表温度平均值;所述第五数值为:第九目标区域在第一预设时段的海冰浓度平均值;所述第六数值为:第二预设时段登陆第十目标区域的台风数量;所述第七数值为:第二预设时段登陆第十一目标区域的台风数量,所述第十一目标区域为所述第十目标区域的子区域;所述第八数值为第三预设时段登陆所述第十目标区域的台风数量,所述第九数值为第三预设时段登陆所述第十一目标区域的台风数量。2.根据权利要求1所述的方法,其中,所述初始夏季登陆中国台风数量预测模型包括长短期记忆神经网络和全连接层。3.根据权利要求2所述的方法,所述模型参数包括:学习率、迭代运算次数、每次迭代运算的样本数据个数、所述长短期记忆神经网络的神经元权重、所述长短期记忆神经网络的偏置值、所述全连接层的神经元权重和所述全连接层的偏置值中的一种或多种。4.根据权利要求3所述的方法,还包括:利用正交矩阵初始化方法设置所述长短期记忆神经网络的神经元权重的初值;以及利用正态分布初始化方法设置所述全连接层的神经元权重的初值。5.一种夏季登陆中国台风数量的预测方法,包括:将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果;其中,所述输出结果包括第一输出值和第二输出值,所述第一输出值为所述第二目标时段登陆第一目的区域的台风数量,所述第二输出值为所述第二目标时段登陆第二目的区域的台风数量,所述第二目的区域为所述第一目的区域的子区域;所述目标夏季登陆中国台风数量预测模型是根据权利要求1至4任一项所述的方法训练的。6.根据权利要求5所述的方法,还包括:根据所述第一输出值和所述第二输出值,确定第三计算值;
其中,所述第三计算值为所述第二目标时段登陆第三目的区域的台风数量,所述第三目的区域为所述第一目的区域的子区域。7.一种夏季登陆中国台风数量预测模型的训练装置,包括:生成模块,用于生成样本数据,所述样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;第一获得模块,用于将所述样本数据输入初始夏季登陆中国台风数量预测模型,得到与所述样本数据对应的输出结果,所述输出结果包括第八数值和第九数值;以及第二获得模块,用于根据所述输出结果、与所述输出结果对应的实际观测结果和损失函数值,调整所述初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型;其中,所述第一数值为:第一目标区域在第一预设时段的海表温度平均值与第二目标区域在第一预设时段的海表温度平均值之间的差值;所述第二数值为:第三目标区域在第一预设时段的海表温度平均值与第四目标区域在第一预设时段的海表温度平均值之间的差值;所述第三数值为:第五目标区域在第一预设时段的海表温度平均值和第六目标区域在第一预设时段的海表温度平均值之间的和值,与,二倍的第七目标区域在第一预设时段的海表温度平均值,之间的差值;所述第四数值为:第八目标区域在第一预设时段的海表温度平均值;所述第五数值为:第九目标区域在第一预设时段的海冰浓度平均值;所述第六数值为:第二预设时段登陆第十目标区域的台风数量;所述第七数值为:第二预设时段登陆第十一目标区域的台风数量,所述第十一目标区域为所述第十目标区域的子区域;所述第八数值为第三预设时段登陆所述第十目标区域的台风数量,所述第九数值为第三预设时段登陆所述第十一目标区域的台风数量。8.一种夏季登陆中国台风数量的预测装置,包括:第三获得模块,用于将第一目标时段的目标观测数据输入目标夏季登陆中国台风数量预测模型,得到与第二目标时段对应的输出结果;其中,所述输出结果包括第一输出值和第二输出值,所述第一输出值为所述第二目标时段登陆第一目的区域的台风数量,所述第二输出值为所述第二目标时段登陆第二目的区域的台风数量,所述第二目的区域为所述第一目的区域的子区域;所述目标夏季登陆中国台风数量预测模型是根据权利要求7所述的装置训练的。9.一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~6中任一项所述的方法。10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。
技术总结
本公开提供了一种夏季登陆中国台风数量预测模型的训练方法。该夏季登陆中国台风数量预测模型的训练方法包括:生成样本数据,样本数据包括:多组年际数据,每一组年际数据包括属于同一年的第一数值、第二数值、第三数值、第四数值、第五数值、第六数值和第七数值;将样本数据输入初始夏季登陆中国台风数量预测模型,得到与样本数据对应的输出结果,输出结果包括第八数值和第九数值;以及根据输出结果、与输出结果对应的实际观测结果和损失函数值,调整初始夏季登陆中国台风数量预测模型的模型参数,得到目标夏季登陆中国台风数量预测模型。本公开还提供了一种夏季登陆中国台风数量的预测方法、装置、设备和存储介质。设备和存储介质。设备和存储介质。
技术研发人员:王磊 陈光华 王林 周连童
受保护的技术使用者:中国科学院大气物理研究所
技术研发日:2023.05.10
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/