一种风光数据生成模型构建方法及风光数据生成方法与流程
未命名
09-14
阅读:91
评论:0

1.本发明涉及气象预报技术领域,尤其涉及一种风光数据生成模型构建方法及风光数据生成方法。
背景技术:
2.当前的风光资源分析大多以中尺度再分析气象数据集进行,空间分辨率比较低,一般在几十至上百公里,但是在如今新能源场站工程建设的大潮下,对精细化资源评估的需求越来越大,以低空间分辨率的中尺度气象数据集为出发点的评估方案无法满足工程需求。
3.现有技术中,降尺度精细化方法有统计降尺度和动力降尺度。其中,统计降尺度仅仅从数据统计的角度上进行分析,缺乏坚实的理论基础支撑。而现有的动力降尺度是用中尺度数据集(几十至上百公里空间分辨率)驱动气象模式进行模拟,将模式格点大小设置得较小(几公里),完成动力降尺度、提高空间分辨率的目的,此时需要耗费巨大的算力和时间,效率较低。
技术实现要素:
4.为对中尺度风光数据进行降尺度分析,提高降尺度分析效率,本发明提出了一种风光数据生成模型构建方法及风光数据生成方法。
5.第一方面,本发明提供了一种风光数据生成模型构建方法,方法包括:获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组合;对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据;将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入至第一地球系统耦合模式中,得到目标区域的多个降尺度风光数据;将第二中尺度风光历史数据作为初始风光数据生成模型的输入,各降尺度风光数据作为初始风光数据生成模型的输出,训练初始风光数据生成模型,得到最终的风光数据生成模型。
6.考虑到相关技术中,在对中尺度风光数据进行降尺度时,需要将中尺度风光数据驱动气象模式进行模拟,从而完成降尺度、提高空间分辨率的目的,在该过程中需要耗费巨大的算力和时间成本,因此,通过上述方法,利用中尺度风光历史数据、地球系统耦合模式模拟得到降尺度风光数据,根据中尺度风光历史数据、降尺度风光数据训练初始风光数据生成模型,得到最终的风光数据生成模型。进一步的,利用风光数据生成模型即可快速对中尺度风光数据进行降尺度计算,提高降尺度分析效率。
7.在一种可选的实施方式中,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据,包括:计算各第一中尺度风光历史数据的平均值;
根据平均值,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
8.在一种可选的实施方式中,根据平均值,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据,包括:将各第一中尺度风光历史数据与平均值作差,得到多个第一差值;对各第一差值进行聚类,得到多个聚类簇;计算各第一差值与所属聚类簇的聚类中心之间的距离;根据各距离,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
9.在一种可选的实施方式中,根据各距离,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据,包括:将各距离按照从小到大进行排序,选择排序靠前的预设数量的距离;将排序靠前的预设数量的距离对应的第一中尺度风光历史数据作为第二中尺度风光历史数据。
10.在一种可选的实施方式中,获取区域地形数据的步骤包括:获取目标区域的下垫面数据;根据下垫面数据,获得区域地形数据。
11.在一种可选的实施方式中,第一初始场包括多个第二初始场,获取各第二初始场的步骤包括:获取目标区域的全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据;根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,获得第三初始场;对第三初始场进行扰动处理,得到多个第二初始场。
12.在一种可选的实施方式中,第一边界场组合包括多个第二边界场组合,获取第二边界场组合的步骤包括:分别根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,确定全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场;在全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场中,选择至少两个边界场构成第二边界场组合。
13.在一种可选的实施方式中,第一地球系统耦合模式包括多个第二地球系统耦合模式,第二地球系统耦合模式包括多个不同类型的分量模式,不同的第二地球系统耦合模式对应的分量模式不同,获取第二地球系统耦合模式的步骤包括:确定目标区域在第二地球系统耦合模式中的多个构成分量;对于每一个构成分量,选择构成分量对应的分量模式;将各分量模式进行耦合,得到第二地球系统耦合模式。
14.在一种可选的实施方式中,第一参数化方案组合包括多个第二参数化方案组合,将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入至第一地球系
统耦合模式中,得到目标区域的多个降尺度风光数据,包括:将区域地形数据、各第二初始场、各第二边界场组合和各第二参数化方案组合,输入至各第二地球系统耦合模式中,得到多个降尺度风光数据。
15.第二方面,本发明还提供了一种风光数据生成方法,该方法包括:获取目标区域的中尺度风光数据;将中尺度风光数据输入至风光数据生成模型中,得到降尺度风光数据,风光数据生成模型是通过第一方面或第一方面任一实施方式中的风光数据生成模型构建方法获得的。
16.第三方面,本发明还提供了一种风光数据生成模型构建装置,该装置包括:第一获取模块,用于获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组合;筛选模块,用于对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据;第一降尺度模块,用于将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入至第一地球系统耦合模式中,得到目标区域的多个降尺度风光数据;训练模块,用于将第二中尺度风光历史数据作为初始风光数据生成模型的输入,各降尺度风光数据作为初始风光数据生成模型的输出,训练初始风光数据生成模型,得到最终的风光数据生成模型。
17.考虑到相关技术中,在对中尺度风光数据进行降尺度时,需要将中尺度风光数据驱动气象模式进行模拟,从而完成降尺度、提高空间分辨率的目的,在该过程中需要耗费巨大的算力和时间成本,因此,通过上述装置,利用中尺度风光历史数据、地球系统耦合模式模拟得到降尺度风光数据,根据中尺度风光历史数据、降尺度风光数据训练初始风光数据生成模型,得到最终的风光数据生成模型。进一步的,利用风光数据生成模型即可快速对中尺度风光数据进行降尺度计算,提高降尺度分析效率。
18.在一种可选的实施方式中,筛选模块包括:计算子模块,用于计算各第一中尺度风光历史数据的平均值;筛选子模块,用于根据平均值,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
19.第四方面,本发明还提供了一种风光数据生成装置,该装置包括:第二获取模块,用于获取目标区域的中尺度风光数据;第二降尺度模块,用于将中尺度风光数据输入至风光数据生成模型中,得到降尺度风光数据,风光数据生成模型是通过第一方面或第一方面任一实施方式中的风光数据生成模型构建方法获得的。
20.第五方面,本发明还提供了一种计算机设备,包括存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或第一方面的任一实施方式的风光数据生成模型构建方法,或,第二方面或第二方面的任一实施方式的风光数据生成方法的步骤。
21.第六方面,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,计
算机程序被处理器执行时实现第一方面或第一方面的任一实施方式的风光数据生成模型构建方法,或,第二方面或第二方面的任一实施方式的风光数据生成方法的步骤。
附图说明
22.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1是根据一示例性实施例提出的一种风光数据生成模型构建方法的流程图;图2是在一示例中,聚类结果的误差平方和与聚类中心个数的关系图;图3是根据一示例性实施例提出的一种风光数据生成方法的流程图;图4 为根据一示例性实施例提出的一种风光数据生成模型构建装置的结构示意图;图5为根据一示例性实施例提出的一种风光数据生成装置的结构示意图;图6是根据一示例性实施例提出的一种计算机设备的硬件结构示意图。
具体实施方式
24.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
25.此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
26.为对中尺度风光数据进行降尺度分析,提高降尺度分析效率,本发明提出了一种风光数据生成模型构建方法及风光数据生成方法。
27.图1是根据一示例性实施例提出的一种风光数据生成模型构建方法的流程图。如图1所示,风光数据生成模型构建方法包括如下步骤s101至s104。
28.步骤s101:获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组合。
29.在一可选实施例中,中尺度风光历史数据可以为中尺度风况历史数据,其中,风况历史数据包括风速;中尺度风光历史数据也可以为中尺度太阳辐照历史数据,其中,太阳辐照历史数据包括太阳辐照度和气温。
30.在一可选实施例中,中尺度风光历史数据可以通过era5再分析数据集、merra2再分析数据集、jra-55再分析数据集、ncep/ncar再分析数据集获得。
31.在一可选实施例中,区域地形数据包括但不限于地形高度、地表类型(如草地、水面、森林等)。
32.在一可选实施例中,第一地球系统耦合模式包括但不限于大气分量模式(如weather researchand forecasting model,wrf模式)、海洋分量模式(如roms模式、fvcom模式、hycom模式)和海浪分量模式(如swan模式、wavewatchⅲ模式)构成的耦合模式。
33.在一可选实施例中,地球系统耦合模式中的初始场指的是预测起始时刻目标区域
所在地的大气状态、海洋状态,如位势高度、风场、相对湿度、温度场等变量。通过初值扰动方法对初始场加入扰动信息即可得到多个第一初始场。
34.在一可选实施例中,地球系统耦合模式中的边界场指的是预测时段内大气分量模式、海洋分量模式、陆地分量模式、波浪分量模式等分量模式中运动过程的限制条件。示例性地,可以选择2至3种不同的大气边界场、海洋边界场构成第一边界场组合。
35.在一可选实施例中,地球系统耦合模式中的参数化方案用于描述和调整模型中的各种参数,以更准确地模拟和预测地球系统的行为。第一参数化方案组合可以由多组不同的参数化方案构成。示例性地,参数化方案可以为微物理方案(如kessler方案、lin方案、wsm5方案等)、边界层与近地层方案(如ysu-revised mm5、monin-obukhov方案、qnse方案等)、长波与短波辐射方案(如cam-rrtmg方案、cam-rrtmg fast方案、new goddard方案等),在此不做具体限制。
36.步骤s102:对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
37.在一可选实施例中,可以通过第一中尺度风光历史数据的平均值,对第一中尺度风光历史数据进行筛选。
38.步骤s103:将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入至第一地球系统耦合模式中,得到目标区域的多个降尺度风光数据。
39.在一可选实施例中,第一初始场可以为一个初始场,也可以为多个初始场。同样的,第一边界场组合可以为一个边界场组合,也可以为多个边界场组合;第一参数化方案组合可以为一个参数化方案组合,也可以为多个参数化方案组合;第一地球系统耦合模式可以为一个地球系统耦合模式,也可以为多个地球系统耦合模式,在此不做具体限制。
40.在一可选实施例中,中尺度风光历史数据的空间分辨率低于降尺度风光数据的空间分辨率。示例性地,中尺度风光历史数据的空间分辨率一般为几十公里,降尺度风光数据的空间分辨率为高空间分辨率,可以为1至3公里。
41.步骤s104:将第二中尺度风光历史数据作为初始风光数据生成模型的输入,各降尺度风光数据作为初始风光数据生成模型的输出,训练初始风光数据生成模型,得到最终的风光数据生成模型。
42.在一可选实施例中,初始风光数据生成模型可以通过机器学习算法获得。机器学习算法可以为卷积神经网络、视觉自注意力模型等,在此不做具体限制。
43.考虑到相关技术中,在对中尺度风光数据进行降尺度时,需要将中尺度风光数据驱动气象模式进行模拟,从而完成降尺度、提高空间分辨率的目的,在该过程中需要耗费巨大的算力和时间成本,因此,通过上述方法,利用中尺度风光历史数据、地球系统耦合模式模拟得到降尺度风光数据,根据中尺度风光历史数据、降尺度风光数据训练初始风光数据生成模型,得到最终的风光数据生成模型。进一步的,利用风光数据生成模型即可快速对中尺度风光数据进行降尺度计算,提高降尺度分析效率。
44.在一示例中,在步骤s101中的区域地形数据通过如下方式获取:首先,获取目标区域的下垫面数据。
45.在一可选实施例中,下垫面数据包括但不限于陆地的地形数据、海洋的地形数据、土地覆盖数据、土地利用数据等。下垫面数据对地形数据来源及种类不设限制。示例性地,
陆地的地形数据可以采用geog地形数据。然后,根据下垫面数据,获得区域地形数据。
46.在一示例中,步骤s101中的第一地球系统耦合模式包括多个第二地球系统耦合模式,第二地球系统耦合模式包括多个不同类型的分量模式,不同的第二地球系统耦合模式对应的分量模式不同,通过如下方式获取第二地球系统耦合模式:首先,确定目标区域在第二地球系统耦合模式中的多个构成分量。
47.在一可选实施例中,地球系统耦合模式的构成分量可以根据目标区域所在地的实际情况确定。示例性地,海上目标区域的构成分量可选择大气分量、海洋分量、海浪分量。长江流域目标区域的构成分量可选择大气分量、陆地分量、水文分量,从而最大程度适应目标区域所在地的下垫面特性并做出准确的模拟及预报。
48.然后,对于每一个构成分量,选择构成分量对应的分量模式。
49.在一可选实施例中,大气分量对应的分量模式可以为wrf模式、mm5模式等,海洋分量对应的分量模式可以为roms模式、fvcom模式、hycom模式等,海浪分量对应的分量模式可以为swan模式、wavewatchⅲ模式等。分量模式的数量在此不做具体限制,示例性地,可以选择2-3种不同的分量模式。
50.最后,将各分量模式进行耦合,得到第二地球系统耦合模式。
51.在一可选实施例中,可以通过耦合器(model coupling toolkit,mct)将不同分量模式进行耦合得到地球系统耦合模式。示例性地,可以选择wrf模式+roms模式+wavewatchⅲ模式,或者wrf模式+fvcom模式+swan模式通过mct进行耦合得到地球系统耦合模式。
52.在一可选实施例中,地球系统耦合模式中模式格点大小可以设置为1至3公里,时间分辨率可以设置为1至3小时。
53.在本发明实施例中,不同的地球系统耦合模式包含分量模式不同。对于同一个地球系统耦合模式,考虑到了地球系统运转的物理动力规律,根据目标区域所在地的特征选取地球系统相关圈层的分量模式进行耦合,考虑到了不同圈层、不同分量模式之间的相互影响,使得通过地球系统耦合模式得到的降尺度风光数据更加贴合实际、更加准确。
54.在一示例中,步骤s101中的第一初始场包括多个第二初始场,通过如下方式获取各第二初始场:首先,获取目标区域的全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据。
55.在一可选实施例中,地球系统耦合模式中的大气分量模式用于模拟大气圈层发生的过程,全球大气预报数据为地球系统耦合模式中的大气分量模式中所需要的数据。
56.在一可选实施例中,地球系统耦合模式中的海洋分量模式用于模拟海洋圈层发生的过程。全球海洋预报数据为地球系统耦合模式中的海洋分量模式中所需要的数据。
57.在一可选实施例中,地球系统耦合模式中的海浪分量模式用于模拟海浪圈层发生的过程。区域海洋模式分析场数据为地球系统耦合模式中的海浪分量模式中所需要的数据。
58.在一可选实施例中,全球大气预报数据可以通过全球预报系统gfs获得。
59.在一可选实施例中,全球海洋预报数据可以通过国家海洋环境预报中心获得。
60.然后,根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,获
得第三初始场。
61.最后,对第三初始场进行扰动处理,得到多个第二初始场。
62.在一可选实施例中,可以通过增长模繁殖法、奇异向量法、集合变化卡尔曼滤波法等初值扰动方法对第二初始场进行扰动处理,得到多个第一初始场。第一初始场的数量不做具体限制,示例性地,第一初始场的数量设置为至少10个。
63.在一示例中,步骤s101中的第一边界场组合包括多个第二边界场组合,获取第二边界场组合的步骤包括:首先,分别根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,确定全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场。
64.在一可选实施例中,全球大气预报数据的边界场可以为gfs大气预报边界场、grapes大气预报边界场等。
65.在一可选实施例中,全球海洋预报数据的边界场可以为国家海洋环境预报中心(national marine environmental forecasting center,nmefc)全球海洋预报边界场、其他中心的全球海洋预报边界场等。
66.然后,在全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场中,选择至少两个边界场构成第二边界场组合。
67.示例性地,可以选择gfs大气预报边界场+国家海洋环境预报中心(nmefc)全球海洋预报边界场作为一组边界场组合。
68.在一示例中,步骤s101中的第一参数化方案组合包括多个第二参数化方案组合。第二参数化方案组合可以由多个参数化方案构成。参数化方案包括但不限于微物理方案(如kessler方案、lin方案、wsm5方案等)、边界层与近地层方案(如ysu-revised mm5、monin-obukhov方案、qnse方案等)、长波与短波辐射方案(如cam-rrtmg方案、cam-rrtmg fast方案、new goddard方案等)。对于第二参数化方案组合中参数化方案的数量在此不做具体限制,示例性地,可以选择2-3种参数化方案构成第二参数化方案组合。第二参数化方案组合可以为kessler方案+qnse方案+cam-rrtmg方案。
69.为了避免第一中尺度风光历史数据中存在个别数据存在误差,进而影响最终的风光数据生成模型的准确性,因此需要对第一中尺度风光历史数据进行筛选,利用筛选后的中尺度风光历史数据构建风光数据生成模型。在上述步骤s102中,通过如下步骤筛选第一中尺度风光历史数据:步骤a1:计算各第一中尺度风光历史数据的平均值。
70.步骤a2:根据平均值,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
71.在一可选实施例中,步骤a2中,通过如下内容筛选第一中尺度风光历史数据:首先,将各第一中尺度风光历史数据与平均值作差,得到多个第一差值。
72.其次,对各第一差值进行聚类,得到多个聚类簇。
73.在一可选实施例中,聚类方法可以采用无监督聚类算法,示例性地,可以为k-means、自组织映射算法。
74.然后,计算各第一差值与所属聚类簇的聚类中心之间的距离。
75.在一可选实施例中,聚类簇的聚类中心个数可以通过肘部法获得。肘部法的实现方法为绘制聚类结果的误差平方和与聚类中心个数n的关系图,找到曲线形状类似于手肘的拐点,该点对应的n值可作为合适的聚类中心个数。如图2所示,通过肘部法确定的聚类中心个数为6。
76.在一可选实施例中,聚类簇的聚类中心个数还可以通过轮廓系数法获得。轮廓系数法的实现方法为计算每个数据点的轮廓系数,该系数综合考虑了点与其所属的聚类中心簇的距离和与其它簇的距离,计算不同聚类中心个数下的平均轮廓系数,选择具有最大平均轮廓系数的聚类中心个数作为最终的聚类中心个数。
77.在一可选实施例中,第一差值与所属聚类簇的聚类中心之间的距离可以为欧几里得距离,其计算公式为:其中,d为欧几里得距离;,) 表示聚类中心坐标;,)表示归属于该聚类中心簇中的第一差值。
78.最后,根据各距离,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。
79.在一可选实施例中,可以将各距离按照从小到大进行排序,选择排序靠前的预设数量的距离,示例性地,可以选择排序前30的距离;将排序靠前的预设数量的距离对应的第一中尺度风光历史数据作为第二中尺度风光历史数据。
80.当然,也可以将各距离按照从大到小进行排序,选择排序靠后的预设数量的距离;将排序靠后的预设数量的距离对应的第一中尺度风光历史数据作为第二中尺度风光历史数据。
81.在上述步骤s103中,将区域地形数据、各第二初始场、各第二边界场组合和各第二参数化方案组合,输入至各第二地球系统耦合模式中,得到多个降尺度风光数据。
82.在一可选实施例中,将区域地形数据、一个第二初始场、一组第二边界场组合和一组第二参数化方案组合,输入至一个地球系统耦合模式中,会得到多组降尺度风光数据。示例性地,当第二初始场的数量为10,第二边界场组合的数量为3,第二参数化方案组合的数量为3,地球系统耦合模式的数量为1时,得到的10*3*3*1=90组降尺度风光数据。
83.图3是根据一示例性实施例提出的一种风光数据生成方法的流程图。该风光数据生成方法包括如下步骤s301至步骤s302。
84.步骤s301:获取目标区域的中尺度风光数据。
85.步骤s302:将中尺度风光数据输入至风光数据生成模型中,得到降尺度风光数据,风光数据生成模型是通过上述实施例中的风光数据生成模型构建方法获得的。
86.下面通过一个具体的实施例来说明风光数据生成的具体实现过程。
87.步骤b1:收集中尺度再分析气象数据集的全周期数据(如era5的全周期覆盖时间段为1940至今)。
88.中尺度再分析气象数据集的全周期数据可以从era5再分析数据集、merra2再分析数据集、jra-55再分析数据集和ncep/ncar再分析数据集等获得。收集高空大气状态变量,地表变量和强迫变量。收集同期的全球海洋预报数据(如国家海洋环境预报中心nmefc的全
球海洋预报数据)、区域海洋模式分析场数据(如nmefc区域或全球海洋模式分析场,仅举例,不以此为限制)。收集地球系统耦合模式运行所需要的下垫面静态数据,如陆地、海洋的地形数据、土地覆盖数据、土地利用数据等,根据项目实施要求按需选取,如陆地数据可采用geog地形数据,对地形数据来源及种类不设限制。
89.步骤b2:从步骤b1得到的中尺度再分析气象数据集中提取100米高度处的风速,计算100米高度处风速的异常值。异常值的定义为各时刻的风速值与该时刻所对应的平均风速值的差。
90.计算在全周期时间段内各时刻的平均风速值,可以使用以下公式=其中,代表t时刻的100米高度平均风速,为全周期内第i个t时刻100米高度处的风速,n=1,2,3,
…
,n为全周期内t时刻的总个数。
91.100米高度处风速的异常值可以用一下公式计算=其中,代表第i个t时刻100米高度处的风速异常值,为第i个t时刻100米高度处的风速,代表t时刻的100米高度平均风速。
92.步骤b3:利用无监督聚类算法,如k-means或自组织映射算法(此处仅举例,不对具体无监督聚类算法做约束)对步骤b2获得的100米高度处风速异常值进行处理,得到n个聚类中心以及每个100米高度处风速异常值所属的聚类中心簇。确定聚类中心个数n的方法一般有肘部法和轮廓系数法。其中,肘部法的实施方法为绘制聚类结果的误差平方和与聚类中心个数n的关系图,找到曲线形状类似于手肘的拐点,该点对应的n值可作为合适的聚类中心个数。轮廓系数法的实施方法为计算每个数据点的轮廓系数,该系数综合考虑了点与其所属的聚类中心簇的距离和与其它簇的距离,计算不同n值下的平均轮廓系数,选择具有最大平均轮廓系数的n值作为合适的聚类中心个数。
93.步骤b4:针对每一个聚类中心,计算归属于该聚类中心簇中的各100米高度风速异常值与聚类中心的欧几里得距离,欧几里得距离的计算公式为:其中,,)表示聚类中心坐标,,)表示归属于该聚类中心簇中的100米高度风速异常值坐标。
94.对每一个聚类中心簇中的欧几里得距离结果进行从小到大的排序,提取前30个与聚类中心的欧几里得距离最小的100米高度处风速异常值(此处的数量30个仅作举例,不以具体数量为限,根据可利用算力和实际需求进行灵活调整)。注意,此处每一个自然日只取一个时刻的100米高度处风速异常值,如某一自然日的3时刻和18时刻的欧几里得距离均属于同一聚类中心簇中最小的30个,那么只随机挑选1个时刻的100米高度处风速异常值,忽略其它时刻。
95.步骤b5:从步骤b1中所得的中尺度再分析气象数据集中提取与步骤b4中所得各聚类中心簇中欧几里得最小的30个所对应时刻的高空大气状态变量、地表变量和强迫变量,
对其做预处理,得到耦合模式运转所需要的初始场和边界场。对下垫面静态数据做预处理,得到地球系统耦合模式运行所需要的区域地形文件。将以上结果代入地球系统耦合模式并设置模式格点大小为1至3公里,时间分辨率设置为1至3小时,驱动地球系统耦合模式进行动力降尺度模拟(地球系统耦合模式可以由目标所在地进行选取,如大气模式+海洋模式+海浪模式的通过耦合器mct组合形成,常用的大气模式包括wrf、mm5等,海洋模式有roms、fvcom、hycom等,海浪模式有swan、wavewatchⅲ等,此处仅举例说明,不以此为限制),得到1至3公里空间分辨率、1至3小时时间分辨率的高时空分辨率的100米高度处风速模拟结果。
96.步骤b6:将从步骤b1中所得的中尺度再分析气象数据集中提取到的与步骤b4中所得各聚类中心簇中欧几里得最小的30个所对应时刻的100米高度风速作为机器学习算法训练的输入量,将步骤b5中获得的由地球系统耦合模式模拟所得的相同时刻的1至3公里空间分辨率的高空间分辨率100米高度风速作为机器学习算法训练的输出目标量,训练高分辨率图像算法,如卷积神经网络、视觉自注意力模型等(此处仅举例,不以此为限制),得到训练好的高分辨率图像算法,用来快速地将低空间分辨率的中尺度再分析100米高度处风速数据(一般空间分辨率为几十公里)细化为高空间分辨率(1至3公里)的100米高度处风速。
97.步骤b7:将步骤b6获得的训练好的高分辨率图像算法应用于全周期时间段内中尺度再分析气象数据集所含的所有时刻的100米高度处风速,生成全周期所有时刻的高空间分辨率100米高度处风速。
98.步骤b8:重复步骤b5,利用中尺度再分析气象数据集驱动地球系统耦合模式进行动力降尺度模拟得到高精度1至3公里的100米高度处风速模拟结果,但对初始场利用增长模繁殖法、奇异向量法、集合变化卡尔曼滤波法(可根据需求选择适当的初值扰动方法,不以此为限制)做初始扰动处理并得到有初值扰动信息的初始场集合;选取不同的全球海洋预报数据和区域海洋模式分析场数据做预处理并得到边界场集合;选取不同的地球系统耦合模式的分量构成(大气分量模式有wrf、mm5等,海洋分量模式有roms、fvcom、hycom,海浪分量模式有swan、wavewatchⅲ,利用耦合器mct将各分量模式进行耦合,可选取不同的分量模式进行耦合,如wrf+roms+wavewatchⅲ或wrf+fvcom+swan等,可选择2-3种不同分量模式组成的耦合模式),不同的耦合模式参数化方案组合(包括微物理方案如kessler方案、lin方案、wsm5方案等;边界层与近地层方案如ysu-revised mm5方案、monin-obukhov方案、qnse方案等;长波与短波辐射方案如cam-rrtmg方案、cam-rrtmg fast方案、new goddard方案等,可形成微物理lin方案+边界层与近地层qnse方案+长波与短波辐射new goddard方案)。通过以上处理,对初始场集合中的各个成员,以不同的边界场成员驱动由不同分量构成、不同的耦合模式参数化方案组合形成的地球系统耦合模式,得到多组高空间分辨率(1至3公里)的100米高度处风速模拟结果,形成100米高度处风速模拟结果的集合。
99.步骤b9:以步骤b8得到的100米高度处风速模拟结果的集合,重复步骤b6至步骤b7,得到由多个成员组合而成的1至3公里高空间分辨率的覆盖全周期时间段的100米高度处风速集合数据库。
100.基于相同的发明构思,本发明实施例还提供了一种风光数据生成模型构建装置,如图4所示,该风光数据生成模型构建装置包括:第一获取模块401,用于获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组
合;详细内容参见上述实施例中步骤s101的描述,在此不再赘述。
101.筛选模块402,用于对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据;详细内容参见上述实施例中步骤s102的描述,在此不再赘述。
102.第一降尺度模块403,用于将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入至第一地球系统耦合模式中,得到目标区域的多个降尺度风光数据;详细内容参见上述实施例中步骤s103的描述,在此不再赘述。
103.训练模块404,用于将第二中尺度风光历史数据作为初始风光数据生成模型的输入,各降尺度风光数据作为初始风光数据生成模型的输出,训练初始风光数据生成模型,得到最终的风光数据生成模型。详细内容参见上述实施例中步骤s104的描述,在此不再赘述。
104.考虑到相关技术中,在对中尺度风光数据进行降尺度时,需要将中尺度风光数据驱动气象模式进行模拟,从而完成降尺度、提高空间分辨率的目的,在该过程中需要耗费巨大的算力和时间成本,因此,通过上述装置,利用中尺度风光历史数据、地球系统耦合模式模拟得到降尺度风光数据,根据中尺度风光历史数据、降尺度风光数据训练初始风光数据生成模型,得到最终的风光数据生成模型。进一步的,利用风光数据生成模型即可快速对中尺度风光数据进行降尺度计算,提高降尺度分析效率。
105.在一示例中,筛选模块402包括:计算子模块,用于计算各第一中尺度风光历史数据的平均值;详细内容参见上述实施例中的描述,在此不再赘述。
106.筛选子模块,用于根据平均值,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。详细内容参见上述实施例中的描述,在此不再赘述。
107.在一示例中,筛选子模块包括:作差单元,用于将各第一中尺度风光历史数据与平均值作差,得到多个第一差值;详细内容参见上述实施例中的描述,在此不再赘述。
108.聚类单元,用于对各第一差值进行聚类,得到多个聚类簇;详细内容参见上述实施例中的描述,在此不再赘述。
109.计算单元,用于计算各第一差值与所属聚类簇的聚类中心之间的距离;详细内容参见上述实施例中的描述,在此不再赘述。
110.筛选单元,用于根据各距离,对各第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。详细内容参见上述实施例中的描述,在此不再赘述。
111.在一示例中,筛选单元包括:排序子单元,用于将各距离按照从小到大进行排序,选择排序靠前的预设数量的距离;详细内容参见上述实施例中的描述,在此不再赘述。
112.筛选子单元,用于将排序靠前的预设数量的距离对应的第一中尺度风光历史数据作为第二中尺度风光历史数据。详细内容参见上述实施例中的描述,在此不再赘述。
113.在一示例中,第一获取模块401包括:第一获取子模块,用于获取目标区域的下垫面数据;详细内容参见上述实施例中的描述,在此不再赘述。
114.第二获取子模块,用于根据下垫面数据,获得区域地形数据。详细内容参见上述实施例中的描述,在此不再赘述。
115.在一示例中,第一初始场包括多个第二初始场,第一获取模块401还包括:第三获取子模块,用于获取目标区域的全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据;详细内容参见上述实施例中的描述,在此不再赘述。
116.第四获取子模块,用于根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,获得第三初始场;详细内容参见上述实施例中的描述,在此不再赘述。
117.处理子模块,用于对第三初始场进行扰动处理,得到多个第二初始场。详细内容参见上述实施例中的描述,在此不再赘述。
118.在一示例中,第一边界场组合包括多个第二边界场组合,第一获取模块401还包括:第一确定子模块,用于分别根据全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据,确定全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场;详细内容参见上述实施例中的描述,在此不再赘述。
119.第一选择子模块,用于在全球大气预报数据的多个边界场、全球海洋预报数据的多个边界场和区域海洋模式分析场数据的多个边界场中,选择至少两个边界场构成第二边界场组合。详细内容参见上述实施例中的描述,在此不再赘述。
120.在一示例中,第一地球系统耦合模式包括多个第二地球系统耦合模式,第二地球系统耦合模式包括多个不同类型的分量模式,不同的第二地球系统耦合模式对应的分量模式不同,第一获取模块401还包括:第二确定子模块,用于确定目标区域在第二地球系统耦合模式中的多个构成分量;详细内容参见上述实施例中的描述,在此不再赘述。
121.第二选择子模块,用于对于每一个构成分量,选择构成分量对应的分量模式;详细内容参见上述实施例中的描述,在此不再赘述。
122.耦合子模块,用于将各分量模式进行耦合,得到第二地球系统耦合模式。详细内容参见上述实施例中的描述,在此不再赘述。
123.在一示例中,第一参数化方案组合包括多个第二参数化方案组合,第一降尺度模块403包括:降尺度子模块,用于将区域地形数据、各第二初始场、各第二边界场组合和各第二参数化方案组合,输入至各第二地球系统耦合模式中,得到多个降尺度风光数据。详细内容参见上述实施例中的描述,在此不再赘述。
124.基于相同的发明构思,本发明还提供了一种风光数据生成装置。如图5所示,该装置包括:第二获取模块501,用于获取目标区域的中尺度风光数据;详细内容参见上述实施例中步骤s301的描述,在此不再赘述。
125.第二降尺度模块502,用于将中尺度风光数据输入至风光数据生成模型中,得到降尺度风光数据,风光数据生成模型是上述实施例中的风光数据生成模型构建方法获得的。详细内容参见上述实施例中步骤s302的描述,在此不再赘述。
126.上述装置的具体限定以及有益效果可以参见上文中对于风光数据生成模型构建方法、风光数据生成方法的限定,在此不再赘述。上述各个模块可全部或部分通过软件、硬
件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
127.图6是根据一示例性实施例提出的一种计算机设备的硬件结构示意图。如图6所示,该设备包括一个或多个处理器610以及存储器620,存储器620包括持久内存、易失内存和硬盘,图6中以一个处理器610为例。该设备还可以包括:输入装置630和输出装置640。
128.处理器610、存储器620、输入装置630和输出装置640可以通过总线或者其他方式连接,图6中以通过总线连接为例。
129.处理器610可以为中央处理器(central processing unit,cpu)。处理器610还可以为其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
130.存储器620作为一种非暂态计算机可读存储介质,包括持久内存、易失内存和硬盘,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本技术实施例中风光数据生成模型构建方法、风光数据生成方法对应的程序指令/模块。处理器610通过运行存储在存储器620中的非暂态软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述任意一种风光数据生成模型构建方法、风光数据生成方法。
131.存储器620可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据、需要使用的数据等。此外,存储器620可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器620可选包括相对于处理器610远程设置的存储器,这些远程存储器可以通过网络连接至数据处理装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
132.输入装置630可接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的信号输入。输出装置640可包括显示屏等显示设备。
133.一个或者多个模块存储在存储器620中,当被一个或者多个处理器610执行时,执行如图1所示的方法。
134.上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,具体可参见如图1所示的实施例中的相关描述。
135.本发明实施例还提供了一种非暂态计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的方法。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;存储介质还可以包括上述种类的存储器的组合。
136.需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之
间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
137.以上仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
技术特征:
1.一种风光数据生成模型构建方法,其特征在于,所述方法包括:获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组合;对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据;将所述区域地形数据、所述第一初始场、所述第一边界场组合和所述第一参数化方案组合,输入至所述第一地球系统耦合模式中,得到所述目标区域的多个降尺度风光数据;将所述第二中尺度风光历史数据作为初始风光数据生成模型的输入,各所述降尺度风光数据作为所述初始风光数据生成模型的输出,训练所述初始风光数据生成模型,得到最终的风光数据生成模型。2.根据权利要求1所述的方法,其特征在于,对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据,包括:计算各所述第一中尺度风光历史数据的平均值;根据所述平均值,对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。3.根据权利要求2所述的方法,其特征在于,根据所述平均值,对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据,包括:将各所述第一中尺度风光历史数据与所述平均值作差,得到多个第一差值;对各所述第一差值进行聚类,得到多个聚类簇;计算各所述第一差值与所属聚类簇的聚类中心之间的距离;根据各所述距离,对各所述第一中尺度风光历史数据进行筛选,得到所述第二中尺度风光历史数据。4.根据权利要求3所述的方法,其特征在于,根据各所述距离,对各所述第一中尺度风光历史数据进行筛选,得到所述第二中尺度风光历史数据,包括:将各所述距离按照从小到大进行排序,选择排序靠前的预设数量的距离;将排序靠前的预设数量的距离对应的第一中尺度风光历史数据作为所述第二中尺度风光历史数据。5.根据权利要求1所述的方法,其特征在于,获取所述区域地形数据的步骤包括:获取所述目标区域的下垫面数据;根据所述下垫面数据,获得所述区域地形数据。6.根据权利要求1所述的方法,其特征在于,所述第一初始场包括多个第二初始场,获取各所述第二初始场的步骤包括:获取所述目标区域的全球大气预报数据、全球海洋预报数据和区域海洋模式分析场数据;根据所述全球大气预报数据、所述全球海洋预报数据和所述区域海洋模式分析场数据,获得第三初始场;对所述第三初始场进行扰动处理,得到多个所述第二初始场。7.根据权利要求6所述的方法,其特征在于,所述第一边界场组合包括多个第二边界场组合,获取所述第二边界场组合的步骤包括:分别根据所述全球大气预报数据、所述全球海洋预报数据和所述区域海洋模式分析场
数据,确定所述全球大气预报数据的多个边界场、所述全球海洋预报数据的多个边界场和所述区域海洋模式分析场数据的多个边界场;在所述全球大气预报数据的多个边界场、所述全球海洋预报数据的多个边界场和所述区域海洋模式分析场数据的多个边界场中,选择至少两个边界场构成所述第二边界场组合。8.根据权利要求7所述的方法,其特征在于,所述第一地球系统耦合模式包括多个第二地球系统耦合模式,所述第二地球系统耦合模式包括多个不同类型的分量模式,不同的第二地球系统耦合模式对应的分量模式不同,获取所述第二地球系统耦合模式的步骤包括:确定所述目标区域在第二地球系统耦合模式中的多个构成分量;对于每一个构成分量,选择所述构成分量对应的分量模式;将各所述分量模式进行耦合,得到所述第二地球系统耦合模式。9.根据权利要求8所述的方法,其特征在于,所述第一参数化方案组合包括多个第二参数化方案组合,将所述区域地形数据、所述第一初始场、所述第一边界场组合和所述第一参数化方案组合,输入至所述第一地球系统耦合模式中,得到所述目标区域的多个降尺度风光数据,包括:将所述区域地形数据、各所述第二初始场、各所述第二边界场组合和各所述第二参数化方案组合,输入至各所述第二地球系统耦合模式中,得到多个降尺度风光数据。10.一种风光数据生成方法,其特征在于,所述方法包括:获取目标区域的中尺度风光数据;将所述中尺度风光数据输入至风光数据生成模型中,得到降尺度风光数据,所述风光数据生成模型是通过权利要求1至9中任一项所述的风光数据生成模型构建方法获得的。11.一种风光数据生成模型构建装置,其特征在于,所述装置包括:第一获取模块,用于获取目标区域的多个第一中尺度风光历史数据、区域地形数据,以及在第一地球系统耦合模式中的第一初始场、第一边界场组合、第一参数化方案组合;筛选模块,用于对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据;第一降尺度模块,用于将所述区域地形数据、所述第一初始场、所述第一边界场组合和所述第一参数化方案组合,输入至所述第一地球系统耦合模式中,得到所述目标区域的多个降尺度风光数据;训练模块,用于将所述第二中尺度风光历史数据作为初始风光数据生成模型的输入,各所述降尺度风光数据作为所述初始风光数据生成模型的输出,训练所述初始风光数据生成模型,得到最终的风光数据生成模型。12.根据权利要求11所述的装置,其特征在于,所述筛选模块包括:计算子模块,用于计算各所述第一中尺度风光历史数据的平均值;筛选子模块,用于根据所述平均值,对各所述第一中尺度风光历史数据进行筛选,得到第二中尺度风光历史数据。13.一种风光数据生成装置,其特征在于,所述装置包括:第二获取模块,用于获取目标区域的中尺度风光数据;第二降尺度模块,用于将所述中尺度风光数据输入至风光数据生成模型中,得到降尺
度风光数据,所述风光数据生成模型是通过权利要求1至9中任一项所述的风光数据生成模型构建方法获得的。14.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-9中任一项所述的风光数据生成模型构建方法,或,执行权利要求10所述的风光数据生成方法的步骤。15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述的风光数据生成模型构建方法,或,如权利要求10所述的风光数据生成方法的步骤。
技术总结
本发明涉及气象预报技术领域,提供了一种风光数据生成模型构建方法及风光数据生成方法。其中,风光数据生成模型构建方法包括:获取目标区域第一中尺度风光历史数据、区域地形数据,第一地球系统耦合模式的第一初始场、第一边界场组合、第一参数化方案组合;对第一中尺度风光历史数据筛选,得到第二中尺度风光历史数据;将区域地形数据、第一初始场、第一边界场组合和第一参数化方案组合,输入第一地球系统耦合模式,得到降尺度风光数据;将第二中尺度风光历史数据作为初始风光数据生成模型输入,降尺度风光数据作为初始风光数据生成模型输出,训练初始风光数据生成模型,得到风光数据生成模型。通过本发明,得到降尺度风光数据,提高计算效率。高计算效率。高计算效率。
技术研发人员:陈圣哲 邓友汉 蒋定国 文仁强 梁犁丽 余意 李雨抒 宋子达 陈静 张子良 张皓 杜梦蛟 王浩 易侃 贾天下
受保护的技术使用者:中国长江三峡集团有限公司
技术研发日:2023.08.14
技术公布日:2023/9/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种铝棒自动喷涂机的制作方法 下一篇:一种带预定位结构的拼接屏的制作方法