空气质量预测方法及系统

未命名 08-22 阅读:103 评论:0


1.本发明涉及空气质量预测领域,特别是涉及空气质量预测方法及系统。


背景技术:

2.随着工业化和城市化的快速发展,空气污染已成为公众关注的焦点。为了减少空气污染的有害影响,准确预测空气质量显得十分重要。
3.然而,由于城市空气质量监测站的数量较少,站点空间分布不均,维护成本过高等因素,使得城市空气质量空间分辨率过低,无法精准预测未设监测站地区的空气质量。
4.同时,现有方法一般采用基于统计学的方法来提取特征,往往需要依赖领域知识和人工提取,难以获取数据中的潜在信息。
5.预测精度低,现有方法往往只能根据历史预测数据进行简单的回归预测,无法考虑多种因素对空气质量的影响。这种单一的预测方法导致预测精度较低,难以满足实际需求。


技术实现要素:

6.本发明的目的是提供一种空气质量预测方法及系统,可在进行空气质量预测时,进行空间特征和时间特征的提取,实现对未设监测站点区域的空气质量预测。
7.为实现上述目的,本发明提供了如下方案:
8.一种空气质量预测方法,包括:
9.获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据;所述监测站点数据集包括各个监测站点的空气质量测量数据;所述目标城市的区域划分为监测区域和目标区域;任一目标区域为:所述目标城市中未设有监测站点的区域;任一监测区域为:所述目标城市中设有监测站点的区域;
10.对监测站点信息和目标区域信息进行特征提取和拼接,得到初始特征信息;所述监测站点信息至少包括:所述监测站点数据集;所述目标区域信息包括所述目标区域内的气象数据、poi数据和地理拓扑数据;
11.使用所述初始特征信息提取空间特征;所述空间特征用于表征所述目标区域与各监测站点之间的空间相关性;
12.通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征;
13.根据所述空间特征和时间注意力特征,获得融合特征;
14.根据所述融合特征预测得到所述目标区域的空气质量预测结果。
15.可选地,使用所述初始特征信息提取空间特征,具体包括:
16.根据各所述监测站点与所述目标区域之间的距离,获得邻接矩阵;
17.根据所述初始特征信息,获得空间注意力矩阵;所述空间注意力矩阵用于表征各监测站点空间位置相对于目标区域的重要性;
18.根据所述初始特征信息、邻接矩阵和空间注意力矩阵,获得所述空间特征。
19.可选地,根据所述初始特征信息,获得空间注意力矩阵,具体包括:
20.根据所述初始特征信息计算各监测站点相对于所述目标区域的空间相关性分数;
21.对各所述空间相关性分数进行归一化处理,得到各监测站点的空间注意力值;所述空间注意力矩阵包括:各监测站点的空间注意力值。
22.可选地,所述初始特征信息包括:各监测站点的初始特征,以及,所述目标区域的初始特征;
23.任一监测站点的空间相关性分数的计算,具体包括:
24.利用第一节点特征转换矩阵和监测站点i的初始特征进行计算,得到第一特征;所述监测站点i表征任一监测站点;
25.利用第二节点特征转换矩阵和所述目标区域的初始特征进行计算,得到第二特征;
26.对所述第一特征和第二特征进行拼接,并利用注意力权值矩阵加权,得到所述监测站点i和所述目标区域之间的空间相关特征;
27.利用评分函数对所述空间相关特征进行评分,得到所述监测站点i的空间相关性分数;
28.其中,所述第一节点特征转换矩阵和所述第二节点特征转换矩阵用于将所述监测站点i的初始特征和所述目标区域的初始特征嵌入到统一的空间。
29.可选地,根据所述初始特征信息、邻接矩阵和空间注意力矩阵,获得所述空间特征,具体包括:
30.利用空间注意力矩阵,对所述初始特征信息中各监测站点的初始特征进行特征提取,得到空间注意力特征;
31.将所述空间注意力特征进行空间映射,得到映射特征;
32.利用特征提取函数和所述邻接矩阵,对所述映射特征进行特征提取得到所述空间特征。
33.可选地,所述初始特征信息包括多个时刻的子初始特征;
34.通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征,具体包括:
35.根据初始特征信息中的子初始特征计算指定时间中每一时刻的时间注意力分数;
36.对各时刻的时间注意力分数进行归一化处理,得到各时刻对应的时间注意力值;所述时间注意力矩阵包括:各时刻对应的时间注意力值;
37.对所述时间注意力矩阵和初始特征信息进行聚合操作,得到所述时间注意力特征。
38.可选地,所述目标区域的空气质量预测结果包括:所述目标区域在指定时间内各时刻的空气质量预测值;
39.所述根据所述融合特征预测得到所述目标区域的空气质量预测结果包括:
40.利用空气质量预测权重矩阵和所述融合特征,预测得到所述目标区域在指定时间内各时刻的空气质量预测值;所述指定时间包括过去时间段t和未来时间段p。
41.可选地,所述目标区域内的气象数据包括:过去时间段t内的气象数据和未来时间
段p内预测的气象数据;所述监测站点数据集包括:各个监测站点过去时间段t内的空气质量测量数据;
42.所述目标区域信息包括:所述目标区域在过去时间段t内的气象数据、poi数据和地理拓扑数据;
43.所述融合特征包括第一融合特征和第二融合特征;所述第一融合特征包括:所述目标区域在过去时间段t内各时刻的融合特征;所述第二融合特征包括:所述目标区域在未来时间段p内各时刻的融合特征;
44.其中,所述第二融合特征是由所述第一融合物征向量和未来时间段p内预测的气象数据得到的;所述第一融合特征是通过门控融合机制融合所述时间注意力特征和所述空间特征得到;
45.所述目标区域的空气质量预测结果包括:所述目标区域在过去时间段t和未来时间段p内各时刻的空气质量预测值。
46.本发明还提供了一种空气质量预测系统,所述预测系统包括:
47.数据获取单元,用于:
48.获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据;所述监测站点数据集包括各个监测站点的空气质量测量数据;所述目标城市的区域划分为监测区域和目标区域;任一目标区域为:所述目标城市中未设有监测站点的区域;任一监测区域为:所述目标城市中设有监测站点的区域;
49.时空匹配单元,用于对监测站点信息和目标区域信息进行特征提取和拼接,得到初始特征信息;所述监测站点信息至少包括:所述监测站点数据集;所述目标区域信息包括所述目标区域内的气象数据、poi数据和地理拓扑数据;
50.图注意力网络单元,用于初始特征信息使用所述初始特征信息提取空间特征;所述空间特征用于表征所述目标区域与各监测站点之间的空间相关性;
51.时间注意力单元,用于通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征;
52.融合单元,用于根据所述空间特征和时间注意力特征,获得融合特征;
53.预测单元,用于根据所述融合特征预测得到所述目标区域的空气质量预测结果。
54.根据本发明提供的具体实施例,本发明公开了以下技术效果:
55.与现有的空气质量预测方法相比,本发明实施例所提供的预测方法,考虑到了多种因素(气象数据、地理拓扑数据)对空气质量的影响,将多种因素(气象数据、地理拓扑数据)引入参与空气质量预测以提高预测精度。同时,真实的大气环境中,空间某一点的空气质量与其他点的空气质量不是孤立无关的,因此,本发明实施例提取了目标区域与各监测站点之间潜在的空间特征(空间相关性),并通过时间注意力机制自适应模拟不同时间步长之间的非线性相关性,获取了目标区域的时间注意力特征;进一步,将空间特征和时间注意力特征相融合,还能够获取数据中更高级的潜在信息(融合特征),进而基于上述融合特征对未设监测站点的目标区域的空气质量进行监测,以获得更为真实和精确的预测结果。
56.综上,本发明实施例兼顾了多种因素、充分利用时空特性,挖掘出了数据中的潜在信息,实现了对未设监测站地区的空气质量的精准预测。
附图说明
57.图1为本发明实施例中空气质量预测方法的流程图;
58.图2为提取空间相关性的参考图;
59.图3为提取时间特征的参考图;
60.图4为进行空气质量预测的整体参考图;
61.图5为本发明实施例中空气质量预测系统的模块结构示意图。
62.符号说明:
63.区域划分单元-1、数据获取单元-2、时空匹配单元-3、图注意力网络单元-4、时间注意力单元-5、融合单元-6、预测单元-7。
具体实施方式
64.下面结合附图和具体实施方式对本发明作进一步详细的说明。
65.本发明的目的是提供空气质量预测方法及系统,以实现对城市中未设监测站点区域(目标区域)的空气质量预测。
66.可参照图1,下面对上述空气质量预测方法进行详细阐述:
67.一、特征获取
68.步骤s01:将目标城市的区域划分为监测区域和目标区域。
69.其中,任一目标区域为:目标城市中未设有监测站点的区域;任一监测区域为:目标城市中设有监测站点的区域。
70.需要说明的是,在一些场景下目标城市的监测区域和目标区域可能已经预先划分好,在此情况下,可不执行步骤s01。
71.步骤s02:获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据。
72.其中,监测站点数据集包括各个监测站点的空气质量测量数据。每一监测站点的空气质量测量数据包括:不同采样点(不同时刻)所采集的、各种类的质量测量值。
73.示例性地,监测站点数据集可选取目标城市中多个国控点作为监测站点数据,具体可收集pm2.5,pm10,o3,no2,co等空气污染物空气素质指数。国控点的数量可根据实际情况而定,例如15个,20个等等。
74.示例性地,气象数据包括但不限于:不同采样点(不同时刻)所采集的温度、湿度、压力、风速、风向和天气等。
75.示例性地,poi数据包括但不限于:车辆服务、交通站点、工厂、装饰家具市场、食品饮料、商场超市、体育、公园、文化教育、娱乐和酒店等类别;poi数据的获取可通过查询目标城市地图得到。
76.地理拓扑数据示例性的包括但不限于:每个监测站点的经纬度信息,每个监测站点与目标区域之间的距离和方向;进一步地,该距离可为某监测站点与目标区域预设点(例如中心点)之间的距离,方向亦如此,不作赘述。
77.步骤s03:对监测站点信息和目标区域信息进行特征提取和拼接,得到初始特征信息。
78.其中,监测站点信息至少包括:上述监测站点数据集;目标区域信息包括目标区域
内的气象数据、poi数据和地理拓扑数据。
79.步骤s03是为了对监测站点数据集、地理拓扑数据、气象数据和poi(point to interest,兴趣点)数据等多源时空数据,进行分析预处理工作。
80.具体地,可使用全连接层提取静态的地理拓扑数据与poi数据,再使用一维卷积网络提取动态的气象数据与空气质量测量数据,最后将静态数据与动态数据拼接生成包含多源数据信息的时空特征数据(即上述的初始特征信息)。具体可参考如下步骤:
81.步骤s031:获取全部监测站点的初始特征(时空特征)。
82.以监测站点i表征任一监测站点,则其中任一监测站点的初始特征(时空特征)的获取可包括:
83.提取监测站点i的静态初始特征和动态初始特征,使用第一融合函数对静态初始特征和动态初始特征进行融合,得到监测站点i的初始特征
84.示例性的,可利用下述公式得到
[0085][0086]
其中,表示监测站点i(也可称为第i个监测站点)的时空特征,si∈s,si表示监测站点i,s为全部监测站点的集合;σ1()表示第一融合函数,||表示连接操作;*表示矩阵相乘;表示监测站点i的地理拓扑数据(矩阵形式),表示监测站点i的poi数据,表示矩阵形式的监测站点i的气象数据,表示监测站点i的空气质量测量数据,对应动态初始特征。
[0087]
对应上述静态初始特征,ws为用于提取监测站点的静态初始特征所使用的全连接层(可称为第一全连接层)的权重矩阵。
[0088]
对应一动态初始特征向量,其示例性的可使用一维卷积网络(可称为第一卷积网络)提取。其中,第一卷积网络可包括m个卷积核,表示该一维卷积网络的第k个卷积核。在本实施例中,可使用m个卷积核在时间维度对动态数据分别进行一维卷积操作,得到m个不同的动态初始特征向量,这m个动态初始特征向量进行拼接,可得到动态初始特征。bs为卷积操作的偏置参数。ws和bs可通过训练得到。
[0089]
m个卷积核的尺寸可互不相同,本领域技术人员可灵活设计任一卷积核的尺寸,只要不大于的尺寸即可,在此不作赘述。
[0090]
步骤s032:获取目标区域的初始特征(时空特征)。
[0091]
在一个示例中,可提取目标区域的静态初始特征和动态初始特征,使用第二融合函数对目标区域静态初始特征和动态初始特征进行融合,得到初始特征h
l

[0092]
示例性的,可利用下述具体公式得到初始特征h
l

[0093]
[0094]
其中,h
l
表示目标区域的时空特征,l表示需要预测的目标区域,x
g,l
表示目标区域的地理拓扑数据,x
poi,l
表示目标区域的poi数据,x
m',l
表示目标区域的气象数据。σ2表示第二融合函数。
[0095]“w
l
(x
g,l
||x
poi,l
)”对应目标区域的静态初始特征,w
l
为用于提取目标区域的静态初始特征所使用的第二全连接层的权重矩阵。
[0096]
对应目标区域的一动态初始特征向量,其示例性的可使用一维卷积网络(可称为第二卷积网络)提取。第二卷积网络可包括m个卷积核,其中,表示第二卷积网络的第k个卷积核。在本实施例中,可使用m个卷积核在时间维度对目标区域的动态数据(x
m',l
)进行一维卷积操作,得到m个不同的动态初始特征向量,这m个动态初始特征向量进行拼接,可得到目标区域的动态初始特征。b
l
为卷积操作的偏置参数。w
l
和b
l
可通过训练得到。
[0097]
m个卷积核的尺寸可互不相同,本领域技术人员可灵活设计任一卷积核的尺寸,只要不大于x
m',l
的尺寸即可,在此不作赘述。
[0098]
上述第一融合函数、第二融合函数可为激活函数(例如relu激活函数)、归一化函数等等。
[0099]
步骤s033:对监测站点的时空特征和目标区域的时空特征进行拼接,得到初始特征信息h。
[0100]
示例性地,h={hs,h
l
};hs表示各监测站点的时空特征,
[0101]
二、提取空间关系
[0102]
高精细度空气质量预测是一个现实世界的地理空间建模问题,因而应考虑到目标区域与各监测站点之间的地理空间关系,参照图2(图2以3个监测站点为例,实际上可以有更多或更少的监测站点),下面对此展开详细介绍:
[0103]
步骤s04:使用初始特征信息提取空间特征。
[0104]
上述空间特征用于表征目标区域与各监测站点之间的空间相关性。
[0105]
为了获取空间特征,捕捉空间中目标区域与各监测站点之间的空间相关性,将监测站点与目标区域作为节点,构建图结构来表示静态的空间拓扑关系。其中v=s∪{l}为所有节点集合。e为监测站点s与目标区域l之间所有边的集合,d为邻接矩阵。基于图结构和初始特征信息来提取空间特征。
[0106]
获取空间特征的具体步骤,可如下所示:
[0107]
步骤s041:根据各监测站点与目标区域之间的距离,获得邻接矩阵。
[0108]
领接矩阵表征了各监测站点与目标区域之间的权重。
[0109]
而任一监测站点i在邻接矩阵中所对应的权重值可参考下述公式:
[0110][0111]
其中,为监测站点i在邻接矩阵中所对应的权重值;si∈s,l表示需要预测的
目标区域,为目标区域与监测站点i之间的距离,为标准差,ε为控制矩阵稀疏性的阈值。而ε的取值范围示例性的可为:0~0.2。
[0112]
邻接矩阵的表达式则为:
[0113]
其中,n为监测站点的总个数,i∈{1,2,...,n}。
[0114]
步骤s042:根据初始特征信息,获得空间注意力矩阵。
[0115]
空间注意力矩阵用于表征各监测站点空间位置相对于目标区域的重要性。
[0116]
空间注意力矩阵具体可通过如下步骤获得:
[0117]
步骤s0421:根据初始特征信息计算各监测站点相对于目标区域的空间相关性分数。
[0118]
其中,任一监测站点相对于目标区域的空间相关性分数的计算,具体包括:
[0119]
利用第一节点特征转换矩阵和监测站点i的初始特征进行计算,得到第一特征;
[0120]
利用第二节点特征转换矩阵和目标区域的初始特征进行计算,得到第二特征;
[0121]
对第一特征和第二特征进行拼接,并利用注意力权值矩阵加权,得到监测站点i和目标区域之间的空间相关特征;
[0122]
利用评分函数对空间相关特征进行评分,得到监测站点i的空间相关性分数。
[0123]
其中,第一节点特征转换矩阵和第二节点特征转换矩阵用于将监测站点i的初始特征和目标区域的初始特征嵌入到统一的空间。
[0124]
在一个示例中,上述空间相关性分数的计算可参照下述公式:
[0125][0126]
式中,为监测站点i与目标区域之间的空间相关性分数,σ3()表示评分函数,w1为第一矩阵参数,对应上述第一特征,wfh
l
对应上述第二特征;表示对wfh
l
和进行拼接,对应上述空间相关特征;wf和wg分别为第一节点特征转换矩阵和第二节点特征转换矩阵;h
l
表示目标区域的时空特征,表示监测站点i的时空特征。
[0127]
w1是一个可学习的矩阵向量,用于学习目标区域与各监测站点之间的空间注意力,其相当于一个全连接层中可训练的参数矩阵,或者说,的作用相当于将拼接得到的特征输入一个全连接层,在训练过程中,可学习w1中各元素的取值。而评分函数σ3()示例性的可为激活函数,例如,leakyrelu的激活函数。本领域技术人员也可选择其他激活函数,在此不作赘述。
[0128]
当然,可也采用下述公式计算空间相关性分数:
[0129]
其中,矩阵参数w
′1也可通过学习得到。
[0130]
示例性地,可通过图注意力模型(gat)自动计算不同站点数据的重要程度,从而获取上述空间相关性分数。具体的,可使用图注意力模型的图注意力层获取空间相关性分数。
[0131]
步骤s0422:对各空间相关性分数进行归一化处理,得到各监测站点的空间注意力值。
[0132]
其中,空间注意力矩阵包括:各监测站点的空间注意力值。
[0133]
本领域技术人员可使用多种归一化函数进行归一化处理,例如,min-max函数、sigmoid函数、softmax函数等等。
[0134]
以softmax函数为例,在获取任一监测站点的空间注意力值时,可参照下述公式:
[0135][0136]
式中,表示监测站点i相对于目标区域的空间注意力值(即空间注意力权重),表示第g个监测站点与目标区域之间的空间相关性分数,g∈{1,2,...,n}。
[0137]
相应地,空间注意力矩阵a的表达式则为:
[0138]
步骤s043:根据初始特征信息、邻接矩阵和空间注意力矩阵,获得空间特征。
[0139]
示例性地,可使用图注意力(gat)网络,通过有效结合含有地理信息的邻接矩阵与空间注意力矩阵,学习动态空间相关性,进而得到隐藏的空间特征。具体的,可使用图注意力模型的归一化层(归一化层对应前述的归一化函数)获取空间相关性分数。
[0140]
示例性地,在执行该步骤s043时,具体操作如下所示:
[0141]
利用空间注意力矩阵,对监测站点的初始特征进行特征提取,得到空间注意力特征;
[0142]
将空间注意力特征进行空间映射,得到映射特征;
[0143]
利用特征提取函数和邻接矩阵,对映射特征进行特征提取得到空间特征。
[0144]
在具体实现时,可通过公式实现上述s043的操作。例如,可参照下述公式实现上述s043的操作:
[0145][0146]
式中,β表示空间特征;σ4()表示特征提取函数,表示矩阵对应元素相乘操作,hs∈h,hs表示全部监测站点的时空特征,wb为节点的映射矩阵,用于将空间注意力特征(ahs)嵌入到前述统一的空间中。
[0147]
w2和w3分别为第二参数矩阵和第三参数矩阵;w2和w3作为可学习的参数矩阵,用于平衡邻接矩阵与空间注意力矩阵的贡献,在训练过程中,可学习w2和w3中各元素的取值。
[0148]
σ4()表示特征提取函数。特征提取函数示例性的可为激活函数,例如,leakyrelu的激活函数。本领域技术人员也可选择其他激活函数,在此不作赘述。
[0149]
示例性地,可使用图注意力模型的聚合层获得空间特征。
[0150]
三、提取时间关系
[0151]
由于某一地点的空气质量与其先前的观测值相关,且相关性随时间非线性变化,由此,通过设计时间注意力机制(可参见图3),以自适应地模拟不同时刻之间的非线性相关性,对此下面展开进一步地介绍:
[0152]
步骤s05:通过时间注意力机制对初始特征信息进行特征提取,得到目标区域的时间注意力特征。
[0153]
其中,初始特征信息包括多个时刻的子初始特征。每一时刻的子初始特征包括:目标区域和各监测站点在该时刻对应的初始特征。
[0154]
示例性的,执行上述步骤s05时具体过程可如下所示:
[0155]
步骤s051:根据初始特征信息中的子初始特征计算指定时间中每一时刻的时间注意力分数。
[0156]
需要说明的是,在本示例中,前述的“获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据”具体可为:获取目标城市指定时间内的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据。则初始特征信息具体也是与指定时间所对应的初始特征信息,其可包括指定时间内多个时刻的子初始特征。
[0157]
假定指定时间中包含有q个时刻,每一时刻对应一个采样点,则初始特征信息包括该q个时刻各自对应的子初始特征。子初始特征可为一维向量形式或矩阵形式。
[0158]
在一个示例中,以tr时刻和tj时刻表示指定时间中任一时刻,其分别对应向量形式的第一子初始特征和第二子初始特征,则可根据下述操作得到时间注意力分数:
[0159]
对第一子初始特征和第二子初始特征分别进行加权处理;
[0160]
计算加权后的第一子初始特征和加权后的第二子初始特征之间的夹角余弦;
[0161]
根据夹角余弦计算得到tj时刻相对于tr时刻的时间注意力分数。
[0162]
更具体的,步骤s051及后续步骤s502、s503具体可由时间注意力模型执行,该时间注意力模型示例性的可包括:全连接层、注意力层、归一化层和聚合层(输出层)。时间注意力模型通过时间注意力操作可计算出在指定时间中,各时刻的时间注意力分数。上述初始特征信息作为时间注意力模型的数据输入,从而提取时间注意力特征。
[0163]
进一步地,以计算指定时间内任一时刻(采样点)tr的时间注意力分数为例,时间注意力模型所执行的示例性操作可由下述公式表示:
[0164][0165]
式中,为tj时刻对于tr时刻的注意力分数,用于表征时刻tr与时刻tj之间的时间相关性,tr表示第r个时刻,tj表示第j个时刻。σ5()表示时间评分函数,具体可为激活函数,例如leakyrelu激活函数。
[0166]
《,》是向量内积的运算符,用于计算夹角余弦,flat()表示特征展开操作,用于将矩阵特征转换成向量特征。||表示连接操作。表示tr时刻目标区域的时空特征(初始特征),表示tr时刻全部监测站点的时空特征(初始特征),表示tj时刻目标区域的时空特征,表示tj时刻全部监测站点的时空特征;其中,对应矩阵形式的第一子初始特征,对应向量形式的第一子初始特征,同时,对应矩阵形式的第二子初始特征,对应向量形式的第二子初始特征。
[0167]
w4和w5分别为第四参数矩阵和第五参数矩阵,用于进行加权。在训练过程中,可学习w4和w5中各元素的取值。m1表示经特征展开操作后得到的、向量形式的第一子初始特征或第二子初始特征的特征维度。
[0168]
其中,flat()函数可由时间注意力模型中的全连接层实现,注意力得分可由注意力层实现。
[0169]
需要说明的是,以指定时间内包含q个采样点为例,tr时刻的时间注意力分数可至少包括其他q-1个采样点相对于tr时刻的时间注意力分数。
[0170]
步骤s052:对各时刻(采样点)的时间注意力分数进行归一化处理,得到各时刻对应的时间注意力值。
[0171]
本步骤可由前述时间注意力模型的归一化层执行。
[0172]
其中,时间注意力矩阵包括:各时刻对应的时间注意力值。
[0173]
本领域技术人员可选择多种归一化处理方式得到空间注意力值,例如,使用min-max函数、sigmoid函数、softmax函数等归一化函数进行处理等等。
[0174]
以softmax函数进行归一化处理的计算公式如下:
[0175][0176]
式中,为tj时刻相对于tr时刻的时间注意力值,用于表征时刻tr与时刻tj之间的时间注意力权重;表示tu时刻相对于tr时刻的时间注意力分数,u∈{1,2,...,q},q表示指定时间内采样点的个数。表示对指定时间内各时刻对于tr时刻的时间注意力值进行求和。
[0177]
需要说明的是,以指定时间内包含q个采样点为例,tr时刻的时间注意力值可至少包括其他q-1个采样点相对于tr时刻的时间注意力值。此外,也可包括tr时刻自身的时间注意力值。
[0178]
步骤s053:对时间注意力矩阵和初始特征信息进行聚合操作,得到时间注意力特征。
[0179]
本步骤可由前述时间注意力模型的聚合层执行。
[0180]
在一个示例中,可根据下述操作得到时间注意力特征:
[0181]
对初始特征信息进行维度转换,得到维度转换后的初始特征信息;
[0182]
使用时间注意力矩阵对上述维度转换后的初始特征信息进行加权,得到加权特征信息;
[0183]
根据时间注意力特征提取函数对加权特征信息进行特征提取,得到上述时间注意力特征。
[0184]
或者,可根据下述操作得到时间注意力特征:
[0185]
使用时间注意力矩阵对初始特征信息进行加权,得到加权特征信息;
[0186]
对加权特征信息进行维度转换,得到维度转换后的加权特征信息;
[0187]
根据时间注意力特征提取函数对维度转换后的加权特征信息进行特征提取,得到上述时间注意力特征。
[0188]
具体地,可利用下述任一公式计算得到时间注意力特征:
[0189]
δ=σ6(flat(b(h
l
||hs)wv);
[0190]
式中,flat()表示特征展开,用于进行聚合操作来提取不同时刻的时间信息,b表示时间注意力矩阵;wv为矩阵参数,用于对“h
l
||h
s”进行维度转换,得到维度转换后的初始特征信息;σ6()表示时间注意力特征提取函数,具体可为激活函数,例如leakyrelu激活函
数。h
l
表示目标区域的时空特征,hs表示全部监测站点的时空特征,“h
l
||h
s”即表征初始特征信息h。
[0191]
四、特征融合及预测
[0192]
通过融合空间特征和时间注意力特征,可获得蕴含时空信息的融合特征(高级隐藏特征),最后可通过全连接层输出每个时刻目标区域的空气质量数据,从而实现高精细度空气质量预测。参照图4,下面对此展开详细介绍:
[0193]
步骤s06:根据空间特征和时间注意力特征,获得融合特征。
[0194]
在一个示例中,上述融合特征包括第一融合特征和第二融合特征中的至少一个。也即,上述融合特征可仅包括第一融合特征,或仅包括第二融合特征,或同时包括第一融合特征和第二融合特征。
[0195]
其中,第一融合特征包括:目标区域在过去时间段t内各时刻的融合特征;第二融合特征包括:目标区域在未来时间段p内各时刻的融合特征。
[0196]
第二融合特征可由第一融合物征向量和未来时间段p内预测的气象数据得到的;第一融合特征可通过门控融合机制融合时间注意力特征和空间特征得到。
[0197]
步骤s07:根据融合特征预测得到目标区域的空气质量预测结果。
[0198]
在一个示例中,可利用空气质量预测权重矩阵和融合特征,预测得到空气质量预测结果。
[0199]
其中,空气质量预测结果包括目标区域指定时间内的空气质量预测值。目标区域指定时间内的空气质量预测值又进一步可包括:指定时间内各时刻的空气质量预测值。
[0200]
指定时间包括过去时间段t和未来时间段p中的至少一个。也即,指定时间可仅包括过去时间段t,也可仅包括未来时间段p,也可同时包括过去时间段t和未来时间段p。
[0201]
则相应的,指定时间内各时刻的空气质量预测值可仅包括过去时间段t间内各时刻的空气质量预测值,也可仅包括未来时间段p间内各时刻的空气质量预测值,也可同时包括过去时间段t和未来时间段p间内各时刻的空气质量预测值。
[0202]
每一时刻的空气质量预测值示例性的包括但不限于:pm2.5,pm10,o3,no2,co等中一种或任意多种空气污染物空气素质指数的预测值。
[0203]
本发明实施例所提供的方法可有多种细化的应用,下面一一介绍。
[0204]
应用一:本应用可根据第一融合特征对过去时间段t内目标区域的空气质量进行预测。
[0205]
在本应用中,前述步骤s02中所获取的目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据均为过去时间段t内的现有数据。前述的空间特征和时间注意力特征也均为过去时间段t所对应的空间特征和时间注意力特征。
[0206]
示例性地,可利用下述公式获取第一融合特征:
[0207]
z=sigmoid(δw6+βw7);
[0208][0209]
式中,z表示门控机制,用于调控空间特征β与时间注意力特征δ的权重比例,sigmoid()表示激活函数,相当于全连接层;w6和w7分别为第六参数矩阵和第七参数矩阵,w6和w7用于将空间特征β和时间注意力特征δ转换到同一维度空间(也即前述统一的空间);在训练过程中,可学习w6和w7中各元素的取值;表示第一融合特征,在本应用中,其为过
去时间段t内目标区域的融合特征;表示矩阵对应元素相乘操作。
[0210]
进一步,可利用公式:从而实现对目标区域在过去时间段t内的空气质量预测。
[0211]
其中,y
t
表示过去时间段t内目标区域的空气质量预测结果;w
x
,b
x
分别为空气质量预测权重矩阵(为与下述的矩阵相区别,可称为第一空气质量预测权重矩阵)和第一偏置值。在训练过程中,可学习w
x
中各元素的取值,以及学习b
x
的取值。
[0212]
需要说明的是,在本应用下,第一融合特征具体可包括过去时间段t内各时刻对应的融合特征,则y
t
具体包括:过去时间段t内各时刻的空气质量预测值。
[0213]
应用二:本应用可根据第二融合特征对未来时间段p内目标区域的空气质量进行预测。
[0214]
在本应用中,当执行步骤s02时,所获取的目标城市的地理拓扑数据、兴趣点poi数据为现有数据,而所获取的监测站点数据集包括:各个监测站点未来时间段p内的空气质量预测数据;所获取的气象数据则是由气象站预测的未来时间段p内的气象数据。
[0215]
需要说明的是,各个监测站点未来时间段p内的空气质量预测数据,以及,未来时间段p内的气象数据,可通过现有技术进行预测获得,当然未来所出现的预测技术也可应用于此,此处不再赘述。
[0216]
进一步地,可对照上述应用一获取第二融合特征;由于与应用一仅是在执行步骤s02时所获取的具体数据不同,因此与应用一类似,获取第二融合特征可利用下述公式:
[0217]
z=sigmoid(δw6+βw7);
[0218][0219]
进一步,可利用公式:从而实现对目标区域在未来时间段p内的空气质量预测。
[0220]
其中,y
p
表示未来时间段p内目标区域的空气质量预测结果。w
x

为第二空气质量预测权重矩阵,但由于其用于未来时间段的预测,因此,其元素的取值可能与前述的w
x
并不相同,同理,第二偏置b
x'
可能不同于b
x
。在训练过程中,可学习w
x

中各元素的取值,以及学习b
x'
的取值。
[0221]
需要说明的是,在本应用下,第二融合特征具体可包括未来时间段p内各时刻对应的融合特征,则y
t
具体包括:未来时间段p内各时刻的空气质量预测值。
[0222]
应用三:本应用可根据第一融合特征和第二融合特征对过去时间段t和未来时间段p内目标区域的空气质量进行预测。
[0223]
可在应用一的基础上,获取到第一融合特征进而同时实现对目标区域过去时间段t,以及,未来时间段p内的空气质量预测,具体如下所示:
[0224]
根据第一融合特征获取第二融合特征;示例性地可利用下述公式实现:
[0225][0226][0227]
其中,τ表示未来时间段p内,目标区域的时间注意力矩阵;w8和w9分别为第八参数
矩阵和第九参数矩阵;w
10
为第十参数矩阵。m2表示的特征维度。在一个示例中,本发明所提及的各层的输出维度均被投影到同一大小。
[0228]hl,p
表示未来时间段p内的目标区域的时空特征,具体提取方式可参见本文前述记载(例如步骤s032),在此不作赘述。
[0229]
需要说明的是,h
l,p
是通过融合目标区域的地理拓扑数,以及,气象站预测的未来时间段p内的气象数据得到;也就是说,第二融合特征是根据第一融合特征和未来时间段p内预测的气象数据得到的。
[0230]
进一步,可利用公式:从而实现对目标区域在过去时间段t,以及,未来时间段p内的空气质量预测。
[0231]
其中,y
t+p
表示过去一段时间t,以及,未来一段时间p内目标区域的空气质量预测结果;表示时间维度连接操作,wy为第三空气质量预测权重矩阵,by为第三偏置;在训练过程中,可学习wy中各元素的取值,以及学习by的取值。
[0232]
需要说明的是,在本应用下,第一融合特征具体可包括过去时间段t内各时刻对应的融合特征,第二融合特征具体可包括未来时间段p内各时刻对应的融合特征,则y
t+p
具体包括:过去时间段t和未来时间段p内各时刻的空气质量预测值。
[0233]
过去时间段t、未来时间段p的长度可根据实际需要来设定,例如,过去时间段t为过去一周,两周,一个月等等,同理,未来时间段p可为未来一周,两周,一个月等等。
[0234]
进一步地,本发明实施例中还提供了空气质量预测系统(参见图5),具体包括:区域划分单元1、数据获取单元2、时空匹配单元3、图注意力网络单元4、时间注意力单元5、融合单元6、预测单元7。
[0235]
区域划分单元1用于将目标城市的区域划分为监测区域和目标区域。
[0236]
任一目标区域为:目标城市中未设有监测站点的区域;任一监测区域为:目标城市中设有监测站点的区域。
[0237]
区域划分单元1可用于执行上述所有实施例中步骤s01,相关描述请参见前文记载,在此不作赘述。
[0238]
需要说明的是,在一些场景下目标城市的监测区域和目标区域可能已经预先划分好,在此情况下,可不包括区域划分单元1。
[0239]
数据获取单元2,用于:
[0240]
获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据;
[0241]
选取目标区域内的气象数据、poi数据和地理拓扑数据作为目标区域信息。
[0242]
数据获取单元2可用于执行上述所有实施例中步骤s02至s03,相关描述請参见前文记载,在此不作赘述。
[0243]
时空匹配单元3用于对监测站点数据集和目标区域信息进行特征提取和拼接,得到初始特征信息。
[0244]
其中,监测站点数据集包括各个监测站点的空气质量测量数据。时空匹配单元3可用于执行上述所有实施例中步骤s04,相关描述請参见前文记载,在此不作赘述。
[0245]
图注意力网络单元4用于将初始特征信息输入图注意力网络,获取空间特征。
[0246]
其中,空间特征用于表征目标区域与各监测站点之间的空间关系。图注意力网络
单元4可用于执行上述所有实施例中步骤s05,相关描述请参见前文记载,在此不作赘述。
[0247]
时间注意力单元5用于通过时间注意力机制对初始特征信息进行特征提取,得到时间注意力特征。
[0248]
时间注意力单元5可用于执行上述所有实施例中步骤s06,相关描述請参见前文记载,在此不作赘述。
[0249]
融合单元6用于通过门控融合机制融合时间注意力特征和空间特征,得到融合特征。
[0250]
融合单元6可用于执行上述所有实施例中步骤s07,相关描述請参见前文记载,在此不作赘述。
[0251]
预测单元7用于根据融合特征预测得到目标区域的空气质量预测结果。
[0252]
其中,空气质量预测结果包括目标区域指定时间内的空气质量预测值。预测单元7可用于执行上述所有实施例中步骤s08,相关描述請参见前文记载,在此不作赘述。
[0253]
综上所述,本发明实施例中所提供的空气质量预测方法及系统,均能够实现对目标城市中未设监测站点区域的空气质量预测。
[0254]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0255]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种空气质量预测方法,其特征在于,所述预测方法包括:获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据;所述监测站点数据集包括各个监测站点的空气质量测量数据;所述目标城市的区域划分为监测区域和目标区域;任一目标区域为:所述目标城市中未设有监测站点的区域;任一监测区域为:所述目标城市中设有监测站点的区域;对监测站点信息和目标区域信息进行特征提取和拼接,得到初始特征信息;所述监测站点信息至少包括:所述监测站点数据集;所述目标区域信息包括所述目标区域内的气象数据、poi数据和地理拓扑数据;使用所述初始特征信息提取空间特征;所述空间特征用于表征所述目标区域与各监测站点之间的空间相关性;通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征;根据所述空间特征和时间注意力特征,获得融合特征;根据所述融合特征预测得到所述目标区域的空气质量预测结果。2.根据权利要求1所述的一种空气质量预测方法,其特征在于,使用所述初始特征信息提取空间特征,具体包括:根据各所述监测站点与所述目标区域之间的距离,获得邻接矩阵;根据所述初始特征信息,获得空间注意力矩阵;所述空间注意力矩阵用于表征各监测站点空间位置相对于目标区域的重要性;根据所述初始特征信息、邻接矩阵和空间注意力矩阵,获得所述空间特征。3.根据权利要求2所述的一种空气质量预测方法,其特征在于,根据所述初始特征信息,获得空间注意力矩阵,具体包括:根据所述初始特征信息计算各监测站点相对于所述目标区域的空间相关性分数;对各所述空间相关性分数进行归一化处理,得到各监测站点的空间注意力值;所述空间注意力矩阵包括:各监测站点的空间注意力值。4.根据权利要求3所述的一种空气质量预测方法,其特征在于,所述初始特征信息包括:各监测站点的初始特征,以及,所述目标区域的初始特征;任一监测站点的空间相关性分数的计算,具体包括:利用第一节点特征转换矩阵和监测站点i的初始特征进行计算,得到第一特征;所述监测站点i表征任一监测站点;利用第二节点特征转换矩阵和所述目标区域的初始特征进行计算,得到第二特征;对所述第一特征和第二特征进行拼接,并利用注意力权值矩阵加权,得到所述监测站点i和所述目标区域之间的空间相关特征;利用评分函数对所述空间相关特征进行评分,得到所述监测站点i的空间相关性分数;其中,所述第一节点特征转换矩阵和所述第二节点特征转换矩阵用于将所述监测站点i的初始特征和所述目标区域的初始特征嵌入到统一的空间。5.根据权利要求2-4任一项所述的一种空气质量预测方法,其特征在于,根据所述初始特征信息、邻接矩阵和空间注意力矩阵,获得所述空间特征,具体包括:利用空间注意力矩阵,对所述初始特征信息中各监测站点的初始特征进行特征提取,
得到空间注意力特征;将所述空间注意力特征进行空间映射,得到映射特征;利用特征提取函数和所述邻接矩阵,对所述映射特征进行特征提取得到所述空间特征。6.根据权利要求1-4任一项所述的一种空气质量预测方法,其特征在于,所述初始特征信息包括多个时刻的子初始特征;通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征,具体包括:根据初始特征信息中的子初始特征计算指定时间中每一时刻的时间注意力分数;对各时刻的时间注意力分数进行归一化处理,得到各时刻对应的时间注意力值;所述时间注意力矩阵包括:各时刻对应的时间注意力值;对所述时间注意力矩阵和初始特征信息进行聚合操作,得到所述时间注意力特征。7.根据权利要求1所述的一种空气质量预测方法,其特征在于,所述目标区域的空气质量预测结果包括:所述目标区域在指定时间内各时刻的空气质量预测值;所述根据所述融合特征预测得到所述目标区域的空气质量预测结果包括:利用空气质量预测权重矩阵和所述融合特征,预测得到所述目标区域在指定时间内各时刻的空气质量预测值;所述指定时间包括过去时间段t和未来时间段p。8.根据权利要求1或7所述的一种空气质量预测方法,其特征在于,所述目标区域内的气象数据包括:过去时间段t内的气象数据和未来时间段p内预测的气象数据;所述监测站点数据集包括:各个监测站点过去时间段t内的空气质量测量数据;所述目标区域信息包括:所述目标区域在过去时间段t内的气象数据、poi数据和地理拓扑数据;所述融合特征包括第一融合特征和第二融合特征;所述第一融合特征包括:所述目标区域在过去时间段t内各时刻的融合特征;所述第二融合特征包括:所述目标区域在未来时间段p内各时刻的融合特征;其中,所述第二融合特征是由所述第一融合物征向量和未来时间段p内预测的气象数据得到的;所述第一融合特征是通过门控融合机制融合所述时间注意力特征和所述空间特征得到;所述目标区域的空气质量预测结果包括:所述目标区域在过去时间段t和未来时间段p内各时刻的空气质量预测值。9.一种空气质量预测系统,其特征在于,所述预测系统包括:数据获取单元,用于:获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点poi数据;所述监测站点数据集包括各个监测站点的空气质量测量数据;所述目标城市的区域划分为监测区域和目标区域;任一目标区域为:所述目标城市中未设有监测站点的区域;任一监测区域为:所述目标城市中设有监测站点的区域;时空匹配单元,用于对监测站点信息和目标区域信息进行特征提取和拼接,得到初始特征信息;所述监测站点信息至少包括:所述监测站点数据集;所述目标区域信息包括所述
目标区域内的气象数据、poi数据和地理拓扑数据;图注意力网络单元,用于初始特征信息使用所述初始特征信息提取空间特征;所述空间特征用于表征所述目标区域与各监测站点之间的空间相关性;时间注意力单元,用于通过时间注意力机制对所述初始特征信息进行特征提取,得到所述目标区域的时间注意力特征;融合单元,用于根据所述空间特征和时间注意力特征,获得融合特征;预测单元,用于根据所述融合特征预测得到所述目标区域的空气质量预测结果。

技术总结
本发明公开一种空气质量预测方法及系统,涉及空气质量预测领域,预测方法包括:目标城市划分为监测区域(设有监测站点)及目标区域(未设有监测站点),获取目标城市的监测站点数据集、地理拓扑数据、气象数据和兴趣点POI数据,进一步选取目标区域内的气象数据、POI数据和地理拓扑数据作为特征信息,根据监测站点和目标区域信息获得初始特征信息,之后使用初始特征信息提取空间特征和时间注意力特征,进而利用门控融合机制融合时间注意力特征和空间特征,得到融合特征,最后可根据融合特征预测得到目标区域的空气质量预测结果;本发明对城市中未设有监测站点的区域,也能够实现空气质量的精准预测。量的精准预测。量的精准预测。


技术研发人员:郝洁 孙子旭 吴强
受保护的技术使用者:南京航空航天大学
技术研发日:2023.05.23
技术公布日:2023/8/21
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐