基于神经网络的大气污染溯源方法及系统与流程
未命名
10-18
阅读:107
评论:0

1.本发明涉及大气污染溯源技术,尤其是基于神经网络的大气污染溯源方法及系统。
背景技术:
2.随着工业化和城市化的发展,大气污染问题日益严重,给人类健康和生态环境带来了巨大的危害。为了有效地控制和治理大气污染,需要对污染源进行准确地识别和定位。然而,由于大气污染物的扩散、转化、沉降等复杂过程,以及污染源的多样性、分散性、时空变化性等特点,传统的基于固定监测站的大气污染源溯源方法往往难以满足实际需求。
3.为了解决这一问题,近年来出现了一种基于移动监测站的大气污染源溯源方法。移动监测站是指可以在不同地点进行空气质量监测的设备,如无人机、无人艇、汽车等。相比固定监测站,移动监测站具有以下优点:(1)可以覆盖更广泛的空间范围,提高空间分辨率;(2)可以根据实际情况灵活调整监测路线和时间,提高时序分辨率;(3)可以采集更多维度的数据,如位置、速度、方向等,提高数据信息量。然而,基于移动监测站的大气污染源溯源方法也面临着一些挑战,比如:
①
如何处理移动监测站在运动过程中受到各种因素影响而产生的数据噪声和偏差;
②
如何对来自不同来源、不同频率、不同精度的数据进行有效地质量控制和融合;
③
如何利用移动监测数据挖掘出污染物的时空分布趋势,并基于趋势反推出污染源的位置和强度,以及这种分析方法的准确率和高效性。
4.因此,需要对现有技术进行改进,以克服现有技术的缺陷。
技术实现要素:
5.发明目的:提供一种基于神经网络的大气污染溯源方法,以解决现有技术存在的上述问题。
6.技术方案:基于神经网络的大气污染溯源方法,包括如下步骤:步骤s1、读取移动式检测站的移动监测数据并预处理,获得标准化的移动监测数据,所述移动监测数据至少包括监测到的染物浓度、监测时间和监测位置坐标;步骤s2、基于所述移动监测数据挖掘污染物的时空演变趋势,获得趋势分析结果;步骤s3、读取多源污染物数据,并构建污染源校正模块,以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟结果进行校正;步骤s4、构建图神经网络模型,基于校正后的模拟结果进行编码和训练,获得溯源数据,所述溯源数据包括污染源识别、各个污染源的贡献、污染传播路径以及敏感性分析结果。
7.根据本技术的一个方面,所述步骤s1中,对移动式检测站的移动监测数据进行预处理的过程包括:步骤s11、对移动监测数据进行异常值的检测和剔除,消除数据的噪声和干扰;步骤s12、设定异常值判断标准,检测并剔除移动监测数据中的异常值;
步骤s13、对移动监测数据进行空间插值,填补空间上的数据空缺;步骤s14、将移动监测数据进行时间同步,使得不同移动监测站在同一时刻的数据对应起来。
8.根据本技术的一个方面,所述步骤s2进一步为:步骤s21、根据移动监测站的位置信息,将移动监测数据划分为若干个子区域,每个子区域包含至少一个移动监测站在预定时间内的监测数据,形成监测数据的时间序列;步骤s22、基于时间序列分析方法对每个子区域内的监测数据进行趋势分析,计算污染物浓度随时间的变化率和方差,作为污染趋势指标;步骤s23、根据污染趋势指标,对每个子区域进行排名和筛选,选择出排名靠前且超过阈值的子区域作为候选污染源区域,并估计其污染源位置、类型和强度,输出污染源信息和趋势分析结果。
9.根据本技术的一个方面,所述步骤s3进一步包括:步骤s31、获取多源污染物的数据,包括固定监测站数据、遥感影像数据、地理信息数据,以及气象信息数据;步骤s32、构建污染源校正模块,所述污染源校正模块包括camx-osat-psat模块;基于预存储的环境信息,对污染源校正模块进行环境校正;步骤s33、以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟和预测结果进行比较和评估,计算其与实际情况的相似度和误差,并根据相似度和误差对候选污染源区域进行排序和筛选,选择出最优的污染源区域,并确定其位置、强度和类型。
10.根据本技术的一个方面,所述步骤s4进一步包括:步骤s41、利用图神经网络对图数据进行编码和嵌入,学习节点和边的隐含特征,以及节点之间的关系和相似度;步骤s42、利用图神经网络对图数据进行解码和预测,实现不同的分析目标。
11.根据本技术的一个方面,所述步骤s22进一步为:步骤s22a、构建自回归滑动平均模型,采用单位根检验或者平稳性检验判断时间序列是否平稳;采用自相关函数或者偏自相关函数判断时间序列是否为白噪声;如果时间序列不满足平稳性或者白噪声性,采用差分方法使其满足arma模型的假设;步骤s22b、采用信息准则方法或者残差分析方法选择最优的模型阶数,所述信息准则方法包括aic、bic、hq;所述残差分析方法包括ljung-box检验、正态性检验;步骤s22c、利用最大似然估计法或者最小二乘估计法,估计arma模型的参数,并利用估计的参数和历史数据,预测监测数据的未来值,并计算预测误差作为变化率和方差,作为污染趋势指标。
12.根据本技术的一个方面,所述步骤s23进一步为:步骤s23a、按照综合值从高到低进行排名,对每个子区域的污染趋势指标进行排序,得到子区域的排名列表;步骤s23b、对每个子区域的污染趋势指标进行筛选,根据预定的阈值或者比例,选择出综合值超过阈值或者排名在前n位的子区域,作为候选污染源区域;n为自然数;步骤s23c、对每个候选污染源区域进行估计,根据子区域轨迹和监测数据,利用最
大似然法或者最小二乘法估计其污染源位置、类型和强度,输出污染源信息和趋势分析结果。
13.根据本技术的一个方面,步骤s23b进一步为:利用香农信息熵计算污染趋势指标的信息熵;根据信息熵的变化规律,确定最优的阈值,使得信息熵达到最大或者最小;根据最优阈值或者比例,对子区域进行筛选,选择出综合值超过阈值或者排名在前n位的子区域,作为候选污染源区域。
14.根据本技术的一个方面,步骤s22进一步为:步骤s22a、构建非线性函数集合和广义可加模型,根据污染物数据与非线性函数的映射关系,分析污染物监测数据的分布特征和变化规律,选择对应的非线性函数作为广义可加模型的基函数;步骤s22b、利用最大似然估计估计广义可加模型的参数,包括基函数的系数和平滑参数;步骤s22c、利用广义可加模型对污染物浓度进行拟合,并计算拟合值与实际值之间的残差,并将残差平方求和,作为方差的估计值;计算污染物浓度随时间的变化率,并将变化率和方差作为污染趋势指标。
15.根据本技术的另一个方面,一种基于神经网络的大气污染溯源系统,包括:至少一个处理器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项技术方案所述的基于神经网络的大气污染溯源方法。
16.有益效果:本发明对大气污染溯源的效率更高,准确度大大提升。相关优势将在下文结合具体实施方式进行说明。
附图说明
17.图1是本发明的流程图。
18.图2是本发明步骤s1的流程图。
19.图3是本发明步骤s2的流程图。
20.图4是本发明步骤s3的流程图。
具体实施方式
21.如图1所示,提供如下的实施例。
22.步骤s1、读取移动式检测站的污染监测数据并预处理,获得标准化监测数据,所述污染监测数据包括监测到的染物浓度、监测时间和监测位置坐标;步骤s11:质量检验。该子步骤主要是对移动监测数据进行有效性和完整性的检验,剔除无效或缺失的数据,保证数据的质量。具体的实现过程如下:首先,对移动监测数据进行格式和范围的检查,确保数据符合预期的类型和取值范围,例如,污染物浓度应为非负数,时间戳应为有效的日期和时间格式等。
23.其次,对移动监测数据进行完整性的检查,检测是否存在缺失值或空值,例如,某个移动监测站在某个时间段内没有上传数据,或者某个污染物指标没有记录等。
24.最后,对移动监测数据进行有效性的检查,检测是否存在不合理或不可信的数据,例如,某个移动监测站在短时间内跨越了很远的距离,或者某个污染物浓度超过了正常水平等。
25.对于检查出来的无效或缺失的数据,可以采用删除、替换或忽略等策略进行处理,具体取决于数据的重要性和影响程度。
26.步骤s12:异常值剔除。该子步骤主要是对移动监测数据进行异常值的检测和剔除,消除数据的噪声和干扰,提高数据的准确性。具体的实现过程如下:首先,对移动监测数据进行统计分析,计算各个指标的均值、方差、最大值、最小值、中位数、四分位数等基本统计量,以了解数据的分布特征。
27.其次,对移动监测数据进行异常值的检测,根据不同的指标和场景选择合适的异常值检测方法和阈值,例如,可以采用箱线图法、z-分数法、孤立森林法等方法。
28.最后,对移动监测数据进行异常值的剔除,根据检测结果删除或替换异常值,或者将其作为特殊情况进行标记和分析。
29.步骤s13:空间插值。该子步骤主要是对移动监测数据进行空间插值,填补空间上的数据空缺,增加数据的密度和连续性。具体的实现过程如下:首先,对移动监测数据进行空间分布的分析,确定空间上的插值区域和插值点,例如,可以根据地理信息系统(gis)将空间划分为网格,并选择网格中心作为插值点。
30.其次,对移动监测数据进行空间插值的计算,根据不同的指标和场景选择合适的空间插值方法和参数,例如,可以采用反距离加权法、克里金法、径向基函数法等方法。
31.最后,对移动监测数据进行空间插值的评估,根据插值结果和实际情况进行比较和分析,评估插值的准确性和可信度,例如,可以采用均方误差、相关系数、交叉验证等方法。
32.步骤s14:时间同步。该子步骤主要是对移动监测数据进行时间同步,使得不同移动监测站在同一时刻的数据能够对应起来,便于后续的分析和比较。具体的实现过程如下:首先,对移动监测数据进行时间分布的分析,确定时间上的同步区间和同步点,例如,可以根据数据的采样频率和时间范围,将时间划分为等长的时间段,并选择时间段的中点作为同步点。
33.其次,对移动监测数据进行时间同步的计算,根据不同的指标和场景选择合适的时间同步方法和参数,例如,可以采用线性插值法、滑动平均法、卡尔曼滤波法等方法。
34.最后,对移动监测数据进行时间同步的评估,根据同步结果和实际情况进行比较和分析,评估同步的准确性和可信度,例如,可以采用均方误差、相关系数、交叉验证等方法。
35.步骤s2、基于所述标准化监测数据挖掘污染物的时空演变趋势,获得趋势分析结果;步骤s21:子区域划分。该子步骤主要是根据移动监测站的运动轨迹,根据移动监测站的位置信息,将移动监测数据划分为若干个子区域,每个子区域包含一个或多个移动监测站在一定时间内的监测数据。具体的实现过程如下:首先,对移动监测站的运动轨迹进行轨迹分割,将连续的轨迹点按照一定的时间间隔或者距离间隔划分为若干个轨迹段,每个轨迹段包含一个或多个轨迹点。
36.其次,对每个轨迹段进行轨迹聚类,利用聚类算法将具有相似运动特征的轨迹段划分为一个类别,每个类别代表一个子区域。
37.最后,对每个子区域进行轨迹合并,将属于同一类别的轨迹段连接起来,形成一个完整的子区域轨迹,并提取该子区域内的所有监测数据。
38.一种可能的轨迹分割和聚类算法是基于密度的时空轨迹聚类算法(density-basedspatio-temporaltrajectoryclustering,dbstc),该算法可以根据轨迹点之间的时空距离和密度阈值进行轨迹分割和聚类。具体过程如下:步骤1:计算轨迹点之间的时空距离。该步骤主要是利用欧氏距离或者曼哈顿距离等公式,计算每两个轨迹点之间在空间和时间上的距离,并保存为一个距离矩阵。
39.步骤2:确定密度阈值。该步骤主要是根据数据的分布特征,确定一个合适的密度阈值,用于判断轨迹点是否属于同一个簇。一般来说,可以采用基于信息熵或者基于核密度估计等方法,来自动地确定最优的密度阈值。
40.步骤3:进行轨迹分割和聚类。该步骤主要是利用密度连接性的概念,将距离小于密度阈值且在时间上连续的轨迹点划分为一个轨迹段,并将具有相似运动特征的轨迹段划分为一个轨迹簇。具体来说,可以采用基于dbscan或者optics等算法,来实现轨迹分割和聚类。
41.该方法可以有效地处理不同长度、不同形状、不同密度的轨迹数据;可以自适应地确定合适的密度阈值;可以保留轨迹数据的时空特征和运动特征。解决了如何根据移动监测站的运动轨迹,将移动监测数据划分为若干个子区域,每个子区域包含一个或多个移动监测站在一定时间内的监测数据的问题。
42.步骤s22:趋势分析。该子步骤主要是对每个子区域内的监测数据进行趋势分析,计算污染物浓度随时间的变化率和方差,作为污染趋势指标。具体的实现过程如下:首先,对每个子区域内的监测数据进行时间序列分析,利用时间序列模型拟合污染物浓度与时间的关系,并计算污染物浓度随时间的变化率,作为污染趋势指标之一。
43.其次,对每个子区域内的监测数据进行方差分析,利用方差分析模型计算污染物浓度在时间上的波动程度,并计算污染物浓度在时间上的方差,作为污染趋势指标之一。
44.最后,对每个子区域内的监测数据进行综合评价,利用综合评价模型将污染物浓度随时间的变化率和方差进行加权求和,并得到污染趋势指标的综合值。
45.在一个实施例中,采用时间序列模型是自回归滑动平均模型arma来实现上述过程,arma为 autoregressivemovingaveragemodel,该模型可以根据历史数据预测未来数据,并计算预测误差作为变化率。
46.步骤1:检验平稳性和白噪声性。该步骤主要是检验时间序列是否满足arma模型的基本假设,即平稳性和白噪声性。一般来说,可以采用单位根检验或者平稳性检验等方法,来判断时间序列是否平稳;可以采用自相关函数或者偏自相关函数等方法,来判断时间序列是否为白噪声。如果时间序列不满足平稳性或者白噪声性,可以采用差分或者转换等方法,来使其满足arma模型的假设。
47.步骤2:确定模型阶数。该步骤主要是确定arma模型的自回归阶数p和滑动平均阶数q,即arma(p,q)模型。一般来说,可以采用信息准则或者残差分析等方法,来选择最优的模型阶数。信息准则是根据模型的拟合程度和复杂度,来评价模型的优劣,常用的信息准则
有aic、bic、hq等;残差分析是根据模型的残差是否为白噪声,来评价模型的合理性,常用的残差分析有ljung-box检验、正态性检验等。
48.步骤3:估计模型参数和预测未来数据。该步骤主要是利用最大似然估计或者最小二乘估计等方法,估计arma模型的参数,并利用估计的参数和历史数据,预测未来数据,并计算预测误差作为变化率。
49.该方法针对现有技术中存在的问题:如何对每个子区域内的监测数据进行时间序列分析,利用时间序列模型拟合污染物浓度与时间的关系,并计算污染物浓度随时间的变化率。该方法可以有效地描述时间序列的动态特征和随机特征;可以利用历史数据进行未来数据的预测;可以通过预测误差反映时间序列的变化趋势。
50.另外一种可能的实施例是通过构建方差分析模型是广义可加模型来实现。广义可加模型gam(generalizedadditivemodel),该模型可以根据非线性函数拟合污染物浓度与时间的关系,并计算残差平方和作为方差。
51.具体过程如下:步骤1:选择非线性函数。该步骤主要是根据数据的分布特征和变化规律,选择合适的非线性函数作为gam模型的基函数,如样条函数、多项式函数、对数函数等。
52.步骤2:估计模型参数。该步骤主要是利用最大似然估计或者最小二乘估计等方法,估计gam模型的参数,包括基函数的系数和平滑参数等。
53.步骤3:计算残差平方和。该步骤主要是利用gam模型对污染物浓度进行拟合,并计算拟合值与实际值之间的残差,并将残差平方求和,作为方差的估计值。
54.本实施例可以有效地处理非线性和非平稳的数据;可以利用不同类型的基函数进行灵活的拟合;可以通过残差反映数据的波动程度。本实施例针对现有技术存在的如何对每个子区域内的监测数据进行方差分析,利用方差分析模型计算污染物浓度在时间上的波动程度,并计算污染物浓度在时间上的方差。
55.一种可能的综合评价模型是层次分析法(analytichierarchyprocess,ahp),该模型可以根据专家打分和一致性检验确定变化率和方差的权重,并进行加权求和。
56.步骤1:构建层次结构。该步骤主要是将综合评价问题分解为若干个层次,包括目标层、准则层和方案层。目标层是综合评价问题的总目标,即污染趋势指标;准则层是影响综合评价结果的因素,即变化率和方差;方案层是需要进行综合评价比较的对象,即各个子区域。
57.步骤2:构建判断矩阵。该步骤主要是根据专家打分或者客观数据,构建判断矩阵,反映不同层次之间或者同一层次内各个元素之间的相对重要性或者优先级。一般来说,可以采用1-9量表或者其他量化方法,来表示判断矩阵中的元素值。
58.步骤3:计算权重向量和一致性比例。该步骤主要是利用特征值法或者其他方法,计算判断矩阵的最大特征值和对应的特征向量,并将特征向量归一化,作为权重向量。同时,利用一致性指标或者其他方法,计算判断矩阵的一致性比例,并检验是否满足一致性要求。如果不满足一致性要求,可以对判断矩阵进行修正,直到满足一致性要求为止。
59.步骤4:进行加权求和和排序。该步骤主要是利用权重向量和各个子区域的变化率和方差,进行加权求和,得到各个子区域的污染趋势指标的综合值,并根据综合值进行排序,得到综合评价结果。
60.采用这个方法的优势是:可以有效地处理多准则和多方案的综合评价问题;可以充分利用专家知识和客观数据;可以通过一致性检验保证评价结果的合理性和可信度。
61.采用这个方法能够解决的技术问题是:如何对每个子区域内的监测数据进行综合评价,利用综合评价模型将污染物浓度随时间的变化率和方差进行加权求和,并得到污染趋势指标的综合值。
62.步骤s23:区域筛选。该子步骤主要是根据污染趋势指标,对每个子区域进行排名和筛选,选择出排名靠前且超过阈值的子区域作为候选污染源区域,并估计其污染源位置和强度。具体的实现过程如下:首先,对每个子区域的污染趋势指标进行排序,按照综合值从高到低进行排名,得到子区域的排名列表。
63.其次,对每个子区域的污染趋势指标进行筛选,根据阈值或者预定比例,选择出综合值超过阈值或者排名在前几位的子区域,作为候选污染源区域。
64.最后,对每个候选污染源区域进行估计,根据子区域轨迹和监测数据,利用最大似然法或者最小二乘法等方法,估计其污染源位置和强度。
65.一种可能的阈值或者比例的确定方法是基于信息熵的方法,该方法可以根据污染趋势指标的分布特征,计算其信息熵,并根据信息熵确定最优的阈值或者比例。
66.步骤1:计算信息熵。该步骤主要是利用香农信息熵或者其他信息熵公式,计算污染趋势指标的信息熵,反映其分布的不确定性或者混乱程度。一般来说,信息熵越大,表示分布越均匀或者随机;信息熵越小,表示分布越集中或者有序。
67.步骤2:确定最优阈值或者比例。该步骤主要是根据信息熵的变化规律,确定最优的阈值或者比例,使得信息熵达到最大或者最小。一般来说,可以采用极大似然估计或者最小二乘估计等方法,来求解最优阈值或者比例。
68.步骤3:进行区域筛选。该步骤主要是根据最优阈值或者比例,对子区域进行筛选,选择出综合值超过阈值或者排名在前几位的子区域,作为候选污染源区域。本实施例可以有效地处理不同类型和分布的数据;可以利用信息论的原理进行客观和科学的决策;可以通过信息熵反映数据的分布特征和变化规律。 本实施例能够解决现有技术存在的如何根据污染趋势指标,对每个子区域进行排名和筛选,选择出排名靠前且超过阈值的子区域作为候选污染源区域的问题。
69.步骤s3、读取多源污染物数据,并构建污染源校正模块,以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟结果进行校正;步骤s31:扩散模拟。该子步骤主要是利用camx—osat+psat模式,根据不同类型的污染源,如点源、面源、线源等,选择合适的扩散模型和参数,对候选污染源区域进行模拟和预测,得到其在空间上的污染物浓度分布。具体的实现过程如下:首先,根据候选污染源区域的位置、强度、类型等信息,设置camx—osat+psat模式的输入参数,如排放源位置、排放量、排放高度、排放速率等。
70.其次,运行camx—osat+psat模式,利用欧拉化学传输模型(eulerianchemistry-transportmodel,ctm)模拟大气污染物的传输和化学转化过程,并利用osat(臭氧来源分配技术)和psat(颗粒物来源分配技术)工具对臭氧和颗粒物的来源进行解析,计算出各个来源对污染物浓度的贡献。
71.最后,输出camx—osat+psat模式的结果,得到候选污染源区域在空间上的污染物浓度分布图,以及各个来源对污染物浓度的贡献图。
72.步骤s32:环境校正。该子步骤主要是利用camx—osat+psat模式,根据大气环境因素,如风速、风向、温度、湿度、气压等,对扩散模型和参数进行校正和修正,得到其在时间上的污染物浓度变化。具体的实现过程如下:首先,获取大气环境因素的数据,如风速、风向、温度、湿度、气压等,可以从气象站数据、遥感影像数据、地理信息数据等来源获取。
73.其次,利用camx—osat+psat模式,根据大气环境因素的数据,对扩散模型和参数进行校正和修正,考虑大气环境因素对污染物传输和扩散的影响。
74.最后,输出camx—osat+psat模式的结果,得到候选污染源区域在时间上的污染物浓度变化图,以及大气环境因素对污染物浓度变化的影响图。
75.步骤s33:信息融合。该子步骤主要是利用其他来源的信息,如固定监测站数据、遥感影像数据、地理信息数据、气象信息数据等,对模拟和预测结果进行比较和评估,计算其与实际情况的相似度和误差,并根据相似度和误差对候选污染源区域进行排序和筛选,选择出最优的污染源区域,并确定其位置、强度、类型等信息。具体的实现过程如下:首先,获取其他来源的信息,如固定监测站数据、遥感影像数据、地理信息数据、气象信息数据等,可以从公开的数据库、网站、报告等来源获取。
76.其次,利用多源信息融合的方法,对模拟和预测结果进行比较和评估,计算其与实际情况的相似度和误差,例如,可以采用均方误差、相关系数、交叉验证等方法。
77.最后,利用多源信息融合的方法,根据相似度和误差对候选污染源区域进行排序和筛选,选择出最优的污染源区域,并确定其位置、强度、类型等信息,例如,可以采用层次分析法、模糊综合评价法、灰色关联分析法等方法。
78.步骤s4、构建图神经网络模型,基于校正后的模拟结果进行编码和训练,获得溯源数据,所述溯源数据包括污染源识别、各个污染源的贡献、污染传播路径以及敏感性分析结果。
79.步骤s41:图神经网络编码和嵌入。该子步骤主要是利用图神经网络对图数据进行编码和嵌入,学习节点和边的隐含特征,以及节点之间的关系和相似度。图神经网络可以采用不同的架构和参数,如graphsage、gcn、gat等。具体的实现过程如下:首先,对图数据进行预处理,将节点和边的属性进行标准化或归一化,以消除数据的量纲和偏差,提高数据的可比性和稳定性。节点数据包括:污染物浓度、监测时间、监测位置坐标和污染源类型。边数据包括污染物传播方向、传播速度和传播距离。
80.其次,选择合适的图神经网络架构和参数,根据不同的分析目标和数据特征,选择最适合的图神经网络模型,如graphsage、gcn、gat等,并设置模型的层数、激活函数、损失函数、优化器等参数。网络架构的图结构信息包括邻接矩阵、度矩阵和拉普拉斯矩阵。
81.最后,利用图神经网络对图数据进行编码和嵌入,通过多层的信息传播和聚合,将节点和边的属性转换为低维的向量表示,即嵌入向量,并保存嵌入向量作为后续分析的输入。
82.步骤s42:图神经网络解码和预测。该子步骤主要是利用图神经网络对图数据进行解码和预测,实现不同的分析目标,如污染源识别、溯源贡献分析、敏感性分析等。图神经网
络可以采用不同的损失函数和评价指标,如mse、mae、r2等。具体的实现过程如下:首先,根据不同的分析目标,设计合适的解码器或预测器,将嵌入向量作为输入,输出所需的分析结果,如污染源位置、强度、类型等。
83.其次,选择合适的损失函数和评价指标,根据不同的分析目标和输出类型,选择最适合的损失函数和评价指标,如mse、mae、r2等,并计算模型在训练集和测试集上的表现。
84.最后,利用图神经网络对图数据进行解码和预测,并输出所需的分析结果,并根据损失函数和评价指标对模型进行优化和调整。根据图语义信息来进行解读,包括污染源区域、污染物传播路径、污染趋势指标。
85.在本技术中,针对现有仅使用污染源校正模块来溯源存在的问题,主要包括污染源区域可能有多个,而且可能有不同的类型和强度,如何对它们进行有效的识别和区分;污染物在空气中的传播路径可能有多条,而且可能受到气象条件、地形地貌、建筑物等因素的影响,如何对它们进行有效的追踪和分析;污染源区域和污染物传播路径可能存在不确定性和变化性,如何对它们进行有效的评估和预测;污染源区域和污染物传播路径可能受到不同因素的影响,如何对它们进行有效的敏感性分析和优化。
86.通过图神经网络的特性,来解决上述问题。利用图神经网络对图数据进行分类或者聚类分析,从而更加准确识别出污染源区域和类型;利用图神经网络对图数据进行回归分析,从而估计出各个污染源区域的强度和贡献率;利用图神经网络对图数据进行生成或者重建分析,从而追踪出污染物在空气中的传播路径和范围;利用图神经网络对图数据进行敏感性分析,从而评估出污染源区域和污染物传播路径对不同因素的响应和影响。
87.将模拟校正模块和图神经网络结合起来,模拟校正模块输出的数据是图神经网络的输入数据之一,能够提供以下信息:数据融合和校正结果,包括最优的污染源区域和相关信息;数据对比和评估结果,包括相似度和误差;以及环境信息、气象信息。在经过模拟校正后,各个点的数据更加准确,因此为图神经网络提供了更加优质的输入数据。
88.以上详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种等同变换,这些等同变换均属于本发明的保护范围。
技术特征:
1.基于神经网络的大气污染溯源方法,其特征在于,包括如下步骤:步骤s1、读取移动式检测站的移动监测数据并预处理,获得标准化的移动监测数据,所述移动监测数据至少包括监测到的染物浓度、监测时间和监测位置坐标;步骤s2、基于所述移动监测数据挖掘污染物的时空演变趋势,获得趋势分析结果;步骤s3、读取多源污染物数据,并构建污染源校正模块,以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟结果进行校正;步骤s4、构建图神经网络模型,基于校正后的模拟结果进行编码和训练,获得溯源数据,所述溯源数据包括污染源识别、各个污染源的贡献、污染传播路径以及敏感性分析结果。2.如权利要求1所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s1中,对移动式检测站的移动监测数据进行预处理的过程包括:步骤s11、对移动监测数据进行异常值的检测和剔除,消除数据的噪声和干扰;步骤s12、设定异常值判断标准,检测并剔除移动监测数据中的异常值;步骤s13、对移动监测数据进行空间插值,填补空间上的数据空缺;步骤s14、将移动监测数据进行时间同步,使得不同移动监测站在同一时刻的数据对应起来。3.如权利要求2所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s2进一步为:步骤s21、根据移动监测站的位置信息,将移动监测数据划分为若干个子区域,每个子区域包含至少一个移动监测站在预定时间内的监测数据,形成监测数据的时间序列;步骤s22、基于时间序列分析方法对每个子区域内的监测数据进行趋势分析,计算污染物浓度随时间的变化率和方差,作为污染趋势指标;步骤s23、根据污染趋势指标,对每个子区域进行排名和筛选,选择出排名靠前且超过阈值的子区域作为候选污染源区域,并估计其污染源位置、类型和强度,输出污染源信息和趋势分析结果。4.如权利要求3所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s3进一步包括:步骤s31、获取多源污染物的数据,包括固定监测站数据、遥感影像数据、地理信息数据,以及气象信息数据;步骤s32、构建污染源校正模块,所述污染源校正模块包括camx-osat-psat模块;基于预存储的环境信息,对污染源校正模块进行环境校正;步骤s33、以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟和预测结果进行比较和评估,计算其与实际情况的相似度和误差,并根据相似度和误差对候选污染源区域进行排序和筛选,选择出最优的污染源区域,并确定其位置、强度和类型。5.如权利要求4所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s4进一步包括:步骤s41、利用图神经网络对图数据进行编码和嵌入,学习节点和边的隐含特征,以及节点之间的关系和相似度;
步骤s42、利用图神经网络对图数据进行解码和预测,实现不同的分析目标。6.如权利要求3所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s22进一步为:步骤s22a、构建自回归滑动平均模型,采用单位根检验或者平稳性检验判断时间序列是否平稳;采用自相关函数或者偏自相关函数判断时间序列是否为白噪声;如果时间序列不满足平稳性或者白噪声性,采用差分方法使其满足arma模型的假设;步骤s22b、采用信息准则方法或者残差分析方法选择最优的模型阶数,所述信息准则方法包括aic、bic和hq;所述残差分析方法包括ljung-box检验和正态性检验;步骤s22c、利用最大似然估计法或者最小二乘估计法,估计arma模型的参数,并利用估计的参数和历史数据,预测监测数据的未来值,并计算预测误差作为变化率和方差,作为污染趋势指标。7.如权利要求3所述的基于神经网络的大气污染溯源方法,其特征在于,所述步骤s23进一步为:步骤s23a、按照综合值从高到低进行排名,对每个子区域的污染趋势指标进行排序,得到子区域的排名列表;步骤s23b、对每个子区域的污染趋势指标进行筛选,根据预定的阈值或者比例,选择出综合值超过阈值或者排名在前n位的子区域,作为候选污染源区域;n为自然数;步骤s23c、对每个候选污染源区域进行估计,根据子区域轨迹和监测数据,利用最大似然法或者最小二乘法估计其污染源位置、类型和强度,输出污染源信息和趋势分析结果。8.如权利要求7所述的基于神经网络的大气污染溯源方法,其特征在于,步骤s23b进一步为:利用香农信息熵计算污染趋势指标的信息熵;根据信息熵的变化规律,确定最优的阈值,使得信息熵达到最大或者最小;根据最优阈值或者比例,对子区域进行筛选,选择出综合值超过阈值或者排名在前n位的子区域,作为候选污染源区域。9.如权利要求3所述的基于神经网络的大气污染溯源方法,其特征在于,步骤s22进一步为:步骤s22a、构建非线性函数集合和广义可加模型,根据污染物数据与非线性函数的映射关系,分析污染物监测数据的分布特征和变化规律,选择对应的非线性函数作为广义可加模型的基函数;步骤s22b、利用最大似然估计估计广义可加模型的参数,包括基函数的系数和平滑参数;步骤s22c、利用广义可加模型对污染物浓度进行拟合,并计算拟合值与实际值之间的残差,并将残差平方求和,作为方差的估计值;计算污染物浓度随时间的变化率,并将变化率和方差作为污染趋势指标。10.一种基于神经网络的大气污染溯源系统,其特征在于,包括:至少一个处理器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1~9任一项所述的基于神经网络的大气污染溯源方法。
技术总结
本发明公开了一种基于神经网络的大气污染溯源方法及系统,属于空气污染模拟溯源技术领域,所述方法包括如下步骤:读取移动式检测站的移动监测数据并预处理,获得标准化的移动监测数据;基于所述移动监测数据挖掘污染物的时空演变趋势,获得趋势分析结果;读取多源污染物数据,并构建污染源校正模块,以多源污染物为输入,获得污染物的预测结果,将其与模拟结果进行对比,对模拟结果进行校正;构建图神经网络模型,基于校正后的模拟结果进行编码和训练,获得溯源数据。本发明对大气污染溯源的效率更高,准确度大大提升。准确度大大提升。准确度大大提升。
技术研发人员:王继春 徐龙昊 张建强
受保护的技术使用者:山东智明环保工程有限公司
技术研发日:2023.09.04
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/