一种电阻率参数和机器学习的土壤有机污染浓度预测方法

未命名 09-15 阅读:148 评论:0


1.本发明涉及土壤污染浓度预测领域,尤其涉及一种电阻率参数和机器学习的土壤有机污染浓度预测方法。


背景技术:

2.在土壤有机污染物调查及修复过程中,有污染物的空间分布特征通常是通过污染物浓度表征,而污染物浓度的获取通常是通过大量钻孔取样检测获得,大量钻孔及检测会消耗较高的经济成本;另外一方面,大量钻孔的灌入可能会贯穿隔水层,进而引起更深层土壤及地下水的污染。
3.土壤被有机污染物污染后,其电性参数会改变,这为地球物理勘探方法提供了物探基础。电法勘探是以地质介质的电性差异为基础的勘探方法,其常用电法勘探方法有电阻率法、充电法激发极化法、充电法、自然电场法、大地电磁法和电磁感应法。不同方法得到的物理参数不同,主要有电阻率、极化率、导磁率和介电常数等。目前有机污染物调查中常用的是高密度电阻率法,该方法具有快速、经济的优点。
4.有机污染物引起的土壤电性特征变化和污染物浓度有直接关系,但是污染物浓度和地球物理获得的电性参数是非线性的,无法利用传统方式将两者建立量化关系。而机器学习方法可以处理非线性问题,并且具有自主学习性,因此将机器学习方法应用于预测有机物染污物的预测。


技术实现要素:

5.发明目的:本发明针对土壤有机污染调查中钻探及检测成本高问题,提出了一种电阻率参数和机器学习的土壤有机污染浓度预测方法,该方法耗时短,精度高及成本低。
6.技术方案:为实现上述目的,本发明提出一种电阻率参数和机器学习的土壤有机污染浓度预测方法,该方法包括以下具体步骤:
7.1)采集土壤样品并检测有机污染物浓度,针对有机污染物场地,均匀对土壤进行取样,土壤样本采集过程中,记录土壤样品采样深度信息和空间点位坐标信息;
8.2)污染物浓度建模,根据土壤样品采样深度和空间坐标信息,将土壤有机物污染浓度数据处理成空间坐标和浓度数据类型,将整理好的数据输入三维成图软件earth volumetric studio进行三维建模,获得有机污染物三维空间浓度模型;
9.3)采集污染物电性参数,获取污染场地的垂向剖面电阻率数据,并记录电阻率测线的空间点位坐标;
10.4)提取污染物数据,在建立好的污染物三维空间浓度模型中提取和电阻率测线相同位置的浓度剖面,获得相同剖面的污染物浓度和电阻率值;
11.5)将机污染物浓度和电阻率数据整理成一一对应格式,并按照2:8比例分成训练集和测试集,将训练集输入机器学习模型进行训练以获得基于有机污染物的电阻率预测有机物浓度的回归预测模型;
12.6)利用测试集数据检测模型精度,进一步优化基于电阻率预测有机物浓度的回归预测模型,确定最优模型;
13.7)基于最优模型预测污染物浓度,将电阻率参数输入最优模型,得到有机物预测浓度。
14.进一步的,所述的步骤1)中,土壤取样时,钻孔间距控制在2米内,钻孔的土样采集间隔为15厘米。
15.进一步的,所述的步骤3)中,电性参数的采集使用高密度电阻率法或地电磁法,行数据采集不低于3次。
16.进一步的,所述的步骤4)中,设置横向数据间隔为0.5米,垂向数据间隔为0.1米对相同剖面的电阻率和污染物浓度进行提取。
17.进一步的,所述的步骤5)中,基于random随机函数随机划训练集和测试集。
18.进一步的,所述的步骤5)中,机器学习模型为随机森林回归(rf)、邻近算法回归(knn)、xgboost模型中的任一种。
19.进一步的,所述的步骤6)中,用测试集来验证模型的精度时,计算模型的均方根误差rmse与拟合优度r2,选择均方根误差rmse与拟合优度r2都符合预设条件的模型参数作为最优模型参数,并且,基于最优模型参数时的模型准确率不小于0.90;均方根误差rmse与拟合优度r2的计算公式如下:
[0020][0021][0022]
式中,yi为模型预测浓度值;ti为实验测得的真实浓度值;ri是实验测得的m个真实浓度的平均值。
[0023]
发明原理:电法勘探是以地质介质的电性差异为基础的勘探方法,土壤被有机污染物浸润后,其电阻率特征会改变,这一特征恰恰为电法的应用提供了基础,但是土壤中的有机污染物浓度和其电阻率是非线性关系,无法使用传统手段建立联系,而机器学习具有自主学习性和解决非线性问题的能力,所以利用机器学习方法和地球物理电性参数可以实现低成本、快速预测有机污染物浓度。
[0024]
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
[0025]
本发明提供的一种电阻率参数和机器学习的土壤有机污染浓度预测方法。地球物理电性参数的获取方法众多,如高密度电阻率法可以获得地质介质的电阻率,物探成本相对检测成本较低。本发明所述方法将地球物理电性参数与机器学习算法结合建立土壤有机物污染物浓度预测模型,能够实现根据电阻率参数便可快速高效地预测有机污染物的浓度,同一场地内,对于外部验证集土壤有机污染浓度的预测准确率高达0.8772,具有较高的经济和应用价值。本发明有望为土壤有机污染源调查及修复过程中有机物浓度的确定提供创新的技术思路。
附图说明
[0026]
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
[0027]
图1为本发明所涉及的基于地球物理电阻率参数和机器学习的经济快速土壤有机污染浓度预测的流程图;
[0028]
图2为本发明实施例1所涉及的石油烃浓度模型;
[0029]
图3为本发明实施例1所涉及的作为机器学习训练集的石油烃污染物电阻率剖面;
[0030]
图4为本发明实施例1所涉及的作为机器学习训练集的石油烃污染物浓度剖面;
[0031]
图5为本发明实施例1所涉及的作为机器学习外部验证集的石油烃污染物电阻率剖面;
[0032]
图6为本发明实施例1所涉及的作为机器学习外部预测的石油烃污染物浓度剖面;
[0033]
图7为本发明实施例1所涉及的测试集的预测值与检测值散点分布图。
具体实施方式
[0034]
下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。
[0035]
本发明提出一种电阻率参数和机器学习的土壤有机污染浓度预测方法,该方法包括以下具体步骤:
[0036]
1)采集土壤样品并检测有机污染物浓度,针对有机污染物场地,均匀对土壤进行取样,土壤样本采集过程中,记录土壤样品采样深度信息和空间点位坐标信息;
[0037]
2)污染物浓度建模,根据土壤样品采样深度和空间坐标信息,将土壤有机物污染浓度数据处理成空间坐标和浓度数据类型,将整理好的数据输入三维成图软件earth volumetric studio进行三维建模,获得有机污染物三维空间浓度模型;
[0038]
3)采集污染物电性参数,获取污染场地的垂向剖面电阻率数据,并记录电阻率测线的空间点位坐标;
[0039]
4)提取污染物数据,在建立好的污染物三维空间浓度模型中提取和电阻率测线相同位置的浓度剖面,获得相同剖面的污染物浓度和电阻率值;
[0040]
5)将机污染物浓度和电阻率数据整理成一一对应格式,并按照2:8比例分成训练集和测试集,将训练集输入机器学习模型进行训练以获得基于有机污染物的电阻率预测有机物浓度的回归预测模型;
[0041]
6)利用测试集数据检测模型精度,进一步优化基于电阻率预测有机物浓度的回归预测模型,确定最优模型;
[0042]
7)基于最优模型预测污染物浓度,将电阻率参数输入最优模型,得到有机物预测浓度。
[0043]
所述的步骤1)中,土壤取样时,钻孔间距控制在2米内,钻孔的土样采集间隔为15厘米。
[0044]
所述的步骤3)中,电性参数的采集使用高密度电阻率法或地电磁法,行数据采集不低于3次。
[0045]
所述的步骤4)中,设置横向数据间隔为0.5米,垂向数据间隔为0.1米对相同剖面
的电阻率和污染物浓度进行提取。
[0046]
所述的步骤5)中,基于random随机函数随机划训练集和测试集。
[0047]
所述的步骤5)中,机器学习模型为随机森林回归(rf)、邻近算法回归(knn)、xgboost模型中的任一种。
[0048]
所述的步骤6)中,用测试集来验证模型的精度时,计算模型的均方根误差rmse与拟合优度r2,选择均方根误差rmse与拟合优度r2都符合预设条件的模型参数作为最优模型参数,并且,基于最优模型参数时的模型准确率不小于0.90,均方根误差rmse与拟合优度r2的计算公式如下:
[0049][0050][0051]
式中,yi为模型预测浓度值,ti为实验测得的真实浓度值,ri是实验测得的m个真实浓度的平均值。
[0052]
实施例1
[0053]
本发明首次提出了一种电阻率参数和机器学习的土壤有机污染浓度预测方法,能够实现根据地球物理电性参数便可快速高效地预测有机污染物的浓度。
[0054]
所述方法的具体实施步骤如下:
[0055]
(1)采集土壤垂向样品,针石油烃污染场地,水平钻孔间隔是1-2米,钻孔垂直取样间距是0.15米,共12个钻孔,土壤取样共240个,检测指标为石油烃(c
10-c
40
),检测后获得石油烃污染物样品浓度,记录使用rtk记录每个钻孔坐标信息。
[0056]
(2)石油烃污染物浓度的空间模型建立,将石油烃浓度数据整理成空间坐标和浓度数据类型,将整理好的数据输入三维成图软件earth volumetric studio进行三维建模。该软件数据格式为x、y、z、c,x横坐标,y纵坐标,z埋深,c石油烃浓度,利用kriging插值方法建立石油烃浓度模型,以上所述步骤建立石油烃浓度模型,见图2。
[0057]
(3)采集污染场地垂向电阻率参数,针对土壤石油烃污染,选择高密度电阻率法采集石油烃的电阻率,采集装置为温纳,共60个电极,极距为1.2米,采集3次平行数据,获得垂向深度为10米以内的电阻率剖面,并记录电阻率测线的空间点位坐标,成图可见图3和图5。
[0058]
(4)提取污染物数据,已知电阻率测线的空间坐标信息石油烃钻孔的空间信息,利用earth volumetric studio软件中的slice功能从建立好的石油烃浓度模型中提取和电阻率剖面对应位置的垂向浓度剖面,可见图4。
[0059]
(5)基于污染物电性参数和浓度筛选最优模型,将电阻率数据和污染物浓度按照8:2的比例分割为训练集、测试集,并输入机器学习模型,利用随机森林回归(rf)、邻近算法回归(knn)和xgboost模型进行训练,
[0060]
(6)随机森林(rf)的测试集拟合度为0.90,邻近算法(knn)测试集的拟合度为0.94,xgboost模型测试集的拟合度为0.93,所以近邻算法模型(knn)为最优模型。
[0061]
(7)将电阻率参数输入近邻算法模型(knn)模型,得到相应石油烃污染物浓度,见图5和图6。
[0062]
本发明提供的一种基于地球物理电阻率参数和机器学习的土壤有机污染浓度预测方法。同一场地内,测试集的拟合度达到0.94,外部验证集的预测准确率高达0.83,具有较高的准确度和应用价值。

技术特征:
1.一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,该方法包括以下具体步骤:1)采集土壤样品并检测有机污染物浓度,针对有机污染物场地,均匀对土壤进行取样,土壤样本采集过程中,记录土壤样品采样深度信息和空间点位坐标信息;2)污染物浓度建模,根据土壤样品采样深度和空间坐标信息,将土壤有机物污染浓度数据处理成空间坐标和浓度数据类型,将处理好的数据输入三维成图软件earth volumetric studio进行三维建模,获得有机污染物三维空间浓度模型;3)采集污染物电性参数,获取污染场地的垂向剖面电阻率数据,并记录电阻率测线的空间点位坐标;4)提取污染物数据,在建立好的污染物三维空间浓度模型中提取和电阻率测线相同位置的浓度剖面,获得相同剖面的污染物浓度和电阻率值;5)将机污染物浓度和电阻率数据整理成一一对应格式,并按照2:8比例分成训练集和测试集,将训练集输入机器学习模型进行训练以获得基于有机污染物的电阻率预测有机物浓度的回归预测模型;6)利用测试集数据检测模型精度,进一步优化基于电阻率预测有机物浓度的回归预测模型,确定最优模型;7)基于最优模型预测污染物浓度,将电阻率参数输入最优模型,得到有机物预测浓度。2.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤1)中,土壤取样时,钻孔间距控制在2米内,钻孔的土样采集间隔为15厘米。3.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤3)中,电性参数的采集使用高密度电阻率法或地电磁法,行数据采集不低于3次。4.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤4)中,设置横向数据间隔为0.5米,垂向数据间隔为0.1米对相同剖面的电阻率和污染物浓度进行提取。5.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤5)中,基于random随机函数随机划训练集和测试集。6.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤5)中,机器学习模型为随机森林回归(rf)、邻近算法回归(knn)、xgboost模型中的任一种。7.根据权利要求1所述的一种电阻率参数和机器学习的土壤有机污染浓度预测方法,其特征在于,所述的步骤6)中,用测试集验证模型的精度时,计算模型的均方根误差rmse与拟合优度r2,选择均方根误差rmse与拟合优度r2都符合预设条件的模型参数作为最优模型参数,并且,基于最优模型参数时的模型准确率不小于0.90;均方根误差rmse与拟合优度r2的计算公式如下:
式中,y
i
为模型预测浓度值,t
i
为实验测得的真实浓度值,r
i
是实验测得的m个真实浓度的平均值。

技术总结
本发明公开了一种电阻率参数和机器学习的土壤有机污染浓度预测方法,属于土壤污染源调查领域。土壤有机污染物浓度是场地有机污染调查和治理的关键指标之一,目前土壤有机污染物浓度调查依靠大量钻孔土样检测,而大量土样检测的成本较高。因此,本发明提出一种基于电阻率参数和机器学习预测土壤有机污染物浓度的方法,本发明所示方法包括:针对有机污染场地,前期通过钻孔取样,建立污染物浓度模型,基于浓度模型提取污染物浓度剖面数据,然后利用地球物理手段采集污染场地内的电阻率,结合机器学习模型,建立污染物浓度最优预测模型,最终将电阻率参数输入最优模型得到有机污染物的预测浓度。的预测浓度。的预测浓度。


技术研发人员:孟凡松 王锦国 陈舟 窦智 杨蕴
受保护的技术使用者:河海大学
技术研发日:2023.05.30
技术公布日:2023/9/14
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐