一种基于机器学习的生物质热解效率预测方法、设备及存储介质
未命名
07-12
阅读:73
评论:0

1.本发明属于机器学习领域和生物质材料制备领域,具体涉及一种基于机器学习的生物质热解效率预测方法。
背景技术:
2.生物炭是一种由生物质材料经过高温热解、脱水和碳化得到的固体炭质材料。生物炭具有良好的稳定性、高孔隙度、高比表面积,因此具有广泛的应用前景,生物炭产率和热解能量产率作为评判生物质热解效率的重要指标,受诸多因素影响,包括原始生物质的类型、热解温度和时间等。较高的热解温度和更长的热解时间通常会有较高的能量产率,但也可能会导致生物炭的质量和产率下降,能耗增加。因此,在确定生物质的最佳生产条件时,需要考虑许多因素,以获得较高的生物炭材料产率和生物质热解能量产率。高热解效率意味着使用,相对较少的原料可以生产出更多的生物炭材料和能量,从而降低生产成本和资源消耗。
3.相较于通过传统试错实验得到生物质热解效率数值,采用机器学习辅助建模的方法更为高效,同时通过机器学习模型预测生物质热解效率,能更好的节约人力成本,因此如何建立预测生物质热解效率模型是亟需解决的问题。
4.现有技术存在以下问题:第一、耗时费力,传统生物质热解效率中,生物炭产率的确定,需要将生物质材料烧成生物炭后,通过前后质量比得出生物炭产率,而生物质热解能量产率的确定,需要获得出生物质热解前后的热值数据,并且通过其比值乘以生物炭产率获得,具体计算公式如下:
[0005][0006][0007]
因此,在实际实验过程中,需要一定的设备仪器和实验室环境等,涉及到的工作量较大,且需要进行反复的试验。这会使得实验测量变得耗时费力。第二、成本较高,实验测量需要使用专业设备和试剂,而这些设备和试剂通常价格较高。此外,实验过程中还需要进行多次测量和重复实验,也会增加成本。第三、涉及面窄,实验测量通常只能针对特定的生物质和制备条件进行测量,无法全面覆盖所有的生物炭制备情况,因此存在一定的局限性。
技术实现要素:
[0008]
为解决上述背景技术中提出的问题,本发明提供了一种基于机器学习的生物质热解效率预测方法、设备及存储介质,具有测试成本低、准确度高的特点。
[0009]
为实现上述目的,本发明提供如下技术方案:
[0010]
技术方案:为解决上述技术问题,本发明采用的技术方案为:
[0011]
第一方面,本发明提供一种基于机器学习的生物质热解效率预测方法,包括:
[0012]
步骤(1)获取数据集,其中所述数据集包括生物质材料及实验条件描述符数据集、多种类生物质表征描述符数据集;
[0013]
步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集;
[0014]
步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集;
[0015]
步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型;
[0016]
步骤(5)利用所述训练好的生物质热解效率模型对目标生物质热解效率进行预测,得到目标生物质热解效率预测结果,其中所述目标生物质热解效率预测结果包括生物炭产率预测结果和热解能量产率预测结果。
[0017]
步骤(1)中,所述生物质材料及实验条件描述符数据集是通过收集现有公开中英文文献,且描述符完整的数据集,所述描述符完整是指包含生物质表征描述符、生物质热解条件描述符、生物质热解效率描述符;所述生物质表征描述符中数据可包含缺失值,所述生物质热解条件描述符不包含缺失值。
[0018]
在一些实施例中,步骤(1)中,所述多种类生物质表征描述符数据集来自github数据库已公开数据集;且所述多种类生物质表征描述符数据集中数据必须包含生物质表征描述符。
[0019]
在一些实施例中,步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集,包括:
[0020]
将生物质材料及实验条件描述符数据集进行初步筛选,删除描述符缺失值大于40%的数据,得到初步筛选的生物质材料及实验条件描述符数据集;
[0021]
将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版;
[0022]
将所述多种类生物质表征描述符数据集补充版中已补充完整的缺失项数据集加入初步筛选的生物质材料及实验条件描述符数据集,得到补全后的生物质材料及实验条件描述符数据集;
[0023]
将所述补全后的生物质材料及实验条件描述符数据集进行独热编码和归一化处理,得到归一化后的生物质材料及实验条件描述符数据集。
[0024]
在一些实施例中,将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版,包括:
[0025]
s1、将所述初步筛选的生物质材料及实验条件描述符数据集中生物质表征描述符数据中仍有缺失项的数据整体挑选出,作为缺失项数据集;
[0026]
s2、将所述缺失项数据集的数据和多种类生物质表征描述符数据集进行整合,使用knn算法补充缺失值,得到多种类生物质表征描述符数据集补充版。
[0027]
在一些实施例中,使用knn算法补充缺失值包括:
[0028][0029]
其中d是欧氏距离,xi是有缺失值新样本的值,yi是无缺失值样本的值,i是第i个特征的样本个数,n代表样本总数。
[0030]
在一些实施例中,步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集,包括:
[0031]
计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数;
[0032]
删除线性相关系数大于0.9的描述符,保留与生物质热解效率描述符相关性强的特征,作为生物质热解效率数据集;
[0033]
其中计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数包括:
[0034][0035]
其中r代表两个变量x和y之间的线性相关系数,和分别代表x和y的均值,xi、yi分别代表任意一个随机描述符对应的特征值,n代表样本总数。
[0036]
在一些实施例中,步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型,包括:
[0037]
所述生物质热解效率模型利用生物质热解效率数据集使用随机森林算法进行构建;
[0038]
所述生物质热解效率模型通过特征贡献性、线性相关系数性r2和均方根误差rmse对所述最佳预测模型进行评估。
[0039]
第二方面,本发明提供了一种基于机器学习的生物质热解效率预测装置,包括处理器及存储介质;
[0040]
所述存储介质用于存储指令;
[0041]
所述处理器用于根据所述指令进行操作以执行根据第一方面所述的方法。
[0042]
第三方面,本发明提供了一种设备,包括,
[0043]
存储器;
[0044]
处理器;
[0045]
以及
[0046]
计算机程序;
[0047]
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现上述第一方面所述的方法。
[0048]
第四方面,本发明提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
[0049]
与现有技术相比,本发明的有益效果(创新点)是:本发明提出了一种基于机器学习的生物质热解效率预测方法、装置、设备及存储介质:
[0050]
(1)通过收集现有数据,构建了预测生物质热解效率预测模型,包括预测生物炭产率和热解能量产率,可有效节约生物质材料热解效率参数确定,所需要的人力成本和时间成本。
[0051]
(2)提出了一种数据清洗补全方法,通过有针对性的对生物质热解数据中缺失部分的合理拆分,为机器学习构建生物质热解效率数据集缺失问题,提供了一种新的解决思路。
附图说明
[0052]
图1为本发明实施例的方法流程示意图;
[0053]
图2为本发明实施例中生物炭热解效率预测模型,各特征值之间的线性相关性图(左为生物炭产率预测各特征之间的线性相关性,右图为能量产率预测各特征之间的线性相关性);
[0054]
图3为本发明实施例中各描述符对生物炭热解效率预测模型的贡献性图(左为生物炭产率预测,右图为能量产率预测);
[0055]
图4为本发明实施例中预测值和真实值的线性相关性图。
具体实施方式
[0056]
下面结合附图和实施例对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
[0057]
在本发明的描述中,若干的含义是一个以上,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0058]
本发明的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0059]
实施例1
[0060]
如图1所示,一种基于机器学习的生物质热解效率预测方法,包括:
[0061]
步骤(1)获取数据集,其中所述数据集包括生物质材料及实验条件描述符数据集、多种类生物质表征描述符数据集;
[0062]
步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集;
[0063]
步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集;
[0064]
步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,
得到训练好的生物质热解效率模型;
[0065]
步骤(5)利用所述训练好的生物质热解效率模型对目标生物质热解效率进行预测,得到目标生物质热解效率预测结果,其中所述目标生物质热解效率预测结果包括生物炭产率预测结果和热解能量产率预测结果。
[0066]
在一些实施例中,步骤(1)中,所述生物质材料及实验条件描述符数据集是通过收集现有公开中英文文献,且描述符完整的数据集,所述描述符完整是指包含生物质表征描述符、生物质热解条件描述符、生物质热解效率描述符;所述生物质表征描述符中数据可包含缺失值,所述生物质热解条件描述符不包含缺失值。
[0067]
在一些实施例中,生物质表征描述符具体包括:生物质材料名称-biomass material(bm)、生物炭原材料固定碳含量-fixed carbon(fc)、挥发分含量-volatile matter(vm)、生物材料灰分含量-ash content(ash)、碳含量(c)、氢含量(h)、氧含量(o)、氮含量(n)、硫含量(s)、纤维素-cellulose(cel)、半纤维素-hemicellulose(hem)、木质素-lignin(lig);生物质热解条件描述符具体包括停留时间-residence time(rt)、热解温度-temperature(pt)、升温速率-heating rate(hr);生物质热解效率描述符具体包括:生物炭产率-biochar yield(by)、能量产率-energy yield(ey)。
[0068]
在一些实施例中,步骤(1)中,所述多种类生物质表征描述符数据集来自github数据库已公开数据集;且所述多种类生物质表征描述符数据集中数据必须包含生物质表征描述符。
[0069]
通过采用上述技术方案,通过从自github数据库和搜索biochar检索关键词,获取多种类生物质表征描述符数据集,收集多种类生物质表征描述符数据集描述符必须完整,包含生物质表征描述符由于多种类生物质表征描述符数据集中数据为生物质表征数据,所以在收集过程中相对于生物质材料及实验条件描述符数据集,的获取范围要更广阔,不必像生物质材料及实验条件描述符数据集中,需要涵盖生物质表征描述符、生物质热解条件描述符、生物质热解效率描述符,可以理解为生物质表征描述符数据集的描述符包含于生物质材料及实验条件描述符数据集的描述符,所以才给数据补充环节提供可能。
[0070]
在一些实施例中,步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集,包括:
[0071]
将生物质材料及实验条件描述符数据集进行初步筛选,删除描述符缺失值大于40%的数据,得到初步筛选的生物质材料及实验条件描述符数据集;
[0072]
将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版;
[0073]
将所述多种类生物质表征描述符数据集补充版中已补充完整的缺失项数据集加入初步筛选的生物质材料及实验条件描述符数据集,得到补全后的生物质材料及实验条件描述符数据集;
[0074]
将所述补全后的生物质材料及实验条件描述符数据集进行独热编码和归一化处理,得到归一化后的生物质材料及实验条件描述符数据集。
[0075]
在一些实施例中,将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版,包括:
[0076]
s1、将所述初步筛选的生物质材料及实验条件描述符数据集中生物质表征描述符
数据中仍有缺失项的数据整体挑选出,作为缺失项数据集;
[0077]
s2、将所述缺失项数据集的数据和多种类生物质表征描述符数据集进行整合,使用knn算法补充缺失值,得到多种类生物质表征描述符数据集补充版。
[0078]
通过采用上述技术方案,可将生物质材料及实验条件描述符数据集进行数据清洗,清洗后的数据集中仍然含有缺失值但是相对于未清洗前,数据完整性已经有大幅提高。
[0079]
通过采用上述技术方案,数据二次整理有助于补充仍有缺失值的生物质材料及实验条件描述符数据集,由于已经对生物质材料及实验条件描述符数据集进行了数据清洗,而且生物质材料及实验条件描述符数据集中仅有生物质表征描述符有缺失,所以挑选出的缺失值对应的描述符仅为生物质表征描述符,将缺失项数据集和多种类生物质表征描述符数据集进行整合,放入同一个csv格式文件中,方便软件调用,由于生物质材料及实验条件描述符数据集缺失值仅来自生物质表征描述符中的数据,而生物质表征描述符,是相对生物质热解条件描述符,独立的数据集,两者为对并列因素关系,共同和生物质热解效率描述符数据形成映射关系,从而构建生物质热解效率模型,所以可单独提取;
[0080]
使用knn算法补充,整合后的数据集,有利于提高生物质热解效率建模的准确率。
[0081]
在一些实施例中,使用knn算法补充缺失值包括:
[0082][0083]
其中d是欧氏距离,xi是有缺失值新样本的值,yi是无缺失值样本的值,i是第i个特征的样本个数,n代表样本总数。
[0084]
通过采用上述技术方案,对初步筛选的生物质材料及实验条件描述符数据集中,生物炭材料名称是文本型不能被算法识别,所以对其进行独热编码处理:如表1所示:
[0085][0086]
表1
[0087]
使用独热编码,将生物质表征描述符中生物质材料名称这种文本型特征,转化为数值型特征;通常初步筛选的生物质材料及实验条件描述符数据集中,不同描述符的取值范围差异较大,会导致某些特征的重要性被高估,为了提高模型的稳定性,准确性和计算速度,使用归一化进而减少特征重要性被高估的情况,如下式所示:
[0088][0089]
上式中,y为归一化后的数据,x述符中的数据值,x
min
为此描述符数据中的最小值,
x
max
为此描述符数据中的最大值。
[0090]
在一些实施例中,步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集,包括:
[0091]
计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数;
[0092]
删除线性相关系数大于0.9的描述符,保留与生物质热解效率描述符相关性强的特征,作为生物质热解效率数据集。
[0093]
其中计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数的计算公式为:
[0094][0095]
其中r代表两个变量x和y之间的线性相关系数,和分别代表x和y的均值,xi、yi分别代表任意一个随机描述符对应的特征值,n代表代表样本总数。
[0096]
通过采用上述技术方案,有助于提高分析效率:减少多重共线性:提高模型性能。
[0097]
如图2所示,左图为生物炭产率预测各特征值之间的线性相关性图,右图为预测热解能量图产率各特征值之间的线性相关性图。
[0098]
在一些实施例中,步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型,包括:
[0099]
所述生物质热解效率模型利用生物质热解效率数据集使用随机森林算法进行构建;构建公式如下:
[0100][0101]
其中代表最终树的预测,b是决策树的数量,b代表当前树,x是训练样本。
[0102]
所述生物质热解效率模型通过特征贡献性、线性相关系数性r2和均方根误差rmse对所述最佳预测模型进行评估;
[0103][0104]
其中y、和分别是目标描述符的预测值、实际值和平均值,n是任何给定实例的数据点,n是数据点总数。
[0105]
通过采用上述技术方案,将数据代入随机森林模型中,采用gridsearch进行超参数调优,最终建立训练好的生物质热解效率模型,各描述符特征贡献性如图3(左图为生物炭产率预测各描述符贡献值,右图为能量产率预测各描述符贡献值)、线性相关系数性r2和
均方根误差rmse如表2所示:图4为预测值和真实值的线性相关性图。
[0106]
表2
[0107][0108]
实施例2
[0109]
第二方面,本实施例提供了一种基于机器学习的生物质热解效率预测装置,包括处理器及存储介质;
[0110]
所述存储介质用于存储指令;
[0111]
所述处理器用于根据所述指令进行操作以执行根据实施例1所述的方法。
[0112]
实施例3
[0113]
第三方面,本实施例提供了一种设备,包括,
[0114]
存储器;
[0115]
处理器;
[0116]
以及
[0117]
计算机程序;
[0118]
其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现实施例1所述的方法。
[0119]
实施例4
[0120]
第四方面,本实施例提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现实施例1所述的方法。
[0121]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0122]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0123]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0124]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计
算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0125]
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
[0126]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
技术特征:
1.一种基于机器学习的生物质热解效率预测方法,其特征在于,包括:步骤(1)获取数据集,其中所述数据集包括生物质材料及实验条件描述符数据集、多种类生物质表征描述符数据集;步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集;步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集;步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型;步骤(5)利用所述训练好的生物质热解效率模型对目标生物质热解效率进行预测,得到目标生物质热解效率预测结果,其中所述目标生物质热解效率预测结果包括生物炭产率预测结果和热解能量产率预测结果。2.根据权利要求1所述的基于机器学习的生物质热解效率预测方法,其特征在于,步骤(1)中,所述生物质材料及实验条件描述符数据集是通过收集现有公开中英文文献,且描述符完整的数据集,所述描述符完整是指包含生物质表征描述符、生物质热解条件描述符、生物质热解效率描述符;所述生物质表征描述符中数据可包含缺失值,所述生物质热解条件描述符不包含缺失值。3.根据权利要求1所述的基于机器学习的生物质热解效率预测方法,其特征在于,步骤(1)中,所述多种类生物质表征描述符数据集来自github数据库已公开数据集;且所述多种类生物质表征描述符数据集中数据必须包含生物质表征描述符。4.根据权利要求1所述的基于机器学习的生物质热解效率预测方法,其特征在于,步骤(2)对所述数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集,包括:将生物质材料及实验条件描述符数据集进行初步筛选,删除描述符缺失值大于40%的数据,得到初步筛选的生物质材料及实验条件描述符数据集;将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版;将所述多种类生物质表征描述符数据集补充版中已补充完整的缺失项数据集加入初步筛选的生物质材料及实验条件描述符数据集,得到补全后的生物质材料及实验条件描述符数据集;将所述补全后的生物质材料及实验条件描述符数据集进行独热编码和归一化处理,得到归一化后的生物质材料及实验条件描述符数据集。5.根据权利要求4所述的基于机器学习的生物质热解效率预测方法,其特征在于,将所述初步筛选的生物质材料及实验条件描述符数据集进行二次数据整理,补充缺失项数据集得到多种类生物质表征描述符数据集补充版,包括:s1、将所述初步筛选的生物质材料及实验条件描述符数据集中生物质表征描述符数据中仍有缺失项的数据整体挑选出,作为缺失项数据集;s2、将所述缺失项数据集的数据和多种类生物质表征描述符数据集进行整合,使用knn算法补充缺失值,得到多种类生物质表征描述符数据集补充版。
6.根据权利要求5所述的基于机器学习的生物质热解效率预测方法,其特征在于,使用knn算法补充缺失值包括:其中d是欧氏距离,x
i
是有缺失值新样本的值,y
i
是无缺失值样本的值,i是第i个特征的样本个数,n代表样本总数。7.根据权利要求1所述的基于机器学习的生物质热解效率预测方法,其特征在于,步骤(3)对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集,包括:计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数;删除线性相关系数大于0.9的描述符,保留与生物质热解效率描述符相关性强的特征,作为生物质热解效率数据集;其中计算归一化后的生物质材料及实验条件描述符数据集中两两描述符数据的线性相关系数包括:其中r代表两个变量x和y之间的线性相关系数,和分别代表x和y的均值,x
i
、y
i
分别代表任意一个随机描述符对应的特征值,n代表样本总数。8.根据权利要求1所述的基于机器学习的生物质热解效率预测方法,其特征在于,步骤(4)利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型,包括:所述生物质热解效率模型利用生物质热解效率数据集使用随机森林算法进行构建;所述生物质热解效率模型通过特征贡献性、线性相关系数性r2和均方根误差rmse对所述最佳预测模型进行评估。9.一种电子设备,其特征在于,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-8任一项所述的方法。10.一种存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一项所述的方法。
技术总结
本发明公开了一种基于机器学习的生物质热解效率预测方法、设备及存储介质,方法包括:获取数据集,数据集包括生物质材料及实验条件描述符数据集、多种类生物质表征描述符数据集;对数据集进行清洗和补全缺失值得到归一化后的生物质材料及实验条件描述符数据集;对归一化后的生物质材料及实验条件描述符数据集进行数据描述符筛选,确定生物质热解效率数据集;利用所述生物质热解效率数据集对生物质热解效率模型进行构建、评估,得到训练好的生物质热解效率模型;利用所述训练好的生物质热解效率模型对目标生物质热解效率进行预测,得到目标生物质热解效率预测结果。本发明解决了生物质数据缺失问题对建模的影响,建立的模型有较高的准确度。较高的准确度。较高的准确度。
技术研发人员:唐登勇 丁旭 唐文轩 傅润晨 董涛
受保护的技术使用者:南京信息工程大学
技术研发日:2023.04.07
技术公布日:2023/7/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/