一种催化材料高通量计算方法和筛选系统

未命名 08-26 阅读:150 评论:0


1.本发明涉及催化材料研发领域,特别涉及一种催化材料高通量计算方法和筛选系统。


背景技术:

2.传统的材料研制一般采用逐一试错法,由于研发周期长、效率低,已不能满足人们对新材料开发的需求,尤其是对作为化工生产
ꢀ“
点金石”的催化材料的工业需求。基于材料基因工程的思想,从诸多催化剂结构中,进行高通量计算筛选出催化效率更高的可能结构,以指导实验合成。
3.为加快催化剂的研发,实现大批量催化材料的模拟计算,依靠传统的手工建模、作业提交和结果提取方式,按每天每人提交20个作业算,提交100个作业需要一个人5天时间完成,结果的收集整理也需用时3天左右的时间,效率极其低下,且人工成本很高,不能在规定的时间内完成对大批量催化材料模型作业的筛选,需要开发自动化的催化材料高通量计算平台,缩短计算时间。
4.目前最常用是materialproject、aflow和matcloud等,但是在这些系统中,前两者仅支持单次第一性原理计算,第三种主要用来做材料一般性质的模拟计算功能支持,由于催化材料高通量计算筛选问题本身的复杂度较高,催化材料的筛选不可能通过对某一种结构类型的计算完成,而需要连续的多层次的计算,例如从体相结构到表面吸附,中间需要经过体相优化,表面结构计算和表面吸附计算,中间这些计算过程是彼此联系的,后一步的计算文件产生依赖于前一步的输出,现有平台都缺乏针对催化领域的催化材料特有的计算功能支持。


技术实现要素:

5.本发明针对上述现有平台都缺乏针对催化领域的催化材料特有的计算功能支持的问题,提出了一种催化材料高通量计算方法和筛选系统,针对催化剂材料特点实现了作业并发计算,提高了大批量催化材料的模拟计算的效率。
6.为了实现上述发明目的,本发明提供了以下技术方案:一种催化材料高通量计算方法,步骤包括:s1,设置催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;s2,基于所述配置信息并发完成多个高通量计算。
7.作为本发明的优选方案,所述配置信息均通过spring整合mvc技术实现前后端的交互,通过ajax完成数据校验,通过mysql数据库项目信息表来存储项目信息。
8.作为本发明的优选方案,项目计算信息包括项目名称、高通量计算的并发量、计算软件、单个计算所用核数、单个作业运行最大时长。
9.作为本发明的优选方案,所述初始结构文件包括催化材料初始结构文件、吸附分
子初始结构。
10.作为本发明的优选方案,所述初始结构文件还包括反应物初始结构和产物初始结构,当所述反应物初始结构和产物初始结构上传后,根据所述反应物初始结构和产物初始结构自动生成均相或者多相反应的反应网络,生成反应网络中包含的各基元反应始态、终态和基于neb或cineb生成的过渡态;最后解析出始态、终态和过渡态的结果并存储到催化材料数据库中。
11.作为本发明的优选方案,步骤s2包括:s21、计算调度服务控制并发量;s22、产生量子化学软件计算作业所需的输入文件;s23、采用spring boot框架,根据配置信息,将输入文件传递到远程超算中心并提交计算;s24、解析并存储计算结果。
12.作为本发明的优选方案,还包括步骤s3查看已有催化材料高通量计算项目计算结果,所述项目计算结果包括一般的能量性质、电子结构性质、频率结果、化学位移结果、吸附能、吸附自由能。
13.作为本发明的优选方案,步骤s23还包括s231:启动高通量计算后,对于某一类型的计算,通过机器学习预测模块预测计算结果中可解析的目标性质。
14.作为本发明的优选方案,步骤s231具体包括以下步骤:通过爬虫获得材料的性质和组成材料的原子的性质,以所述性质为特征,首先使用特征工程对所述性质进行预处理,如果描述符为数值,采用网格搜索结合交叉验证训练机器学习随机森林、支持向量和神经网络等回归模型,通过训练的机器学习模型预测需要量子化学计算才能获得的性质,如果预测精度达到化学精度,则停止高通量计算,剩余未计算结果通过机器学习预测得到。
15.基于相同的构思,还提出了一种催化材料高通量计算筛选系统,包括微服务架构,所述微服务架构包括输入文件产生服务模块、计算调度服务模块、计算执行服务模块,所述输入文件产生服务用于产生量子化学软件计算作业所需的输入文件,所述输入文件包括催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;所述计算调度服务模块用于并发量的监控;所述计算执行服务模块用于提交多个作业到超算,基于所述配置信息并发完成多个高通量计算。
16.与现有技术相比,本发明的有益效果:本发明提供的一种适用于催化材料高通量计算筛选的方法及系统,集成了输入文件实时自动连续产生、自动连续高并发提交计算、实时获取计算结果、解析计算结果中的性质、对计算结果进行进一步的分析处理和展示,可实现多个作业并发计算,提高了大批量催化材料的模拟计算的效率。
17.附图说明:图1为实施例1中一种可视化全自动催化材料高通量计算方法流程图;图2为实施例2中一种可视化全自动催化材料高通量计算系统的微服务架构图;图3为实施例2中扩展后的微服务架构图;
图4为实施例3中一种具体的可视化全自动催化材料高通量计算方法流程图;图5为实施例3中用户注册界面示意图;图6为实施例3中密码登陆界面示意图;图7为实施例3中提交新计算项目界面示意图;图8为实施例3中项目信息填写界面示意图;图9为实施例3中计算资源信息填写界面示意图;图10为实施例3中项目文件上传界面示意图;图11为实施例3中高通量计算界面示意图。
具体实施方式
18.下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
19.实施例1一种催化材料高通量计算方法,其流程图如图1所示,步骤包括:s1,设置催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;s2,基于所述配置信息并发完成多个高通量计算。
20.作为具体的实施例,详细的步骤包括:步骤1 注册和登录催化材料高通量计算平台。基于浏览器/服务器结构设计,用户在催化材料高通量计算平台的所有操作均通过浏览器网页界面完成,无需下载任何客户端软件,通过浏览器访问催化材料高通量计算平台的首页,点击注册按钮,跳转到注册页面注册催化材料高通量计算平台用户账号,注册完成后,通过选择直接跳转或者从催化材料高通量计算平台首页点击登录按钮跳转到登录页面,使用已经注册的账号进行登录验证,验证成功后使用催化材料高通量计算平台提供的服务。
21.步骤2 提交新的催化材料高通量计算项目。每一次高通量计算都定义为一个计算项目,完成步骤1中的登录验证后。用户在跳转后的页面可选择提交新的高通量计算项目,选择此功能后,需要配置新项目信息包括:项目计算信息、初始结构文件、计算控制文件和外部计算资源信息。具体每项包括:其中,项目计算信息,包括:1.1、项目名称,项目名称可使用任意名称,同一个用户不同项目必须使用不同的名称。一个用户可提交多个不同高通量计算项目,此名称用于用户对不同项目的区分。
22.1.2 高通量计算的并发量,用户可根据自身需要设置为一个正整数。计算提交后,催化材料高通量计算平台计算调度服务会根据用户设置的并发量确定任意时刻下提交计算作业数量,如果某一时刻计算作业数量少于用户设置的并发数量,可立刻递补提交(并发量-当前时刻计算作业数量)个计算作业,使得并发量稳定维持在并发量要求的作业个数,提高计算效率。
23.1.3 计算软件,用户可根据计算需要选择本次计算使用的计算软件,提交计算后,计算执行服务在执行作业时将按照设置的软件提交作业进行计算,计算软件类型包括但不
限于vasp和gaussion等。
24.1.4 单个计算所用核数,用户可自由决定单个作业所用的计算核数,提交计算后,计算执行服务在执行作业时将按照设置的核数提交作业进行计算。
25.1.5 单个作业运行最大时长,用户可指定作业运行的最大时长,超时作业会被计算执行服务主动停止计算,避免个别作业浪费大量计算机时。
26.初始结构文件包括催化材料初始结构文件、吸附分子初始结构。
27.用户根据需要上传要计算的催化材料的初始结构文件,文件格式包括但不限于cif、pdb、mol等,上传文件个数下限为1,上限不受限制,如需要计算的为多相催化反应的催化材料,则初始结构为催化材料体相初始结构;如为均相反应的催化材料,则初始结构为催化材料的初始结构。
28.上传吸附物的初始结构文件,文件格式包括但不限于cif、gjf、xyz、mol等,用户根据需要上传吸附物的初始结构文件,上传文件个数下限为1,上限不受限制,这里的吸附物可以是单个原子、反应物、产物、反应中间体等;如不需要计算吸附,则此项可不上传。
29.计算控制文件内容中有每一步计算涉及的所有参数,包括建模参数、计算参数等,平台提供计算控制文件示例,用户根据示例文件,根据需要编写个性化的计算控制文件并上传,计算控制文件的格式包括但不限于yml、properties和json等格式。提交计算后,输入文件产生服务在需要的时候根据计算控制文件产生每一步模型和计算所需的输入文件。
30.外部计算资源信息包括:外部计算资源提供的连接ip、连接端口、登录账号、登录密码、作业提交脚本和作业提交命令,用户可设置已购买了计算服务的超算中心提供的连接ip、端口等信息,设置后催化材料高通量计算平台可根据用户设置的外部计算资源,由计算执行服务将作业提交到对应资源进行计算。
31.以上项目信息均通过spring中整合mvc技术实现前后端的交互,通过ajax完成数据校验,通过mysql数据库项目信息表来存储项目信息,每个项目为一条记录,除了包含项目信息外,每条记录还包含项目计算状态,项目信息设置完成后会默认将此项目的计算状态设置为未开始计算状态。
32.步骤3 一键启动高通量计算,完成以上步骤并确认无误后,即可一键启动高通量计算。此功能共由6个微服务模块实现,分别为注册中心(eureka服务)、输入文件产生服务(catalyst-vasp-input-generator服务)、web服务(catalyst-web服务)、计算调度服务(catalyst-scheduler服务)、计算执行服务(catalyst-eexecutor服务)和结果收集服务(catalyst-collector服务),各微服务高内聚低耦合。所有服务均注册到注册中心,各微服务通过注册中心一方面注册自身提供的服务,一方面通过在注册中心获取服务列表,获取的服务列表中包含的其他微服务注册到该中心的服务信息,查找到所需的服务进行调用。各微服务之间彼此调用,从而实现整个程序的正常运行。各服务均为常驻服务,一键启动高通量计算后,修改步骤2中项目信息表中项目状态为开始计算状态。
33.步骤3.1 计算调度服务控制并发量。计算调度服务负责并发量的监控,采用spring boot框架编写,此服务会间隔30秒查询数据库计算项目表,获得表中状态为正在计算的所有项目,计算状态不为正在计算的项目将不会被查询到,对于其中某一个项目,首先会查询项目并发量,根据并发量,调用输入文件产生服务产生一定数量初始文件对应量子化学软件计算作业所需的输入文件,再调用计算执行服务提交(并发量-正在运行作业数)
个作业到超算进行计算和监控,每个计算作业完成后,计算执行服务会将作业状态和作业信息报告给计算调度服务,计算调度服务会根据接受到的信息更新数据库作业信息表中此作业的状态,调用输入文件产生服务根据作业信息产生下一步计算的输入文件。
34.步骤3.2 输入文件产生服务产生量子化学软件计算作业所需的输入文件。此服务提供两个功能,一个是产生初始结构对应的第一步计算所需的输入文件;另一个是根据上一步计算结果产生下一步计算所需的输入文件,两个功能都供步骤3.1中计算调度服务调用。输入文件采用java和python语言混合编程的策略,采用java搭建整体框架方便和其他服务交互,采用python实现具体输入文件产生的功能,具体为通过获取用户上传的计算控制文件中的计算类型和计算参数产生对应的量子化学计算输入文件,采用python实现输入文件产生可方便扩展,可供有python基础的用户定制个性化计算。
35.步骤3.3 计算执行服务负责提交和监控作业在超算的执行。采用spring boot框架,根据计算调度服务传递的项目信息,将输入文件产生服务产生的输入文件传递到远程超算中心并提交计算,每隔作业占用一个线程,每提交一个作业则向从线程池中获取一个线程,提交后每个线程每隔60秒远程查看作业计算状态,如果计算完则将作业传输到本地并删除超算上的作业文件,向计算调度服务报告作业状态和作业信息,调用计算计算结果收集服务解析作业计算结果,释放线程到线程池。
36.步骤 3.4 结果收集服务解析并存储计算结果。采用spring boot框架,采用java和python语言混合编程的策略,采用java搭建整体框架方便和其他服务交互,采用python实现具体结果收集的功能,具体为通过根据计算调度服务提供的作业结果信息中的计算类型,调用不同的python代码解析计算结果,并将结果存储到数据库对应的表单中,采用python实现结果收集可方便扩展,可供有python基础的用户定制个性化计算。
37.步骤4 一键停止高通量计算,计算提交后,用户可随时一键停止计算服务,只需在一键启动页面点击停止计算按钮或在计算项目查看页面停止对应计算项目于即可一键停止高通量计算。此时,修改了项目信息表中对应项目的项目状态为暂停计算,计算调度服务遍历查询项目信息表中正在计算的项目时将不会查询到暂停的项目,项目计算暂停。
38.步骤 5 一键修改项目信息。所有项目信息均通过数据库表单存储,且计算过程中会间隔查询表单数据,根据表单数据进行高通计算的控制,通过修改表单信息则可控制高通量计算的执行。
39.步骤6 查看已有催化材料高通量计算项目计算结果,用户可通过图形化控制界面查看已有计算项目,此图形化界面有视图服务产生,具体为基于spring boot框架,采用其中集成的themleaf模板引擎生成的动态页面,其中采用ajax实现和后端的交互,平台会在每一个计算完成后利用计算结果收集服务自动解析计算结果中的性质,除了一般的能量性质,电子结构性质,本平台还可提供频率结果、化学位移结果、吸附能、吸附自由能等数据在线实时查看。
40.本发明的有益效果是本发明提供的一种适用于催化材料高通量计算筛选的方法及系统,集成了输入文件实时自动连续产生、自动连续高并发提交计算、实时获取计算结果、解析计算结果中的性质、对计算结果进行进一步的分析处理,并将计算结果通过浏览器实时展示给用户。极大地降低了催化材料高通量计算筛选的门槛,帮助加快新催化材料的研发。
41.作为优选方案,初始结构文件除了包含催化材料初始结构文件、吸附分子初始结构外,还可包含反应物初始结构和产物初始结构。
42.上传反应物的初始结构文件,文件格式包括但不限于cif、gjf、xyz、mol等,用户根据需要上传反应物的初始结构文件,上传文件个数下限为1,上限不受限制,这里的反应物可以是单个原子、分子等;如不需要计算反应,则此项可不上传。
43.上传产物的初始结构文件,文件格式包括但不限于cif、gjf、xyz、mol等,用户根据需要上传产物的初始结构文件,上传文件个数下限为1,上限不受限制,这里的反应物可以是单个原子、分子等;如不需要计算反应,则此项可不上传。
44.如果用户上传了反应物和产物的分子结构,输入文件产生服务调用python代码根据上传的反应物和产物分子结构自动生成均相或者多相反应的反应网络,生成反应网络中包含的各基元反应始态、终态和基于neb(或cineb)生成的过渡态;计算调度服务调用计算执行服务计算产生的始态、终态和过渡态,结果收集服务自动收集解析各始态、终态和过渡态的结果并存储到催化材料数据库中。
45.所有基元反应的始态、终态和过渡态计算完成后,计算执行服务会调用输入文件产生服务会根据计算控制文件生成围观动力学分析输入文件,计算执行服务调用微观动力学程序进行微观动力学学习,并将结果存储到数据库中。
46.步骤 3 还可做如下改进:增加机器学习训练预测服务,一键启动高通量计算后,对于某一类型的计算,通过高通量计算得到一定量计算结果后,通过机器学习预测模块预测计算结果中可解析的目标性质,根据材料的结构,可通过爬虫获得材料的性质和组成材料的原子的性质,以这些性质为特征,首先使用特征工程对性质进行预处理,如果描述符为数值,采用网格搜索结合交叉验证训练机器学习随机森林、支持向量和神经网络等回归模型,通过训练的机器学习模型预测需要量子化学计算才能获得的性质,如果预测精度达到化学精度,则停止高通来量计算,剩余未计算结果可通过机器学习预测得到;如果预测进度未达到化学精度,则采用增强学习策略,对未计算的作业,调整作业计算的优先集,优先计算最需要的结果,计算完成后,加入机器学习训练集重新训练模型并判断预测精度,机器学习训练预测服务间隔一定时间或者产生一定量新作业结果后执行一次,直到模型预测结果达到化学精度。如果描述符为已知品优催化材料,则可通过分类、聚类等机器学习技术直接判断候选品优催化剂结构,如果准确度达到精度要求,则停止提交作业计算,直接采用机器学习判断是否为品优催化材料即可。
47.步骤2还可做如下改进,项目信息还可包含:步骤2.9 描述符数值输入,具体包含描述符所述计算类型、描述符性质和描述符数值范围,对应的在步骤6中用户可直接查看基于描述符筛选的候选催化材料信息。
48.步骤2.10 已知品优催化材料输入,具体包含候选品优催化材料结构文件和计算类型,用户可上传多个品优催化材料结构文件,平台会优先计算这些材料,其他材料计算完成后,会跟品优催化材料进行对比,对性质相似度较高的材料确定为候选催化材料。用户可在步骤6中查看依此得到的类比候选催化材料。
49.步骤6 还可做如下改进:如果步骤2.6上传了反应物初始结构和产物初始结构,用户除了查看一般的能量性质,电子结构性质、频率结果、化学位移结果、吸附能、吸附自由能外,平台还提供反应能垒、反应自由能垒、反应热、反应的选择性,催化剂活性、反应表观活
化能、候选催化材料等数据在线实时查看。
50.采用上述改进方案的有益效果是:增加和修改的图形界面进一步改进催化材料高通量计算平台用户友好性,随时修改项目未计算完成项目的项目信息提高通量计算的灵活性、错误可控性,增加了反应网络的计算,使得高通量催化材料筛选结果更精确可靠,增加了机器学习,极大地节省的计算成本,提高了计算效率,增加了基于描述符的催化材料筛选,使得筛选更为对用户更直接更便利实施例2用于实现一种可视化全自动催化材料高通量计算方法的系统包括本地服务器和外部资源,其中,平台由两台服务器组成,服务器1负责作业的提交和结果提取与存储,服务器2负责对作业计算状态的监控和调度,所有的计算通过外部资源实现,平台负责作业的准备、提交、监控、结果提取和存储,外部资源负责作业计算,平台和外部资源共同完成计算任务。
51.外部资源提供最大800个节点,依据项目任务书并发量102的要求,需要申请100个节点,每个节点都可调用vasp(电子结构计算和量子力学-分子动力学模拟软件包,是目前材料模拟和计算物质科学研究中的商用软件)软件,平台将数据库中准备的作业提交给高性能计算中心,高性能计算中心lsf管理软件将平台提交的作业分配到的可运行vasp软件的节点进行计算,运行过程中平台监控作业状态,一旦作业计算结束,平台自动提取结果并存储到数据库指定位置。
52.如图2所示,一种可视化全自动催化材料高通量计算系统采用了微服务架构,具体采用spring cloud netflix框架实现,共由6个微服务模块构成,分别为注册中心(eureka服务)、输入文件产生服务(catalyst-vasp-input-generator服务)、web服务(catalyst-web服务)、计算调度服务(catalyst-scheduler服务)、计算执行服务(catalyst-eexecutor服务)和结果收集服务(catalyst-collector服务),各微服务高内聚低耦合。所有服务均注册到注册中心,各微服务通过注册中心一方面注册自身提供的服务,一方面通过在注册中心获取服务列表,获取的服务列表中包含的其他微服务注册到该中心的服务信息,查找到所需的服务进行调用。各微服务之间彼此调用,从而实现整个程序的正常运行。
53.各微服务之间通过feign进行调用,通过在各服务中导入服务注册eurekaclient和服务发现discoveryclient模块即可实现,服务注册将自身提供的服务注册到注册中心,服务发现通过注册中心查找需要的服务进行调用。各模块具体配置如下:注册中心配置@springbootapplication@enableeurekaserverpublic class eurekaserverapplication {
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(eurekaserverapplication.class, args);
ꢀꢀꢀꢀ
}}输入文件产生服务配置@enableeurekaclient
@enablediscoveryclient@springbootapplicationpublic class inputgenerateserverapplication {
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(inputgenerateserverapplication.class, args);
ꢀꢀꢀꢀ
}}web服务配置@springbootapplicationpublic class catalystwebapplication {
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(catalystwebapplication.class, args);
ꢀꢀꢀꢀ
}}计算调度服务配置@enableeurekaclient@enablediscoveryclient@springbootapplicationpublic class scheduleserverapplication {
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(scheduleserverapplication.class, args);
ꢀꢀꢀꢀꢀꢀꢀꢀ
taskdispatcher.startup();
ꢀꢀꢀꢀ
}}计算执行服务配置@enablediscoveryclient@springbootapplicationpublic class executorserverapplication {
ꢀꢀꢀꢀ
private static final logger logger = loggerfactory.getlogger(executorserverapplication.class);
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(executorserverapplication.class, args);
ꢀꢀꢀꢀ
}}结果搜集服务配置@enableeurekaclient@enablediscoveryclient@springbootapplication
public class outputcollectorserverapplication {
ꢀꢀꢀꢀ
public static void main(string[] args) {
ꢀꢀꢀꢀꢀꢀꢀꢀ
springapplication.run(outputcollectorserverapplication.class, args);
ꢀꢀꢀꢀ
}}此软件中包含的6个微服务模块均可进行横向扩展,只需要在满足硬件要求的服务器上搭载一个或者多个微服务即可,各微服务之间的调用采用feign,feign是一种声明式的web service客户端,feign中整合了ribbon进行负载均衡,本软件中每个微服务模块均可扩展,扩展后的每个微服务均注册到注册中心,采用的负载均衡策略是fegin默认的轮询策略,用户通过zuul网关访问高通量计算平台。扩展后的系统架构图如图3所示。
[0054]
实施例3一种具体的可视化全自动催化材料高通量计算方法流程图如图4所示,具体包括如下步骤:第一步,通过注册页面注册用户test123456,密码xxx;注册界面如图5所示;通过登录页面登录用户test123456,登陆界面如图6所示。
[0055]
第二步,提交新计算配置计算信息。在如图7所示的提交新计算项目界面点击提交新计算项目;在如图8所示的项目信息填写界面配置新计算项目信息,设置项目名称为test,并发量为100,计算软件选择vasp,核数/作业设置为24,作业最大时长设置为48小时,点击确认;在如图9所示的计算资源信息填写界面填写外部计算资源的ip、外部计算资源提供的连接端口、外部资源提供的登录账户名、登录账号对应的登录密码、作业提交脚本(在外部资源上提交作业时所用的作业提交脚本,一般超算会提供作业提交脚本给用户,一般为shell脚本)以及作业提交命令(在超算提交作业时所用的命令,如超算作业提交命令为:bsub 《 作业提交脚本名称)。
[0056]
第三步,数据源(cif等文件)获取。在如图10所示的项目文件上传界面上传初始结构文件,需上传的文件有三项,其中初始结构文件和计算控制文件两项为必选,初始结构文件为要计算的材料的初始cif文件,计算控制文件为产生计算输入文件时所用的方案。分子结构文件为需要特定的吸附计算时所用,如果并不需要进行吸附计算,则不需要上传,否则,必须上传。将从实验数据库得到的100个金属或合金的体相结构.cif文件,以材料名称命名并上传;上传ch3、co、cho、hcoo的.gjf结构文件;编制计算控制文件,文件中设置的作业计算类型有:1)体相结构优化,对应的计算参数:截断能设置400,精度设置accurate,能量收敛标准设置为0.0001ev/atom,k点网格设置为60,其他采用平台默认计算参数;2)体相静态计算,采用vasp推荐参数;3)吸附分子静态计算,采用vasp计算推荐参数;4)吸附分子结构优化,采用vasp计算推荐参数;5)slab结构优化,对应的计算参数:截断能设置400,精度设置accurate,能量收敛标准设置为0.0001,力收敛标准为-0.05,k点网格设置为40,所需的米勒指数面为:100,
110,111,slab总厚度为8层,允许弛豫的层数为3层,固定的层数为5层;6)slab静态计算,采用vasp手册默认的计算参数;7)slab态密度计算,采用vasp手册默认的计算参数;8)slab吸附结构优化,对应的计算参数:截断能设置400,精度设置accurate,能量收敛标准设置为0.0001,力收敛标准为-0.05,k点网格设置为40,所需的米勒指数面为:100,110,111,允许弛豫的层数为3层,固定的层数为5层;9)slab吸附静态计算,采用vasp手册默认的计算参数;10)slab吸附态密度计算,采用vasp手册默认的计算参数。上传计算控制文件,点击确认;设置计算资源信息,设置ip为ip:***》***.***.***,端口:*,登录账号为ttshi,密码:*******,上传超算提供的vasp作业提交脚本vasp.sh,填写作业提交命令:bsub 《 vasp.sh,点击确认。
[0057]
点击开始高通量计算按钮开始高通量计算,在如图11所示的高通量计算界面点击“开始高通量计算”按钮即可开始高通量计算,点击停止高通量计算按钮停止高通量计算,点击回到首页按钮回到首页,点击查看已提交项目查看计算中的项目和已经计算完成的项目,从本次提交的项目计算结果中可查看1)各吸附分子的结构参数、能量等;2)各金属体相优化后的结构参数、空间群等;3)每个体相结构产生3个弥勒指数面100、110和111slab的总能量、表面能,各slab结构的电子结构性质,如态密度、s带质心、p带质心、d带质心等性质;4)各slab上各吸附分子的吸附能,吸附结构的态密度等性质。
[0058]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种催化材料高通量计算方法,其特征在于,步骤包括:s1,设置催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;s2,基于所述配置信息并发完成多个高通量计算。2.如权利要求1所述的一种催化材料高通量计算方法,其特征在于,所述配置信息均通过spring整合mvc技术实现前后端的交互,通过ajax完成数据校验,通过mysql数据库项目信息表来存储项目信息。3.如权利要求2所述的一种催化材料高通量计算方法,其特征在于,项目计算信息包括项目名称、高通量计算的并发量、计算软件、单个计算所用核数、单个作业运行最大时长。4.如权利要求3所述的一种催化材料高通量计算方法,其特征在于,所述初始结构文件包括催化材料初始结构文件、吸附分子初始结构。5.如权利要求4所述的一种催化材料高通量计算方法,其特征在于,所述初始结构文件还包括反应物初始结构和产物初始结构,当所述反应物初始结构和产物初始结构上传后,根据所述反应物初始结构和产物初始结构自动生成均相或者多相反应的反应网络,生成反应网络中包含的各基元反应始态、终态和基于neb或cineb生成的过渡态;最后解析出始态、终态和过渡态的结果并存储到催化材料数据库中。6.如权利要求1所述的一种催化材料高通量计算方法,其特征在于,步骤s2包括:s21、计算调度服务控制并发量;s22、产生量子化学软件计算作业所需的输入文件;s23、采用spring boot框架,根据配置信息,将输入文件传递到远程超算中心并提交计算;s24、解析并存储计算结果。7.如权利要求1-5任一所述的一种催化材料高通量计算方法,其特征在于,还包括步骤s3查看已有催化材料高通量计算项目计算结果,所述项目计算结果包括一般的能量性质、电子结构性质、频率结果、化学位移结果、吸附能、吸附自由能。8.如权利要求6所述的一种催化材料高通量计算方法,其特征在于,步骤s23还包括s231:启动高通量计算后,对于某一类型的计算,通过机器学习预测模块预测计算结果中可解析的目标性质。9.如权利要求8所述的一种催化材料高通量计算方法,其特征在于,步骤s231具体包括以下步骤:通过爬虫获得材料的性质和组成材料的原子的性质,以所述性质为特征,首先使用特征工程对所述性质进行预处理,如果描述符为数值,采用网格搜索结合交叉验证训练机器学习随机森林、支持向量和神经网络等回归模型,通过训练的机器学习模型预测需要量子化学计算才能获得的性质,如果预测精度达到化学精度,则停止高通量计算,剩余未计算结果通过机器学习预测得到。10.一种催化材料高通量计算筛选系统,其特征在于,包括微服务架构,所述微服务架构包括输入文件产生服务模块、计算调度服务模块、计算执行服务模块,所述输入文件产生服务用于产生量子化学软件计算作业所需的输入文件,所述输入文件包括催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;
所述计算调度服务模块用于并发量的监控;所述计算执行服务模块用于提交多个作业到超算,基于所述配置信息并发完成多个高通量计算。

技术总结
本发明涉及催化材料研发领域,特别涉及一种催化材料高通量计算方法和筛选系统。方法包括以下步骤:S1,设置催化材料高通量计算的配置信息,所述配置信息包括项目计算信息、初始结构文件、计算控制文件和外部计算资源信息;S2,基于所述配置信息并发完成多个高通量计算;筛选系统采用微服务架构,所述微服务架构包括注册中心模块、输入文件产生服务模块、Web服务模块、计算调度服务模块、计算执行服务模块和结果收集服务模块,各模块高内聚低耦合,彼此调用,从而实现整个程序的正常运行。本发明针对催化剂材料特点实现了多个作业并发自动计算,提高了大批量催化材料的模拟计算的效率。率。率。


技术研发人员:陈兆旭 史涛涛
受保护的技术使用者:南京大学
技术研发日:2022.02.11
技术公布日:2023/8/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐