一种基于蒙特卡洛树搜索的逆合成分析方法及设备与流程

未命名 08-15 阅读:91 评论:0


1.本技术涉及计算机领域,具体涉及一种基于蒙特卡洛树搜索的逆合成分析方法及设备。


背景技术:

2.逆合成分析是一种用来合成指定化合物的方法,它将目标化合物一步步分解为中间体或更简单的反应物,直到找到可购买的构建块。
3.逆合成分析在传统上是通过基于手动编码规则的专家系统来实现的,这就导致其应用范围窄,且准确率较低。


技术实现要素:

4.为了解决上述问题,本技术提出了一种基于蒙特卡洛树搜索的逆合成分析方法,包括:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
5.另一方面,本技术还提出了一种基于蒙特卡洛树搜索的逆合成分析设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
6.另一方面,本技术还提出了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
7.通过本技术提出基于蒙特卡洛树搜索的逆合成分析方法能够带来如下有益效果:通过设置的多个所需模型,以及得到的相似度得分,并对蒙特卡洛树搜索算法进行改进,可以有效提高生成出符合用户合成偏好路线的概率,并能够扩大应用领域,使其能够适应更多的化合物逆合成分析领域。
附图说明
8.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:图1为本技术实施例中基于蒙特卡洛树搜索的逆合成分析方法的流程示意图;图2为本技术实施例中模板相关性模型的架构示意图;图3为本技术实施例中模板适用性模型的架构示意图;图4为本技术实施例中反应合理性模型的架构示意图;图5为本技术实施例中基于蒙特卡洛树搜索的逆合成分析设备的示意图。
具体实施方式
9.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
10.以下结合附图,详细说明本技术各实施例提供的技术方案。
11.如图1所示,本技术实施例提供基于蒙特卡洛树搜索的逆合成分析方法,包括:s101:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个。
12.基于蒙特卡洛树搜索等ai算法进行逆合成路线的生成受到了关注,虽然其能较快较准确地生成指定目标化合物的合成路线,但在工业落地场景下很难生成令用户满意、符合用户合成偏好的合成路线。
13.smiles是一种化学结构的线性表示方法,而smarts是一种基于smiles的反应表现。模板是否优先则可以基于人工进行预先标注,标注“是”的逆反应模板则可以被称为优
先逆反应模板。
14.s102:基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型。
15.具体地,针对于模板相关性模型,搭建第一神经网络模型(比如,其可以为多隐藏层全连接多分类神经网络)。
16.通过逆反应模板库对第一神经网络模型进行训练,以得到模板相关性模型。其中,模板相关性模型的输入为产物smiles的某种分子向量化表示,输出为逆反应模板库中,对应的不重复的逆反应模板smarts的概率分布。比如,采用rdkit计算的长度为2048,半径为2的摩根指纹进行分子向量化表示,采用keras深度学习框架搭建该第一神经网络模型,如图2所示,第一神经网络模型的输入层神经元个数为2048,连接一个dense层,神经元个数为512,激活函数为relu,连接一个dropout层参数设置为0.4,并重复设置一个dense层与dropout层后,连接一个dense层,神经元个数为128,激活函数为elu,最后连接一个dense层,输出层神经元个数为不重复逆反应模板数,损失函数为交叉熵损失(通过softmax函数处理后,输入交叉熵函数进行交叉熵损失的计算)。
17.针对于模板适用性模型,首先生成对应的标签向量,针对每个产物smiles,当其作用于每个逆反应模板smarts时,若能生成前置反应物,则对应的逆反应模板smarts式的标签为1,否则为0,从而生成由0或1组成的标签向量。
18.搭建第二神经网络模型(比如,其可以为多隐藏层全连接多标签分类神经网络)。
19.通过逆反应模板库对第二神经网络模型,以标签向量有监督训练,得到模板适用性模型,其中,模板适用性模型的输入为产物smiles的某种分子向量化表示,输出为逆反应模板库中,对应的不重复逆反应模板smarts的适用概率。比如,产物smiles的分子向量化表示可以采用rdkit计算的长度为2048,半径为2的摩根指纹,采用keras深度学习框架搭建该第二神经网络模型,如图3所示,输入层神经元个数为2048,连接一个dense层,神经元个数为512,激活函数为relu,连接一个dropout层参数设置为0.4,连接一个dense层,神经元个数为128,激活函数为elu,最后连接一个dense层,输出层神经元个数为不重复逆反应模板数,损失函数为二元交叉熵损失(通过sigmoid函数处理后,输入交叉熵函数进行交叉熵损失的计算)。
20.针对于反应合理性模型,类似地,同样需要生成对应的标签向量,将逆反应模板库的逆反应模板smarts转换为正向反应模板smarts。针对每个反应物smiles,当其作用于随机选择的正向反应模板smarts时,若生成的产物smiles不同于该反应物smiles对应的产物smiles,则该生成的产物smiles及对应的反应物smiles为不合理反应,标签为0,并将逆反应模板库中的反应为合理反应(与不合理反应相反的,若生成的产物smiles与该反应物smiles对应的产物smiles相同,则为合理反应),标签为1,以生成由0或1组成的标签向量。
21.搭建第三神经网络模型(比如,其可以为多隐藏层全连接二分类神经网络)。
22.通过逆反应模板库对第三神经网络模型,以标签向量有监督训练,得到反应合理性模型,其中,反应合理性模型的输入为产物smiles与反应smiles的某种分子向量化表示,输出为该反应的合理概率。比如,产物smiles的分子向量化表示采用rdkit计算的长度为2048,半径为2的摩根指纹,反应smiles的分子向量化表示为产物摩根指纹与反应物摩根指纹的求和之差,采用keras深度学习框架搭建该第三神经网络模型,如图4所示,网络输入层
有两个头,分别用于接收产物摩根指纹(产物morgan fp)与反应摩根指纹(反应morgan fp),神经元个数均为2048,对于产物摩根指纹一侧,连接一个dense层,神经元个数为512,激活函数为relu,连接一个dropout层参数设置为0.4,对于反应摩根指纹一侧,连接一个dense层,神经元个数为512,激活函数为relu,两者输出连接余弦相似度层(cosine),输出层dense层神经元个数为1,损失函数为二元交叉熵损失(通过sigmoid函数处理后,输入交叉熵函数进行交叉熵损失的计算)。
23.s103:针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分。
24.具体地,将待分解产物smiles进行分子向量化表示,得到待分解产物分子向量化表示。比如,采用rdkit计算的长度为2048,半径为2的摩根指纹,在本技术实施例中,未作出特殊说明时,分子向量化均可采用该种方式。
25.在逆反应模板库中,优先逆反应模板可能对应多个产物smiles,此时,针对优先逆反应模板所对应的某个产物smiles以及反应物smiles,将其进行分子向量化表示,得到对应的产物分子向量化表示以及反应物分子向量化表示。在对应多个产物smiles时,可以均得到对应的产物分子向量化表示。将待分解产物smiles作用于优先逆反应模板对应生成的反应物smiles,并进行分子向量化表示,得到生成反应物分子向量化表示。
26.根据待分解产物分子向量化表示与产物分子向量化表示之间的相似度,将其作为产物相似度。根据生成反应物分子向量化表示与反应物分子向量化表示之间的相似度,将其作为反应物相似度。
27.根据产物相似度以及反应物相似度,将两者相乘得到总相似度。由于单个优先逆反应模板对应于多个产物smiles,故而可以求得多个总相似度,此时,针对单个优先逆反应模板,根据其所有的总相似度,取最大值得到该优先逆反应模板对应的相似度得分。其中,相似度可以采用rdkit的tanimotosimilarity指标。
28.s104:基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
29.具体地,蒙特卡洛树搜索共包括四个阶段,分别是选择阶段、扩展阶段、模拟阶段、回溯阶段。
30.其中,选择阶段从根节点开始递归选择ucb得分最高的子节点,直至到达叶子节点, ucb得分基于相似度得分进行融合计算得到,比如,ucb得分由下列公式计算得到, ;其中,其中ucb为ucb得分,q为前步价值的总和,n为当前子节点被遍历的次数,n-1
为当前节点的父节点被遍历的次数,c是用于平衡探索与开发的超参,默认值为1.4,u表示是否为优先逆反应模板,若是则取1,若否则取0,s为优先逆反应模板的相似度得分。
31.扩展阶段,对所选该叶子节点的每个分子,通过结合模板相关性模型、模板适用性模型得到的逆反应模板,通过反应合理性模型生成前置分子并创建叶子节点。
32.对所选该叶子节点的每个分子,分别输入模板相关性模型与模板适用性模型,分别得到对应的第一输出结果(对应于模板相关性模型的输出)与第二输出结果(对应于模板
适用性模型的输出)。将第二输出结果经过阈值过滤后,与第一输出结果相乘得到多个逆反应模板。通过反应合理性模型,对得到的每个逆反应模板生成的前置分子,并在过滤后创建叶子节点。
33.其中,对每个分子通过结合模板相关性模型与模板适用性模型预测得到的所有模板中,只保留前50个概率最高的模板,或者保留的模板的累积概率达到0.995。模板适用性模型、反应合理性模型过滤阈值分别取0.1,0.05。
34.模拟阶段,针对未访问过的叶子节点,重复进行选择与扩展,直到满足停止条件到达终止节点,所述扩展包括生成前置分子并创建叶子节点。
35.保持模板相关性模型、模板适用性模型以及反应合理性模型不变,以针对未访问过的叶子节点,重复进行选择与扩展,直到满足停止条件到达终止节点,停止条件包括:生成的前置分子均存在于预先设置的通用可购化合物库或优先可购化合物库中、达到蒙特卡洛树的最大深度以及逆反应模板均无效。
36.回溯阶段,从当前叶子节点开始,从下至上更新回溯路径上每个节点的q值和n值,直到到达根节点。其中,q值表示前步价值的总和,而n值表示当前子节点被遍历的次数,而在上文中已经介绍了如何计算得到ucb得分,将q与n值相除后用于进行ucb得分的计算,并且ucb计算过程中用到的参数 可以凸显优先逆反应模板,选用优先逆反应模板为生成出符合用户偏好路径的关键。
37.根据价值更新函数获取终止节点的价值评估值,价值更新函数通过下列公式计算得到,reward=0.9
×
+0.1
×
,其中,reward为价值评估值,nin_generalstock为通用可购化合物的数量,nin_prioritystock为优先可购化合物的数量,n为终止节点中化合物的数量。而通用可购化合物和优先可购化合物,则是用户基于实际需求进行设置。
38.从当前叶子节点开始,从下至上更新回溯,并在更新回溯路径上,使每个节点的q值都累加一次价值评估值,并同时n值加1,直到到达根节点,从而计算得到最终的q值和n值。
39.如图5所示,本技术实施例还提供了一种基于蒙特卡洛树搜索的逆合成分析设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的
选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
40.本技术实施例还提供了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。
41.本技术中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
42.本技术实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
43.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
44.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
45.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
46.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
47.在一个典型的配置中,计算设备包括一个或多个处理器 (cpu)、输入/输出接口、网络接口和内存。
48.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (ram) 和/或非易失性内存等形式,如只读存储器 (rom) 或闪存(flash ram)。内存是计算机可读介质的示例。
49.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (pram)、静态随机存取存储器 (sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器 (ram)、只读存储器 (rom)、电可擦除可编程只读存储器 (eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器 (cd-rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
50.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
51.以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。

技术特征:
1.一种基于蒙特卡洛树搜索的逆合成分析方法,其特征在于,包括:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。2.根据权利要求1所述的方法,其特征在于,基于所述逆反应模板库,训练生成多个所需模型,具体包括:搭建第一神经网络模型;通过所述逆反应模板库对所述第一神经网络模型进行训练,以得到模板相关性模型,其中,所述模板相关性模型的输入为产物smiles,输出为所述逆反应模板库中,对应的不重复的逆反应模板smarts的概率分布。3.根据权利要求1所述的方法,其特征在于,基于所述逆反应模板库,训练生成多个所需模型,具体包括:针对每个产物smiles,当其作用于每个逆反应模板smarts时,若能生成前置反应物,则对应的逆反应模板smarts式的标签为1,否则为0,以生成由0或1组成的标签向量;搭建第二神经网络模型;通过所述逆反应模板库对所述第二神经网络模型,以所述标签向量有监督训练,得到模板适用性模型,其中,所述模板适用性模型的输入为产物smiles,输出为所述逆反应模板库中,对应的不重复逆反应模板smarts的适用概率。4.根据权利要求1所述的方法,其特征在于,基于所述逆反应模板库,训练生成多个所需模型,具体包括:将所述逆反应模板库的逆反应模板smarts转换为正向反应模板smarts;针对每个反应物smiles,当其作用于随机选择的正向反应模板smarts时,若生成的产物smiles不同于该反应物smiles对应的产物smiles,则该生成的产物smiles及对应的反应物smiles为不合理反应,标签为0,并将逆反应模板库中的反应为合理反应,标签为1,以生成由0或1组成的标签向量;搭建第三神经网络模型;通过所述逆反应模板库对所述第三神经网络模型,以所述标签向量有监督训练,得到反应合理性模型,其中,所述反应合理性模型的输入为产物smiles与反应smiles,输出为该反应的合理概率。5.根据权利要求1所述的方法,其特征在于,针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分,具体包括:将待分解产物smiles进行分子向量化表示,得到待分解产物分子向量化表示;
针对优先逆反应模板所对应的产物smiles以及反应物smiles,将其进行分子向量化表示,得到对应的产物分子向量化表示以及反应物分子向量化表示;将所述待分解产物smiles作用于所述优先逆反应模板对应的反应物smiles,并进行分子向量化表示,得到生成反应物分子向量化表示;根据所述待分解产物分子向量化表示与所述产物分子向量化表示之间的相似度,得到产物相似度;根据所述生成反应物分子向量化表示与所述反应物分子向量化表示之间的相似度,得到反应物相似度;根据所述产物相似度以及所述反应物相似度,得到总相似度;针对单个优先逆反应模板,根据其所有的总相似度,取最大值得到该优先逆反应模板对应的相似度得分。6.根据权利要求1所述的方法,其特征在于,基于蒙特卡洛树搜索的方式,从根节点开始根据所述得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,具体包括:从根节点开始递归选择ucb得分最高的子节点,直至到达叶子节点,所述ucb得分基于所述相似度得分进行融合计算得到;对所选该叶子节点的每个分子,通过结合所述模板相关性模型、所述模板适用性模型得到的逆反应模板,生成前置分子并通过所述反应合理性模型过滤后创建叶子节点;针对未访问过的叶子节点,重复进行选择与扩展,直到满足停止条件到达终止节点,所述扩展包括生成前置分子并创建叶子节点;从当前叶子节点开始,从下至上更新回溯路径上每个节点的q值和n值,直到到达根节点。7.根据权利要求6所述的方法,其特征在于,对所选该叶子节点的每个分子,通过结合所述模板相关性模型、所述模板适用性模型得到的逆反应模板,通过所述反应合理性模型生成前置分子并创建叶子节点,具体包括:对所选该叶子节点的每个分子,分别输入所述模板相关性模型与所述模板适用性模型,分别得到对应的第一输出结果与第二输出结果;将所述第二输出结果经过阈值过滤后,与所述第一输出结果相乘得到多个逆反应模板;通过所述反应合理性模型,对得到的每个逆反应模板生成的前置分子,并在过滤后创建叶子节点。8.根据权利要求6所述的方法,其特征在于,针对未访问过的叶子节点,重复进行选择与扩展,直到满足停止条件到达终止节点,具体包括:保持所述模板相关性模型、所述模板适用性模型以及所述反应合理性模型不变,以针对未访问过的叶子节点,重复进行选择与扩展,直到满足停止条件到达终止节点,所述停止条件包括:生成的前置分子均存在于预先设置的通用可购化合物库或优先可购化合物库中、达到蒙特卡洛树的最大深度以及逆反应模板均无效。9.根据权利要求6所述的方法,其特征在于,从当前叶子节点开始,从下至上更新回溯路径上每个节点的q值和n值,直到到达根节点,具体包括:
根据价值更新函数获取终止节点的价值评估值;从当前叶子节点开始,从下至上更新回溯,并在更新回溯路径上,使每个节点的q值都累加一次价值评估值,并同时n值加1,直到到达根节点。10.一种基于蒙特卡洛树搜索的逆合成分析设备,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取逆反应模板库,所述逆反应模板库中包含有多个字段,所述多个字段包括反应物smiles、产物smiles、逆反应模板smarts以及模板是否优先中的至少多个;基于所述逆反应模板库,训练生成多个所需模型,所述所需模型包括模板相关性模型、模板适用性模型、反应合理性模型;针对单个优先逆反应模板,基于其对应的产物smiles和反应物smiles,与待分解产物smiles得到的相似度,得到所述逆反应模板smarts对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据所述相似度得分进行叶子节点的选择,并根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点,以得到符合用户偏好的逆合成分析路径。

技术总结
本申请公开了一种基于蒙特卡洛树搜索的逆合成分析方法及设备,方法包括:获取逆反应模板库,逆反应模板库中包含有多个字段;基于逆反应模板库,训练生成多个所需模型;针对单个优先逆反应模板,基于其对应的产物SMILES和反应物SMILES,与待分解产物SMILES得到的相似度,得到逆反应模板SMARTS对应的相似度得分;基于蒙特卡洛树搜索的方式,从根节点开始根据相似度得分进行叶子节点的选择,根据所选的叶子节点进行节点扩展,直至模拟满足停止条件达到终止节点,进行回溯至根节点。通过对蒙特卡洛树搜索算法进行改进,可以有效提高生成出符合用户合成偏好路线的概率,并能够扩大应用领域,使其能够适应更多的化合物逆合成分析领域。域。域。


技术研发人员:却立勇 李中伟 柳彦宏
受保护的技术使用者:烟台国工智能科技有限公司
技术研发日:2023.07.13
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐