一种基因分析结果可视化方法、装置、设备及介质
未命名
09-17
阅读:112
评论:0

背景技术:
::2.基因组比较和进化分析是生物信息学的重要领域,伴随着高通量测序技术的发展,越来越多的基因组数据被产生。目前常用于基因组比较和进化分析的主要工具主要有orthofinder(直系同源基因分析)、orcan、orthoinspector等。orthofinder,虽然提供直系同源簇分析进化分析,但在可视化展示方面效果不高,信息量较大难以直观解读;orcan,虽然提供简单的可视化,但其分析功能薄弱,不能满足进行多种分析的需求,以致于用户不能进行高效的挖掘信息。3.由上可见,如何将直系同源簇分析进化分析与可视化进行结合,从而提高直系同源聚类识别方法的准确性,直观展示物种之间独特和共享的集群,快速理解研究对象之间的差异与进化关系,提高基因组学数据进行规模化比较与分析的效率是本领域有待解决的问题。技术实现要素:4.有鉴于此,本发明的目的在于提供一种基因分析结果可视化方法、装置、设备及介质,能够将直系同源簇分析进化分析与可视化进行结合,从而提高直系同源聚类识别方法的准确性,直观展示物种之间独特和共享的集群,快速理解研究对象之间的差异与进化关系,提高基因组学数据进行规模化比较与分析的效率。其具体方案如下:5.第一方面,本技术公开了一种基因分析结果可视化方法,应用于orthovenn3,包括:6.对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;7.若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;8.若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;9.若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;10.若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。11.可选的,所述对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,包括:12.对所述基因数据进行blast比对与聚类操作,以得到比对结果,对所述比对结果进行直系同源簇的聚类与鉴定操作,以得到聚类鉴定结果;13.对所述聚类鉴定结果进行直系同源簇的go功能注释,以得到直系同源簇分析结果。14.可选的,所述基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,包括:15.基于所述基因数据确定出物种间的单拷贝直系同源基因簇;16.基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树。17.可选的,所述基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树,包括:18.对所述单拷贝直系同源基因簇进行多序列比对,以得到对比后的单拷贝直系同源基因簇多序列;19.对所述对比后的单拷贝直系同源基因簇多序列进行冗余序列修剪删除,以得到目标序列,将物种间的所述目标序列进行串联,基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。20.可选的,所述基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树,包括:21.从本地预设的所有进化模型中筛选出目标进化模型;22.调用所述目标进化模型通过fasttree2,并基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。23.可选的,所述基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,包括:24.基于所述基因数据确定出物种进化树;25.利用所述物种进化树并基于所述直系同源簇分析结果进行基因家族收缩与扩张分析,以得到基因家族进化分析结果。26.可选的,所述基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,包括:27.从本地所有的物种基因注释信息中确定出与所述基因数据相对应的目标物种基因注释信息;28.利用mcscanx并基于所述直系同源簇分析结果和所述目标物种基因注释信息进行物种间的共线性分析操作,以得到共线性分析结果。29.第二方面,本技术公开了一种基因分析结果可视化装置,包括:30.按钮检测模块,用于对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;31.直系同源簇分析结果可视化模块,用于若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;32.系统发育进化树可视化模块,用于若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;33.基因家族进化分析结果可视化模块,用于若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;34.共线性分析结果可视化模块,用于若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。35.第三方面,本技术公开了一种电子设备,包括:36.存储器,用于保存计算机程序;37.处理器,用于执行所述计算机程序,以实现前述的基因分析结果可视化方法。38.第四方面,本技术公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的基因分析结果可视化方法的步骤。39.可见,本技术提供了一种基因分析结果可视化方法,包括对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。本技术应用于orthovenn3(一个支持跨基因组探索与可视化直系同源数据的综合平台),本发明在分析功能与结果可视化两方面进行了优化改进,提供了准确性更高的直系同源簇鉴定算法、系统发育进化分析、基因家族进化分析以及共线性分析的分析功能,并借助清楚直观的可视化手段,帮助用户快速理解研究对象之间的差异与进化关系,该平台无需安装部署,计算过程快速,结果易于解释,提高基因组学数据进行规模化比较与分析的效率。附图说明40.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。41.图1为本技术公开的一种基因分析结果可视化方法流程图;42.图2为本技术公开的一种orthovenn3的具体示例图;43.图3为本技术公开的一种基因分析结果可视化装置结构示意图;44.图4为本技术提供的一种电子设备结构图。具体实施方式45.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。46.基因组比较和进化分析是生物信息学的重要领域,伴随着高通量测序技术的发展,越来越多的基因组数据被产生。目前常用于基因组比较和进化分析的主要工具主要有orthofinder(直系同源基因分析)、orcan、orthoinspector等。orthofinder,虽然提供直系同源簇分析进化分析,但在可视化展示方面效果不高,信息量较大难以直观解读;orcan,虽然提供简单的可视化,但其分析功能薄弱,不能满足进行多种分析的需求,以致于用户不能进行高效的挖掘信息。由上可见,如何将直系同源簇分析进化分析与可视化进行结合,从而提高直系同源聚类识别方法的准确性,直观展示物种之间独特和共享的集群,快速理解研究对象之间的差异与进化关系,提高基因组学数据进行规模化比较与分析的效率是本领域有待解决的问题。47.本技术应用于orthovenn3(一个支持跨基因组探索与可视化直系同源数据的综合平台),最新版本的orthovenn3对分析功能和可视化方法等多项内容进行了更新。首先,增加了内置物种数据库的数据容量以包含更多物种并添加了物种的基因注释信息(annotationdata)。其次,整合了更加准确的直系同源聚类识别方法,以提高orthovenn3的准确性。最后,采用了upset可视化方法,这是一种用于在矩阵布局中可视化元素交集的工具,使得更直观展示众多物种之间独特和共享的集群。除了这些功能之外,orthovenn3还扩展了多项比较基因组学研究中常用的分析功能,包括系统发育分析,允许根据物种的单拷贝直系同源簇推断物种之间的进化关系;基因家族收缩和扩张分析,深入了解不同物种之间基因家族的获得或丢失;共线性分析,有助于识别基因组重排和进化的区域。48.参见图1所示,本发明实施例公开了一种基因分析结果可视化方法,应用于orthovenn3,具体可以包括:49.步骤s11:对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮。50.步骤s12:若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化。51.本实施例中,若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据进行blast比对与聚类操作,以得到比对结果,对所述比对结果进行直系同源簇的聚类与鉴定操作,以得到聚类鉴定结果,对所述聚类鉴定结果进行直系同源簇的go功能注释,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化。52.其中,对所述直系同源簇分析结果进行可视化的方法,包括但不限于venn图(韦恩图)、occurencetable、upsettable、热图以及堆叠柱状图。53.步骤s13:若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化。54.本实施例中,若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述基因数据确定出物种间的单拷贝直系同源基因簇,基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树。具体的,若检测到所述系统发育进化分析按钮被触发,自动执行直系同源簇分析的流程,并基于所述基因数据确定出物种间的单拷贝直系同源基因簇,对所述单拷贝直系同源基因簇进行多序列比对,以得到对比后的单拷贝直系同源基因簇多序列,对所述对比后的单拷贝直系同源基因簇多序列进行冗余序列修剪删除,以得到目标序列,将物种间的所述目标序列进行串联,基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。55.其中,构建系统发育进化树的流程为:从本地预设的所有进化模型中筛选出目标进化模型,调用所述目标进化模型通过fasttree2,并基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。对所述系统发育进化树进行可视化的方法,包括但不限于树状图和柱状图。56.构建系统发育进化树的具体步骤为:(1)获取物种间的单拷贝直系同源基因簇;其中,单拷贝直系同源簇包括各个物种的保守序列;(2)进行多序列比对后并修剪删除冗余序列;其中,通过muscle多序列比对,trimal进行序列修剪;(3)将物种间比对修剪后的序列进行串联;(4)选择合适的进化模型(即目标进化模型)通过fasttree2推断物种间进化树;(5)标记合适的物种进化时间节点,通过r8s推断物种间的进化时间,获得时间度量进化树;(6)构建出系统发育进化树。57.步骤s14:若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化。58.本实施例中,若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述基因数据确定出物种进化树,利用所述物种进化树并基于所述直系同源簇分析结果进行基因家族收缩与扩张分析,以得到基因家族进化分析结果。59.其中,对所述基因家族进化分析结果进行可视化的方法,包括但不限于树状图和柱状图。60.步骤s15:若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。61.本实施例中,若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并从本地所有的物种基因注释信息中确定出与所述基因数据相对应的目标物种基因注释信息,利用mcscanx并基于所述直系同源簇分析结果和所述目标物种基因注释信息进行物种间的共线性分析操作,以得到共线性分析结果。62.其中,对所述共线性分析结果进行可视化的方法,包括但不限于桑基图。63.本技术应用于一种提供多种分析功能的综合平台,包括直系同源簇分析模块、基因家族进化分析模块、系统发育分析模块、共线性分析模块。直系同源簇分析模块支持两种直系同源簇鉴定算法,分别是orthomcl算法和orthofinder算法。系统发育分析模块采用muscle多序列比对,trimal序列修剪,fasttree构建系统发育树的分析策略。基因家族进化分析模块通过cafe5算法针对直系同源基因家族和超时间度量进化树来进行基因家族收缩与扩张分析统计,通过特定的进化模型统计发生进化的基因家族。64.orthologousclusteranalysis模块(直系同源簇分析模块)用于:1、物种间基因组学数据的blast比对;2、直系同源簇的聚类与鉴定;3、直系同源簇的go功能注释。genefamilyevolutionanalysis模块(基因家族进化分析模块)用于:利用直系同源基因簇和物种进化树进行基因家族收缩与扩张分析。phylogeneticanalysis模块(系统发育进化分析模块)用于:利用单拷贝基因簇构建系统发育进化树,包括:1、获取物种间的单拷贝直系同源基因簇;2、进行多序列比对后并修剪删除冗余序列;3、将物种间比对修剪后的序列进行串联;4、选择合适的进化模型通过fasttree2推断物种间进化树。collinearityanalysis模块(共线性分析模块)用于:根据注释信息文件以及蛋白序列比对结果,通过mcscanx识别物种间的共线性区域。65.具体orthovenn3(anintegratedplatformforexploringandvisualizingorthologousdataacrossgenomes,一个支持跨基因组探索与可视化直系同源数据的综合平台)示例如图2所示,对本地的各基因分析按钮进行检测;(1)若检测到直系同源簇分析按钮被触发,则获取基因数据(genomicsdata),对基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,得到直系同源簇分析结果,对所直系同源簇分析结果进行可视化(orthologousclusteranalysis);(2)若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,构建出系统发育进化树,对所述系统发育进化树进行可视化(phylogeneticanalysis);(3)若检测到基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并进行基因家族进化分析操作,以得到基因家族进化分析结果,对基因家族进化分析结果进行可视化(genefamilyevolutionanalysis);(4)若检测到共线性分析按钮被触发,则自动执行直系同源簇分析的流程,基于基因注释信息(annotationdata)进行物种间的共线性分析操作,以得到共线性分析结果,对共线性分析结果进行可视化(collinearityanalysis)。本技术能帮助研究人员高效地识别和注释不同物种之间共享和特有的直系同源聚类,推断出物种间的进化关系、共线性区域等信息,从而促进研究者对不同物种之间的进化关系和遗传多样性的理解。提供针对直系同源数据的多种分析功能,能一键进行基因组学数据处理、比较分析和结果可视化,减少生物学研究人员的负担,避免由于配置参数错误造成分。66.本技术的关键点在于:(1)提供的“一站式分析平台”,使用方便,设置分析参数后自使得后台能自动进行分析并对结果可视化,不需要安装配置等环境配置操作,减少比较基因组学方向研究人员的负担。(2)提供两种高效的直系同源簇分析算法有效的确保了直系同源基因鉴定的准确性和高效性,能快速准确地鉴定直系同源基因,有效避免造成数据错误。(3)提供多种可视化方式来展示分析结果,如:upsettable、occurencetable、venn等可视化方法。67.本实施例中,对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。本技术应用于orthovenn3(一个支持跨基因组探索与可视化直系同源数据的综合平台),本发明在分析功能与结果可视化两方面进行了优化改进,提供了准确性更高的直系同源簇鉴定算法、系统发育进化分析、基因家族进化分析以及共线性分析的分析功能,并借助清楚直观的可视化手段,帮助用户快速理解研究对象之间的差异与进化关系,该平台无需安装部署,计算过程快速,结果易于解释,提高基因组学数据进行规模化比较与分析的效率。68.参见图3所示,本发明实施例公开了一种基因分析结果可视化装置,具体可以包括:69.按钮检测模块11,用于对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;70.直系同源簇分析结果可视化模块12,用于若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;71.系统发育进化树可视化模块13,用于若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;72.基因家族进化分析结果可视化模块14,用于若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;73.共线性分析结果可视化模块15,用于若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。74.本实施例中,对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。本技术应用于orthovenn3(一个支持跨基因组探索与可视化直系同源数据的综合平台),本发明在分析功能与结果可视化两方面进行了优化改进,提供了准确性更高的直系同源簇鉴定算法、系统发育进化分析、基因家族进化分析以及共线性分析的分析功能,并借助清楚直观的可视化手段,帮助用户快速理解研究对象之间的差异与进化关系,该平台无需安装部署,计算过程快速,结果易于解释,提高基因组学数据进行规模化比较与分析的效率。75.在一些具体实施例中,所述直系同源簇分析结果可视化模块12,具体可以包括:76.比对与聚类模块,用于对所述基因数据进行blast比对与聚类操作,以得到比对结果,对所述比对结果进行直系同源簇的聚类与鉴定操作,以得到聚类鉴定结果;77.go功能注释模块,用于对所述聚类鉴定结果进行直系同源簇的go功能注释,以得到直系同源簇分析结果。78.在一些具体实施例中,所述系统发育进化树可视化模块13,具体可以包括:79.单拷贝直系同源基因簇确定模块,用于基于所述基因数据确定出物种间的单拷贝直系同源基因簇;80.系统发育进化树构建模块,用于基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树。81.在一些具体实施例中,所述系统发育进化树可视化模块13,具体可以包括:82.多序列比对模块,用于对所述单拷贝直系同源基因簇进行多序列比对,以得到对比后的单拷贝直系同源基因簇多序列;83.冗余序列修剪删除模块,用于对所述对比后的单拷贝直系同源基因簇多序列进行冗余序列修剪删除,以得到目标序列,将物种间的所述目标序列进行串联,基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。84.在一些具体实施例中,所述系统发育进化树可视化模块13,具体可以包括:85.目标进化模型筛选模块,用于从本地预设的所有进化模型中筛选出目标进化模型;86.系统发育进化树构建模块,用于调用所述目标进化模型通过fasttree2,并基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。87.在一些具体实施例中,所述基因家族进化分析结果可视化模块14,具体可以包括:88.物种进化树确定模块,用于基于所述基因数据确定出物种进化树;89.基因家族收缩与扩张分析模块,用于利用所述物种进化树并基于所述直系同源簇分析结果进行基因家族收缩与扩张分析,以得到基因家族进化分析结果。90.在一些具体实施例中,所述共线性分析结果可视化模块15,具体可以包括:91.目标物种基因注释信息确定模块,用于从本地所有的物种基因注释信息中确定出与所述基因数据相对应的目标物种基因注释信息;92.共线性分析操作模块,用于利用mcscanx并基于所述直系同源簇分析结果和所述目标物种基因注释信息进行物种间的共线性分析操作,以得到共线性分析结果。93.图4为本技术实施例提供的一种电子设备的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的由电子设备执行的基因分析结果可视化方法中的相关步骤。94.本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本技术技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。95.另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统221、计算机程序222及数据223等,存储方式可以是短暂存储或者永久存储。96.其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中数据223的运算与处理,其可以是windows、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的基因分析结果可视化方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括基因分析结果可视化设备接收到的由外部设备传输进来的数据,也可以包括由自身输入输出接口25采集到的数据等。97.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或
技术领域:
:内所公知的任意其它形式的存储介质中。98.进一步的,本技术实施例还公开了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的基因分析结果可视化方法步骤。99.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。100.以上对本发明所提供的一种基因分析结果可视化方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。当前第1页12当前第1页12
技术特征:
1.一种基因分析结果可视化方法,其特征在于,应用于orthovenn3,包括:对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。2.根据权利要求1所述的基因分析结果可视化方法,其特征在于,所述对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,包括:对所述基因数据进行blast比对与聚类操作,以得到比对结果,对所述比对结果进行直系同源簇的聚类与鉴定操作,以得到聚类鉴定结果;对所述聚类鉴定结果进行直系同源簇的go功能注释,以得到直系同源簇分析结果。3.根据权利要求1所述的基因分析结果可视化方法,其特征在于,所述基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,包括:基于所述基因数据确定出物种间的单拷贝直系同源基因簇;基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树。4.根据权利要求3所述的基因分析结果可视化方法,其特征在于,所述基于所述直系同源簇分析结果和所述单拷贝直系同源基因簇构建出系统发育进化树,包括:对所述单拷贝直系同源基因簇进行多序列比对,以得到对比后的单拷贝直系同源基因簇多序列;对所述对比后的单拷贝直系同源基因簇多序列进行冗余序列修剪删除,以得到目标序列,将物种间的所述目标序列进行串联,基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。5.根据权利要求4所述的基因分析结果可视化方法,其特征在于,所述基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树,包括:从本地预设的所有进化模型中筛选出目标进化模型;调用所述目标进化模型通过fasttree2,并基于所述直系同源簇分析结果和串联后的所述目标序列构建出系统发育进化树。6.根据权利要求1所述的基因分析结果可视化方法,其特征在于,所述基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,包括:
基于所述基因数据确定出物种进化树;利用所述物种进化树并基于所述直系同源簇分析结果进行基因家族收缩与扩张分析,以得到基因家族进化分析结果。7.根据权利要求1至6任一项所述的基因分析结果可视化方法,其特征在于,所述基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,包括:从本地所有的物种基因注释信息中确定出与所述基因数据相对应的目标物种基因注释信息;利用mcscanx并基于所述直系同源簇分析结果和所述目标物种基因注释信息进行物种间的共线性分析操作,以得到共线性分析结果。8.一种基因分析结果可视化装置,其特征在于,包括:按钮检测模块,用于对本地的各基因分析按钮进行检测;所述基因分析按钮包括直系同源簇分析按钮、系统发育进化分析按钮、基因家族进化分析按钮以及共线性分析按钮;直系同源簇分析结果可视化模块,用于若检测到所述直系同源簇分析按钮被触发,则获取待分析的基因数据,对所述基因数据分别进行局部比对操作和直系同源簇鉴定识别操作,以得到直系同源簇分析结果,对所述直系同源簇分析结果进行可视化;系统发育进化树可视化模块,用于若检测到所述系统发育进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据构建出系统发育进化树,对所述系统发育进化树进行可视化;基因家族进化分析结果可视化模块,用于若检测到所述基因家族进化分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行基因家族进化分析操作,以得到基因家族进化分析结果,对所述基因家族进化分析结果进行可视化;共线性分析结果可视化模块,用于若检测到所述共线性分析按钮被触发,则自动执行直系同源簇分析的流程,并基于所述直系同源簇分析结果和所述基因数据进行物种间的共线性分析操作,以得到共线性分析结果,对所述共线性分析结果进行可视化。9.一种电子设备,其特征在于,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的基因分析结果可视化方法。10.一种计算机可读存储介质,其特征在于,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基因分析结果可视化方法。
技术总结
本申请公开了一种基因分析结果可视化方法、装置、设备及介质,涉及基因组比较和进化分析领域,包括若检测到直系同源簇分析按钮被触发,进行局部比对操作和直系同源簇鉴定识别操作,对直系同源簇分析结果可视化;若检测到系统发育进化分析按钮被触发,自动执行直系同源簇分析流程,构建系统发育进化树,对系统发育进化树可视化;若检测到基因家族进化分析按钮被触发,自动执行直系同源簇分析流程,进行基因家族进化分析操作,对基因家族进化分析结果可视化;若检测到共线性分析按钮被触发,自动执行直系同源簇分析流程,进行物种间共线性分析操作,对共线性分析结果可视化,提高直系同源聚类识别方法准确性,快速理解研究对象之间差异与进化关系。差异与进化关系。差异与进化关系。
技术研发人员:王翊 孙家贺 鲁方 罗永江 别灵子
受保护的技术使用者:西南大学
技术研发日:2023.07.17
技术公布日:2023/9/13
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/