基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统

未命名 08-13 阅读:97 评论:0


1.本公开属于生物信息领域,具体涉及一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统。


背景技术:

2.近年来,恶性肿瘤和癌症的发病率逐年增高,世界卫生组织国际癌症研究机构(iarc)发布的2020年全球最新癌症负担数据显示:2020年全球新发癌症病例1929万例,其中男性1006万例,女性923万例;2020年全球癌症死亡病例996万例,其中男性553万例,女性443万例,恶性肿瘤和癌症已经成为无性别差异、无国界阻隔的全球性健康难题。
3.在2021~2022年间,iarc针对不同类肿瘤陆续发布的世界卫生组织肿瘤分级分类标准(第五版)中,肿瘤基因型的分子诊断标准被正式纳入肿瘤的分级分类标准,肿瘤诊断中分子基因型的诊断在临床发挥越来越重要的作用。
4.目前肿瘤分子基因型的诊断仍需要通过基因测序来进行判断,需要从肿瘤组织中对肿瘤基因组dna提取纯化,之后采用基因测序仪进行分析,不仅仪器设备昂贵,单次采样测量也价格不菲。同时针对不同的检测目标,可能还需要不同类型的组织、血液和体液进行分析。其高昂的成本和复杂的检测流程给临床大规模应用带来了较大的困难。因此,有必要研发一种能够快速、有效地进行肿瘤基因突变点位的分子检测的技术。


技术实现要素:

5.有鉴于此,本公开提供了一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,能够解决肿瘤基因突变点位的分子诊断复杂且价格昂贵的问题。
6.为了解决上述技术问题,本发明是这样实现的:一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,包括:载物台、控温吹扫装置、光谱激发和收集装置、数据库和检测装置;所述控温吹扫装置,用于对置于载玻片上的待测组织样本进行表面控温吹扫,在待测组织样本表面形成胶质固态硬膜;所述载物台,用于放置承载有表面控温吹扫后的待测组织样本的载玻片;所述光谱激发和收集装置,用于产生脉冲激光聚焦照射所述待测组织样本,对准所述待测组织样本产生的等离子体团进行光谱收集,产生待测组织样本的光谱数据,发送给检测装置;所述数据库,用于存储各种已知基因突变类型对应的光谱特征点位和分类模型;所述检测装置,用于根据数据库存储内容,从所述待测组织样本的光谱数据中提取已知基因突变类型对应的光谱特征点位处的光谱强度,将提取的光谱强度输入对应的分类模型,以确定待测组织样本对已知基因突变类型归属情况。
7.较佳地,该系统进一步包括数据库构建装置;该数据库构建装置包括点位获取模块和分类模型训练模块;
所述点位获取模块,用于确定已知基因突变类型的光谱特征点位:获取一已知基因突变类型q的组织样本的光谱数据a,以及一个未发生突变的组织样本的光谱数据o;将光谱数据a与光谱数据o进行逐点位对比,筛选强度差值大于设定阈值的点位,作为评估点位;采用随机森林确定评估点位的重要性权值,按照重要性权值从大到小的顺序选择n个评估点位,组成已知基因突变类型q对应的光谱特征点位,n为大于或等于2的正整数;光谱特征点位对应的光谱强度组成了一组光谱特征;将已知基因突变类型q与对应的光谱特征点位保存到所述数据库;所述分类模型训练模块,用于根据数据库存储的基因突变类型对应的光谱特征点位,从已知属于一基因突变类型的组织样本中,获取光谱特征点位处的光谱强度;利用提取的光谱强度构建训练样本对分类模型进行训练;针对每一种基因突变类型分别训练分类模型,将训练好的分类模型保存到所述数据库。
8.较佳地,所述n个评估点位的确定方式为:采用随机森林中所有树对同一个点位的基尼指数减小值的平均值作为该点位的重要性权值;根据随机森林评估出的点位的重要性权值,采用不同数量的点位进行组合,对点位组合进行识别准确率的预测,准确率最高时的点位组合的点位数量被设定为n。
9.较佳地,所述控温吹扫装置包括温控单元和热风枪;采用控温吹扫的样本制备方式,仅使样本表面硬化,去除液体残留,组织块内部仍然湿润,未受表面处理的影响。
10.较佳地,所述热风枪设置在距离待测组织样本20-25cm距离处,温控单元控制热风枪以400℃的热风均匀吹扫待测组织样本表面5s。
11.较佳地,所述光谱激发和收集装置包括:激光发生系统、聚焦物镜、双透镜系统、光谱仪和光电转换探测器;所述激光发生系统的出射光经所述聚焦物镜聚焦后照射待测组织样本,击穿分子键,产生等离子体;所述双透镜系统设置在待测组织样本上方,以斜45
°
方向对准待测组织样本,对所述待测组织样本产生的等离子体团进行光谱收集,所收集的发光信号通过多模光纤传输至光谱仪;所述光谱仪将发光信号色散为宽带光谱信号,传输至光电转换探测器;所述光电转换探测器将宽带光谱信号转化为电信号的光谱数据,传输至检测装置。
12.较佳地,所述分类模型采用支持向量机svm、最邻近法k-nn、人工神经网络ann、簇类独立软模式simca、随机森林randomforests、脉冲神经网络snn中的一种或任意组合。
13.有益效果:1、本公开基于元素变化能够反应基因变化的关系,而元素变化又能由光谱特征反映的特点,提出了一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测方案,通过对组织样本进行激光照射并检测其等离子体团的光谱特征,能够解决肿瘤基因突变点位的分子诊断复杂且价格昂贵的问题。
14.2、本公开通过数据库构建装置的设置,能够建立宏观光谱特征与微观基因突变间的对应关系,并在长期使用过程中,通过广泛代表性样本累积,将不同基因突变类型所对应的不同光谱特征点位的组合保存于数据库,对相应的分类模型也进行保存选用,在此后试
(nadph),nadph作为体内还原性氢的供体,一方面参与了细胞抵御氧化应激反应,另一方面还参与了不饱和脂肪数的氧化过程。尽管氧化脱羧主要是直接和c、h、o等有机元素相关,但影响了新陈代谢,就会对控制细胞平衡的na、k等元素产生影响。
33.除此之外,尽管目前尚没有从元素角度分析基因突变的先例,但是与基因突变密切相关的肿瘤分级,与元素水平具有很大的相关性。从元素的角度考量,金属元素比有机物主要元素更能反映出标志性特征。除了分子标记物可能造成成分不同外,信号通路也可能会造成组织内不同区域的成分不同。钙池调控通道(store-operated ca
2+
entry,soce)是调节多种癌症类型中细胞内ca
2+
浓度的途径。已经在较多胶质瘤患者中观察到钙释放激活钙通道蛋白1(calciumrelease-activated calcium channel modulator 1,orai1)的表达比非肿瘤组织中更多,这在很大程度上会促使soce调控ca
2+
向胶质瘤中富集。这也可能是部分胶质瘤局部钙化的主要原因之一。此外,(na
+
+k
+
)-atpase作为一种膜结合酶,在跨膜转运钠和钾离子的过程中发挥作用,其在胶质瘤中含量明显极少。
34.因此,本公开基于元素变化能够反应基因变化的关系,而元素变化又能由光谱特征反映的特点,提出了一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测方案。
35.图1为本公开一实施例提供的基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统的组成框图。如图1所示,该检测系统包括载物台、控温吹扫装置、光谱激发和收集装置、数据库、数据库构建装置和检测装置。
36.控温吹扫装置,用于对置于载玻片上的待测组织样本进行表面控温吹扫,在待测组织样本表面形成胶质固态硬膜。在一实施例中,该控温吹扫装置包括温控单元和热风枪(图中未示出)。采用控温吹扫的样本制备方式,仅使样本表面硬化,去除液体残留,组织块内部仍然湿润,未受表面处理的影响。具体来说,热风枪可以设置在距离待测组织样本20-25cm距离处,温控单元控制热风枪以400℃的热风均匀吹扫待测组织样本表面5s,从而在样本表面一薄层形成胶质固态硬膜。该热风吹扫时间可以根据实际样本情况进行调整。
37.本控温吹扫装置的作用是对样本进行硬化处理。本发明采用的基于激光聚焦的libs(激光诱导击穿光谱,laser-induced breakdown spectroscopy)生物组织检测与常规硬质样本检测的最大不同在于样本形态。尤其是离体鲜活组织的检测,由于质地较为柔软,且样本表面存在血液和组织液残留,较为湿润,致使激光能量难以耦合进入组织样本,液体也会吸收热量导致等离子体温度下降,造成光谱信号较弱。且湿润组织表面的液体在激光脉冲激发下容易产生溅射,污染物镜表面。
38.对样本进行硬化处理可以改善光谱信号,目前已经采用的硬化方法主要有石蜡包埋法、冷冻法等。但包埋后样本表面会残留少许的石蜡成分,干扰测量结果,且石蜡包埋往往需要专业的病理科技师进行操作,经过固定、脱水、透明、浸蜡和包埋等五大标准步骤,耗时较长,不能满足快速处理鲜活样本以供后续检测的要求。在冷冻法中,随着激光能量聚焦在样本表面,短短几发脉冲样本表面就会解冻,所以信号增强较弱,参见图2(a)。而本公开所提出的表面控温吹扫的样本制备方法,吹扫结束后,样本表面明显硬化,已无液体残留,但是组织块内部仍然湿润,没有受到表面处理的影响。经过表面控温吹扫后样本光谱信号强度明显上升,背景基线的波动明显减小,参见图2(b)。libs光谱检测主要针对样本表面很薄的一层组织,只要下层组织不在激光作用下产生大的抖动,影响聚焦和信号收集,就无需对完整样本进行处理,经过验证可见表面吹扫处理足够有效。
39.载物台,用于放置承载有表面控温吹扫后的待测组织样本的载玻片。
40.光谱激发和收集装置,用于产生脉冲激光聚焦照射所述待测组织样本,对准所述待测组织样本产生的等离子体团进行光谱收集,产生待测组织样本的光谱数据,发送给检测装置。
41.光谱激发和收集装置具体包括激光发生系统、聚焦物镜、观察系统、双透镜系统、光谱仪和光电转换探测器。光谱激发和收集装置的部分组成部件如图3所示,光谱仪和光电转换探测器并未在图中示出。激光发生系统包括脉冲激光器、指示激光器和能量反馈子系统;脉冲激光器选用nd:yag激光器,用于产生脉冲激光,而由于产生的脉冲激光的波长在红外段,肉眼不可见难于调整光路,因此选用he-ne激光器作为指示激光器,产生一束非脉冲且肉眼可见的稳定指示激光与脉冲激光并行以帮助调整脉冲激光的光路;能量反馈子系统包括:能量计、偏振棱镜和两片半波片hwp;脉冲激光器所发生的脉冲激光经过偏振棱镜和半波片hwp,由能量计实现脉冲激光能量的监控,帮助调节脉冲激光器的输出。
42.激光发生系统的出射脉冲激光经由反射镜反射并通过聚焦物镜聚焦照射待测组织样本,击穿分子键,产生等离子体。双透镜系统设置在待测组织样本上方并设置在聚焦收集镜筒内,以斜45
°
方向对准待测组织样本,对所述待测组织样本产生的等离子体团进行光谱收集,所收集的发光信号通过多模光纤传输至光谱仪。光谱仪将发光信号色散为宽带光谱信号,传输至光电转换探测器;光电转换探测器将宽带光谱信号转化为电信号的光谱数据,传输至检测装置。本实施例中的光谱激发和收集装置还进一步包括观察系统,具体包括cmos相机和调焦镜头,用于实验中实验人员对组织样本的观察。
43.其中,用来聚焦收集等离子体发光的双透镜系统以斜45
°
方向对准待测组织样本,既避免了光路收集与竖直方向的激光产生干扰,也避免了光路收集在水平方向上受样本平面的限制,同时生物组织表面呈弧形,45
°
收集时双透镜系统的光轴与弧形切面近似垂直,最有利于提升光谱信号的强度。
44.数据库,用于存储各种已知基因突变类型对应的光谱特征点位和分类模型。
45.检测装置,用于根据数据库存储内容,从所述待测组织样本的光谱数据中提取已知基因突变类型对应的光谱特征点位处的光谱强度,将提取的光谱强度输入对应的分类模型,以确定待测组织样本属于哪类已知基因突变类型。
46.数据库构建装置,用于确定数据库存储的内容,包括已知基因突变类型对应的光谱特征点位以及建立已知基因突变类型的分类模型。图4示出了数据库构建装置的组成,其包括点位获取模块和分类模型训练模块。其中,点位获取模块,用于确定已知基因突变类型所对应的光谱特征点位。具体为:准备一已知基因突变类型q的组织和一未发生突变的组织,利用控温吹扫装置制备吹扫两个组织样本,使其形成胶质固态硬膜,获得2个组织样本。再利用光谱激发和收集装置从2个组织样本中获取光谱数据,发送给本数据库构建装置。将已知基因突变类型的组织样本的光谱数据定义为光谱数据a,光谱数据a的基因突变类型定义为q,将未发生突变的组织样本的光谱数据定义为光谱数据o。
47.本数据库构建装置中的点位获取模块获取已知基因突变类型q的光谱数据a,以及未发生突变的光谱数据o;将光谱数据a与光谱数据o进行逐点位对比。这里点位是指光谱数据中的波长维度,每个波长取值作为一个点位。然后筛选强度差值大于设定阈值的点位,作
为评估点位。接着,采用随机森林确定评估点位的重要性权值,按照重要性权值从大到小的顺序选择n个评估点位,组成已知基因突变类型q对应的光谱特征点位,n为大于或等于2的正整数;光谱特征点位及其对应的光谱强度组成了一组光谱特征。将已知基因突变类型q与对应的光谱特征点位保存到所述数据库。
48.其中,n的数值可以采用设定的值,或者根据后续使用的识别模型在建模数据集的的识别准确率来确定。后者具体包括如下操作:将已有的已知基因突变类型及其对应的样本光谱数据作为建模数据集,针对此建模数据集通过随机森林选取感兴趣的评估点位并得到各评估点位的重要性权值,根据随机森林评估出的点位重要性权值按从高到低的顺序对评估点位进行排序,依此顺序分别从小到大采用不同数量的评估点位输入分类模型进行识别,以在不同的n可能取值下对建模数据集进行基因突变类型的预测识别,将识别结果与已知基因突变类型进行比对,以该方法对建模数据集进行识别比较,分别计算在选取不同数量的评估点位时的识别结果准确率,并将准确率最高时的点位数量设定为n,此后即采用n个点位来对未知突变的光谱数据进行分析。
49.上文中,采用随机森林确定评估点位的重要性权值的方式为:重要性权值评估依据是随机森林建模过程中,每个点位作为识别依据时,对最终结果的熵下降程度,以基尼指数减小值作表征。点位重要性权值就是随机森林中所有树对同一个点位的光谱特征评估结果(即基尼指数的减小值)的平均值,以此作为这个特征点位的评估权重。在随机森林算法中通常采用基尼指数或袋外数据错误率作为变量重要性的评价指标,一般封装的函数默认使用基尼指数下降值,本发明应用随机森林建模过程中的基尼指数下降值来表征特征重要性。
50.本发明并未采用随机森林进行分类,而是采用随机森林算法的中间量来确定光谱特征点位以及光谱特征点位的数量n。随机森林(randomforests,rf)是由一组决策树分类器组成的集成分类器。它基于分类和回归决策树(classification and regression tree,cart)模型,属于机器学习的一个分支——集成学习(ensemble learning,el)。cart模型是一种树形结构,其中每个内部节点表示对一个属性的测试,每个分支代表一个测试输出,每个叶节点代表一种最终类别。cart假设决策树是二叉树,内部节点特征的取值为“是”和“否”,左分支是取值为“是”的分支,右分支是取值为“否”的分支。这样的决策树等价于递归地二分每个特征,将输入空间即特征空间划分为有限个单元,并在这些单元上确定预测的概率分布,也就是在输入给定的条件下输出的条件概率分布。rf中包含多个cart,每个cart分类器投票确定最终的分类结果。在生成每棵树的过程中,rf通过在某个谱线上的每个样本之间的差异来划分节点。例如,如果有该突变代表性样本和无该突变代表性样本在某条谱线处的强度差异较大且稳定,甚至在极端情况下其中一种样本可能没有这条谱线,那么可以直接区分出两种样本,该节点被划分为叶节点。与神经网络相似,随机森林的输入是几类样本的光谱特征,在这里是对应波长处光谱强度特征,然后经过决策树的划分,将这几类样本分类,实现建模,输出是每个样本的类别标签。在这个分类的过程中,可以推算出每个特征对于最后分类的重要性,然后应用这个重要性对特征进行排序。
51.分类模型训练模块,用于根据数据库存储的基因突变类型对应的光谱特征点位,从已知属于一基因突变类型的组织样本中,获取光谱特征点位处的光谱强度;利用提取的光谱强度构建训练样本对分类模型进行训练;针对每一种基因突变类型分别训练分类模
型,将训练好的分类模型保存到所述数据库。
52.其中,分类模型采用支持向量机svm、最邻近法k-nn、人工神经网络ann、簇类独立软模式simca、随机森林randomforests、脉冲神经网络snn中的任意一种。光谱特征点位处的光谱强度作为分类模型的输入,分类模型的输出为是否属于某一基因突变类型。每个基因突变类型对应一个分类模型,需要分别判断。
53.下面针对本发明基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统的工作过程进行详细描述。
54.步骤1、制备肿瘤组织样本。
55.检测前,组织样本置于-80℃保存,待测前取出,自然消解,置于黏附型玻璃载玻片上,采用控温吹扫装置的400℃热风枪,距离样本25cm远距离,热风均匀吹扫5s,在样本表面一薄层形成胶质固态硬膜,如图5所示。将承载有制备好的组织样本的载玻片放置于载物台上。
56.步骤2、样本光谱激发。
57.本步骤中,在一实施例中,采用nd:yag纳秒脉冲激光器(1064nm,13ns,1hz,45mj),经近红外校正显微物镜聚焦照射胶质固态硬膜表面,导致样本表面微区被烧蚀,激发产生等离子体。
58.步骤3、等离子体光谱收集。
59.在样本上方斜45
°
方向,采用双透镜系统对准等离子体团进行光谱收集,所收集的发光信号通过多模光纤(芯径600μm)传输至光谱仪(分辨率0.2nm),经光谱仪后色散为宽带光谱信号,并传输至作为光电转换探测器的电荷耦合器件探测器(ccd)。
60.步骤4、光谱数据预处理。
61.光谱信号经过光电转换探测器转化为电信号。电信号在被处理前可以采用光谱强度最大值归一化方法进行光谱信号预处理,提升光谱检测稳定度,然后再进行分析。该预处理操作可以设置在光谱激发和收集装置中,也可以设置为一个单独的数据处理模块,或者设置在使用该光谱数据的装置中,例如设置在检测装置中和数据库构建装置中。
62.以上步骤1~4为通用操作,适用于检测过程、光谱特征点位确定过程以及分类模型的训练过程。
63.步骤5、检测样本突变点位。
64.准备2份代表样本。本实施例准备代表样本的过程为:提取样本dna,利用检测基因突变的引物组合物通过多重pcr扩增目标区域,扩增产物构建文库,进行高通量测序,确定基因突变点位,对所选取的两份代表样本分别进行9项检测,检测结果具体如下。
65.表1 代表性样本基因测序检测结果
两份代表性样本的差异为idh1基因是否有r132突变。一份样本为idh1基因有r132突变(即类型q)的样本,另一份为无基因突变的样本。
66.采用步骤1~4的方式对2个代表样本进行处理,获得idh1基因有r132突变的样本的光谱数据a,和无基因突变的样本的光谱数据o。对光谱数据a和光谱数据o进行逐点位光谱强度作差,筛选出差值大于设定阈值的光谱点位作为评估点位。
67.采用随机森林确定评估点位的重要性权值,按照重要性权值从大到小的顺序选择n个评估点位,组成idh1基因r132突变类型对应的光谱特征点位,这一组光谱特征点位最能代表r132突变类型的基因突变,从而将光谱特征与基因突变点位建立对应关系。
68.在一实施例中,通过人工对比可见,代表性样本1表现为766nm、769nm附近的钾元素谱线峰值最高,而代表性样本2表现为588nm、589nm附近的钠元素谱线峰值最高。由此对比可知,钠、钾可能为典型的宏观表征元素谱线。
69.而通过本公开中的点位获取模块,以光谱差值确定了32个大于阈值的点位,并采用随机森林算法对全部32个点位进行评估,树数量10000棵,以所有树对同一个点位的光谱特征评估结果(即基尼指数的减小值)的平均值作为这个特征的评估权重,从而排序。评估结果如图7所示,可以看出最为表征同种肿瘤中该基因突变点位不同的光谱信号也是k、na元素谱线,最为具有差异代表性的8条谱线中有7条来自于k、na,人工对比也印证了该结果的正确性。按照重要性权值从大到小的顺序排列,选择能够与元素相对应的重要性权值最大的7个光谱点位作为光谱特征点位,将这7个光谱特征点位及其对应光谱点位上的光谱强度视为光谱特征与基因突变点位间的对应关系。针对每一种基因突变类型,均需要采用本步骤确定其对应的光谱特征点位,基因突变类型与光谱特征点位的对应关系存储在数据库中。
70.步骤6、分类模型训练。
71.本步骤中,针对某一种已知基因突变类型,假设为基因突变类型x1,获取该类型基
因突变的组织样本,采用步骤1~4的方式制备样本、获取光谱数据。同时对于一些未出现基因突变类型的组织样本获取光谱数据。
72.根据数据库存储的对应关系,获得该基因突变类型x1的光谱特征点位,从光谱数据中获得光谱特征点位处的光谱强度,得到一组光谱特征;将该组光谱特征与已知基因突变类型x1组成训练样本,x1为标签。利用训练样本对分类模型进行训练。
73.具体的分类模型包括但不限于支持向量机(svm)、最邻近法(k-nn)、人工神经网络(ann)、簇类独立软模式(simca)、随机森林(randomforests)、脉冲神经网络(snn)等方法。本实施例中采用svm进行分类。
74.针对每一种已知的基因突变类型分别训练分类模型。本应用实例中仅针对idh1基因的r132突变这一种基因突变进行分析,因此最终输出的判断结果仅分为存在该突变或不存在该突变这两种可能,待测样本最终仅被归为阴性或阳性两类。而当需要同时分析的基因突变点位较多时,可能存在每个基因突变点位均有阴性或阳性而导致多种排列组合的情况,此时不能简单地将待测样本分为有突变或无突变2类去进行识别判断,而需根据实际存在的基因突变排列组合,来确定待测样本的分类个数。
75.步骤7、基因突变检测。
76.在实际进行基因突变检测时,获取待测组织样本,采用步骤1~4的方式进行样本处理、光谱激发、光谱收集、数据处理,从而获得光谱数据。
77.针对每种已知基因突变类型,检测光谱数据是否属于这种突变类型。检测方式是,根据数据库存储的这种基因突变类型的光谱特征点位,从待测组织样本的光谱数据中提取光谱特征点位对应的光谱强度,得到一组光谱特征;将该组光谱特征输入当前基因突变类型对应的分类模型,获得针对当前突变类型的分类结果。该分类结果只是针对当前突变类型的结果,还需要针对每种已知基因突变类型进行相同的操作。以最终确定待测组织样本属于哪种基因突变,或者没有基因突变。
78.本实施例中,根据宏观光谱特征与微观基因突变间的对应关系,从最能代表差异特征的元素线所对应的光谱特征点位开始依次选择,对代表性样本1和代表性样本2的区分效果如图8所示,可见诊断效果极佳,无论n的取值为多少均可实现100%的识别精度。尽管实现了良好的效果,但仅凭单一元素谱线的表征所实现的判断可能存在偶然性,这种由偶然性因素导致的高识别精度可能是由两份同类肿瘤的样本的均匀性或癌细胞含量差异或施用药物等外部因素导致的。
79.因此,为了进一步验证本方法的识别精度潜力,加入代表性样本1、2的同源瘤周样本进行诊断,将对应瘤周与代表性突变样本分别诊断,诊断精度如图8所示。可见仍可实现较好的诊断效果,这进一步验证了本公开所提出的方法初步有效。与已有技术进行对比,对代表性样本1、2,和其对应的同源正常组织的全部光谱特征数据进行主成分分析,采用主成分得分进行二维可视化聚类,如图9(a)和图9(b)所示。可见代表性样本1、2可实现有效区分,而对应同源正常组织无法区分,可见无突变正常组织具有一定的宏观成分相似性,而同种肿瘤的不同突变型具有一定的宏观成分差异性;对比之下本公开所提出的基于随机森林的识别方法较之于主成分分析等识别方法的优势显然,本方法能够以97.06%的准确率识别以主成分分析方法所无法正确区分的代表性样本1、2的同源瘤周样本。
80.本公开能够建立宏观光谱特征与微观基因突变间的对应关系,并在长期使用过程
中,通过广泛代表性样本累积,将不同基因突变类型所对应的不同光谱特征点位的组合保存于数据库,对相应的分类模型也进行保存选用,在此后试验中根据待测样本的光谱特征即能预判其具体基因突变型归属;而且考虑到不同基因突变类型所反映的光谱特征点位不同,因此存储的并不是基因突变类型对应的光谱特征,而是特征点位,在该特征点位上获取光谱强度进行基因突变的判断,更加准确可靠。
81.以上的具体实施例仅描述了本发明的设计原理,该描述中的部件形状,名称可以不同,不受限制。所以,本发明领域的技术人员可以对前述实施例记载的技术方案进行修改或等同替换;而这些修改和替换未脱离本发明创造宗旨和技术方案,均应属于本发明的保护范围。

技术特征:
1.一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,包括:载物台、控温吹扫装置、光谱激发和收集装置、数据库和检测装置;所述控温吹扫装置,用于对置于载玻片上的待测组织样本进行表面控温吹扫,在待测组织样本表面形成胶质固态硬膜;所述载物台,用于放置承载有表面控温吹扫后的待测组织样本的载玻片;所述光谱激发和收集装置,用于产生脉冲激光聚焦照射所述待测组织样本,对准所述待测组织样本产生的等离子体团进行光谱收集,产生待测组织样本的光谱数据,发送给检测装置;所述数据库,用于存储各种已知基因突变类型对应的光谱特征点位和分类模型;所述检测装置,用于根据数据库存储内容,从所述待测组织样本的光谱数据中提取已知基因突变类型对应的光谱特征点位处的光谱强度,将提取的光谱强度输入对应的分类模型,以确定待测组织样本对已知基因突变类型归属情况。2.如权利要求1所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,该系统进一步包括数据库构建装置;该数据库构建装置包括点位获取模块和分类模型训练模块;所述点位获取模块,用于确定已知基因突变类型的光谱特征点位:获取一已知基因突变类型q的组织样本的光谱数据a,以及一个未发生突变的组织样本的光谱数据o;将光谱数据a与光谱数据o进行逐点位对比,筛选强度差值大于设定阈值的点位,作为评估点位;采用随机森林确定评估点位的重要性权值,按照重要性权值从大到小的顺序选择n个评估点位,组成已知基因突变类型q对应的光谱特征点位,n为大于或等于2的正整数;光谱特征点位对应的光谱强度组成了一组光谱特征;将已知基因突变类型q与对应的光谱特征点位保存到所述数据库;所述分类模型训练模块,用于根据数据库存储的基因突变类型对应的光谱特征点位,从已知属于一基因突变类型的组织样本中,获取光谱特征点位处的光谱强度;利用提取的光谱强度构建训练样本对分类模型进行训练;针对每一种基因突变类型分别训练分类模型,将训练好的分类模型保存到所述数据库。3.如权利要求2所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,所述n个评估点位的确定方式为:采用随机森林中所有树对同一个点位的基尼指数减小值的平均值作为该点位的重要性权值;根据随机森林评估出的点位的重要性权值,采用不同数量的点位进行组合,对点位组合进行识别准确率的预测,准确率最高时的点位组合的点位数量被设定为n。4.如权利要求1所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,所述控温吹扫装置包括温控单元和热风枪;采用控温吹扫的样本制备方式,仅使样本表面硬化,去除液体残留,组织块内部仍然湿润,未受表面处理的影响。5.如权利要求4所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,所述热风枪设置在距离待测组织样本20-25cm距离处,温控单元控制热风枪以400℃的热风均匀吹扫待测组织样本表面5s。6.如权利要求1所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,所述光谱激发和收集装置包括:激光发生系统、聚焦物镜、双透镜系统、光
谱仪和光电转换探测器;所述激光发生系统的出射光经所述聚焦物镜聚焦后照射待测组织样本,击穿分子键,产生等离子体;所述双透镜系统设置在待测组织样本上方,以斜45
°
方向对准待测组织样本,对所述待测组织样本产生的等离子体团进行光谱收集,所收集的发光信号通过多模光纤传输至光谱仪;所述光谱仪将发光信号色散为宽带光谱信号,传输至光电转换探测器;所述光电转换探测器将宽带光谱信号转化为电信号的光谱数据,传输至检测装置。7.如权利要求1-6任一项所述的一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,其特征在于,所述分类模型采用支持向量机svm、最邻近法k-nn、人工神经网络ann、簇类独立软模式simca、随机森林random forests、脉冲神经网络snn中的一种或任意组合。

技术总结
本发明公开了一种基于宏观光谱元素成分分析的肿瘤微观基因突变检测系统,属于生物信息领域;包括:载物台、控温吹扫装置、光谱激发和收集装置、数据库和检测装置;控温吹扫装置,用于对置于载玻片上的待测组织样本进行表面控温吹扫,在待测组织样本表面形成胶质固态硬膜;载物台,用于放置承载有表面控温吹扫后的待测组织样本的载玻片;光谱激发和收集装置,用于产生脉冲激光聚焦照射待测组织样本,对准待测组织样本产生的等离子体团进行光谱收集,产生待测组织样本的光谱数据,发送给检测装置;数据库,用于存储各种已知基因突变类型对应的光谱特征点位和分类模型;使用本发明能够解决肿瘤基因突变点位的分子诊断复杂且价格昂贵的问题。昂贵的问题。昂贵的问题。


技术研发人员:腾格尔 王茜蒨 郝群 杨海峰 彭中
受保护的技术使用者:重庆大学附属肿瘤医院
技术研发日:2023.07.04
技术公布日:2023/8/9
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐