一种基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法与流程
未命名
08-23
阅读:331
评论:0
1.本发明涉及生物信息技术领域,尤其涉及一种基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法。
背景技术:
2.外泌体是由细胞分泌的包含复杂遗传信息和蛋白质的囊泡,多种细胞可以分泌外泌体,其多来源于细胞内溶酶体微粒内陷形成的多囊泡体,经多囊泡体外膜与细胞膜融合后释放到胞外基质中。外泌体是介导细胞间通讯的重要方式之一,其可以通过多种方式由外泌体供体细胞产生,被外泌体受体细胞接受,进而进行细胞间信号的传导。
3.现有技术中存在对细胞外泌体通讯相关的研究,例如有研究从肿瘤细胞的单细胞测序数据,推测肿瘤细胞和少突胶质细胞间可能存在外泌体通讯;有研究从组织外泌体数据中确定关键蛋白质,之后结合单细胞数据推测该外泌体的来源细胞;有研究通过单细胞测序发现肿瘤细胞和成纤维细胞间存在配受体通讯,进而通过体外实验确定了这两者间还存在外泌体通讯,但是这些方法存在有分析方法简单,结果单一的问题,难以全面地分析微环境中不同细胞亚群间的外泌体通讯信息。
技术实现要素:
4.为了解决现有技术存在的技术问题,本发明提供一种检测细胞外囊泡通讯的方法。
5.本发明提出了一种基于单细胞转录组与组织外泌体多组学数据分析细胞亚群间的外泌体通讯信息的完整方案,可以更加准确、全面地分析组织间的细胞通讯情况。本发明提供的方法非常适用于同一个样本匹配的单细胞转录组数据和外泌体组学数据联合分析,但不限于同一个样本,单细胞数据和外泌体数据来源组织类型匹配即可。
6.第一方面,本发明提供一种基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法,包括:获取待测样品的单细胞转录组数据和外泌体组学数据;根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群;进一步结合所述外泌体组学数据进行细胞外泌体通讯分析;所述外泌体组学数据包括如下中的至少一种:外泌体的mirna组学数据、外泌体的mrna组学数据、外泌体的lncrna组学数据或外泌体的蛋白组学数据。
7.在本发明的一些实施方式中,所述外泌体组学数据包括外泌体的mirna组学数据、外泌体的mrna组学数据、外泌体的lncrna组学数据或外泌体的蛋白组学数据中的任意一种;或是包括其中两种;或是包括其中三种;或是包括其中四种。
8.单细胞转录组数据可以通过现有成熟的单细胞转录组测序手段检测得到,得到的
信息包括有细胞的类型、其含有的基因以及基因的表达水平等基本信息,并且基于这些信息分析得到各细胞亚群的高表达基因,不同细胞亚群间的组间差异表达基因以及marker基因在不同细胞亚群的表达情况的内容。
9.外泌体组学数据可以通过现有成熟的外泌体组学分析手段检测得到,其包含有外泌体中存在的mrna、lncrna、mirna或蛋白以及其相应的表达水平的信息,并且基于这些信息可以进一步分析得到高表达或差异表达的蛋白或核酸分子等内容。
10.以上所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程中,采用的指标包括:各细胞亚群的高表达基因、组间差异表达基因、marker基因或特异性模块中的一种或多种。
11.以上所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程中,采用的依据包括如下任意一种或多种:i)将所述待测样品中各细胞亚群的高表达基因,和/或,不同细胞亚群间的组间差异表达基因,和公共外泌体数据库中ev基因进行比对,推断重叠数量较多的细胞亚群可能参与外泌体通讯;ii)将所述待测样品中各细胞亚群的高表达基因进行比对,推断两两细胞间重叠基因数量较多且重叠基因参与了外泌体相关的功能通路的细胞亚群之间可能存在外泌体通讯;iii)查看已知细胞类型的marker基因在各细胞亚群中的表达情况,推断存在异位表达的marker基因对应的细胞亚群参与外泌体通讯;iv)对各细胞亚群的特异性模块进行功能富集功能分析,推断和生成外泌体的生物过程相关的细胞亚群可能参与外泌体通讯。
12.在本发明的一个实施方式中,所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程包括:1、查看各细胞亚群的高表达基因/细胞亚群组间差异表达基因与公共外泌体数据库exocarta和vesiclepedia中top 100 ev proteins对应基因的交集,根据交叠蛋白个数的多少,初步推测该细胞亚群是否释放蛋白ev分子参与微环境中进行外泌体通讯。
13.2、查看每两两细胞亚群高表达基因间的overlap基因个数,可进一步提示哪些细胞亚群间可能存在ev通讯,导致二者间显著高表达基因出现很多重叠。并对overlap重叠基因进行功能富集分析,查看重叠基因是否与外泌体的生成等生物过程相关,进一步从侧面验证亚群间可能存在的外泌体通讯。
14.3、使用已知细胞类型的marker基因(marker基因一般具有亚群特异性,只在一种细胞类型中表达),查看其在不同的细胞亚群中是否存在异位表达,如果已知细胞类型a的marker基因在细胞亚群b中高表达(a与b非同种细胞类型),则推测细胞类型a的marker基因可能由外泌体ev传递到了细胞亚群b,细胞之间通讯的ev传递了这部分marker,导致细胞亚群b中高表达了细胞类型a的marker基因。
15.4、使用monocle3软件鉴定细胞亚群特异性模块,并对模块进行功能富集分析,如亚群特异性模块与外泌体的生成等生物过程相关,则推测此细胞亚群可能为外泌体供体或受体细胞亚群。
16.基于以上几点内容,可以挑选出候选的外泌体供体或受体细胞亚群,但是这部分内容因没有结合组织外泌体测序数据,故而这些推测出来的分子可能并不能被分泌到外泌体中。需要后续的组织外泌体测序数据的联合分析。
17.以上所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程中可以采用一种或多种指标进行存在外泌体通讯的细胞亚群的初步判断。
18.以上所述的外泌体的mrna组学数据包括如下中的一种或多种:外泌体中高表达的mrna evs分子、外泌体bulk转录组数据、外泌体差异上调mrna evs分子或外泌体差异上调ev分子。
19.以上所述的细胞外泌体通讯分析的过程中,所述外泌体中高表达的mrna evs分子用于和已知细胞类型cell marker基因进行比对,将重叠的cell marker基因进一步和其对应的细胞亚群的单细胞转录组数据进行比对,推断比对结果中表达水平上升的cell marker基因对应的细胞亚群可能为外泌体供体细胞亚群;和/或,所述外泌体bulk转录组数据用于:采用反卷积方法进行处理,结合单细胞转录组数据构造的signature matrix,推断主要细胞亚群,筛选外泌体供体细胞亚群;和/或,所述外泌体差异上调mrna evs分子用于和各细胞亚群高表达基因间的overlap基因进行比对,推断比对结果中存在重叠的细胞亚群可能为外泌体供体细胞亚群;和/或,所述外泌体差异上调ev分子用于和各细胞亚群组间差异上调基因的overlap进行比对,推断比对结果中存在重叠的细胞亚群可能为外泌体供体细胞亚群。
20.在本发明的一个实施方式中,所述的细胞外泌体通讯分析基于单细胞转录组数据和外泌体的mrna组学数据,分析流程包括:1、查看外泌体数据中高表达的mrna evs分子与已知细胞类型cell marker基因的交集,分析主要是哪些已知细胞类型可能分泌了mrna evs分子,并且查看这些已知细胞类型的cell marker是否在单细胞数据中对应的细胞亚群中也特异性高表达,如果是,则可推断已知细胞类型亚群为外泌体供体细胞亚群,向组织微环境中分泌的ev传递了这些高表达的mrna evs分子。
21.2、使用单细胞数据构造signature matrix,然后再用反卷积方法cibersort对外泌体bulk转录组数据进行反卷积分析,推测样本中的主要细胞亚群,统计组织细胞间隙外泌体主要由哪些细胞类型分泌,筛选候选外泌体供体细胞亚群。
22.3、查看外泌体差异上调mrna ev分子,与各细胞亚群高表达基因overlap交集,推断哪些细胞亚群在样本某一表型如癌症样本中可能为外泌体供体细胞亚群。这是由于细胞亚群中mrna ev分子表达越高,越有可能向组织间隙分泌的外泌体的中包含这些mrna ev分子。
23.4、查看组织外泌体差异上调mrna ev分子,与各细胞亚群组间差异上调基因overlap交集,推断哪些细胞亚群在样本某一表型如癌症样本中存在ev通讯,且ev间传递了这些overlap的基因。
24.5、查看2.3中的异位表达marker基因是否为组织外泌体差异上调基因,如果是则可确定2.3中推断的细胞亚群间传递的mrna ev分子是真的被组织微环境中的细胞分泌到了ev中。
25.以上所述的外泌体的lncrna组学数据包括如下任意一种或多种:外泌体中差异上调ev lncrna的靶基因、外泌体中存在cerna的ev lncrna。
26.以上所述的细胞外泌体通讯分析的过程中,所述外泌体中差异上调ev lncrna的靶基因用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群;和/或,所述外泌体中存在cerna的ev lncrna用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群。
27.在本发明的一个实施方式中,所述的细胞外泌体通讯分析基于单细胞转录组数据和外泌体的lncrna组学数据,分析流程包括:1、查看组织外泌体差异上调ev lncrna的靶基因与单细胞亚群组间差异基因异交集,各单细胞亚群中选取差异ev lncrna-靶基因对数量最多的细胞亚群为候选外泌体受体细胞亚群;这是由于外泌体ev lncrna通过ev传递到某一细胞亚群后,可以调控其靶基因的表达。
28.2、筛选外泌体差异cerna与各单细胞亚群组间差异基因交集,不同细胞亚群中选取差异cerna对最多的细胞亚群为候选ev通讯受体细胞亚群。这是由于lncrna可作为cerna,与mirna结合,从而影响mirna所调控的基因mrna表达,即lncrna与mrna可互为cerna,二者间表达正相关。举例而言,相关性计算采用:pearson 相关,显著相关筛选阈值为:cor》0.3且pvalue《0.05。
29.以上所述的外泌体的mirna组学数据包括如下任意一种或多种:外泌体中差异上调的ev mirna、外泌体中存在cerna的ev mirna。
30.以上所述的细胞外泌体通讯分析的过程中,所述外泌体中差异上调的ev mirna用于结合其靶基因在各单细胞亚群中的表达水平进行筛选,当其靶基因在单细胞亚群组间差异下调,则推导该ev mirna的来源细胞亚群为外泌体供体细胞亚群,该ev mirna的受体细胞为外泌体受体细胞亚群;和/或,所述外泌体中存在cerna的ev mirna用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群。
31.在本发明的一个实施方式中,所述的细胞外泌体通讯分析基于单细胞转录组数据和外泌体的mirna组学数据,分析流程包括:1、筛选组织外泌体中显著差异上调的ev mirna,且其靶基因表达在单细胞亚群组间差异下调的mirna分子,确定该ev mirna的来源细胞为候选外泌体供体细胞,其受体细胞为候选外泌体受体细胞。这是由于如果ev传递的分子为mirna,mirna一般负向调控靶mrna表达,一般其来源细胞和受体细胞中该mirna的表达比较高,其靶基因的表达一般比较低。
32.2、筛选组织外泌体差异ev mirna与单细胞亚群中scmrna的靶向关系对,组织外泌体差异ev mirna与单细胞亚群中sclncrna的靶向关系对,以及单细胞亚群中scmrna与sclncrna共表达的cerna对,cerna对越多的细胞亚群可为候选外泌体受体细胞亚群。这是由于mirna也可能通过cerna的方式发挥功能,mirna可以通过结合mrna导致基因沉默,lncrna即可作为cerna,与mirna结合,从而影响mirna所调控的基因mrna表达,即lncrna与mrna可互为cerna,二者间表达正相关。
33.以上所述的外泌体的蛋白组学数据包括如下任意一种或多种:
外泌体中的高表达evs分子、外泌体中的组间差异evs分子、细胞亚群分泌蛋白分子的能力、外泌体中的差异上调ev蛋白、外泌体中转录因子和其靶基因的表达水平、外泌体中蛋白调控的通路。
34.以上所述的细胞外泌体通讯分析的过程中,所述外泌体中的高表达evs分子和外泌体中的组间差异evs分子用于和各细胞亚群分泌的配体进行比对,推断比对结果中出现重叠的细胞亚群为外泌体供体细胞亚群,表达该配体对应受体的细胞亚群为外泌体受体细胞亚群;和/或,所述细胞亚群分泌蛋白分子的能力用于筛选外泌体供体细胞亚群,分泌蛋白分子的能力越强的细胞亚群,作为外泌体供体细胞亚群的可能性越高;和/或,所述外泌体中的差异上调ev蛋白用于和各单细胞亚群组间差异上调基因进行比对,推断出现重叠的单细胞亚群为外泌体供体细胞亚群;和/或,所述外泌体中转录因子和其靶基因的表达水平用于相互对比,推断若转录因子和其靶基因的表达水平相关,该转录因子对应的细胞亚群为外泌体供体细胞亚群,其靶基因对应的细胞亚群为外泌体受体细胞亚群;和/或,所述外泌体中蛋白调控的通路用于和各细胞亚群富集的通路进行比对;推断重叠数量较多的细胞亚群为外泌体受体细胞亚群。
35.在本发明的一个实施方式中,所述的细胞外泌体通讯分析基于单细胞转录组数据和外泌体的蛋白质组学数据,分析流程包括:1、对单细胞数据使用cellchat软件进行细胞通讯分析,然后查看哪些细胞亚群分泌的配体为外泌体蛋白组学数据中的高表达ev蛋白分子或是组间差异ev蛋白分子,那么可能存在此配受体介导的受体细胞摄取外泌体,从而推测细胞亚群间是否有可能通过外泌体来进行通讯,表达该配体的细胞亚群可能是供体细胞,而表达该配体对应受体的细胞亚群可能是受体细胞。
36.2、基于单细胞数据与组织外泌体蛋白数据,计算每个样本或每组样本中每个细胞亚群的占比以及每个细胞亚群分泌外泌体蛋白分子的能力,从而对组织外泌体进行细胞亚群溯源分析。细胞亚群分泌外泌体蛋白分子的能力越强,越有可能为外泌体供体细胞亚群。
37.3、基于组织外泌体差异上调ev蛋白与各单细胞亚群组间差异上调基因的交集,根据交集基因个数,这些外泌体中显著上调的外泌体蛋白可能来自于某个单细胞亚群中显著上调的该蛋白对应的基因,因此可以推测为外泌体蛋白的来源细胞亚群,也就是外泌体供体细胞亚群。
38.4、如果某细胞亚群的转录因子的靶基因表达与该外泌体转录因子表达显著相关,可以推测该外泌体转录因子调控了此细胞亚群中其靶基因的表达,这个细胞亚群是潜在的外泌体受体细胞亚群,而表达外泌体转录因子基因且在组间显著差异的细胞亚群则可能为供体细胞亚群。
39.5、若组织外泌体蛋白调控的通路与某个细胞亚群中显著富集的通路一致,或是通路交集数量较多,则推测外泌体蛋白可能作用于该细胞亚群,该细胞亚群为候选外泌体受体细胞亚群。这是由于外泌体蛋白作用到受体细胞亚群后不会上调该受体细胞亚群中对应蛋白的基因的表达,但是该外泌体蛋白在受体细胞亚群中会调控与之存在互作的蛋白或其所在的通路的激活或抑制情况。
40.本发明的有益效果至少包括如下:本发明提供的基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法可以准确、全面地分析组织内细胞间可能存在的外泌体通讯、参与外泌体通讯的相关分子,以及这些相关分子的具体功能,并且基于这些信息构建相应的细胞亚群互作图谱,这对于细胞间外泌体通讯的研究具有重要意义。
附图说明
41.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1是本发明实施例1提供的单细胞亚群高表达基因与外泌体数据库的交集情况示意图;其中,endothelial是内皮细胞;pericytes是周细胞;tc,tumor cell是肿瘤细胞;monocyte是单核细胞;cafs,cancer-associated fibroblasts是癌症相关成纤维细胞;myofbs,myofibroblasts是肌成纤维细胞;t cells是t淋巴细胞;ent.prog是肠祖细胞,enterocytes是肠细胞;stem是干细胞;fbs,fibroblasts是成纤维细胞;glia,glial cell是神经胶质细胞;mast是肥大细胞;b cells是b细胞;goblet,goblet cell是杯状细胞;tuft是肠上皮细胞;plasma是浆细胞。
43.图2是本发明实施例1提供的蛋白质分泌能力检测结果示意图。
44.图3是本发明实施例2提供的每个组别ev-mrna和该组别的单细胞数据或各cluster基因表达的相关性分析结果示意图;其中g1为正常组织n,g2为肿瘤组织t。
45.图4是本发明实施例2提供的单细胞亚群高表达基因与外泌体数据库的交集情况示意图;其中tumor_cell是肿瘤细胞;endo,endothelial cells是内皮细胞;mac,macrophages是巨噬细胞;nk_t,natural killer cell and t cell是nk细胞和t细胞;fib,fibroblast是成纤维细胞;mono,monocyte是单核细胞;mast,mast cells是肥大细胞;dc,dentritic cell是树突状细胞;epi,epithelial cells是上皮细胞;b是b细胞;plasma,plasma cell是浆细胞。
46.图5是本发明实施例2提供的细胞亚群高表达基因交集分析结果示意图。
47.图6是本发明实施例2提供的外泌体相关功能的go数据库通路中亚群高表达基因交集个数与此交集个数的比值。
48.图7是本发明实施例2提供的各细胞类型marker基因在各cluster的差异表达情况分析,以及与组织外泌体差异分子的overlap分析结果示意图。
49.图8是本发明实施例2提供的不同细胞亚群间的配受体对通讯示意图。
50.图9是本发明实施例2提供的外泌体组间差异上调ev分子与细胞亚群高表达基因交集情况示意图。
51.图10是本发明实施例3提供的单细胞亚群高表达基因与外泌体数据库中top 100 ev proteins对应的基因的交集示意图;其中cycling_t_cell是循环t细胞;dc,dentritic cell是树突状细胞;mac,macrophages是巨噬细胞;nkt,natural killer t cell是自然杀伤t细胞;platelet是血小板;monocyte是单核细胞;nk,natural killer cell是自然杀伤
cells(t细胞)(29个蛋白)的交集蛋白数量较多,因此推测这几个细胞亚群为主要外泌体供体。
60.4、结合scrna-seq与组织外泌体蛋白数据对细胞cluster分泌蛋白能力进行分析,得到如图2所示的结果,可以得出结果:cafs,endothelial, fbs, mast, monocyte,pericytes,tc可能作为主要的外泌体供体细胞亚群。
61.5、结合单细胞cellchat细胞通讯与组织外泌体蛋白数据进行了进一步分析,筛选到了tc亚群与monocyte(5对),cafs(4对),pericytes(4对),fbs(3对),endothelial(2对),plasma(2对),b cells(1对),mast(1对),t cells(1对)存在配体受体对通讯,其中配体蛋白在组织外泌体数据中显著差异表达,推测这几对细胞可能存在外泌体通讯。
62.6、结合组织外泌体差异上调ev蛋白与各单细胞亚群组间差异上调基因的交集分析,tc亚群显著上调基因与癌组织外泌体中显著上调的蛋白取交集,得到如下表所示结果。其中,相对于正常样本,dpep1在癌症样本的组织外泌体数据中显著上调,单细胞数据tc亚群中同样显著上调。此外,dpep1也在肿瘤干细胞亚群中显著上调。
63.表2 tc亚群显著上调基因与癌组织外泌体中显著上调的蛋白取交集后结果
64.注:evs_开头的为组织外泌体蛋白 tumor肿瘤 vs normal癌旁正常样本差异表达分析结果;evs_gene:基因symbol;evs_pvalue:组织外泌体差异分析pvalue值;evs_log2fc:组织外泌体差异分析log2fc值;evs_regulated:组织外泌体差异分析上下调方向;scrna_开头为单细胞数据不同细胞亚群组间比较(g2肿瘤 vs g1癌旁正常样本)差异表达分析结果;scrna_p_val:单细胞数据细胞亚群组间差异分析pvalue值;scrna_avg_log2fc:单细胞数据细胞亚群组间差异分析log2fc值;scrna_pct.1:单细胞数据基因在g2肿瘤样本中表达比例;scrna_pct.2:单细胞数据基因在g1正常样本中表达比例;scrna_p_val_adj:单细胞数据细胞亚群组间差异分析矫正后的pvalue值;scrna_group:单细胞数据差异分组;
scrna_regulated:单细胞数据细胞亚群组间差异分析上下调方向。
65.基于以上结果,本发明提出基本假设:结直肠癌肿瘤细胞来源外泌体dpep1可以促进肿瘤干细胞增殖、侵袭等促进结直肠癌进展或耐药,与目前的研究结果一致,文献支持数据如下:文献调研发现dpep1是一个具有二肽酶活性的酶,研究报道在结直肠癌crc系difi的sev中发现的最丰富的蛋白质是dpep1,并被鉴定为crc的潜在生物标志物,其已被证明在增殖、侵袭、转移和耐药性中发挥作用。在大多数crc中观察到dpep1染色,dpep1的弥漫性细胞质染色与较差的无进展和总生存率有关。与健康对照组相比,crc患者血浆中dpep1阳性evs和dpep1/ceacam5双阳性、流式分选evs增加(参考如下:https://evcna.com/article/view/5721)另外也可参考下列文献:(1)dpep1 promotes the proliferation of colon cancer cells via the dpep1/myc feedback loop regulation。(2)dpep1,expressed in the erly stages of colon carcinogenesis,affects cancer cell invasiveness。(3)dehydropeptidase 1 promotes metastasis through regulation of e-cdherin expression in colon cancer。(4)dpep1 promotes drug resistance in colon caner cells by forming a positive feedback loop with ascl2。
66.这一结果表明了本实施例体用的分析方法具备较高的准确性。
67.实施例2
68.本实施例提供一种基于单细胞测序结果和组织外泌体mrna、lncrna和mirna的ev通讯信息检测细胞外囊泡通讯的方法,具体流程如下:1、样本来源取6例肝癌样本,制备得到单细胞悬液和细胞上清。
69.2、数据处理采用步骤1得到的单细胞悬液进行单细胞测序,细胞上清进行组织外泌体mrna/lncrna测序和mirna测序,具体样本表格如下表所示:表3 单细胞测序和组织外泌体mrna/lncrna、mirna测序记录表格示例
70.注:scrna_id:单细胞数据分析时使用名;evsmrna/lncrna_id:组织外泌体mrna/lncrna组学分析使用名;evsmirna_id: 组织外泌体mirna组学分析使用名;group_information:样本分组信息,g1为正常样本,g2为肿瘤样本。
71.3、根据每个组别ev-mrna和该组别的单细胞数据或各cluster基因表达进行相关性分析,得到如图3所示结果,初步推测肿瘤样本组织外泌体中来源于tumor_cell肿瘤细胞
和fib成纤维细胞、endo内皮细胞的外泌体更多一些。
72.4、根据单细胞亚群高表达基因与外泌体数据库exocarta和vesiclepedia中top 100 ev proteins对应的基因进行比对,统计交集数量,得到如图4所示的结果,可以看出tumor_cell肿瘤细胞(32个基因), endo内皮细胞(28个基因),mac巨噬细胞(20个基因),nk_t自然杀伤细胞与t细胞(17个基因),fib成纤维细胞(16个基因)交集基因数量较多,可以推测这几个细胞亚群为主要的外泌体供体细胞。
73.5、本实施例进一步通过细胞亚群高表达基因交集分析得到了如图5和图6所示的结果,筛选重叠比例比较高的cluster对。这可进一步提示哪些cluster间可能存在ev通讯,导致二者间显著上调基因出现很多重叠:tumor_cell与endo(交集基因363个),fib(交集基因366个)存在较多的亚群高表达基因交集,更多地发生互作,且这些交集基因的功能富集分析显示与receptor mediated endocytosis, endocytic vesicle和endosome transport via multivesicular body sorting pathway等外泌体的相关功能显著相关。
74.6、基于已知各细胞类型marker基因,提取本项目对应细胞类型的已知marker基因在各cluster表达情况,统计2个异位cluster间有多少个已知cellmarker基因存在异位表达作为打分,打分越高的2个cluster越有可能存在细胞间ev通讯,并结合后面组织外泌体差异分子与已知细胞类型marker基因overlap分析,得到如图7所示的结果,初步推测tumor_cell或epi可能与mac、endo间存在ev通讯,尤其是endo。
75.7、本实施例进一步通过单细胞数据的cellchat细胞通讯分析得到如图8所示的结果,结果显示tumor_cell分别与mac(42对),endo(34对),fib(22对),nk_t(22对)存在较多的配受体对通讯。
76.8、本实施例进一步通过组间所有差异上调ev mrna分子,与各cluster高表达基因overlap交集得到如图9所示的结果,结果显示外泌体组间差异上调ev分子与细胞亚群高表达基因交集中,tumor_cell分别与fib(165), endo(112), mac(50)存在大量交集,更多地释放外泌体到微环境中。
77.综上,这些结果表明更应该聚焦于肿瘤细胞与成纤维细胞或内皮细胞或巨噬细胞间的ev通讯机制。
78.9、结果一已有研究发现,通过多组学分析,spp1被确定为预测hcc患者的不良生存结果,并且通过scrna-seq中的受体-配体对分析,基于spp1-cd44和spp1-ptger4结合,spp1显示为介导hcc细胞和巨噬细胞之间的通讯。此外,spp1已被证明在体外促进巨噬细胞向tam2的极化。然而,spp1介导hcc细胞和巨噬细胞之间串扰的分子机制需要在体内实验和临床试验中进一步验证。参考文献“construction of tme and identification of crosstalk between malignant cells and macrophages by spp1 in hepatocellular carcinoma”。
79.本发明发现单细胞数据中的肿瘤细胞和巨噬细胞在肿瘤样本组织中均显著上调spp1表达,且肿瘤组织外泌体中spp1表达也显著上调(如下表),因此推测肿瘤细胞释放外泌体spp1作用于巨噬细胞促进其向肿瘤相关巨噬细胞tam2极化参与icc发生/进展,与上述参考文献结果一致。
80.表4 spp1的组织外泌体mrna和单细胞数据差异分析结果
81.注:evs_开头的为组织外泌体mrna g2肿瘤 vs g1癌旁正常样本 差异表达分析结果;evs_symbol:基因symbol;evs_pvalue:组织外泌体差异分析pvalue值;evs_log2fc:组织外泌体差异分析log2fc值;evs_regulated:组织外泌体差异分析上下调方向;scrna_开头为单细胞数据不同细胞亚群组间比较(g2肿瘤 vs g1癌旁正常样本)差异表达分析结果;scrna_p_val:单细胞数据细胞亚群组间差异分析pvalue值;scrna_avg_log2fc:单细胞数据细胞亚群组间差异分析log2fc值;scrna_pct.1:单细胞数据基因在g2肿瘤样本中表达比例;scrna_pct.2:单细胞数据基因在g1正常样本中表达比例;scrna_p_val_adj:单细胞数据细胞亚群组间差异分析矫正后的pvalue值;scrna_group:单细胞数据差异分组;scrna_regulated:单细胞数据细胞亚群组间差异分析上下调方向。
82.10、结果二已有研究发现,hdac6的恢复引起let-7i-5p的抑制以去抑制tsp1的表达;因此,它占据了cd47受体来阻断cd47-sirpα介导的hcc巨噬细胞的抗吞噬作用。hdac6-let-7i-5p-tsp1调控通路通过与hcc和肿瘤微环境的邻近细胞中的细胞表面受体cd47相互作用,抑制hcc的肿瘤和抗吞噬细胞行为,为治疗肝脏恶性肿瘤和转移提供了治疗靶点。参考文献“hdac6 suppresses let-7i-5p to elicit tsp1/cd47-mediated anti-tumorigenesis and phagocytosis of hepatocellular carcinoma”,“non-coding rna derived from extracellular vesicles in cancer immune escape: biological functions and potential clinical applications”。
83.本研究中发现肿瘤组织外泌体中高表达的hsa-let-7i-5p可能通过靶向巨噬细胞中显著差异表达的2个预测靶基因以及已经报道的thbs1即tsp1,本研究中thbs1在2组间的巨噬细胞中显著差异下调(如下表),从而参与肝癌发生发展。通过前面的分析表明肿瘤组织外泌体更多地释放于肿瘤细胞。说明本联合分析可以比较可靠地发现组织微环境中的细胞亚群间ev通讯机制。
84.表5 hsa-let-7i-5p的组织外泌体mrna和单细胞数据差异分析结果
85.注:evs_开头的为组织外泌体mirna g2肿瘤 vs g1癌旁正常样本差异表达分析结果;evs_demirnaid:mirna id;evs_pvalue:组织外泌体差异分析pvalue值;evs_log2fc:组织外泌体差异分析log2fc值;evs_regulated:组织外泌体差异分析上下调方向;scrna_开头为单细胞数据不同细胞亚群组间比较(g2肿瘤 vs g1癌旁正常样本)差异表达分析结果;scrna_target: mirna的靶基因,在单细胞数据中的表达情况;scrna_p_val:单细胞数据细胞亚群组间差异分析pvalue值;scrna_avg_log2fc:单细胞数据细胞亚群组间差异分析log2fc值;scrna_pct.1:单细胞数据基因在g2肿瘤样本中表达比例;scrna_pct.2:单细胞数据基因在g1正常样本中表达比例;scrna_p_val_adj:单细胞数据细胞亚群组间差异分析矫正后的pvalue值;scrna_group:单细胞数据差异分组;scrna_regulated:单细胞数据细胞亚群组间差异分析上下调方向。
86.根据如上的联合分析结果,可以看出本实施例所用的分析方法具备较高的准确性。
87.实施例3
88.本实施例提供一种基于单细胞测序结果和体液pbmc外泌体mirna的ev通讯信息检测细胞外囊泡通讯的方法,具体流程如下:1、样本来源单细胞数据来自公共数据库,样本为体液类型的细胞外周血单个核细胞(pbmc),数据编号分别为gse168522(包括4例阿尔兹海默症患者样本,2例健康人对照),gse181279(1例阿尔兹海默症患者样本),cnp0001102(cngbdb数据库,3例健康人对照)。
89.pbmc体液外泌体mirna测序数据来自gse155700,包括5例阿尔兹海默症患者样本,5例健康人对照。
90.2、数据处理采用步骤1得到的单细胞数据进行数据预处理,样本整合,去批次以及细胞类型注释分析,差异表达分析。体液外泌体mirna测序数据进行差异表达分析,然后对单细胞数据与体液外泌体mirna测序数据进行联合分析。具体样本表格如下表所示:表6 单细胞测序和体液外泌体mirna测序记录表格示例
91.注:scrna_id:单细胞数据分析时使用名;evsmirna_id:体液外泌体mirna组学分析使用名;group_information:样本分组信息,ad为阿尔兹海默症患者组,ctrl为正常对照组。
92.体液联合分析的背景:阿尔兹海默病ad的病灶组织在脑组织,不在外周血,但有研究发现外周免疫系统可能影响中枢神经系统的病理进程。因此,对于ad的外周血pbmc单细胞转录组和血浆外泌体的联合分析,仅需要确定哪些外周血免疫细胞可能影响ad发生进展,以及哪些外周血免疫细胞来源的外泌体及其携带分子可能作用于ad脑组织中的受体细胞,虽然缺少ad脑组织单细胞转录组数据,无法推测外泌体作用于哪个ad脑组织中的受体细胞,但如果这些外周免疫细胞间存在外泌体通讯的可能,则也可推测外周血中外泌体的受体细胞。
93.3、根据单细胞数据分析结果显示,各细胞比例:cycling t细胞、巨噬细胞、单核细胞、nk细胞、浆细胞比例均在ad组中比例上升,见下表。
94.表7 不同分组中的细胞亚群占比
95.4、根据单细胞亚群高表达基因与外泌体数据库exocarta和vesiclepedia中top 100 ev proteins对应的基因的交集数量,初步推测该细胞亚群是否释放蛋白ev分子参与微环境中ev通讯,得到如图10所示的结果,初步推测cycling t细胞(36个)和dc树突状细胞(22个)、macro巨噬细胞(21个)交集基因较多,可以推测这几个细胞亚群为主要的外泌体供
体细胞。
96.5、本实施例进一步通过细胞亚群高表达基因交集分析得到了如图11所示的结果,初步推测cycling t细胞分别和浆细胞样树突状细胞(pdc,交集基因245个)、树突状细胞dc(交集基因215个)、巨噬细胞macro(交集基因183个)等间可能存在互作。其中与dc细胞的交集基因显著富集到的与外泌体相关的功能:clathrin coated pit,late endosome to vacuole transport via multivesicular body sorting pathway。
97.6、本实施例进一步通过单细胞数据的cellchat细胞通讯分析得到如图12所示的结果,初步推测cycling t细胞分别和浆细胞样树突状细胞(pdc,19对)、树突状细胞(dc、22对)、巨噬细胞(macro,18对)、自然杀伤细胞(nk,13对)等间存在较多配受体互作,具体的配体受体对结果见下表。
98.表8 cycling t细胞的配体受体对结果
99.注:source:来源细胞;target:受体细胞;ligand:配体基因名;receptor:受体基因名;prob:配受体互作概率;pval:配受体互作显著性pvalue;interaction_name:配受体互作名字;interaction_name_2:配受体互作名字;pathway_name:配受体互作所在通路名;
annotation:配受体互作方式;evidence:配受体互作支持文献。
100.7、本实施例进一步通过筛选体液外泌体中显著差异上调的ev mirna,且其靶基因表达在单细胞亚群组间差异下调的ev mirna分子得到如表9和表10所示的结果,结果显示在t细胞、b细胞和nkt细胞以及pdc和浆细胞中差异表达mrna与外泌体差异mirna间互作更多。通过此结果,本发明筛选到了mir-29b-1-5p在外泌体mirna数据中ad样本中显著下调,详细数据见表10。
101.表9 差异表达mrna与外泌体差异mirna间互作统计数量
102.表10差异表达mrna与外泌体差异mirna间互作统计结果
103.注:evs_开头的为组织外泌体mirna ad vs ctrl 差异表达分析结果;target:mirna靶向基因;evs_demirnaid:组织外泌体差异分析mirna id;evs_pvalue:组织外泌体差异分析pvalue值;evs_log2fc:组织外泌体差异分析log2fc值;evs_regulated:组织外泌体差异分析上下调方向;scrna_开头为单细胞数据不同细胞亚群组间比较(ad vs ctrl)差异表达分析结果;scrna_p_val:单细胞数据细胞亚群组间差异分析pvalue值;scrna_avg_log2fc:单细胞数据细胞亚群组间差异分析log2fc值;scrna_pct.1:单细胞数据基因在g2肿瘤样本中表达比例;scrna_pct.2:单细胞数据基因在g1正常样本中表达比例;scrna_p_val_adj:单细胞数据细胞亚群组间差异分析矫正后的pvalue值;scrna_group:单细胞数据差异分组;scrna_regulated:单细胞数据细胞亚群组间差异分析上下调方向;mirna_target_cor:mirna与靶基因相关性cor值;mirna_target_cor.pvalue:mirna与靶基因相关性pvalue值。
104.上述结果与参考文献“therapeutic effects of transplanted exosomes containing mir-29b to a rat model of alzheimer's disease”中一致,该参考文献中的内容显示mir-29家族在ad中的表达显著减少,这表明该家族成员参与了该疾病的发病机制。其采用携带mir-29a或mir-29b前体序列的重组表达载体转染大鼠骨髓间充质干细胞和hek-293t细胞(人胚胎肾293细胞)。在转染的细胞中证实了mir-29的显著过表达及其靶基因bace1(β-位点淀粉样蛋白前体蛋白切割酶1)和bim[bcl-2相互作用的细胞死亡介质(bcl2样11)]的下调。然后,该参考文献证实了mir-29在转染细胞分泌的外泌体中的包装。最后,该文献作者研究了工程外泌体在ad大鼠模型中对于降低淀粉样蛋白-β(aβ)肽病理作用可能存在的治疗作用。经过aβ处理的模型大鼠在空间学习和记忆方面表现出一些缺陷,但是在ca1注射含有mir-29的外泌体的动物中,上述损伤得到了预防。
[0105]
而在本实施例的结果中,在外泌体mirna数据中mir-29b-1-5p显著下调,与该文献中一致,即mir-29家族对ad造成的损伤起保护作用。
[0106]
以上联合分析结果说明了本实施例提供的联合分析方法具有较高的准确性。
[0107]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法,其特征在于,包括:获取待测样品的单细胞转录组数据和外泌体组学数据;根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群;进一步结合所述外泌体组学数据进行细胞外泌体通讯分析;所述外泌体组学数据包括如下中的至少一种:外泌体的mirna组学数据、外泌体的mrna组学数据、外泌体的lncrna组学数据或外泌体的蛋白组学数据。2.根据权利要求1所述的方法,其特征在于,所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程中,采用的指标包括:各细胞亚群的高表达基因、组间差异表达基因、marker基因或特异性模块中的一种或多种。3.根据权利要求2所述的方法,其特征在于,所述根据所述单细胞转录组数据判断存在外泌体通讯的细胞亚群的过程中,采用的依据包括如下任意一种或多种:i)将所述待测样品中各细胞亚群的高表达基因,和/或,不同细胞亚群间的组间差异表达基因,和公共外泌体数据库中ev基因进行比对,推断重叠数量较多的细胞亚群可能参与外泌体通讯;ii)将所述待测样品中各细胞亚群的高表达基因进行比对,推断两两细胞间重叠基因数量较多且重叠基因参与了外泌体相关的功能通路的细胞亚群之间可能存在外泌体通讯;iii)查看已知细胞类型的marker基因在各细胞亚群中的表达情况,推断存在异位表达的marker基因对应的细胞亚群参与外泌体通讯;iv)对各细胞亚群的特异性模块进行富集功能分析,推断和生成外泌体的生物过程相关的细胞亚群可能参与外泌体通讯。4.根据权利要求1-3任一项所述的方法,其特征在于,所述外泌体的mrna组学数据包括如下中的一种或多种:外泌体中高表达的mrna evs分子、外泌体bulk转录组数据、外泌体差异上调mrna evs分子或外泌体差异上调ev分子。5.根据权利要求4所述的方法,其特征在于,在所述细胞外泌体通讯分析的过程中,所述外泌体中高表达的mrna evs分子用于和已知细胞类型cell marker基因进行对比,将重叠的cell marker基因进一步和其对应的细胞亚群的单细胞转录组数据进行比对,推断比对结果中表达水平上升的cell marker基因对应的细胞亚群可能为外泌体供体细胞亚群;和/或,所述外泌体bulk转录组数据用于:采用反卷积方法进行处理,结合单细胞转录组数据构造的signature matrix,推断主要细胞亚群,筛选外泌体供体细胞亚群;和/或,所述外泌体差异上调mrna evs分子用于和各细胞亚群高表达基因间的overlap基因进行比对,推断比对结果中存在重叠的细胞亚群可能为外泌体供体细胞亚群;和/或,所述外泌体差异上调ev分子用于和各细胞亚群组间差异上调基因的overlap进行比对,推断比对结果中存在重叠的细胞亚群可能为外泌体供体细胞亚群。6.根据权利要求1-3任一项所述的方法,其特征在于,所述外泌体的lncrna组学数据包
括如下任意一种或多种:外泌体中差异上调ev lncrna的靶基因、外泌体中存在cerna的ev lncrna。7.根据权利要求6所述的方法,其特征在于,在所述细胞外泌体通讯分析的过程中,所述外泌体中差异上调ev lncrna的靶基因用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群;和/或,所述外泌体中存在cerna的ev lncrna用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群。8.根据权利要求1-3任一项所述的方法,其特征在于,所述外泌体的mirna组学数据包括如下任意一种或多种:外泌体中差异上调的ev mirna、外泌体中存在cerna的ev mirna。9.根据权利要求8所述的方法,其特征在于,在所述细胞外泌体通讯分析的过程中,所述外泌体中差异上调的ev mirna用于结合其靶基因在各单细胞亚群中的表达水平进行筛选,当其靶基因在单细胞亚群组间差异下调,则推导该ev mirna的来源细胞亚群为外泌体供体细胞亚群,该ev mirna的受体细胞为外泌体受体细胞亚群;和/或,所述外泌体中存在cerna的ev mirna用于和各单细胞亚群组间差异基因进行比对,推断重叠数量较多的单细胞亚群为外泌体受体细胞亚群。10.根据权利要求1-3任一项所述的方法,其特征在于,所述外泌体的蛋白组学数据包括如下任意一种或多种:外泌体中的高表达evs分子、外泌体中的组间差异evs分子、细胞亚群分泌蛋白分子的能力、外泌体中的差异上调ev蛋白、外泌体中转录因子和其靶基因的表达水平、外泌体中蛋白调控的通路。11.根据权利要求10所述的方法,其特征在于,在所述细胞外泌体通讯分析的过程中,所述外泌体中的高表达evs分子和外泌体中的组间差异evs分子用于和各细胞亚群分泌的配体进行比对,推断比对结果中出现重叠的细胞亚群为外泌体供体细胞亚群,表达该配体对应受体的细胞亚群为外泌体受体细胞亚群;和/或,所述细胞亚群分泌蛋白分子的能力用于筛选外泌体供体细胞亚群,分泌蛋白分子的能力越强的细胞亚群,作为外泌体供体细胞亚群的可能性越高;和/或,所述外泌体中的差异上调ev蛋白用于和各单细胞亚群组间差异上调基因进行比对,推断出现重叠的单细胞亚群为外泌体供体细胞亚群;和/或,所述外泌体中转录因子和其靶基因的表达水平用于相互对比,推断若转录因子和其靶基因的表达水平相关,该转录因子对应的细胞亚群为外泌体供体细胞亚群,其靶基因对应的细胞亚群为外泌体受体细胞亚群;和/或,所述外泌体中蛋白调控的通路用于和各细胞亚群富集的通路进行比对;推断重叠数量较多的细胞亚群为外泌体受体细胞亚群。
技术总结
本发明涉及生物信息技术领域,尤其涉及一种基于单细胞转录组数据和外泌体组学分析细胞外泌体通讯的方法。所述方法包括:获取待测样品的单细胞转录组数据和外泌体组学数据;根据单细胞转录组数据判断存在外泌体通讯的细胞亚群;进一步结合外泌体组学数据进行细胞外泌体通讯分析;外泌体组学数据包括如下中的至少一种:外泌体的miRNA组学数据、外泌体的mRNA组学数据、外泌体的lncRNA组学数据或外泌体的蛋白组学数据。本发明基于单细胞转录组数据和外泌体组学分析可能存在外泌体通讯的细胞亚群以及相应的通讯信息,可以准确、全面、多方位地推测组织内不同细胞亚群间的外泌体通讯情况,对于外泌体通讯的相关研究具有重要意义。对于外泌体通讯的相关研究具有重要意义。对于外泌体通讯的相关研究具有重要意义。
技术研发人员:林海军 张娟 李志 时韦美 刘翔
受保护的技术使用者:北京恩泽康泰生物科技有限公司
技术研发日:2023.07.21
技术公布日:2023/8/21
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
