通过寡杂交和基于PCR扩增进行核酸检测的方法与流程
未命名
07-12
阅读:59
评论:0

通过寡杂交和基于pcr扩增进行核酸检测的方法
技术领域
1.本发明涉及单细胞水平的核酸测序领域,例如单细胞rna测序(scrna-seq)。具体而言,本发明提供了一种检测固定或非固定的含核酸隔室如真核细胞或其细胞核中的核酸的方法,所述方法将多个单链(ss)dna寡核苷酸探针与所述隔室中的互补核酸分子杂交;从所述隔室中除去未与核酸特异性杂交的ssdna寡核苷酸探针;以及通过测序或扩增鉴定与所述隔室中的核酸分子特异性杂交的ssdna寡核苷酸探针,从而确定所述隔室中存在的相应核酸。所述方法不需要与相同靶核酸进行顺序ssdna探针杂交的步骤作为提高特异性或灵敏度的手段,也不需要rna分离和cdna产生的步骤。本发明的方法具有基本上检测每一种已知和/或未知核酸种类的潜力,特别是rna,例如编码蛋白质的mrna以及非编码rna。所述方法还具有足够的灵敏度来检测低丰度核酸及其在亚细胞隔室中的丰度。所述方法还能够对所检测的核酸进行空间映射,其中在探针杂交之前对所述隔室进行切片以获得碎片(fraction)的集合,因此核酸分子根据其定位而彼此分离。检测的核酸的空间映射可与至少一个dna基因座、至少一种蛋白质的检测相结合,或与细胞核中染色质凝聚、染色质接触和染色质径向位置的分析相结合。
背景技术:
2.核糖核酸(rna)是一种具有多种生物学功能的多功能分子。以将遗传信息从dna传递到蛋白质生物合成位点而闻名,核糖体、rna分子也可能表现出调节、催化或加工活性。因此,了解rna分子在细胞中表达的时间、地点、方式和原因是研究人员和临床医生的主要兴趣所在。
3.因此,已开发了多种检测、鉴定和量化单个细胞、组织或整个生物体中rna的方法,并不断对其进行优化。
4.northern印迹法是一种在将rna转移到膜上之前首先通过电泳根据大小进行分离的方法。然后,通过在膜上添加与目标rna杂交的标记探针来实现rna检测(josefsen等人,2011,northern blottinganalysis.methods mol biol.703,87-105)。
5.核酸酶保护分析依赖于退火至样本中rna的放射性标记或非同位素探针。杂交后,单链未杂交探针和rna被核酸酶降解,而与探针结合的rna片段被保留下来,随后在丙烯酰胺凝胶上通过放射自显影术进行分离和检测(https://www.thermofisher.com/de/de/home/references/ambion-tech-support/ribonuclease-protection-assays/general-articles/the-basics-what-is-a-nuclease-protection-assay.html)。
6.逆转录酶是一种来源于逆转录病毒的酶,能够使rna分子逆转录成互补的dna(cdna),逆转录酶的发现是rna研究的一个重大突破。rna转化为更稳定的cdna降低了样本降解速率,并有助于生物材料的处理,从而允许开发和应用更复杂的rna检测方法。例如,逆转录定量聚合酶链式反应(rt-qpcr)是一种基于pcr的方法,其中rna首先被逆转录成cdna,然后使用退火至目的cdna分子的特异性设计的引物对进行扩增。它需要足够的rna完整性,以实现cdna聚合至与进一步扩增相容的长度(约》100n,或通常》200nts)。cdna的定量可能
of single-cell rna sequencing methods.mol cell.85(4),631-643)。通常,在单孔或微流体液滴中分离单个细胞。每个孔或液滴均含有裂解细胞和制备测序文库所需的所有化学物质,包括rna分离、逆转录和接头连接步骤(ziegenhain等人,2017)。
11.单细胞转录组分析面临几个重要挑战:首先,rna的深度测序需要最少量的原料。然而,从单细胞中分离出的rna数量有限,且rna在分离过程中极易降解。因此,常规scrna-seq方法的信息价值受到原料可用性的限制。分离的scrna的反转录以及之前的扩增步骤(如“线性扩增”)会将转录组信息内容转化为更稳定的cdna分子,但通常会引入其他偏差,最终可能会造成错误的测序结果的评估。
12.因此,使用从单个细胞中收集的有限rna浓度进行转录组研究时,通常需要使用其他rna检测方法。使用可在显微镜下原位(即在其天然细胞环境中)检测的荧光标记的寡核苷酸探针,从而避免了rna分离的需要,代表了一种常用的方法。这些荧光原位杂交(fish)探针定位并与固定组织切片或细胞中的互补rna分子杂交。结合的探针随后可使用荧光显微镜或专用传感装置以亚细胞分辨率进行检测。如今,已有大量rna-fish探针库,如oligopaints(beliveau等人,2012,versatile design and synthesis platform for visualizing genomes with oligopaint fish probes.proc natl acad sci 109(52),21301-6)可以通过生物信息学设计来覆盖大部分基因组,它们可以通过大规模并行合成产生。然而,通过基于fish的rna检测方法同时分析的基因数量传统上受到可并行监测的有限数量的荧光标签的限制。这一问题已通过rnaseqfish+等方法得到解决,这些方法基于具有复杂多色条形码的修饰探针,大大增加了单个实验中可同时检测的基因数量。
13.同样,nanostring technologies提供的多重ncounter分析基于通过探针对进行的rna检测,该探针对由退火至目的rna分子的靶特异性捕获探针和与靶探针杂交的基因特异性颜色编码报告探针组成。rna-捕获-探针-报告探针复合物被固定并排列在特定试剂盒的成像表面上。随后,通过能够进行自动荧光检测的特定显微镜设备对试剂盒进行扫描,该设备可直接对标记的探针进行计数(geiss等人,2008,direct multiplexed measurement of gene expression with color-coded probe pairs.nat biotechnol.26(3),317-325)。然而,像ncounter这样的方法需要购买能够检测探针的特殊实验室设备。此外,所需的探针仅与选定的mrna和mirna组结合,不能简单地在实验室中生成。
14.基于ncounter分析,nanostring technologies进一步开发了一种称为geomx
tm
数字空间分析(dsp)的方法。该方法包括用荧光标记和针对rna的寡核苷酸“分析”探针对组织或细胞切片进行共染色。每个探针由靶互补序列形成,该靶互补序列通过可光裂解的接头(linker)与dsp寡核苷酸条形码相连。然后用紫外光照射组织/细胞切片中单独选择的目的区域,以从切片中释放dsp-寡聚序列。随后抽吸dsp-寡核苷酸并转移到微量滴定板的孔中。每个孔内的信息被索引到组织上的每个先前选择的目的区域。最后,将dsp-寡核苷酸与nanostring条形码杂交,并在ncounter平台上进行定量(geomx
tm
产品手册,可查阅https://www.nanostring.com/products/geomx-digital-spatial-profiler/geomx-dsp)。因此,geomx
tm
技术也需要购买昂贵的设备,以及使用专门开发的配套软件和包含dsp的专用探针。
15.wo2019/157445和merritt等人,2020(multiplex digital spatial profiling of proteins and rna in fixed tissue.nature biotechnology 38,586-599)更详细地涉及上述dsp方法,还提到了通过ngs进行探针鉴定和定量,作为ncounter平台的替代方案。
对于ngs分析,dsp寡核苷酸(在wo2019/157445中称为“标识符核苷酸”,或在merritt等人的文献中称为“索引寡核苷酸”)可包含用于其扩增和添加测序接头的两个引物结合位点以及唯一的分子标识符,和识别rna靶的特定核酸序列(即条形码序列)。在uv诱导下从靶互补序列中释放后,随后对dsp寡核苷酸进行pcr扩增和测序。因此,该方法避免了对rna反转录的需要,并依赖ngs进行探针鉴定。然而,该方法在技术上非常具有挑战性,因为它需要相当复杂的探针设计。dsp寡核苷酸中存在的独特条形码序列还可能导致靶外退火事件,从而降低检测的特异性。条形码序列位于独特分子标识符和引物结合位点附近的事实进一步加剧了这一问题。条形码序列还公认会增加pcr偏倚的风险。此外,为了释放标识符核苷酸,样品需要暴露于例如紫外线,对所述样品中存在的核酸具有潜在的有害后果。
16.slideseq和/或visium spatial gene expression等空间转录组学方法(rodriques等人,2019年。science 363(6434):1463-1467)与短寡核苷酸探针的使用和ngs技术相结合,对近端组织区域释放的rna分子进行空间捕获和测序。这些方法包括以有组织/局部/阵列的方式将空间组织的和条形码的寡d(t)引物或dna条形码微粒附着到显微镜载玻片表面。当细胞或组织与这些载玻片接触并进行处理以通过渗透释放其rna内容物时,引物捕获扩散到其附近的mrna分子。捕获的mrna被反转录成结合了其引物空间条形码的cdna,随后进行测序。在接下来的分析中,条形码允许追溯最初发现检测到的rna的亚细胞区域(等人,2016,visualization and analysis of gene expression in tissue sections by spatial transcriptomics.science 353(6294),78-82)。
17.在最近出版的预印本中,marshall等人介绍了一种称为探针与rna杂交的方法,用于测序(hypr-seq;marshall等人,2020,hypr-seq:single-cell quantification of chosen rnas via hybridization and sequencing of dna probes,biorxiv预印本doi:https://doi.org/10.1101/2020.06.01.128314,也发表为marshall等人,2020,hypr-seq:single-cell quantification of chosen rnas via hybridization and sequencing of dna probes.pnas 117(52),33404-33413)。该方法基于杂交链式反应(hcr)smfish方案。简言之,hpr-seq首先需要两个ssdna起始探针通过同源碱基配对退火至靶rna。在第二步中,所述起始探针用作短发夹寡探针的结合位点,随后,一种特殊的“读出”探针与之杂交。然后将所述“读出”探针连接到起始探针的5’端,以最终获得单个ssdna片段,该片段首先通过pcr扩增,然后测序。因此,尽管hypr-seq是一种基于ngs的技术,可避免对rna分离和反转录的需要,但转录物检测依赖于至少四种不同寡核苷酸的三层顺序杂交,因此将单个实验中可同时分析的基因数量限制为不超过100个(marshal等人,2020)。目前,还没有一种rna检测方法依赖于下一代测序,但不需要rna分离、cdna产生或通过互补寡核苷酸探针的连续杂交进行信号扩增的步骤。使用常规rna-seq方法,无法避免rna降解和反转录偏倚,在生物信息学评估期间评估原始测序数据时必须考虑到这一点。因此,由于对每个细胞的rna成分进行了随机采样,存在在分析中引入偏差的风险,特别是当数据来源于少量起始材料(如scrna)时。相比之下,许多依赖于使用寡核苷酸探针检测rna转录物的基于fish的方法甚至可以在亚细胞分辨率下检测rna,但是它们或者受到可以同时监测的基因或转录物数量的限制,或者受到与购买专用设备和试剂相关的高额费用的限制。
技术实现要素:
18.根据本领域的现状,本发明人解决了该问题,提供了一种新颖且灵敏度高的以单细胞分辨率进行rna检测的方法,所述方法克服了目前使用的方法的许多限制,并且有利地,具有以序列特异性方式检测和定量处于每种可能成熟状态的任何rna物种及其替代剪接变体、同工型、融合产物或单核苷酸多态性的潜力。
19.本发明,特别是权利要求的主题解决了该问题。本发明的方法被命名为通过测序进行基于寡核苷酸的映射(oligo-seq)或基于转录物的寡核苷酸的pcr映射(tom-pcr)。它不仅适用于检测rna,也适用于检测样品中存在的任何类型的核酸。
20.本发明提供了一种检测核酸的方法,包括以下步骤
21.(a)提供含有核酸的隔室;
22.(b)使至少一个单链dna寡核苷酸探针,优选多个单链dna寡核苷酸探针与所述隔室中的核酸分子杂交;
23.(c)从所述隔室中除去未与所述隔室内的任一核酸特异性杂交的单链dna寡核苷酸探针;
24.(d)通过探针测序或探针扩增鉴定与所述隔室内的核酸分子特异性杂交的单链dna-寡核苷酸探针;从而确定与所述隔室中存在的探针对应的核酸,
25.其中所述方法不包括作为扩增核酸检测的手段的顺序探针杂交。
26.核酸是由称为核苷酸的单体构建模块形成的生物聚合物。每个核苷酸由一个五碳糖、一个磷酸基团和一个含氮碱基组成。在本发明中,术语核酸是指天然存在的核酸,即脱氧核糖核酸(dna)或核糖核酸(rna)。本发明的方法可以用于检测rna,并特别具有优势。因此,优选地,在整个发明中,核酸是rna。
27.dna大多以双链状态存在,在细胞中呈特征性的双螺旋形状。然而,在极少数情况下,dna也可能以单链状态存在,例如,作为称为r环的dna转录过程和dna复制过程中形成的中间结构的一部分。此外,ssdna病毒将它们的遗传信息编码在单链环状dna分子中。
28.核糖核酸(rna)是一种聚合分子,作为由糖核糖、磷酸基团和四个碱基腺嘌呤(a)、鸟嘌呤(g)、胞嘧啶(c)和尿嘧啶(u)之一组成的核苷酸链组装而成。与大多数天然存在的dna不同,rna是单链分子,可以通过分子内碱基配对形成复杂的二级和三级结构。根据其功能,rna可以分为不同的子类和种类。
29.本文中检测核酸应理解为使技术人员能够理解样品中是否存在给定核酸的本发明的方法。检测还可以包括定量核酸,即查明样品中存在多少拷贝的给定核酸。它还可以包括核酸量的比较,即检测一个样品中的核酸是否比另一种核酸更丰富,或者是否比另一个样品中的核酸更丰富。本发明的方法表现出足够高的灵敏度以检测样品中存在非常少的核酸。待检测的核酸可以是例如任何目的dna或rna。在一个优选的实施方案中,待检测的核酸是在隔室中内源产生的。然而,核酸也可以是外源核酸,即它可以通过例如转染或显微注射从外部引入到隔室中。外源核酸可以是例如设计用于敲除蛋白编码基因的人工短发夹rna(shrna)。待检测的外源核酸也可以例如在病毒感染期间自然地引入到隔室中。在另一个实施方案中,外源核酸也可以是与另一种化合物缀合的核酸标签,例如生物分子,如蛋白质、碳水化合物、脂质或代谢物。例如,在优选的实施方案中,外源核酸可以通过核酸标签与抗体缀合,如下文更详细描述的。
30.根据本发明的含核酸隔室可以是器官内的组织、真核细胞或细胞簇、真核细胞的核、真核细胞的核仁、真核细胞的细胞质、线粒体、叶绿体、外泌体、原核细胞或病毒。
31.真核细胞可以是例如植物细胞、真菌细胞或动物细胞。在优选的实施方案中,真核细胞是哺乳动物细胞。哺乳动物细胞可以优选来源于人类,例如来源于患有疾病或病症、或被诊断为患有病症的人类患者、或健康受试者的细胞。所述细胞可以是例如肿瘤细胞或干细胞。这种细胞特别适合用于本发明,因为它们表现出独特的和高度特征性的转录特征,用本文所述的方法可以容易地鉴定。然而,哺乳动物细胞也可以是非人类细胞,例如来自哺乳动物遗传模型生物体的细胞,例如小鼠、大鼠、兔、豚鼠、猪或非人类灵长类动物。
32.虽然所述细胞优选是哺乳动物细胞,例如人细胞,但也可能以研究和任选地比较例如其它生物体的rna表达为目的,所述其它生物体例如大肠杆菌(e.coli)、酵母、拟南芥(a.thaliana)、秀丽隐杆线虫(c.elegans)、非洲爪蟾(x.laevis)、斑马鱼(d.rerio)、非洲齿鲤(n.furzeri)、黑腹果蝇(d.melanogaster)或涡虫(planarians)。
33.含核酸的隔室也可以是原核细胞,即来自细菌或古细菌的细胞。本发明还可应用于,例如,研究生物膜或肠腔中微生物群的空间组织,其中已成功应用了fish(参见tropini等人,2017,the gut microbiome:connecting spatial organization to function.cell host&microbe 21(4),433-442;liu等人,2017,low-abundant species facilitates specific spatial organization that promotes multispecies biofilm formation.environ microbiol.19,2893
–
905;liu等,2019,deciphering links between bacterial interactions and spatial organization in multispecies biofilms.the isme journal 13,3054
–
3066)。
34.在替代的实施方案中,含核酸的隔室可以是例如亚细胞结构或细胞器。例如,它可以是真核细胞的核,例如哺乳动物细胞,优选人细胞。含核酸的隔室也可以是真核细胞核的亚结构,即核仁。所述隔室还可包含哺乳动物(例如人)细胞的细胞质。虽然隔室可以仅包含所述细胞的细胞器,但是它也可以包含它们的组合,例如,它也可以是完整的人细胞,包括核、细胞质和线粒体。它也可以包括例如细胞质和线粒体,但不包括细胞核。
35.外泌体是核内体衍生的、与膜结合的小的细胞外囊泡,参与细胞间的通讯,通常含有mrna和microrna(mirna)作为其货物。
36.细胞可以来源于细胞培养,或离体分解来自活生物体或死生物体的特定组织,即,死后,或来自整个实验生物体(例如,整个黑腹果蝇胚胎或秀丽隐杆线虫的任何发育阶段)。所述细胞可以例如从通常与疾病相关的脑区域的切片获得。因此,细胞可以来自包含多种不同细胞类型的复杂组织。细胞的精确身份甚至可能在分析时还不知道,但可以通过本发明的方法确定。所述方法甚至可能适合于基于独特的转录特征来鉴定和描述先前未表征的细胞类型。
37.待实施本发明方法的细胞可以处于细胞周期的任何状态。根据实验目的,在细胞周期的特定阶段分离细胞可能会有所帮助,因为转录谱在整个细胞周期中可能会有很大差异。当比较多个细胞中的基因表达时,所有细胞应优选处于共同的细胞周期阶段,例如同步化。该阶段可以是分裂间期,例如g1期、s期或g2期、有丝分裂期或胞质分裂期。优选地,该阶段是分裂间期。
38.或者,也可以在不同细胞周期阶段的细胞中比较rna转录。细胞的分化状态也可能
不同。细胞可以是例如具有分化成不同细胞类型潜力的全能性或多能性干细胞。或者,通过本发明的方法分析的细胞可以在组织中完全分化并实现特定功能。细胞也可以是从干细胞分化为终末分化细胞过程中的任何细胞。
39.含核酸隔室也可以是包含多个细胞的组织切片或其部分。
40.在一个实施方案中,在根据步骤(b)杂交ssdna寡核苷酸探针之前,对含核酸的隔室进行切片。这提供了多个碎片或切片。含核酸隔室的切片可以通过本领域已知的任何合适的方法实现,例如超低温切片或低温球磨,优选超低温切片。冷冻切片优选在没有树脂包埋的情况下产生,例如通过tokuyasu方法(tokuyasu,k.t.,1973,atechnique for ultracryotomy of cell suspensions and tissues.j.cell biol.57,551-65)。所述方法包括在0-25℃的温度下、优选在室温(20-25℃)或在约4℃下将固定组织包埋在饱和蔗糖溶液中以对进行冷冻保护至少约30分钟、或至少约2小时、或至少约1天、或至多1周,例如在室温下2小时,或在室温下储存2小时后在约4℃下短期储存1天直至1周。包埋后,将蔗糖包埋的细胞小丸或组织或生物体,例如放置在充当样品保持器的金属短柱上,然后在液氮中冷冻,并根据细胞类型或组织在优选-80℃至-110℃切片,例如约-100℃。稍微改变的方法(guillot p.v.,xie s.q.,hollinshead m.,pombo a.,2004 fixation-induced redistribution of hyperphosphorylated rna polymerase ii in the nucleus of human cells.exp.cell res.295,460-468;pombo a,hollinshead m,cook pr,1999,bridging the resolution gap:imaging the same transcription factories in cryosections by light and electron microscopy.j.histochem.cytochem.47,471-480)已被证明得到了良好的结果。这些方法保留了完整细胞结构,与在非固定冷冻切片中观察到的细胞结构相当(mcdowall等人,1989,the structure of organelles of the endocytic pathway in hydrated cryosections of cultured cells,eur.j.cell biol.49,281-294),并提供活性rna聚合酶和细胞核结构的最佳保存(guillot等人,2004)。也可以使用chen等人(2014,small 10:3267)公开的方法。例如,可根据v.等人(2013.j.cell biol.202(3),407)描述的方法制备经玻璃化处理的非固定切片。
41.例如,核的切片可以具有约70纳米至约1000纳米的厚度,对于直径为5-15微米的核,优选为150-220纳米或180-200纳米。在本发明的上下文中,低于300纳米,例如150-220纳米,优选约200纳米的切片厚度被称为“超薄”。可提供用于在蔗糖介质中冷冻切片以用于固定细胞的商业设备(例如,leica ultracutuct 52超低温切片机)。切片也可以是4-10μm厚的冷冻切片(https://www.protocols.io/view/stellaris-rna-fish-protocol-for-frozentissue-iwgs5v)、50-300微米的振动切片(https://www.protocols.io/view/exfish-tissue-slice-n6adhae)、单层的细胞或悬浮的细胞。
42.从细胞切片中,可以制备分离的隔室的切片,例如核图谱、在不存在核组分(特别是,用于检测rna)的情况下以及任选地进一步在不存在线粒体组分的情况下的细胞质切片、或分离的细胞器的切片,例如线粒体的切片。
43.切片得到一个碎片集合,即多个碎片。切片的最佳厚度取决于隔室的大小。它可以分成5-300个碎片、10-100个碎片,更优选40-60个碎片或约45-50个碎片。在一些实施方案中,对于整个分析,碎片的厚度可以是均匀的。对于其他应用,例如,用于量化几种rna物种的相对量,或如果存在用于校准的手段,例如,一种rna相对于另一种rna(例如,相对于肌动
蛋白),则不同切片的厚度也可以在单个隔室中变化。优选地,dna寡核苷酸文库与显微镜载玻片上的超薄冷冻切片接触,优选在激光显微切割载玻片上,在先前已经为dna-和rna-cryofish建立的条件下接触(branco,m.r.和pombo,a,2006,intermingling of chromosome territories in interphase suggests role in translocations and transcription-dependent associations.plos biol.第4卷,第138页;xie,s.q.等人,2006,splicing speckles are not reservoirs of rna polymerase ii,but contain an inactive form,phosphorylated on serine2 residues of the c-terminal domain.mol.biol.cell 17,1723-1733;branco,m.r.,2006,correlative microscopy using tokuyasu cryosections:applications for immunogold labelling and in situ hybridisation.在“cell imaging(methods express series)”中,d.stephens编,科学出版有限公司(bloxham,uk),201-217;ferrai,c.等人,2010,poised transcription factories prime silent upa genes prior to activation.plos biology 8,e1000270)。
44.任选地,在探针杂交之前不将隔室切片。相反,ssdna寡核苷酸探针可以与整个隔室接触,例如,一组细胞或整个细胞,其可以是整个隔室或可以包括整个隔室,或完整的核或其它细胞器。在本发明的隔室是一组细胞的情况下,例如在组织中,本发明的探针可以与悬浮液中的该组细胞杂交。随后可洗涤细胞以除去未结合或弱结合的探针,然后通过facs将其分离成单细胞碎片。然后可以从每个单独的细胞中提取杂交的探针,用于制备测序文库。接下来可能会对单个文库进行池化(pooling)和测序。
45.或者,细胞群可利用油滴分隔,如液滴测序(droplet-seq)和hypr-测序(hypr-seq)所示。可使用pcr混合物(如1
×
evagreen supermix)和条形码珠分离单细胞,如macosko等人(2015,highly parallel genome-wide expression profiling of individual cells using nanoliter droplets.cell 161(5),1202-1214)设计的和由chemgenes(https://www.fishersci.com/shop/products/macosko-2011-10-b/nc0927472)提供的方法。细胞的制备无需在pcr前进行细胞裂解,因为这足以将探针(在95℃温度下)从其靶直接变性到pcr混合物中,然后进行扩增;pcr扩增发生在分隔的油滴内。条形码珠分别对来自同一细胞的所有探针进行条形码标记,从而提供单细胞分离度。对油滴进行变性处理,并对所有pcr产物进行测序。常用的微滴发生器有biorad qx200、quanti3d系统和nadia系统(dolomite bio)。
46.隔室可以在固体支持物例如载玻片上,例如在细胞涂片或单层细胞中,或者隔室可以在悬浮液中(图6b)。优选固定细胞和/或隔室以保存核酸,并允许探针进入目的隔室。不同的固定方案可能导致细胞或特定隔室中蛋白质或核酸的丢失,并可用于检测特定隔室(例如细胞核)中的rna(levsky,j.m.等人,2002,single-cell gene expressionprofiling.science 297,836
–
840;pombo,a.,2003,cellular genomics:which genes are transcribed when and where?trends biochem.sci.28,6-9.)。在本发明的一些实施方案中,可以用温和的洗涤剂、triton x-100、或皂苷、或tween-20以例如0.05%至5%、优选0.1%至0.5%处理细胞和/或隔室1-120分钟,优选10-30分钟,或用其它试剂如蛋白酶处理细胞和/或隔室,以增强初始探针接近目的隔室内的核酸。
47.根据步骤(b)的ssdna寡核苷酸探针与核酸(例如rna)的杂交可以在含核酸隔室的
固定之前进行,其中,任选地,含核酸隔室在固定之后被切片。
48.本领域已知许多固定方法。例如,固定可以包括使用沉淀固定剂,例如甲醇、乙醇或丙酮。沉淀固定剂特别适用于冷冻切片的固定。
49.在一个优选的实施方案中,含核酸隔室的固定是通过交联剂如甲醛或戊二醛实现的。交联也可以通过使用紫外线或电离辐射来实现。由于辐射是一种能够破坏核酸(如rna和dna)完整性的强效诱变剂,因此辐射交联不太可取。
50.甲醛优选用作交联剂,例如浓度为0.5-8%,优选1-8%,2-8%,或最优选4-8%(全部w/w),例如在ph 7.0-8.0的250mm hepes-naoh缓冲溶液中,或在pbs中,或在细胞骨架(csk)缓冲液中(tripathi等人,2015,rnafluorescence in situ hybridization in cultured mammalian cells.carmichael g.(eds)regulatory non-coding rnas.methods in molecular biology(methods and protocols),第1206卷,humana出版社,纽约,ny.https://doi.org/10.1007/978-1-4939-1369-5_11)。对于哺乳动物细胞,条件优选包括ph 7.6-7.8,10分钟至24小时,例如在4%甲醛下10分钟,然后在8%甲醛下2小时。例如,在实验生物体的情况下,整个组织或生物体可以通过用hepes缓冲的甲醛溶液(例如4%)或pbs缓冲的甲醛溶液灌注交联,优选至少30分钟,然后在冰冷却的含4%甲醛的250mm hepes-naoh(ph 7.6)中进行组织解剖30分钟至1小时,然后在冰冷却的含8%甲醛的250mm hepes-naoh(ph 7.6)中进行1-3小时(等人,2012,proteomic analysis of mitotic rna polymerase ii complexes reveals novel interactors and association with proteins dysfunctional in disease.mol.cell.proteomics 11(6):m111.011767;winick-ng等人,2020,cell-type specialization in the brain is encoded by specific long-range chromatin topologies,biorxiv.https://doi.org/10.1101/2020.04.02.020990;https://www.protocols.io/view/stellaris-rna-fish-protocol-for-frozentissue-iwgs5v;https://www.protocols.io/view/exfish-tissue-slice-n6adhae)。
51.组织或细胞的固定可以以不同的强度进行。即使在非常强的交联条件下,例如用4-8%甲醛处理数小时,本发明的方法也允许核酸检测。高水平的交联可更有效地保存细胞,并有利于在后续程序中保留核酸物种。因此,高交联用于耗时长或承受高机械应力时制备细胞。令人惊讶的是,本发明甚至可以应用于高度交联的细胞或组织,特别是当与切片结合时。
52.在另一个实施方案中,在寡核苷酸探针杂交之前不固定含核酸的隔室,其中任选的将其玻璃化。玻璃化是指快速冷冻细胞、组织或整个生物体,以保存细胞超微结构并避免任何可能因应用化学交联剂(如甲醛)而引入的伪影。
53.在本发明方法的步骤(b)中,使含核酸的隔室,或优选其碎片,例如其超薄碎片,与多个单链寡核苷酸探针接触。探针是dna、rna或化学修饰的寡核苷酸的片段,例如,包含lna(锁定核酸)或由其组成,可用于检测样品中核酸的存在。在本发明中,探针是单链dna寡核苷酸。dna寡核苷酸是通常长度为150nt或更短的短dna分子。它们可以制成任意序列的单链分子,由用户指定。或者,序列也可以是随机的。这些寡核苷酸可以通过序列特异性互补碱基配对与靶核酸结合,形成稳定的双链体。寡核苷酸探针与其靶序列之间的互补碱基对的数目越高,两条链之间的非共价键就越紧密。严格洗涤将去除非特异性探针,仅保留相互结
合的强配对链。特异性也可以通过使用具有更高杂交特性(解链温度)的化学修饰的rna分子来增加,即,包括lna,例如,以检测特定的单核苷酸多态性,或有利于检测临床样品中的低丰度rna物种(domiguez和kolodney,2005,wild-type blocking polymerase chain reaction for detection of single nucleotide minority mutations from clinical specimens.oncogene 24,6830-6834)。多个探针是指大于一个的任意数量的dna寡核苷酸。形成本发明所称的探针文库的探针的精确数目可以变化,并且对应于本发明要测试的基因的数目。
54.在本发明的上下文中,短语“其中所述方法不包括作为扩增核酸检测的手段的顺序探针杂交”应理解为排除使用与结合至靶的初始探针杂交的次级“辅助/进一步”探针。该短语还意味着根据本发明的方法不包括从其靶释放初始探针随后用新探针替换它的步骤。
55.与此一致,根据本发明的方法优选也不包括连接步骤,即例如将两个或更多个根据本发明的探针彼此连接(例如化学连接或酶连接)或将一个或更多个根据本发明的探针连接到其他类型的探针以促进探针扩增和基因检测的步骤。
56.在一个优选的实施方案中,根据本发明的探针不包含任何分子标签,例如dna、rna或生物素标签。探针优选也不包含通过可切割基序如限制性酶位点或可光裂解接头与探针连接的任何分子标签。因此,优选的,本发明的方法不包括从探针上切割分子标签如dna或rna标签的步骤,例如,避免需要紫外线处理或限制性内切酶处理。
57.在一个优选的实施方案中,由本发明方法中使用的探针检测的核酸,即靶核酸,是rna。
58.本文所述的方法既不对rna分子本身测序,也不对其产生的cdna测序,也不对可切割的(例如,dna-)标记或标签测序,而是通过直接对与其互补结合的ssdna寡核苷酸探针测序或扩增来鉴定目的rna。因此,本发明的方法优选不包括cdna产生步骤。步骤(b)的接触在允许探针与所述隔室内的rna分子结合(或杂交)的条件下进行。因此,探针与所述隔室内的rna分子杂交。可以选择不允许探针与dna杂交的条件,所述dna也可以任选地包含在隔室中,例如,可以使用脱氧核糖核酸酶(dnase)在ssdna探针杂交之前预处理隔室以除去dsdna和ssdna(pombo,a.等人,1994,1994,adenovirus replication and transcription sites are spatially separated in the nucleus of infected cells.embo j.13(12),5075-5085)。或者,可以在探针后杂交后使用特异性dsdnase以去除dsdna。合适的dsdnase酶可以从商业途径获得,例如从thermofisher(货号:en0771)获得。
59.探针与rna杂交的示例性条件是在30-65℃,例如37-55℃,例如在含10-50%,优选30%甲酰胺和5-20%,优选10%硫酸葡聚糖的盐水-柠檬酸钠(ssc)缓冲液中。可选地,缓冲液可补充适当的核糖核酸酶抑制剂,如氧钒核糖核苷络合物(rvc),或在杂交缓冲液不含甲酰胺的情况下,补充rnaseout
tm
。缓冲液可进一步包含作为非特异性阻断剂的trna(来自例如酵母),例如浓度为约1mg/ml。杂交可以进行例如至少15分钟至一周,优选至少30分钟,例如至少45分钟、至少1小时、至少2小时或至少5小时。它也可能持续更长时间,例如一夜、两晚或三晚。下面的实施例中也描述了合适的条件。值得注意的是,温度和甲酰胺浓度不仅会影响探针杂交,还会调节用于去除未结合或部分杂交探针的严格洗涤的严格性。因此,上述选择的条件极大地有助于本发明方法的灵敏度和特异性。
60.在另一个实施方案中,通过本发明的方法检测的核酸可以是dna,优选单链dna。
61.因此,接触步骤(b)在允许探针与所述隔室中的dna分子杂交的条件下进行。例如,如果待检测的dna是dsdna,则必须对其进行变性以获得可用于探针杂交的ssdna。可选地,在探针杂交之前或之后,可使用rnase对隔室进行预处理,以从样本中去除rna。探针杂交可在与上述rna检测相同的条件下进行。
62.为了精确的dna检测,本发明的方法可以进一步适于允许双链dna-探针复合物和天然存在的dsdna的片段(例如基因组或质粒dna)之间的可靠区分。例如,寡核苷酸探针可以用条形码序列或独特的分子标签修饰,以便于它们的鉴定,如本文所解释的。或者,可考虑基因组dna修饰,如胞嘧啶甲基化,以将基因组dna排除在分析之外。
63.在另一个实施方案中,本发明的方法允许同时检测隔室中的rna和dna。为了检测rna和dsdna,例如,可以添加探针以首先与rna杂交,而不发生dsdna变性,然后可以添加另一组探针(例如,具有不同的条形码序列或标签)以在dna变性后与dna杂交。rna和ssdna也可以同时检测,如上所述用于rna检测,但要避免破坏ssdna的条件。
64.在一个优选的实施方案中,本发明的方法不包括rna分离步骤。有利地,在步骤b)之前不进行核酸分离。本文所述的方法利用ssdna寡核苷酸探针,所述探针优选与核酸原位杂交,即在核酸天然存在的隔室内杂交。因此,本发明的方法适合于将检测到的核酸定位在隔室中。
65.在另一个实施方案中,本发明的方法也可用于检测已从隔室中分离的核酸。核酸可以例如在体外检测,如在试管内的合适缓冲液中检测。在这种情况下,可以将ssdna寡核苷酸探针直接添加到试管内的分离的核酸中以启动杂交。或者,探针杂交可以在从含核酸的隔室中分离核酸和所有结合的探针之前原位进行。
66.本发明方法中使用的ssdna寡核苷酸探针可以通过本领域已知的任何方法产生,例如,每个探针可以分别合成(femino,a.m.等人,1998,visualization of single rna transcripts in situ.science,280(5363),585-590)。最近,在被扩增并释放到溶液中之前,通过在固体基底如微芯片上的大规模平行合成制备了大量探针(beliveau等人,2012;,in situ super-resolution imaging of genomic dna with oligostorm and oligodna-paint.methods mol biol.1663,231-252;https://oligopaints.hms.harvard.edu/protocols)。
67.根据本发明的ssdna寡核苷酸探针可以具有约55-150个核苷酸(nt)的长度,优选70-120nt,或约80-115nt。在下面的实施例和优选的实施方案中,探针的长度为75-85nt或107-113nt。例如,探针长度可因此为约75-85nt。
68.每个探针通常包含与靶核酸(例如,靶rna)的核苷酸序列互补的靶区域,所述靶区域的两侧是一对引物区域,例如通用引物区域(图1,探针结构)。该中心靶区的核苷酸序列与单个核酸特异性杂交。杂交是指两个单链核酸分子通过互补碱基配对彼此退火的过程,即一条核酸链中存在的含氮碱基腺嘌呤与相对链中的胸腺嘧啶(dna)或尿嘧啶(rna)配对并形成氢键,而胞嘧啶与鸟嘌呤配对。重要的是,根据本发明的探针的靶向区域被设计成对其相应的靶核酸显示高严格性,以确保特异性结合,即,其不能退火至不同的核酸。优选地,靶区与目的核酸内的序列呈现出100%的互补性。因此,本文所述的方法具有差异检测核酸分子的潜力,所述核酸分子甚至在单个核苷酸中也不同。beliveau等人(2014年)详细介绍了一种设计能够通过检测snp来区分不同等位基因的高灵敏度寡核苷酸探针的可能方法,
所述方法依赖于针对不同物种存在的公开可用的snp收集数据库。探针的靶区被设计成具有一定的稳定性,允许探针及其靶核酸形成的双链体在37℃至65℃的温度(例如45-50℃或更多范围,优选47℃)经受严格洗涤,以在特异性杂交的探针变性之前,即在探针从其靶核酸中除去之前,除去部分杂交的探针。通过在升高的温度下进行严格洗涤来去除多余的探针,可确保检测方法的高特异性。在下面的实施例中,在含有40%甲酰胺的缓冲液中,于47℃,在葡聚糖存在下进行严格洗涤。靶区域可以具有例如20至50nt,优选30至45nt,例如30、31、32、33、34、35、36、37、38、39、40、41、42、43、44或45nt的长度。在两个特定的优选实施方案中,靶区具有约35nt或约39-45nt的长度。靶区也可以长于45nt,例如45-50nt。增加靶区的长度可增加探针特异性。然而,靶区也可以具有短于30nt的长度,例如与小的靶核酸杂交。例如,成熟mirna的长度仅为20-25nt。因此,探针靶区的长度可能对应于靶mirna的长度。探针的靶区可以具有20nt的最小长度,以仍然确保靶核酸的特异性和选择性检测。除探针长度外,杂交严格性还取决于探针的精确核苷酸组成。较高的gc(鸟嘌呤/胞嘧啶)含量通常与较高的严格性有关。
69.在其它实施方案中,靶区或探针对目的核酸表现出小于100%的互补性,例如85-99%或90-95%的互补性。例如,在应用时可能需要不完全互补,其中对于靶核酸的确切基因组序列不是100%置信。特别是在人类中,不同等位基因之间的snp可能是未知的。因此,允许给定量错配的探针用于评估来自两个不同等位基因的组合基因表达。
70.在一个任选的实施方案中,探针的靶区可以不设计成与所限定的靶核酸杂交。相反,靶区可以由一段随机组装的核苷酸组成。可将这种“随机”寡核苷酸探针添加到隔室中,以与未知的rna或dna分子杂交。
71.靶区每侧的通用引物区使探针能够扩增,并可附加到测序接头上(图5a)。任选地,通用引物区可以用作荧光原位杂交(fish)探针的靶位点,以使得能够在优化期间对成功的探针杂交进行直接的显微镜验证(图4)。每个通用引物的长度为15-30,优选20-25,例如21-23nt。任选地,通用引物的长度为22nt。
72.优选地,单链dna寡核苷酸探针还包含唯一分子标识符(umi)。umi是一个随机组装的短核苷酸序列,作为独特的分子标签。每种umi分别标记特定的探针,从而有助于可靠的探针鉴定,同时有效减少扩增引入的误差和定量偏差。用umi标记本发明的探针优选用于其中要定量隔室内部的核酸(例如rna)的应用。此外,umi还有助于鉴定(例如)罕见的转录物变体,尤其是在处理样本中总rna量较低的情况下。
73.任选地,ssdna寡核苷酸探针可以进一步包含至少一个(例如,至少两个)识别条形码序列。条形码与umi的不同之处在于,它不仅能唯一识别单个探针,还能标记不同的探针的集合,这些探针可根据共同特征进行分组(beliveau等人,2012年)。例如,条形码序列可以标记所有靶向相同特定目的基因的探针。可替换地,和/或另外,它可以被靶向基因相同基因区域的所有探针共享,例如外显子和内含子或外显子/内含子连接。条形码也可以总结具有特定功能或共享共同通路的基因的探针。此外,在基于pcr的定量过程中,条形码序列可作为引物的结合区。
74.任选地,单链dna寡核苷酸探针不包含umi。任选地,单链dna寡核苷酸探针不包含条形码序列,并且在一个实施方案中,它们既不包含umi序列也不包含条形码序列。探针的这些组分不是必需的,并且由于它们在本发明的方法中也需要测序或扩增,因此可能引入
有利于避免的偏差。条形码还可能导致靶外退火事件,即退火至非靶rna,降低分析的特异性,从而导致数据中出现噪声。当它们与umi或引物区或同源性位点相邻时,或通过使用更高数量的dna条形码时,这可能更成问题,从而进一步增加了靶外结合的机会。因此,优选的,探针不包含条形码序列。
75.尽管用单一类型的探针进行本发明的方法也可能是有意义的,例如,为了发现特定rna是否在细胞中表达,典型地,所述多个探针是多个不同的探针,即,在根据本发明的方法中使用的单链dna寡核苷酸探针与存在于隔室中的多个靶核酸,例如靶rna,或与一个靶核酸的不同区域特异性杂交。例如,探针可用于靶向从用作特定细胞类型和/或分化标记的基因转录的一组rna,或用于检测病毒转录物。探针可以靶向例如众所周知的干细胞标记物(如oct4或sox2)的转录物。探针也可以检测标记并跟踪干细胞分化为不同细胞类型或谱系的标记基因转录物。可被多个探针靶向的基因的其它子集包括例如炎性细胞因子的集合、特定信号级联的成员或特定癌症标记和其它疾病标记。还可以特别设计探针来检测细胞周期标记基因,如细胞周期蛋白e或b,以根据其在细胞周期中的阶段对不同的隔室或碎片进行分类。靶向所有或大多数分析细胞类型共有的且对环境变化无应答的已知管家基因的其它探针可被包括作为对照,以例如使差异基因表达的分析正常化。
76.可以使用的典型探针文库可以靶向数百种核酸,例如,从基因如标记基因转录的mrna。这种探针文库可能适用于多种应用。例如,探针文库可以靶向至少两种核酸,例如2-100000、3-50000、4-25000、5-10000、10-5000、15-2000、20-1000、25-500、30-250、40-200、50-100种核酸(例如rna如mrna)。它还可以靶向至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1000种核酸(例如rna如mrna)。在一些实施方案中,探针文库也可以靶向少于50种核酸(例如rna)。例如,如果要通过基于pcr的探针扩增而不是大规模平行测序来检测探针,则可以制备靶向最多5种、最多10种、最多15种、最多20种、最多25种、最多50种、最多75种、最多100种、最多200种、最多300种、最多400种或最多500种核酸的探针文库。然而,在优选的实施方案中,可以使用来自共有探针文库或完整共有文库的探针,这与探针是通过测序还是扩增进行鉴定无关。
77.为了使可从本发明的方法获得的信息量最大化,单个核酸,例如mrna转录物,可以例如通过多个探针靶向不同的位置。例如,多个探针可以覆盖单个基因的几个外显子、内含子以及外显子/内含子或外显子/外显子连接,以检测不同的剪接变体。或者,可特异性设计探针以靶向或识别来自基因的转录物的等位变体,所述等位变体例如由于核苷酸缺失、插入、反转或取代而不同。用于该方法的探针可能表现出足够的特异性,以忠实地区分即使在单个snp中也不同的转录物。基因融合可以通过设计靶向已知融合连接的探针来检测,或者通过比较分别与基因转录物的3’或5’末端结合的探针的检测水平来检测。
78.在一个实施方案中,探针可以完全覆盖核酸,例如来自基因的转录物,包括每个外显子和内含子。因此,能够结合单个转录物的探针数量可能取决于编码基因的长度。例如,长度为2000nt的转录物可能比长度为500nt的rna被更多的探针靶向。设计涵盖目的基因转录物全长的探针将为该基因或转录物提供最大量的信息,特别是剪接变体、同工型或融合产物的存在。例如,可以使用针对基因的每个外显子和内含子的探针,或如果适用,针对基因的每个剪接变体的探针。然而,在一些实验中,可能足以确定任何给定的基因是否被主动转录,尤其是当考虑大量基因时。因此,为了降低成本和工作量,rna分子可能只被几个探针
靶向,甚至不超过一个特异性探针。这是可能的,因为rna的存在将通过本发明的方法通过探针的测序或扩增来确定。相比之下,通过显微镜检测rna的基于fish的方法通常需要将多个探针与转录物杂交,以产生可检测的fish信号。同样,基于fish的hypr-seq需要将至少一对初始探针与目标rna杂交,然后对亚稳发夹寡核苷酸和“读出寡核苷酸”进行顺序退火。
79.因此,核酸,例如来自基因的转录物,可能被大约1-1000、50-700、100-500、150-400、200-300个寡核苷酸探针靶向,但也可以被少至1-100、1-50、1-20、1-10、1-5或甚至1-3个寡核苷酸探针靶向。根据本发明,足以进行有效rna检测的探针浓度取决于初始探针文库的大小和复杂性,还取决于所研究的隔室以及在探针杂交之前如何对其进行处理。为了在约200nm厚度的细胞冷冻切片上进行有效的rna检测,每个寡核苷酸探针可以例如在合适的缓冲溶液(例如水)中以约0.1至约1μm、优选0.2
–
0.8μm、0.3
–
0.7μm或0.4
–
0.6μm的浓度使用。在特别优选的实施方案中,探针可以具有0.5μm的浓度。优选地,对于文库中的每个独特探针约0.1nm。
80.优选地,所述单链dna寡核苷酸探针与靶rna特异性杂交,所述靶rna选自参与蛋白质生物合成的rna,所述rna包括mrna、rrna、snrna、snorna和trna,包括mirna、sirna、shrna和pirna的小调节rna,包括erna和lncrna的长调节rna,circrna、tracrrna、crrna、反转录转座子、病毒rna、卫星、terc、vtrna、ddrna、prompt或其组合。
81.原则上,本发明因此能够检测和鉴定在隔室中发现的每个rna分子。
82.在优选的实施方案中,靶rna是mrna。mrna将遗传信息从dna蓝图传递到核糖体,在那里编码的信息被翻译成多肽链。因此,检测隔室中的mrna可为蛋白质编码基因的表达提供有价值的信息。在一个实施方案中,本发明的单链dna寡核苷酸探针可形成与隔室中存在的基本上所有mrna特异性杂交的文库。因此,使用这种探针文库,该方法不限于仅检测相对小的子集,例如标记mrna,而是能够检测整个蛋白质编码转录组。因此,本发明的方法还提供了研究例如响应于环境条件变化、衰老或改变的(即受损或增强的)细胞信号的全基因组表达差异的手段。
83.在真核细胞中,mrna通过rna聚合酶从细胞核内的dna转录,作为长的前体转录物,称为前体mrna(前mrna)。在被转运到细胞质中翻译成蛋白质之前,前mrna在细胞核中经历连续的加工步骤。在其中一个步骤中,前mrna经历一个称为剪接的过程,其中非编码的基因间区域(内含子)从新生的转录物中切除,剩余的编码区域(外显子)融合在一起,获得成熟的mrna。单个前mrna可以通过多种替代方式进行剪接,这取决于剪接机制(剪接体)对被视为内含子或外显子的片段的选择。例如,外显子可以延伸或跳过,内含子可以保留在最终的转录物中。选择性剪接产生独特的成熟mrna变体,这些变体可能产生一系列具有不同功能特性的独特蛋白质。本发明上下文中使用的探针可以检测前mrna和/或这种剪接变体。可进一步设计探针以检测基因同工型,即由相同基因或基因位点产生但在转录时彼此不同的mrna,例如来自不同的转录起始位点(tss)。
84.然而,mrna仅代表细胞中存在的所有rna的一小部分。据估计,整个人类基因组中只有2%编码蛋白质。在哺乳动物中发现的其他98%rna转录物被认为是非编码的(dhanoa,j.k.,sethi,r.s.,verma,r.,arora,j.s.,和mukhopadhyay,c.s.,2018,long non-coding rna:its evolutionary relics and biological implications in mammals:综述,journal of animal science and technology,60,25)。因此,用于本发明方法的ssdna寡
核苷酸可以替代地或另外地杂交和检测非编码rna。例如,探针可以检测转运rna(trna)。trna将氨基酸转运至核糖体,并在mrna翻译成多肽链的过程中发挥核心作用。也可以专门设计探针来检测核糖体rna(rrna)。rrna代表细胞中最常见的一类rna,与一组蛋白质结合形成核糖体。rrna不仅具备结构功能,还通过催化氨基酸间肽键形成多肽链来发挥酶活性。因此rrna属于核酶类。由于rrna普遍存在的丰度,因此大多被排除在经典rna-seq实验之外,要么是通过它们的选择性耗竭,要么是通过在测序前专门预选多聚腺苷酸化转录物。然而,物种间rrna序列的比较为系统发育关系和物种多样性提供了有用的信息。
85.在根据本发明的方法中可通过探针检测的核酶的另一个实例是小核rna(snrna),其与一组蛋白质一起形成剪接体。snrna在剪接过程中催化前mrna内含子的去除。rrna、snrna和trna在细胞核的一个亚区域(核仁)内加工,受小核仁rna家族(snrna)调控。
86.调节性rna是调节各种生物过程的非编码rna。在这组rna中,对小的调节性rna的研究尤为深入,因此对转录组研究具有重要意义。小调节rna的大小为40nt或更小,通常在转录后调节基因表达。在这些小rna中,对microrna(mirna)、小干扰rna(sirna)和piwi相互作用rna(pirna)最为了解。据估计,几乎在每一种生物分子途径中,都有数百种不同且进化上保守的mirna调节着60%以上的人蛋白编码基因的表达(catalanotto,c.,cogoni,c.,和zardo,g.,2016,microrna in control of gene expression:an overview of nuclear functions.international journal of molecular sciences,17(10),1712)。特别是由于microrna在调节细胞死亡和增殖中的特殊作用,其既可以作为肿瘤抑制剂,也可以作为癌基因。因此,它们通常被用作肿瘤标志物。因此,设计为与此类癌症相关mirna特异性杂交的探针可以可靠地鉴定组织中的癌细胞。mirna由形成发夹结构的长前体转录物产生,并通过核仁内裂解进行加工。mirna通过一种被称为rna干扰(rnai)的分子机制在转录后沉默基因表达,在这种机制中,它们通过互补碱基配对将蛋白复合物导向靶mrna,从而引发mrna降解或翻译抑制。小干扰rna(sirna)依赖于与mirna相似的生物发生途径,但来源于双链rna分子。与mirna相似,它们利用rnai阻止靶mrna翻译成蛋白质。根据本发明的方法的探针可以特异性地检测例如这些不同小rna物种的加工成熟版本。此外或可选地,可以设计探针以检测其较长的初级或前体转录物。短发夹rna(shrna)是人工产生的分子,由研究人员外源引入细胞或生物体,通过rnai机制(基因敲除)降低目的基因的表达。本发明的方法可允许科学家通过评估shrna及其靶mrna的水平,例如在其模型生物体或细胞中,来验证shrna导入和基因敲除的有效性。稍长的piwi相互作用rna(pirna)是小的非编码rna。它们以沉默转座元件而闻名。
87.除了mirna、sirna或pirna等短调节rna之外,非编码调节rna的子集还包括一类长非编码rna(lnc rna)和增强子rna。lncrna在人类中高度表达,长度至少为200nt,加工方式通常与mrna相同。然而,lncrna与mrna的不同之处在于它们通常缺乏开放阅读框(orf)。lncrna调节多种细胞过程,如转录、转录后调节、rnai、剪接、翻译或表观遗传调节。然而,许多lncrna的生物学相关性目前尚不清楚(dhanoa等人,2018年)。例如,许多lncrna实际上可能编码功能未知的肽(van heesch等人,2019,the translational landscape of the human heart.cell 178(1),242-260)。用本发明的方法分析lncrna可提供关于其表达、定位和最终功能的新信息。
88.erna的长度为50-2000nt,由增强子区域的dna序列转录而来。它们的表达与其相
应增强子的活性相关,因此是区分活跃增强子和静息增强子的合适标记(arnold等人,2020,diversity and emerging roles of enhancer rna in regulation of gene expression and cell fate.前文.cell dev.biol.)。erna可能通过促进增强子-启动子相互作用、染色质修饰或转录机制调节来调节mrna转录。
89.环状rna(circr rna)是单链、成环的rna分子,分子功能通常不清楚。一些环状rna被认为是mirna海绵(kristensen等人,2019,the biogenesis,biology and characterization of circular rnas.nat rev genet.20(11),675-691),而其他环状rna似乎编码蛋白质(van heesch等人,2019)。重要的是,人脑中特定环状rna的表达与神经退行性疾病,特别是阿尔茨海默病(ad)的发生和发展有关。因此,它们被认为是ad诊断的潜在生物标志物(akhter,2018,circular rna and alzheimer’s disease.adv exp med biol.2018;1087:239-243)。
90.本发明还可适用于检测细胞中的外源致病性rna,例如病毒rna基因组和卫星或其部分。它还可适用于检测参与抗病毒免疫防御的细菌rna,如反式激活rna(tracr rna)或crispr-rna(crrna)及其用于crispr/cas介导的基因工程的修饰版本。terc(端粒酶rna成分的简称)是一种在真核生物中发现的非编码rna,并作为端粒酶延伸端粒的模板(feng等,1995,the rnacomponent of human telomerase.science 269(5228),1236-1241)。ddrna是在dna双链断裂位点产生的短非编码rna,是启动细胞中dna损伤应答所必需的(michelini,f.,pitchiaya,s.,vitelli,v.等人,2017,damage-induced lncrnas control the dna damage response through interaction with ddrnas at individual double-strand breaks.nat cell biol 19,1400-1411)。反转座子是基因组中的dna序列,被转录成rna,然后通过反转录转化回dna,随后插入不同的基因组位置。穹窿体rna(vtrna)是被称为穹窿的核糖核蛋白颗粒的一部分,在细胞内可能具有功能,特别是在核质转运过程中。启动子上游转录物(prompt)是在转录起始位点上游约1-1.5kb处以大多数活性蛋白编码基因的反向转录的非编码rna。prompt通常会被rna外来体迅速降解(lloret-llinares等人,2016,relationships between prompt and gene expression.rnabiol.13(1),6-14)。总之,尽管近年来发现了许多新的rna物种,但它们的功能往往不完全清楚。根据本发明的方法对于在本发明的方法中通过探针对这些rna物种的选择性识别来获得关于这些rna物种的新信息可能是至关重要的。
91.或者,单链dna寡核苷酸探针可以特异性地与靶dna杂交,所述靶dna选自包括染色体dna、线粒体dna、叶绿体dna、细菌dna、质粒dna、病毒dsdna或双链dna转座元件(转座子)的双链dna。
92.质粒是与染色体dna在物理上分离的小的环状染色体外dna分子。质粒通常存在于细菌中,并且通常携带有利于细菌存活的基因,例如抗生素耐药性。人工产生的质粒常用作载体对细胞或整个动物进行遗传修饰或进行分子克隆。
93.巴尔的摩分类系统第一组的病毒以dsdna病毒作为其遗传物质。在一些病毒中,病毒dsdna基因组可能呈圆形(杆状病毒科(baculoviridiae),乳多泡病毒科(papovaviridiae)),而在其他病毒中,病毒dna呈线性(腺病毒科(adenoviridae),疱疹病毒科(herpesviridae))。
94.dna转座子是可能改变其在基因组中位置的dna序列。利用剪切和粘贴式的机制,
dsdna被一种叫做转座酶的酶移动并整合到新的基因位置。
95.为了使根据本发明的寡核苷酸探针能够杂交,dsdna必须首先变性为单链状态。天然存在的dsdna变性可优选通过加热实现,即通过将含dna样品的温度升高至dna含氮碱基之间的氢键断裂的点。精确的变性温度取决于dsdna分子的长度及其gc含量。或者,dna可以进行化学变性,例如将其暴露于naoh或高浓度盐中,或用dnase i处理以暴露ssdna。
96.在允许两条ssdna链复性为其原始双链形式之前,需要将ssdna寡核苷酸探针添加到样品中,在样品中它们与各自的目的单链dna区域结合。
97.在另一个实施方案中,单链dna寡核苷酸探针可以被设计成特异性地与靶dna杂交,所述靶dna选自包括病毒ssdna基因组、helitrons以及存在于例如r-环或dna损伤位点的瞬时暴露的单链基因组dna片段的单链dna物种。被归为巴尔的摩病毒分类系统ii类的病毒具有环形的ssdna基因组。根据本发明的探针可以设计成特异性结合并检测隔室中的病毒ssdna基因组。
98.类似地,探针也可以检测被称为helitrons的特定dna转座子,其通过涉及产生环状ssdna中间体的滚环机制来切换基因组中的位置。
99.术语r-环描述了由dna:rna杂交体和非模板ssdna组成的三链核酸结构。当新转录的rna穿回与模板导向dna链杂交,从而取代非模板过客dna链时,r环通常在活性转录位点发育(allison和wang,2019,r-loops:formation,function,and relevance to cell stress.cell stress 3(2),38-47)。传统上,r-环通过与序列无关但具有结构特异性的抗体进行检测,然后通过一种称为drip-seq的方法进行dna测序。在本发明的方法中,特别设计的ssdna寡核苷酸探针可以例如与置换的非模板dna链杂交。
100.在其他情况下,例如,由于dna损伤,在复制叉停滞位点,ssdna延伸也可能短暂出现。
101.本发明的寡核苷酸探针还可以检测片段化或甚至高度降解的dna分子,例如从考古遗址或史前动物获得的古代dna。
102.总之,本发明因此还使得科学家能够检测含dna的隔室中的任何目的dna分子,前提是dna在探针杂交之前以单链状态存在。
103.因此,在一个实施方案中,如本文所述,单链dna寡核苷酸探针文库可检测隔室中存在的基本上所有rna或所有dna或其组合。之前的生物信息学分析表明,超过90%的整个人类基因组和100%的秀丽隐杆线虫基因组可以在约10个探针/kb的密度下被称为寡肽的专门设计的独特dna寡核苷酸探针覆盖,所述寡肽类似于本发明中使用的探针(beliveau等人,2012)。因此,本发明有可能选择性地检测覆盖细胞中存在的基因组的高达75%、高达80%、高达85%、高达90%、高达95%或高达99%的rna。在某些实施方案中,根据本发明方法的探针文库可覆盖至少99%,优选100%的rna或dna或其组合,所述rna或dna或其组合存在于例如测试基因组的隔室中。然后,它可以检测隔室中存在的基本上所有rna或所有dna,或其组合。
104.本发明的方法还可以有效地有助于核酸修饰的检测。例如,可以设计探针来检测罕见的编辑过的rna分子。rna编辑涉及转录后rna的核苷酸序列发生改变的过程,例如通过核苷酸的缺失、插入或取代。rna编辑可能会影响rna的活性、稳定性和定位。其他核酸修饰,如dna或rna甲基化或碱基异构化,可用特异性抗体检测。用本发明的方法对核酸的检测结
合所述核酸修饰的鉴定可以使本领域技术人员将特定核酸的丰度与其在给定空间位置的修饰联系起来。
105.在本发明的任选实施方案中,通过在ssdna寡核苷酸探针之前或同时向含核酸的隔室中加入“冷寡核苷酸”,可以将非实验目的的特定核酸排除分析之外。术语“冷寡核苷酸”是指具有竞争性地“消除”不需要的核酸的功能的未标记的寡核苷酸。例如,本发明探针的使用可能与添加寡核苷酸有关,所述寡核苷酸缺乏侧翼引物区,并与高丰度的核酸(例如rrna或7sk snrna)特异性杂交,但在杂交后的步骤中不扩增。因此,探针可能不再接近和结合这些非靶核酸。由于冷寡核苷酸缺少引物区,它们在下一步骤中不会被pcr扩增,因此在例如测序过程中不会被鉴定。
106.在本发明的方法中,在步骤(c)中从隔室中除去不杂交或仅与靶核酸分子的同源序列的一部分杂交的探针或任选的冷寡核苷酸。探针的移除可能需要使用合适的溶剂进行严格洗涤。可在室温(20-25℃)至约75℃的任何温度用合适的缓冲液从隔室中洗涤未杂交探针。在优选的实施方案中,在45-49℃的温度,优选在47℃,用约40%甲酰胺从隔室中洗涤未杂交探针。也可使用杂交实验中常用的其它缓冲液,如盐水-柠檬酸钠(ssc)或磷酸盐缓冲盐水(pbs)缓冲液进行严格洗涤。缓冲液可能含有洗涤剂,例如0.1%tween-20。去除未结合的探针可能至少涉及一个洗涤步骤。它还可以包括一个以上的洗涤步骤,例如两个、三个、四个或五个步骤,使用相同或优选不同浓度的洗涤缓冲液,例如增加严格性。在可替代的实施方案中,可以使用特异性降解游离ssdna寡核苷酸的内切酶,例如核酸外切酶i,从隔室中除去未杂交的探针。
107.可选地,在基于测序或基于pcr的探针鉴定之前,通过用第二个荧光标记的fish探针靶向杂交的探针,可以在显微镜下验证ssdna寡核苷酸探针与rna的杂交。fish探针可与ssdna寡核苷酸探针的条形码区域互补结合,并可通过荧光显微镜或适用于检测荧光染料的另一装置可视化(图4a和图4b)。然而,有利的是,在本发明的方法中不需要(并且优选不进行)对探针的存在进行基于成像的分析。
108.在步骤(c)中除去未杂交的ssdna寡核苷酸探针之后,并且在测序或扩增之前,通常从所述隔室中提取已经与所述隔室内的核酸分子杂交的寡核苷酸探针。可使用dna分离的标准方法。
109.然后,可以进行杂交的单链dna寡核苷酸探针的扩增。首先,杂交的探针可以在约85℃,优选约95℃的温度下从隔室中的核酸,例如rna中释放。或者,核酸-寡核苷酸探针-复合物的变性可以通过使用例如naoh的碱性水解来实现。在探针与rna分子杂交的情况下,加入rna降解酶(如rnase h)后可能发生探针释放。然后,通常通过聚合酶链式反应(pcr)使用特异性退火至每个探针的引物来实现探针扩增。引物可以例如设计成与探针的通用引物区和/或靶区杂交。优选地,引物直接退火至与目的核酸互补杂交的探针,而非退火至与可能已经通过化学接头(例如,可光裂解接头)连接到所述探针的任何分子标签。
110.扩增引物可被设计成在其5’端包含测序接头,例如为基于illumina的ngs提供的接头序列。因此,可以在pcr反应期间将测序接头添加到扩增探针的5’端。在另一个实施方案中,在扩增之前,探针可以首先连接到测序接头上。在这种情况下,扩增引物可以被特异性设计为退火至这些测序接头,以能够扩增容易使用的测序文库。此外或可替换地,扩增引物可编码额外信息,例如,它们可包含编码例如组织内样品的物理空间位置的独特dna序
列,如先前在slide-seq和10x visium中所做的(图5c)。条形码信息中还可包括额外的样本信息(例如,组织类型或患者标识符),以允许在同一测序运行中同时对多个样本进行测序,并在测序后将测序读段分配给其来源样本。
111.可以使用taq聚合酶,或者为了最大限度地减少聚合酶引入的误差,可以使用本领域技术人员公知的高保真聚合酶,例如或在可替代的实施方案中,探针在鉴定前不进行扩增,以防止以后由于复制偏差或扩增不准确而出现鉴定问题。
112.t7介导的线性扩增也可以用作探针扩增的手段。
113.pcr扩增后可优选去除过量引物,否则可能干扰探针测序。引物去除可以例如通过将样品与合适的核酸外切酶(例如核酸外切酶i)接触来实现,所述核酸外切酶有效降解过量的单链寡核苷酸,同时保持双链复合物完整。与它们的靶核酸杂交的探针、或其扩增产物、或退火至探针的引物因此保留在样品中,并且可以在随后的步骤中鉴定。
114.杂交的单链dna寡核苷酸探针优选通过测序来鉴定。本文公开的方法利用能够与靶核酸分子特异性杂交的单链dna寡核苷酸探针。与基于fish的检测方法相反,根据本发明方法的探针检测和鉴定不需要且优选不使用基于成像的方法,例如显微方法。相反,例如通过测序鉴定与靶核酸杂交的探针。探针可以通过本领域已知的任何合适的方法进行测序。例如,可以通过依赖于例如在体外dna复制过程中引入链终止的双脱氧核苷酸的测序方法(例如桑格-测序)对小组选定的探针进行测序。
115.在一个优选的实施方案中,通过下一代测序(ngs)鉴定探针。由于本发明的寡核苷酸探针的短尺寸,可以使用通常已知的短读高通量ngs技术进行测序,例如由illumina、roche 454、helicos、pacbio、solid和complete genomics提供的。根据要使用的精确ngs平台,需要相应地制备样品,即,必须将寡核苷酸探针附加到合适的测序接头上,并且可能需要将样品装载到合适的流动细胞上。测序接头可以很容易地连接到每个探针的末端,或者在基于pcr的探针扩增过程中添加,以生成测序文库。例如,illumina提供了多种用于测序文库制备的试剂盒(如nextera flex文库制备试剂盒)。特别有利的是,本发明的方法避免了从隔室中分离rna并将其反转录成cdna以检测rna的需要,因为本发明的方法仅确定了与rna互补的dna寡核苷酸的序列。众所周知,rna分离和反转录都有很大的材料损失风险,并可能给最终分析带来偏差。
116.测序提供了核酸(如rna,即目的物种)上每个独特靶位点的探针离散计数。随后可将获得的测序读段与探针参考图谱进行比对,该图谱包含所有探针序列信息,包括探针特异性条形码、引物和/或umi。接下来,可以根据探针在参考基因组中的基因组位置对其进行排序。然后可以应用汇总统计,例如,在整个转录物或外显子/内含子中检测到的探针数量的原始计数。
117.在优选的实施方案中,在步骤c)之后,并且通常在从所述隔室中提取已经与所述隔室中的核酸特异性杂交的单链dna寡核苷酸之后,在步骤d)中,通过探针扩增和探针测序按顺序鉴定与所述隔室中的核酸分子特异性杂交的单链dna-寡核苷酸探针。
118.在一个实施方案中,探针的全长被测序。例如,测序可以在探针的3’或5’端开始,随后继续到相对端。为了降低成本和增加方法的处理量,探针可选择地仅部分测序,即从3’或5’端的相同起始位置开始,仅对每个探针的前30、前35、前40、前45、前50、前55、前60、前
65、前70、前75、前80、前85、前90、前95或前100nt进行测序。在实施例中描述的实施方案中,测序从5’端开始,每个测序读段的长度为75nt。因此,根据本发明方法的测序读长比传统rna-seq实验中使用的那些(约200nt)短得多,从而节省了金钱成本和时间。如果探针包含侧翼条形码序列,测序读长可进一步缩短,仅覆盖足以识别靶rna的侧翼条形码的足够长度。将umi序列引入到探针中还可有助于识别扩增伪影,如pcr导致的重复,且不会妨碍识别样本中存在的rna物种。
119.在可替代的实施方案中,可以进行配对末端测序,其中每个探针从3’和5’端同时测序,以提高测序灵敏度并检测可能由于技术pcr偏差而产生的重复。
120.有利地,在本发明的方法中,探针测序包括对探针的已经与靶核酸杂交的区域(即具有与靶区域互补的序列)的至少一部分、任选地全部进行测序。这避免了对复杂探针设计的需要,并允许更短的探针,并使得能够定量核酸的特定片段,例如检测替代剪接事件。
121.尽管测序成本变得越来越实惠,但它仍然是许多实验室的一个限制因素,尤其是当样本量很大或需要重复分析时。此外,对测序结果的解读需要训练有素的人员和高计算能力。通过不涉及测序步骤的更传统的方法,如northern印迹法或反转录定量pcr(rt-qpcr),对选定的相对较小的rna子集的检测和定量可能更具成本效益,也更容易实现。然而,这两种技术都需要对rna进行分离和进一步处理,因此存在因样本降解而损失珍贵材料的相当大的风险。此外,northern印迹法通常缺乏足够检测低丰度转录物的灵敏度。相比之下,rt-qpcr依赖于靶rna的反转录。
122.在可替代的实施方案中,本发明的方法还允许通过扩增,优选通过定量pcr鉴定杂交的单链dna寡核苷酸探针,而不需要测序技术(图5b、图6a和图6b)。可以设计特异性靶向与目的特定基因互补的探针的条形码序列的引物,并且pcr,例如定量pcr,将导致它们的扩增。用于核酸qpcr分析的不同合适方案和试剂是本领域已知的,例如,它们可从sigma-aldrich、thermo-fisher、promega等公司轻易获得。因此,通过基于pcr的扩增检测寡核苷酸探针可以快速监测表达,特别是少数选定基因的表达。同样有利的是,探针与靶核酸杂交的区域被扩增。
123.本发明的方法还允许在隔室中对检测的核酸(例如rna)进行空间映射,进一步包括以下步骤:
124.(i)在步骤(b)之前对所述隔室进行切片,特别是冷冻切片或低温球磨切片,优选冷冻切片,以获得碎片的集合,并由此根据核酸分子的定位将核酸分子彼此分离;
125.(ii)鉴定在步骤(d)中与每个碎片中的核酸分子特异性杂交的单链dna-寡核苷酸探针,从而确定在每个碎片中是否存在对应于该探针的核酸;和
126.(iii)对隔室中的核酸进行映射。
127.在本发明的上下文中,空间映射应理解为要在隔室中确定核酸的空间定位或位置。用于对细胞或亚细胞区域中的核酸进行空间映射的现有方法通常依赖于基于fish的映射方法,这些方法要么通量低,要么需要昂贵的设备。到目前为止,空间转录组学依赖于从预先设计的探针阵列上捕获的rna衍生的cdna的大规模平行测序,但其用途仅限于组织切片。
128.相比之下,本发明的方法将单个隔室(例如,单细胞、细胞质或细胞核)的超低温切片与通过仅对与所述隔室内的核酸杂交的ssdna寡核苷酸探针测序来间接检测靶核酸相结
合。不涉及隔室冷冻的其他类型的切片也可以用于本发明。例如,在一个实施方案中,隔室也可以是福尔马林固定石蜡包埋(ffpe),即在其包埋到石蜡块中之前首先固定在甲醛中,以保持隔室的结构完整性,然后可以将其切成不同的切片。
129.当穿过所述隔室切割如本文所述的薄冷冻切片时,与针对在其它区域具有功能的rna分子的探针相比,针对在所述隔室共同位置例如转录、翻译或实现例如调节功能的rna分子的探针更频繁地在同一切片中被检测到。在冷冻切片的情况下,例如细胞核,可以通过在穿过该单个细胞核的多个切片中对所述前mrna拷贝的存在或不存在(即覆盖内含子区域或外显子-内含子和内含子-外显子连接的探针寡核苷酸的丰度)进行评分来推断新生的前mrna转录物的起源位点。类似地,当冷冻切割单个细胞的细胞质时,所述方法因此可推断亚细胞定位,其中例如调节性非编码rna可优先发挥其生物学功能或其中mrna被翻译成蛋白质(例如通过选择成纤维细胞或神经元轴突或树突的前缘)。本发明的方法还可提供关于隔室空间内的单个核酸(例如rna)分子之间的相对距离的信息。因此,该分析的结果可以用于例如计算通过本发明的方法检测的每一个rna分子相对于每一个其它rna分子的共分离频率,以创建推断的rna转录物之间的相对距离的矩阵。
130.因此,在本发明的一个实施方案中,通过本发明的方法分析隔室的所有碎片,使得单个细胞中核酸的空间映射成为可能。然而,这不是必需的,并且所分析的碎片可以从目的细胞群的多个隔室(例如,多个单个细胞或核)采样。使用本发明的方法,优选地,分析超过180个碎片是否存在靶向某些核酸的探针,以及任选地,探针共分离。例如,可以分析约180至约10000个碎片,优选约200至5000个、约220至4000个、约230至3500个、约250至3000个、300至2000个或500至1000个碎片,其中这些碎片可以从单个含核酸的隔室或多个含核酸的隔室获得。
131.研究隔室中核酸的空间分布可以通过分析核酸共分离来补充,这可以通过统计分析来确定空间邻近性来实现(例如,weibel,e.r.,1979,stereological methods:practical methods for biological morphometry.第1卷academic press,英国伦敦;weibel,e.r.,1980,stereological methods:theoretical foundations.第2卷.academic press,英国伦敦)。这可能特别令人感兴趣,因为例如具有序列相似性的两个rna分子之间的紧密空间邻近性可能是例如两个rna的共同转录起点的标志。例如,这两种rna分子可能是源自一个共同基因的未知的剪接变体或同工型。相比之下,核碎片中两个明显不同的rna分子和/或物种在空间上的紧密邻近性可能表明两个独立的基因在相似的时间点以彼此接近的距离表达,这又可能表明两个独立基因共享共同的调控元件。根据上下文和两种rna分子的精确序列,紧密邻近性也可能表明它们之间存在调节性相互作用。病毒rna分子和小rna在一个共同的细胞质碎片中的共分离可能进一步表明,例如,活性rnai应答。因此,使用统计学方法分析rna分子的共分离不仅有助于绘制多种rna分子的空间映射,还可以为rna之间的转录和转录后关系以及抗病毒宿主应答提供新的见解。此外,对一个单细胞、一组细胞或组织切片中的两种或多种rna物种进行共检测(例如,通过以相同大小的正方形或其他形状对rna内容物进行采样来对组织进行采样)可用于重建复杂组织中的细胞类型内容物和细胞间空间关系。在本发明的方法中使用的统计方法可以是例如推断统计方法。
132.在一个实施方案中,当以高于预设阈值的频率检测针对所述核酸的探针时,确定核酸的位置,以降低由于例如固定伪影或rna/dna污染而将核酸分子错误映射到区域的风
and rna in embryos at single-cell resolution.nature 568,49-54)开发了一种称为染色质结构光学重建(orca)的方法,依赖oligopaint探针来三维重建约100-700kb区域的基因组组织。在该研究中,orca与单分子rna-fish相结合,检测了30种rna的表达,并将其与局部染色质组织联系起来。因此,orca等现有方法局限于从相对较短的基因组区域捕获信息和仅检测小的rna子集,或依赖于大量的顺序杂交和成像步骤。
144.本发明人通过将根据本发明方法的高通量rna检测与最近开发和创新的基于测序的方法相结合来克服这些限制,所述方法用于分析整个隔室(例如单细胞、细胞核或细胞器)中dna的三维结构。发明人将所述方法称为基因组结构作图(gam)。beagrie等人(2017,nature 543(7646),519-524)和wo 2016156469提供了gam方法的详细描述。简而言之,gam采用下一代基因组dna测序和统计学方法,通过测定多个dna基因座在一个隔室(优选细胞核)碎片间的共分离来计算它们的空间邻近性。因此,gam允许对更高阶的染色质相互作用进行深入分析,包括以无偏倚的方式鉴定全基因组的结合位点,从而提供了基因组结构的详细图谱。gam还允许全基因组单倍型重建(markowski等人,2020,gamibhear:whole-genome haplotype reconstruction from genome architecture mapping data.biorxiv 2020.01.30.927061,也发表为markowski等人(2021)gamibhear:whole-genome haplotype reconstruction from genome architecture mapping data.bioinformatics 19,3128-3135),其与本发明组合可以使得能够研究等位基因特异性基因表达,即遗传变体调节基因表达的机制。
145.为了将根据本发明方法的rna检测与gam分析相结合,可优选将隔室(例如细胞核)例如通过冷冻切片法切成超薄碎片。例如,通过激光显微切割从这些碎片中分离出单个核剖面(nuclear profile,np)(或其他含核酸隔室,如线粒体的剖面)。从每个剖面中,严格洗涤后保留在隔室中的基因组dna以及rna结合的dna寡核苷酸探针依次或优选同时分离和pcr扩增。接下来可以分别对探针和基因组dna进行索引,以生成两个不同的测序文库(一个用于寡核苷酸探针,一个用于基因组dna)。然后可将两个文库汇集在一起并测序(图3b)。因此,通过本发明的方法测试的每个样品可以产生两个独立的测序文件。寡核苷酸探针的读取恢复可作为原始含rna隔室中rna物种相对丰度的替代物进行量化,并可用于在从基因组读取中解卷积细胞类型/状态特异性三维基因组拓扑之前对各个隔室碎片进行聚类。可确定各个碎片中检测到的rna分子和基因组基因座的共分离。因此,平行检测单个np的rna和基因组dna能够研究染色质拓扑和基因表达调控之间的相互作用。上述工作流程可以改变。例如,隔室可以是包含dna和rna的任何隔室,例如线粒体或叶绿体或原核细胞。碎片也可以来自多个隔室,并且可以针对每个相应的碎片比较rna分子和dna基因座的共分离。
146.优选地,可以分析不同隔室(例如核)碎片中的多个基因组dna基因座的共分离频率,以确定特定的染色质相互作用、基因座之间的相对和绝对距离以及基因座在核内的径向定位。因此,该信息可用于推断隔室(例如细胞核)中的染色质结构和拓扑,并确定(例如)基因启动子和远增强子区域之间的邻近性。同时,dna基因座和检测到的rna分子之间的相对距离可以通过在穿过单个细胞核的多个切片中对它们的存在与否进行评分来推断。因此,可以计算每种检测到的rna分子相对于任何dna基因座的共分离频率,以创建一个推断rna和基因组基因座之间相对距离的矩阵。用于分析rna分子和dna基因座共分离的统计方法对应于上述在gam分析期间用于分析dna基因座共分离或分析不同rna分子的方法。
147.与基因组结构相关的基因表达信息可以通过几种不同的方式加以利用:
148.在一个实施方案中,基因组结构可以与表达的rna的空间映射直接相关,以确定染色质拓扑和结构对转录、rna加工和mrna表达的影响。例如,在gam分析为特异性启动子-增强子关联提供证据的情况下,本发明可以证明这些关联在转录输出增加方面是否一致。以前使用orca的研究令人惊讶地表明,在以高水平新生rna为特征的活性基因位点,启动子与增强子的邻近性存在,但较弱(mateo等人,2019年)。然而,本研究仅限于黑腹果蝇模型系统胚胎中相对较短的基因组区域和少数基因。本发明具有将这样的研究扩展到整个基因组和哺乳动物或植物细胞中的潜力。
149.在另一个实施方案中,该方法还可以证明基因表达的变化如何影响染色质拓扑。例如,可以检测从增强子区域表达的新生erna诱导染色质组织改变的能力,例如将其相应的增强子带入靶启动子附近。
150.在另一个实施方案中,关于基因表达的信息可以用作细胞状态变化及其对基因组结构和基因位置的影响的读数(read-out)。一个经过充分研究的关于细胞状态的例子是细胞周期。不同的细胞周期阶段与整体基因组结构的剧烈变化有关(nagano等人,2017,cell-cycle dynamics of chromosomal organization at single-cell resolution.nature,547(7661):61-67)。通过靶向关键细胞周期标记基因的rna,完整组织的激光显微切割核切片可以根据其在细胞周期中的时间点进行分类,从而在保持空间分辨率的同时,改进细胞在细胞周期特定阶段的精确定位。类似地,用本发明的方法进行rna检测可以促进特定细胞类型或干细胞分化状态的鉴定,从而能够研究与其相关的特征性染色质重排。
151.根据组蛋白周围dna的致密程度,染色质可以被组装成或高或低凝聚的高阶结构。在低凝聚的形式中,dna包裹在组蛋白周围,形成核小体,核小体可以彼此均匀间隔,因此类似于一串未折叠的珠子。这种松散的染色质被称为常染色质。常染色质与基因主动转录到rna有关,因为基因更容易被转录机制和辅助转录因子所利用。相比之下,异染色质是指高度凝聚、紧密堆积的染色质结构,其中单个核小体被包裹成更厚的高阶染色质纤维。由于其高度致密,异染色质不能很好地被转录机制所利用,因此在转录上保持沉默。尽管着丝粒和端粒通常都处于恒定的异染色质状态,但染色体其他部分的染色质凝聚是一个高度动态的过程,通过可表观遗传的组蛋白翻译后修饰来控制。gam还能够在数万或数兆碱基以及整个染色体的水平上提供染色质凝聚态的信息(beagrie等人,2017年)。因此,通过将本发明的方法(称为寡核苷酸测序(oligo-seq))与gam结合,可以进一步将rna表达与以更大的规模(约300kb或更高)的染色质凝聚和重塑联系起来。
152.本领域技术人员可设想到gam和oligo-seq组合分析的多种其他应用和用途。任何这样的应用和用途都包含在本发明的范围内。
153.表1总结了oligo-seq和gam组合分析的独特优势。
154.表1:oligo-seq和gam联合分析的优点
155.[0156][0157]
可以将组合的gam和oligo-seq评价的大多数或所有可能的应用组合到单个多组学实验中,以使通过本发明的方法可获得的信息量最大化。
[0158]
本文公开的检测核酸如rna的方法不仅可以与检测基因组dna基因座相结合。在另一个实施方案中,rna/dna检测和空间映射也可以与来自外源的dna,例如来自病毒的dna的检测相结合。病毒dna可以是单链或双链的,并且可以存在于感染细胞的胞质溶胶中或整合到宿主细胞的基因组中。它可能存在于组织的某些细胞中,而不存在于其他细胞中,或者存在于相同的细胞类型中,但细胞生理学(细胞状态)发生改变。在细胞内、细胞或组织水平的细胞相互作用中,rna分子和病毒dna在一个隔室的碎片中的共分离可以提供关于病毒增殖和转录的程度、定位和后果的信息。
[0159]
在另一个实施方案中,可以与rna组合检测的至少一个dna基因座可以是标记除了存在于隔室中的核酸之外的生物化合物的dna寡核苷酸探针。例如,所述dna寡核苷酸探针可以连接到特异性识别目的蛋白的抗体,或连接到与一个或多个基因座的死亡cas9标记一起使用的引导rna中的ssdna尾。
[0160]
因此,本发明的方法也可用于将rna的检测和空间映射与至少一种蛋白质或所述蛋白质的翻译后修饰的检测相结合,包括
[0161]-使所述隔室与配体(例如抗体)接触,所述配体用寡核苷酸探针标记并且能够特异性结合所述至少一种蛋白质或翻译后修饰,和
[0162]-确定标记配体(例如抗体)的所述至少一个寡核苷酸探针与特异性杂交至核酸(例如rna)的单链dna寡核苷酸探针的共分离(co-segregation)。
[0163]
在优选的实施方案中,用所述方法检测至少一种蛋白质。与核酸如rna组合检测的至少一种蛋白质可以是例如由通过本发明方法检测的rna直接编码的蛋白质。它也可能是生物合成被怀疑或已知受检测到的rna调控的蛋白质。还可以怀疑或已知该蛋白质与通过本发明方法检测的给定核酸相互作用。因此,它可以是蛋白质-rna或蛋白质-dna复合物的
成员。然而,该蛋白质也可以是先前与特定核酸不相关的蛋白质。蛋白质可以在隔室中内源表达,或者可以从外源引入,例如通过转染。也可能是病毒基因表达的结果。任选地,在一个隔室中检测到一种以上的蛋白质与核酸的组合。例如,至少2个、至少5个、至少10个、至少25个、至少50个或至少100个蛋白质可以与核酸组合检测。多种蛋白质的检测可用于评估细胞生理/状态,并有助于将特定染色质构象(增强子-启动子接触)与转录和蛋白质表达或翻译后修饰联系起来。
[0164]
配体-探针-缀合物,例如抗体-探针-缀合物可在固定或玻璃化后与隔室接触。优选地,在切片(例如,冷冻切片)后,与隔室的碎片接触。然而,也可在切片前使其与隔室接触,例如通过检测遗传编码探针或弗兰肯体(frankenbody),以检测新生或成熟蛋白质(zhao,n.,等人2019,a genetically encoded probe for imaging nascent and mature ha-tagged proteins in vivo.nat.commun.10(10:2947.)。
[0165]
与互补核酸分子杂交的ssdna寡核苷酸探针和标记配体(如与蛋白质结合的抗体)的dna探针的平行检测可以例如以与上述rna和dna基因座的组合检测类似的方式实现。简而言之,在严格性洗涤之后,已经与互补核酸杂交的ssdna寡核苷酸探针可以从隔室的多个碎片(例如,冷冻切片)中分离,例如从整个真核细胞、核或细胞质中分离。平行地,与配体(如与蛋白质结合的抗体)缀合的dna寡核苷酸探针从配体中释放,例如,用合适的化学溶剂(例如,含有二硫苏糖醇(dtt)的盐缓冲液)释放,并且也从各自的碎片中分离。如此获得的两种dna寡核苷酸探针集合可任选地进行pcr扩增并分别进行索引以产生两个不同的测序文库(一个用于检测的核酸,一个用于检测的蛋白质)。然后可以将这两个文库合并在一起并测序。因此,通过本发明的方法测试的每个样品产生两个独立的测序文件。通过评估检测碎片中的核酸分子的探针和检测蛋白质的探针的共分离,可以推断核酸和蛋白质之间的物理邻近性。因此,通过本发明的方法将例如rna和蛋白质的检测以及确定它们在隔室内的总体空间分布和相对于彼此的空间分布相结合,可以例如允许关于rna翻译成蛋白质的速率和水平的结论。特定核酸和蛋白质之间的紧密邻近性可能进一步表明可能的相互作用或生物相关rna/dna-蛋白质复合物的形成。在具有空间分辨率的转录物水平上同时检测蛋白质表位和/或蛋白质翻译后修饰(ptm),例如组蛋白修饰或转录因子磷酸化,从而进一步扩展了从生物样品中检索到的关于细胞身份的信息量,超出了基因表达特征。该方法可应用于患者来源的样本,例如,用于早期疾病诊断。
[0166]
作为对如上所述与配体缀合的寡核苷酸探针直接测序的替代方法,根据本发明的方法还可以包括对能够与缀合于所述配体的核酸标签特异性杂交的游离寡核苷酸探针进行测序,例如抗体或其它亲和蛋白试剂,优选免疫缀合物。在这样的实施方案中,核酸标签本身因此不是直接测序的,而是用作序列特异性杂交界面,用于文库中存在的互补寡核苷酸探针的对接,以将靶表位的水平转化为dna读段。因此,寡核苷酸探针的杂交必须在抗体结合后进行。在与核酸标记的抗体进行原位探针杂交后,将使用与上述类似的途径扩增读出序列并制备用于ngs。
[0167]
因此,根据本发明的方法的该实施方案介于多重免疫检测的现有方法之间,因为它将使用杂交原理,而不产生cdna中间体,与通过测序直接检测杂交的寡核苷酸探针相结合。与直接检测缀合核酸标签本身的其它基于测序的方法相比,通过对杂交的寡核苷酸探针进行测序来定量(例如抗体结合)的关键优点在于,由于读出探针的开放式设计和互换性
(取决于技术应用),其提供了用于定量的灵活性,以用于定义缀合物或其组合的面板(panels)。因此,它大大减少了与重复需要不同报告核酸标签与抗体不可逆结合相关的技术限制。此外,与例如已知的顺序成像方法(如codex、ibex和seqfish+if)相反(takei等人,2021,integrated spatial genomics reveals global architecture of single nuclei.nature,590,344-350)),其中与抗体偶联的短核酸标签用作荧光标记的读出探针的连续杂交、成像和剥离的杂交平台,对于多个抗体缀合物将仅并行进行单个杂交步骤,因此节省时间和成本,并且重要的是确保维护样品完整性和抗体结合。
[0168]
优选地,如上所述对隔室内部的蛋白质和/或其ptm的检测与对其他核酸(例如rna)或gam的检测并行进行。然而,当然还应理解,本发明的方法允许检测隔室中的核酸标记的化合物,而不平行检测其它核酸。
[0169]
在另一个实施方案中,rna和至少一种蛋白质的平行检测和映射可以进一步与至少一个dna基因座的检测和映射相结合,例如通过gam。这种方法有可能将染色质组织与转录和翻译调控联系起来。因此,它还允许重建与特定细胞类型或状态相关的基因组结构,如相对蛋白质和/或rna含量所定义的。此外,它可能被证明可用于将3d基因组的特征与特定的核标志(层、核体的成分、组蛋白修饰)或事件(例如,新生基因表达、剪接)相关联。
[0170]
基因表达水平也取决于染色质对转录机制的局部可及性。染色质可及性涉及转录因子等与dna位点结合以促进或抑制基因转录的程度。尽管通过对基因组结构的gam分析,可以得出关于染色质的更大规模凝聚和结构组织的结论,但其他方法(如atac-seq)在确定染色质在整个基因组转录机制的单个核小体水平上的可及性方面更为专业(buenrostro,j.d.,wu,b.,chang,h.y.,和greenleaf,w.j.,2015,atac-seq:a method for assaying chromatin accessibility genome-wide.current protocols in molecular biology,109,21.29.1-21.29.9)。因此,atac-seq代表了一种绘制转录因子结合位点的有用工具。
[0171]
根据本发明的核酸(优选rna)的检测也可以与隔室内局部染色质可及性的分析相结合,包括以下步骤:
[0172]
(i)在步骤(b)之前对所述隔室进行冷冻切片或低温球磨切片,优选冷冻切片,以获得碎片的集合,并由此根据核酸分子的定位将核酸分子彼此分离;
[0173]
(ii)从每个碎片中分离基因组dna
[0174]
(iii)对从每个碎片分离的基因组dna进行片段化和标记以产生atac seq文库;
[0175]
(iv)纯化和任选地扩增所述atac-seq文库;
[0176]
(v)确定基因组dna的任何给定基因座的局部染色质可及性状态;和
[0177]
(vi)分析映射的核酸(优选rna)的存在和/或丰度,并将其与基因组dna任何给定基因座的染色质可及性联系起来。
[0178]
采用高通量测序(atac-seq)的转座酶可及性染色质分析是一种基于ngs的方法,适用于评估细胞核中染色质的调控格局。atac-seq依赖于过度活跃的tn5转座酶的活性。转座酶通过剪切-粘贴机制天然催化转座元件从基因组的一个部分移动到另一个部分。在atac-seq中,ngs-接头被装载到tn5转座酶上。装载的转座酶接下来在可及性的常染色质区域切割dna(片段化),同时将ngs-接头连接到这些染色质片段上(标记化),生成atac-seq测序文库。该文库经过纯化,可在通过qpcr或ngs分析之前使用条形码引物进行pcr扩增。通常对约25000-75000个细胞进行atac-seq分析。
[0179]
通过atac-seq对局部染色质可及性的检测可以与通过本发明方法进行的核酸,优选rna检测相结合。例如,从细胞或细胞切片中分离的基因组dna可以首先进行atac-seq分析,以确定细胞核中不同dna基因座的染色质可及性状态。然后,通过评估给定基因座附近是否存在先前映射的rna,来检测染色质可及性的变化对局部转录活性的影响。
[0180]
在一个优选的实施方案中,atac-seq测序文库和杂交的ssdna寡核苷酸探针文库从相同的隔室产生并在单次测序运行中测序。
[0181]
通过在处理后的不同状态或时间点评估细胞,该方法还可以例如帮助确定基因组基因座rna水平的增加是否是由于局部染色质可及性变化导致转录增加的结果,反之亦然,如之前在秀丽隐杆线虫中所建议的,表达的rna分子影响染色质可及性(fields等人,2019,chromatin compaction by small rnas and the nuclear rnai machinery in c.elegans.scientific reports 9)。因此,本发明的方法允许破译染色质可及性和基因表达的动力学。
[0182]
本发明还提供了本发明方法的用途:
[0183]
(a)测定单细胞、细胞群或细胞内隔室中的基因表达;
[0184]
(b)鉴定隔室中rna的同工型和等位基因特异性变体;
[0185]
(c)定量基因的转录;
[0186]
(d)鉴定复杂异种组织的细胞类型和状态;
[0187]
(e)识别隔室内的内源性和外源性dsdna和ssdna;
[0188]
(f)映射核酸(例如rna)在隔室中的位置;
[0189]
(g)映射隔室中的rna和核酸基因座的位置;
[0190]
(h)映射隔室中的核酸(优选rna)和蛋白质的位置;和/或
[0191]
(i)映射隔室中的核酸(优选rna)、蛋白质和核酸基因座的位置。
[0192]
例如,可以在周围组织环境中的单个细胞中,或在周围组织环境中的一组细胞中,任选地,在特定组织的至少一种,例如几种细胞类型的细胞中测定基因表达。然后,分析可以涉及不同细胞的比较,例如,不同的细胞类型。因此,本发明允许在组织的2d或甚至3d环境中对某些细胞进行空间转录组学。也可以在组织/器官水平,甚至不同物种的不同个体群体,例如,不同单细胞生物体或不同原核生物体中进行映射。
[0193]
本发明还提供了一种诊断与患者中一种或多种基因的错误表达和/或不同转录谱相关的疾病的方法,包括在取自所述患者的样品中,鉴定所述患者中核酸,特别是rna的存在和/或分析其丰度,以获得患者特异性转录谱,并将所述患者特异性转录谱与已诊断患有所述疾病的受试者的转录谱进行比较,其中所述转录谱优选还与健康受试者的转录谱进行比较。或者,可在细胞的特定亚组之间比较转录谱,所述细胞可来自同一患者,例如肿瘤细胞和正常组织,优选来自与肿瘤组织相同细胞类型的正常组织。
[0194]
由于本发明可用于研究患者中受干扰的基因表达,例如与致瘤细胞生长相关的癌基因的过度表达,因此也可有助于治疗患有与受干扰的基因表达相关疾病的患者,例如癌症。
[0195]
总之,本发明提供了用于检测样品中核酸的高度灵敏的测序或基于扩增的方法。与已知的rna测序方法相反,本发明的方法不依赖rna分离或cdna产生作为rna检测的先决条件。因此,它克服了与rna快速降解或反正转录过程中引入偏差相关的问题。相反,本文引
入的方法依赖于对与组织、细胞或细胞器内的核酸互补杂交的ssdna寡核苷酸探针进行测序。
[0196]
表2总结了本发明方法(指oligo-seq)和现有技术方法之间的差异。
[0197]
表2:列出了与最先进方法相比的oligo-seq的特征
[0198]
[0199][0200]
在最近的研究中,marshall等人在开发hpr-seq时提出了类似的概念。然而,本发明提供了一系列优于hypr-seq的决定性优点:首先,本方法的特异性首先基于所用探针的长度和数量以及所选择的孵育时间、温度和严格洗涤。hpr-seq使用两个长度为25nt的初始探针。本发明方法中使用的探针的靶识别位点的长度优选为至少约32nt,因此表现出更高的特异性。其次,hypr-seq是一种耗时费力得多的方法,因为它在扩增和测序之前涉及8个不同的连续杂交和洗涤步骤。相比之下,oligo-seq仅包括一个杂交步骤,然后进行严格洗涤。正如hypr-seq的开发人员所承认的,多轮杂交和洗涤可能会导致显著的细胞损失。因此,hpr-seq需要从至少100万个细胞开始进行实验。相反,本发明的方法可以用哺乳动物细胞的1/20的单个隔室成功完成。此外,hpr-seq方案的大量洗涤步骤和苛刻的乙醇渗透可能会影响含核酸隔室的结构完整性和蛋白质含量。因此,hpr-seq可能与其他多组学技术不兼容。此外,本发明的方法仅需要单次寡核苷酸杂交,因此与hypr-seq相比,不依赖于通过额外的二级或三级寡核苷酸的杂交来扩增初级rna-dna杂交事件。因此,oligo-seq能够并行鉴定出相比于hpr-seq数量明显更多的核酸,或相比于大多数其他基于fish探针的检测方法。
[0201]
表3再次总结了本发明的方法和hypr-seq之间的差异。
[0202]
表3:hpr-seq和oligo-seq的比较
[0203]
[0204][0205]
本发明的方法有效且忠实地提供了关于例如基因表达的信息,即使当处理非常少量的起始rna材料时也是如此。因此,它特别适合于在单细胞甚至亚细胞水平上研究基因表达。与组织或细胞切片相结合,根据本发明的方法还允许监测隔室中核酸相对于其它生物分子的空间分布,从而提供适用于传导空间转录组学的高灵敏度的技术。根据本发明的核酸检测不依赖于任何显微镜或成像技术,而是使用测序来提供转录组数据。因此,在更大规模的多组学研究中,它可以很容易地与本领域已知的其他基于测序的方法相结合。
[0206]
在整个发明中,术语“约”和“大约”应理解为“+/-10%”。如果“约”或“大约”与某一范围相关,则它们指该范围的下限和上限。如果未明确提及,则“一个”意为“一个或多个”。
[0207]
本文引用的所有文献均全文并入本文。本发明通过以下实施例进一步说明,但不限于此。
附图说明
[0208]
图1:探针设计示意图,包括以下实验中使用的设计(设计a和b)和寡核苷酸设计c。通用引物(up)为20个核苷酸,由文库中所有探针共享。up1、up2和up3表示不同的通用引物序列。唯一分子标识符(umi)是一段6至15个随机核苷酸,用于在测序中识别唯一分子,如果发现因pcr扩增而重复,则仅计数一次。同源区(hr)是靶向目的靶分子的唯一核酸序列的序列。文库中的每个探针都有一个唯一的同源区。实施例中使用的5’条形码b1对靶向相同基因的所有探针特异,3’条形码b2对靶向相同基因的所有外显子或内含子特异。
[0209]
图2:探针设计的一般特征。(a)探针设计a(ol66)中包含的66个基因的列表,以及外显子或内含子中每个基因的靶向寡核苷酸的数量。hotair、malat1、xist、neat1和firre编码长非编码rna,其他基因编码信使rna。(b)探针设计b中包含的1823个基因的直方图(ol1823)(y轴),以及每个基因的靶向寡核苷酸数量(x轴)。所有基因都编码信使rna。
[0210]
图3:本发明方法的示意图。(a)隔室中的rna检测。通过荧光原位杂交(fish)进行特异性探针杂交的可选验证如虚线框所示。(b)隔室rna检测与使用gam程序的平行dna检测相结合。
[0211]
图4:使用rna-fish验证探针库杂交,并在杂交前使用rnase处理验证杂交特异性。(a)上图显示了mescs(克隆f123)超薄(200nm厚)冷冻切片与设计的rna-gam探针(浓度0.5μm)杂交。下图显示了在用0.25mg/ml rnasea预处理2h的冷冻切片中平行进行的杂交。左图显示了用dapi染色的dna,以识别核切片。右图显示了与靶向ssdna探针(桥)通用序列的寡核苷酸进行二次冷冻杂交,然后与桥杂交的alexafluor647-缀合寡核苷酸退火后检测到的探针信号。比例尺,10μm。(b)基于荧光的杂交oligo-seq初级探针检测示意图。
[0212]
图5:(a)用于对实施例中使用的ssdna探针进行测序的pcr步骤的简化概述。探针
设计a与图2a所示相同。对于探针设计b,相同的设计适用于与up1具有同源性的p5接头。illumina接头p5和p7与每个探针(分别为up1和up2)末端的通用引物区互补。(b)用于扩增设计a的ssdna探针特定子集的qpcr步骤示意图,例如仅针对单个基因或特定基因中单个区域的探针。探针设计与图2a相同。从目的隔室中提取探针。然后使用引物up1和up2对探针进行通用扩增,并在qpcr前通过dna浓度对不同样本进行标准化。然后,通过用引物b1和up2扩增5’b1条形码和3’up2之间的区域,来确定靶向相同基因的所有探针的相对丰度。或者,可以通过用引物b1和b2扩增b1和b2之间的探针区域来特异性扩增基因区域。(c)对实施例中使用的ssdna探针设计a(ol66)进行测序的pcr步骤的简化概述。探针设计与图2a相同。对于探针设计b,同样的设计适用于对up3具有同源性的p5接头,以及对up2具有同源性的p7接头)。引物/二级寡核苷酸含有额外信息(i1/i2),可用于例如组织2d空间中样本的编码位置。也可以使用含有p5和p7样本索引条形码的二级/寡核苷酸,用独特的dna序列对单个样本进行条形码编码,以直接扩增到每个探针末端的通用引物区。
[0213]
图6:(a)使用探针设计a(ol66)在冷冻切片中杂交后,从mescs-f123(+)、xen细胞(
●
)和经rnase处理的mescs-f123(
▲
)的100np样本中进行寡核苷酸探针扩增的qpcr结果。y轴表示检测sybr-green信号所需的定量循环次数(cq)。在独立的重复样本(每个样本100np)中进行6个基因的表达。sox2和oct4基因是在mesc-f123中特异性表达的多能性基因,sox17和gata6基因在xen细胞中特异性表达,malat1是一种长的非编码rna,在mesc和xen中大量且普遍表达,bdnf基因是在mesc或xen中不表达的神经元基因。-1和-2表示技术复制品1和2。(b)使用探针设计a(ol66)在溶液中的全细胞中进行寡核苷酸探针杂交的qpcr结果。将mesc(f123)用胰蛋白酶消化,与寡核苷酸探针ol66杂交,并洗涤。提取并扩增了1-20个细胞的结合探针内容物(+)。将扩增的探针洗涤并归一化至2.5ng/μl。作为背景对照,将探针储备液归一化至2.5ng/μl(
●
)。y轴表示检测sybr-green信号所需的定量循环次数(cq)。sox2和oct4基因是在mesc-f123中特异性表达的多能性基因,sox17和gata6基因在xen细胞中特异性表达,malat1是一种长的非编码rna,在mesc和xen细胞中大量且普遍表达,bdnf基因是在mesc或xen中不表达的神经元基因。对于mesc表达基因、sox2、oct4和普遍表达的malat1发现了在探针背景下的特异性检测。-1和-2分别表示技术复制品1和2。
[0214]
图7:在来自mesc或xen细胞的100np样本中,跨sox2基因的每个同源靶位点的杂交探针数。sox2在mesc中表达,在xen细胞中不表达。探针文库(设计a)仅包含总共17种寡核苷酸,这些寡核苷酸跨sox2基因的编码区靶向sox2基因,这里从转录起始位点(tss)到转录终止位点(tes)按基因组顺序(位置1-17)从左到右排列。y-轴表示靶向该唯一靶位点的探针数量。
[0215]
图8:rna-gam中rna丰度和dna存在的平行检测。在洗涤、激光显微切割以及扩增寡核苷酸探针和基因组dna之前,将来自mesc和xen细胞的超薄冷冻切片与寡核苷酸探针(设计a,ol66)杂交。从寡探针和基因组dna中分别制备文库后,将样本混合并测序。
[0216]
(a)100np样本中寡核苷酸探针的原始测序数据的基因组浏览器轨迹。基因组浏览器测序读出轨迹下的块代表外显子的位置,在那里探针杂交更丰富,正如预期的那样,因为内含子被快速剪接和降解。轨迹显示了与映射到探针参考图谱上的探针位置的探针数量,所有探针参考均按其线性基因组顺序排列。所有四条轨迹都是一起自动缩放的。突出显示了三个基因:ywhae(管家基因)、oct4(在mesc中特异性表达)和gata4(在xen细胞中特异性
表达)。
[0217]
(b)来自细胞dna平行提取和测序的原始测序数据。四份gam样本的基因组dna轨迹,每份样本由1np的两份mesc样本和两份xen细胞样本产生。这些轨迹显示了典型的基因组dna检测,其覆盖了染色体的短的连续区域,正如从薄的核切片中提取的dna所预期的那样。
[0218]
图9:(a)来自mesc-f123和xen细胞的单个超薄切片中sox2和oct4的表达。散点图显示了使用寡核酸探针设计a进行oligo-seq分析后(ol66),从mesc-f123(
□‑
左图,样本数量=96)和xen细胞(
☆‑
右图;样本数=40)获得的单个1np样品中测序的sox2(y轴)和oct4(x轴)读段次数之间的关系。上图表示覆盖整个基因所有探针的测序读段计数,中间图表示仅覆盖前五个探针(来自tss)的测序读段,下图表示仅覆盖每个基因(来自tss)第一个探针的测序读段。sox2和oct4基因在mesc中表达,而在xen细胞中不表达。
[0219]
(b)来自mesc-f123和xen细胞的单个超薄切片中sox2和sox17的表达。散点图显示了使用寡核酸探针设计a进行oligo-seq分析后(ol66),从mesc-f123(
□‑
左图,样本数量=96)和xen细胞(
☆‑
右图;样本数=40)获得的单个1np样品中测序的sox2(y轴)和sox17(x轴)读段次数之间的关系。上图表示覆盖整个基因所有探针的测序读段计数,中间图表示仅覆盖前五个探针(来自tss)的测序读段,下图表示仅覆盖每个基因(来自tss)第一个探针的测序读段。sox2基因在mesc中表达,但在xen细胞中不表达,sox17基因在xen细胞中表达,但在mesc中不表达。
[0220]
图10:超薄冷冻切片中的oligo-seq区分不同的细胞类型。使用来自单个切片样本的表达数据以及每个细胞切片中特定基因编码的转录物的表达水平对mesc-f123和xen细胞进行聚类。考虑探针设计a(ol66)中存在的所有靶基因,包括非表达的对照基因,对来自靶向外显子的探针的标准化读段计数的所有mesc-f123(
□
)和xen(
☆
)1np样品进行umap聚类。左上图显示了所有1np样本在y轴和x轴上的umap坐标,这些坐标清楚地区分了切片与mesc或xen细胞。根据z评分标准化表达(比例尺,以灰度表示的表达强度z评分,右上角)显示了基因ywhae(管家)、sox2和oct4(mesc特异性)以及sox17和gata6(xen细胞特异性)的表达。
[0221]
图11:超薄冷冻切片中的oligo-seq区分不同的细胞类型。使用来自1np单切片样本的表达数据以及特定基因编码的转录物的表达水平(标准化读段计数),包括非表达对照基因,对mesc-f123、肝脏和xen细胞进行聚类,所述特定基因在探针设计b(ol1823)中代表的每个基因至少有6个探针。所有mesc-f123(
○
)、肝(x)和xen(
▽
)1np样本的umap聚类。左上图(a)显示了所有1np样本在y和x轴上的umap坐标,这些坐标清楚地区分了单细胞切片与mesc(b)、xen细胞(c)或肝细胞(d)。
[0222]
图12:(a)在来自mesc-f123的单个超薄切片中,与gam(rna-gam)偶联的oligo-seq可以区分细胞状态和表达特异性3d基因组结构。与探针设计b(ol1823)杂交的mesc-f1231np样本根据其sox2探针检索(retrieval)分为不同组(最低sox2 retrieval=2691np样本,最高sox2 retrieval=1571np样本)。在sox2基因周围区域的150kb分辨率下绘制了相应的npmi接触图(小鼠基因组组装mm10,染色体3:30
–
39mb)。矩阵的灰度表示两个基因组基因座之间的归一化逐点互信息(npmi)得分。(b)mesc 1np样本中的sox2rna检测直方图(总n=507),表示为每个np检索到的sox2 umi数量,由探针设计b(ol1823)中sox2靶位点的
总数标准化。
[0223]
图13:使用oligo-seq进行rna检测在转录水平上对rnase高度敏感,显示出其高度特异性和灵敏度。oligo-seq探针设计b(ol1823)应用于经(r)或未经(nr)rnase预处理的mesc冷冻切片。从1np(上图,图a)和100np(下图,图b)定量rna。根据基因在mesc-f123 rnaseq中的表达水平(0-1,1-10,10-50,50-100,》100tpm)将其分为5组。条形图表示所采集的所有mesc-f123样本中每种基因的平均探针分数(未经过rnase处理(nr)和经过rnase处理(r)的mesc分别表示为箱线图)。tpm基因样本量(n)(0-1:455,1-10:332,10-50:457,50-100:217,》100:285个基因)。
[0224]
图14:使用探针设计b(ol1823)从1np或100np样本得到的oligo-seq结果显示,基因表达与批量rna-seq(bulkrna-seq)以及1np和100np样本之间存在高度相关性。绘制了从所有1np(b)和100np(a)样本中添加的每个基因的平均oligo-seq衍生探针评分(log10)与来自mesc总rna-seq的基因表达(tpm(log10))的对比图(基因数=1823)。rna-seq由数百万个细胞、来自507个样品(约20个细胞价值的生物材料)的oligo-seq 1np和来自15个样品(约50个细胞价值的生物材料)的oligo-seq 100np计算。对表达》1tpm的基因进行spearman秩相关(r)分析。(c)每个基因的oligo-seq表达值在1np和100np收集策略之间、y轴上为1np和x轴上为100np时具有高度再现性。对探针ol1823中包含的所有基因进行spearman秩相关(r)分析。
[0225]
图15:特定基因rna丰度的oligo-seq检测。来自mesc、xen细胞和肝细胞的超薄冷冻切片与寡核苷酸探针杂交(设计b;ol1823),洗涤前,激光显微切割并扩增寡核苷酸探针和基因组dna。从寡核苷酸探针中分别制备文库后,将样本混合并测序。基因组浏览器可跟踪100np样本中寡核苷酸探针的原始测序数据。x轴表示覆盖每个指定基因的着丝粒至端粒方向的基因组坐标。x轴下的块(基因组浏览器轨迹)代表与外显子重叠的靶位点的位置。ol1823中的所有探针都被专门映射到外显子或外显子-内含子连接处。基因轨迹显示了映射到探针参考图谱对应的探针数量。所有探针参考均按其线性基因组顺序排列。我们突出显示了四个基因,管家基因ywhae,在mesc中特异性表达的oct4,在xen细胞(以及一小部分mesc-f123)中特异性表达的gata4,在肝细胞中表达的aldob。
[0226]
图16:oligo-seq捕获mesc-f123单个超薄细胞切片中oct4和ywhae的特异性表达。散点图显示了aldob、gata4或bdnf(y轴)与oct4、ywhae或aldob(x轴)的umi数(或归一化为每个基因的靶位点数的umi数)之间的关系,这些umi是在使用寡核苷酸探针设计b(ol1823)进行oligo-seq分析后从mesc-f123获得的单个1np样本中测序得到的。oct4和ywhae基因在mesc中表达,而aldob不表达,gata4仅在在mesc-f123群体中的少数细胞中表达。
[0227]
图17:oligo-seq捕获xen细胞单个超薄切片中gata4和ywhae的特异性表达。散点图显示了aldob、gata4或bdnf(y轴)与oct4、ywhae或aldob(x轴)的umi数(或归一化为每个基因的靶位点数的umi数)之间的关系,这些umi是在使用寡核苷酸探针设计b(ol1823)进行oligo-seq分析后从xen细胞获得的单个1np样本中测序得到的。gata4和ywhae基因在mesc中表达,而aldob、oct4和bdnf不表达。
[0228]
图18:oligo-seq捕获成体肝细胞单个超薄切片中aldob和ywhae的特异性表达。散点图显示了aldob、gata4或bdnf(y轴)与oct4、ywhae或aldob(x轴)的umi数(或归一化为每个基因的靶位点数的umi数)之间的关系,这些umi是在使用寡核苷酸探针设计b(ol1823)进
行oligo-seq分析后从肝细胞获得的单个1np样本中测序得到的。aldob和ywhae基因在肝细胞中表达,而gata4、oct4和bdnf不表达。
实施例
[0229]
本发明的方法称为oligo-seq,在短的单链寡核苷酸与核酸严格杂交之后,分离杂交的寡核苷酸,最后通过它们的测序或pcr扩增,检测所述核酸的存在或丰度,例如组织、细胞或隔室中不同rna物种的存在或丰度。寡核苷酸包含与目的核酸同源的区域和已知序列的侧翼区域,其用于寡核苷酸扩增和检测的目的,以及用于分配给例如rna物种(图1)。oligo-seq的改进的实施方式通过回收和测序隔室的基因组dna内容物,与rna杂交的寡聚核苷酸探针的提取和测序并行,将rna检测与基因组结构映射相结合(图3b)。其它实施方式可涉及用相似的寡核苷酸序列标记其它类型的探针(例如抗体),或标记样品(例如来自组织切片的不同空间坐标,或来自不同患者的样品,以实现诊断环境中的大量平行测序)。
[0230]
优选的探针结构
[0231]
每个探针的中心靶区对小鼠基因组(基因组版本号mm10(mm10 assembly))内的一个单独靶位点是唯一的,并且大约35-50bp长(同源性区,hr;图1)。检查每一个靶序列以排除任何形成二级结构的可能性,并且具有热稳定性以耐受在40%甲酰胺中47-60℃的严格洗涤。
[0232]
任选地,在靶区的任一侧是序列条形码,如原理证明ol66文库中所示(图1,oligo设计a)。5’条形码(b1)由所有靶向给定基因的探针共享,3’条形码(b2)由所有靶向同一基因外显子或内含子的探针共享。b1和b2允许通过fish或qpcr独立靶向不同的基因区域。条形码与全基因组序列(mm10 assembly)比对,以确保它们不表现出互补性,从而避免侧翼区与特定rna的非特异性结合。
[0233]
在每个探针的末端有两个通用引物区(up1和up2;图1)。首先,它们能够扩增来自原始贮备的探针。其次,它们可以很容易地将illumina兼容引物附加到每个寡核苷酸上进行测序。此外,通用靶区可用作fish的靶位点,用于在优化阶段期间快速验证目的区室中成功的探针杂交,尽管这一步骤对于本发明不是必需的。
[0234]
在可替代的设计中,探针结构可以仅包含与目的rna物种的同源性序列,以及5’和/或3’通用引物序列,而没有分配给外显子/内含子的条形码。探针结构还可以包含一个或多个条形码序列,用于某些靶位点特性、与fish检测的兼容性(用于验证/优化目的)和pcr方法(用于优化和作为独立实施)。探针结构还可包括umi,以减少pcr偏差并解决探针丰度测量问题(图1)。
[0235]
唯一分子标识符(umi)可替代地或者也可被引入(图1,寡核苷酸设计b和c),其是通常在4-12个碱基对之间的一串随机核苷酸。通过随机机会,umi对于寡核苷酸杂交池中的每个靶向寡核苷酸是唯一的,即靶向相同靶区的寡核苷酸将具有不同的umi序列。umi用于提高测序后的准确度,并定量评估样本中存在的原始池rna。
[0236]
构建了两种探针设计,并在两个独立的探针文库中展示了其特性。探针文库oligo-批号66(ol66),在图1中表示为oligo设计a,其具有~35bp的靶区、两个侧翼条形码区和位于每端的通用引物区。探针文库oligo-批号1823(ol1823),具有约45bp的目标区域、两个侧翼通用引物和一个8bp umi(图1,oligo设计b)。
[0237]
原理验证:rna检测
[0238]
对于原理验证文库ol66,我们将重点放在66个基因的一个子集上(图2a)。我们随后的文库ol1823被扩大到覆盖1823个基因(图2b)。
[0239]
对于ol66,我们选择了适用于本方法实施中所用细胞类型的关键细胞类型标记。我们旨在测试oligo-seq区分不同细胞类型的能力。这需要检测66个基因是否足够,并确定每个基因所需的探针数量、非特异性探针在隔室中的保留水平以及对高表达和低表达基因的敏感性。我们选择了两种具有不同基因表达谱的发育接近的细胞类型:小鼠胚胎干细胞(mesc;细胞系f123)和胚胎外内胚层细胞(xen细胞系im8a1),以及成体组织内的小鼠肝细胞。我们选择了对在mesc或xen细胞中表达的基因具有特异性的探针。例如,oct4基因在mesc中表达,而在xen细胞中不表达,而gata4基因在xen细胞中表达,而在mesc中不表达。为了评估探针对非表达转录物的背景保留,我们还纳入了对神经元中表达的基因特异的探针,以及一些对多巴胺能神经元特异的探针(如编码酪氨酸羟化酶的th)。mesc和xen细胞均主动分裂。因此,我们进一步选择检测细胞周期标记物,其在两种细胞类型中表达,但根据细胞周期阶段在分裂细胞群的不同细胞中以不同水平表达。我们还包括针对高度表达且经过充分研究的lncrna的探针,这些lncrna在核亚区中具有优先定位,并在3d架构中发挥作用(malat1、firre、neat1和xist)。我们还包括针对编码多能性因子的rna的探针。例如,nanog是一种在mesc群体中以不同水平表达,在xen细胞中不表达的转录因子。为了探索oligo-seq的灵敏度,我们还根据基因的长度加入了不同数量的基因探针,例如将1100个探针(占所有探针的9.8%)分配给satb2(在mesc或xen细胞中不表达的长神经元基因),将17个探针分配给sox2(在mesc中表达而xen细胞中不表达的较短基因)。还包括针对具有不同表达水平的管家基因的探针(基因ywhae和eif3h高表达,基因faim和alyref2低表达)。所有测试的管家基因在mesc与多巴胺能神经元之间的分化时间线上表现出一致的表达(ferrai等人,2017,rna polymerase ii primes polycomb-repressed developmental genes throughout terminal neuronal differentiation.mol.syst.biol.13,946)。考虑具有不同表达水平的基因有可能帮助校准目的基因的表达,并为成功的实验设计提供细胞类型独立对照。
[0240]
我们的第二个探针文库ol1823(90,941个单独的寡核苷酸探针;来自customarray公司,参见方法)展示了来自nanostring.com的用于微阵列分析的基因组合。在ol1823文库中,我们靶向了更广泛的基因,涵盖了预期靶细胞类型中的表达范围,并将非表达基因作为阴性或非特异性背景对照。所选基因集中于以下nanostring基因组合:细胞周期、诱导多能干细胞(ips)细胞、干细胞、干细胞信号传导、干细胞转录因子、造血、polycomb和trithorax靶基因、神经递质受体、学习和记忆、dna损伤修复、染色质修饰酶、染色质重塑复合物、notch通路、wnt通路、细胞因子、hippo通路、间充质干细胞、notch靶基因、代谢途径,其中1310/1823基因在mesc中的表达量超过百万分之一;513/1823个基因未表达。
[0241]
对于ol66,除了靶向内含子的探针数量减少的超长基因之外,所有基因都被完全靶向,包括外显子和内含子(图2a)。因此,靶向每个基因的探针数量因基因而异,这在本原理验证中是特意的,作为评估每个基因的靶向探针数量与我们检测表达以及从每个基因中检索最大量信息的能力之间关系的一种手段。例如,我们旨在了解转录物的不同区域或靶rna区域的序列组成是否具有优先的特异性和灵敏度。
[0242]
对于ol1823,靶位点仅限于外显子和外显子内含子重叠。39-45个核苷酸的靶位点由来自oligopants的公开数据库确定,mm10“严格”的基因组坐标与目的基因重叠,并且对其核酸序列进行了链校正。ol1823靶位点的设计杂交温度为47℃,tm为47-52℃,mm10基因组装配长度为18mer kmer(https://www.pnas.org/content/115/10/e2183)。(https://oligopaints.hms.harvard.edu/genome-files)。
[0243]
我们期望未来的实施方式使用提供稳健的检测潜力的最少数量的探针,其可以在不同的应用中变化,例如,限定复杂组织中细胞类型的组成可能需要不同数量的探针或基因,而不是限定治疗或疾病在细胞类型的表达谱中的作用。
[0244]
基于公布的分化为神经元的mesc的rna-seq数据(ferrai等人,2017年),选择了涵盖66个不同长度、表达模式(例如仅在mesc或xen细胞中,或在两者中,或两者均没有,例如神经元基因)和表达水平的基因(ol66)的寡核苷酸文库(图2)。对于每种基因,探针包括覆盖外显子或内含子的寡核苷酸,无内含子基因除外。在某些情况下,一个基因(如h3f3a)的外显子仅被单个寡核苷酸覆盖,而其他基因(如lhx1)的外显子则被99个寡核苷酸探针覆盖。类似地,基因的内含子被不同量的寡核苷酸探针覆盖。例如,hspa8的内含子被7个寡核苷酸覆盖,而satb2的内含子被1031个寡核苷酸覆盖。共531个探针覆盖了神经元基因bdnf,以研究esc中rna检测的背景和特异性。
[0245]
对于涵盖1823个基因ol1823的寡核苷酸文库,包括了上述nanostring组中的所有基因。例如,基因hmcn1最多被313个探针覆盖,而基因ubb、ndufb4、pcna、ifna1、cbx3、bcl2a1a最少被1个探针覆盖。
[0246]
生物材料与超薄冷冻切片
[0247]
作为原理验证,我们使用来自mesc、xen细胞和肝(组织)细胞的超薄冷冻切片实施了oligo-seq。在没有树脂包埋的情况下,通过改良的tokuyasu方法制备了薄核冷冻切片(tokuyasu,k.t.,1973;guillot 2004;pombo等人,1999)。使用经hepes缓冲的电镜级甲醛固定后,将细胞包埋在饱和蔗糖溶液中进行冷冻保护,然后在液氮中冷冻。在leica ultracut低温切片机中于-100℃切割厚度约220nm的超薄冷冻切片,并转移至玻璃盖玻片上以验证杂交,或转移至激光显微切割pen载玻片上以进行寡oligo-seq。
[0248]
通过rna-fish在超薄冷冻切片上进行寡核苷酸文库杂交的验证
[0249]
为了检测oligo-seq探针ol66是否能有效地与小鼠胚胎干细胞(esc)杂交,我们首先将其用于超薄冷冻切片上的荧光原位杂交(rna-fish)。已知超薄冷冻切片可保留细胞核和细胞质中的细胞rna内容物,同时允许在hela细胞中有效杂交fitc标记的寡核苷酸-dt探针(xie sq和pombo a,2006,distribution of different phosphorylated forms of rna polymerase ii in relation to cajal and pml bodies in human cells:an ultrastructural study.histochem.cell biol.125,21-31;branco等人,2006),并提供单个短rna的有效检测,如在hepg2细胞中激活后的upa/plau基因表达(ferrai等人,2010)。
[0250]
将oligo-seq文库(ol66)与来自固定和蔗糖包埋的mesc的冷冻切片杂交后,对未结合或部分杂交的探针进行严格洗涤,并通过与荧光标记的、与寡核苷酸探针侧翼区通用序列具有同源性的较短ssdna寡核苷酸进行二次杂交,揭示保留在切片中的杂交探针(beliveau等人,2012)。正如预期,在细胞质和细胞核中检测到荧光信号,包括在细胞核中称为染色质间区或剪接斑点的染色质贫乏区域(箭头;图4)。通过用rnase预处理切片(图4,
+rnase),并通过核仁中探针信号的缺失(星号;图4)证实对杂交rna的寡核苷酸检测的特异性,所述核仁富含新生和成熟的核糖体rna,但不富含本探针文库靶向的蛋白编码转录物。
[0251]
冷冻切片上的oligo-seq杂交
[0252]
作为原理验证,我们将oligo-seq与gam结合,并使用了来自mesc、xen和肝组织细胞的超薄冷冻切片。同时提取寡核苷酸探针和细胞基因组dna,并根据gam程序并行扩增寡核苷酸序列与基因组dna(如图3所示)(beagrie等人,2017;beagrie等人,2020,multiplex-gam:genome-wide identification of chromatin contacts yields insights not captured by hi-c.biorxiv 2020.07.31.230284;doi:https://doi.org/10.1101/2020.07.31.230284)。作为对mesc或xen细胞中是否存在细胞类型特异性转录物的首次探索,我们根据图5b中概述的程序,通过使用与通用探针序列同源的引物进行qpcr。在lmd塑料包被载玻片上使用甲酚紫染色的冷冻切片进行激光显微切割(lmd),我们从(a)mesc-f123、(b)xen细胞和(c)使用rnase预处理的mesc-f123细胞中收集了几批约100个单个核切片到单个pcr管中,如方法中所述。发现对mesc(sox2,oct4)和xen细胞(sox17,gata6)特异的基因在其各自的细胞类型中更富集(即以较低的pcr循环扩增值检测到)(图6a),并且对在两种细胞类型中表达的高表达malat1 lncrna表现出等同的富集。bdnf(在两种细胞类型中均不表达的神经元标志物)在所有分析样本(包括经rnase处理的mesc)中均显示出较高的pcr循环次数。经rnase处理的mesc样本未富集细胞类型特异性基因标记。
[0253]
接下来,我们通过使用(图3b)中所述的途径产生文库,使用ngs法开发oligo-seq。我们采用了内部开发的方法,用于在gam途径内提取和扩增基因组dna。winick-ng等人2020(也发表于winick-ng等人,2021,cell-type specialization is encoded by specific long-range chromatin topologies.nature中,正在出版)中概述了适应的malbac方法,其基于malbac全基因组扩增方法(zhong c等人,2012,genome-wide detection of single nucleotide and copy number variations of a single human cell,science,338(6114):1622
–
1626.),用于对寡核苷酸探针的平行检测,详见以下方法。
[0254]
简而言之,为了从我们的样本中的探针产生测序文库,我们设计了引物,将与illumina nextera试剂盒兼容的序列附加到每个寡核苷酸的末端。将这些引物直接整合到我们的内部全基因组扩增中,从而在同一反应中同时pcr扩增探针和基因组dna。用核酸外切酶i消化多余的引物。接下来,将含有扩增的寡核苷酸探针和基因组dna的pcr反应一分为二,以使来自相同样品(含有1np或100np)的探针和基因组dna能够独立扩增(图3b)。探针和基因组dna测序文库分别编入索引。可选地,可以将肽核酸(pna)包括在方案的索引步骤中,以减少因引物和寡核苷酸错配导致的不希望的测序结果。纳入了与gam程序中使用的gat-com序列互补的pna,以防止在最终测序文库中出现含有gat-com序列的读段。然后将dna文库合并,在nextseq illumina测序仪中进行相同序列的测序(75bp读取长度,单端测序)。使用ol66,我们从mesc共产生198个dna文库,包含96个基因组文库和96个探针文库以及6个dna文库,其中96个基因组文库和96个探针文库来自96个各含1np的样本,6个dna文库包含6个基因组文库和6个探针文库,其来源于6个各含100np的样品(表4)。我们还从寡核苷酸杂交前用rnase处理的mesc和xen细胞中产生了类似的文库,如表4所示。测序后(基因组文库200-400万次读取,每个探针文库约500000次读取),对读取进行解复用,得到每个样本两个独立的fastq文件,一个用于rna-gam寡核苷酸探针,一个用于细胞基因组dna。详细说明见
下文方法概述。
[0255]
基因组测序文件被映射到参考小鼠基因组(assemblymm10),每个样本必须通过质量控制分析,多个参数的典型的gam数据分析(beagrie等人,2017,winick-ng等人,2020),尤其是孤立窗口的百分比(《60%)和唯一映射读段的数量(》25000)。这些参数表明提取不完全、激光显微切割失败或很少发生的污染(在原理验证实验中采集的154份1np生物样本中,129份通过质量控制)。质量控制可如winick-ng等人,2020中所述进行。表4列出了收集的所有样本。为了映射探针组的测序读段,我们构建了一个探针参考序列图,将包括探针特异性条形码和引物在内的所有探针序列并置,使探针按其在mm10中的基因组定位排序。由bowtie2确定的映射质量差的低质量读取,即映射到一个唯一位置的概率低的读取被删除。由于每个探针从相同的起始位置(5’端)测序以75bp的读长进入rna靶同源性序列(图1,图7),从oligo-seq获得的原始数据是与目的rna物种上每个独特靶位点的探针同源的测序读取的离散计数。然后可以直接基于与探针参考基因组比对的读取计数应用rna的简单汇总统计。对于探针库ol1823,通过计算从测序读段中提取umi并去重,以给出使用umi工具(https://umi-tools.readthedocs.io/en/latest/index.html)测序的单个探针的定量计数。
[0256]
表4:ol66oligo-seq数据集采集。下表示出了在1np或100np模式下采集的样本总数。
[0257] mescmesc+rnasexen细胞1np962640100np622合计1022842
[0258]
表5:探针设计a(ol66)中包含的66个基因列表。根据其在mesc、xen细胞和/或神经元细胞中的表达选择基因。它们普遍表达或在特定细胞类型中表达,或在不同细胞类型之间或在其细胞类型内以不同水平表达(如nanog)。
[0259]
[0260]
[0261][0262]
表6:ol1823 oligo-seq数据集采集
[0263]
[0264][0265]
在将单个核剖面(1np)或100np激光显微切割到单个pcr管中后,产生了三个ol66集合,包括mesc-f123、经rnase处理的mesc-f123和xen细胞(表4)。以“批量”样本的形式收集100np样本,每个样本中的细胞物质总含量为约3-5个细胞。将不同组的含100np mesc或xen细胞的样本映射至探针参考图谱后,我们发现了明确的证据来检测映射到管家基因(ywhae)的寡核苷酸探针,尤其是在外显子区域。由于表达基因的外显子既存在于转录位点(在新生rna中),也存在于成熟mrna分子中(其从细胞核迁移到细胞质以翻译成蛋白质),因此预期在外显子区域进行优选的寡核苷酸检测(图8a)。相反,在表达基因的整个内含子中也检测到内含子序列,但丰度较低,因为内含子通常存在时间短,在新生mrna剪接时会立即降解。在ol1823中还观察到对每种细胞类型具有特异性的基因富集,oct4在mesc中高度富集,gata4在xen细胞中高度富集,aldob在肝脏中高度富集,ywhae在所有细胞类型中高度富集(图15)。
[0266]
接下来,我们检测了冷冻切片中rna的oligo-seq映射是否干扰了基因组dna的检测,如在gam中。我们发现,对1np样本测序得到的读段分布显示了预期的特征(图8b),存在罕见但连续富集的基因组dna检测斑点,这些斑点在样本之间存在差异,如预期的那样,这是由于以随机方向对细胞核进行了切片。这一观察结果非常有价值,因为从亚细胞隔室(如薄(200纳米厚)冷冻切片)中提取和检测基因组dna可能容易受到污染,尤其是在dna提取前首先对生物样本进行额外处理(如oligo-seq)时。然而,我们发现将gam与oligo-seq相结合可以成功实施,因为所收集的大多数样本(样本中ol66约85%,ol1823约62%具有》25000个唯一映射的读取值且《60%的孤立窗口)都通过了我们当前针对gam数据的qc筛选步骤。
[0267]
当对ol1823衍生的个体1np的整个基因(图8a)的探针计数求和时,细胞类型特异性基因aldob(肝)、oct 4(mesc)和gata4(xen细胞)的富集也很明显。正如对个体1np的预期,神经元标志物bdnf在xen细胞、mesc和肝细胞中的检测水平较低。
[0268]
对于ol66,对于某些基因,来自转录起始位点的前5个探针足以鉴定细胞类型特异性信息(图9a)。例如,相比于与sox17互补的寡核苷酸(xen特异性),来自mesc的冷冻切片与高丰度的与sox2互补的寡核苷酸(mesc特异性)杂交,sox17则相反(图9b)。
[0269]
使用umap(https://umap-learn.readthedocs.io/en/latest/basic_usage.html)每个样本的每个基因的探针计数总和可以成功地产生由mesc、肝脏和xen细胞类型产生的样本的细胞类型特异性簇,表明每个样本都富集了由其已知细胞类型表达的转录物(图10,图11)。通过预先标准化、探索除每个基因的原始探针计数之外的rna丰度的改进度量以及基于oligo-seq序列对低质量探针和样本的潜在过滤,可以进一步改进聚类。
[0270]
对于ol1823,我们进一步证实了在mesc、xen细胞和肝细胞之间检测细胞类型特异性转录物的特异性(图16-18)。从单次(1np)mesc冷冻切片收集的oligo-seq数据中未表达aldob(肝标记基因)、gata4(xen细胞标记)和bdnf(神经元标记),少数数据集有罕见例外情况,由于在含有lif的血清中的mesc培养物中存在3-5%的gata4阳性细胞,因而正如预期。oct4(mesc标记物)或ywhae(细胞周期标记物)相反(图16)。aldob、bdnf和oct4在单(1np)xen细胞冷冻切片中未表达,而gata4和ywhae表达(图17)。最后,在单个(1np)肝细胞冷冻切
片中,检测到aldob和ywhae的表达,但未检测到oct4或gata4的表达(图18)。
[0271]
使用umap(https://umap-learn.readthedocs.io/en/latest/basic_usage.html)每个样本的每个基因的探针计数总和可以成功地产生由mesc、肝脏和xen细胞类型产生的样本的细胞类型特异性簇,表明每个样本都富集了由其已知细胞类型表达的转录物(图10,图11)。重要的是,oligo-seq能够捕获3-5%的向xen样谱系分化的mesc细胞(图11)。通过预先标准化、探索除每个基因的原始探针计数之外的rna丰度的改进度量以及基于oligo-seq序列对低质量探针和样本的潜在过滤,可以进一步改进聚类。
[0272]
为了研究oligo-seq检测到的转录组表达的线性,我们使用mesc中100np或1np的ol1823将每个基因检测到的表达值与相同细胞类型的批量总rna-seq关联起来。如在图14中所见,1np和100np数据都与通过批量rna-seq和高于1tpm(spearman等级检验r=0.85)的从数百万个细胞定量的基因表达高度相关,对于在1tpm以下的批量rna-seq中表达的基因,噪声水平低且一致,这通常被认为是基因表达的最小阈值。在oligo-seq杂交和进一步加工之前,通过定量来自用rnasea预处理的样本的表达来检测oligo-seq的特异性(图13)。对于表达的基因,在经rnase处理的样本上检测到较高的基因表达,与表达水平无关,包括100np和1np中最低表达范围(1至10tpm)的基因(单侧t检验p《0.001)。在经rnase处理的样本中,oligo-seq检测到的基因表达背景水平不显著,与基因表达无关,证明了检测的特异性和灵敏度。
[0273]
为了举例说明与gam(rna-gam)偶联的oligo-seq如何能够提供特定于细胞状态的3d基因组信息,我们根据其表达,研究了3号染色体上含有sox2基因座的基因组区域的3d基因组构象(图12)。通过将sox2转录物最高检出率(157/507)的rna-gam样本与最低/未检出率(269/507)的rna-gam样本分离(图12b),我们发现在sox2探针计数最低的细胞中,sox2基因座高度凝聚(有强接触),在sox2转录物表达最高的细胞中高度解凝(图12a)。
[0274]
从目前的数据中,可以得出结论,对于包含来自单个细胞的单个碎片或一百个这样的碎片的每个样本,可以使用oligo-seq来检索rna丰度和基因表达信息。重要的是,可以根据细胞来源的细胞类型,使用来自代表胚胎第一谱系承诺的细胞系的两种非常接近的细胞类型,仅基于oligo-seq测序读段,对样本进行无偏聚类,这可能允许从复杂的异质组织进行细胞类型聚类。一个令人惊讶的结果是表达检测所需的探针数量最少,约为5(图9a,下图;
[0275]
图9b,下图)。
[0276]
作为oligo-seq的一个独立应用,有可能扩展到液滴单细胞测序技术中,我们使用悬浮细胞测试了oligo-seq的应用。我们在溶液中收集了完整细胞(mesc,克隆46c),并根据以下方法制备细胞,其中oligo-seq杂交在含有ol66的溶液中进行。杂交后和严格洗涤后,将细胞重悬于pbs中,将约1至20个mesc分别等分至不同pcr孔中,并通过qpcr分析细胞类型特异性基因寡核苷酸探针的存在情况,详见方法。如预期的那样,与初始探针文库组成(直接来自贮备的探针)相比,mesc对mesc表达的基因(sox2和oct4)和普遍表达的基因lncrnamalat1表现出富集。如预期的那样,mesc对xen细胞中表达的基因的特异性寡核苷酸探针几乎没有可检测到的富集(sox17和gata6),对神经元标志物bdnf没有富集(图6b)。
[0277]
采用流式细胞术技术分离单细胞。全细胞杂交后产生的oligo-seq样本与薄的冷冻切片产生的样本相当,因此也可以扩增,用于下一代测序,因为它们是用相同的寡核苷酸
文库和结构进行杂交、提取和扩增,用于测序(图1),如上述结果所示。测序的生物学结果也将保持一致。
[0278]
材料与方法
[0279]
靶位点识别
[0280]
选择靶向基因体和外显子的探针序列,并以fasta格式编译成其基因组序列。首先可以筛选基因组序列以排除重复元件(http://repeatmasker.org/)。可以对潜在的靶位点进行过滤,以获得均聚程序、“n”碱基、靶位点长度、gc含量以及通过最近邻动力学预测的有利且一致的解链温度(tm)(santaluciaj,jr(1998)a unified view of polymer,dumbbell,and oligonucleotide dna nearest-neighbor thermodynamics.proc natl acad sci usa 95:1460-1465)。通过这些过滤器的所有候选位点可以被编译成fastq格式,然后可以与目标物种的整个基因组进行比对,以检查每个候选位点是否唯一,并且不与基因组的多个位置进行比对;用于ngs数据的公开可用的常用比对软件是bowtie和bwa(langmead b,trapnell c,pop m,salzberg sl(2009)bowtie:an ultrafast memory efficient short read aligner.genome biol 10:r25.46;langmead b,salzberg sl(2012)fast gapped-read alignment with bowtie 2.nat methods 9:357-359.47;li h,durbin r(2010)fast and accurate long-read alignment with burrows-wheeler transform.bioinformatics 26:589-595)。ngs比对软件也可以报告设计的探头到靶位点的可测绘性。可以使用公开可用的软件检查筛选出的一组筛选的且独特的靶位点,以筛选二级结构(dirks rm,pierce na(2003)a partition function algorithm for nucleic acid secondary structure including pseudoknots.j comput chem 24:1664
–
1677),删除或连接重叠的靶站点和重复性高的kmer(g,kingsford c(2011)a fast,lock-free approach for efficientparallel counting of occurrences of k-mers.bioinformatics 27:764-770)。靶位点可以转化为其反向补体,以靶向dna链的任一侧,这是靶向rna所必需的。可以将靶位点序列和基因组范围格式化为标准bed格式,以便于基因组浏览器的查看和数据处理(quinlan ar,hall im(2010)bedtools:a flexible suite of utilities for comparing genomic features.bioinformatics 26:841-842)。使用适当的对照(例如,rnase治疗或生物相关组织)最终通过实验验证每种oligo-seq探针的特异性,如果通过计算从数据分析中去除部分或完全非特异性的话。与其他ish技术相比,在寡核苷酸的离散水平上能够去除已识别的非特异性结合事件的能力具有明显的优势,所述其他ish技术例如fish和以nanostring为例的基于微阵列的技术在其检测方法中无法区分单个寡核苷酸。
[0281]
探针合成
[0282]
ssdna寡核苷酸从customarray公司(博塞尔,wa98011,美国)订购。customarray提供了含有数千个寡核苷酸的文库,这些寡核苷酸是使用cmos半导体技术同时合成的。
[0283]
使用与存在于文库up1和up2内的所有探针上的通用引物末端互补的引物,将寡核苷酸文库的原始贮备进行pcr扩增并作为dsdna文库安全储存(图1)。如所述,通过t7扩增和逆转录反应将寡核苷酸文库转化为ssdna探针贮备用于杂交(beliveau等人,2017)。替代扩增方法可从例如https://oligopaints.hms.harvard.edu/protocols获得。
[0284]
通过先前的pcr将umi附加到每个寡核苷酸的5’端,如下:(kapa gc缓冲液
(kb2501)20μl,seq id:10引物100μm贮备0.5μl,seq id:4100μm贮备0.5μl,dntp(kn1009)混合10mm 4μl,kapahifi聚合酶(ke2004)1u/μl贮备5μl,50ng寡核苷酸文库贮备,水至100μl)。pcr程序如下:95℃5min,(95℃30s,58℃30s,72℃45s)
×
12,72℃5min。然后如上继续附加的寡核苷酸文库以产生ssdna探针贮备。
[0285]
细胞生长和固定。
[0286]
用于薄的冷冻切片中oligo-seq的小鼠es细胞(mesc)属于f123系。在悬浮的全细胞中用于oligo-seq的小鼠es细胞(mescs)属于46c系,是e14tg2a的sox1-gfp衍生物。
[0287]
在有丝分裂失活的饲养鼠胚胎成纤维细胞(mef)层(gsc-6201g,global stem)上培养mesc(克隆f123)。饲养细胞在37℃饲养培养基(90%dmem(11995-065,gibco),10%胎牛血清)中生长,接种后最多可使用10天。在培养mesc前一天,用0.1%明胶包被培养皿,并以约1500个细胞/mm2的密度铺板灭活的饲养细胞。饲养层稳定后(铺板后约4-12小时),将mesc接种到饲养层上,并在37℃下在mesc-f123培养基(dmem(11995-065,gibco)中生长,培养基中添加了15%敲除血清替代物(ksr,10828028,invitrogen)、1
×
谷氨酰胺酶(35050,gibco)、10mm非必需氨基酸(11140-050,gibco)、50μmβ-巯基乙醇(31350011)和1000u/ml lif(gfm200,cell guidance systems)。每隔48小时将细胞分裂到新的涂有饲养层的培养皿上,每隔24小时更换培养基。通常,在两次传代后,通过将细胞分裂到未涂覆的培养皿上30分钟,从mesc培养物中除去饲养层细胞。mef快速沉降,而mesc保持悬浮状态。将细胞悬液转移到一个新的未包被的平板上保持30分钟,以提高去除饲养层的效率,然后将细胞接种到明胶包被的培养皿上(esgro完全明胶;sf008,merck)。48小时后重复去除饲养层过程。随后将mesc铺板用于收获。由于去除饲养层会导致培养物中的lif水平降低,因此当细胞处于无饲养层培养条件下时,培养基中的lif浓度增加了一倍。约48小时后,在70-80%汇合时收获细胞。
[0288]
mesc,克隆46c,细胞在5%(v/v)co2培养箱中于37℃在gmem培养基(invitrogen,#21710025)中生长,所述gmem培养基在明胶包被的(0.1%(v/v))nunc t25烧瓶上补充有10%(v/v)胎牛血清(fcs;paa,#a15-151)、2u/ml lif(millipore,#esg1107)、0.1mmβ-巯基乙醇(invitrogen,#31350-010)、2mm l-谷氨酰胺(invitrogen,#25030-024)、1mm丙酮酸钠(invitrogen,#11360039)、1%青霉素-链霉素(invitrogen,#15140122)、1%mem非必需氨基酸(invitrogen,#1122)。每天更换培养基,隔天分裂细胞。采集样本前,将mesc置于明胶包被(0.1%(v/v))的nunc 10cm培养皿上,培养基为无血清esgro完全克隆级培养基(millipore,#sf001-500),含1u/ml lif。细胞生长48h,24h更换培养基。
[0289]
小鼠胚胎外内胚层(xen)细胞来源于原始内胚层(kunath等人,2005,imprinted x-inactivation in extra-embryonic endoderm cell lines from mouse blastocysts.development 132,1649-1661)。xen细胞(克隆im8a1,kunath等人,2005)在补充了20%fcs、2mm l-谷氨酰胺、1mm丙酮酸钠和0.1mmβ-巯基乙醇的rpmi的0.1%明胶包被表面上于37℃、5%co2培养箱中培养。
[0290]
按照moellera等人(2012mol.cell.proteomics,10.1074/mcp.m111.011767-2)的描述处理肝组织。简言之,在用pbs进行心内灌注后,然后在0.25m hepes-naoh溶液中用4%新鲜解聚的多聚甲醛采集肝组织。将组织在冷的4%pfa/hepes溶液中切成1.5mm的碎片,并在8%pfa/hepes中固定(2h)。将固定组织包埋在2.1m蔗糖/pbs溶液中,冷冻并储存在液氮
中,直至冷冻切片以进行oligo-seq。
[0291]
冷冻切片的制备
[0292]
如前所述,制备细胞用于冷冻切片(beagrie等人,2017)。简言之,将细胞固定的250mm hepes-naoh溶液(ph 7.6,分别为10分钟和2小时)的4%和8%多聚甲醛中,造粒,包埋(2小时)在pbs中的2.1m蔗糖中,并在液氮中冷冻在铜柱上。冷冻细胞可以无限期储存在液氮中。使用疏水笔绘制一个约1
×
2cm的小矩形,制备金属框架载玻片的lmd 4μmpen膜(leica)。冷冻切片前,对用于切割冷冻切片的玻璃刀和用于冷冻切片转移的lmd pen膜进行紫外线处理(45min,λ=385nm)。使用ultracut uct 52超低温切片机(leica,英国米尔顿凯恩斯)在玻璃刀上切割厚度约为220nm的超薄冷冻切片。将切片采集在pbs液滴中的不含rnase的2.1m蔗糖液滴中,固定在铜环上,然后转移到lmd 4μm pen膜覆盖的玻璃载玻片上进行激光显微切割(leica,英国米尔顿凯恩斯)或转移到玻璃盖玻片上进行rna-fish。
[0293]
细胞/组织冷冻切片在lmd pen膜上的寡核苷酸探针杂交
[0294]
在加热到37℃(或在30℃至60℃之间,但理想情况下为37℃,温度越高,特异性越高)之前,通过彻底清洁腔室并通过用无菌水引入润湿的吸墨纸来制备用于孵育的杂交烘箱。所有步骤均在无rnase条件下进行,所有试剂均为分子生物学级试剂。
[0295]
将lmd载玻片(用于oligo-seq)或玻璃盖玻片(用于rna-fish)上的冷冻切片在0.2μm过滤的分子生物学级pbs中洗涤(3次,每次5min),以洗掉冷冻切片中的蔗糖溶液。将冷冻切片在0.5%(v/v)triton x-100的pbs溶液中渗透(10min),然后在pbs溶液中洗涤(3次,每次5min)。
[0296]
对于阴性对照样本,冷冻切片在triton x-100处理后用rnase处理。上一步骤的第二次pbs洗涤后,用2
×
ssc冲洗冷冻切片,并在加湿室中在250μg/mlrnasea的2
×
ssc中孵育(2h,37℃)。未处理的样本在室温(约20℃)或4℃保存在2
×
ssc中。
[0297]
将初级探针杂交混合物(2
×
ssc、30%甲酰胺、2mm氧钒核糖核苷复合物、1mg/ml酵母trna、10%硫酸葡聚糖、0.1μm初级探针)在78℃下变性(3min),在冰块上冷却并于4℃保持最长4h,直至完成透化和rnase处理。
[0298]
与探针杂交前,仅在含有冷冻切片的pen膜一侧用洗涤缓冲液(30%甲酰胺,2
×
ssc,2mm氧钒核糖核苷复合物)冲洗冷冻切片(2次),并用洗涤缓冲液孵育(5分钟,室温)。小心去除洗涤缓冲液,并使用经过紫外线处理的滤纸从lmd载玻片的边缘去除多余的缓冲液。将初级探针杂交混合物(40μl)置于lmd一侧的冷冻切片位置上。将不含rnase的hybrislip(invitrogen)小心覆盖在初级探针杂交混合物上,然后用橡胶胶泥密封。为了有助于去除杂交后的hybrislip(分子探针),使用了大量的橡胶胶泥,并将其涂抹到载玻片的金属边缘。ol66的样本在杂交烘箱内的潮湿室中于37℃培养(超过36h,或4-48h),对于ol1823,在47℃(或30℃至60℃,理想情况下在37℃)培养。
[0299]
杂交后,通过将其轻轻覆盖在洗涤缓冲液中,松开lmd载玻片上的橡胶胶泥层,并与hybrislip一起小心去除。在洗涤缓冲液中快速冲洗pen膜上的冷冻切片,以避免干燥。使用洗涤缓冲液于47℃对ol66进行严格洗涤(3次,每次20min),以去除多余的初级探针。对于ol1823,在室温下在2
×
ssc中进行严格洗涤(4次,每次5min)。通过在pbs中洗涤(3次,每次5分钟)去除洗涤缓冲液或2
×
ssc。用水冲洗lmd载玻片1次,并在1%甲酚紫水溶液中孵育(20分钟)。通过用水冲洗lmd载玻片的顶部和反面(每次3次)来去除过量的甲酚紫,并使其干
燥,然后立即进行lmd(可以在激光显微切割之前储存杂交样本,例如在4℃的pbs中储存,但目前未检测储备)。
[0300]
核剖面的分离
[0301]
使用leica激光显微切割显微镜(leica microsystems,lmd7000)和63
×
干式物镜,通过激光显微切割从冷冻切片中分离出单个np。在明场成像下鉴定来自单个细胞的切片,并使用激光切割每个细胞周围的滑膜。将切下的细胞切片收集到pcr胶盖中(adhesivestrip8c不透明;carl zeiss microscopy#415190-9161-000)。在每个平板采集中,采集了两个面积相当于100np或1np的空膜区域作为阴性对照。这些阴性对照也用于制作用于质量控制目的的测序文库。将adhesivestrip盖上的激光显微切割样本储存在-20℃下,直至下一步使用。
[0302]
wga
[0303]
gat-7n:gtgagtgatggttgaggtagtgtggagnnnnnnn(seq id no:1)
[0304]
gat-com:gtgagtgatggttgaggtagtgtggag(seq id no:2)
[0305]
ol66正向探针引物:ggcacaacgttgcagcacag(seq id no:3)
[0306]
ol66/ol1823反向探针引物:caccaacgctaccagctccg(seq id no:4)
[0307]
ol66探针引物a merev正向:tcgtcggcagcgtcagatgtgtataagagacagggcacaacgttgcagcacag(seq id no:5)
[0308]
ol66/ol1823探针引物b merev反向:gtctcgtgggctcggagatgtgtataagagacagcaccaacgctaccagctccg(seq id no:6)
[0309]
ol1823正向探针引物:gaccagcccacatcgcactg(seq id no:7)
[0310]
ol1823探针引物a merev正向:tcgtcggcagcgtcagatgtgtataagagacaggaccagcccacatcgcactg(seq id no:8)
[0311]
pna序列:gtgagtgatggttgaggtagtgtggag(seq id no:9)
[0312]
ol1823 umi附加-gaccagcccacatcgcactgnnnnnnnnggcacaacgttgcagcacag(seq id no:10)
[0313]
裂解混合物:(21mm tris-hcl ph=8.0,1.4nm edtaph=8,胍基-hcl ph=8.5,3.5%吐温20,0.35%triton x-100,123μg qiagen蛋白酶(19157),总体积10μl
[0314]2×
deepvent缓冲液:2
×
thermo pol反应缓冲液(b9004s)、4mm mgso4(b1003s)、400μm dntp(n0447 l)
[0315]
pcr混合物1(ol66):1.333
×
deepvent缓冲液,0.666μm gat-7n,0.0066μm ol66正向探针引物(seq id no:3),0.0066μm ol66反向探针引物(seq id no:4),80u/ml deepvent聚合酶
[0316]
pcr混合物1(ol1823):1.333
×
deepvent缓冲液,0.666μm gat-7n,0.0066μm ol1823正向探针引物(seq id no:7),0.0066μm ol1823反向探针引物(seq id no:4),80u/ml deepvent聚合酶
[0317]
pcr混合物2(ol66):1
×
deepvent缓冲液,1.2μm gat-com,0.12μm ol66正向探针引物(seq id no:3),0.12μm ol66反向探针引物(seq id no:4),60u/mldeepvent聚合酶,0.4mm dntp。
[0318]
pcr混合物2(ol1823):1
×
deepvent缓冲液,1.2μm gat-com,0.12μm ol1823正向
探针引物(seq id no:7),0.12μm ol66反向探针引物(seq id no:4),60u/ml deepvent聚合酶,0.4mm dntp。
[0319]
探针pcr混合物(ol66):1
×
deepvent缓冲液,1μm ol66探针引物amerev正向(seq id no:5),1μm ol66探针引物b merev反向(seq id no:6),30u/mldeepvent聚合酶
[0320]
探针pcr混合物(ol1823):1
×
deepvent缓冲液,1μm ol1823探针引物amerev正向(seq id no:8),1μm ol1823探针引物b merev反向(seq id no:6),30u/ml deepvent聚合酶
[0321]
基因组pcr混合物:1
×
deepvent缓冲液,1μm gat-com,30u/mldeepvent聚合酶向96孔板的每个孔中加入裂解混合物(10μl)。用含有激光显微切割样本的lmd盖封闭96孔板并紧密密封。倒置96孔板,通过在200
×
g下轻轻旋转倒置的板2分钟,将裂解混合物收集在盖中。将样品在60℃孵育过夜以消化样品。
[0322]
第二天,200
×
g离心2分钟,在孔底收集96孔板缓冲液。蛋白酶在pcr仪中于75℃热灭活30min。
[0323]
为了同时进行基因组dna的线性扩增和探针扩增,向每个孔中加入30μl pcr混合物1,并按照以下方式孵育:95℃
–
5min,11
×
(60℃
–
50s,20℃
–
50s,30℃
–
50s,40℃
–
45s,50℃
–
45s,65℃
–
7min,95℃
–
20s),72℃
–
5min。值得注意的是,通常,在本发明的方法中,用于该步骤的引物的浓度可以非常低,例如,正向和反向引物各小于0.001μm。
[0324]
为了同时扩增基因组dna和探针,向每个孔中加入20μlpcr混合物2。按如下方式孵育:[95℃
–
3min,3
×
(95℃
–
20s,58℃
–
30s,72℃
–
3min),72℃
–
3min]。
[0325]
向每个孔中加入5μl核酸外切酶溶液[1
×
核酸外切酶缓冲液(m0293l),10u核酸外切酶1(m0293l)]以去除多余的引物,并在37℃孵育40min,然后在72℃下对核酸外切酶进行热灭活20min。
[0326]
为了pcr扩增探针,将30μl来自每个孔的反应混合物转移到新的96孔板中,将20μl探针引物混合物添加到新的96孔板的每个孔中,并按如下方式孵育:95℃
–
3min,18
×
(95℃
–
20s,60℃
–
30s,72℃
–
1min)72℃
–
3min。同时,为了pcr扩增基因组dna,向含有约30μl原始反应混合物的原始板中的每个孔中加入20μl基因组pcr混合物,并按如下方式孵育:95℃
–
3min,24
×
(95℃
–
20s,58℃
–
30s,72℃
–
3min),72℃
–
3min)。板保存在-20℃,直至下一步使用。
[0327]
通过测序:
[0328]
在1.7
×
和1.8
×
spri珠中洗涤基因组dna板和探针dna板,并在20μl超纯水中洗脱(sigma)。使用quant-it picogreen dsdna定量分析法测量dna浓度。
[0329]
将每份样本中的基因组dna浓度标准化至1ng/μl浓度。采用与illumina系统直接兼容的内部tn5文库制备方案,对基因组dna进行索引并制成文库(winick-ng,w等人,2020,cell-type specialization in the brain is encoded by specific long-range chromatin topologies,biorxiv.https://doi.org/10.1101/2020.04.02.02099)。简言之,将含有(250mm taps-hcl,ph8.5,10%peg,250μm氯化镁,1ng基因组dna)总计5μl的反应混合物,标记混合物在55℃孵育7min,以进行转座反应。tn5经70℃再孵育5min热灭活。96孔板中的基因组dna用对应于来自nextera xt系统的setai5和i7 illumina条形码的引物进行索引。将pcr混合物(5μl)直接加入到转座的dna中(pcr混合物由2.5
×
kapagc缓冲液
hsdna分析测定浓度。将所有样本标准化至0.2ng/μl。按如下方式进行qpcr混合(2.5μl标准化样本,12.5μl 2xsybr-green pcr主混合物,0.75μl 10μm引物贮备液(包含正向和反向引物),用25μl水调整pcr反应体积,分子生物学级)。qpcr运行如下:95℃
–
5min,40
×
(95℃
–
30s,60℃
–
15s,72℃
–
30s)。
[0342]
作为验证和优化手段的ssdna荧光检测
[0343]
对于使用oligo-seq探针的rna-fish,我们使用了相同的初级探针和杂交条件。为了在荧光显微镜上观察杂交的oligo-seq探针,将冷冻切片与桥探针和二级探针杂交(图4b)。
[0344]
初级:[通用引物1][条形码1][靶同源性][条形码2][通用引物2]
[0345]
桥:[条形码同源性][tt铰链][二级同源性]
[0346]
二级:[alexafluor647][aa][桥同源性][aa][alexaflour647]
[0347]
将来自mesc-f123冷冻样本的冷冻切片(220nm厚)转移至玻璃盖玻片(直径1cm),在pbs中洗涤(3次,每次5min),在含0.1%(v/v)triton x-100的pbs中透化(10min),在pbs中洗涤(3次,每次5min)。在2
×
ssc中冲洗样本并在2
×
ssc中于4℃储存2h,或在含250μg/ml rnase a的2
×
ssc中于加湿室中孵育(2h,37℃)。
[0348]
将初级探针杂交混合物(2
×
ssc、30%甲酰胺、2mm氧钒核糖核苷复合物、1mg/ml酵母trna、10%硫酸葡聚糖、0.1μm初级探针)在78℃下变性(3min),在冰块上冷却,并在4℃保持最长4h,直至准备好冷冻切片。
[0349]
与探针杂交前,冷冻切片用洗涤缓冲液(30%甲酰胺,2
×
ssc,2mm氧钒核糖核苷复合物)冲洗(2次),并用洗涤缓冲液孵育(5min,室温)。小心去除洗涤缓冲液,并使用经过紫外线处理的滤纸从盖玻片边缘去除多余的缓冲液。将初级探针杂交混合物(8μl)置于不含rnase的hybrislip(invitrogen)上,并将盖玻片小心地覆盖在初级探针杂交混合物上,然后用橡胶胶泥密封。将样品在37℃(或30℃至60℃,理想情况下为37℃)的杂交烘箱内的潮湿室中孵育(超过36小时(两夜),或4-48小时)。
[0350]
用洗涤缓冲液稍微覆盖橡胶胶泥,使其变松。随后,小心地移除橡胶胶泥。在洗涤缓冲液中快速冲洗冷冻切片,以避免干燥。使用洗涤缓冲液在47℃(或37℃至65℃,理想情况下为47℃;温度升高会增加特异性)进行严格洗涤,以去除多余的初级探针(3次,每次20min)。
[0351]
通过在2
×
ssc中洗涤(3次)除去洗涤缓冲液。用经过紫外线处理的滤纸小心地去除多余的缓冲液。将二级杂交缓冲液(8μl)置于防紫外线的封口膜上,将含有冷冻切片的盖玻片一侧置于含有(30%甲酰胺,2
×
ssc,1.6μm二级寡核苷酸,1.4μm桥寡核苷酸)的二级杂交缓冲液上孵育。在室温下,在2
×
ssc、40%甲酰胺(3次,每次5min)中进行严格洗涤,以去除过量的二级寡核苷酸,并轻微摇动。然后在2
×
ssc中洗涤盖玻片5min。最后将盖玻片在1
×
pbs中洗涤(3次,每次5min),并在4℃储存或置于dapi-vectashield下,在leica共焦显微镜上成像。冷冻切片的图像在共焦激光扫描显微镜(leica tcs sp8;63
×
物镜,na 1.4),配备405nm二极管和白光激光器,使用相当于1个airy盘的针孔。按顺序采集来自不同通道的图像,以避免荧光透出。
[0352]
溶液中oligo-seq详情
[0353]
将mesc(克隆46c)置于nunc t75烧瓶中(4.5
×
106个细胞),并在w/mesc-46c培养
基+lif条件下培养48小时。用含0.05%胰蛋白酶的pbs(两个nunc t75烧瓶各2.5ml)对细胞进行胰蛋白酶消化(37℃2min)。用10ml不含lif的mesc-46c培养基终止胰蛋白酶化。然后将两个烧瓶中的内容物合并到一个50ml锥形瓶(25ml单细胞悬液)中,280
×
g下离心3min。使用scepter
tm
2.0手持式自动细胞计数仪对细胞计数(在pbs中以1:10稀释)。去除上清液,将细胞以5
×
106个细胞/ml的浓度重新悬浮在mesc-46c培养基加lif中。将细胞等分至1.5ml试管中,每管5
×
106个细胞。
[0354]
将分离了胰蛋白酶的mesc在900
×
g下于4℃下沉淀10min。然后用1
×
pbs洗涤细胞,并重新悬浮在500μl的1
×
pbs中。室温下,用含4%电镜级甲醛的pbs(1ml)固定细胞20min,方法是在rt的旋转轮上向1
×
pbs中加入500μl的8%甲醛。细胞在300
×
g下于4℃沉淀6min,然后用1
×
pbs冲洗和洗涤5min。细胞在300
×
g下于4℃沉淀6min,以重新沉淀细胞。将细胞重悬,在冰上用含200μl0.5%tritonx-100的pbs透化10min,并轻轻摇动。加入700μlpbs,在4℃以300
×
g沉淀细胞6min。在此步骤中,将初级探针在78℃下变性3min,直接移至冰块上快速冷却,以避免复性。
[0355]
将细胞重悬,并在1
×
洗涤缓冲液(30%甲酰胺,2
×
ssc,2mm氧钒核糖核苷复合物)中轻微摇晃孵育5min,然后在4℃下以300
×
g离心6min。小心去除所有缓冲液,将细胞轻轻重悬在100μl的初级探针杂交混合物(30%甲酰胺,2
×
ssc,2mm氧钒核糖核苷复合物,0.1μm初级探针,1mg/ml酵母trna,10%硫酸葡聚糖)中,并于37℃在轻度旋转的加湿室中孵育过夜。
[0356]
将900μl的1
×
ewb直接加入1.5ml试管中,并在500
×
g下沉淀6min。去除上清液,将细胞重悬在500μl的1
×
ewb中,并在47℃洗涤20min。将细胞在2000
×
g下沉淀3min,去除上清液,重悬在500μl的1
×
ewb中,并在47℃下洗涤20min。将细胞在2000
×
g下沉淀3min,并在1
×
pbs中冲洗和洗涤(2次,每次5min)。将细胞重悬在50μl的1
×
pbs中。将约1-20个细胞在5μlpbs溶液中等分至96孔板的独立孔中,并在-20℃储存,直至下一步使用。
[0357]
向每个样本孔中加入17μl的裂解缓冲液(30mm tris-hcl ph 8.0,2mm edta ph 8.0,0.8m胍基-hcl ph 8.5,5%吐温-20,0.5%triton x-100)和3μl的qiagen蛋白酶(cat 19157)。在60℃下用轨道摇摆法将样品孵育过夜。第二天早上将蛋白酶于75℃热灭活30min。向每个孔中加入40μl pcr混合物(2
×
deepvent溶液,0.24μl 100μm正向引物,0.24μl 100μm反向引物,1.8μl deepvent聚合酶,8μl超纯水)。pcr程序:95℃
–
3min,30
×
(95℃
–
20s,58℃
–
30s,72℃
–
1min,72℃
–
3min)。
[0358]
在1.8
×
spri珠中洗涤pcr混合物,并通过进行qubit hsdna分析测定浓度。将所有样本标准化至0.2ng/μl。按如下方式进行qpcr混合(2.5μl标准化样本(总计0.5ng)、12.5μl sybr-green[ts1]、0.75μl 10μm引物储备液(包含目的基因的正向和反向引物)、pcr-清水至25μl)。qpcr程序如下:95℃
–
5min,40
×
(95℃
–
30s,60℃
–
15s,72℃
–
30s,sybr-green读数板)。
[0359]
rna-seq数据
[0360]
按照kempfer(2020,chromatin folding in health and disease:exploring allele-specific topologies and the reorganization due to the 16p11.2 deletion in autism-spectrum disorder.柏林洪堡大学博士论文doi:10.18452/22071)中的描述,生成了来自mesc-f123的总rna-seq数据。使用trizol试剂提取rna,并用dnase处理。根据制
organization that promotes multispecies biofilm formation.environ microbiol.19,2893
–
905.
[0376]
15.liu et al.(2019)deciphering links between bacterial interactions and spatial organization in multispecies biofilms.the isme journal 13,3054
–
3066.
[0377]
16.tokuyasu,k.t.(1973)a technique for ultracryotomy of cell suspensions and tissues.,j.cell biol.57,551-65.
[0378]
17.guillot p.v.,xie s.q.,hollinshead m.,pombo a.(2004)fixation-induced redistribution of hyperphosphorylated rna polymerase ii in the nucleus of human cells.exp.cell res.295,460-468.
[0379]
18.pombo a,hollinshead m,cook pr(1999)bridging the resolution gap:imaging the same transcription factories in cryosections by light and electron microscopy.j.histochem.cytochem.47,471-480.
[0380]
19.mcdowall et al.(1989)the structure of organelles of the endocytic pathway in hydrated cryosections of cultured cells,eur.j.cell biol.49,281
–
294.
[0381]
20.chen et al.(2014)nano-dissection and sequencing of dna at single sub-nuclear structures.small 10:3267.
[0382]
21.v.,et al.(2013)cryo-electron tomography:the challenge of doing structural biology in situ.j cell biol 202(3),407.
[0383]
22.https://www.protocols.io/view/stellaris-rna-fish-protocol-for-frozentissue-iwgs5v
[0384]
23.https://www.protocols.io/view/exfish-tissue-slice-n6adhae
[0385]
24.branco,m.r.&pombo,a.(2006)intermingling of chromosome territories in interphase suggests role in translocations and transcription-dependent associations.plos biol.4,e138.
[0386]
25.xie,s.q.et al.(2006)splicing speckles are not reservoirs of rna polymerase ii,but contain an inactive form,phosphorylated on serine
2 residues of the c-terminal domain.mol.biol.cell 17,1723-1733.
[0387]
26.branco,m.r.(2006)correlative microscopy using tokuyasu cryosections:applications for immunogold labelling and in situ hybridisation.cell imaging(methods express series)”,ed.d.stephens,scion publishing ltd.(bloxham,uk),201-217.
[0388]
27.ferrai,c.,et al.(2010)poised transcription factories prime silent upa genes prior to activation.plos biology 8,e1000270.
[0389]
28.macosko et al.(2015)highly parallel genome-wide expression profiling of individual cells usingnanoliter droplets.cell 161(5),1202-1214.
[0390]
29.levsky,j.m.et al.(2002)single-cell gene expression profiling.science 297,836
–
840.
[0391]
30.tripathi et al.,2015,rna fluorescence in situ hybridization in culturedmammalian cells.in:carmichael g.(eds)regulatory non-coding rnas.methods in molecular biology(methods and protocols),vol 1206.humana press,new york,ny.https://doi.org/10.1007/978-1-4939-1369-5_11.
[0392]
31.pombo,a.(2003)cellular genomics:which genes are transcribed when and where?trends biochem.sci.28,6-9.
[0393]
32.winick-ng,w.,et al.,2020,cell-type specialization in the brain is encoded by specific long-range chromatin topologies,biorxiv.https://doi.org/10.1101/2020.04.02.020990.
[0394]
33.et al.(2012)proteomic analysis of mitotic rna polymerase ii complexes reveals novel in-teractors and association with proteins dysfunctional in disease.mol.cell.proteomics 11(6):m111.011767.
[0395]
34.https://www.protocols.io/view/stellaris-rna-fish-protocol-for-frozentissue-iwgs5v
[0396]
35.https://www.protocols.io/view/exfish-tissue-slice-n6adhae
[0397]
36.domiguez and kolodney(2005)wild-type blocking polymerase chain reaction for detection of single nucleotide minority mutations from clinical specimens.oncogene 24,6830-6834.
[0398]
37.pombo,a.,et al.(1994)adenovirus replication andtranscription sites are spatially separated in the nucleus of infected cells.embo j.13(12),5075-5085.
[0399]
38.femino,a.m.,et al.(1998)visualization of single rna transcripts in situ.science,280(5363).
[0400]
39.beliveau et al.(2017)in situ super-resolution imaging of genomic dna with oligostorm and oligodna-paint.methods mol biol.1663,231-252.
[0401]
40.https://oligopaints.hms.harvard.edu/protocols
[0402]
41.dhanoa,j.k.,sethi,r.s.,verma,r.,arora,j.s.,&mukhopadhyay,c.s.(2018).long non-coding rna:its evolutionary relics and biological implications in mammals:a review.journal of animal science and technology,60,25.
[0403]
42.catalanotto,c.,cogoni,c.,&zardo,g.(2016)microrna in control of gene expression:an overview of nuclear functions.international journal of molecular sciences,17(10),1712.
[0404]
43.van heesch et al.(2019)the translational landscape of the human heart.cell 178(1),242-260.
[0405]
44.arnold et al.,(2020)diversity and emerging roles of enhancer rna in regulation of gene ex-pression and cell fate.front.cell dev.biol.7.
[0406]
45.kristensen et al.(2019)the biogenesis,biology and characterization of circular rnas.nat rev genet.20(11),675-691.
[0407]
46.akhter et al.(2018)circular rna and alzheimer's disease.adv exp med biol.2018;1087:239-243.
[0408]
47.michelini,f.,pitchiaya,s.,vitelli,v.et al.(2017)damage-induced lncrnas control the dna dam-age response through interaction with ddrnas at individual double-strand breaks.nat cell biol 19,1400
–
1411.
[0409]
48.lloret-llinares et al.(2016)relationships between prompt and gene expression.rna biol.13(1),6-14.
[0410]
49.feng et al.,1995,the rna component of human telomerase.science 269(5228),1236-1241.
[0411]
50.weibel,e.r.(1979)stereological methods:practical methods for biological morphometry.vol.1 academic press,london,uk.
[0412]
51.weibel,e.r.(1980)stereological methods:theoretical foundations.vol.2.academic press,london,uk.
[0413]
52.mateo et al.(2019)visualizing dna folding and rna in embryos at single-cell resolution.nature 568,49-54.
[0414]
53.zhao,n.,et al.(2019)a genetically encoded probe for imaging nascent and mature ha-tagged proteins in vivo.nat.commun.10(10)2947.
[0415]
54.beagrie et al.(2017).complex multi-enhancer contacts captured by genome architecture mapping.nature.543,519-524.
[0416]
55.markowski et al.(2020)gamibhear:whole-genome haplotype reconstruction from genome architecture mapping data.biorxiv 2020.01.30.927061,also published as markowski et al.(2021)gamibhear:whole-genome haplotype reconstruction from genome architecture mapping data.bioinformatics 19,3128-3135.
[0417]
56.nagano et al.(2017)cell-cycle dynamics of chromosomal organization at single-cell resolution.nature,547(7661),61-67.
[0418]
57.van buggenum et al.(2018)immuno-detection by sequencing enables large-scale high-dimensional phenotyping in cells.nature communications.
[0419]
58.buenrostro,j.d.,et al.(2015)atac-seq:a method for assay-ing chromatin accessibility genome-wide.current protocols in molecular biology,109,21.29.1
–
21.29.9.
[0420]
59.wo 2016156469
[0421]
60.beliveau et al.(2018)oligominer provides a rapid,flexible environment for the design of genome-scale oligonucleotide in situ hybridization probes.pnas 115(10),183-192
[0422]
61.geomx
tm product brochure,available on https://www.nanostring.com/products/geomx-digital-spatial-profiler/geomx-dsp
[0423]
62.ferraiet al.(2017)rna polymerase ii primes polycomb-repressed developmental genes throughout terminal neuronal differentiation.mol.syst.bi
ol.13,946.
[0424]
63.xie sq and pombo a.(2006)distribution of different phosphorylated forms of rna polymerase ii in relation to cajal and pml bodies in human cells:an ultrastructural study.histochem.cell biol.125,21-31.
[0425]
64.beagrie et al.(2020)multiplex-gam:genome-wide identification of chromatin contacts yields insights not capturedby hi-c.biorxiv 2020.07.31.230284;doi:https://doi.org/10.1101/2020.07.31.230284.
[0426]
65.kunath et al.(2005)imprinted x-inactivation in extra-embryonic endoderm cell lines from mouse blastocysts.development 132,1649-1661.
[0427]
66.http://repeatmasker.org/
[0428]
67.santalucia j,jr(1998)a unified view of polymer,dumbbell,and oligonucleotide dna nearest-neighbor thermodynamics.proc natl acad sci usa 95:1460
–
1465.
[0429]
68.langmead b,trapnell c,pop m,salzberg sl(2009)bowtie:an ultrafast memoryefficient short read aligner.genome biol 10:r25.46.
[0430]
69.langmead b,salzberg sl(2012)fast gapped-read alignment with bowtie 2.nat methods 9:357
–
359.47.
[0431]
70.li h,durbin r(2010)fast and accurate long-read alignment with burrows-wheeler transform.bioinformatics 26:589
–
595
[0432]
71.dirks rm,pierce na(2003)a partition function algorithm for nucleic acid secondary structure including pseudoknots.j comput chem 24:1664
–
1677.
[0433]
72.g,kingsford c(2011)a fast,lock-free approach for efficient parallel counting of occurrences of k-mers.bioinformatics 27:764
–
770.
[0434]
73.quinlan ar,hall im(2010)bedtools:a flexible suite of utilities for comparing genomic features.bioinformatics 26:841
–
842.
[0435]
74.kempfer,rieke.(2020).chromatin folding in health and disease:exploring allele-specific topologies and the reorganization due to the 16p11.2 deletion in autism-spectrum disorder.phd thesis,humboldt university of berlin.doi:10.18452/22071.(see https://edoc.hu-berlin.de/handle/18452/22777).
[0436]
75.takei et al.(2021)integrated spatial genomics reveals global architecture of single nuclei.nature,590,344-350.
技术特征:
1.一种检测核酸的方法,包括步骤:(a)提供含核酸的隔室;(b)使多个单链dna寡核苷酸探针与所述隔室内的核酸分子杂交;(c)从所述隔室中除去未与所述隔室内的任一核酸特异性杂交的单链dna寡核苷酸探针;(d)通过探针测序或探针扩增鉴定与所述隔室内的核酸分子特异性杂交的单链dna-寡核苷酸探针,从而确定与探针对应的存在于所述隔室中的核酸。其中所述方法不包括作为扩增核酸检测的手段的顺序探针杂交法。2.根据权利要求1所述的方法,其中所述方法不包括rna分离步骤。3.根据前述权利要求中任一项所述的方法,其中所述方法不包括cdna产生步骤。4.根据前述权利要求中任一项所述的方法,其中所述核酸是rna,任选地,是mrna。5.根据权利要求1-3中任一项所述的方法,其中所述核酸是ssdna或dsdna,任选地,是ssdna。6.根据前述权利要求中任一项所述的方法,其中所述含核酸的隔室是真核细胞、真核细胞的核、真核细胞的细胞质、线粒体、叶绿体、外泌体、原核细胞、组织中的一组细胞、或病毒。7.根据前述权利要求中任一项所述的方法,其中在步骤(b)之前对所述含核酸的隔室进行切片。8.根据前述权利要求中任一项所述的方法,其中在步骤(b)之前,所述含核酸的隔室或细胞被生化分离或解离。9.根据前述权利要求中任一项所述的方法,其中步骤(b)之前是含核酸的隔室的固定,其中任选地,含核酸的隔室在固定后被切片。10.根据权利要求1-7中任一项所述的方法,其中所述含核酸的隔室未被固定,其中所述含核酸隔室任选地被玻璃化。11.根据前述权利要求中任一项所述的方法,其中所述单链dna寡核苷酸探针包含与靶核酸的核苷酸序列互补的靶区域,所述靶核酸的侧翼为一对通用引物区,其中,任选地,所述单链dna寡核苷酸探针还包含唯一分子标识符。12.根据前述权利要求中任一项所述的方法,其中所述单链dna寡核苷酸探针与所述隔室中存在的多个靶核酸特异性杂交。13.根据权利要求1-4和6-11中任一项所述的方法,其中所述单链dna寡核苷酸探针形成与所述隔室中存在的基本上所有mrna、任选地基本上所有rna特异性杂交的文库。14.根据前述权利要求中任一项所述的方法,其中在步骤(c)和(d)之间,进行结合的单链dna寡核苷酸探针的扩增。15.根据前述权利要求中任一项所述的方法,其中通过测序,优选下一代测序鉴定结合的单链dna寡核苷酸探针。16.根据权利要求1-13中任一项所述的方法,其中通过扩增,优选通过定量pcr鉴定所述结合的单链dna寡核苷酸探针。17.根据前述权利要求中任一项所述的方法,进一步包括对所述隔室中检测的核酸进行空间映射,包括步骤:
(i)在步骤(b)之前对所述隔室进行切片、冷冻切片或低温球磨切片,优选冷冻切片,以获得碎片的集合,并由此根据核酸分子的定位将核酸分子彼此分离;(ii)鉴定在步骤(d)中与每个碎片中的核酸分子特异性杂交的单链dna-寡核苷酸探针,从而确定在每个碎片中是否存在对应于探针的rna;和(iii)对隔室中的核酸进行映射。18.根据权利要求17所述的方法,其中核酸,优选rna的检测与所述隔室中至少一个dna基因座的检测相结合,包括额外步骤:-任选地,通过测序,优选通过下一代测序,确定每个碎片中至少一个dna基因座的存在与否;和-确定所述至少一个dna基因座和与rna特异性杂交的单链dna寡核苷酸探针的共分离。19.根据前述权利要求中任一项所述方法的用途:(a)测定单细胞、细胞群或细胞内隔室中的基因表达;(b)鉴定隔室中rna的同工型和等位基因特异性变体;(c)定量基因的转录;和(d)鉴定复杂异种组织的细胞类型;(e)识别隔室内的内源性和外源性dsdna和ssdna;(f)映射隔室中rna的位置;(g)映射隔室中的rna和核酸基因座的位置;(h)映射隔室中的rna和蛋白质的位置;(i)映射隔室中的rna、蛋白质和核酸基因座的位置。
技术总结
本发明涉及单细胞水平的核酸测序领域,如单细胞RNA测序(scRNA-seq)。具体而言,本发明提供了一种检测固定或非固定的含核酸隔室如真核细胞或其细胞核中的核酸的方法,所述方法将多个单链(ss)DNA寡核苷酸探针与所述隔室中的互补核酸分子杂交;从所述隔室中除去未与核酸特异性杂交的ssDNA寡核苷酸探针;以及通过测序或扩增鉴定与所述隔室中的核酸分子特异性杂交的ssDNA寡核苷酸探针,从而确定所述隔室中存在的相应核酸。所述方法不需要与相同靶核酸进行顺序ssDNA探针杂交的步骤作为提高特异性或敏感性的手段,并且优选的也不需要RNA分离和cDNA产生的步骤。本发明的方法具有基本上检测每一种已知和/或未知核酸物种的潜力,特别是RNA,例如编码蛋白质的mRNA以及非编码RNA。所述方法还能够对检测的核酸进行空间映射,其中在探针杂交之前将所述隔室切片或解离成单细胞悬液,以获得碎片的集合,因此核酸分子根据它们的定位或其细胞类型而彼此分离。检测的核酸的空间映射可以与至少一个DNA基因座、至少一种蛋白质的检测相结合,或者与染色质凝聚分析相结合。本发明的方法命名为oligo-seq。seq。seq。
技术研发人员:安娜
受保护的技术使用者:马克思-德布鲁克-分子医学中心亥姆霍兹联合会
技术研发日:2021.10.22
技术公布日:2023/7/7
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/