大豆中的豆血红蛋白的制作方法
未命名
09-08
阅读:97
评论:0

大豆中的豆血红蛋白
1.以电子方式递交的序列表的引用
2.该序列表的官方副本经由efs-web作为ascii格式的序列表以电子方式提交,文件名为“8429-us-psp_sequencelisting_st25.txt”,创建于2020年10月28日,大小为94千字节,并与本说明书同时提交。该ascii格式的文档中包含的序列表是说明书的一部分,并且通过引用以其全文并入本文。
背景技术:
3.用植物性蛋白替换动物性肉类正在成为食品应用的工业趋势。大豆豆科植物血红蛋白或豆血红蛋白是存在于豆科植物的固氮根瘤中的球蛋白。它携带血红素(一种含铁分子),并且起到保护固氮酶免于氧失活以及起到促进氧气流向固氮细菌的作用。豆血红蛋白可以从工程化酵母中发酵,并通过模仿肉类中血红蛋白带来的风味而用于肉类替代品。提供了在大豆中表达豆血红蛋白的组合物和方法。
技术实现要素:
4.提供了大豆种子,其含有占大豆种子中总蛋白的至少0.5%的量的豆血红蛋白,而不含有由整合到大豆基因组中的包含豆血红蛋白编码序列的重组构建体表达的豆血红蛋白。可对不包含含有豆血红蛋白编码序列的重组构建体的大豆种子基因组进行修饰以将插入、缺失或取代引入天然豆血红蛋白基因中,例如编码序列或调节序列,或者对其进行修饰以用豆血红蛋白编码序列替换种子贮藏蛋白的编码序列的全部或部分。
5.提供了大豆种子,其中对大豆种子基因组进行修饰以将插入、缺失或取代引入天然豆血红蛋白基因中或对其进行修饰以用豆血红蛋白编码序列替换种子贮藏蛋白的编码序列的全部或部分。
6.在一些实施例中,转运肽等靶向序列可操作地连接到豆血红蛋白编码序列以将豆血红蛋白引导至细胞内区室例如质体。
7.在一些实施例中,提供了包含基因组修饰的大豆种子,其中豆血红蛋白在大豆种子中以足以在种子的横切面中赋予大豆种子粉红色的量或者以占总种子蛋白的至少0.1%的量表达。
8.在一些实施例中,对大豆进行修饰以在种子质体中特异性地直接表达豆血红蛋白。
9.在一些实施例中,具有以下中的一者或多者的大豆种子进一步包含整合到其基因组中的包含豆血红蛋白编码序列的重组构建体:在天然豆血红蛋白基因中的修饰、在不同天然启动子的控制下在核基因组中豆血红蛋白基因的插入、或在质体基因组中豆血红蛋白序列的包含。
10.在一些实施例中,大豆种子含有进一步的修饰,例如对编码谷氨酰trna还原酶、铁螯合酶(ferrochelatase)、谷氨酰trna还原酶结合蛋白和氨基乙酰丙酸合酶的一个或多个基因中的核苷酸插入、缺失或取代。在一些实施例中,大豆种子含有一个或多个重组构建
体,该一个或多个重组构建体含有谷氨酰trna还原酶、铁螯合酶、谷氨酰trna还原酶结合蛋白和/或氨基乙酰丙酸合酶的编码序列。
11.提供了大豆种子,其含有占总种子蛋白的至少0.5%的量的豆血红蛋白,并且具有以下特征中的一个或多个:(i)油酸含量占总种子脂肪酸的至少50%;(ii)亚麻酸含量占总种子脂肪酸的少于3%;(iii)在13%水分下或调整至13%水分时测量的蛋白含量占大豆总重量的至少37%;(iv)kunitz型胰蛋白酶抑制剂活性低于未修饰的对照大豆中的活性的5%;(v)bowman-burke蛋白酶抑制剂活性低于未修饰的对照大豆中的活性的5%;(vi)在13%水分下水苏糖含量少于1重量%:以及(vii)在13%水分下棉子糖含量少于0.5重量%。
12.在一些实施例中,提供了转基因大豆种子,其含有重组构建体,该重组构建体包含编码与seq id no:2具有至少95%同一性的豆血红蛋白的多核苷酸,其中该重组构建体不包含蛋白贮藏囊泡靶向序列,并且其中该大豆不含有(i)包含编码谷氨酰trna还原酶的序列或其截短部分的重组构建体,(ii)包含编码铁螯合酶的序列的重组构建体,(iii)包含谷氨酰trna还原酶结合蛋白的重组构建体以及(iv)包含氨基乙酰丙酸合酶的重组构建体,并且其中大豆种子在种子中以至少0.5%总种子蛋白的量包含豆血红蛋白。
13.在一些实施例中,含有占总蛋白的至少0.5%的量的豆血红蛋白的大豆种子具有基因组修饰,其包括以下中的至少一项:(i)大豆基因组序列的核酸插入,该插入排除非大豆基因组序列,(ii)一个或多个核酸取代,(iii)一个或多个核酸缺失,以及(iv)其任何组合,其中该基因组修饰包含(a)对天然豆血红蛋白基因进行的修饰或(b)包含天然豆血红蛋白基因的至少一部分的插入。
14.在一些实施例中,大豆表达豆血红蛋白并且进一步包含不同的修饰以减少或防止一个或多个种子贮藏编码序列的表达,例如大豆球蛋白或伴大豆球蛋白。
15.在一些实施例中,大豆表达豆血红蛋白并且进一步包含高油酸、低亚麻酸、至少37%总种子蛋白(13%水分)中的一种或多种。
16.在一些实施例中,提供了从含有豆血红蛋白的修饰的大豆种子生长的植物和植物部分。
17.在一些实施例中,提供了用于加工从表达豆血红蛋白的修饰的大豆种子中提取的豆粕的方法,其中在足以降解豆粕中的多糖的条件下将豆粕与纤维素酶、半纤维素酶和果胶酶中的至少一种接触并从残余物中过滤渗透物。提供了从修饰的大豆种子中提取的豆粕,其含有至少0.1%、0.2%、0.3%、0.4%或0.5%总蛋白重量的豆血红蛋白。
18.在一些实施例中,提供了包含占总蛋白的至少0.2重量%的豆血红蛋白的大豆分离物,至少约50%的豆血红蛋白用铁基团血红素化,其从表达豆血红蛋白的修饰的种子产生。
19.在一些实施例中,提供了用于从包含豆血红蛋白的修饰的大豆种子和包含高油酸的大豆种子产生豆粕或分离物的方法,其中加工豆以产生包含高油酸和豆血红蛋白的豆粕或分离物,其中至少约50%的豆血红蛋白用铁基团血红素化。
20.附图和序列表的说明
21.根据下列的详细描述和附图以及序列表,可以更全面地理解本公开,所述详细描述和附图以及序列表形成本技术的一部分。
22.图1是显示具有或不具有不同蛋白靶向序列的大豆豆血红蛋白的表达的构建体设
计的图表。
23.图2是显示通过卟啉途径工程化提高大豆豆血红蛋白表达水平的构建体设计的图表。
24.图3是显示通过cr1/cr2 grna对将豆血红蛋白基因基因组工程化到天然大豆大豆球蛋白基因座中的示意图。
25.图4是显示通过cr1/cr3 grna对将豆血红蛋白基因基因组工程化到天然大豆大豆球蛋白基因座中的示意图。
26.图5是显示伴大豆球蛋白基因簇基因座的基因丢失(dropout)策略的示意图。
27.图6是蛋白凝胶的照片,显示了伴大豆球蛋白gm10基因簇丢失变体的种子蛋白图谱。
28.图7是蛋白凝胶的照片,显示了伴大豆球蛋白gm20基因簇丢失变体的种子蛋白图谱。
29.图8是实验1中5个独立事件的种子横切面的照片。
30.图9是考马斯染色的蛋白凝胶的照片,显示实验1中存在16kd豆血红蛋白(箭头)。
31.图10是实验5中4个独立事件的种子横切面的照片。
32.图11是考马斯染色的蛋白凝胶的照片,显示实验5中存在16kd豆血红蛋白。
33.图12是显示酶法大豆加工(e-soy)工艺的一般工艺实例的示意性流程图。
34.图13是显示t-dna内的大豆核转化双元载体的示意图。
35.图14是大豆叶绿体转化载体的示意图。
具体实施方式
36.序列说明(表1)总结了本文所附的序列表,将其据此通过引用并入本文。如描述于以下文献中的iupac-iub标准中所定义的,序列表包含核苷酸序列字符的单字母代码和氨基酸的单字母和三字母代码:nucleic acids research[核酸研究]13:3021-3030(1985)和biochemical journal[生物化学杂志]219(2):345-373(1984)。
[0037]
表1:序列表说明
[0038]
[0039][0040][0041]
本公开描述了表达豆血红蛋白、豆血红蛋白复合物或其组合的修饰的大豆种子。
豆血红蛋白是在固氮细菌定殖后在大豆根瘤中合成的蛋白质。如本文所用,“豆血红蛋白(1eghemoglobin protein或leghemoglobin)”是指球蛋白或多肽,无论是展开的或是折叠成单体的,并且其可能与血红素基团(与铁结合的卟啉)缔合或不缔合。如本文所用,“豆血红蛋白复合物(leghemoglobin complex或leghemoglobin protein complex)”特别地是指包括与血红素基团(与铁结合的卟啉)缔合的豆血红蛋白的复合物。这样的复合物,当以足够量存在时,可以赋予含有复合物的细胞或组织红色或粉红色,肉眼可检测到例如在表达豆血红蛋白复合物的大豆种子的横切面中。如本文所用,关于横切面中大豆的颜色,粉红色意指粉红色或红色的任何阴影。
[0042]
可以修饰大豆种子以增加形成血红素复合物的豆血红蛋白的表达,而不需要将豆血红蛋白的表达靶向蛋白贮藏囊泡或其他靶向的细胞区室。
[0043]
在一些实施例中,不含血红素基团的豆血红蛋白、豆血红蛋白复合物或两种形式的组合可以以总种子蛋白的至少0.01%、0.05%、0.5%、1%、1.5%、2%、2.5%、3%、4%、5%、6%、7%、8%、9%、10%或更多且少于75%、50%、25%、20%、15%、10%、5%、4%或3%存在于大豆种子中。
[0044]
适当地,至少5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%且小于100%、99.9%、95%、90%、85%、80%、70%、60%或50%的总豆血红蛋白与大豆种子中的血红素基团形成复合物。
[0045]
提供了本文公开的大豆种子,以及植物部分、植物细胞、组织培养物和从其生长的植物。
[0046]
在某些实施例中,大豆种子引入了重组构建体,其包含可操作地连接到在大豆种子细胞中起作用的启动子的豆血红蛋白编码序列。如本文所用,重组构建体是包括可操作地连接到编码多肽的多核苷酸的启动子序列和任选的其他调节序列的构建体,其中重组构建体对于植物、植物细胞或种子是外源的。如本文所用,关于核酸的术语“外源”表示核酸不在其天然基因组位置。此类含有重组构建体的植物被称为转基因植物。调节序列可以是基因中或基因周围的序列,其促进多肽编码序列的转录或终止。
[0047]
重组dna构建体的非限制性实例包括与异源序列(也称为调节元件)可操作地连接的目的多核苷酸,这些异源序列有助于目的序列的表达、自主复制和/或基因组插入。此类调节元件包括例如启动子、终止序列、增强子等,或表达盒的任何组分;质粒、粘粒、病毒、自主复制序列、噬菌体、或线性或环状单链或双链dna或rna核苷酸序列;和/或编码异源多肽的序列。
[0048]
所提供的重组dna构建体或重组构建体包含至少一个调节元件,当将该调节元件整合到基因组中时,该调节元件不存在于其在大豆基因组中的天然位置或来自另一物种的基因组。在某些实施例中,重组dna构建体的至少一个调节元件包含启动子,优选驱动豆血红蛋白在种子中的表达的异源启动子,例如大豆球蛋白或伴大豆球蛋白启动子。
[0049]
在一个实施例中,含有包含豆血红蛋白编码序列的重组构建体的大豆种子不含有以下中的一者或多者或全部(i)包含编码谷氨酰trna还原酶的序列或其截短部分的重组构建体,(ii)包含编码铁螯合酶的序列的重组构建体,(iii)包含谷氨酰trna还原酶结合蛋白的重组构建体和(iv)包含氨基乙酰丙酸合酶的重组构建体。截短的编码序列是已去除编码序列的n
′
或c
′
末端或两者的序列,使得从比天然非截短多肽短且在c
′
末端和n
′
末端或两者
缺少许多氨基酸的编码序列合成多肽。发明人发现,高水平的豆血红蛋白和豆血红蛋白复合物可以在大豆种子中通过赋予粉红色以肉眼可检测的量表达,而不需要用这些额外的重组构建体来增加表达,也不需要包括将豆血红蛋白引导至特定的细胞区室(例如蛋白贮藏囊泡)的靶向序列。
[0050]
在一些实施例中,天然豆血红蛋白基因是经修饰的。豆血红蛋白基因的基因组序列提供于seq id no:43中,并且可以对该序列的全部或部分或对大豆基因组中对应于seq id no:43的序列(包括对本文鉴定的特定区域)进行修饰,或包括该序列的全部或部分。关于seq id no:43,包括启动子和5
′
utr的调节区是从核苷酸位置1至位置2058,外显子1是从位置2059至位置2156,内含子1是从位置2157至位置2275,外显子2是从位置2276至位置2384,内含子2是从位置2385至位置2574,外显子3是从位置2575至位置2679,内含子3是从位置2680至位置2876,外显子4是从位置2877至位置3002,包括3
′
utr的终止子是从位置3003至位置5214。
[0051]
在一些实施例中,修饰是从位置seq id no:43的1-2058、seq id no:43的100-2058、seq id no:43的200-2058、seq id no:43的300-2058、seq id no:43的400-2058、seq id no:43的500-2058、seq id no:43的600-2058、seq id no:43的700-2058、seq id no:43的800-2058、seq id no:43的900-2058、seq id no:43的1000-2058、seq id no:43的1100-2058、seq id no:43的1200-2058、seq id no:43的1300-2058、seq id no:43的1400-2058、seq id no:43的1500-2058、seq id no:43的1600-2058、seq id no:43的1700-2058、seq id no:43的1800-2058或seq id no:43的1900-2058进行的。
[0052]
在一些实施例中,大豆种子的质体基因组包含修饰,其中将编码豆血红蛋白的序列插入质体基因组中,使得豆血红蛋白多肽直接在种子质体中表达而不需要转运肽。种子特异性质体转化可通过插入包含连接到dicisgg序列(例如seq id no:44)的豆血红蛋白编码序列的构建体来实现。植物被共转化以表达ppr蛋白,例如ppr10蛋白,例如seq id no:46或48,其中编码ppr蛋白的序列处于在种子中有活性且具有种子特异性的启动子的控制下,例如种子贮藏蛋白例如大豆球蛋白或伴大豆球蛋白的启动子。可以选择不同的种子特异性启动子来调节ppr蛋白的表达的量。可替代地,ppr蛋白的表达可以通过基因组编辑来替换以种子特异性方式表达的天然序列的全部或部分来实现,例如在种子贮藏蛋白的基因座处。ppr蛋白在种子中充当dicisgg序列的触发器,以促进豆血红蛋白在种子质体中的直接表达,而在非种子植物部分(例如根、茎、叶和花)中没有或几乎没有或极少表达。
[0053]
豆血红蛋白的质体表达可以与来自核基因组来源的豆血红蛋白的表达结合,例如通过用转基因构建体转化核基因组,或通过对天然核基因进行基因组编辑,例如通过插入、缺失或取代一个或多个核苷酸至天然豆血红蛋白基因中或通过基因组编辑大豆种子中高度表达的基因,例如通过将豆血红蛋白序列插入种子贮藏蛋白基因以替换种子贮藏蛋白的编码序列的全部或部分,使得表达豆血红蛋白而不是种子贮藏蛋白。豆血红蛋白的质体表达可以与编码或有助于控制血红素生物合成途径(例如本文所公开的)的其他基因增加或减少的表达组合。
[0054]
在一些实施例中,包含细胞内靶向序列或转运序列例如质体靶向序列并将其可操作地连接到编码豆血红蛋白的序列,例如恰好位于编码豆血红蛋白的序列的n
′
末端之前,使得细胞内靶向序列将豆血红蛋白的表达靶向细胞内区室,例如蛋白贮藏囊泡或质体。靶
向序列和可操作地连接的豆血红蛋白序列,例如出现在seq id no:31或编码seq id no:32的多核苷酸,可以与重组构建体中的调节序列可操作地连接并用于转化大豆。靶向序列可以可操作地连接到豆血红蛋白序列,例如出现在seq id no:31或编码seq id no:32的序列,并且可以通过基因组编辑插入以替换种子贮藏蛋白(例如大豆球蛋白或伴大豆球蛋白)的编码序列的全部或部分,使得种子贮藏蛋白的天然调节元件引导靶向序列和豆血红蛋白编码序列的表达,使得豆血红蛋白与转运肽一起表达并靶向细胞内区室。可以将靶向序列插入到天然豆血红蛋白基因中,任选地具有其他插入、或缺失或取代,使得豆血红蛋白在大豆种子中从其天然基因座与转运肽一起表达并靶向细胞内区室。在一个实施例中,质体靶向序列包括在目的编码序列或多肽的n
′
末端。质体靶向序列的一个实例是rubisco ssusp质体靶向序列,例如由seq id no:31的位置1到位置165的核苷酸序列编码的质体靶向序列,相应的肽靶向序列在seq id no:32的位置1到位置55。豆血红蛋白编码序列是从seq id no:31的位置166到位置603,并且相应的肽形成seq id no:32的位置56到位置200。
[0055]
在一些实施例中,提供大豆种子,其表达来自两个或更多个来源、构建体或基因组位置的豆血红蛋白,例如来自以下中的两个或更多个:(i)插入基因组的重组构建体,(ii)其中豆血红蛋白编码序列替换如本文所述的种子贮藏蛋白编码序列的全部或部分的基因组修饰,(iii)其中天然豆血红蛋白基因被修饰以包括插入、缺失或取代中的一个或多个的基因组修饰,例如豆血红蛋白基因的调节区或编码序列的插入、缺失或取代以及(iv)其中质体基因组被修饰以表达豆血红蛋白编码序列的质体基因组修饰。在一些实施例中,两个或更多个来源包括至少一个来源,其中豆血红蛋白编码序列可操作地连接到细胞内靶向序列,例如本文所述的质体靶向序列,以及另一来源,其中豆血红蛋白编码序列不是可操作地连接到细胞内靶向序列。
[0056]
在某些实施例中,包含豆血红蛋白和任选的如本文所述的其他修饰的大豆种子可进一步包含修饰以增加大豆种子中豆血红蛋白复合物的量。增加豆血红蛋白复合物的修饰可包括以下中的一者或多者的修饰的表达:谷氨酰-trna还原酶、谷氨酸-1-半醛2,1-氨基变位酶、氨基乙酰丙酸脱水酶(hemb1)、羟甲基胆素合酶(hemc)、尿卟啉原iii合酶、尿卟啉原脱羧酶、粪卟啉原iii氧化酶(hemf、cpox)、原卟啉原氧化酶(ppox)和/或铁螯合酶。修饰可以包括将重组构建体引入植物的基因组中,或者修饰可以包括基因编辑修饰,例如插入、缺失和/或取代表达这些多肽的基因中,例如以增强这些基因的编码序列的转录。
[0057]
在一些实施例中,大豆植物、细胞和种子包含编码调节蛋白的基因中的修饰,该调节蛋白调节有助于血红素产生或豆血红蛋白血红素化的酶的表达或活性。例如,可以对编码调节谷氨酰-trna还原酶活性的蛋白质的大豆基因包括谷氨酰-trna还原酶结合蛋白(glyma.08g222600)、叶绿体信号颗粒43(glyma.11g097200)和fluorescent in blue light(glyma.16g010200和glyma.07g041700)进行修饰,例如通过插入、缺失或取代来增加或增强大豆中血红素和/或豆血红蛋白复合物的形成。
[0058]
在某些实施例中,大豆种子被编辑为含有插入到编码种子贮藏蛋白并全部或部分替换天然种子贮藏编码序列的天然基因中的豆血红蛋白编码序列。包含在其基因组中的天然位置可操作地连接到天然启动子的外源核酸编码序列的此类经编辑的构建体将不被认为是重组构建体,因为启动子和其他调节元件对于它们的天然环境不是外源的。例如,在经编辑的基因组中,基因结构可以基本保持不变,天然种子贮藏蛋白编码序列被不同的编码
序列替换,例如球蛋白,例如豆血红蛋白。此类植物、种子和细胞可称为修饰或编辑的植物、种子或细胞。
[0059]
一个或多个合适的种子贮藏蛋白编码序列可以使用本文所述的方法用球蛋白编码序列替换,例如豆血红蛋白编码序列,包括例如编码大豆球蛋白、伴大豆球蛋白、2s白蛋白、kunitz型胰蛋白酶抑制剂(kti)、bowman-birk抑制剂(bbi)或其组合的序列。
[0060]
kunitz型胰蛋白酶抑制剂(kti)和bowman-birk抑制剂(bbi)活性可减少至低于野生型大豆、无效大豆或对照大豆中发现的活性的50%、40%、30%、20%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.4%、0.3%、0.2%或0.1%,该野生型大豆、无效大豆或对照大豆未进行修饰以减少或阻止kunitz型胰蛋白酶抑制剂(kti)或bowman-birk抑制剂(bbi)编码序列的表达。
[0061]
如本文所用,关于指定核酸的“编码”(“encoding”、“encoded”等)意指包含用于翻译成指定蛋白质的信息。编码蛋白质的核酸在该核酸的翻译区之内可以包含非翻译序列(例如,内含子)或可能缺乏此类插入的非翻译序列(例如,在cdna中)。通过密码子使用来详细说明用来编码蛋白质的信息。典型地,氨基酸序列通过使用“通用”遗传密码的核酸来编码。然而,当核酸使用以下这些生物体表达时,可以使用通用密码的变体,例如存在于一些植物、动物、和真菌线粒体、细菌山羊支原体(mycoplasma capricolum)(yamao等人,(1985)proc.natl.acad.sci.usa[美国科学院院报]82:2306-9)或纤毛虫大核中的通用密码变体。
[0062]
当合成地制备或改变核酸时,可以利用要表达核酸的预期宿主的已知密码子偏好性。例如,虽然在单子叶和双子叶植物物种中均可以表达本文公开的核酸序列,但是可以修饰序列,以解释单子叶植物或双子叶植物的特定密码子偏好和gc含量偏好,因为这些偏好已经表现出了差异(murray等人,(1989)nucleic acids res.[核酸研究]17:477-98)。
[0063]
如本文所用,“多核苷酸”包括提及具有天然核糖核苷酸的基本性质的脱氧核糖多核苷酸、核糖多核苷酸、或其类似物,因为在严格的杂交条件下,它们与和天然存在的核苷酸基本上相同的核苷酸序列杂交和/或允许翻译成与一个或多个天然存在的核苷酸相同的一个或多个氨基酸。多核苷酸可以是结构基因或调节基因的全长或子序列。除非另外指明,否则术语包括提及指定序列以及其互补序列。因此,出于稳定性或其他原因而具有经修饰的主链的dna或rna是“多核苷酸”,如该术语在本文中所意指的。此外,仅举两个例子,包含稀有碱基(例如肌苷)或修饰的碱基(例如三苯甲基化的碱基)的dna或rna是多核苷酸,如该术语在本文中所用的。应当理解,已经对dna和rna进行了多种修饰,这些修饰具有本领域技术人员已知的许多有用目的。如本文采用的术语多核苷酸涵盖如多核苷酸的化学修饰形式、酶修饰形式或代谢修饰形式,以及病毒和细胞(尤其包括简单和复杂细胞)所特有的dna和rna的化学形式。
[0064]
术语“多肽”、“肽”以及“蛋白质”在本文中可互换使用,是指氨基酸残基的聚合物。所述术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。
[0065]
如本文所用,在两个核酸或多肽序列的背景下的“序列同一性”或“同一性”包括,当在指定比较窗口上比对最大对应性时,提及两个序列中的相同残基。当使用关于蛋白质的序列同一性百分比时,认识到不相同的残基位置通常相差保守氨基酸取代,其中氨基酸残基被具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基取代,并且因此不改变分
子的功能性质。当序列在保守取代方面不同时,可使用百分比相似性。相差这些保守取代的序列被称为具有“序列相似性”或“相似性”。用于进行此调节的方法是本领域技术人员所熟知的。典型地,这涉及作为部分而不是完全错配对保守取代打分,从而提高百分比序列同一性。因此,例如,当相同的氨基酸得分为1,并且非保守取代的得分为零时,保守取代的得分在零和1之间。例如,根据meyers和miller,(1988)computer applic.biol.sci.[计算机在生物科学中的应用]4:11-17的算法计算保守取代的评分,例如,在程序pc/gene(intelligenetics,美国加利福尼亚州山景城)中实施的。
[0066]
如本文所用,“序列同一性百分比”意指在比较窗口上比较两个最佳比对序列所确定的值,其中与参比序列(其不包含添加或缺失)相比,比较窗口中的多核苷酸序列部分可以包含添加或缺失(即空位),以进行这两个序列的最佳比对。通过以下方式计算百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将结果乘以100以产生序列同一性的百分比。
[0067]
提供了多核苷酸和多肽序列,它们与seq id no:1-48中任一项的多肽和多核苷酸或与seq id no:1-48中任一项的定义位置内的特定序列(如本文公开的)具有至少或至少约50%、55%、60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%且小于100%、99%、95%或90%同一性。
[0068]
如本文所用,“参比序列”是用作序列比较的基础的所定义的序列。参比序列可以是指定序列的子集或整体;例如,作为全长cdna或基因序列的区段、或完整的cdna或基因序列。
[0069]
如本文所用,“比较窗口”意指提及多核苷酸序列的连续且指定的区段,其中该多核苷酸序列可以与参比序列进行比较,并且其中与用于两个序列的最佳比对的参比序列(其不包含添加或缺失)相比,比较窗口中的多核苷酸序列部分可能包含添加或缺失(即空位)。通常,比较窗口的长度为至少20个连续核苷酸,并且任选地可以是30个、40个、50个、100个或更长。本领域技术人员应当理解,由于多核苷酸序列中含有空位,为了避免与参比序列的高相似性,典型地引入空位罚分,并且将其从匹配数中减去。
[0070]
用于比较的核苷酸序列和氨基酸序列的比对方法是本领域熟知的。smith和waterman,(1981)adv.appl.math[应用数学进展]2:482的局部同源性算法(bestfit)可以进行序列的最佳比对用于比较;通过needleman和wunsch,(1970)j.mol.biol.[分子生物学杂志]48:443-53的同源性比对算法(gap);通过pearson和lipman,(1988)proc.natl.acad.sci.usa[美国科学院院报]85:2444的相似性搜索法(tfasta和fasta);通过这些算法的计算机化实现,包括但不限于:加利福尼亚州山景城的易达利遗传学公司的pc/基因程序中的clustal,wisconsin genetics software(版本8)中的gap、bestfit、blast、fasta、和tfasta(可获得自遗传学计算机集团(genetics computer group)(程序(accelrys公司,圣地亚哥,加利福尼亚州))。以下充分描述了clustal程序:higgins和sharp,(1988)gene[基因]73:237-44;higgins和sharp(1989)cabios[计算机应用生物科学]5:151-3;corpet等人,(1988)nucleic acids res.[核酸研究]16:10881-90;huang等人,(1992)computer applications in the biosciences[计算机在生物科学
中的应用]8:155-65;以及pearson等人,(1994)meth.mol.biol.[分子生物学方法]24:307-31。用于多个序列的最佳全局比对的优选程序是pileup(feng和doolittle,(1987)j.mol.evol.[分子进化杂志],25:351-60,其类似于higgins和sharp,(1989)cabios[计算机在生物科学中的应用]5∶151-53描述的方法并且据此通过引用并入本文)。可用于数据库相似性搜索的blast程序家族包括:blastn,用于比较核苷酸查询序列与核苷酸数据库序列;blastx,用于比较核苷酸查询序列与蛋白质数据库序列;blastp,用于比较蛋白质查询序列与蛋白质数据库序列;tblastn,用于比较蛋白质查询序列与核苷酸数据库序列;以及tblastx,用于比较核苷酸查询序列与核苷酸数据库序列。参见,current protocols in molecular biology[分子生物学实验指南],第19章,ausubel等人编辑,greene publishing and wiley-interscience[格林出版与威利交叉科学出版社],纽约(1995)。
[0071]
gap使用上文的needleman和wunsch的算法来找到使匹配数目最大化并且使空位数目最小化的两个完整序列的比对。gap考虑所有可能的比对和空位位置,并且产生具有最大匹配碱基数量和最少空位的比对。它允许以匹配碱基单位提供空位产生罚分和空位延伸罚分。gap必须为它插入的每个空位获取空位产生罚分匹配数目的收益。如果选择大于零的空位延伸罚分,gap必须另外地为每个所插入空位获取空位长度乘以空位延伸罚分的收益。在wisconsin genetics software的版本10中,默认空位产生罚分值和空位延伸罚分值分别为8和2。空位产生罚分和空位延伸罚分可以表示为选自由0至100组成的整数组的整数。因此,例如,空位产生罚分和空位延伸罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或更大。
[0072]
gap给出该家族中的具有最佳比对的一个成员。可以存在这个家族的许多成员,但是其他成员没有更好的质量。gap展示出用于比对的四个优值因素:质量、比率、同一性和相似性。质量是为了将序列进行比对而最大化的度量。比率是质量除以更短区段中的碱基数。同一性百分比是实际匹配的符号的百分比。相似性百分比是相似符号的百分比。将相应于空位的符号忽略。当一对符号的评分矩阵值大于或等于相似性阈值0.50时,相似性得分。wisconsin genetics software的版本10中使用的评分矩阵为blosum62(参见henikoff和henikoff,(1989)proc.natl.acad.sci.usa[美国科学院院报]89:10915)。
[0073]
除非另外说明,否则本文提供的序列同一性/相似性值是指使用blast 2.0程序包、使用默认参数获得的值(a1tschul等人,(1997)nucleic acids res.[核酸研究]25:3389-402)。
[0074]
可提供本文所述的豆血红蛋白序列和重组构建体用于在目的植物或目的生物体中表达。该盒可以包括可操作地连接到豆血红蛋白多核苷酸或修饰的豆血红蛋白多核苷酸的5
′
和3
′
调节序列。“可操作地连接”旨在表示两个或更多个元件之间的功能性连接。例如,目的多核苷酸和调节序列(例如,启动子)之间的可操作连接是允许目的多核苷酸表达的功能性连接。可操作地连接的元件可以是连续的或非连续的。当用于指两个蛋白质编码区的连接时,可操作地连接意指这些编码区处于相同的阅读框中。该盒可以另外包含至少一个待共转化到生物体中的另外的基因。可替代地,该一个或多个额外的基因可以在多个表达盒上提供。此类表达盒装备有多个限制性位点和/或重组位点,用于将修饰的大豆球蛋白多核苷酸插入以便处于调节区的转录调节之下。表达盒可另外含有选择性标记基因。
[0075]
表达盒以5
′‑3′
转录的方向可以包括转录和翻译起始区(例如,启动子)、本文所述
的修饰的豆血红蛋白多核苷酸、和在植物中起作用的转录和翻译终止区(例如,终止区)。调节区(例如,启动子、转录调节区、和翻译终止区)和/或修饰的豆血红蛋白多核苷酸对于宿主细胞而言或彼此之间可以是天然的/类似的。可替代地,调节区和/或修饰的豆血红蛋白多核苷酸对于宿主细胞或彼此之间可以是异源的。
[0076]
如本文所用,关于序列的“异源性”是指该序列源于外来物种,或者,如果源于相同物种的话,则是通过精心的人为干预从其在组合物和/或基因组基因座中的天然形式进行实质性修饰得到的序列。例如,可操作地连接到异源多核苷酸的启动子来自与从其衍生多核苷酸的物种不同的物种,或者,如果来自相同/类似的物种,那么一方或双方基本上由它们的原来形式和/或基因组基因座修饰得到,或者启动子不是用于可操作地连接到多核苷酸的天然启动子。
[0077]
终止区对于转录起始区、对于植物宿主而言可是天然的,或可衍生自对于启动子、修饰的豆血红蛋白多核苷酸、植物宿主、或其任何组合而言的另一种来源(即外源的或异源的)。
[0078]
表达盒可以另外含有5
′
前导序列。此类前导序列可以起到增强翻译的作用。翻译前导子在本领域是已知的并且包括病毒翻译前导序列。
[0079]
在制备表达盒时,可以操作各种dna片段,以提供处于适当取向以及合适时,处于适当阅读框中的dna序列。为此,可采用衔接子(adapter)或接头以连接dna片段,或可以涉及其他操作以提供方便的限制位点、移除多余的dna、移除限制位点等。出于这个目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。
[0080]
如本文所用的“启动子”指dna的在转录开始的上游并参与rna聚合酶以及其他蛋白质的识别和结合以启动转录的区域。“植物启动子”是能够在植物细胞中启动转录的启动子。示例性植物启动子包括但不局限于从植物、植物病毒以及包含在植物细胞中表达的基因的细菌(如农杆菌属(agrobacterium)或根瘤菌属(rhizobium))获得的那些启动子。某些启动子类型优先在某些组织(如叶、根、种子、纤维、木质部导管、管胞或厚壁组织)中启动转录。这样的启动子被称为“组织偏好的”。“细胞类型”特异性启动子主要驱动在一个或多个器官中的某些细胞类型(例如,根或叶中的维管细胞)中的表达。“诱导型”或“调节型”启动子是指在环境控制下的启动子。可通过诱导型启动子影响转录的环境条件的实例包括厌氧条件或光照的存在。另一类型的启动子是发育调节启动子,例如在花粉发育期间驱动表达的启动子。组织偏好性启动子、细胞类型特异性启动子、发育调节启动子、和诱导型启动子构成“非组成型”启动子类别。“组成型”启动子是在大多数环境条件下有活性的启动子。组成型启动子包括,例如rsyn7启动子的核心启动子和其他在wo 99/43838和美国专利号6,072,050中公开的组成型启动子;核心camv 35s启动子(odell等人,(1985)nature[自然]313:810-812);稻肌动蛋白(mcelroy等人,(1990)plant cell[植物细胞]2:163-171);泛素(christensen等人,(1989)plant mol.biol.[植物分子生物学]12:619-632和christensen等人,(1992)plant mol.biol.[植物分子生物学]18:675-689);pemu(last等人,(1991)theor.appl.genet.[理论与应用遗传学]81:581-588);mas(velten等人,(1984)embo j.[欧洲分子生物学学会杂志]3:2723-2730);als启动子(美国专利号5,659,026)等。其他组成型启动子包括例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142:和6,177,611。
[0081]
还考虑了包括一种或多种异源调节元件的组合的合成启动子。
[0082]
启动子可以是本领域已知的任何类型或类别的启动子,使得可以使用许多启动子中的任一种来表达本文公开的各种修饰的豆血红蛋白序列,包括目的多核苷酸序列的天然启动子。用于本文公开的重组dna构建体的启动子可以基于期望的结果进行选择。
[0083]
在某些实施例中,本文所述的重组dna构建体在植物或种子中表达。在某些实施例中,植物或种子是大豆植物或大豆种子。如本文所用,术语植物包括植物原生质体、从中可再生出植物的植物细胞组织培养物、植物愈伤组织、植物块和在植物或植物部分(例如胚、花粉、胚珠、种子、叶、花、枝、果、籽粒、穗、穗轴、壳、茎、根、根尖、花药等)中的完整植物细胞。谷物旨在意指由商业种植者出于栽培或繁殖物种之外的目的所生产的成熟种子。再生的植物的子代、变体和突变体也包括在本公开的范围内,前提条件是这些部分包含引入的多核苷酸。
[0084]
在某些实施例中,大豆植物或大豆种子进一步包含至少一种额外的修饰,其与对照种子(例如,不包含至少一种修饰的种子)相比增加了种子中的总蛋白。在某些实施例中,与对照种子相比,包含至少一种修饰的大豆种子包含至少约1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%或15%且少于20%、15%、10%、9%、8%、7%、6%或5%以干重计测量的总蛋白中的百分点增加。
[0085]
在某些实施例中,大豆植物或大豆种子进-步包含至少一种降低种子中棉子糖家族寡糖(rfo)含量的额外的修饰。在某些实施例中,修饰包括棉子糖合酶的表达和/或活性的降低。在某些实施例中,修饰包括棉子糖合酶2(rs2)和/或棉子糖合酶4(rs4)的表达和/或活性的降低。在某些实施例中,与对照种子相比,大豆种子包含rs2、rs4、或rs2和rs4的表达降低至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或99%。在某些实施例中,种子包含以干重计小于约6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或0.5%的rfo含量。在某些实施例中,与对照种子相比,引入的修饰使rfo含量降低少约1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%或15%且少于20%、15%、10%、9%、8%、7%、6%或5%以干重计测量的总蛋白中的百分点增加。
[0086]
在某些实施例中,大豆植物或大豆种子进一步包含至少一种额外的修饰,其增加种子中油酸的量、降低种子中亚麻酸的量、增加种子蛋白的量或其组合。例如,修饰可以在fad2-1a、fad2-1b、fad3a、fad3b基因中。
[0087]
在某些实施例中,大豆植物或大豆种子进一步包含至少一种增加总蛋白量的额外的修饰,例如通过修饰编码以下的基因中的一者或多者:(i)含有cct结构域的蛋白质,(ii)网状蛋白,(iii)海藻糖磷酸合酶,(iv)hect泛素连接酶(hel或upl3),(v)mft(mother of flowering)多肽,(vi)棉子糖合酶rs2、rs3,或rs4,例如美国专利号5,710,365、8728726和10,081,814中所公开的,每一个文献均通过引用以其全文并入本文或(vii)其任何组合。
[0088]
例如,提供了包含本文公开的量的豆血红蛋白并且其可以被加工以产生油和粕的大豆种子,以及由其产生的油,其中大豆和/或油具有占总脂肪酸的至少或至少约50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89或90重量百分比的油酸(c 18∶1)且占总脂肪酸的小于或小于约100、99、98、97、96、95、94、93、92、91、90、89、88、87、86、85、84、83、82、81、80、79、78、76、75、74、73、72、71或70重量百分比的油酸。
[0089]
例如,提供了包含本文公开的量的豆血红蛋白的大豆种子,其可被加工以产生油,以及由其产生的油,其中大豆和/或油具有占总脂肪酸的至少或至少约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9或3.0重量百分比的亚麻酸(c 18∶3)且占总脂肪酸的小于或小于约6、5.5、5、4.5、4、3.9、3.8、3.7、3.6、3.5、3.4、3.3、3.2、3.1、3.0、2.9、2.8、2.7、2.6、2.5、2.4、2.3、2.2、2.1或2.0重量百分比的亚麻酸。
[0090]
例如,提供了大豆种子,其包含本文公开的量的豆血红蛋白并且其蛋白含量为总种子重量的至少或至少约35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%或55%且少于或少于约65%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%(当在13%水分下或调整至13%水分测量时)。
[0091]
例如,提供了大豆种子,其包含本文公开的量的豆血红蛋白并且其水苏糖含量为总种子重量的少于或少于约4%、3.5%、3%、2.5%、2%、1.5%、1%、0.5%、0.4%、0.3%、0.2%或0.1%且至少或至少约0%、0.01%、0.05%、0.06%、0.07%、0.08%或0.09%(当在13%水分下或调整至13%水分测量时)。
[0092]
例如,提供了大豆种子,其包含本文公开的量的豆血红蛋白并且其棉子糖含量为总种子重量的少于或少于约2%、1.5%、1.4%、1.3%、1.2%、1.1%、1%、0.9%、0.8%、0.7%、o.6%、0.5%、0.4%、0.3%、0.2%或0.1%且至少或至少约0%、0.01%、0.05%、0.06%、0.07%、0.08%或0.09%(当在13%水分下或调整至13%水分测量时)。
[0093]
如本文所用,“大豆蛋白组合物”是指含有大豆蛋白的人类或动物食品成分。在某些实施例中,组合物是人类食物组合物。在某些实施例中,人类食物组合物是选自由以下组成的组的组合物:豆粕;大豆粉;脱脂大豆粉;豆浆;喷雾干燥豆浆;大豆蛋白浓缩物;组织大豆蛋白浓缩物;水解大豆蛋白;大豆蛋白分离物;喷雾干燥豆腐;大豆肉模拟物;大豆奶酪模拟物;和大豆咖啡奶精。
[0094]
在一些实施例中,提供大豆分离物或大豆蛋白分离物,其包含占总蛋白重量的至少0.1%、0.2%、0.3%、0.4%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%且小于25%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的豆血红蛋白,其中至少约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%、85%、90%或95%且小于99.9%、99%、98%、97%、96%、95%、90%、85%、80%或75%的豆血红蛋白用铁基团血红素化。
[0095]
在某些实施例中,与对照种子相比,产生包含如本文所述的豆血红蛋白的种子的植物包含至少约10%、15%、20%、25%、30%、35%、40%、50%、60%、70%、80%、90%、100%或500%且小于约1000%、500%、100%、90%、80%、70%、60%或50%的一种或多种必需氨基酸的量的增加。
[0096]
如本文所用,“增加百分比”是指表示为对照值的分数的变化或差异,例如{[修饰/转基因/测试值(%)-对照值(%)]/对照值(%)}x100%=百分比变化,或{[第一个位置获得的值(%)-第二个位置获得的值(%)]/第二个位置的值(%)}x100=百分比变化。
[0097]
在某些实施例中,一种或多种必需氨基酸是甲硫氨酸、胱氨酸、色氨酸、苏氨酸和赖氨酸中的一种或多种或其任意组合。
[0098]
在某些实施例中,提供了方法、植物和种子,其进一步包含至少一种额外的修饰,与对照种子(例如,不包含至少一种修饰的种子)相比增加种子中的总蛋白。在某些实施例中,与对照种子相比,引入的修饰将包含豆血红蛋白的大豆种子中的蛋白含量增加至至少约1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%或15%且小于20%、15%、10%、9%、8%、7%、6%或5%以干重计测量的总蛋白中的百分点增加。
[0099]
在某些实施例中,该方法选一步包括引入至少一种降低种子中棉子糖家族寡糖(rfo)含量的修饰。在某些实施例中,修饰包括棉子糖合酶的表达和/或活性的降低。在某些实施例中,修饰包括棉子糖合酶2(rs2)和/或棉子糖合酶4(rs4)的表达和/或活性的降低。在某些实施例中,与对照种子相比,大豆种子包含rs2、rs4、或rs2和rs4的表达降低至少35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或99%。在某些实施例中,种子包含以干重计小于约6%、5.5%、5%、4.5%、4%、3.5%、3%、2.5%、2%、1.5%、1%或0.5%的rfo含量。在某些实施例中,与对照种子相比,引入的修饰使rfo含量降低少约1%、1.5%、2%、2.5%、3%、3.5%、4%、5%、10%或15%且少于20%、15%、10%、9%、8%、7%、6%或5%以干重计测量的总蛋白中的百分点增加
[0100]
在某些实施例中,该方法包括:(a)提供指导rna、至少一种多核苷酸修饰模板、以及至少一种cas内切核酸酶至植物细胞,其中该至少一种cas内切核酸酶在植物细胞中待修饰的内源基因处引入双链断裂,并且其中多核苷酸修饰模板产生编码本文所述的多肽中的任一者的修饰基因;(b)从该植物细胞获得植物;以及(c)产生子代植物。
[0101]
本文提供了用于修饰天然存在的多核苷酸或整合的转基因序列(包括调节元件、编码序列和非编码序列)的方法和组合物。这些方法和组合物在将核酸靶向至基因组中的预先工程化的靶识别序列中是有用的。多核苷酸的修饰可以例如通过将单链或双链断裂引入dna分子中来完成。
[0102]
在某些实施例中,该方法包括:(a)提供指导rna、至少一种多核苷酸修饰模板、以及至少一种cas内切核酸酶至植物细胞,其中该至少一种cas内切核酸酶在植物细胞中待修饰的内源基因处引入双链断裂,并且其中多核苷酸修饰模板产生编码本文所述的多肽中的任一者的修饰基因;(b)从该植物细胞获得植物;以及(c)产生子代植物。
[0103]
由双链断裂诱导剂(例如在多核苷酸链中切割磷酸二酯键的内切核酸酶)诱导的双链断裂可以导致dna修复机制的诱导,包括非同源末端连接途径以及同源重组。内切核酸酶包括一系列不同的酶,包括限制性内切核酸酶(参见,例如,roberrs等人,(2003)nucleic acids res[核酸研究]1:418-20)、roberrs等人,(2003)nucleic acids res[核酸研究]31:1805-12、和belfort等人,(2002)在mobile dna[运动dna]ii,第761-783页,编辑craigie等人,(asm出版社,华盛顿特区)中)、大范围核酸酶(参见例如,wo 2009/114321;gao等人,(2010)plant journal[植物杂志]1:176-187)、tal效应子核酸酶或talen(参见例如,us 20110145940,christian,m.,t.cermak,等人,2010.targeting dna double-strand breaks with tal effector nucleases.[用tal效应子核酸酶靶向dna双链断裂]genetics[遗传学]186(2):757-61和boch等人,(2009),science[科学]326(5959):1509-12)、锌指核酸酶(参见例如kim,y.g.,j.cha等人,(1996).“hybrid restriction enzymes:zinc finger fusions to foki cleavage[杂交限制性内切酶:锌指与foki融合蛋白的切割]”)、和crispr-cas内切核酸酶(参见例如,2007年3月1日公布的wo 2007/025097申请)。
[0104]
一旦在基因组中诱导了双链断裂,则细胞dna修复机制被激活以修复断裂。有两种dna修复途径。一种被称为非同源末端连接(nhej)途径(bleuyard等人,(2006)dna repair[dna修复]5:1-12),另一种被称为同源-定向修复(hdr)。染色体的结构完整性典型地通过nhej来保存,但是缺失、插入或其他重排(如染色体易位)是可能的(siebert和puchta,2002 plant cell[植物细胞]14:1121-31;pacher等人,2007 genetics[遗传学]175:21-9)。hdr途径是修复双链dna断裂的另一种细胞机制,并且包括同源重组(hr)和单链退火(ssa)(lieber.2010 annu.rev.biochem.[生物化学年鉴]79:181-211)。
[0105]
除了双链断裂诱导剂,还可以实现位点特异性碱基转化以工程化一个或多个核苷酸变化,从而在基因组中创建一个或多个本文所述的修饰。这些包括例如,由c
·
g至t
·
a或a
·
t至g
·
c碱基编辑脱氨酶介导的位点特异性碱基编辑(gaudelli等人,programmable base editing of a
·
t to g
·
c in genomic dna without dna cleavage.[在无dna切割时基因组dna中a
·
t至g
·
c的可编程碱基编辑]
″
nature[自然](2017);nishida等人,“targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.[使用杂交体原核和脊椎动物适应性免疫系统进行靶向核苷酸编辑]”science[科学]353(6305)(2016);komor等人,“programmable editing of a target base in genomic dna without double-stranded dna cleavage.[在无双链dna切割时基因组dna中靶碱基的可编程编辑]”nature[自然]533(7603)(2016):420-4)。
[0106]
在本文所述的方法中,可以通过crispr相关cas内切核酸酶、锌指核酸酶介导的系统、大范围核酸酶介导的系统、寡核碱基介导的系统、或本领域的普通技术人员已知的任何基因修饰系统修饰内源基因。
[0107]
在某些实施例中,通过crispr相关(cas)内切核酸酶修饰内源基因。
[0108]
i类cas内切核酸酶包含多亚基效应子复合物(i型、iii型和iv型),而2类系统包含单蛋白效应子(ii型、v型和vi型)(makarova等人,2015,nature reviews microbiology[自然微生物学综述]第13卷:1-15;zetsche等人,2015,cell[细胞]163,1-13;shmakov等人,2015,molecular cell[分子细胞学]60,1-13;haft等人,2005,computational biology,plos comput biol[美国科学公共图书馆计算生物学]1(6):e60;以及koonin等人,2017,curr opinion microbiology[微生物学新见]37:67-78)。在2类ii型系统中,cas内切核酸酶与指导多核苷酸复合起作用。
[0109]
因此,在本文所述方法的某些实施例中,cas内切核酸酶与指导多核苷酸形成复合物(例如,指导多核苷酸/cas内切核酸酶复合物)。
[0110]
如本文所用,术语“指导多核苷酸”涉及可以与cas内切核酸酶(包括本文所述的cas内切核酸酶)形成复合物,并且使得该cas内切核酸酶能够识别、任选地结合并任选地切割dna靶位点的多核苷酸序列。指导多核苷酸序列可以是rna序列、dna序列或其组合(rna-dna组合序列)。指导多核苷酸可进一步包含化学修饰的碱基,例如但不限于锁核酸(lna)、5-甲基dc、2,6-二氨基嘌呤、2
′‑
氟代a、2
′‑
氟代u、2
′‑
o-甲基rna、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5
′
至3
′
共价连接。
[0111]
在某些实施例中,该cas内切核酸酶与指导多核苷酸(grna)形成复合物,该指导多核苷酸引导cas内切核酸酶切割dna靶标,以使靶标能够被cas内切核酸酶识别、结合和切
割。指导多核苷酸(例如,grna)可包含与cas内切核酸酶相互作用的cas内切核酸酶识别(cer)结构域,以及与靶dna中的核苷酸序列杂交的可变靶向(vt)结构域。在某些实施例中,指导多核苷酸(例如,grna)包含crispr核苷酸(cr核苷酸;例如,crrna)和反式激活crispr核苷酸(tracr核苷酸;例如,tracrrna)以将cas内切核酸酶指导至其dna靶标。该指导多核苷酸(例如,grna)包含与双链dna靶标的一条链互补的间隔区和与tracr核苷酸(例如,tracrrna)碱基配对形成核苷酸双链体(例如,rna双链体)的区域。
[0112]
在一些实施例中,该grna是包含crrna和tracrrna的合成融合体的“单指导rna”(sgrna)。在许多系统中,该cas核酸内切酶指导的多核苷酸复合物识别与靶序列(前间区序列)相邻的短核苷酸序列,称为“前间区序列邻近基序”(pam)。
[0113]
术语“单指导rna”和“sgrna”在本文中可互换使用,并涉及两个rna分子的合成融合,其中包含可变靶向结构域(与tracrrna杂交的tract配对序列连接)的crrna(crispr rna)与tracrrna(反式激活crispr rna)融合。单指导rna可以包含可与ii型cas核酸内切酶形成复合物的ii型crispr/cas系统的crrna或crrna片段和tracrrna或tracrrna片段,其中所述指导rna/cas核酸内切酶复合物可以将cas核酸内切酶引导至dna靶位点,使得cas核酸内切酶能够识别、任选地结合dna靶位点、并任选地使dna靶位点产生切口或切割(引入单链或双链断裂)dna靶位点。
[0114]
连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含rna序列、dna序列或rna-dna组合序列。在一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸的长度。在一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含四核苷酸环序列,例如但不限于gaaa四核苷酸环序列。
[0115]
术语“可变靶向结构域”或“vt结构域”在本文中可互换使用,并且包括可以与双链dna靶位点的一条链(核苷酸序列)杂交(互补)的核苷酸序列。在一些实施例中,可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向结构域可以由dna序列、rna序列、修饰的dna序列、修饰的rna序列或其任何组合构成。
[0116]
术语(指导多核苷酸的)“cas内切核酸酶识别结构域”或“cer结构域”在本文中可互换地使用,并且包括与cas内切核酸酶多肽相互作用的核苷酸序列。cer结构域包含(反式作用)tracr核苷酸配对序列,随后是tracr核苷酸序列。cer结构域可以由dna序列、rna序列、修饰的dna序列、修饰的rna序列(参见,例如,2015年2月26日公开的us 20150059010 a1)或其任何组合构成。
[0117]
如本文所用的“前间区序列邻近基序”(pam)是指与靶序列(前间区序列)相邻的短核苷酸序列,其被本文描述的指导多核苷酸/cas内切核酸酶系统识别(靶向)。在某些实施例中,如果靶dna序列不邻近或靠近pam序列,则cas内切核酸酶可能无法成功识别靶dna序列。在某些实施例中,pam在靶序列之前(例如,cas12a)。在某些实施例中,pam在靶序列之后(例如,化脓性链球菌cas9)。本文中的pam的序列和长度可以取决于所使用的cas蛋白或cas蛋白复合物而不同。pam序列可以是任何长度,但典型地是1、2、3、4、5、6、7、8、9、10、11、12、
13、14、15、16、17、18、19或20个核苷酸长度。
[0118]
如本文所用,术语“指导多核苷酸/cas内切核酸酶复合物”、“指导多核苷酸/cas内切核酸酶系统”、“指导多核苷酸/cas复合物”、“指导多核苷酸/cas系统”和“指导cas系统”、“多核苷酸指导的内切核酸酶”、“pgen”在本文中可互换使用,并且是指能够形成复合物的至少一种指导多核苷酸和至少一种cas内切核酸酶,其中所述指导多核苷酸/cas内切核酸酶复合物可以将cas内切核酸酶引导至dna靶位点,使cas内切核酸酶能够对dna靶位点进行识别、结合、并且任选地产生切口或进行切割(引入单链或双链断裂)。本文的指导多核苷酸/cas内切核酸酶复合物可包含任何已知crispr系统的一种或多种cas蛋白和一种或多种合适的多核苷酸组分(horvath和barrangou,2010,science[科学]327:167-170;makarova等人,2015,nature reviews microbiology[自然微生物学综述]第13卷:1-15;zetsche等人,2015,cell[细胞]163,1-13;shmakov等人,2015,molecular cell[分子细胞学]60,1-13)。在某些实施例中,指导多核苷酸/cas内切核酸酶复合物作为核糖核蛋白(rnp)提供,其中cas内切核酸酶组分作为蛋白质提供并且指导多核苷酸组分作为核糖核苷酸提供。
[0119]
用于本文所述方法的cas内切核酸酶的实例包括但不限于cas9和cpf1。cas9(以前称为cas5、csn1或csx12)是一种2类ii型cas内切核酸酶(makarova等人,2015,nature reviews microbiology[自然微生物学综述],第13卷:1-15)。cas9-grna复合物识别靶位点处的3
′
pam序列(对于化脓性链球菌cas9是ngg),允许指导rna的间隔子侵入双链dna靶标,并且如果间隔子与前间区序列之间存在足够的同源性,则产生双链断裂切割。cas9内切核酸酶包含一起产生双链断裂的ruvc结构域和hnh结构域,并且二者可分别产生单链断裂。对于化脓性链球菌cas9内切核酸酶,双链断裂留下平末端。cpf1是2类v型cas内切核酸酶,并且包含核酸酶ruvc结构域,但缺少hnh结构域(yamane等人,2016,cell[细胞]165:949-962)。cpf1内切核酸酶产生“粘性”突出端。
[0120]
cas9-grna系统在基因组靶位点的一些用途包括但不限于一个或多个核苷酸在靶位点插入、缺失、取代或修饰;修饰或替换目的核苷酸序列(如调节元件):目的多核苷酸的插入;基因敲除;基因敲入;修饰剪接位点和/或引入替换的剪接位点;编码目的蛋白质的核苷酸序列的修饰;氨基酸和/或蛋白质融合;以及通过将反向重复序列表达为目的基因来进行基因沉默。
[0121]
术语“靶位点”、“靶序列”、“靶位点序列”、“靶dna”、“靶基因座”、“基因组靶位点”、“基因组靶序列”、“基因组靶基因座”和“前间区序列”在本文中可互换使用,并且是指多核苷酸序列,例如但不限于细胞基因组(包括染色体、叶绿体、线粒体dna、质粒dna)中的染色体、附加体、基因座或任何其他dna分子上的核苷酸序列,指导多核苷酸/cas内切核酸酶复合物可以在该位置处识别、结合并任选地产生缺口或切割。靶位点可以是细胞的基因组中的内源位点,或者可替代地,靶位点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中,或者与在自然界发生的位置相比,可以在异质基因组位置中找到靶位点。如本文所用,术语“内源靶序列”和“天然靶序列”在本文中可互换使用,是指靶序列对于细胞基因组是内源的或天然的,并且在细胞的基因组中处于该靶序列的内源或天然位置。“人工靶位点”或“人工靶序列”在本文中可互换使用,并且是指已引入细胞基因组中的靶序列。这样的人工靶序列可以在序列上与细胞基因组中的内源或天然靶序列相同,但位于细胞基因组中的不同位置(即,非内源或非天然位置)。“改变的靶位点”、“改变的靶序列”、“修饰的靶
位点”、“修饰的靶序列”在本文中可互换使用,并且是指与未改变的靶序列相比包含至少一个改变的本文公开的靶序列。此类“改变”包括,例如:(i)至少一个核苷酸的替换,(ii)至少一个核苷酸的缺失,(iii)至少一个核苷酸的插入,或(iv)(i)-(iii)的任何组合。
[0122]
还提供了“多核苷酸修饰模板”,与待编辑的核苷酸序列相比,其包含至少一个核苷酸修饰。例如,对应于seq id no:1的内源基因中的修饰以诱导编码的多肽中的氨基取代。核苷酸修饰可以是至少一个核苷酸取代、添加、缺失或化学改造。任选地,多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列,其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。
[0123]
在本文公开的方法的某些实施例中,将目的多核苷酸插入靶位点并作为“供体dna”分子的一部分提供。如本文所用,“供体dna”是dna构建体,其包括待插入到cas内切核酸酶的靶位点的目的多核苷酸。供体dna构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体dna的同源的第一区域和第二区域分别与存在于细胞或生物基因组的靶位点中或位于该靶位点侧翼的第一和第二基因组区域具有同源性。供体dna可以与指导多核苷酸进行系链。系链的供体dna可以允许共定位靶标和供体dna,可用于基因组编辑、基因插入和靶向的基因组调节,并且还可以用于靶向有丝分裂后期细胞,在这些细胞中内源性hr机制的功能预计会大大降低(mali等人,2013 nature methods[自然方法]第10卷:957-963)。靶标和供体多核苷酸共享的同源性或序列同一性的量可以变化并且包括总长度和/或区域。
[0124]
使用修饰模板编辑cas9-grna双链断裂位点的基因组序列的过程通常包括:为宿主细胞提供cas9-grna复合物,该复合物识别宿主细胞基因组中的靶序列并能够诱导基因组序列中的双链断裂,并且提供包含与要编辑的核苷酸序列相比至少一个核苷酸改变的至少一种多核苷酸修饰模板。该多核苷酸修饰模板还可以包含侧翼于该至少一个核苷酸改变的核苷酸序列,其中侧翼序列与侧翼于双链断裂的染色体区域基本同源。已经在例如以下中描述了使用双链断裂诱导剂(如cas9-grna复合物)的基因组编辑:2015年3月19日公开的us20150082478,2015年2月26日公开的wo 2015026886,2016年1月14日公开的wo 2016007347,以及于2016年2月18日公开的wo2016025131。
[0125]
为了促进真核细胞的最佳表达和核定位,可以如2016年11月24日公布的wo 2016186953中所述对包含cas内切核酸酶的基因进行优化,然后通过本领域已知的方法将其作为dna表达盒递送至细胞中。在某些实施例中,cas内切核酸酶作为多肽提供。在某些实施例中,cas内切核酸酶作为编码多肽的多核苷酸提供。在某些实施例中,指导rna作为编码一种或多种rna分子的dna分子提供。在某些实施例中,指导rna作为rna或化学修饰的rna提供。在某些实施例中,cas内切核酸酶蛋白和指导rna作为核糖核蛋白复合物(rnp)提供。
[0126]
在某些实施例中,提供了用于通过锌指介导的基因组编辑工艺修饰内源的方法。用于编辑染色体序列的锌指介导的基因组编辑工艺包括例如:(a)将以下引入细胞中:至少一种编码锌指核酸酶的核酸,该锌指核酸酶识别染色体序列中的靶序列并且能够切割染色体序列中的位点,以及任选地,(i)至少一个供体多核苷酸,其包括侧接有上游序列和下游序列的用于整合的序列,该上游序列和下游序列显示出与切割位点任一侧的基本序列同一性,或(ii)至少一个交换多核苷酸,其包含与在切割位点处的染色体序列的一部分基本相同的序列并且其进一步包含至少一个核苷酸改变;以及(b)培养细胞以允许锌指核酸酶的
表达,使得锌指核酸酶将双链断裂引入染色体序列中,并且其中双链断裂通过以下修复(i)非同源末端连接修复过程,使得失活突变引入染色体序列中,或(ii)同源定向修复过程,使得供体多核苷酸中的序列整合到染色体序列中,或者使得交换多核苷酸中的序列与染色体序列的一部分交换。
[0127]
锌指核酸酶包括dna结合结构域(即锌指)和切割结构域(即核酸酶)。编码锌指核酸酶的核酸可包括dna或rna。锌指结合结构域可以被工程化以识别并结合任何选择的核酸序列。参见,例如,beerli等人,(2002)nat.biotechnol.[自然生物技术]20:135-141;pabo等人,(2001)ann.rev.biochem.[生物化学年鉴]70:313-340;choo等人,(2000)curr.opin.struct.biol.[结构生物学的当前观点]10:411-416;以及doyon等人,(2008)nat.biotechnol.[自然生物技术]26:702-708;santiago等人,(2008)proc.natl.acad.sci.usa[美国科学院院报]105:5809-5814;urnov等人,(2010)nat rev genet.[遗传学自然评论]11(9):636-46;以及shukla等人,(2009)nature[自然]459(7245):437-41。与天然存在的锌指蛋白相比,工程化的锌指结合结构域可能具有新的结合特异性。例如,美国专利号6,453,242中所述的算法可用于设计锌指结合结构域以靶向预选序列。非简并识别代码表也可用于设计锌指结合结构域以靶向特定序列(sera等人,(2002)biochemistry[生物化学]41:7074-7081)。可以使用用于识别dna序列中的潜在靶位点和设计锌指结合结构域的工具(mandell等人,(2006)nuc.acid res.[核酸研究]34:w516-w523;sande等人,(2007)nuc.acid res.[核酸研究]35:w599-w605)。
[0128]
示例性锌指dna结合结构域识别并结合与期望的靶序列具有至少约80%序列同一性的序列。在其他实施例中,序列同一性可为约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
[0129]
锌指核酸酶还包括切割结构域。锌指核酸酶的切割结构域部分可从任何内切核酸酶或外切核酸酶获得。可衍生切割结构域的内切核酸酶的非限制性实例包括但不限于限制性内切核酸酶和归巢内切核酸酶。参见,例如,2010-2011目录,new england biolabs[新英格兰生物实验室],马萨诸塞州贝弗莉;以及belfort等人,(1997)nucleic acids res.[核酸研究]25:3379-3388。已知切割dna的额外的酶(例如,s1核酸酶;绿豆核酸酶;胰腺dnase i;微球菌核酸酶;酵母ho内切核酸酶)。这些酶(或其功能片段)中的一者或多者可用作切割结构域的来源。
[0130]
在本文所述方法的某些实施例中,通过使用为修饰植物基因组而产生的“定制”大范围核酸酶来修饰内源基因(参见例如,wo2009/114321;gao等人,(2010)plant journal[植物学报]1:176-187)。术语“大范围核酸酶”通常是指天然存在的归巢内切核酸酶,其在大于12个碱基对并涵盖相应的内含子插入位点的识别序列处结合双链dna。天然存在的大范围核酸酶可以是单体(例如,i-scei)或二聚体(例如,i-crei)。如本文所用,术语大范围核酸酶可用于指单体大范围核酸酶、二聚体大范围核酸酶或与其结合以形成二聚体大范围核酸酶的单体。
[0131]
天然存在的大范围核酸酶,例如来自laglidadg家族的大范围核酸酶,已被用于有效促进植物、酵母、果蝇、哺乳动物细胞和小鼠中的位点特异性基因组修饰。已知工程化的大范围核酸酶,例如例如lig-34大范围核酸酶,其识别并切割玉米(玉蜀黍)基因组中发现的22个碱基对的dna序列(参见例如,us 20110113509)。
[0132]
在本文所述方法的某些实施例中,内源基因通过使用tal内切核酸酶(talen)进行修饰。来自植物致病性黄单胞菌的tal(转录激活因子样)效应子是重要的毒力因子,其在植物细胞核中充当转录激活因子,在此处它们经由串联重复序列的中心结构域直接与dna结合。转录激活因子样(tal)效应子dna修饰酶(tale或talen)也用于工程化遗传变化。参见例如,us20110145940,boch等人,(2009),science[科学]326(5959):1509-12。tal效应子与foki核酸酶的融合提供了在特定位置结合和切割dna的talen。靶标特异性是通过在tal效应子中开发定制的氨基酸重复序列确定的。
[0133]
在本文所述方法的某些实施例中,内源基因通过使用碱基编辑进行修饰,例如寡核碱基介导的系统。除了双链断裂诱导剂,还可以实现位点特异性碱基转化以工程化一个或多个核苷酸变化,从而在基因组中创建一个或多个本文所述的eme。这些包括例如,由c
·
g至t
·
a或a
·
t至g
·
c碱基编辑脱氨酶介导的位点特异性碱基编辑(gaudelli等人,programmable base editing of a
·
t to g
·
c in genomic dna without dna cleavage.[在无dna切割时基因组dna中a
·
t至g
·
c的可编程碱基编辑]”nature[自然](2017);nishida等人,“targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptive immune systems.[使用杂交体原核和脊椎动物适应性免疫系统进行靶向核苷酸编辑]”science[科学]353(6305)(2016);komor等人,“programmable editing of a target base in genomic dna without double-stranded dna cleavage.[在无双链dna切割时基因组dna中靶碱基的可编程编辑]”nature[自然]533(7603)(2016):420-4)。与胞苷脱氨酶或腺嘌呤脱氨酶蛋白融合的催化死亡的dcas9成为特异性的碱基编辑器,其可以改变dna碱基而不会引起dna断裂。碱基编辑器转换c-》t(或在相反链上,g->a)或腺嘌呤碱基编辑器将腺嘌呤转换为肌苷,从而在grna指定的编辑窗口内导致a->g变化。
[0134]
还提供了植物育种的方法,其包括将本文所述的任何大豆植物与第二植物杂交以产生包含本文所述的至少一种修饰的子代种子。在某些实施例中,植物由子代种子产生。
[0135]
以下是本发明一些方面的具体实施例的实例。提供这些实例仅出于说明目的而无意以任何方式限制本发明的范围。
[0136]
实例1:大豆豆血红蛋白在大豆种子中的表达
[0137]
在大豆基因组中鉴定出大豆豆血红蛋白基因(glyma.20g191200)。该基因含有4个外显子,其cds(seq id no:1)编码豆血红蛋白肽(seq id no:2)。如图1所示,大豆豆血红蛋白在大豆种子中表达时没有信号肽。此外,几种蛋白靶向信号序列被用于将豆血红蛋白靶向到大豆种子中的蛋白贮藏液泡中(表2)。β-伴大豆球蛋白α’spp由seq id no:3的位置1至位置195的核苷酸编码,其相应的肽序列由seq id no:4的位置1至位置65定义。凝集素sp由seq id no:5的位置1至位置105的核苷酸编码,其相应的肽序列由seq id no:6的位置1至位置35定义。gy1 sp由seq id no:7的位置1至位置66的核苷酸编码,其相应的肽序列由seq id no:8的位置1至位置22定义。使用强种子特异性启动子,例如β-伴大豆球蛋白启动子(seq id no:9)或大豆球蛋白启动子(seq id no:10)来驱动豆血红蛋白的表达。rubisco小亚基(rubisco ssu)质体靶向序列也用于将豆血红蛋白靶向质体。rubisco ssusp质体靶向序列由来自seq id no:31的位置1至位置165的核苷酸序列编码,相应的肽靶向seq id no:32的位置1至位置55的序列。豆血红蛋白编码序列是从seq id no:31的位置166到位置603,
并且相应的肽形成seq id no:32的位置56到位置200。这些表达载体通过苍白杆菌属(ochrobactrum)介导或农杆菌(agrobacteria)介导的大豆胚轴转化引入大豆植物中,前者描述于美国专利公开号2018/0216123中。结果描述于实例7中。
[0138]
表2:通过蛋白质靶向在大豆种子中表达豆血红蛋白。
[0139][0140]
实例2:通过卟啉途径工程化-谷氨酰-trna还原酶和铁螯合酶提高大豆豆血红蛋白表达水平
[0141]
为了提高种子中大豆豆血红蛋白的表达水平,采用了卟啉途径工程化方法。导致血红素生物合成的卟啉途径有至少九个酶促步骤。其中,如图2所示,对谷氨酰-trna还原酶(glyma.04g089800)和铁螯合酶(glyma.04g050400)进行了增加血红素产量的测试,以促进大豆种子中更高的豆血红蛋白积累和血红素负载。为此,制作了四种额外的大豆载体,除了实例1中的豆血红蛋白表达盒外,每种载体还含有谷氨酰-trna还原酶(seq id no:11、12)和铁螯合酶(seq id no:13、14)的表达。这两个生物合成基因由强种子特异性启动子驱动,例如菜豆(phaseolus vulgaris)菜豆球蛋白启动子(seq id no:15)或欧洲油菜(brassica napus)油菜贮藏蛋白启动子(seq id no:16)。在这四种载体中,这两种生物合成基因的表达盒与具有或不具有不同的信号肽靶向序列的豆血红蛋白的四种表达盒分子堆叠。如美国专利公开号2018/0216123所述,这些表达载体通过苍白杆菌属介导的大豆胚轴转化引入大豆植物中。结果描述于实例7中。
[0142]
实例3:通过卟啉酶修饰或表达提高大豆豆血红蛋白表达水平
[0143]
使用与实例2中描述的方法类似的技术方法调节卟啉途径的其他酶促步骤,例如谷氨酸-1-半醛2,1-氨基变位酶、氨基乙酰丙酸脱水酶、羟甲基胆素合酶、尿卟啉原iii合酶、尿卟啉原脱羧酶、粪卟啉原iii氧化酶和原卟啉原氧化酶。表3列出了使用的卟啉途径大豆基因的实例。在大豆种子中过表达这些天然代谢酶基因是通过用包含这些多肽的编码序列的重组构建体转化大豆来实现的,该编码序列可操作地连接到提供用于在大豆种子中表达的调节序列。其次,这些酶的表达增加是通过基因编辑实现的。这些酶的反馈敏感调节结构域通过基因编辑截断、缺失、取代或插入来识别和移除或失活。预计实现修饰的大豆种子中产生的豆血红蛋白的增加的血红素含量会产生增加的豆血红蛋白复合物。修饰为反馈不敏感或者以其他方式修饰或编辑以增强酶表达、稳定性或活性的血红素生物合成酶在大豆种子中表达以进一步增加血红素产量,从而使大豆种子中的豆血红蛋白积累和血红素负载更高。具体而言,谷氨酰-trna还原酶(gtr)酶活性处于由蛋白质fluorescent in blue light(flu)、谷氨酰-trna还原酶结合蛋白(gbp)、叶绿体信号颗粒43(srp43)介导的组合、翻译后控制下(表4)。通过基因编辑、种子偏好的过表达或rna干扰实现的这三种蛋白质的
单一或任何组合的改变的表达预计将通过增加发育中种子中的血红素生物合成活性来实现更高水平的含血红素的豆血红蛋白。
[0144]
表3:卟啉途径中的大豆基因
[0145][0146][0147]
表4:编码调节谷氨酰-trna还原酶活性的蛋白质的大豆基因
[0148]
酶名称基因模型名称谷氨酰-trna还原酶结合蛋白glyma.08g222600叶绿体信号颗粒43glyma.l1 g097200fluorescent in blue lightglyma.16g010200 glyma.07g041700
[0149]
实例4:将豆血红蛋白基因基因组工程化到天然大豆大豆球蛋白基因座中
[0150]
使用crispr/cas9系统,我们设计了特异性grna(gm-gy-cr1,seq id no:17;gm-gy-cr2,seq id no:18;和gm-gy-cr3,seq id no:19)以靶向大豆球蛋白1(gy1)基因(glyma.03g163500,seq id no:20(核苷酸序列),seq id no:21(肽序列))。gm-gy1-cr1被设计用于靶向大豆球蛋白原1蛋白外显子1的开始附近的位点。gm-gy1-cr2被设计用于靶向大豆球蛋白原1的酸性亚基(seq id no:21中的氨基酸#1至#310)与碱性亚基(seq id no:21中的氨基酸#311至#495)之间的连接点。gm-gy1-cr3被设计用于靶向大豆球蛋白1基因的3
′
utr的开始。如图3和4所示,双元载体含有cr1/cr2或cr1/cr3 grna组合及其相应的供体dna模板(seq id no:22和seq id no:23)。同源重组(hr)片段用于侧接豆血红蛋白/gy1序列,以促进同源介导的重组过程。cr1或cr2或cr3grna靶位点也用于侧接供体dna,使它们能够从双链断裂修复过程的双元载体中切除。这些序列定义于表5中。
[0151]
表5.供体dna模板中hr片段和cr切点的核苷酸序列
[0152][0153]
通过农杆菌属介导的大豆胚轴转化将双元载体引入大豆植物中。通过同源介导的双链断裂dna修复过程对供体dna进行位点特异性整合,通过(i)替换在天然大豆球蛋白1基因座处编码酸性亚基的基因组序列或者(ii)替换在天然大豆球蛋白1基因座处编码整体大豆球蛋白1蛋白的基因组序列创建了含有大豆豆血红蛋白的大豆球蛋白1的基因组编辑变体。总计为cr1/cr3设计生成了1452株t0植物(图3),以在天然大豆球蛋白1基因座处用豆血红蛋白编码序列替换整体大豆球蛋白1基因。我们使用两次pcr分析来鉴定完美的基因整合事件,一次在大豆球蛋白1基因座的5
′
区域,另一个在3
′
区域。对于1452株t0植物,在t0植物中鉴定了10个潜在的2xhdr完美的整合事件。根据pcr产物的强度,我们将它们分为三类:强(4个事件)、中(3个事件)和弱(3个事件)。在这10个事件中,我们对pcr产物进行了测序分析,这10个事件中有两个(1个强事件和1个弱事件)具有来自双链断裂修复过程的snp变异,因此我们没有对这两个事件进行进一步处理。从所有剩余的8个阳性事件中收获刊种子。我们对来自基于我们的t0植物分析的前六个事件(3个强事件:198a、315a、956a以及3个中事
件:407a、419a和628a)的刊种子进行豆血红蛋白定量,在t1种子中315a事件给出最高的球蛋白积累(种子总蛋白的1.16%;以干重计)。
[0154]
表5a:从表达靶向gy1基因座的豆血红蛋白构建体的分离t0植物收获的单一野生型(黄色)和赤大豆的定量质谱分析
[0155][0156][0157]
我们种植了来自相同的六个事件中的t1种子,并对那些t1植物进行了相同的pcr分子分析。在这些分析中,2xhdr完美的整合t1植物只能在所分析的六个事件中的三个
(198a、315a、628a)中得到一致确认。对于956a事件,只能从筛选的37株t1植物中检测到一株2xhdr植物。对于其他两个事件(407a和419a),我们无法检测到任何2xhdr pcr产物,表明来自其t0植物分析的2xhdr信号未传输到t1植物,这可能是由于转化过程中的嵌合性质。这两个事件被重新分类为t1植物的随机整合转基因事件。将收获2xhdr完美的整合事件以及那些随机整合转基因事件的t2种子。将在所有纯合t2种子中分析豆血红蛋白水平,以比较豆血红蛋白在大豆球蛋白1天然基因座与随机转基因座的表达水平。预计与t1种子中的豆血红蛋白水平相比,完美的整合事件中的豆血红蛋白水平将翻倍,达到每干重总种子蛋白的约2.3%或更多。
[0158]
实例5:将豆血红蛋白基因基因组工程化到其他天然大豆种子贮藏蛋白基因座中
[0159]
表6和7中显示了其他种子贮藏蛋白,例如其他大豆球蛋白蛋白质或伴大豆球蛋白蛋白质。如本实例所述,编码这些贮藏蛋白的基因用作在大豆种子中大豆豆血红蛋白过表达的基因编辑靶标。
[0160]
表6大豆中大豆球蛋白1(粗体)和其他推定的大豆球蛋白家族成员的表达谱。
[0161][0162][0163]
表7:开花后30天或50天大豆种子中7种β-伴大豆球蛋白同种型的表达水平。
[0164]
β-伴大豆球蛋白通过rnaseq测量的表达水平glyma.20g 148200(β)19251(30daf)glyma.20g148300(α)67117(30daf)glyma.20g148400(α)91647(30daf)glyma.20g146200(β)7068(30daf)glyma.10g246300(α
′
)86918(30daf)glyma.10g246500(α
′
)20492(50daf)glyma.10g246400(α)无/低表达6(30daf)
[0165]
按照实例4中的方案为这些基因设计了特定的grna。通过农杆菌属介导的大豆胚轴转化将每个基因靶标的双元载体引入大豆植物中。通过同源介导的双链断裂dna修复过程对供体dna进行位点特异性整合,针对每个种子贮藏蛋白基因(单独或与gly1或其他种子贮藏蛋白基因组合)创建用大豆豆血红蛋白替换编码序列的种子贮藏蛋白基因的基因组编辑变体。植物在温室中生长。我们预计收获的t1种子含有占总种子蛋白的至少1%或更高的豆血红蛋白量。
[0166]
实例6:通过蛋白质再平衡提高大豆种子中大豆豆血红蛋白表达水平
[0167]
大豆球蛋白和伴大豆球蛋白是大豆种子中的两大类种子贮藏蛋白。在大豆种子中,β-伴大豆球蛋白(高丰度的7s球蛋白贮藏蛋白)和大豆球蛋白分别占总蛋白含量的约
21%和33%(utsumi等人,1997)。在通过rnai沉默β-伴大豆球蛋白的α和α
′
亚基后,总大豆蛋白含量没有变化(kinney等人,2001)。得到的工程化种子积累了更多的大豆球蛋白,占总种子蛋白的50%以上,这弥补了工程化种子中缺失的β-伴大豆球蛋白。β-伴大豆球蛋白由3种同种型组成,α、α
′
和β。如果需要,可以通过crispr/cas编辑用基因簇丢失或移码敲除突变消除β-伴大豆球蛋白基因家族(α
′
、α和β亚基的6至7个基因),然后将更多蛋白合成资源用于大豆种子中豆血红蛋白的产生。
[0168]
例如,grna被设计用于通过cas9/grna编辑敲除6种推定的β-伴大豆球蛋白同种型,以将蛋白质组重新平衡至大豆球蛋白。鉴定了包括3个α、2个α
′
和2个β同种型的七个β-伴大豆球蛋白候选者。除glyma.10g246400(α)和glyma.20g146200(β)外,所有其他同种型在开花后30天或50天(daf)在大豆种子中显示出相对高的表达水平(表7)。
[0169]
使用四种grna以删除7种β-伴大豆球蛋白同种型中的6种。gm-cong-grna1(seq id no:24)和gm-cong-grna2(seq id no:25)用于丢失20号染色体(gm20)上的伴大豆球蛋白簇;gm-cong-grna3(seq id no:26)和gm-cong-grna4(seq id no:27)用于丢失10号染色体(gm10)上的伴大豆球蛋白簇,如图5所示。
[0170]
产生了来自伴大豆球蛋白gm10基因座丢失实验的t2纯合种子。种子蛋白分析通过sds-page考马斯蓝凝胶染色分析进行(图6)。在来自gm10基因座丢失变体的那些t2纯合种子中,没有检测到伴大豆球蛋白蛋白质的α
′
亚基,表明完全去除了大豆种子中的伴大豆球蛋白α
′
亚基蛋白,这与它们的基因从大豆基因组中完全去除一致。与野生型种子相比,这些t2种子的总蛋白含量没有变化,表明其他大豆蛋白在补偿这些编辑变体中伴大豆球蛋白α
′
亚基蛋白的损失。对于第二编辑实验,通过蛋白凝胶分析分析了来自gm20基因座丢失的t2种子(图7)。结果表明,纯合丢失植物的大豆种子中的伴大豆球蛋白α亚基蛋白已被完全去除。数据还表明,由于glyma.20g148200基因的消除,伴大豆球蛋白β亚基蛋白在该丢失变体中也减少了。然而,一些β亚基仍然可以检测到,因为丢失设计不包括中等表达的glyma.20g146200基因。这些α
′
和α/β丢失基因座将被遗传杂交在一起,以产生完全伴大豆球蛋白敲除大豆种子。
[0171]
在另一个编辑实验中,设计三种grna(seq id no:28、29、30)以多重移码敲除方法对5个高表达的伴大豆球蛋白基因(glyma.20g148200、glyma.20g148300、glyma.20g148400、glyma.10g246300和glyma.10g246500)和一个中等水平表达的glyma.20g146200进行移码敲除。将分析纯合t2种子的蛋白谱变化和氨基酸组分改善。
[0172]
将豆血红蛋白过表达方法和伴大豆球蛋白敲除方法通过遗传杂交,或通过在豆血红蛋白过表达大豆品系中进行基因编辑,或通过将豆血红蛋白过表达盒重新转化到伴大豆球蛋白敲除大豆品系中结合。由于这些大豆种子中不存在伴大豆球蛋白,预计大豆球蛋白或其他大豆蛋白质的含量会增加,以通过蛋白质再平衡补偿伴大豆球蛋白的损失。预计通过将大豆豆血红蛋白过表达与伴大豆球蛋白丢失方法相结合,大豆种子中的豆血红蛋白水平增加。
[0173]
实例7:大豆种子中大豆豆血红蛋白表达的表征
[0174]
对于实例1和2中描述的8个转基因构建体,产生了t1种子。结果令人非常惊讶。使用gy1-sp/gy1碱性亚基靶向设计的两种构建体(图1和2中的实验4和8)中几乎没有积累豆血红蛋白。使用凝集素sp靶向设计的两种构建体(图1和2中的实验3和7)中的豆血红蛋白积
累水平非常低(占总种子蛋白的约0.1%),并且大豆呈黄色。最佳表达设计来自豆血红蛋白无信号肽的两种构建体(实验1和5,如图1和2所示)。如图8和10所示,在这两个实验中,“红”(即横切面略带粉红色)色的种子很容易通过肉眼鉴别,表明豆血红蛋白表达水平高,并且蛋白质有效组装为含有以铁为中心的卟啉(血红素)的豆血红蛋白复合物。实验1设计(无信号肽)中生成五个事件且实验5设计(无信号肽加上两个血红素途径基因)中生成4个事件,并且所有9个事件都具有“红色”种子表型。通过进行种子蛋白提取、sds page凝胶和考马斯蓝染色进一步验证种子中豆血红蛋白的存在。通过考马斯蓝染色很容易看到16kd豆血红蛋白(图9和11中的箭头)。在图9中,泳道1、2、3、5、6、7、9、10、11是来自实验1设计的三个独立事件的“红色”粉红色豆血红蛋白阳性种子的蛋白样品,并且泳道4、8和12是来自相同三个事件的黄色无效分离种子的蛋白样品。类似地,在图11中,#14泳道来自黄色无效分离种子,并且#11、#21、#33、#43是来自实验5设计的三个独立事件的“红色”(粉红色)豆血红蛋白阳性种子的蛋白样品。
[0175]
单个种子分析的样品制备。
[0176]
从单独分离的t0植物中收获的单个t1红色和黄色大豆被放置在带盖的spex certiprep1/2x2
″
聚碳酸酯小瓶中(目录号3116pc)。添加了3/8”不锈钢滚珠轴承。在spex certiprep 2000 geno/研磨机中以1500冲程/分钟的速度进行研磨,持续三个30秒间隔,每个循环之间休息1分钟。
[0177]
可替代地,在预冷的研钵中,在存在液氮的情况下,用研杵研磨大豆。然后将粉末冷冻干燥48小时,并在-20℃的干燥器中保存直至加工。
[0178]
水分含量确定是根据美国油脂化学家学会(aocs官方方法ba2a-38,针对小样品修改)进行的,如下所示:
[0179]
将粉末状样品材料(大约100mg;精确到0.1mg)称重到预先称重(并记录)的13x100mm玻璃管vwr(53283-800)中,然后再次称重。
[0180]
将样品放入预热至130℃的强制通风烘箱中。
[0181]
允许材料干燥2小时。
[0182]
将试管移至干燥橱中,并在再次称重前允许其达到室温。
[0183]
盖上管子并保存残余干燥材料,用于随后的蛋白质燃烧分析(见下文)。
[0184]
贮藏在干燥器中以供进一步分析。
[0185]
总蛋白分析。
[0186]
通过对上述烘箱干燥或冷冻干燥的粉末的燃烧分析估计蛋白含量。根据制造商的说明,使用天冬氨酸作为标准,在于n蛋白模式下运行的flash 1112ea燃烧分析仪(可从thermo商购)上进行分析。使用mettler-toledo mx5微量天平称量30-40 mg的粉末状样品,精确度为0.001毫克,用于分析。通过将由分析仪确定的%n乘以6.25来计算蛋白含量。假设最终蛋白含量对于烘箱干燥的材料是以干燥计,对于冷冻干燥的材料是以测量计。
[0187]
水分含量的计算。使用以下公式在烘箱干燥后确定组织的原样水分含量:
[0188][0189]
通过lc-ms-ms定量球蛋白蛋白质。
[0190]
在计算机上评估了球蛋白蛋白质的氨基酸序列(表1;seq id 2)潜在的胰蛋白酶
um(2.1 x 100 mm)反相色谱柱上分离,保持在40℃。溶剂流速为300 ul/min,起始条件为90%溶剂a(99.9%ms级水;0.1%甲酸)-10%溶剂b(99.9%乙腈,0.1%甲酸)。在7分钟时间段内将条件变更至60%溶剂a-40%溶剂b,随后在0.5分钟内进一步变更至10%溶剂a-90%溶剂b。然后在3分钟时间段内将溶剂恢复到起始条件,并在下一次注射前将柱在起始条件下再平衡3分钟。使用电喷雾电离(esi)来源将样品引入ms中。来源参数如下:去簇电压135(v),温度350℃,以及离子喷雾电压350v。使用mrm(多反应监测)检测技术来鉴定和定量产物离子(m/z:816.6),使用35(ev)的碰撞池能量来裂解母+2分子(m/z 608.9)。使用另一种产物离子(m/z:444.3)来确认身份(基于存在或不存在)。根据通过上述所有样品制备步骤获得的肽的标准曲线进行定量。
[0204]
表8显示了来自表达无靶向序列的豆血红蛋白构建体的分离的t0植物收获的黄色(wt)和红色大豆的定量质谱分析(材料来自实验1)。在分析的提取物中测量可溶性蛋白,并表示为占豆粉总蛋白含量的百分比,如通过燃烧分析确定的。豆血红蛋白通过uhplc-ms-ms进行定量,并以可溶性蛋白或总蛋白的重量百分比计表示。
[0205]
表8:来自表达无靶向序列的豆血红蛋白构建体的分离的t0植物收获的野生型(黄色)和红色大豆的定量质谱分析
[0206]
[0207]
提取样品的可溶性蛋白的表示为占起始材料总蛋白含量的百分比表明提取效率范围为27.7%-81.3%,平均61.3%(表8)。当以每单位可溶性蛋白或每单位总蛋白计表示时,这导致球蛋白蛋白质含量百分比的显著差异。黄色野生型豆(gmz3a9.1.30 wt和gmz3a9.1.20;wt)中没有可检测到的球蛋白蛋白质(表8)。红豆具有在0.34 wt%至1.93 wt%之间的球蛋白蛋白质(以可溶性蛋白计表示时),并且高达0.8 wt%(以总蛋白计表示时)。
[0208]
为了提高提取效率并使样品制剂更加均匀,对样品制备进行了如下改进;将10+/-0.5mg的粉末样品(称重并记录,精确度0.1mg)放入1.2ml微量滴定管(fisher brand 02-681-376)中。提取缓冲液,8 mm(3-[(3-胆固醇氨丙基)二甲基氨基]-1-丙磺酸内盐水合物(chaps);以50的组织重量体积比添加0.1%triton x-100,ph 8.4。向每个小瓶中添加一个小钢球,盖上盖子后,将样品在geno/研磨机中提取;1150次振荡/分钟,持续30秒,然后在端对端旋转器上振荡10分钟,然后重复基因研磨步骤。均质管内容物,去除钢球,定量转移至干净的1.5ml微量离心管中,并将样品在微量离心机中澄清;10,670xg,持续10分钟。将上清液转移至干净的1.5 ml微量离心管中,并且将样品再次离心;10,670xg,持续5分钟。使用bradford测定确定上清液的总可溶性蛋白浓度,并且将结果用于通过用胰蛋白酶消化缓冲液(100mm碳酸氢铵;0.05%tween-20;ph 8.3)稀释将样品标准化至1 mg可溶蛋白/ml。通过将25 ul蛋白质标准化提取物添加到125 ul胰蛋白酶消化缓冲液、6 ul 0.25m dtt(二硫苏糖醇;在消化缓冲液中)并在95℃下孵育20分钟,制备用于胰蛋白酶消化的样品。向每个样品中添加6ul 300 mm原液碘乙酰胺,并将它们在室温下避光孵育一小时。将胰蛋白酶(pierce,ms级;thermo fisher scientific)10 ul 0.1 ug/ul原液添加到每个样品中,并在37℃的静态培养箱中培养过夜。通过添加10 ul 10%甲酸终止胰蛋白酶消化。然后使用uhplc-ms-ms分析对样品进行分析。
[0209]
改进的提取方法导致在第一次提取中提取出平均97%(范围95.5%-100%)的可溶性蛋白。这代表提取材料的总蛋白含量平均为71%(范围62%-78%)。使用该方法,将来自仅表达豆血红蛋白的事件(实验1)的黄豆和红豆与来自表达表达豆血红蛋白(无信号肽)与两种血红素途径基因结合的事件(实验5)的黄豆和红豆进行比较。结果如表9所示。从仅表达豆血红蛋白构建体(无靶向序列)实验1或与两种血红素途径基因结合的豆血红蛋白构建体(无靶向序列)(实验5)的分离t0植物收获的黄色(wt)和红色大豆的定量质谱分析。在分析的提取物中测量可溶性蛋白,并表示为占豆粉总蛋白含量的百分比,如通过燃烧分析确定的。豆血红蛋白通过uhplc-ms-ms进行定量,并以可溶性蛋白或总蛋白的重量百分比计表示。
[0210]
表9:从表达无靶向序列的豆血红蛋白构建体(实验1)或与两种血红素途径基因结合的豆血红蛋白构建体(无靶向序列)(实验5)的分离t0植物收获的野生型(黄色)和红色大豆的定量质谱分析
[0211][0212]
数据显示,两个实验中豆血红蛋白的量达到相似水平,表明血红素途径的上调在这些事件中没有正面或负面影响豆血红蛋白的水平,当以总蛋白计表示时,对于豆血红蛋白加血红素途径基因(实验5),最大水平达到0.82%,而对于仅有豆血红蛋白的材料(实验1),最大水平达到0.80%。
[0213]
从视觉上看,来自每个实验的豆的红色没有明显的强度差异,解读为显示来自两个实验的豆中豆血红蛋白复合物的量没有差异。对实验1和5的种子在下一代进行了分析。
[0214]
表9a:从表达无靶向序列的豆血红蛋白构建体(实验1)或与两种血红素途径基因结合的豆血红蛋白构建体(无靶向序列)(实验5)的分离t1植物收获的野生型(黄色)和红色(粉红色)大豆的定量质谱分析
[0215][0216]
表9a中的数据显示纯合种子比来自相同事件的t1种子具有更高量的豆血红蛋白。例如,在来自事件gmz3a9.001.24a的t2种子中,总蛋白的1.38%被确定为豆血红蛋白(以干重计),对比t1种子的0.65wt%增加两倍。类似地,在来自事件gm9rdv.001.5a的t2种子中,总蛋白的1.84wt%被确定为豆血红蛋白(以干重计),对比t1种子值为0.71wt%(三个种子平均值),增加2.6倍。数据表明,当种子是纯合子时,豆血红蛋白水平翻倍。
[0217]
实例8:大豆豆血红蛋白系与高油酸品系的堆叠
[0218]
上述转基因豆血红蛋白事件与高油酸品系遗传杂交,例如含有占总脂肪酸的至少50%、70%或75%的油酸的大豆品系。类似地,上述豆血红蛋白基因编辑变体与高油酸品系遗传杂交,例如含有占总脂肪酸的至少50%、70%或75%的油酸。可替代地,直接在高油酸品系中进行豆血红蛋白基因编辑。此外,豆血红蛋白基因编辑和fad2/fad3编辑两者一起进行,通过基因编辑方法仅堆叠豆血红蛋白性状和高油酸性状。所得大豆种子具有增加的营养价值并为大豆蛋白、大豆分离物或大豆浓缩物提供改进的风味。
[0219]
实例9:从大豆中提取豆血红蛋白复合物。
[0220]
为了将豆血红蛋白复合蛋白用于下游产品,需要加工大豆。通常,这涉及:回火、裂化、脱壳、油的溶剂提取和烘烤以去除残余溶剂并灭活蛋白抗营养因子(例如蛋白酶抑制剂)。由这些加工步骤产生的粕或粉(通常大于47.5%的蛋白质)可进一步精制,以通过去除
可溶性糖来浓缩蛋白级分,以形成大豆蛋白浓缩物(通常大于65%的蛋白质)。有三种用于生产大豆蛋白浓缩物的工艺,即醇洗、酸洗或热水提取(deak,n.a.、johnston,l.a.、lusas,e.w.和rhee,k.c.,2008.soybeans:chemistry,production,processing,and utilization.[大豆:化学、产生、加工和应用]johnston,l.a.、white,p.j.和galloway,r.编辑aocs出版社)。预计所有这些工艺都会使豆血红蛋白复合物基本上去血红素化,使它们不适合回收和后续使用。
[0221]
可替代地,大豆可以加工成大豆分离蛋白的形式(通常大于90%的蛋白质)。这是通过在离心去除大部分不溶性碳水化合物(纤维)级分之前,溶解轻微烘烤的白色薄片(脱脂粕)的蛋白级分来实现的。然后通过ph调节沉淀蛋白质,并洗涤以去除剩余的可溶性碳水化合物。在干燥成粉末之前,对纯化的蛋白级分进行巴氏灭菌以灭活残余蛋白酶抑制剂活性和微生物污染物。预计大豆分离物生产过程中的这些最后步骤也会使豆血红蛋白复合物基本上去血红素化,使它们不适合回收和后续使用。
[0222]
为了研究来自大豆的豆血红蛋白的溶解度/可提取性,进行了以下实验。将来自表达红色豆血红蛋白的大豆的大豆粉末样品(10+/-0.5mg;称重并记录,精确度0.1mg)放入1.2ml微量滴定管(fisher brand02-681-376)中。提取缓冲液,8 mm(3-[(3-胆固醇氨丙基)二甲基氨基]-1-丙磺酸内盐水合物(chaps);以50的组织重量体积比添加0.1%triton x-100,ph 8.4。向每个小瓶中添加一个小钢球,盖上盖子后,将样品在geno/研磨机中提取;1150次振荡/分钟,持续30秒,然后在端对端旋转器上振荡10分钟,然后重复基因研磨步骤。均质管内容物,去除钢球,定量转移至干净的1.5ml微量离心管中,并将样品在微量离心机中澄清;10,670xg,持续10分钟。将上清液转移至干净的1.5 ml微量离心管中。如前所述,将来自该步骤的残余颗粒再萃取两次。如实例7中所述,分析来自第一、第二和第三上清液的等分试样的可溶性蛋白和豆血红蛋白。结果如表10所示。
[0223]
表10:对全大豆粉末的碱性缓冲液提取(来自6个样品的平均值)对可溶性蛋白和豆血红蛋白的回收率的影响。实例5中提供了定量方法。
[0224]
提取#%可溶性蛋白回收率%豆血红蛋白回收率197.210022.80300
[0225]
数据显示在第一次提取中回收了所有豆血红蛋白。
[0226]
实例10:豆血红蛋白大豆的酶法大豆加工(e-soy)
[0227]
从豆粕中分离蛋白质的一个挑战是需要高水:固体比以产生可以物理加工的浆料。这会导致过程中产生大量水,从而增加与浓缩提取的蛋白质、干燥未溶解的豆粕残余物以及最终废水处理相关的加工成本。开发了一种从脱脂豆粕中分离蛋白质的新方法,该方法使用食品级多糖降解酶将豆粕中的不溶性或粘性多糖材料转化为可溶的短链多糖,从而大大减少了蛋白质提取和分离所需的水量。预计用于分离更传统的大豆蛋白浓缩物和分离物的该工艺将促进豆血红蛋白的分离,同时保持完整的豆血红蛋白复合物。一般酶法大豆(e-soy)工艺概述如下。
[0228]
工艺流程图
[0229]
图12显示了e-soy工艺的一般工艺流程图的实例。将烧杯中的实验室脱脂全豆粕
(实验室过程通常为40g等分试样)与预热水以3:1液体:固体的比例混合。孵育期后,将烧杯置于调节的水浴中,通常保持在50℃。使用配备有低剪切叶轮的顶置式搅拌器(lightnin mixer)来搅拌豆粕团。混合物的粘度通过以200rpm搅拌豆粕团所需的搅拌器功率(瓦特)估算。在搅拌时,将5n hcl的等分试样逐滴添加到面团中(通常为4-5ml),以将浆料的ph值降低至ph值3.8-4.5的范围。降低不同原料ph值所需的酸的确切量是使用悬浮在较大体积的水中的原料分别确定的。商业酶的等分试样(通常为200μl的纤维素酶、半纤维素酶和果胶酶,10μl的液体果胶酶)。然后搅拌豆粕团并允许其与酶反应不同的时间长度,尽管通常使用3小时。每隔一段时间记录顶置式搅拌机的功率读数以监测面团浆料的粘度。
[0230]
当溶液的粘度已经降低到足以形成自由流动的浆料时,将混合物定量转移到装有500um目聚丙烯筛网的布氏漏斗中并真空过滤。用60ml水洗涤滤饼。使滤液通过装有105um目聚丙烯筛网的第二个布氏漏斗,并用洗瓶中的去离子水冲洗。将来自500um和105um过滤的滤饼定量转移到配衡容器中,并在65℃的真空烘箱中干燥至少48小时。确定合并滤饼的干重,并在进一步分析之前在咖啡磨中研磨残余物(豆粕残余物)。
[0231]
用2nnaoh将来自105um过滤的滤液浆料调节至ph 6.5-7,尽管对于豆血红蛋白分离使用7至11之间的ph。搅拌后,将溶液转移至离心瓶中,并在固定角度转子中以7000rpm离心10分钟。将上清液小心倒入一次性0.45um-1l过滤装置中进行真空过滤。将离心固体(浓缩的沉淀的蛋白浓缩物,或cppc)悬浮在去离子水中,定量转移到配衡烧瓶中,壳冷冻并冻干。冻干后确定cppc的回收干重。
[0232]
将可溶性蛋白溶液(sps)的0.45um过滤上清液转移至配备pes膜组件(vivaflow 200,可变mwco,取决于实验)的超滤装置。将sps浓缩至约50ml的体积,然后用去离子水(100-300ml,取决于实验)渗滤。将uf/df渗透物收集在烧瓶中用于进一步处理。当uf/df步骤完成时,将截留物溶液定量转移到离心瓶中并以7000rpm离心10分钟以去除uf/df过程期间形成的任何沉淀物。将上清液慢慢倒入配衡烧瓶中,壳冷冻并冷冻干燥。对回收的固体(浓缩的可溶蛋白分离物或cspi)进行称重并贮藏以供进一步研究。如果从离心步骤中回收了任何固体(可溶性蛋白溶液沉淀物,或sps-ppt),则将其定量转移到另一个配衡烧瓶中进行冷冻、冻干和分析。
[0233]
在uf/df过程的一些变化中,检查了使用一系列递减的mwco孔隙率的顺序uf/df。该过程基本相同,不同之处在于使来自最高mwco步骤的渗透物通过按顺序排列的下一个较低mwco膜,并将截留物转移到单独的配衡烧瓶中进行冷冻和冷冻干燥。
[0234]
最终的超滤渗透物在配衡圆底烧瓶中在旋转蒸发器上浓缩至干燥。将烧瓶转移到真空烘箱中并在65℃下进一步干燥至少48小时。确定固体干重,并且将材料从烧瓶壁上刮下并转移到容器中贮藏。
[0235]
使用燃烧分析仪(ce elantech,flash ea 1112系列)将蛋白质确定为总氮。通过乘以%n x 6.25将总氮含量转化为总蛋白。
[0236]
商品豆粕中蛋白质的回收率如表11所示。
[0237]
表11:从商业豆粕中回收产品。
[0238][0239]
由于大豆蛋白的不同溶解度,以及它们在ph 6以下的低溶解度,提取的豆粕的豆粕残余物(mr)级分保留了65%的起始蛋白,蛋白纯度为66.3%。这实际上代表豆粕从最初的50.9%蛋白含量得到了富集,符合蛋白浓缩物》65%的标准。在浓缩物和分离物级分中回收的初始蛋白百分比要低得多,在这些产品中仅回收了15%的初始蛋白。浓缩级分的蛋白含量实际上低于豆粕残留物(62.2%相对于66.3%)。分离级分的纯度非常好,为102.5%,并且在uf渗透物中发现了相对较低水平的蛋白质。将豆粕残余物从滤网分离的物理困难影响了总蛋白的回收。鉴于固体级分的蛋白质含量高,利用不同的物理分离将固体与消化的豆粕浆料中的溶解蛋白分离开可能会更有效。
[0240]
一个意外的发现是,分离蛋白可以使用比基于蛋白质级分的分子量所预测的高得多的mwco超滤膜回收。由于溶液中不期望的聚集行为,可以有效地使用更高的mwco膜。预计从含豆血红蛋白的大豆中产生的分离物也能获得类似的回收率。在该过程中使用更高通量的膜将减少所需的总表面积,从而节省资金成本。
[0241]
在该过程的初始时期期间采取步骤以优先将高度可溶的豆血红蛋白复合物提取到上清液中,并在超滤步骤期间进行差异纯化。这将产生可用于下游产品配制品的高价值副产品
[0242]
该工艺已经过测试,并且通常适用于表12中列出的油籽原料。
[0243]
表12:使用e-soy工艺测试的油籽粕
[0244]
黄籽包衣低芥酸菜籽高油酸低芥酸菜籽(nexera 845)传统低芥酸菜籽芥菜籽(芜菁(brassica rapa))印度芥菜籽(芥菜(brassica juncea))黄芥末籽(白芥菜(brassica hirta))商业向日葵(脱脂粕、滤饼、肉类)
红花亚麻籽芝麻
[0245]
通过优化脱脂和脱溶剂过程以最大限度地减少豆粕基质中蛋白质和豆血红蛋白复合物的不可逆变性,可以实现额外的蛋白质产量提高。此外,e-soy加工方案可以针对通过蛋白质组再平衡(如实例6所示)产生的大豆进行优化,以进一步提高从豆粕中回收蛋白质的潜力。对e-soy工艺的进一步修饰以优化衍生自高油酸油大豆的豆粕的蛋白提取(这些高油酸油大豆经过工程化以表达豆血红蛋白(例如实例8所示))预计也会导致改善的感官和加工特性。例如,对于用作原料的合适大豆分离物和与高油酸大豆相关的大豆加工优势的示例,请参见美国专利号9,918,485,其通过引用并入本文。
[0246]
实例11:表达豆血红蛋白并结合减少的抗营养因子和/或增加的蛋白含量的大豆种子
[0247]
许多将大豆蛋白浓缩用于随后掺入食品的收获后加工步骤去除或灭活抗营养因子,例如基于蛋白质的因子(例如蛋白酶抑制剂)和基于碳水化合物的因子(例如棉子寡糖)。此类步骤可能会使豆血红蛋白复合蛋白去血红素化,使其不适合下游使用。
[0248]
基因组编辑技术用于减少或敲除kunitz型胰蛋白酶和bowman-burke蛋白酶抑制剂中的一者或多者的表达和/或抑制棉子糖和水苏糖中的一者或多者的合成。这些大豆种子也经过编辑以表达增加的豆血红蛋白或复合豆血红蛋白,如前面的实例中所述。可替代地,将表达增加的豆血红蛋白或复合豆血红蛋白的经编辑大豆与经编辑以减少或敲除kunitz胰蛋白酶抑制剂和bowman-burke蛋白酶抑制剂的表达和/或抑制棉子糖和水苏糖合成的大豆杂交,以产生经编辑基因的育种堆叠。基因组编辑用于通过敲除棉子糖合酶基因(例如rs2、rs3、rs4)来减少不溶性碳水化合物,例如棉子糖和水苏糖。确定工程化方法有效性的测定将使用美国油脂化学家学会方法ba 12-75测量残余胰蛋白酶抑制剂活性。可溶性碳水化合物谱的变化将使用例如美国专利公开号20190383733中概述的方法确定,该文献通过引用并入本文。
[0249]
基因组编辑还用于通过敲除或修饰关键调节基因来增加种子中的总蛋白含量,例如含有cct结构域的蛋白、网状蛋白、海藻糖磷酸合酶、hect泛素连接酶(hel或upl3)和/或mft(开花时间之母)突变或修饰的植物和种子,例如pct/us2019/058747中所公开的,该文献通过引用并入本文。豆血红蛋白在如本实例中所述经工程化以优化其加工性的大豆中的表达将增加此类大豆的价值和效用。
[0250]
对大豆进行工程化以最大程度地减少收获后的加工步骤,预计将提高完整豆血红蛋白复合物的产量。此类大豆种子的加工不需要使用溶剂来去除油或大豆加工中经常采用的烘烤步骤。此类大豆种子的加工使用冷压、挤压或超临界流体萃取中的一者或多者((friedrich j.p.、list g.r.和heakin a.j.,1982.joumal of the american oil chemists society.[美国油脂化学家学会志]59(7);288-292)。
[0251]
实例12.用于ppr10变体种子特异性表达的核基因组转化
[0252]
如di等人((1996)plant cell rep[植物细胞报告]15:746-750)所述,使用通过将3.5 ml的12 n hcl与100 ml商业漂白剂(5.25%次氯酸钠)混合产生的氯气,对来自大豆品系的成熟干燥种子进行表面消毒16小时。将消毒后的种子在室温下用无菌蒸馏水浸泡16小
时(100个种子在25 x 100 mm皮氏培养皿中),并在室温下避光在含有5 g/l蔗糖和6 g/l琼脂的半固体培养基上吸收。孵育过夜后,将种子在室温下避光浸泡于蒸馏水中另外3-4小时。从吸收的种子中分离出完整的胚轴(ea)。农杆菌属介导的ea转化如下所述进行。
[0253]
向在感染培养基中的含有大豆核转化双元载体的体积为15 ml的根癌农杆菌(a.tumefaciens)lba4404或agl-1悬浮液(图1)(od0.5,于600 nm)中添加约200-300个ea,该感染培养基由1/10x gamborg b5基础培养基、30 g/l蔗糖、20 mm mes、0.25 mg/l ga3、1.67 mg/l bap、200μm乙酰丁香酮和1 mm二硫苏糖醇组成(ph5.4),并且ea在25 x 100 mm深的皮氏培养皿上。将板用石蜡膜(目录号52858,“parafilm m”vwr)密封,然后超声处理(sonicator-vwr型50t)30秒。超声处理后,将ea在室温下孵育2小时。接种后,去除过量的细菌悬浮液,并将约200-300个ea转移到25 x 100 mm皮氏培养皿中的单层高压灭菌滤纸(目录号28320-020,vwr)。将板用微孔胶带(目录号1530-0,3m,st.paul,mn,usa)密封并在暗光下(1-2μe/m2/s)、冷白色荧光灯下21℃下照射16小时,孵育3天。共培养后,将每个胚轴的基部包埋在含有30 g/l蔗糖、6 g/l琼脂和25 mg/l壮观霉素(s742,phytotech labs)作为选择性剂和300 mg/l头孢噻肟(goldbio,美国密苏里州圣路易斯)的发芽诱导培养基(r7100,phytotech labs),ph5.7。在percival生物培养箱(percival scientific,美国爱荷华州佩里)或生长室中进行发芽诱导,温度为26℃,光周期为16小时,光照强度为60-100μe/m2/s。在选择培养基中培养4-6周后,切下壮观霉素抗性芽并转移到含有15 g/l蔗糖、6 g/l琼脂、10 mg/l壮观霉素和250 mg/l头孢噻肟的1/2强度ms生根培养基(m404,phytotech labs),用于进一步的芽和根伸长。根据阳性转基因大豆t0植物的数量除以ea总数计算转化效率。
[0254]
对于对大豆进行热休克处理以产生无壮观霉素标记基因的t0事件,将在100 x 25 mm皮氏培养皿或洋红色盒子中在大观霉素自由生根培养基上生根的2-4 cm t0小植株转移到percival培养箱(percival scientific,美国爱荷华州佩里)在45℃、70%湿度下避光放置2小时。未经热休克处理的t0小植株用作对照。热休克处理后,将t0小植株转移到湿润的berger bm2土壤(berger,加拿大魁北克省saint-modeste),并在26℃下在250-350μe/m2/s的percival培养箱中保持封闭在透明塑料托盘盒中,光周期为16小时。在t0事件适应后2周,从较新的生长中收集2-4个叶穿孔样本用于qpcr和sbs分析。
[0255]
图13是显示t-dna内的大豆核转化双元载体的示意图。在图13中,rb和lb分别为t-dna的右边界和左边界,gm-gy1 pro为大豆大豆球蛋白种子特异性启动子,atubq10pro为拟南芥泛素10启动子,ppr10gg为玉蜀黍或大豆rna结合蛋白ppr10变体,ubq10term为拟南芥泛素10终止子,loxp为lox重组位点,gm-hsp17.3bpro为大豆热休克hs6871启动子,mocre为cre重组酶,sb-gkafterm为高粱(sorghum bicolor)γkafirin贮藏蛋白终止子,at-ubq10 pro为拟南芥泛素10启动子,spcn为来自壮观链霉菌genebank蛋白id aad50455的大豆密码子优化壮观霉素抗性基因,并且ubq14term为拟南芥泛素14终止子。
[0256]
实例13.转质体大豆植物中的种子特异性豆血红蛋白表达:基因枪介导的大豆叶绿体转化
[0257]
含有gm-gy1 pro:ppr10gg:sb-gakf term表达盒的无标记t1纯合品系用作叶绿体转化的供体材料。从大豆无标记刊-2纯合品系收集未成熟豆英并打开以回收约2-8 mm长的未成熟种子。收集未成熟种子并在含有50 ml 10%漂白剂、0.02%tween-20溶液的50 ml螺帽管中进行表面消毒,轻微搅拌15分钟,然后用总计500 ml无菌蒸馏水冲洗10次。在显微镜
或放大镜下切开表面消毒的种子。通常,每个未成熟种子的胚轴被切断,且两个子叶片被释放。收集未成熟的子叶并将其转移到含有液体s30培养基的烧瓶中(表13)。
[0258]
表13:培养皿的组成
[0259][0260]
将未成熟子叶在s30培养基中预培养10天,并靶向直接基因枪介导的dna转化。预培养10天后,将二十(20)个未成熟子叶置于小皮氏培养皿(60 x 15mm)中心的补充有40mg/l 2,4-d的m2固体培养基表面进行轰击。用0.6μm金颗粒/质粒dna(图2)混合物轰击未成熟子叶,浓度为30皮克/碱基对/轰击,使用基因枪(pds1000/he,bio-rad)在650psi,28mm hg。在m2固体培养基中共培养2天后,将被轰击的未成熟子叶转移到含有300mg/l壮观霉素的液体s30培养基中。每两周替换一次含有300mg/l壮观霉素的新鲜s30培养基。经过8-12周的筛选,外植体的表面出现壮观霉素抗性黄绿色至绿色愈伤组织。假定转化的绿色愈伤组织在显微镜下分离,并铺板于具有用无菌滤纸覆盖m7琼脂培养基的皮氏培养皿上。将皮氏培养皿用microporetm手术胶带(3m health care,美国明尼苏达州圣保罗)密封,并在26℃下以35-60μe/m2/s的光强度孵育18小时光周期。在m7培养基上成熟3-4周后,将成熟的体细胞胚
胎置于无菌皮氏培养皿中,并用microporetm手术胶带密封或在室温下开封放置在塑料盒中4-7天以进行体细胞胚胎干燥。4-7天后,将干燥的胚胎接种到补充有10μg/l壮观霉素的m8培养基上,并允许在26℃下以35-60μe/m2/s光强度发芽,光周期为18小时。在m8发芽培养基上4-6周后,将小植株转移到含有湿润berger bm2土壤(berger peat moss,加拿大saint-modeste)的3英寸盆中,并保持封闭在透明塑料托盘盒中,直到适应在具有16小时光周期90-150μe/m2/沙子26℃白天/24℃夜间温度下的培养室。适应后,将硬化的小植物盆栽在含有湿润的berger mb1(berger peat moss,加拿大saint-modeste)的2加仑盆中,并在温室中生长至结籽成熟。
[0261]
图14是大豆叶绿体转化载体的示意图。gm-trnv为大豆质体trnv同源区,nt-psba pro为烟草psba质体启动子,aada为壮观霉素腺苷转移酶基因,nt-psba 3utr为烟草psba 3utr,dicisgg为双顺反子操纵子基因间区的gg结合位点(seq id no:44),豆血红蛋白是大豆豆血红蛋白编码序列(glyma.20g191200),gm-rps为大豆质体rps同源区。
[0262]
预计大豆种子在种子的质体中表达豆血红蛋白,而在植物的非种子部分例如根、茎、叶和花中极少表达或不表达豆血红蛋白。
[0263]
实例14.转质体大豆植物中的种子特异性豆血红蛋白表达:核转化后的质体转化
[0264]
根据实例13的方法,不同的是起始供体材料是无效或未转化的大豆。然后根据实例12中描述的方法转化含有转化质体的所得大豆种子和植物。预计大豆种子在种子的质体中表达豆血红蛋白,而在植物的非种子部分例如根、茎、叶和花中极少表达或不表达豆血红蛋白。
[0265]
本说明书中的所有出版物和专利申请都指示了本发明所属领域的普通技术人员的水平。将所有出版物和专利申请通过引用并入本文,其程度就像明确且单独指出通过引用每个单独出版物或专利申请一样。
[0266]
除非另外定义,否则本文所用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同意义。除非另外提及,否则本文采用或考虑的技术是本领域普通技术人员熟知的标准方法。材料、方法和实例仅为说明性的并且不是限制性的。
[0267]
借助前面的描述和随附的附图中给出的教导,本发明所属领域的技术人员将会想到本文阐述的发明的许多修改形式和其他实施例。因此,应当理解,本发明不限于所公开的特定实施例,并且修改形式和其他实施例旨在包括在所附权利要求书的范围内。尽管本文中采用了特定术语,但这些术语仅在一般性和描述性意义上使用而并非用于限制目的。
[0268]
单位、前缀和符号可以按它们si接受的形式来表示。除非另外指明,否则核酸从左向右以5
′
至3
′
方向书写;氨基酸序列都从左向右以氨基到羧基方向书写。数值范围包括限定所述范围的数值在内。本文氨基酸可以通过它们普遍已知的三字母符号或通过iupac-iub生物化学术语委员会推荐的单字母符号来表示。同样,核酸可以通过它们普遍接受的单个字母代码来表示。
技术特征:
1.一种大豆种子,其包含占所述大豆种子中总蛋白的至少0.5%的量的豆血红蛋白,其中所述大豆种子不含有整合到其基因组中的包含豆血红蛋白编码序列的重组构建体。2.如权利要求1所述的大豆种子,其中已对大豆种子基因组进行修饰以将插入、缺失或取代引入到天然豆血红蛋白基因中。3.如权利要求1或2所述的大豆种子,其中已对所述大豆种子基因组进行修饰以引入(i)插入,其中所述插入包括调节增强子或启动子序列;或者(ii)取代,其中所述取代产生或增强调节增强子或启动子序列。4.如权利要求1或2所述的大豆种子,其中已对所述大豆种子基因组进行修饰以引入插入,并且所述插入包括与所述豆血红蛋白基因的豆血红蛋白编码序列可操作地连接的靶向序列,所述靶向序列将所述豆血红蛋白靶向细胞内区室。5.如权利要求4所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。6.如权利要求5所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。7.如权利要求1所述的大豆种子,其中已对所述大豆种子基因组进行修饰以用豆血红蛋白编码序列替换种子贮藏蛋白的编码序列的全部或部分。8.如权利要求7所述的大豆种子,其中已对所述大豆种子基因组进行修饰以引入插入,并且所述插入包括可操作地连接到所述豆血红蛋白编码序列的靶向序列,所述靶向序列将所述豆血红蛋白靶向细胞内区室。9.如权利要求8所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。10.如权利要求9所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。11.一种包含基因组修饰的大豆种子,所述基因组修饰包含将豆血红蛋白编码序列插入天然种子贮藏蛋白基因中,使得所述豆血红蛋白编码序列替换所述天然贮藏蛋白基因编码序列的全部或部分,并且其中所述豆血红蛋白在所述大豆种子中以足以在所述种子的横切面中赋予所述大豆种子粉红色的量表达。12.如权利要求11所述的大豆种子,其中所述豆血红蛋白以总种子蛋白的至少0.1%的量表达。13.如权利要求11或12所述的大豆种子,其中所述天然种子贮藏蛋白基因编码大豆球蛋白或伴大豆球蛋白。14.如权利要求11至13中任一项所述的大豆种子,其中所述豆血红蛋白编码序列编码与seq id no:2具有至少95%同一性的多肽。15.如权利要求14所述的大豆种子,其中所述豆血红蛋白编码序列与seq id no:1具有至少95%同一性。16.如权利要求11至15中任一项所述的大豆种子,其中所述插入进一步包含可操作地连接到所述豆血红蛋白编码序列的靶向序列,所述靶向序列将所述豆血红蛋白靶向细胞内区室。17.如权利要求16所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。18.如权利要求17所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。
19.如权利要求11至18中任一项所述的大豆种子,其中所述大豆种子进一步包含整合到其基因组中的重组构建体,所述重组构建体包含豆血红蛋白编码序列。20.如权利要求19所述的大豆种子,其中所述重组构建体包含与所述重组构建体的豆血红蛋白编码序列可操作地连接的转运序列,所述转运序列将从所述重组构建体产生的豆血红蛋白靶向细胞内区室。21.如权利要求20所述的大豆种子,其中所述转运序列将从所述重组构建体产生的豆血红蛋白靶向质体。22.如权利要求11至1 8中任一项所述的大豆种子,其中已对所述大豆种子进行修饰以使编码(i)谷氨酰trna还原酶、(ii)铁螯合酶、(iii)谷氨酰trna还原酶结合蛋白和(iv)氨基乙酰丙酸合酶的基因中具有一个或多个核苷酸插入、缺失或取代。23.如权利要求22所述的大豆,其中所述插入、缺失或取代是在所述基因的调节域中进行的。24.如权利要求22所述的转基因大豆,其中所述插入、缺失或取代是在所述基因的编码序列中进行的。25.一种包含修饰的豆血红蛋白基因的大豆种子,其中所述修饰的豆血红蛋白基因包含对天然豆血红蛋白基因的至少一个缺失、插入或取代,并且其中所述豆血红蛋白在所述大豆种子中以足以在所述种子的横切面中赋予所述大豆种子粉红色的量表达。26.如权利要求25所述的大豆种子,其中所述豆血红蛋白以总种子蛋白的至少0.5%的量表达。27.如权利要求25或26所述的大豆种子,其中所述修饰的豆血红蛋白基因包含启动子或调节增强序列的插入。28.如权利要求25至27中任一项所述的大豆种子,其中所述修饰的豆血红蛋白基因包含与所述豆血红蛋白基因的豆血红蛋白编码序列可操作地连接的靶向序列的插入,所述靶向序列将所述豆血红蛋白靶向细胞内区室。29.如权利要求28所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。30.如权利要求29所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。31.如权利要求25至30中任一项所述的大豆种子,其中所述大豆种子进一步包含整合到其基因组中的重组构建体,所述重组构建体包含豆血红蛋白编码序列。32.如权利要求31所述的大豆种子,其中所述重组构建体包含与所述重组构建体的豆血红蛋白编码序列可操作地连接的转运序列,所述转运序列将从所述重组构建体产生的豆血红蛋白靶向细胞内区室。33.如权利要求32所述的大豆种子,其中所述转运序列将从所述重组构建体产生的豆血红蛋白靶向质体。34.如权利要求25至33中任一项所述的大豆种子,其中所述大豆种子进一步包含将豆血红蛋白编码序列插入天然种子贮藏蛋白基因中,使得所述豆血红蛋白编码序列替换所述天然贮藏蛋白基因编码序列的全部或部分。35.一种大豆种子,其包含占所述大豆种子中总蛋白的至少0.5%的量的豆血红蛋白,其中所述大豆进一步包括以下特征中的一个或多个:(i)油酸含量占总种子脂肪酸的至少
50%;(ii)亚麻酸含量占总种子脂肪酸的少于3%;(iii)在13%水分下或调整至13%水分时测量的蛋白含量占所述大豆总重量的至少37%;(iv)kunitz型胰蛋白酶抑制剂活性低于未修饰的对照大豆中的活性的5%;(v)bowman-burke蛋白酶抑制剂活性低于未修饰的对照大豆中的活性的5%;(vi)在13%水分下水苏糖含量少于1重量%;以及(vii)在13%水分下棉子糖含量少于0.5重量%。36.如权利要求35所述的大豆种子,其中所述大豆种子包含大豆基因组中的对天然豆血红蛋白基因的至少一个缺失、插入或取代。37.如权利要求35或36所述的大豆种子,其中所述豆血红蛋白编码序列与seq id no:1具有至少95%同一性。38.如权利要求35所述的大豆种子,其中所述大豆种子包含重组构建体,所述重组构建体包含可操作地连接到豆血红蛋白编码序列的调节序列。39.如权利要求35所述的大豆种子,其中所述大豆种子包含基因组修饰,所述基因组修饰包括将豆血红蛋白编码序列插入天然种子贮藏蛋白基因中,使得所述豆血红蛋白编码序列替换所述天然贮藏蛋白基因编码序列的全部或部分。40.一种包含修饰的豆血红蛋白基因的大豆种子,其中所述修饰的豆血红蛋白基因包含对天然豆血红蛋白基因调节序列的至少一个缺失、插入或取代,并且其中所述大豆种子以0.5%总种子蛋白的量表达豆血红蛋白。41.如权利要求40所述的大豆种子,其中在天然豆血红蛋白基因调节序列中进行插入,并且其中所述插入包括启动子或调节增强序列。42.一种转基因大豆种子,其包含重组构建体,所述重组构建体包含编码与seq id no:2具有至少95%同一性的豆血红蛋白的多核苷酸,其中所述构建体不包含蛋白贮藏囊泡靶向序列,并且其中所述大豆不含有(i)包含编码谷氨酰trna还原酶的序列或所述序列的截短部分的重组构建体、(ii)包含编码铁螯合酶的序列的重组构建体、(iii)包含谷氨酰trna还原酶结合蛋白的重组构建体以及(iv)包含氨基乙酰丙酸合酶的重组构建体,并且其中所述大豆种子在所述种子中以至少0.5%总种子蛋白的量包含豆血红蛋白。43.如权利要求42所述的转基因大豆种子,其中已对所述大豆种子进行修饰以使编码(i)谷氨酰trna还原酶、(ii)铁螯合酶、(iii)谷氨酰trna还原酶结合蛋白和(iv)氨基乙酰丙酸合酶的基因中具有一个或多个核苷酸插入、缺失或取代。44.如权利要求43所述的转基因大豆,其中所述插入、缺失或取代是在所述基因的调节域中进行的。45.如权利要求43所述的转基因大豆,其中所述插入、缺失或取代是在所述基因的编码序列中进行的。46.一种大豆种子,其包含掺入所述大豆质体的基因组中的编码豆血红蛋白的多核苷酸。47.如权利要求46所述的大豆种子,其中所述大豆种子进一步包含基因组修饰,所述基因组修饰包含可操作地连接到种子贮藏启动子的ppr蛋白编码序列。48.如权利要求47所述的大豆种子,其中所述可操作地连接到种子贮藏启动子的ppr蛋白编码序列出现在重组构建体中。49.如权利要求47所述的大豆种子,其中所述ppr蛋白编码序列可操作地连接到天然种
子贮藏编码序列的天然启动子,其中所述ppr蛋白编码序列替换所述天然种子贮藏蛋白编码序列的全部或部分。50.如权利要求46至49中任一项所述的大豆种子,其中所述大豆种子进一步包含整合到其基因组中的重组构建体,所述重组构建体包含豆血红蛋白编码序列。51.如权利要求46至50中任一项所述的大豆种子,其中所述大豆种子进一步包含所述天然豆血红蛋白基因的基因组修饰。52.如权利要求46至52中任一项所述的大豆种子,其中所述大豆种子进一步包含基因组修饰,其中用豆血红蛋白编码序列替换种子贮藏蛋白的编码序列的全部或部分。53.如权利要求46至52中任一项所述的大豆种子,其中已对所述大豆种子进行修饰以使编码(i)谷氨酰trna还原酶、(ii)铁螯合酶、(iii)谷氨酰trna还原酶结合蛋白和(iv)氨基乙酰丙酸合酶的基因中具有一个或多个核苷酸插入、缺失或取代。54.一种大豆种子,其包含占所述大豆种子中总蛋白的至少0.5%的量的豆血红蛋白,其中所述大豆种子包含基因组修饰,所述基因组修饰包括以下中的至少一项:(i)大豆基因组序列的核酸插入,所述插入排除非大豆基因组序列,(ii)一个或多个核酸取代,(iii)一个或多个核酸缺失,以及(iv)其任何组合,其中所述基因组修饰包括(a)对所述天然豆血红蛋白基因进行的修饰或(b)包含所述天然豆血红蛋白基因的至少一部分的插入。55.如权利要求54所述的大豆种子,其中所述基因组修饰包括对天然豆血红蛋白基因的插入、缺失或取代。56.如权利要求54或55所述的方法,其中所述基因组修饰包括(i)插入,其中所述插入包括调节增强子或启动子序列或者(ii)取代,其中所述取代产生或增强调节增强子或启动子序列。57.如权利要求54或55所述的大豆种子,其中所述基因组修饰包括插入,并且所述插入包括与所述豆血红蛋白基因的豆血红蛋白编码序列可操作地连接的靶向序列,所述靶向序列将所述豆血红蛋白靶向细胞内区室。58.如权利要求57所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。59.如权利要求58所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。60.如权利要求54所述的大豆种子,其中所述基因组修饰包括用豆血红蛋白编码序列替换种子贮藏蛋白的编码序列的全部或部分。61.如权利要求60所述的大豆种子,其中所述豆血红蛋白编码序列可操作地连接到靶向序列,其中所述靶向序列将所述豆血红蛋白靶向细胞内区室。62.如权利要求62所述的大豆种子,其中所述靶向序列将所述豆血红蛋白靶向质体。63.如权利要求62所述的大豆种子,其中所述靶向序列包含编码与seq id no:32具有至少95%同一性的多肽的多核苷酸。64.如权利要求54至63中任一项所述的大豆种子,其中所述天然豆血红蛋白基因是对应于seq id no:43的序列。65.如权利要求权利要求1至64中任一项所述的大豆种子,其中所述豆血红蛋白的至少50%在复合物中与血红素结合。66.如权利要求权利要求1至10和32至64中任一项所述的大豆种子,其中所述种子在所
述种子的横切面中具有粉红色。67.如权利要求1至64中任一项所述的大豆,其中所述大豆进一步包含不同的修饰以减少或阻止一个或多个不同的种子贮藏编码序列的表达,其中与表达豆血红蛋白但缺乏不同修饰的可比大豆种子相比,所述豆血红蛋白的表达增加。68.如权利要求67所述的大豆种子,其中所述不同的修饰降低(i)大豆球蛋白多肽序列,(ii)伴大豆球蛋白多肽序列,或(iii)其组合的含量。69.如权利要求1至68中任一项所述的大豆种子,其中所述大豆包含至少50%油酸。70.如权利要求1至69中任一项所述的大豆种子,其中所述大豆包含少于3%亚麻酸。71.如权利要求69或70所述的大豆种子,其中所述大豆包含下调天然fad2编码序列的表达的转基因和fad3基因中的突变。72.如权利要求1至71中任一项所述的大豆种子,其中当在13%水分下或调整至13%水分测量时,所述大豆包含至少37重量%的蛋白质。73.如权利要求72所述的大豆种子,其中所述大豆种子包含修饰以提高种子蛋白含量,所述修饰在编码以下中的至少一者的基因中:(i)含有cct结构域的蛋白、(ii)网状蛋白、(iii)海藻糖磷酸合酶、(iv)hect泛素连接酶,(v)mft(开花之母)多肽和(vi)棉子糖合酶。74.一种从如权利要求1至73中任一项所述的大豆种子长成的植物。75.一种用于加工从如权利要求1至73中任一项所述的大豆种子中提取的豆粕的方法,所述豆粕包含多糖,所述方法包括在足以降解所述豆粕中的多糖的条件下使所述豆粕与纤维素酶、半纤维素酶和果胶酶中的至少一者接触并从残余物中过滤渗透物。76.一种从如权利要求1至73中任一项所述的种子产生的大豆分离物,所述分离物包含占总蛋白的至少0.2重量%的豆血红蛋白,其中所述豆血红蛋白的至少约50%用铁基团血红素化。77.所述从如权利要求1至73中任一项所述的大豆种子中提取的豆粕,其中所述豆粕包含占总蛋白的至少0.1重量%的豆血红蛋白。78.一种用于生产豆粕或分离物的方法,所述方法包括将包含豆血红蛋白的大豆种子与包含高油酸的大豆种子组合并加工所述豆以产生所述豆粕或所述分离物,其中所述豆粕或所述分离物包含豆血红蛋白和高油酸,并且其中所述豆血红蛋白的至少约50%用铁基团血红素化。79.一种用于生产豆血红蛋白的方法,所述方法包括从通过如权利要求78所述的方法生产的豆粕中提取豆血红蛋白。
技术总结
生产包含豆血红蛋白的大豆种子的大豆植物是通过修饰所述大豆植物的基因组产生的。提供了包含豆血红蛋白的大豆植物、大豆种子和大豆蛋白组合物。提供了大豆植物、大豆种子和大豆蛋白组合物,其包含豆血红蛋白并且另外地包含高油酸、低亚麻酸、高蛋白质、低水苏糖、低棉子糖和低蛋白酶抑制剂中的一者或多者。包含豆血红蛋白的蛋白组合物,例如大豆分离物和浓缩物,可以由大豆种子制成。此外,还公开了生成和使用包含豆血红蛋白的植物、种子和蛋白组合物的方法。的方法。的方法。
技术研发人员:H-J
受保护的技术使用者:先锋国际良种公司
技术研发日:2021.10.22
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:疫苗的制作方法 下一篇:弯曲操作机构的制作方法