地方鸡种种质特性相关基因的分析及筛选方法与流程
未命名
08-25
阅读:52
评论:0

1.本发明涉及功能基因分析及筛选技术领域,具体涉及地方鸡种种质特性相关基因的分析及筛选方法。
背景技术:
2.中国各个省份具有不同的生态环境、地形地貌、林地资源以及人文背景,因此,各地都具有极为丰富而优异的地方鸡种遗传资源和品种多样性,比如:我国贵州省包括毕节地区乌蒙乌骨鸡和威宁鸡、安顺地区普定高脚鸡、黔西南地区兴义矮脚鸡、黔东南地区小香鸡、遵义地区赤水乌骨鸡、长顺绿壳蛋鸡以及黔南地区瑶山鸡等8个著名品种(2021年版《国家畜禽遗传资源品种名录》)。这些地方品种既是极具价值的经济资源,也是家鸡品种改良、新品种培育的重要种质资源,为我国种业振兴战略的实现提供了重要动力。尽管我国各个地区的地方鸡种具有诸多优良种质特性,但当前对其遗传机制的解析工作还处于落后的水平,调控重要性状的遗传机制还没有得到充分的挖掘和利用,显著的资源优势尚未能充分转化为产业优势,严重制约着优异地方鸡种种质资源的创新利用。
3.基因组变异是家鸡在驯化过程中形成独特种质特性的遗传学基础。此外,随着基因组时代的来临,研究人员对不同地方品种家鸡基因组序列图谱进行了绘制,并在全基因组范围内对不同地方鸡种的遗传变异进行了广泛的检测,为研究地方鸡种独特种质的遗传机制奠定了基础。然而,迄今为止只有少量报道针对某个或几个地方鸡种的群体遗传变异进行过研究,尚未从全基因组角度全面系统地开展国家畜禽遗传资源地方鸡种遗传变异检测的研究工作,对品种优良性状的遗传机制尚不清楚。因此,从全基因组层面上对地方鸡种进行全面深入的研究,解析地方鸡种在驯化过程中的选择信号、挖掘品种在长期的自然选择和人工选择过程中与其特殊优良性状相关的受选择位点,有助于制定科学合理的鸡种质资源保护、开发和利用策略,同时为现代家禽业精准化的遗传改良和分子育种提供理论基础,具有重要的学术价值和育种应用前景。
4.自然选择和人工选择的双重选择是家鸡表型多样性的主要驱动力,其通过改变群体内的基因型频率,最终形成了纷繁、具有独特种质特性的鸡种资源。而选择性清除(selective sweep)是自然选择和人工选择中的一个重要过程,通过该过程,新的有利突变会增加其频率并最终在群体中固定,同时导致该区域1)杂合度的减少;2)等位基因频率分布的倾斜;3)连锁程度增加以及4)在被选择的等位基因附近出现显著多的高频衍生等位基因。基于基因组受选择区域的这些特征,研究人员基于基因组受选择区域的这些特征开发了一系列检测基因组选择区域的方法。根据它们所使用的特征的差异,可以将它们分为三大类:基于位点频谱的方法、基于连锁不平衡的方法以及基于群体分化的方法。目前,大量研究仅使用单个或至多两种选择信号检测方法扫描基因组受到正向选择的区域及基因。本发明将同时采用4种不同的受选择分析方法,包括
①
群体分化指数(fst,基于群体分化),
②
核苷酸多样度比值(π-ratio,基于位点频率谱),
③
群体间复合似然比检验(xp-clr,基于两个群体间多基因座等位基因频率差异)以及
④
群体间扩展单倍型纯合检验(xp-ehh,基于连
锁不平衡和单倍型)。这4种方法囊括受选择区域的4大特点,能最大程度消除分析的假阳性及假阴性结果,为家养动物表型变异背后遗传机制的研究提供了参考。
技术实现要素:
5.本发明针对现有地方鸡种种质特性相关基因的分析以及筛选存在的准确度参差不齐以及假阳性及假阴性率较高的问题,提供了地方鸡种质特性相关基因的分析及筛选方法。
6.为了解决上述技术问题,本发明的技术方案为:
7.第一方面,本发明提供地方鸡种种质特性相关基因的分析及筛选方法,包括如下步骤:
8.步骤1,挑选不同种群的成年鸡只样本,对每只鸡只建立样本信息,并采集血样后保存备用;
9.步骤2,将血样提取dna后进行全基因组重测序,测序深度10
×
以上,并对数据进行过滤;
10.步骤3,将过滤后的重测序数据与鸡参考基因组进行比对及变异检测,获得snp数据信息;
11.步骤4,将fst、π-ratio、xp-clr和xp-ehh这4种算法相结合,将获得的snp数据信息进行选择性消除分析,获得地方鸡种种质特性相关基因的候选区域;
12.步骤5,将候选区域内的基因进行功能富集分析,结合不同品种的表型种质特性,获得不同种群种质特性相关的候选基因。
13.优选地,成年鸡只日龄为300d以上。
14.优选地,每个种群的鸡只数量不低于10只;更优选为30只,公母各半。
15.进一步地,所述样本信息包括:鸡种名称、产地、样本数量、品种分类、品系信息;可选地,还包括:产地环境参数,比如海拔高/低、山脉划分、气温高/低。
16.进一步地,所述步骤2中,数据过滤的方法包括:
17.步骤2-1,过滤掉含有接头序列的reads;
18.步骤2-2,判断单端测序read中n的含量是否超过该条read长度比例的10%,如果是,则去除此对paired reads;
19.步骤2-3,判断单端测序read中含有的低质量(《=5)碱基数是否超过该条read长度比例的50%,如果是,则去除此对paired reads。
20.进一步地,所述步骤3中,将过滤后的重测序数据与鸡参考基因组进行比对及变异检测包括:
21.步骤3-1,采用序列比对软件bwa的bwa-men算法将过滤后的重测序数据锚定在鸡参考基因组上,参数为:mem-t 10-k 32
–
m;
22.步骤3-2,将比对上的映射读序的位置信息使用samtools去除重复及归类,记录到生成的bam文件中;参数为:rmdup;
23.步骤3-3,利用samtools的index命令生成序列索引,并对序列索引中存在indels的区域进行局部调整。
24.优选地,所述步骤3-3中,对序列索引中存在indels的区域进行局部调整,包括:
25.步骤3-3-1,通过gatk4软件的realigner target creator算法来确定序列索引中存在indels的区域,再通过gatk4软件的indel realigner算法在这些区域内进行重新比对,最后输出一份重新对齐的bam文件中;
26.步骤3-3-2,利用染色体顺序信息对重新对齐的bam文件进行排序,并对pcr扩增导致的冗余重复reads进行过滤,获得重新对齐的bam文件;
27.步骤3-3-3,结合使用samtools软件的pileup算法和bcftools软件的“bcftools call”命令共同检测鸡群体基因组中的单核苷酸多态性位点(snp),过滤存在分离偏差或测序错误的基因后,获得snp/indel数据集,过滤条件为:dp5-miss0.1-maf0.05;
28.步骤3-3-4,利用annovar对snp/indel数据集进行比对和功能注释,然后将获得的snp信息输出到vcf格式中,比对到db snp数据库,鉴定新的snp。
29.进一步地,所述步骤4包括:
30.步骤4-1,按照不同分群方式对群体基因组数据进行两两比较,筛选受选择信号;
31.步骤4-2,根据滑动窗口策略,优选设定100kb滑动窗口以及50kb重叠窗口计算fst和π值,再计算得到各分群方式的πradio;
32.步骤4-3,进行xp-ehh和xp-clr的计算。
33.步骤4-4,通过获取的πradio+fst、xp-clr及xp-ehh的离群值来识别选择信号,以πradio+fst大于阈值(top 5%)、xp-clr大于阈值(top 5%)和xp-ehh大于阈值(top5%)的重叠区域作为受选择基因的候选区域。
34.进一步地,所述分群方式包括但不限定为:野生-家养、产蛋性能、生长性能、羽色肤色等体型类型、产区海拔、产区温度等。
35.进一步地,所述步骤5包括:以ensemble数据库中鸡的所有基因作为背景基因集,利用david对获得的候选基因进行go富集分析和kegg通路分析;优选地,利用q值(false discovery rate)对p值进行校正,q≤0.05的go生物学过程(go-bp)、分子功能(go-mf)、细胞成分(go-cc)和kegg通路定义为显著富集。
36.与现有技术相比,本发明可以获得包括以下技术效果:
37.本发明采用全基因组选择性扫描分析研究了现代鸡商业表型特征的遗传基础,筛选到了与产蛋性能、生长性能以及体型等重要性状相关的候选基因,这些功能基因的定位对加速鸡新品种育种进程、提高育种效率具有重要意义。
附图说明
38.此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
39.图1为本发明实施例1中所有鸡染色体上的snp密度分布图。
40.图2为本发明实施例1中长顺绿壳蛋鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/cs),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
41.图3为本发明实施例1中贵州8个地方鸡种受选择基因所富集的前30个go条目
42.图4为本发明实施例1中贵州8个地方鸡种受选择基因所富集的前20个kegg条目
43.图5为本发明实施例1中竹乡鸡(赤水乌骨鸡)受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/cswg),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域
44.图6为本发明实施例1中普定高脚鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/pd),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
45.图7为本发明实施例1中黔东南小香鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/qd),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
46.图8为本发明实施例1中乌蒙乌骨鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/wm),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
47.图9为本发明实施例1中威宁鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/wn),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
48.图10为本发明实施例1中兴义矮脚鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/xy),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
49.图11为本发明实施例1中瑶山鸡受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(rjf/ys),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
50.图12为本发明实施例2中产蛋性能相关受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(ref/egg),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和
绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
51.图13为本发明实施例2中与经济性状相关受选择基因所富集的前30个go条目。
52.图14为本发明实施例2中与经济性状相关受选择基因所富集的前20个kegg条目。
53.图15为本发明实施例2中生长性能相关受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(ref/broiler),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
54.图16为本发明实施例2中体型大小相关受选择区域及基因。a图为fst和π结合筛选受选择区域;横坐标为θπ的比值(short/tall),纵坐标为fst,分别对应上面的频率分布图和右侧的频率分布图,中部的点图则代表不同窗口内的相应的fst和θπ比值。其中最上方蓝色和绿色区域为θπ选择出来的top 5%区域,橙色区域为fst所选择top 5%区域。b图为xp-clr方法筛选受选择区域。c图为xp-ehh方法筛选受选择区域。
具体实施方式
55.在本发明的描述中,需要说明的是,实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
56.以下将配合实施例来详细说明本发明的实施方式,藉此对本发明如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
57.实施例1
58.全基因组选择消除分析揭示贵州地方鸡种种质特性的遗传机制
59.1试验材料
60.本实施例研究采样血样的鸡只样本信息如下表1所示。采用随机抽样的方法,从乌蒙乌骨鸡(wm)、威宁鸡(wn)、普定高脚鸡(pd)、兴义矮脚鸡(xy)、黔东南小香鸡(qd)、竹乡鸡(赤水乌骨鸡)(cswg)、长顺绿壳蛋鸡(cs)、瑶山鸡(ys)保种群中随机选取30只300d以上成年鸡,其中普定高脚鸡、兴义矮脚鸡取自原产地的资源保护区的鸡群,其他6个品种均取自原产地资源保种场的保种鸡群。
61.将鸡保定后,用剪毛剪将采血处较长的毛发剪除,再依次使用碘酊和75%酒精消毒,随后从颈静脉处采血并存储于使用5ml医用负压edta抗凝管。每只鸡至少采集2管全血,采集完成后立即轻摇混匀并置于4℃保存,每隔6小时轻摇混匀一次,避免因长时间沉降导致白细胞黏连或凝血。
62.表1群体样本信息及分群统计
[0063][0064]
注*:10只红原鸡的基因组数据下载自ncbi数据库(genbank检索号prjna241474、prjeb30270)的基因组重测序数据。
[0065]
2试验方法
[0066]
2.1全基因组重测序
[0067]
2.1.1血液dna提取
[0068]
采用标准苯酚-氯仿法对全血样品进行基因组dna提取,琼脂糖凝胶电泳和nanodrop2000分光光度计检测基因组dna的浓度和质量。
[0069]
2.1.2基因组文库构建和测序
[0070]
dna样品检测合格后,使用covaris超声波破碎仪随机打断,经末端加polya修复、连接测序接头和pcr扩增等步骤制备文库。先使用qubit 3.0对基因组文库进行初步定量,再使用agilent 5300对文库的插入片段进行检测,当确认插入片段大小符合预期后,使用文库定量仪器进行实时定量pcr检测(bio-rad,usa),对文库的有效浓度进行准确定量(文库有效浓度》2nm)。基因组文库构建完成后,利用bgi t7 pe150测序平台对以上文库进行双末端测序,平均读序(reads)长度为350bp。以上步骤均在测序公司完成。
[0071]
2.1.3测序数据的质量评估与过滤
[0072]
将测序得到的原始图像数据经base calling转化为序列数据,raw data或者raw reads,以fastq格式存储。原始序列数据的质量主要通过测序错误率分布和gc含量分布等指标来评估。然而,原始测序数据中会包含接头信息,低质量碱基,未测出的碱基(以n表示)以及测序错误,这些信息会对后续的信息分析造成很大的干扰,分析前需将这些干扰信息去除掉,最终得到的数据即为有效数据,我们称之为clean data或clean reads。原始数据过滤方法如下:
[0073]
1)需要过滤掉含有接头序列的reads;
[0074]
2)当单端测序read中n的含量超过该条read长度比例的10%时,需要去除此对paired reads;
[0075]
3)当单端测序read中含有的低质量(《=5)碱基数超过该条read长度比例的50%时,需要去除此对paired reads。
[0076]
经过对测序数据的严格过滤,得到高质量的clean data。
[0077]
2.1.4重测序数据与参考基因组的比对
[0078]
过滤完成后的有效测序数据需要先与鸡参考基因组进行比对,才能进行后续的变异分析等过程。本试验使用序列比对软件bwa(burrows-wheeler alignment)的bwa-men算法将所有过滤后的样本数据(clean reads)锚定在鸡参考基因组上(参数:mem-t 4-k 32-m)。将比对上的映射读序(reads)的位置信息使用samtools去除重复及归类(参数:rmdup),记录到生成的bam文件中。
[0079]
鸡参考基因组来自:gallus gallus grcg6a(http://ftp.ensembl.org/pub/release-106/fasta/gallus_gallus/dna)
[0080]
2.1.5变异检测
[0081]
利用samtools的index命令生成序列索引,为了减少由碱基插入/缺失(indels)等导致的局部比对错误,需要对存在indels的区域进行局部调整。这个过程分为两步,首先使用gatk4软件中的realigner target creator算法来确定需要重新比对的可能含有indels的区域,然后运行gatk4中的indel realigner算法在这些区域内进行重新比对,最后输出重新对齐的bam文件中。然后利用染色体顺序信息对重新对齐的bam文件进行排序,同时为了尽量减少运算量,需要对pcr扩增导致的冗余重复reads进行过滤。经过以上步骤获得了重新对齐的bam文件,接下来结合使用samtools软件中的pileup算法和bcftools软件中“bcftools call”命令共同检测鸡群体基因组中的单核苷酸多态性位点(snp),通过过滤条件:dp5-miss0.1-maf0.05,排除了那些存在分离偏差或测序错误的基因,得到准确性高的snp/indel数据集,利用annovar进行比对和功能注释;将获得的snp信息输出到vcf格式中,比对到db snp数据库,鉴定新的snp。
[0082]
2.2全基因组选择性消除分析
[0083]
2.2.1选择性消除分析
[0084]
基于前述步骤所获得的snp数据信息,本研究进一步采用基于不同算法的4种选择性消除分析方法(fst、π-ratio、xp-clr和xp-ehh),按照不同的分群方法对群体基因组数据进行两两比较,筛选受选择信号,具体的分群信息如下表2。基于滑动窗口的策略以40kb的滑动窗口,10kb重叠窗口计算fst和π值,再计算得到各分群方式的πradio。根据sabeti提出的公式进行xp-ehh的计算(sabeti p c,varilly p,fry b,et al.genome-wide detection and characterization of positive selection in human populations[j].nature,2007,449:913-8.)。xp-clr的计算根据说明进行(参考网站http://genetics.med.harvard.edu/reich/reich lab/software.html)。随后通过获取πradio+fst、xp-clr及xp-ehh的离群值来识别选择信号。以πradio+fst大于阈值(top 5%)、xp-clr大于阈值(top 5%)和xp-ehh大于阈值(top 5%)的重叠区域作为受选择基因的候选区域,top5%指的是排序前5%的区域。
[0085]
表2选择性消除分析分群信息表
[0086][0087]
注:cs长顺绿壳蛋鸡,cswg赤水乌骨鸡,pd普定高脚鸡,qd黔东南小香鸡,wm乌蒙乌骨鸡,wn威宁鸡,xy兴义矮脚鸡,ys瑶山鸡,rjf红原鸡。
[0088]
2.2.2功能富集分析
[0089]
将检测到的受选择区域内的基因作为候选基因进行功能富集分析。以ensemble数据库中鸡的所有基因作为背景基因集,利用david(http://david.abcc.ncifcrf.gov/)对获得的候选基因进行go富集分析和kegg通路分析。利用q值(false discovery rate)对p值进行校正,只有q≤0.05的go生物学过程(go-bp)、分子功能(go-mf)、细胞成分(go-cc)和kegg通路才认为显著富集的,以进一步了解候选基因的功能方向。
[0090]
3试验结果
[0091]
3.1不同鸡种基因组变异信息
[0092]
本研究使用的鸡种材料包括表型多样的8个贵州地方品种,2个商业品种及红原鸡。对10个家鸡品种(共300个个体)进行了全基因组重测序分析,总的测序数据量为4256.67gb,高质量的clean data数据量为4201.19gb,平均每只鸡获得14.00gb的高质量数据,极大地丰富了贵州地方鸡品种的遗传背景。测序数据q20和q30的平均比例分别达到97%和91%以上,gc含量为42.64%,q20、q30比例较高,gc含量无偏倚性,说明建库与测序质量良好。按照1.05g的参考基因组大小计算样本,平均比对率为99.15%
±
0.04%,样本平均测序深度为12.89
±
3.16
×
,将clean reads比对到红原鸡参考基因组(galgal6),样品平均覆盖度为92.81%
±
4.31%,说明测序样品与参考物种序列相似度高,亲缘关系较近。10只红原鸡的基因组数据下载自ncbi数据库(genbank检索号prjna241474、prjeb30270)的基因组重测序数据。
[0093]
生物基因组存在许多遗传变异类型,单核甘酸多态性(snp)只涉及单碱基的替换,是最简单也是最常见变异类型,约占全部遗传变异的90%。由于snp在基因组中的密度较高、而且较易检测、方便进行大样本群体检测,是遗传学研究中应用最广泛的变异。本次测序总计发现8145040个高度可信的snp,极大地丰富了鸡snp数据信息,其中36.93%的snp位
于基因间区,47.31%的snp位于内含子区域,只有2.37%的snp位于外显子区域,提示基因组中的基因间区和内含子区域的基因在遗传调控中起作用并且负责鸡品种的表型多样性。snps在染色体上的分布密度如图1所示,除了一些染色体上小部分的孤立区域外,snps以相对均匀的方式分布在每个染色体上。此外,1号染色体上的变异数量最多,z染色体也含有较多的变异;snps在每条染色体上的数量有随染色体长度减小而降低的趋势。
[0094]
随后使用annovar软件对上述高质量snps进行注释,总共发现79045个snps导致同义突变,30825个snps为异义突变,非同义突变与同义突变的比率为0.39。在本研究中总共发现5556070个纯合子snp(69.23%)和2469103个杂合子snp(30.77%);8个地方品种snp的纯合/杂合比值范围为0.6788~2.0238。转换ts(transition)/颠换tv(transversion)是检测随机序列误差的重要指标,是对snp的提取质量的评估,经验值(ts/tv)》2.1,本研究各群体的ts/tv在2.667到2.695之间,表明本研究中检测到的已识别snp较准确,详细注释结果如表3所示。每个群体总共发现732~748万snp,将这些snps比对到鸡第六版本参考基因组(galgal6)db snp数据库,每个品种或群体分别检测到了20-47万个snp不能与数据库相匹配,说明其为该品种特有的snp,分别占cs、cswg、pd、qd、wm、wn、xy、ys、shxy、tf及rjf群体的7%、6%、7%、7%、6%、6%、6%、7%、4%、5%及6%,相比之前研究中新发现的snp比率要低,推测可能由于近年来随着基因组测序的发展,数据库越来越完善,使能比对上的snp比例明显增大,新发现的逐渐变少,各个群体特异性snp注释结果如表4所示。
[0095]
表3各个群体snps注释
[0096]
[0097][0098]
注:total:snp总个数;upstream:基因上游1kb区域;exonic:变异位于外显子区域;stop gain:使基因获得终止密码子的变异;stop loss:使基因失去终止密码子的变异;synonymous:同义变异;nonsynonymous:非同义变异;intronic:变异位于内含子区域;splicing:变异位于剪接位点(内含子中靠近外显子/内含子边界的2bp);downstream:基因下游1kb区域;upstream/downstream:基因上游1kb区域,同时也在另一基因的下游1kb区域;intergenic:变异位于基因间区;het:杂合子;hom:纯合子。
[0099]
表4各群体特异性snps注释
[0100]
[0101][0102]
注:total:snp总个数;upstream:基因上游1kb区域;exonic:变异位于外显子区域;stop gain:使基因获得终止密码子的变异;stop loss:使基因失去终止密码子的变异;synonymous:同义变异;nonsynonymous:非同义变异;intronic:变异位于内含子区域;splicing:变异位于剪接位点(内含子中靠近外显子/内含子边界的2bp);downstream:基因下游1kb区域;upstream/downstream:基因上游1kb区域,同时也在另一基因的下游1kb区域;intergenic:变异位于基因间区;het:杂合子;hom:纯合子。
[0103]
3.2全基因组选择消除分析
[0104]
3.2.1长顺绿壳蛋鸡(cs)驯化过程中选择性清除信号分析
[0105]
选取fst结合θπ(fst》0.1和θπ(rjf/cs)≥0.16为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1106、2515和3353个正选择基因,其中1419个基因至少在两种方法中受到选择,391个基因在这四种方法彼此重叠(图2)。
[0106]
选取cs在四种受选择方法中共同筛选出的391个候选基因进行kegg通路和go富集
分析。go富集分析中显著富集(p《0.05)的go条目共有58个,部分极显著(p《0.01)富集的go条目共有21个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:凋亡信号通路(go:0006309、0006921、0030262、0097194),dna分解代谢过程(go:0000737、0006308);细胞内蛋白激酶级联的正调控(i-kappab激酶/nf-kappa级联)(go:0007249、0043122、0043123、0010740);dna转录过程(go:0006352、0006367、0006384);dna保护(go:0042262)。细胞成分注释(go_cc)中极显著富集的go条目包括:转录因子tfiia复合物(go:0005672)。分子功能注释(go_mf)中极显著富集的go条目包括:atp:adp反向转运蛋白活性(go:0005471);双链dna结合(go:0003690);钙离子结合(go:0005509);脂质结合(go:0008289);氧化还原酶活性(go:0003885、0016899)。
[0107]
kegg富集分析中显著富集(p《0.05)的条目共有13个,部分极显著(p《0.01)富集的kegg条目共有12个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与氨基酸代谢相关【缬氨酸、亮氨酸和异亮氨酸降解、氨基酸生物合成、蛋白质输出】,能量代谢相关【泛酸和辅酶a生物合成、2-氧代羧酸代谢、类固醇生物合成、半乳糖代谢、戊糖和葡萄糖醛酸的相互转化、果糖和甘露糖代谢】,与抗病免疫相关【p53信号通路、凋亡】,以及血管平滑肌收缩【血管平滑肌收缩、钙信号通路】。
[0108]
对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多kegg通路和go条目与抗病免疫性能相关,包括p53信号通路、凋亡、蛋白激酶级联的正调控(i-kappab激酶/nf-kappa级联)等,该结果很好的解释了cs优异的抗逆抗病性。此外,大量正选择基因被发现富集在氨基酸和能量代谢相关通路中,包括泛酸和辅酶a生物合成、半乳糖代谢、戊糖和葡萄糖醛酸的相互转化、氨基酸生物合成、脂质结合等,这些通路都是维持机体生长发育不可或缺的。一些正选择基因也富集在血管平滑肌功能相关通路,包括血管平滑肌收缩、钙信号通路、钙离子结合等,与血管功能和血氧运输有关,它们都是维持机体机能的重要因素。值得一提的是,cs所在的黔南地区紫外线强烈,强烈的紫外线辐射会导致dna损伤,推测go功能富集到的dna保护、双链dna结合、氧化还原酶活性相关基因能够帮助cs适应当地长期强烈紫外线环境。cs是以觅食能力强和耐粗饲著称的地方鸡种,这意味着这些正选择基因可能是人们在驯化cs过程中提升其能量代谢和耐粗饲环境的关键因素,因此这些富集条目中的关键基因值得重点关注。值得关注的是,slco1b3基因同时发现在xp-clr和xp-ehh两种分析排分前十的受选择区域,该基因已被证实是鸡蛋绿壳性状的重要候选基因,该结果很好的解释了cs所产鸡蛋的绿壳表型。
[0109]
3.2.2竹乡鸡(赤水乌骨鸡,cswg)驯化过程中选择性清除信号分析
[0110]
选取fst结合θπ(fst》0.13和θπ(rjf/cs)≥0.19为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1444、2447和3296个正选择基因,其中1522个基因至少在两种方法中受到选择,488个基因在这四种方法彼此重叠(图5)。
[0111]
选取cswg在四种受选择方法中共同筛选出的488个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有44个,部分极显著(p《0.01)富集的go条目共有12个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:离子转运(go:0006811)、铁离子转运(go:0006826);单有机体过程(go:0044765);乙酰辅酶a代谢过程(go:0006084)、酰基辅酶a代谢过程(go:0006637)、硫酯代谢
过程(go:0035383)。分子功能注释(go_mf)中极显著富集的go条目包括:甘氨酰肽n-十四烷酰基转移酶活性(go:0004379)、肉豆蔻酰转移酶活性(go:0019107);紫黄质脱环氧化酶活性(go:0046422);铁离子跨膜转运蛋白活性(go:0005381);3-羟基邻氨基苯甲酸酯3,4-加氧酶活性(go:0000334);一氧化碳脱氢酶(受体)活性(go:0018492)。
[0112]
kegg富集分析中显著富集(p《0.05)的条目共有18个,部分极显著(p《0.01)富集的kegg条目共有9个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与生长和代谢有关【缬氨酸、亮氨酸和异亮氨酸降解、氨基糖和核苷酸糖代谢、泛酸和辅酶a生物合成、泛素介导的蛋白水解】,与能量代谢相关【戊糖和葡萄糖醛酸的相互转化、半乳糖代谢、果糖和甘露糖代谢、甘油酯代谢、2-氧代羧酸代谢、戊糖磷酸途径】,与抗病免疫相关【p53信号通路、吞噬体、凋亡、卵母细胞减数分裂、notch信号通路、mrna监视途径】,与血管收缩相关【血管平滑肌收缩】,以及细胞通讯【缝隙连接】。
[0113]
在cswg群体中通过四种方法筛选的正选择基因的富集结果中,许多kegg通路和go条目与离子跨膜转运相关,包括离子转运、铁离子转运、铁离子跨膜转运蛋白活性、缝隙连接等功能,以及各种酶的活性,包括:甘氨酰肽n-十四烷酰基转移酶活性、肉豆蔻酰转移酶活性等,推测这些基因与cswg肉质中富含丰富的氨基酸、微量元素、矿物质和黑色素有关。此外,大量正选择基因被发现富集在生长与糖脂蛋白能量代谢相关途径,包括乙酰辅酶a代谢过程、酰基辅酶a代谢过程、戊糖和葡萄糖醛酸的相互转化、半乳糖代谢、果糖和甘露糖代谢、缬氨酸、亮氨酸和异亮氨酸降解、氨基糖和核苷酸糖代谢、泛酸和辅酶a生物合成等过程,很好的解释了cswg较大的体型及较佳的储脂能力。值得一提的是,cswg所在的赤水市西北部地区极端气温可达40℃以上,cswg黑色的羽色和肤色使得它们更容易受到太阳辐射热量的影响,使得身体核心温度的上升而导致热应激,因此cswg在驯化过程中发生了热适应性的选择。在cswg的选择性清除基因中发现了许多基因显著富集在泛素介导的蛋白水解、p53信号通路、凋亡、卵母细胞减数分裂、notch信号通路、mrna监视途径等通路和功能中,这些基因可能与cswg较佳的耐热性和抗病免疫性能有关。热辐射会导致机体体温调节发生障碍,水、电解质代谢紊乱以及神经系统功能受到损害。热辐射对神经系统的损伤主要由错误折叠的蛋白质在神经细胞内大量积累,最终引发的神经细胞的凋亡。“泛素介导蛋白水解途径”在细胞内非正常折叠蛋白质的泛素化降解过程中起到关键作用,此条目在cswg候选基因中显著富集。维持内环境稳态对于防止热辐射也同样重要,cswg受到选择的候选基因在离子转运相关路径中富集,这些基因可能在调节电解质平衡的过程中起重要作用,防止热辐射条件下的电解质紊乱。此外,p53信号通路在热辐射诱导的细胞凋亡和细胞周期的调节中起关键作用。戊糖磷酸通路被认为是动物适应高温环境压力的重要调节通路,该通路能够产生大量gp
x
的辅助因子(nadph),从而提高机体抗氧化能力从而抵抗热应激。该条通路可能是参与cswg适应高温环境压力的重要因素。
[0114]
3.2.3普定高脚鸡(pd)驯化过程中选择性消除信号分析
[0115]
选取fst结合θπ(fst》0.11和θπ(rjf/cs)≥0.22为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1175、2761和3625个正选择基因,其中1617个基因至少在两种方法中受到选择,401个基因在这四种方法彼此重叠(图6)。
[0116]
选取pd在四种受选择方法中共同筛选出的401个候选基因进行kegg通路和go富集
分析。go富集分析中显著富集(p《0.05)的go条目共有29个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中显著富集的go条目包括:细胞内蛋白质定位的维持(go:0032507)、蛋白定位的维持(go:0045185)、位置的维持(go:0051235)、细胞内位置的维持(go:0051651);自噬空泡组装(go:0000045)、巨自噬(go:0016236)、空泡组织(go:0007033);铁离子跨膜转运(go:0034755);细胞骨架在质膜上的锚定(go:0007016);线粒体靶向蛋白(go:0006626);铁硫簇组件(go:0016226)、金属硫团簇组件(go:0031163);dna依赖性转录、启动(go:0006352);染色质重塑(go:0006338)。细胞成分注释(go_cc)中显著富集的go条目包括:baf型复合体(go:0090544)、swi/snf超家族型复合体(go:0070603);转录抑制复合物(go:0017053);肌营养不良聚糖复合体(go:0016011)、肉瘤聚糖复合物(go:0016012)。分子功能注释(go_mf)中显著富集的go条目包括:眼晶状体的结构成分(go:0005212),包含基因larp6(la-related protein 6);半乳糖神经酰胺硫转移酶活性(go:0001733)、半乳糖3-o-磺基转移酶活性(go:0050694);白细胞介素-12受体结合(go:0005143)、生长因子活性(go:0008083);rrna结合(go:0019843);刺猬受体活性(go:0008158);氨基酸结合(go:0016597);铁硫簇结合(go:0051536)、金属簇结合(go:0051540)。
[0117]
kegg富集分析中显著富集(p《0.05)的条目共有10个,部分极显著(p《0.01)富集的kegg条目共有2个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与生长和代谢相关【泛素介导的蛋白水解、内质网中的蛋白质加工、ppar信号通路、氨基糖和核苷酸糖代谢、n-聚糖生物合成】,与抗病免疫相关【wnt信号通路、细胞骨架的调节、刺猬信号通路、erbb信号通路】,以及【黑色素生成】。
[0118]
对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多正选择基因富集到抗病免疫相关通路,包括wnt信号通路、细胞骨架的调节、刺猬信号通路、erbb信号通路。wnt信号通路富集最显著的kegg通路,该通路中的许多基因在动物胚胎的早期发育、器官形成、组织再生和其它生理过程中,在维持机体内稳态中起着核心作用,而异常的wnt信号通路则参与了多种人类疾病的发病机制,包括出生缺陷、骨病、癌症和自身免疫性疾病,提示这些正选择基因和通路可能是pd优异的抗逆抗病性的关键因素,因此这些富集条目中的关键基因值得重点关注。此外,大量正选择基因被发现富集在生长和代谢相关的通路中,包括泛素介导的蛋白水解、内质网中的蛋白质加工、ppar信号通路等。pd是以体型大、产肉多以及脂肪沉积能力强著称的优质鸡种,提示这些正选择基因与pd较大的体型和较佳的脂肪沉积能力有关,因此这些富集条目中的关键基因值得重点关注。
[0119]
3.2.4黔东南小香鸡(qd)驯化过程中选择性清除信号分析
[0120]
选取fst结合θπ(fst》0.1和θπ(rjf/cs)≥0.17为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1172、2630和3450个正选择基因,其中1443个基因至少在两种方法中受到选择,432个基因在这四种方法彼此重叠(图7)。
[0121]
选取qd在四种受选择方法中共同筛选出的432个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有80个,部分极显著(p《0.01)富集的go条目共有9个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:钙离子转运(go:0006816);细胞内蛋白激酶级联的正调控(i-kappab激酶/nf-kappa级联)(go:0007249、go:0043122、go:0043123)。细胞成分注释(go_cc)中极显
著富集的go条目包括:转录因子tfiia复合物(go:0005672)。分子功能注释(go_mf)中极显著富集的go条目包括:双链dna结合(go:0003690);atp酶抑制剂活性(go:0042030)、钙通道调节活性(go:0005246)、核苷三磷酸酶调节活性(go:0060589)。
[0122]
kegg富集分析中显著富集(p《0.05)的条目共有7个,部分极显著(p《0.01)富集的kegg条目共有2个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与生长代谢有关【泛素介导的蛋白水解、半胱氨酸和蛋氨酸代谢、叶酸合成】,与免疫及药物代谢相关【药物代谢-其他酶、foxo信号通路、黏着连接】,与心脏功能相关【心肌收缩】。
[0123]
在qd群体中通过四种方法筛选的正选择基因的富集结果中,有许多kegg通路和go条目与心肌的功能维持相关,包括心肌收缩、钙离子转运、atp酶抑制剂活性、钙通道调节活性、核苷三磷酸酶调节活性等,心肌的功能与血氧运输有关,是维持运动机能不可或缺的。黔东南小香鸡原产于黔东南苗族侗族自治州,历有"九山半水半分田"之说,境内沟壑纵横,山峦延绵,重崖迭峰,森林覆盖率达67.37%,且黔东南小香鸡以散养为主,造就了其在驯化过程中心肌功能和运动能力受到正向选择。因此,这些富集条目中的候选基因可能是qd在驯化过程中提升运动能力和心肌功能的关键因素。良好的生态环境也是黔东南小香鸡优良肉品质形成的原因。叶酸是动物生长发育不可缺少的营养素,与神经系统、脑、心脏等器官的发育和功能的完善密切相关,qd发生选择性清除的基因有2个落在该通路中,且均与脑部和神经系统发育有关。此外,尽管qd生活在有利于病菌和寄生虫生长的潮湿丛林环境,但qd表现出对疾病极强的抗性。在qd的富集结果中,许多kegg通路和go条目与抗病免疫性能相关,包括细胞内蛋白激酶级联的正调控(i-kappab激酶/nf-kappa级联)、药物代谢-其他酶、foxo信号通路、黏着连接等过程、泛素介导的蛋白水解,这些候选基因很好的解释了qd极强的抗逆抗病性和环境适应性。皮肤和粘膜构成了机体免疫的第一道防线,高度组织化的细胞间紧密连接和黏着连接是建立和维持表皮和粘膜屏障功能的关键结构组件,将病原体阻挡在体外。黏着连接是由肌动蛋白丝参与的锚定连接,主要参与组织器官形态和功能的维持以及细胞迁徙、发育和分化等过程,与皮肤和粘膜的生长、功能维持和伤口愈合等过程有关。foxo信号通路在基因的转录中起到了重要的作用从而介导细胞的多种过程,包括dna损伤修复、凋亡、葡萄糖代谢、细胞周期和肿瘤形成,qd发生选择性清除的基因有2个落在该通路中。此外,除了创伤性损伤外,dna损伤也是机体遭受病原体或外在环境侵害机体的靶点途径,对dna损伤的修复同样是qd极强抗病力的特征。调节性泛素化正在成为保护dna损伤细胞基因组完整性的重要机制,因此泛素介导的蛋白水解通路中富集的对dna损伤具有调节作用的基因至关重要。
[0124]
3.2.5乌蒙乌骨鸡(wm)驯化过程中选择性清除信号分析
[0125]
选取fst结合θπ(fst》0.12和θπ(rjf/cs)≥0.33为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1302、2663和3542个正选择基因,其中1544个基因至少在两种方法中受到选择,332个基因在这四种方法彼此重叠(图8)。
[0126]
选取wm在四种受选择方法中共同筛选出的332个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有28个,部分极显著(p《0.01)富集的go条目共有1个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中显著富集
的go条目包括:铁离子传输(go:0006826)、铁离子跨膜转运(go:0034755)、过渡金属离子迁移(go:0000041);细胞铁离子稳态(go:0006879、0055072)、细胞过渡金属离子稳态(go:0046916、0055076);wnt受体信号通路的(负)调控(go:0030111、0030178)、信号转导的负调控(go:0009968)、细胞通讯的负调控(go:0010648)、信号负调控(go:0023057);线粒体靶向(定位)蛋白相关(go:0006626、0070585、0072655)、线粒体转运(go:0006839)。细胞成分注释(go_cc)中显著富集的go条目包括:放氧复合体(go:0009654)。分子功能注释(go_mf)中显著富集的go条目包括:3-羟基邻氨基苯甲酸酯3,4-加氧酶活性(go:0000334)、养分库活性(go:0045735);白细胞介素-12受体结合(go:0005143);谷氨酰trna还原酶活性(go:0008883);铁离子跨膜转运蛋白活性(go:0005381)、过渡金属离子跨膜转运活性(go:0046915);半胱氨酸型内肽酶活性(go:0004197)、钙依赖性半胱氨酸型内肽酶活性(go:0004198);刺猬受体活性(go:0008158);内向整流钾通道活性(go:0005242);错配dna结合(go:0030983)。
[0127]
kegg富集分析中显著富集(p《0.05)的条目共有11个,部分极显著(p《0.01)富集的kegg条目共有3个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与生长代谢相关【叶酸合成、赖氨酸降解、n-聚糖生物合成、gnrh信号通路、背腹轴形成】,与心肌和血管平滑肌有关【血管平滑肌收缩、钙信号通路、心肌细胞中的肾上腺素能信号】,与抗病免疫有关【ecm受体相互作用、范科尼贫血通路】,以及细胞通讯【缝隙连接】。
[0128]
在wm群体中通过四种方法筛选的正选择基因的富集结果中,许多kegg通路和go条目与离子跨膜转运相关,包括铁离子跨膜转运、过渡金属离子迁移、铁离子跨膜转运蛋白活性、过渡金属离子跨膜转运活性、内向整流钾通道活性等通路和功能,推测这些基因与wm肉质中富含丰富的氨基酸、微量元素、矿物质有关。一些正选择基因也富集在抗病免疫相关通路,包括ecm受体相互作用、范科尼贫血通路、wnt受体信号通路的调控、刺猬受体活性、白细胞介素-12受体结合等途径和功能,这些基因都是参与机体免疫和抗病调节的关键因子,与wm较好的抗逆抗病性密切相关。细胞与细胞外基质成分(ecm)相互结合,共同构成组织和器官。ecm还可以作为生长因子以及其它信号分子的库,将信号从外基质细胞转导到细胞内,调节细胞的多种功能,如生存、生长、迁移和分化,并对维持正常的内稳态至关重要,该通路中富集的基因对维持细胞的正常结构和功能至关重要。此外,许多正选择基因富集到生长和代谢相关的途径中,包括叶酸合成、赖氨酸降解、n-聚糖生物合成、gnrh信号通路、背腹轴形成等,这些正选择基因可能与wm相对于红原鸡体型显著变大、生长速度加快有关。gnrh信号通路被证实与鸡的繁殖性能相关,提示wm在驯化过程中繁殖性能受到了人工选择。叶酸是动物生长发育不可缺少的营养素,与神经系统、脑、心脏等器官的发育和功能的完善密切相关,wm发生选择性清除的基因有2个落在该通路中。此外,叶酸生物合成途径已被证实与动物的高原适应性相关。在wm群体中通过四种方法筛选的正选择基因的富集结果中,有许多kegg通路和go条目与心肌和血管平滑肌的功能维持相关,包括血管平滑肌收缩、钙信号通路、心肌细胞中的肾上腺素能信号等,心肌的功能与血氧运输有关。wm原产于云贵高原黔西北部乌蒙山区,属于高原地区,造就了其在驯化过程中心肌功能和运动能力受到正向选择。因此,这些富集条目中的候选基因可能是wm在驯化过程中形成高原适应性的关键因素。缺氧通常会引起细胞内ros浓度升高,而ros会促进大量钙离子通过钙离子通道进行释放,
使细胞收缩来应对低氧的伤害,因此这些受选择的钙信号通路富集基因可能对wm的高原适应起了重要作用。此外,富集在血管平滑肌收缩、心肌细胞中的肾上腺素能信号的基因可能有助于wm在心肌和血管平滑肌功能方面产生适应性进化,有利于它们在高海拔低氧环境下生存。值得关注的是,缝隙连接在心肌细胞间是实现电藕联及化学信息交换的重要结构基础,与心脏功能及心律失常的发生等有着密切的关系。在心肌或星形胶质细胞缺氧缺血早期给予阻断缝隙连接细胞间通讯,可以明显降低随后发生的心肌坏死及细胞缺氧损伤。一些正选择基因富集在缝隙连接通路,推测这些基因与wm对高原低氧环境的适应性有关。
[0129]
3.2.6威宁鸡(wn)驯化过程中选择性清除信号分析
[0130]
选取fst结合θπ(fst》0.09和θπ(rjf/cs)≥0.45为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1159、2463和3349个正选择基因,其中1394个基因至少在两种方法中受到选择,399个基因在这四种方法彼此重叠(图9)。
[0131]
选取wn在四种受选择方法中共同筛选出的399个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有64个,部分极显著(p《0.01)富集的go条目共有13个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:磷脂酰丝氨酸代谢过程(go:0006658)、磷脂酰丝氨酸生物合成过程(go:0006659);rna聚合酶iii启动子的转录起始(go:0006384);nad生物合成过程(go:0009435)、nad代谢过程(go:0019674);dna保护(go:0042262);有机物代谢过程(go:0071704)。分子功能注释(go_mf)中极显著富集的go条目包括:双链dna结合(go:0003690);3-羟基邻氨基苯甲酸酯3,4-加氧酶活性(go:0000334);烟酸核苷酸二磷酸化酶(羧化)活性(go:0004514);d-阿拉伯糖基-1,4-内酯氧化酶活性(go:0003885)、氧化还原酶活性,作用于供体的ch-oh基团,氧作为受体(go:0016899);结构特异性dna结合(go:0043566)。
[0132]
kegg富集分析中显著富集(p《0.05)的条目共有9个,部分极显著(p《0.01)富集的kegg条目共有1个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与生物合成有关【叶酸合成、氨酰trna生物合成】,与血管平滑肌有关【血管平滑肌收缩】,与抗病免疫有关【wnt信号通路、黏着连接、刺猬信号通路、范科尼贫血通路、产生iga的肠道免疫网络、p53信号通路】。
[0133]
对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多kegg通路和go条目与生物合成和能量代谢相关,包括nad生物合成过程、nad代谢过程、有机物代谢过程、叶酸合成等途径。wn主产于云贵高原乌蒙山脉东延部威宁等地区,属贵州高原的高寒山区,寒冷会引起机体通过多组织、多通路共同调节来提高冷应激下的代谢效率和能量转换以维持体温,因此推测富集到与能量代谢途径相关的正选择基因能够帮助wn适应当地高寒的气候环境。wn是以抗寒性强和耐粗饲著称的地方鸡种,这意味着这些正选择基因可能是人们在驯化wn过程中提升其能量代谢御寒和耐粗饲环境的关键因素,因此这些富集条目中的关键基因值得重点关注。叶酸是动物生长发育不可缺少的营养素,其通过参与动物遗传物质和蛋白质代谢,提升动物机体免疫力以达到促进动物生长的作用。此外,叶酸生物合成途径已被证实与动物的高原适应性相关。nad是脱氢酶的辅酶,在糖酵解、糖异生和三羧酸循环等能量代谢途径中发挥着不可替代的作用。nad能结合中间产物脱下的氢形成nadh,进一步在呼吸链中通过化学渗透偶联的方式合成atp,为机体供能。动物体内的有机物代谢主要分
为糖类代谢、蛋白质代谢和脂类代谢,不仅能为机体合成生命所必需的酶、激素、氨基酸等物质,还能产生大量的能量保障生命活动正常运转,wn发生选择性清除的基因有20个落在该通路中。此外,研究表明在寒冷环境下增加动物血液血氧运输能力能显著提高其脂质代谢能力,进而提高动物的代谢效率和能量转换以抵抗寒冷应激。wn的选择性消除所筛选的正选择基因被发现在血管平滑肌收缩途径的富集,为wn寒冷环境适应性进化的遗传机理提供了新见解。该通路的富集也为wn的高原适应性提供了初步的遗传学证据。此外,大量正选择基因被发现富集在抗病免疫性能相关通路中,包括wnt信号通路、黏着连接、刺猬信号通路、范科尼贫血通路、产生iga的肠道免疫网络、p53信号通路、dna保护等,这些候选基因不仅很好的解释了wn极强的抗逆抗病性,还从另一个角度揭示了其优异的耐粗饲和抗寒等环境适应性的潜在遗传机理。值得关注的是,产生iga的肠道免疫网络这一途径是wn有别于其他贵州地方品种所富集的免疫抗病性相关通路。肠道不仅仅是动物的消化器官,还是机体最大的免疫器官,在维持机体健康方面发挥着重要的免疫作用。此外,肠道免疫在机体抵抗冷应激方面也发挥这重要的调节作用。同样,在wn的富集结果中,也发现正选择基因富集在神经系统发育相关的通路中,包括磷脂酰丝氨酸代谢过程、磷脂酰丝氨酸生物合成过程等途径,这些途径都是改善神经细胞功能,调节神经脉冲的传导,增进大脑记忆功能以及增加脑部供血。这些结果进一步说明wn的神经系统在人工选择过程中受到强烈的选择而发生快速的进化。
[0134]
3.2.7兴义矮脚鸡(xy)驯化过程中选择性清除信号分析
[0135]
选取fst结合θπ(fst》0.16和θπ(rjf/cs)≥0.21为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1333、2705和3412个正选择基因,其中1689个基因至少在两种方法中受到选择,425个基因在这四种方法彼此重叠(图10)。
[0136]
选取xy在四种受选择方法中共同筛选出的425个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有29个,部分极显著(p《0.01)富集的go条目共有9个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:dna保护(go:0042262);肽聚糖周转(go:0009254)。细胞成分注释(go_cc)中极显著富集的go条目包括:复制叉结构(go:0005657)、dna复制因子c复合物(go:0005663)。分子功能注释(go_mf)中极显著富集的go条目包括:nad+核苷酶活性(go:0003953);d-阿拉伯糖基-1,4-内酯氧化酶活性(go:0003885)、氧化还原酶活性,作用于供体的ch-oh基团,氧作为受体(go:0016899);dna钳装载器活性(go:0003689);蛋白质dna负载与atp酶活性(go:0033170)。
[0137]
kegg富集分析中显著富集(p《0.05)的条目共有11个,部分极显著(p《0.01)富集的kegg条目共有3个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与氨基酸合成和糖脂能量代谢相关【戊糖和葡萄糖醛酸的相互转化、糖酵解/糖异生、甘油酯代谢、脂肪酸生物合成、缬氨酸、亮氨酸和异亮氨酸降解】,与抗病免疫有关【wnt信号通路、mapk信号通路、沙门氏菌感染】、与核苷酸有关【非同源末端连接、rna转运】、以及与细胞运输有关【囊泡运输中的snare蛋白交流】。
[0138]
xy原产于喀斯特地区兴义市,该地是贵州喀斯特高原向广西喀斯特丘陵的过渡带,地势以山地和丘陵为主,因此xy多散养于房屋四周坡林地。此外,因地理位置的限制,旱
地作物较多,农户多以淀粉含量较高的玉米、豆薯类及小麦等农家饲料饲喂xy,除此之外xy在散养过程中多食用虫蚁、嫩草、草籽等天然动植物饲料。在xy的选择性清除基因的富集分析中,发现了一系列与糖代谢有关的基因和富集条目,包括戊糖和葡萄糖醛酸的相互转化、糖酵解/糖异生等途径,可能与xy在驯化过程中适应高淀粉食物有关。这些通路中所富集的基因akr1a1是醛酮还原酶(akr)超家族的成员,其所编码的醇醛酮还原酶1以nadph依赖的方式催化各种醛还原为相应的醇,保护细胞免受氧化应激损伤;此外,该酶在葡萄糖以及醇醛代谢中发挥重要的调节作用。
[0139]
在xy群体中通过四种方法筛选的正选择基因的富集结果中,许多kegg通路和go条目与生物合成与脂质代谢相关,包括甘油酯代谢、脂肪酸生物合成等途径。脂质合成和代谢状态是决定家禽产蛋性能至关重要的因素。肉品质的嫩度和风味同样受到脂肪含量的影响,与动物脂质代谢状态密切相关。在贵州地方鸡种中,xy是以产蛋性能良好、肉质细嫩、味道鲜美著称的地方品种,提示这些正选择基因与xy良好的产蛋性能和较佳的肉品质有关,因此这些富集条目中的关键基因值得重点关注。此外,糖脂能量代谢过程是维持机体生长发育及各种生命活动不可或缺的。xy散养于山林坡地,日常活动较多,能量消耗较大,这意味着这些富集在糖脂能量代谢的正选择基因可能是人们在驯化xy过程中提升运动能力的关键因素。除此之外,对四种方法共同筛选到的正选择基因进行功能聚类分析时,许多kegg通路和go条目被发现与抗病免疫性能相关,包括wnt信号通路、mapk信号通路、沙门氏菌感染、dna保护等相关途径,这些基因对我们解析xy较强的环境适应性和较佳的抗逆抗病性的遗传机制奠定了理论基础。mapk信号通路是动物机体内调节各种细胞活动的重要应激信号通路,参与调控多种生理活动,如炎症、凋亡、癌化、肿瘤细胞的侵袭和转移等,xy发生选择性清除的基因有4个落在该通路中。值得关注的是,沙门氏菌感染这一途径是xy有别于其他贵州地方品种所富集的免疫抗病性相关通路。xy在驯化过程中多散养在农户房屋周围的山林坡地,自然环境与人类社会环境的混杂导致环境卫生不洁净,增加了鸡感染沙门氏菌的机率,因此该通路中富集的候选基因可能参与了xy在驯化过程中对沙门氏菌的抗病性。
[0140]
3.2.8瑶山鸡(ys)驯化过程中选择性清除信号分析
[0141]
选取fst结合θπ(fst》0.16和θπ(rjf/cs)≥0.21为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1279、2497和3475个正选择基因,其中1446个基因至少在两种方法中受到选择,389个基因在这四种方法彼此重叠(图11)。
[0142]
选取ys在四种受选择方法中共同筛选出的389个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有39个,部分极显著(p《0.01)富集的go条目共有8个,go富集最显著的30个go term如图3所示。生物过程注释(go_bp)中极显著富集的go条目包括:脂质定位(go:0010876);钙离子转运(go:0006816)。细胞成分注释(go_cc)中极显著富集的go条目包括:蛋白质-脂质复合物(go:0032994)、血浆脂蛋白颗粒(go:0034358)、乳糜微粒(go:0042627)。分子功能注释(go_mf)中极显著富集的go条目包括:atp酶抑制剂活性(go:0042030)、钙通道调节活性(go:0005246)、通道调节器活动(go:0016247)。kegg富集分析中显著富集(p《0.05)的条目共有7个,部分极显著(p《0.01)富集的kegg条目共有3个,kegg富集最显著的20个条目如图4所示。这些显著富集kegg通路代表的主要生物学功能主要分为与脂质合成相关【脂肪酸生物合成】,与抗病免疫有关【范科尼贫
血通路、肌动蛋白细胞骨架的调节、foxo信号通路】,与核苷酸有关【同源重组、真核生物中的核糖体生物发生】,以及与基础生理过程有关【钙信号通路】。
[0143]
在ys群体中通过四种方法筛选的正选择基因的富集结果中,有许多kegg通路和go条目与钙信号通路相关,包括钙信号通路、钙离子转运、钙通道调节活性等通路和功能。钙离子通路参与机体各项生理活动,包括骨骼形成、肌肉收缩(心肌、骨骼肌、血管平滑肌)、神经传到及大脑思维活动等,在维持机体运动机能,促进骨骼生长发育发挥重要作用。ys产区地处贵州高原南部边坡向广西丘陵盆地的过渡地带,产区瑶寨居民居住分散,房前屋后的树林草地可供放牧养鸡,因此ys在驯化过程中多散养为主,且ys以胫高体大,骨骼粗壮著称,这意味着这些富集条目中的候选基因可能是人们在驯化ys过程中提升运动机能和骨骼发育的关键因素。此外,许多正选择基因富集到脂肪合成和转运相关的途径中,包括脂肪酸生物合成、蛋白质-脂质复合物、血浆脂蛋白颗粒、乳糜微粒等,脂类物质不仅是促进鸡只生长发育良好能源供给,还是维持鸡只产蛋性能的重要物质。此外,鸡肉品质也受到脂肪含量的影响。因此,这些正选择基因可能与ys相对于红原鸡生长速度加快、生产性能提升以及肉质细嫩鲜美有关。同时,大量正选择基因被发现富集在抗病免疫性能相关通路中,包括范科尼贫血通路、肌动蛋白细胞骨架的调节、foxo信号通路等,这些候选基因揭示了ys优异的耐粗饲性以及极强的环境适应性的潜在遗传机理。foxo信号通路在基因的转录中起到了重要的作用从而介导细胞的多种过程,包括dna损伤修复、凋亡、葡萄糖代谢、细胞周期和肿瘤形成,ys发生选择性清除的基因有2个落在该通路中。近些年研究表明,肌动蛋白细胞骨架重构除了与细胞迁移、胞质分裂、囊泡运输等多个过程密切相关,也与多种免疫细胞(包括t细胞、b细胞、巨噬细胞等)的功能密切相关。肌动蛋白细胞骨架重构可参与免疫突触的形成和t细胞发育成熟,从而影响t细胞功能;也可通过调节bcr信号和抗原内化提呈影响b细胞功能;还对巨噬细胞的趋化作用和吞噬作用也有一定的影响。ys发生选择性清除的基因有6个落在该通路中。
[0144]
4结论
[0145]
综上所述,本实施例利用全基因组选择性扫描分析方法在贵州地方鸡种中筛选到大量正选择基因,这些基因及所富集的功能条目都与目标品种生物学特性相对应,例如抗逆抗病性强、高原适应性强、耐粗饲、肉质细嫩等特性,为解析贵州地方品种鸡独特种质特性形成的分子遗传基础提供了初步的遗传学证据,也为今后优质地方鸡品种的分子改良和遗传育种提供理论参考。本发明不限定于只针对贵州地方鸡种,其它区域地方鸡种同样可以采用本发明的技术方案展开研究,这里仅仅作为代表性案例。
[0146]
实施例2
[0147]
全基因组选择消除分析鉴定鸡种重要经济性状相关候选基因
[0148]
1试验材料
[0149]
实施例1中贵州8个地方鸡种(cs、cswg、pd、qd、wm、wn、xy和ys)、1个商业蛋鸡(shxy)、1个商业肉鸡(tf)及红原鸡基因组数据。
[0150]
2试验方法
[0151]
2.1全基因组选择性消除分析
[0152]
2.1.1选择性消除分析
[0153]
基于前述步骤所获得的snp数据信息,本研究进一步采用基于不同算法的4种选择
性消除分析方法(fst、π-ratio、xp-clr和xp-ehh),按照不同的分群方法对群体基因组数据进行两两比较,筛选受选择信号,具体的分群信息如下表5。基于滑动窗口的策略以40kb的滑动窗口,10kb重叠窗口计算fst和π值,再计算得到各分群方式的πradio。根据sabeti提出的公式进行xp-ehh的计算。xp-clr的计算根据说明进行。随后通过获取πradio+fst、xp-clr及xp-ehh的离群值来识别选择信号。以πradio+fst大于阈值(top 5%)、xp-clr大于阈值(top 5%)和xp-ehh大于阈值(top 5%)的重叠区域作为受选择基因的候选区域。
[0154]
表5选择性消除分析分群信息表
[0155][0156]
注:cs长顺绿壳蛋鸡,cswg赤水乌骨鸡,pd普定高脚鸡,qd黔东南小香鸡,wm乌蒙乌骨鸡,wn威宁鸡,xy兴义矮脚鸡,ys瑶山鸡,shxy商业蛋鸡,tf天府肉鸡,rjf红原鸡。
[0157]
2.1.2功能富集分析
[0158]
将检测到的受选择区域内的基因作为候选基因进行功能富集分析。以ensemble数据库中鸡的所有基因作为背景基因集,利用david(http://david.abcc.ncifcrf.gov/)对获得的候选基因进行go富集分析和kegg通路分析。利用q值(false discovery rate)对p值进行校正,只有q≤0.05的go生物学过程(go-bp)、分子功能(go-mf)、细胞成分(go-cc)和kegg通路才认为显著富集的,以进一步了解候选基因的功能方向。
[0159]
3试验结果
[0160]
3.1全基因组选择性消除鉴定产蛋性状相关受选择基因
[0161]
我们将商品蛋鸡(shxy)作为目标群体,将贵州8个地方鸡种整体作为参考群体,采用四种不同的选择性消除分析方法(fst、π-ratio、xp-clr和xp-ehh)按照进行基因组比较,以挖掘控制产蛋性状的潜在候选基因。选取fst结合θπ(fst》0.15和θπ(其他/蛋鸡)≥0.84为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1369、3868和3445个正选择基因,其中1553个基因至少在两种方法中受到选择,435个基因在这四种方法彼此重叠(图12)。
[0162]
选取在四种受选择方法中共同筛选出的与鸡产蛋性能相关的435个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有102个,部分极显著(p《0.01)富集的go条目共有31个,go富集最显著的30个go term如图13所示。生物过程注释(go_bp)中极显著富集的go条目包括:细胞碳水化合物代谢过程(go:0044262)、细胞多糖生物合成过程(go:0033692)、多糖生物合成过程(go:0000271)、细胞碳水化合物生物合成过程(go:0034637)、细胞多糖代谢过程(go:0044264)、醛酸代谢过程(go:0019520)、半乳糖酸代谢过程(go:0019583)、半乳糖酸分解代谢过程(go:0019584)、d-半乳酸代谢过程(go:0034192)、d-半乳酸分解代谢过程(go:0034194)、醛酸分解代谢过程(go:0046176);翻译起始(go:0006413)、翻译起始的(负)调节(go:0006446、0045947)、翻译的负调控(go:0017148)、细胞蛋白质代谢过程的负调控(go:0032269)、蛋白质代谢过程的负调控(go:
0051248)、翻译规范(go:0006417),几丁质代谢过程(go:0006030)、含葡萄糖胺化合物代谢过程(go:1901071)、几丁质生物合成过程(go:0006031)、氨基糖生物合成过程(go:0046349)、含氨基葡萄糖化合物生物合成工艺(go:1901073)。分子功能注释(go_mf)中极显著富集的go条目包括:翻译起始因子结合(go:0031369)、真核启动因子4e结合(go:0008190);转移酶活性,转移糖基(go:0031369)、udp糖基转移酶活性(go:0008194)、转移酶活性,转移己糖基(go:0016758);转移酶活性(go:0016740);n-琥珀酰精氨酸二氢酶活性(go:0009015);2-脱氢-3-脱氧半乳糖激酶活性(go:0008671)。
[0163]
kegg富集分析中显著富集(p《0.05)的条目共有7个,部分极显著(p《0.01)富集的kegg条目共有4个,kegg富集最显著的20个条目如图14所示。这些显著富集kegg通路代表的主要生物学功能主要分为与抗病免疫有关【mapk信号通路、肌动蛋白细胞骨架的调节、范科尼贫血通路、vegf信号通路】,与核苷酸有关【非同源末端连接、同源重组】,糖脂能量代谢【脂肪细胞因子信号通路】。
[0164]
产蛋性状作为鸡最重要的经济性状之一,受到了研究人员和养鸡人群长期以来的广泛关注,通过长期的选育及先进育种方法的运用,目前专门化的蛋鸡品系的产蛋量得到了大幅提升。本实施例研究统计了所有10个鸡品种的生产性能,shxy是经过人工选育而来的专门化蛋鸡品系,因此在本实施例的研究中,我们将其他地方品种作为参考群体,将shxy作为目标群体,通过基因组选择性清除分析挖掘与蛋鸡产蛋性状相关的遗传机理,旨在为高产蛋鸡的分子选育提供候选靶点。对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多kegg通路和go条目与糖脂碳水化合物能量代谢有关,包括脂肪细胞因子信号通路、细胞碳水化合物代谢过程、细胞多糖生物合成过程、多糖生物合成过程、细胞碳水化合物生物合成过程、细胞多糖代谢过程、醛酸代谢过程、半乳糖酸代谢过程、半乳糖酸分解代谢过程、d-半乳酸代谢过程、d-半乳酸分解代谢过程、醛酸分解代谢等过程。蛋鸡的产蛋过程需要大量的能量,充足的能量是保障产蛋性能的关键要素之一。在动物体内,能量的转换与物质的代谢密不可分,动物只有通过降解碳水化合物、脂肪和蛋白质这三大养分才能获得能量,并且只有利用这些能量才能实现包括生长、生产在内的一切生命活动。碳水化合物除了直接氧化供能外,也可以转化为糖原和脂肪,用于其他物质合成;鸡蛋蛋黄中脂类物质占30%,脂质合成和代谢状态是决定家禽产蛋性能至关重要的因素。因此,这些糖脂碳水化合物能量代谢富集条目中的候选基因可能是人们在选育shxy过程中提升产蛋性能的关键因素。
[0165]
值得一提的是,大量正选择基因被发现富集在与免疫物质的合成相关的途径,包括几丁质代谢过程、含葡萄糖胺化合物代谢过程、几丁质生物合成过程、氨基糖生物合成过程、含氨基葡萄糖化合物生物合成工艺等途径,这些发现反映了蛋鸡在人工选育过程中生产性能与免疫性能之间的权衡。氨基葡萄糖能促进软骨的合成、抑制关节软骨分解、刺激软骨细胞生长、抗炎症、抗氧化的作用,同时氨糖参与多种生物活性物质的合成,具有激活免疫反应,增强机体免疫力的功能。蛋鸡饲养于鸡笼中,狭小的空间导致其腿部和骨骼疾病多发,在氨基糖生物合成过程中富集的正选择基因可能是shxy在选育过程中提升骨头耐力和免疫性能的关键因素。几丁质是广泛存在于自然界的一种含氮多糖类生物性高分子化合物,具有提高机体免疫力、增强机体消化吸收能力和促进胆固醇转化预防心脑血管疾病等作用。蛋鸡多饲养于鸡笼中,属静态饲养,且为了保证其产蛋性能多饲喂高蛋白高能日粮,
导致蛋鸡易患脂质代谢异常相关疾病,因此在几丁质生物合成过程中富集的正选择基因可能是shxy在选育过程中增加机体对脂质代谢异常疾病耐受的关键因素。
[0166]
3.2全基因组选择性消除鉴定生长性状相关受选择基因
[0167]
我们将商品肉鸡(tf)作为目标群体,将贵州7个兼用型地方鸡种整体作为参考群体,采用四种不同的选择性消除分析方法(fst、π-ratio、xp-clr和xp-ehh)按照进行基因组比较,以挖掘控制产蛋性状的潜在候选基因。选取fst结合θπ(fst》0.06和θπ(其他/肉鸡)≥0.34为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到941、2739和3326个正选择基因,其中1271个基因至少在两种方法中受到选择,324个基因在这四种方法彼此重叠(图15)。
[0168]
选取在四种受选择方法中共同筛选出的与鸡产肉性能相关的324个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有66个,部分极显著(p《0.01)富集的go条目共有19个,go富集最显著的30个go term如图13所示。生物过程注释(go_bp)中极显著富集的go条目包括:基因表达的正调控(go:0010628)、转录的正调控,dna依赖(go:0045893)、含核碱化合物代谢过程的正调控(go:0045935)、氮化合物代谢过程的正调控(go:0051173)、rna代谢过程的正调控(go:0051254)、生物合成过程的正调控(go:0009891)、大分子生物合成过程的正调控(go:0010557)、细胞生物合成过程的正调控(go:0031328)、代谢过程的积极调节(go:0009893)、细胞代谢过程的正调控(go:0031325);精氨酸生物合成过程(go:0006526);rna聚合酶ii启动子转录的正调控(go:0045944)、大分子代谢过程的正调控(go:0010604)。细胞成分注释(go_cc)中极显著富集的go条目包括:电压门控钾通道复合体(go:0008076)、钾通道复合体(go:0034705);核体(go:0016604)、核斑点(go:0016607)。分子功能注释(go_mf)中极显著富集的go条目包括:精氨琥珀酸合酶活性(go:0004055)、甲酸四氢叶酸连接酶活性(go:0004329)。
[0169]
kegg富集分析中显著富集(p《0.05)的条目共有10个,部分极显著(p《0.01)富集的kegg条目共有5个,kegg富集最显著的20个条目如图14所示。这些显著富集kegg通路代表的主要生物学功能主要分为与抗病免疫有关【凋亡、紧密连接、非同源末端连接】,与生长代谢有关【泛素介导的蛋白水解、硒化合物代谢、孕酮介导的卵母细胞成熟、糖胺聚糖生物合成-硫酸软骨素/硫酸皮肤素、糖胺聚糖生物合成-硫酸肝素/肝素】、以及与细胞通讯有关【缝隙连接、囊泡运输中的snare蛋白交流】。
[0170]
鸡作为最受大众喜爱的肉类来源,其生长速度和体重是日常生活中最受关注的经济性状。培育生长速度快、体型大的品种是生产和品种培育的目标。生长属于复杂的性状,由许多基因控制。tf是经过人工选育而来的专门化肉鸡配套系,因此在本实施例的研究中,我们将7个兼用型地方品种作为参考群体,将tf作为目标群体,通过基因组选择性清除分析挖掘与肉鸡生长性能相关的遗传机理,旨在为高产肉鸡的分子选育提供候选靶点。对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多kegg通路和go条目与生长代谢有关,包括硒化合物代谢、孕酮介导的卵母细胞成熟、糖胺聚糖生物合成-硫酸软骨素/硫酸皮肤素、糖胺聚糖生物合成-硫酸肝素/肝素、生物合成过程的正调控、大分子生物合成过程的正调控、细胞生物合成过程、精氨酸生物合成过程等过程。动物生长发育是一个复杂的生命过程,受到许多基因和通路的共同调控,整个过程中机体会将所消化吸收的营养成分转换成能量及中间产物,同时合成大量生长所需的物质,因此机体生物合成的功能对其生长
发育至关重要,这意味着这些通路中富集的基因可能是人们在选育tf过程中提升生长性能的关键因素。
[0171]
硫酸软骨素是一种由身体自然形成的糖胺聚糖,具有促进软骨生长、保护软骨及修复软骨的作用。肉鸡生长相对缓慢的骨骼和内脏器官与生长较快的肌肉组织间的反差,造成家禽整体与组织间生长发育的不均衡进而引发一系列腿部疾病问题。研究表明肉鸡快速生长与腿病特别是胫骨软骨发育不良的发生密切相关。糖胺聚糖生物合成-硫酸软骨素/硫酸皮肤素通路是kegg富集中最显著的条目,该通路中富集的基因可能是人们在选育肉鸡过程中平衡快速生长与骨骼发育的关键因素。值得一提的是,精氨酸是肉鸡必需氨基酸,在肉鸡的生长发育过程中发挥着多种作用,包括提高生产性能、促进生长激素分泌、促进骨骼发育以及调节细胞免疫及体液免疫功能等。
[0172]
3.3全基因组选择性消除鉴定体型大小相关受选择基因
[0173]
我们将拥有最大体型的贵州鸡种普定高脚鸡(pd)作为目标群体,将拥有匀称娇小体型的贵州鸡种兴义矮脚鸡(xy)和黔东南小香鸡(qd)作为参考群体,采用四种不同的选择性消除分析方法(fst、π-ratio、xp-clr和xp-ehh)按照进行基因组比较,以挖掘控制体型的潜在候选基因。选取fst结合θπ(fst》0.08和θπ(大/小)≥0.18为筛选标准)、xp-clr和xp-ehh分析中选择信号前5%的基因组窗口作为正选择区域,分别注释到1233、2694和3741个正选择基因,其中1424个基因至少在两种方法中受到选择,116个基因在这四种方法彼此重叠(图16)。
[0174]
选取在四种受选择方法中共同筛选出的与鸡体型相关的116个候选基因进行kegg通路和go富集分析。go富集分析中显著富集(p《0.05)的go条目共有60个,部分极显著(p《0.01)富集的go条目共有14个,go富集最显著的30个go term如图13所示。生物过程注释(go_bp)中极显著富集的go条目包括:磷脂酰丝氨酸代谢过程(go:0006658)、磷脂酰丝氨酸生物合成过程(go:0006659)、细胞氨基酸生物合成过程(go:0008652)、天冬酰胺代谢过程(go:0006528)、天冬酰胺生物合成过程(go:0006529)、有机酸生物合成过程(go:0016053)、羧酸生物合成过程(go:0046394)、小分子生物合成过程(go:0044283)、单生物生物合成过程(go:0044711)。分子功能注释(go_mf)中极显著富集的go条目包括:几丁质酶活性(go:0004568);天冬酰胺合酶(谷氨酰胺水解)活性(go:0004066)、以谷氨酰胺为氨基-n供体的碳氮连接酶活性(go:0016884);水解酶活性,水解o-糖基化合物(go:0004553),水解酶活性,作用于糖基键(go:0016798)。
[0175]
kegg富集分析中显著富集(p《0.05)的条目共有8个,部分极显著(p《0.01)富集的kegg条目共有4个,kegg富集最显著的20个条目如图14所示。这些显著富集kegg通路代表的主要生物学功能主要分为与抗病免疫有关【黏着连接、紧密连接、内吞作用、wnt信号通路、tgf-β信号通路】,蛋白质合成水解有关【泛素介导的蛋白水解、内质网中的蛋白质加工】,以及【神经活性配体-受体相互作用】。
[0176]
体型是家鸡最主要的经济性状之一,是一种复杂的多基因调控的性状。体型是体重和骨架的综合体现,对于蛋鸡,体型的大小与蛋鸡的生产性能密切相关,一般来说,体重在标准范围内,骨架大小适中方可称为理想体型,理想体型的鸡只会拥有最佳生产性能,而体型不合适则会给生产带来诸多不利;而对于肉鸡,培育出生长速度快、体型大的肉鸡品种是育种工作者所追求的目标。因此体型大小变化的遗传机制一直是研究者关注的热点。本
研究中,pd以体型大、胫长为特征,xy和qd均拥是小体型的鸡种,且xy的胫极短,表现为匍匐性状。因此在本实施例的研究中,我们将xy和qd作为参考群体,将pd作为目标群体,通过基因组选择性清除分析挖掘与肉鸡体型相关的遗传机理,旨在为今后的家鸡不同体型大小的品种培育和分子育种提供参考。对四种方法共同筛选到的正选择基因进行功能聚类分析时,有许多kegg通路和go条目与蛋白质合成、加工和代谢有关,包括泛素介导的蛋白水解、内质网中的蛋白质加工等途径,推测这些基因与pd更大的体型、更快的生长速度有关。泛素化是一类重要的蛋白质翻译后修饰,参与了体内多种生命活动。除此之外,很多正选择基因富集在氨基酸合成和代谢过程,包括磷脂酰丝氨酸代谢过程、磷脂酰丝氨酸生物合成过程、细胞氨基酸生物合成过程、天冬酰胺代谢过程、天冬酰胺生物合成过程、有机酸生物合成过程、羧酸生物合成过程等过程,这些通路都是维持机体生长发育不可或缺的。氨基酸是蛋白质组成的基本单位,是动物合成生长激素和自身组织的物质基础,在促进动物生长发育中发挥重要作用。不同的氨基酸具有不同的生理功能,包括促进神经系统发育、促进骨骼发育、促进组织愈合、提高免疫力、促进营养平衡等作用。因此这些正选择基因可能跟pd体型的增长与快速生长有关。
[0177]
值得一提的是,功能聚类分析发现正选择基因富集在tgf-β信号通路中。tgf-β信号通路是通过转化生长因子所介导的一系列信号传递过程,在细胞和组织的生长、发育、分化中起关键作用,对细胞的增殖、细胞间质产生、分化、凋亡,胚胎发育,器官的形成,免疫功能,炎性反应,创伤修复等都有重要的调节作用。
[0178]
4结论
[0179]
在本发明中,我们采用全基因组选择性扫描分析研究了现代鸡商业表型特征的遗传基础,筛选到了与产蛋性能、生长性能以及体型等重要性状相关的候选基因,这些功能基因的定位对加速鸡新品种育种进程、提高育种效率具有重要意义。
[0180]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
技术特征:
1.地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,包括如下步骤:步骤1,挑选不同种群的成年鸡只样本,对每只鸡只建立样本信息,并采集血样后保存备用;步骤2,将血样提取dna后进行全基因组重测序,测序深度10
×
以上,并对数据进行过滤;步骤3,将过滤后的重测序数据与鸡参考基因组进行比对及变异检测,获得snp数据信息;步骤4,将fst、π-ratio、xp-clr和xp-ehh这4种算法相结合,将获得的snp数据信息进行选择性消除分析,获得地方鸡种种质特性相关基因的候选区域;步骤5,将候选区域内的基因进行功能富集分析,结合不同品种的表型种质特性,获得不同种群种质特性相关的候选基因。2.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,成年鸡只日龄为300d以上。3.根据权利要求1或2所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,每个种群的鸡只数量不低于10只;更优选为30只,公母各半。4.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述样本信息包括:鸡种名称、产地、样本数量、品种分类、品系信息。5.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述步骤2中,数据过滤的方法包括:步骤2-1,过滤掉含有接头序列的reads;步骤2-2,判断单端测序read中n的含量是否超过该条read长度比例的10%,如果是,则去除此对paired reads;步骤2-3,判断单端测序read中含有的低质量(<=5)碱基数是否超过该条read长度比例的50%,如果是,则去除此对paired reads。6.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述步骤3中,将过滤后的重测序数据与鸡参考基因组进行比对及变异检测包括:步骤3-1,采用序列比对软件bwa的bwa-men算法将过滤后的重测序数据锚定在鸡参考基因组上,参数为:mem-t 10-k 32
–
m;步骤3-2,将比对上的映射读序的位置信息使用samtools去除重复及归类,记录到生成的bam文件中;参数为:rmdup;步骤3-3,利用samtools的index命令生成序列索引,并对序列索引中存在indels的区域进行局部调整。7.根据权利要求6所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述步骤3-3中,对序列索引中存在indels的区域进行局部调整,包括:步骤3-3-1,通过gatk4软件的realigner target creator算法来确定序列索引中存在indels的区域,再通过gatk4软件的indel realigner算法在这些区域内进行重新比对,最后输出一份重新对齐的bam文件中;步骤3-3-2,利用染色体顺序信息对重新对齐的bam文件进行排序,并对pcr扩增导致的冗余重复reads进行过滤,获得重新对齐的bam文件;
步骤3-3-3,结合使用samtools软件的pileup算法和bcftools软件的“bcftools call”命令共同检测鸡群体基因组中的单核苷酸多态性位点(snp),过滤存在分离偏差或测序错误的基因后,获得snp/indel数据集,过滤条件为:dp5-miss0.1-maf0.05;步骤3-3-4,利用annovar对snp/indel数据集进行比对和功能注释,然后将获得的snp信息输出到vcf格式中,比对到db snp数据库,鉴定新的snp。8.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述步骤4包括:步骤4-1,按照不同分群方式对群体基因组数据进行两两比较,筛选受选择信号;步骤4-2,根据滑动窗口策略,优选设定100kb滑动窗口以及50kb重叠窗口计算fst和π值,再计算得到各分群方式的πradio;步骤4-3,进行xp-ehh和xp-clr的计算。步骤4-4,通过获取的πradio+fst、xp-clr及xp-ehh的离群值来识别选择信号,以πradio+fst大于阈值(top 5%)、xp-clr大于阈值(top 5%)和xp-ehh大于阈值(top5%)的重叠区域作为受选择基因的候选区域。9.根据权利要求1所述的地方鸡种种质特性相关基因的分析及筛选方法,其特征在于,所述步骤5包括:以ensemble数据库中鸡的所有基因作为背景基因集,利用david对获得的候选基因进行go富集分析和kegg通路分析;优选地,利用q值(false discovery rate)对p值进行校正,q≤0.05的go生物学过程(go-bp)、分子功能(go-mf)、细胞成分(go-cc)和kegg通路定义为显著富集。
技术总结
本发明提供地方鸡种种质特性相关基因的分析及筛选方法,包括:挑选不同种群的成年鸡只样本,建立样本信息,并采集血样后保存备用;将血样提取DNA后进行全基因组重测序,并对数据进行过滤;将过滤后的重测序数据与鸡参考基因组进行比对及变异检测,获得SNP数据信息;将Fst、π-ratio、XP-CLR和XP-EHH这4种算法相结合,将获得的SNP数据信息进行选择性消除分析,获得种质特性相关基因的候选区域;将候选区域内的基因进行功能富集分析,结合不同品种的表型种质特性,获得不同种群种质特性相关的候选基因。本发明分析研究了现代鸡商业表型特征的遗传基础,筛选到了重要性状相关的候选基因,这些功能基因的定位对加速鸡新品种育种进程、提高育种效率具有重要意义。提高育种效率具有重要意义。提高育种效率具有重要意义。
技术研发人员:赵小玲 韩雪 徐丹 田尧夫 伍友豪 魏硕 伍革民 冯宇隆 苗小猛 李亮 唐继高 代国滔 舒刚
受保护的技术使用者:贵州宏宇畜牧技术发展有限公司 贵州省畜牧兽医研究所
技术研发日:2023.04.18
技术公布日:2023/8/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/