基于下一代测序数据红安格斯牛毛色和优良饲料转化率遗传基础
下面是小编为大家整理的基于下一代测序数据红安格斯牛毛色和优良饲料转化率遗传基础,供大家参考。
基于下一代测序数据的红安格斯牛毛色和优良饲料转化率的遗传基础
抽象 安格斯牛作为一种商业肉型品种,为全球畜牧业做出了卓越的贡献。一些证据支持不同毛色的安格斯牛具有不同的饲料与肉的比例,其毛色的遗传基础尚无定论。在这里,进行了全基因组关联研究,以研究黑安格斯牛和红安格斯牛的遗传差异,具有 63个公共基因组测序数据。使用一般线性模型分析来鉴定具有潜在候选变异/基因的基因组区域,这些变异/基因有助于毛色和饲料转化率。结果显示,六个单核苷酸多态性(SNP)和两个插入缺失,它们在五个基因(ZCCHC14,ANKRD11,FANCA,MC1R和 LOC532875 [AFG3 样蛋白 1])中注释,在黑色和红色安格斯牛之间显着分化。最强的相关位点,即 CHIR18_14705671 错义突变(c.296T > C)和移码突变 CHIR18_12999497(c.310G>-),位于 MC1R。在 FANCA 中也发现了三个连续的强相关性SNP,FANCA 广泛参与 Fanconi 贫血途径。几种高度相关的 SNP 在 ZCCHC14 和 ANKRD11 中显着富集,这与肌纤维生长和肌肉发育有关。本研究为在未来育种计划中使用潜在的遗传标记提供了基础,以改善牛在毛色和肉表型方面的选择。本研究也有助于了解不同毛色和肉类表型的遗传基础。然而,本研究中确定的假定候选基因或标记需要进一步研究,以确认其表型因果关系和潜在的有效遗传关系。
关键字:
全基因组关联研究; 安格斯牛; 色素沉着; 饲料转化率 1. 引言 安格斯牛于 1892 年被认证为古老的英国肉类品种之一,原产于苏格兰北部的阿伯丁。该品种具有许多出色的生产性能。其牛肉营养成分和肉质在高端牛肉市场占据不可替代的地位[1]。已经对 Angus 的肉质性状[2,3],繁殖力[4,5]和杂交利用[6]进行了许多研究。此外,安格斯毛色(红色和黑色)是一种可以在品种内直接观察到的表型[7]。研究表明,具有红色皮毛的安格斯牛比黑色安格斯牛具有更好的生产性能(例如,饲料与肉和瘦肉的比例)[8]。然而,直到现在,安格斯的毛色和经济性状的遗传基础仍然不清楚。
下一代测序(NGS)技术的出现已经证实了各种家畜中大量表型的分子基础[9]。虽然与安格斯牛的毛色和饲料转化率相关的遗传特征尚未见报道,但一系列基因和途径已在其他牛品种中得到广泛证实[10,11]。
在这项研究中,通过使用 NGS 数据集来研究具有不同皮毛颜色的安格斯牛的广泛基因组差异,以解释毛色的遗传基础,并帮助理解可能导致生产性能差异的遗传决定因素。
2. 材料和方法 通过先前的研究[12]获得的 63 头安格斯牛的公共测序数据,包括 21 头红安格斯牛和 42 头黑安格斯牛,是从国家生物技术信息中心(NCBI)序列读取档案数据库下载的(表 表 S1)。高质量读数(HQR)是通过过滤掉读取速度(开源代码和相应的说明可在 )[13]基于 自定义过滤器参数(切割窗口大小 4 切割平均质量 15-5 3-3 长度要求 40)产生。通过使用 Burrows-Wheeler Aligner(版本 v 0.7.15)(HQR 映射到牛(Bos taurus)基因组(ARS-UCD1.2),Picard(版本 v2.1.1,删除了潜在的重复。单核苷酸多态性(SNP)和插入缺失(InDels)由 GATK 单倍型呼叫者[15](版本 v4.1.9.0)和 ANNOVAR[16]进行鉴定和注释。最终的 VCF 文件是使用 vcftools(版本 v0.1.16)软件[17]获得的,该软件具有自定义过滤器参数(SNP:QD < 2.0,MQ <40.0,FS >60.0,SOR > 3.0,MQRankSum <−12.5,ReadPosRankSum < −8.0;Indel:
QD < 2.0, FS > 200.0, SOR > 10.0,
MQRankSum < −12.5, ReadPosRankSum < −8.0)。此外,SNP 和 InDel 数据集的数据质量控制由 PLINK(版本 v1.90b6.21,64 位,处理,并由呼叫率>90%和次要等位基因频率>0.99 的个体过滤。
毛色分为两类。红色和黑色外套分别为 1 和 2。对于全基因组关联研究(GWAS),SNP 和 InDel 数据集通过 PLINK [18](版本 v1.90b6.21,64 位)过滤,以排除 SNP 缺失和个体缺失>0.05 和最小等位基因频率≤0.01 的个体。采用 PLINK 方法,在一般线性模型中,采用卡方检验评估了用于关联分析的最终 SNP 和 InDel 数据集[19]。基因本体论(GO)和京都基因与基因组百科全书(KEGG)注释由 KOBAS 3.0 执行[20]。获得的 GO 术语是使用 Cytoscape 中的 ClueGO [21]插件可视化的 3. 结果和讨论 在进行 GWAS 之前,从 63 头安格斯牛的测序数据集中获得了 16,797,007 个 SNP 和 2,563,523 个 InDels。其中,GWAS 使用 PLINK 绘制安格斯牛的毛色轨迹进行过滤后,保留了 11,503,619 个 SNP 和 1,469,221 个 InDels(图 图 1)。8 个 SNP 超过 Bonferroni 显著阈值(p <4.3464 ×10 −9 ).其中,6 个 SNP 位于 4 个功能基因(ANKRD11、FANCA、MC1R、LOC532875(AFG3 样蛋白 1))的外显子或内含子中,2 个 SNP 分布在基因间序列中(表 表 S2)。此外,8 个 SNP 中有 3 个在 51 个 GO 项中得到丰富,42 个 GO 项得到显着丰富(校正 p<0.05)。其中七个 GO 术语与色素合成有关(表 表 S3)。KEGG结果(表 表 S4)显示,两个基因(FANCA 和 MC1R)在三个已知的单一途径(范可尼贫血(FA)途径,黑色素发生和神经活性配体 - 受体相互作用)中显着注释(校正 p<0.05)。校正 p = 5.461 的最强关联 (SAM)
× 10 −15 在 MC1R 的 CHIR18_14,705,671(c.296T>C)中鉴定出来。此外,分别位于 MC1R 和 ZCCHC14 中的两个 InDels(CHIR18_12999497 和CHIR18_14705684)超过了 Bonferroni 显着阈值(p <3.40316×10 −8 ).这些偶联基因在 13 个 GO 项和两个单一途径(黑色素发生和神经活性配体 - 受体相互作用表 表 S5 和 和 S6)中显着富集(校正 p<0.05)。
图 图 1.使用 PLINK 在安格斯牛中常染色体 SNP 的 GWAS。(A)
常染色体 SNP 的曼哈顿地块;(B)
部分 18 号染色体 SNP 的曼哈顿图(CHIR 18_10350193 至 CHIR 18_16664071);(C)
常染色体核糖核酸的 Q–Q 图;(D)MC1R SNP 的基因型频率(c.296T>C);和(E)ANKRD11,FANCA 和 MC1R 的 GO 项富集,作为使用 ClueGO 中的 Cytoscape 插件构建的交互网络。
先前的研究证实,MC1R 及其在编码序列区域中的变异对各种哺乳动物的毛色具有重要且决定性的影响[22]。例如,牛MC1R 中的 c.844C>A(p281T> N)可能导致黑色素合成中的苏氨酸羟基化,导致牛的毛色发红[23]。MC1R 的两种 SAM(c.296T>C 和 c.310G>-)已经在亚洲牛中发现[24]。c.296T > C 是导致亮氨酸 (E D -型)在第 99 个氨基酸残基处被脯氨酸(E 型)取代。此外,E +D - 型 MC1R 个体保持敏感并产生真黑素[25]。在本研究中,结果表明所有红色安格斯个体都是 E / E纯合子,并且 E ++D 黑安格斯在 c.296T>C 位点的基因频率为 0.9125(表 表 S7)。
随后,一系列研究表明,MC1R 蛋白的关键功能结构包括 7 个跨膜结构域(TMD)[26]。在本研究中,帧移突变 c.310G>-的基因频率具有可观察到的差异。例如,e 型红色安格斯的频率为 0.8824,E 型黑色安格斯的频率为 0.9268。这一结果与以往关于不同毛色奶牛 MC1R 变异的研究结果一致[27]。特别是,由于代码翻译的转变,c.310G>-的 e 基因型过早地产生了终止密码子,导致截断的 MC1R 蛋白只有两个 TMD(图 图 2)。巧合的是,一项研究表明,截短的 MC1R 蛋白作为非功能性或减弱的受体可以优先诱导 phomelanin 的产生并导致红色[26]。有证据表明,MC1R 中的氨基酸变异是人类红头发的重要遗传基础[28,29]。
图 图 2.使用 PLINK 在安格斯牛中常染色体 InDels 的 GWAS。(A)
曼哈顿常染色体 InDels 地块; (B)
部分 18 号染色体 InDels 的曼哈顿图(CHIR 18_1831698 至 CHIR 18_26780468);(C)常染色体 InDels 的 Q-Q 图;(四 四)基因型图 图 1。R InDels (c.310G >–);(E)
牛的 MC1R 蛋白和截断的 MC1R 蛋白结构域;(F)MC1R 和 ZCCHC14 作为交互网络的 GO 项富集与ClueGO 形成对比。
值得注意的是,三个连续的强相关性 SNP(CHIR18_14636355,CHIR18_14639215 和 CHIR18_14643255)被注释到FANCA , FANCA 在 FA 途径中得到了丰富。FANCA 突变最常见于 FA 患者[30,31],它们是 FA 的重要病因之一。突变体可以减少呼吸复合物 I-III 和活性氧解毒酶之间的电子转移[32]并损害线粒体自噬[33]。其临床特征包括先天性畸形和色素沉着过度[34,35]。先前的一项研究表明,FANCA 蛋白可能在调节 FA 通路中的 DNA 损伤修复系统中发挥作用[36]。一些研究证实,FAP不能处理 DNA 复制干扰中的 DNA 损伤,DNA 损伤的皮肤角质形成细胞分泌的 α-黑素细胞刺激素(α-MSH)与 MC1R 相互作用,增强黑素细胞的核苷酸切除修复[37]。此外,一些报告表明,由于 α-MSH 的功能调控,DNA 损伤与黑色素生成之间存在相关性[38]。
随后,之前的一项研究指出,红安格斯牛比黑安格斯具有更好的获得饲料转化率,红牛被分配到加拿大生产类别 1(≥59%瘦肉),而黑牛具有更高的背部脂肪厚度[8]。在本研究中, 在 LOC532875 中发现的显着 SNP(CHIR18_14759471)可能与红安格斯的出色生产性能有关。AFG3 作为 LOC532875 的同系物和 AAA 蛋白家族亚家族的成员,在线粒体代谢(MM)和氧化磷酸化(MOP)中起重要作用[39,40]。大量证据表明,MM 和 MOP 在肌肉和脂肪发育中起作用[41,42]。特别是,一项研究表明,肉质家禽比蛋类家禽具有更高的饲料效率和更快的生长,因为肉鸡的骨骼肌线粒体比蛋鸡表现出更高的氧化磷酸化效率[43]。
此外,在 ZCCHC14 和 ANKRD11 中分别注释了超过阈值的两个重要 SNP(CHIR18_12999497 和 CHIR18_14389309)。一些研究确定,肌强直性营养不良的一个病因是 CCHC 型锌指核酸结合蛋白[44 ,45,46,47]。一系列广泛证实的肌肉发育基因(例如 , FHL3、MYOG、BAG3、SMAD3 和 HIF1AN)[48],其作为成人肌纤维生长和肌肉干细胞稳态的重要调节因子的MYOG 与 ZCCHC14 相互作用[49]。ANKRD11 在 KBP 综合征中起重要作用[50]。它与一系列肌肉发育相关基因(例如 HDAC3 、HDAC4、SRC、ARRB2 和 APEX1)相互作用[51,52]。
它们参与骨骼系统发育[53],平滑肌细胞迁移的负调节[54]和心肌细胞分化的阳性调节[55]。巧合的是,尽管没有直接证据表明 ZCCHC14/ANKRD11 与 MOP 有关,但大量被证明与这些基因相互作用的基因(例如 MYOD、SQSTM1 和 KRAS)在氧化磷酸化方面显示出积极的调控[56,57]].因此,这些基因不仅可能与安格斯牛肌肉表型的发育有关,而且通过参与氧化磷酸化过程影响饲料转化率。
最后,另一个位于LRRC30和LOC781276之间基因间区域的显着发散的SNP(CHIR24_40137470)不应被忽视。LRRC26作为 LRRC 的家族成员,与大钾(BK)α 亚基有关。LRRC26 可以增加通道电压和表观 Ca 2+ 动脉肌肉细胞对诱导血管舒张并维持肌肉细胞中功能性 BK 通道 γ 亚基的表达的敏感性[58,59]。此外,LOC781276 作为富含丝氨酸/精氨酸的剪接因子 12(SRSF12)假基因引起了我们的注意。SRSF12 参与 mRNA 选择性剪接和剪接体三 snRNP 复合物组装的调控[60,61]。许多研究阐明,关键基因的选择性 RNA 剪接对色素沉着[62]和肌肉发育具有不可替代的贡献[63,64]。
4. 结论 家畜的毛色和饲料转化率/瘦肉比是具有复杂分子基础的表型。在这项研究中,一系列 SNP 和 InDels 在红色和黑色 Angus之间强烈分化,如 GWAS 方法鉴定的那样。这项研究可以帮助进一步了解这些表型的遗传基础,并支持使用可用的分子标记来改善养牛业