全球鸡基因字典首批成果发布!华大智造工具助力全球首个10万规模鸡参考面板项目
来源:华大智造 2025-04-24 16:26
本研究构建了全球首个鸡类参考基因组资源库,整合了来自全球多个品种/品系的11,951个鸡基因组样本,涵盖全球主要商品鸡与地方鸡种群。
“从AI大模型的角度来说,基因组也是一门语言,它本身就非常符合文本类型语言化的特征。因此,我们想用AI的深度学习与大语言模型的方法,把基因组作为一门语言来进行深入的研究。把鸡的基因组弄明白后,对我们理解人类和其他动物的疾病等现象都是有帮助的,这是我们全球鸡基因字典这个项目希望实现的意义。”
——中国农业大学 胡晓湘教授
填补空白
全球首个10万规模鸡参考面板项目
在群体基因组研究中,构建一个高质量、代表性强的参考基因组面板(reference panel)是提升基因型填充精度的关键。牛和猪等经济动物已分别建立标准化参考资源,有效推动了数量性状位点(QTL)解析和候选基因识别的进展。相比之下,作为全球饲养量最大的家禽——鸡,此前尚缺乏一套覆盖广泛、样本充足、可支持多场景应用的高质量参考面板。
为填补这一空白,研究团队发起并构建了全球首个10万规模鸡参考面板项目——100K GCRP(Global Chicken Reference Panel)。第一阶段成果于2025年4月15日,在Genomics, Proteomics & Bioinformatics杂志在线发表,题为“GCRP: Integrated Global Chicken Reference Panel from 11,951 Chicken Genomes” 。该研究由中国农业大学胡晓湘和王宇哲团队牵头,联合国内外多个单位合作完成,第一阶段成果构建了全球首个鸡类参考基因组资源库,有望为鸡种遗传变异图谱构建、人工选择研究和精准育种提供基础支撑。
在此项研究中,华大智造DNBSEQ-T7基因测序平台以及MGISP-960高通量自动化样本制备系统、MGISTP-7000分杯处理系统为项目组提供了从样本处理到基因测序的系统支持。畜禽全基因组选择通常面临着样本量巨大、成本要求苛刻等问题,华大智造一站式解决平台的业务模式恰好能够解决这一难题,华大智造超高通量基因测序仪匹配自动化产线,一方面能够在样本处理和建库通量上实现高通量、高效率、低成本,另一方面也大大降低了时间成本,进一步匹配畜禽育种的产业需求。
第一阶段成果发布
构建全球首个鸡类参考基因组资源库
鸡的驯化历史可追溯至约8000年前,起源于分布在南亚和东南亚的原鸡(Gallus gallus)。原鸡不仅是首个完成全基因组测序的鸟类,也是最早被解码的脊椎动物基因组之一。目前,公共变异数据库(如 dbSNP v106)已收录约2343万个单核苷酸多态性位点(SNP)和240万个短插入/缺失变异(InDel),为鸡的基因组关联分析(GWAS)和功能基因挖掘提供了重要基础。
随着低深度测序(LCS)技术的发展,研究者得以在控制成本的同时实现大规模样本测序,弥补传统SNP芯片信息覆盖不足的局限,为基因组选择与精细化变异定位提供了新可能。
第一阶段成果采用低深度测序获得了 10,104 份商品鸡样本,此外搜集了1847个高深度测序样本,构建了两个高质量子面板(CBP 与 CMP),系统评估了不同策略下的基因型填充性能,并在模拟与真实性状中展示了其在 GWAS 和因果变异定位中的优势。该资源库有望为鸡种遗传变异图谱构建、人工选择研究和精准育种提供基础支撑。
图示:全球10万规模鸡基因型参考面板GCRP
以下是研究成果的相关总结:
01 构建全球首个鸡类参考基因组资源库
本研究构建了全球首个鸡类参考基因组资源库,整合了来自全球多个品种/品系的11,951个鸡基因组样本,涵盖全球主要商品鸡与地方鸡种群,识别了超过48M个SNP以及4.7M个InDel突变,其中新发现突变占比高达67.6%,显著扩展了现有变异数据库的覆盖范围。
02 构建两个高质量子面板
依据群体特征构建了两个高质量子面板:CBP(Commercial Breed Panel):基于10,104只商品鸡的低深度测序数据;CMP(Comprehensive Mix Panel):基于1847个深度测序样本,聚焦地方鸡种与遗传多样性。两者可分别支持商业育种与基础研究应用,提供灵活的参考选择。
03 优越的基因型填充性能
通过系统评估显示:GCRP在8种典型场景下均表现出优越的基因型填充性能,其中CMP面板在6种场景中表现最优,填充准确性显著高于现有发布的鸡参考面板资源(如AGIDB和 SNPAtlas等)。
04 GCRP填充数据有效提升了统计效能
在模拟和真实性状的GWAS 分析中,GCRP填充数据有效提升了统计效能:检测到的关联信号更集中,显著位点更靠近已知功能区域或候选基因,支持更高精度的因果变异定位。
05构建并上线了开放共享的 GCRP 数据平台
构建并上线了开放共享的 GCRP 数据平台,集成变异浏览、在线填充和文件下载三大模块,支持全球研究者开展多样化的鸡类基因组分析任务,并为后续多组学整合分析的基因组面板奠定基础。(数据库链接:http://farmrefpanel.com/GCRP)
中国农业大学胡晓湘教授表示,最初应用低深度重测序技术时采用了进口测序平台,但经过测序实测数据的对比,华大智造测序仪的数据准确性和数据质量与进口仪器相当,并且华大智造测序仪的Duplication rate(重复序列率)明显低于进口平台,这将有助于得到更多的有效数据用于后续分析。
不仅如此,华大智造测序平台以更低成本能够释放更多测序潜力,成本与效率的“双突破”成为其在2018年切换为华大智造测序平台的重要初衷。大设施遗传系统已经形成了应用低深度重测序技术年处理100万样本的规模。华大智造不仅提供测序仪器,还提供一系列自动化设备配套,实现从提取建库到测序的全产业链闭环的生态系统。未来,还将依托于华大智造测序平台将这一技术推广到主要的猪鸡等经济动物家禽的育种企业。
此前,中国农业大学国家模式动物科学中心于去年10月与华大智造达成战略合作,共建国家模式动物科学中心DCS Lab,入驻包括华大智造高通量基因测序仪DNBSEQ-T7、全自动MGISTP-7000分杯处理系统、高通量自动化样本制备系统MGISP-960、全自动核酸提取纯化仪MGISP-NE384等多个平台及设备,搭建从提取建库到测序的完善系统平台,为猪模型在异种器官移植、人类疾病模型和生物育种等领域发展持续贡献力量。
鸡是目前世界上数量最多的鸟类,也是全球饲养量最大的家禽。基于中国农业大学在模式动物表型与遗传研究领域拥有的学术积累和基础设施,胡晓湘教授主导的全球鸡基因字典项目工作徐徐展开,将基于华大智造DNBSEQ-T7及T1+建立高通量测序技术平台,执行百万级样本的重测序任务,为商业化肉鸡群体的遗传选育、GWAS研究提供重要科研支撑。
中国农业大学王宇哲博士为本文的通讯作者,胡晓湘教授为本文最后作者。博士生朱迪以及博士后王宇占为本文的共同第一作者。中国农业大学赵毅强,广东省农科院动物科学研究所舒鼎铭、瞿浩,东北农业大学李辉、张慧,南京农业大学冯春刚,华中农业大学盛哲雅,山东农业大学姜运良,温氏南方家禽育种公司徐振强、张德祥、姜自琴,石家庄畜牧技术推广站褚素乔,奥胡斯大学房灵昭为本文共同作者。本研究得到了国家自然科学基金 (32272862)、国家重点研发计划(2021YFD1300100)以及中国农业大学“2115人才发展计划”的资助支持。
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
