海洋所构建完成长牡蛎染色体水平基因组和变异图谱
近日,由中科院海洋所张国范研究组独立完成的论文“Construction of a chromosome-level genome and variation map for the Pacific oyster Crassostrea gigas(长牡蛎染色体水平基因组和变异图谱构建)”在国际学术期刊Molecular Ecology Resources(《分子生态资源》)在线发表。该研究首次构建了长牡蛎染色体水平基因组和贝类中第一张包含SNP、INDEL和CNV的综合序列变异图谱,发现长牡蛎基因组中存在高比例的长片段重复序列,CNV结构变异可导致个体间平均21%的区域差异,更新了长牡蛎基因组资源和对基因组复杂性的认知。
长牡蛎(Crassostrea gigas),俗称太平洋牡蛎,是世界重要的养殖贝类,具有重要的经济和生态价值。张国范研究组长期从事贝类养殖和育种相关工作,并一直致力于牡蛎基因资源挖掘和分子育种研究。2012年在Nature发表的牡蛎第一张基因组图谱得到广泛应用,引领并开启了水产物种基因组学相关研究。张国范研究组之后一直对牡蛎基因资源进行维护和更新。随着新一代测序技术的普及和对长牡蛎染色体水平基因组需求的增加,研究组于2019年正式启动长牡蛎染色体水平基因组构建工作。
本研究利用高覆盖第三代测序(PacBio,~200×)结合HIC技术,并利用遗传连锁图谱进行辅助,对一个中国青岛的长牡蛎进行从头组装,获得基因组总长度为587M,包含10条染色体水平scaffold序列,ContigN50达到3.1M,ScaffoldN50达到60M,组装完整性和连续性均有较大提高。发现基因组中高比例的长片段重复在基因进化中发挥了重要作用,同时也是导致之前基于二代测序技术组装的长牡蛎基因组碎片化的主要原因。基于495个野生长牡蛎的重测序数据分析,构建了长牡蛎综合变异图谱,包含480万个高质量SNP,60万个INDEL和4.9万个CNV。这些新的数据资源对牡蛎比较基因组学、分子育种和适应进化等研究具有重要意义。美国南加州大学Dennis Hedgecock教授团队成员Xiaoshen Yin博士对该基因组进行了分析,发现和连锁图谱一致性达到90%以上,明显的组装错误不到0.1%,肯定了其较高的组装质量(Yin et al, 2020)。
长牡蛎基因组序列图谱
长牡蛎基因组变异图谱
本研究得到国家自然科学基金、山东省科技创新重大专项、中科院海洋大科学研究中心重点部署项目、国家贝类产业技术体系专项基金等资助。中科院海洋所高性能计算中心对部分生物信息分析提供了技术支持。亓海刚副研究员为论文第一作者,李莉研究员和张国范研究员为通讯作者。
论文链接:onlinelibrary.wiley.com/doi/abs/10.1111/1755-0998.13368。
附件下载:
古镇口园区地址:青岛市西海岸新区海军路88号 南海路园区地址:青岛市市南区南海路7号 科考船码头基地:青岛市西海岸新区长江东路8号 |
邮编:266000 邮件:iocas@qdio.ac.cn 电话:0532-82898611 传真:0532-82898612 |