科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布
人类的基因组常被比作是一本书写生命的“天书”,只有A、T、C、G四种“字母”——代表构成DNA的四种碱基,但字数多达60亿个,分布在23对染色体中,无穷的组合蕴含着人类进化、生老病死的无数奥秘 。
_本文原题是:新的里程碑!新的里程碑!《科学》封面重磅:迄今最完整的人类基因组测序结果公布
21世纪之初,人类基因组序列的第一版草图问世,尽管并不完整,却已经在生物医学领域产生了深远的影响,为临床研究、药物开发和医疗实践的发展提供指引 。
时隔二十一年,人类基因组测序领域迎来了新的里程碑:一份更完整的、无间隙的人类参考基因组 。
本周,《科学》杂志同时上线的6篇论文中,一个名为“端粒到端粒”联盟(T2T)的国际科研团队宣布完成了最新的人类参考基因组(被命名为T2T-CHM13),包括所有22条常染色体和X染色体的无缝组装 。其序列包含30.55亿对碱基,不仅在过去的基础上增加了近 2亿碱基的遗传信息——相当于一条人类染色体包含的信息,还纠正了过往基因组序列上的许多错误,并解锁了人类基因组中结构最为复杂的一些区域 。
文章图片
填补最后8%的空白
由于当时的测序技术所限,第一版人类基因组测序草图中留有许多空白 。2013年完成的新版本并经过2019年的更新后,人类基因组测序结果中仍有数百万个碱基由字母“N”表示,代表着该位置的实际碱基未知 。更重要的是,占人类基因组大约8%的生物学重要区域处于未探明的状态 。
为了填补最后的空白,来自几十个研究机构的近100名科学家组成了大型团队“T2T联盟”,也就是对每条染色体从一端的端粒到另一端的端粒进行测序 。随着此次研究成果的集中发表,用团队领导人之一、华盛顿大学Evan Eichler教授的话说,我们在生命天书中“读到了以前从未读过的章节” 。
文章图片
▲相比先前的人类参考基因组(GRCh38),此次的新版本T2T-CHM13填补了所有原先的空白,在过去未解决的基因组区域内,每个样本中发现了数十万个变异,为理解进化和生物医学新发现提供机会(图片来源:参考资料[2])
读取基因组时,科学家首先将所有DNA切成数百到数千个字母长的片段,由测序机器读取每个片段中的字母,然后科学家们试图以正确的顺序组装片段,就像玩一个超级复杂的拼图 。
这个过程中的一大挑战是,基因组中的某些区域由大段重复字母组成,就像拼图中有些板块由看起来一样的碎片组成,而这些区域往往具有重要的生物学特征,某些情况下还与人类疾病有关 。另一个难点是,绝大多数细胞内包含两套基因组,分别来自父亲和母亲 。当研究人员试图组装DNA片段时,两套基因组的序列混合在一起,就掩盖了两者本身具有的差异 。
文章图片
研究团队找到了一种只含单个基因组的细胞系来消除上述等位基因多样性的问题 。这种特殊的细胞系来自所谓的葡萄胎,是一种异常胚胎,受精后仅保留一个亲本的基因组副本 。
攻克难关的关键进展还离不开测序技术的重大飞跃 。基于具有革命性突破的长读长测序技术,研究者可以解码更长的序列,甚至一次准确读取多达百万级的碱基对也不成问题 。
解锁最复杂的区域
- 人物|两位诺奖得主 给“太上老君托梦”的天价白酒当首席科学家
- 科学探索|科学家研发毫米级机器人 可实现人体内靶向给药
- 科学探索|野生蝙蝠被发现可在4年后识别跟食物奖励相关的铃声
- 科学探索|盘点大自然6种能使身体部位再生的动物
- 科学探索|中国空间站的光学舱:巡天空间望远镜预计2024年投入科学运行
- 科学探索|科学家发现了本质上不会衰老的物种
- 科学探索|问天实验舱器箭组合体今天进行垂直转运
- 科学探索|新研究揭示了大象是如何避免癌症的
- 科学探索|一种新开发的抗生素被发现可以杀死耐药性细菌
- 科学探索|增材纺织法造出人工心室模型
