科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布( 二 )


此次解锁的新序列大约90%来自染色体的着丝粒 。在形成精子或卵子的减数分裂过程中,着丝粒是成对染色体分离时附着的地方 。这个区域结构独特,包含长段重复序列,而且DNA和蛋白质似乎在这一区域缠绕得格外紧凑 。
在T2T提供完整序列后,人类第一次有机会对着丝粒及其周围序列的作用一探究竟 。
根据他们的分析,着丝粒以及附近区域有各种序列堆叠现象,通常是一段新序列覆盖在旧序列上 。这一过程可以保证着丝粒与关键的动粒结构紧紧结合 。动粒是着丝粒两侧的特化结构,参与染色体的移动过程 。

科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布
文章图片

▲着丝粒是一个包含高度重复 DNA 序列的区域,比较这些序列揭示了突变在数百万年中积累的位置,反映了每个重复序列的相对年龄(图片来源:参考资料[4];Credit:Nicolas Altemose, UC Berkeley)
旧序列会存在一些随机突变和缺失,说明这一段区域已经被弃用;新序列中突变和甲基化都更少,说明正在被使用 。而着丝粒中含有大量重复长度的DNA序列,大约为171个碱基,这些重复单元会共同形成更大的重复结构并串联多次,构成了着丝粒中的重复序列区域 。
着丝粒的重复序列在不同人之间同样会存在差异 。其中一篇论文比较了全世界1600人的着丝粒序列后发现,非洲大陆以外的人,着丝粒(尤其是X染色体上的着丝粒)倾向于分成两大簇,还有一些有意思的突变会出现在有非洲人血统的人身上 。未来,科学家或许能通过解析着丝粒序列来追溯人类的谱系,对人类的演化史探索有重要意义 。

科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布
文章图片

最后得到完整测序的区域
在此次发表的一系列成果中,研究人员着重分析了基因组中的重复片段在人类演化、遗传多样性的形成以及疾病中的重要作用 。
重复片段(segmental duplication)是基因组中反复出现的、序列相似性超过90%以上的大段序列 。无论是物种内还是物种之间的演化过程中,大多数的遗传变异都出现在重复片段区域,这里是产生新基因和新基因功能发生适应性变化的关键 。但由于结构的复杂性,这里也是人类基因组中最后得到完整测序的区域 。

科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布
文章图片

【科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布】现在,基于最新的完整人类基因组测序结果,科学家终于能够以更综合的视角审视人类的重复片段 。在这类区域,科学家找到了182个全新的蛋白质编码基因,并且帮助我们理解一系列重要的演化与医学难题 。
例如,比较人类与其他灵长类动物的测序结果,研究发现了与人类前额叶皮层扩张相关的基因TBC1D3,这将有助于重现古人类演化的历史 。而在不同人类个体间,在重复片段区域编码脂蛋白的LPA基因,其数量与心血管疾病风险高度相关……
基于这项研究,我们能够全面理解重复片段的组织、表达与调控,并提升基因注释与基因分型 。

科学探索|《科学》封面重磅:迄今最完整的人类基因组测序结果公布
文章图片

在另一项研究中,康涅狄格大学Rachel O‘Neill教授领导的团队揭示了重复序列的转录与表观遗传状态 。重复序列包含移动遗传元件,它们可以移动至基因组的其他区域 。研究指出,一些多次重复的片段所包含的基因,能在很大程度上解释人类的遗传多样性 。