科学探索|麻省理工学院的生物学家对重复的蛋白质序列有了新的认识

计算分析显示,许多重复序列在不同的蛋白质中是共享的,并且在从细菌到人类的物种中是相似的 。大约70%的人类蛋白质包括至少一个由单一氨基酸重复多次组成的序列,其中还夹杂着一些其他氨基酸 。这些"低复杂性区域"(LCRs)也存在于大多数其他生物体的蛋白质中 。
科学探索|麻省理工学院的生物学家对重复的蛋白质序列有了新的认识
文章图片

尽管包含这些序列的蛋白质有许多不同的功能,但麻省理工学院的生物学家们现在已经想出了一种方法,将它们作为一个统一的群体进行识别和分析 。他们的技术使他们能够检查来自不同物种的LCRs之间的相似性和差异,并帮助他们解决这些序列的功能和它们所处的蛋白质 。
利用他们的技术,科学家们分析了在八个不同物种中发现的所有蛋白质,从细菌到人类 。他们发现,虽然LCRs在不同的蛋白质和物种之间可能有所不同,但它们往往有一个类似的作用--帮助发现它们的蛋白质加入一个更大规模的组件,如核仁,一个在几乎所有人类细胞中发现的细胞器 。
麻省理工学院的一名研究生Byron Lee说:"我们没有研究特定的LCR和它们的功能,因为它们参与了不同的过程,所以看起来是分开的,而我们更广泛的方法使我们能够看到它们的特性之间的相似性,这表明也许LCR的功能毕竟不是那么悬殊的 。"
研究小组还发现了不同物种的LCRs之间的差异 。他们表明,这些特定物种的LCR序列对应于特定物种的功能,如形成植物细胞壁 。
Lee和研究生Nima Jaberi-Lashkari是这项研究的主要作者,该研究最近发表在《eLife》杂志上 。麻省理工学院生物学助理教授Eliezer Calo是该论文的资深作者 。
科学探索|麻省理工学院的生物学家对重复的蛋白质序列有了新的认识
文章图片

通过计算分析,研究人员发现许多重复序列在整个蛋白质中是共享的,并且在从细菌到人类的物种中是相似的 。资料来源:研究人员提供
大规模的研究
先前的研究显示,LCRs参与了多种细胞过程,包括细胞粘附和DNA结合 。这些LCRs通常富含一个氨基酸,如丙氨酸、赖氨酸或谷氨酸 。
找到这些序列,然后单独研究它们的功能是一个耗时的过程,因此科学家们决定使用生物信息学--一种使用计算方法来分析大量生物数据集的方法--将它们作为一个更大的群体来评估 。
生物信息学是一门相对较新的科学分支学科,它将生物学和计算机科学的元素结合在一起,目的是开发高效和强大的方法来分析和解释大量的生物数据,如DNA、RNA和氨基酸序列或关于这些序列的注释 。
Jaberi-Lashkari说:"我们想做的是退一步,不看单个的LCR,而是试着看一下所有的LCR,看看我们是否能在更大的范围内观察到一些模式,这可能有助于我们弄清楚那些被分配了功能的LCR在做什么,也有助于我们了解那些没有被分配功能的LCR在做什么 。"
为了做到这一点,麻省理工学院的团队使用了一种叫做点阵图的技术(见页面顶部的图片),这是一种直观地表示氨基酸序列的方法,以生成研究中的每个蛋白质的图像 。接下来,他们使用计算图像处理方法来同时比较数以千计的这些矩阵 。
利用这种技术,研究人员能够根据哪些氨基酸在LCR中最频繁地重复而对LCR进行分类 。他们还根据蛋白质中发现的每种LCR类型的拷贝数对含有LCR的蛋白质进行分组 。分析这些特征有助于研究人员更多地了解这些LCRs的功能 。
作为一个示范,研究小组挑出了一个人类蛋白质,称为RPA43,它有三个富含赖氨酸的LCR 。这种蛋白质是构成一种叫做RNA聚合酶1的酶的许多亚单位之一,该酶合成核糖体RNA 。科学家们发现,富含赖氨酸的LCR的拷贝数对于帮助该蛋白整合到核小体(负责合成核糖体的细胞器)非常重要 。