Science综述详解!利用计算分子物理学模拟蛋白行为,有助于遏制新冠疫情
来源:本站原创 2020-12-09 13:06
2020年12月9日讯/生物谷BIOON/---在过去的50年里,我们已经了解了很多关于蛋白的秘密生活---它们是如何发挥作用的,它们与什么相互作用,让它们发挥作用的机制是什么,此外,取得新发现的速度正在加快。第一个三维蛋白结构在20世纪70年代开始出现。如今,蛋白数据库(Protein Data Bank)是一个全球大生物分子三维结构的信息库,拥有数十万种
2020年12月9日讯/生物谷BIOON/---在过去的50年里,我们已经了解了很多关于蛋白的秘密行为---它们是如何发挥作用的,它们与什么相互作用,让它们发挥作用的机制是什么,此外,取得新发现的速度正在加快。
第一个三维蛋白结构在20世纪70年代开始出现。如今,蛋白数据库(Protein Data Bank)是一个全球大生物分子三维结构的信息库,拥有数十万种蛋白的信息。就在本周,DeepMind公司以其准确的、人工智能(AI)驱动的蛋白结构预测震惊了蛋白结构界。
不过,美国石溪大学物理与定量生物学中心主任Ken Dill说,三维结构往往不足以真正了解一种蛋白的情况,“这就像有人问汽车是如何工作的,机械师打开汽车的引擎盖说,‘看,这就是发动机,这就是它的工作原理’。”
在此后的几十年里,计算机模拟通过设置这些三维分子机器的运动,建立并增加了对蛋白行为的理解。分析它们的能量景观、相互作用和动力学,让我们对生命的这些主要推动者有了更多的了解。
Dill说,“我们真正想问的是:它是如何工作的?而不仅仅是它看起来如何?这就是为什么你首先想知道蛋白结构的本质,而它最大的应用之一就是用于药物发现。”
2020年11月,Dill和他的同事Carlos Simmerling和Emiliano Brini在Science期刊上发表了一篇综述文章,分享了他们对该领域发展的看法。文章标题为“Protein storytelling through physics”。
他们写道,“计算分子物理学是一个越来越强大的工具,用于描述蛋白分子作用的行为。力场的系统改进、增强的采样方法和加速器已经让[计算分子物理学]达到捕捉重要生物行为的时间尺度…以这样的速度,在下一个四分之一个世纪,我们将会描述在细菌细胞长几十分钟的生命周期中的蛋白分子行为。”
加速模拟
然而,在第一批蛋白动态模型诞生几十年后,计算生物物理学家仍然面临着重大挑战。模拟要有用,就必须准确;而为了确保准确,模拟需要一个原子一个原子、一个飞秒(10-12秒)一个飞秒地进行。为了与重要的时间尺度相匹配,模拟必须延长到微秒或毫秒---也就是数百万个时间步长。
他说,“相对而言,计算分子物理学的发展速度很快,但还不足以让我们进入我们需要观察到的时间、大小和运动范围。”
科学家们用这种方式来理解蛋白的主要方法之一叫做分子动力学。自2015年以来,在美国国立卫生研究院和国家科学基金会的支持下,Dill和他的团队一直致力于加快分子动力学模拟。他们的称为MELD的方法通过提供有关被研究系统的模糊但重要的信息来加速这一过程。
Dill将这种方法比作寻宝。他们并没有要求别人找到可能在任何地方保存的宝藏,而是提供一张带有线索的地图,说,‘它要么在芝加哥附近,要么在爱达荷州’。在实际的蛋白中,这可能意味着指示模拟氨基酸链的一部分靠近该链的另一部分。这种搜索领域的缩小可以大大加快模拟速度--有时会快1000多倍--从而实现新颖的研究并提供新的见解。
SARS-CoV-2蛋白结构预测
生物物理模型在我们日常生活中最重要的应用之一是药物的发现和开发。病毒或细菌的三维模型有助于识别它们防御中的弱点,而分子动力学模拟则可以确定哪些小分子可能会结合入侵者,并使得这些入侵者的运作陷入瘫痪。
Dill团队在白宫组织的COVID-19 HPC联盟的支持下,参与了一系列寻找COVID-19药物和治疗方法的工作,该联盟是美国联邦政府、行业界和学术界领袖之间的努力,旨在提供世界上最强大的高性能计算资源,以支持COVID-19研究。
Dill回忆说,“每个人都放下了其他事情来研究COVID-19。”Dill团队迈出的第一步是利用MELD确定冠状病毒SARS-CoV-2未知蛋白的三维形状。到目前为止,这种病毒的29种蛋白中只有3种得到了明确的解析。他说,“大多数结构都不知道,这对药物发现来说不是一个好的开始。我们能预测这些未知的结构吗?这就是我们使用Frontera的主要目的。”
位于德克萨斯高级计算中心(Texas Advanced Computing Center)的Frontera超级计算机---世界上所有大学中计算最快的---允许Dill和他的团队对另外19种蛋白进行结构预测。这19种蛋白中的每一种都可以为新药开发提供新的途径。他们已经公开了他们的结构预测,并正在与其他团队合作,通过实验测试其准确性。
虽然疫苗竞赛似乎已经接近宣布获胜者,但是第一轮的疫苗、药物和治疗只是复苏的起点。和HIV一样,第一批研发的药物很可能不会对所有的人都有效,或者在未来会被更有效、副作用更小的药物所超越。Dill团队正在进行长期研究,希望找到比已经开发的药物更有前景的靶点和机制。
药物重新利用和探索新方法
Dill团队的第二个项目是与石溪大学的Dima Kozakov团队合作,利用Frontera扫描数百万种市售小分子对COVID-19的功效。
他说,“通过关注市售分子的重新利用,原则上可以缩短寻找新药的时间。Kozakov团队有能力快速筛选数千种分子,以便找出最好的一百种。我们利用我们的物理学建模来进一步过滤这个候选分子池,以缩小实验人员需要测试的分子数目。”
第三个项目正在研究一种有趣的称为PROTAC的细胞蛋白,它能引导人体细胞的“垃圾收集蛋白(trash collector protein)”拾取它们通常不会清除的特定目标蛋白。
他解释说,“我们的细胞有聪明的方法来识别需要被破坏的蛋白。PROTAC靠近将要被破坏的蛋白,给后者贴上标签,然后这些负责收集垃圾的蛋白会把它带走。最初,PROTAC分子被用于靶向癌症相关蛋白。如今有一种将这一概念转移到针对SARS-CoV-2蛋白的推动力。”
通过与石溪大学化学家Peter Tonge合作,他们正在努力模拟PROTAC与SARS-CoV-2病毒之间的相互作用。他说,“这些是我们最雄心勃勃的模拟,无论是从我们正在处理的系统的大小还是从化学复杂性来看。Frontera是为我们提供足够的周转时间的关键资源。对于一种模拟,我们需要30个GPU和4到5天的连续计算。”
Dill团队正在非COVID-19测试系统上开发和测试他们的方案,以便对他们的预测进行基准测试。一旦他们确定了一种方案,他们将把这个设计程序应用到COVID-19测试系统上。
每一种蛋白都有独特的行为,而Dill、Brini和他们的合作者正在构建和应用有助于阐明这些行为的工具。Dill总结道,“在蛋白科学中存在一些问题,在这些问题中,我们相信真正的挑战是把物理学和数学搞清楚。我们正在测试关于COVID-19的假设。”(生物谷 Bioon.com)
参考资料:
1.Emiliano Brini et al. Protein storytelling through physics. Science, 2020, doi:10.1126/science.aaz3041.
2.Protein storytelling to address the pandemic
https://phys.org/news/2020-12-protein-storytelling-pandemic.html
第一个三维蛋白结构在20世纪70年代开始出现。如今,蛋白数据库(Protein Data Bank)是一个全球大生物分子三维结构的信息库,拥有数十万种蛋白的信息。就在本周,DeepMind公司以其准确的、人工智能(AI)驱动的蛋白结构预测震惊了蛋白结构界。
不过,美国石溪大学物理与定量生物学中心主任Ken Dill说,三维结构往往不足以真正了解一种蛋白的情况,“这就像有人问汽车是如何工作的,机械师打开汽车的引擎盖说,‘看,这就是发动机,这就是它的工作原理’。”
在此后的几十年里,计算机模拟通过设置这些三维分子机器的运动,建立并增加了对蛋白行为的理解。分析它们的能量景观、相互作用和动力学,让我们对生命的这些主要推动者有了更多的了解。
Dill说,“我们真正想问的是:它是如何工作的?而不仅仅是它看起来如何?这就是为什么你首先想知道蛋白结构的本质,而它最大的应用之一就是用于药物发现。”
2020年11月,Dill和他的同事Carlos Simmerling和Emiliano Brini在Science期刊上发表了一篇综述文章,分享了他们对该领域发展的看法。文章标题为“Protein storytelling through physics”。
图片来自Science, 2020, doi:10.1126/science.aaz3041。
他们写道,“计算分子物理学是一个越来越强大的工具,用于描述蛋白分子作用的行为。力场的系统改进、增强的采样方法和加速器已经让[计算分子物理学]达到捕捉重要生物行为的时间尺度…以这样的速度,在下一个四分之一个世纪,我们将会描述在细菌细胞长几十分钟的生命周期中的蛋白分子行为。”
加速模拟
然而,在第一批蛋白动态模型诞生几十年后,计算生物物理学家仍然面临着重大挑战。模拟要有用,就必须准确;而为了确保准确,模拟需要一个原子一个原子、一个飞秒(10-12秒)一个飞秒地进行。为了与重要的时间尺度相匹配,模拟必须延长到微秒或毫秒---也就是数百万个时间步长。
他说,“相对而言,计算分子物理学的发展速度很快,但还不足以让我们进入我们需要观察到的时间、大小和运动范围。”
科学家们用这种方式来理解蛋白的主要方法之一叫做分子动力学。自2015年以来,在美国国立卫生研究院和国家科学基金会的支持下,Dill和他的团队一直致力于加快分子动力学模拟。他们的称为MELD的方法通过提供有关被研究系统的模糊但重要的信息来加速这一过程。
Dill将这种方法比作寻宝。他们并没有要求别人找到可能在任何地方保存的宝藏,而是提供一张带有线索的地图,说,‘它要么在芝加哥附近,要么在爱达荷州’。在实际的蛋白中,这可能意味着指示模拟氨基酸链的一部分靠近该链的另一部分。这种搜索领域的缩小可以大大加快模拟速度--有时会快1000多倍--从而实现新颖的研究并提供新的见解。
SARS-CoV-2蛋白结构预测
生物物理模型在我们日常生活中最重要的应用之一是药物的发现和开发。病毒或细菌的三维模型有助于识别它们防御中的弱点,而分子动力学模拟则可以确定哪些小分子可能会结合入侵者,并使得这些入侵者的运作陷入瘫痪。
Dill团队在白宫组织的COVID-19 HPC联盟的支持下,参与了一系列寻找COVID-19药物和治疗方法的工作,该联盟是美国联邦政府、行业界和学术界领袖之间的努力,旨在提供世界上最强大的高性能计算资源,以支持COVID-19研究。
Dill回忆说,“每个人都放下了其他事情来研究COVID-19。”Dill团队迈出的第一步是利用MELD确定冠状病毒SARS-CoV-2未知蛋白的三维形状。到目前为止,这种病毒的29种蛋白中只有3种得到了明确的解析。他说,“大多数结构都不知道,这对药物发现来说不是一个好的开始。我们能预测这些未知的结构吗?这就是我们使用Frontera的主要目的。”
位于德克萨斯高级计算中心(Texas Advanced Computing Center)的Frontera超级计算机---世界上所有大学中计算最快的---允许Dill和他的团队对另外19种蛋白进行结构预测。这19种蛋白中的每一种都可以为新药开发提供新的途径。他们已经公开了他们的结构预测,并正在与其他团队合作,通过实验测试其准确性。
虽然疫苗竞赛似乎已经接近宣布获胜者,但是第一轮的疫苗、药物和治疗只是复苏的起点。和HIV一样,第一批研发的药物很可能不会对所有的人都有效,或者在未来会被更有效、副作用更小的药物所超越。Dill团队正在进行长期研究,希望找到比已经开发的药物更有前景的靶点和机制。
药物重新利用和探索新方法
Dill团队的第二个项目是与石溪大学的Dima Kozakov团队合作,利用Frontera扫描数百万种市售小分子对COVID-19的功效。
他说,“通过关注市售分子的重新利用,原则上可以缩短寻找新药的时间。Kozakov团队有能力快速筛选数千种分子,以便找出最好的一百种。我们利用我们的物理学建模来进一步过滤这个候选分子池,以缩小实验人员需要测试的分子数目。”
第三个项目正在研究一种有趣的称为PROTAC的细胞蛋白,它能引导人体细胞的“垃圾收集蛋白(trash collector protein)”拾取它们通常不会清除的特定目标蛋白。
他解释说,“我们的细胞有聪明的方法来识别需要被破坏的蛋白。PROTAC靠近将要被破坏的蛋白,给后者贴上标签,然后这些负责收集垃圾的蛋白会把它带走。最初,PROTAC分子被用于靶向癌症相关蛋白。如今有一种将这一概念转移到针对SARS-CoV-2蛋白的推动力。”
通过与石溪大学化学家Peter Tonge合作,他们正在努力模拟PROTAC与SARS-CoV-2病毒之间的相互作用。他说,“这些是我们最雄心勃勃的模拟,无论是从我们正在处理的系统的大小还是从化学复杂性来看。Frontera是为我们提供足够的周转时间的关键资源。对于一种模拟,我们需要30个GPU和4到5天的连续计算。”
Dill团队正在非COVID-19测试系统上开发和测试他们的方案,以便对他们的预测进行基准测试。一旦他们确定了一种方案,他们将把这个设计程序应用到COVID-19测试系统上。
每一种蛋白都有独特的行为,而Dill、Brini和他们的合作者正在构建和应用有助于阐明这些行为的工具。Dill总结道,“在蛋白科学中存在一些问题,在这些问题中,我们相信真正的挑战是把物理学和数学搞清楚。我们正在测试关于COVID-19的假设。”(生物谷 Bioon.com)
参考资料:
1.Emiliano Brini et al. Protein storytelling through physics. Science, 2020, doi:10.1126/science.aaz3041.
2.Protein storytelling to address the pandemic
https://phys.org/news/2020-12-protein-storytelling-pandemic.html
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->