对25,000多个原子进行纳秒级MD模拟,DeepMind开发基于ML的大规模分子模拟通用方法

编辑 | 萝卜皮

深入了解复杂的过程是分子动力学(MD)模拟可以做到的,但准确的MD模拟需要昂贵的量子力学计算。对于较大的系统,使用高效但不太可靠的经验力场。机器学习力场(MLFF)提供与从头计算方法相当的精度,速度更快更高效,但难以模拟大分子中的长程相互作用。

Google DeepMind、柏林工业大学(Technische Universität Berlin)和卢森堡大学(University of Luxembourg)的研究人员提出了一种通用方法 GEMS,通过对「自下而上」和「自上而下」分子片段进行训练,来构建用于大规模分子模拟的准确 MLFF。

GEMS 允许以从头计算级别的质量,对超过25,000个原子进行纳米级MD模拟,正确预测聚丙烯酸丙酯中不同螺旋基序之间的动态振动,并与溶剂化Crambin 中大规模蛋白质-水波动的太赫兹光谱产生良好的一致性。该团队分析表明,从头开始精度的模拟对于理解动态生物分子过程是必要的。

研究以「Biomolecular dynamics with machine-learned quantum-mechanical force fields trained on diverse chemical fragments」为题,于 2024 年 4 月 5 日发布在《Science Advances》。

分子动力学(MD)模拟通过计算化学和生物过程中单个原子的运动,为理解分子属相和功能提供了解释。

然而,由于精确求解多体薛定谔方程的难度,目前仅适用于短期内少量原子的模拟,而近似的经验力场(FF)则因其计算效率而广泛应用于较大系统的模拟。

在需要额外准确性和灵活性的情况下,量子力学/分子力学(QM/MM)模拟提供了一种替代方案,即将系统分为用量子力学方法建模的小QM区域和用经典力学描述的大MM区域。

近年来,机器学习力场(MLFF)作为一种新的 MD 模拟手段出现,它结合了传统 FF 的计算效率和量子化学方法的高精度,通过在从头算参考数据上训练机器学习模型来预测能量和力,无需显式求解薛定谔方程。

虽然在小到中等规模系统的模拟中,MLFF 取得了成功,但构建适用于大型异质系统(如蛋白质或其他生物相关系统)的 MLFF 仍面临挑战。

图示:GEMS 模拟的解释。(来源:论文)

在最新的工作中,Google DeepMind 和卢森堡大学的研究人员提出了一种为大规模分子模拟构建精确 MLFF 的通用方法,称为 GEMS。

基于分而治之的原则,大型异质系统的 MLFF 在不同大小的分子片段上进行训练,这些分子片段仍然适合电子结构计算。这些碎片并不构成更大系统的分区;相反,它们可以是重叠的部分,甚至只是在结构上与原始系统相关。

在评估 MLFF 时,不会直接使用这些片段,而是仅在训练过程中使用,从而了解较大系统中存在的相关物理化学相互作用。

根据这些片段数据(包括水或溶剂分子),ML 模型推断重组原始系统,并能够预测完整的势能表面(PES),包括与溶剂的相互作用,这使得 GEMS 能够成功解决从头开始质量生物分子模拟的长期挑战。因此,GEMS 指的是使用以这种方式构建的 MLFF 运行分子模拟的一般原理。

图示:GEMS 方法概述。(来源:论文)

虽然 MLFF 可以成功地从小分子中学习局部化学相互作用,但需要足够数量的较大片段来学习推广到更大系统所需的远程效应,并相对于从头开始的基本事实实现高预测精度(能量为 0.450 meV/atom,力为 36.704 meV/Å)。

在这里,科学家依赖于最近提出的 SpookyNet 架构,该架构通过将物理驱动的交互项嵌入到 ML 架构中并从参考数据中学习其参数来显式地模拟色散和静电。

研究人员注意到 SpookyNet 模型并不是第一个明确模拟远程静电的模型,其他模型也遵循类似的方法。此外,原子核之间短程排斥力的经验项提高了模型对强键畸变的稳健性。

SpookyNet 还包括一种描述非局部电荷转移等效应的机制,而其他 MLFF 通常无法做到这一点。当使用适当的参考数据进行训练时,这些组件共同使模型能够推广到更大的分子。

图示:自上而下和自下而上片段的生成。(来源:论文)

至关重要的是,这使得 GEMS 能够解释合作的远程效应,这对于传统的 FF 来说是困难或不可能的。虽然小片段的大量参考数据主要用于学习短程相互作用的稳健「基线」表示,但额外的较大片段允许 GEMS 还捕获长程相互作用以及不同相互作用尺度之间的相互作用。用同样的方式,也可以囊括溶剂效应(通过明确描述与溶剂分子的相互作用)。

研究证明,GEMS 可以学习从此类片段数据中准确地模拟大规模现象,例如协作偏振效应,从而与从头开始的地面事实实现密切一致。

然而,MLFF 的质量和可靠性应该通过其对实验测量的预测来判断,例如,GEMS 能够定量重现有关不同温度下聚丙氨酸系统螺旋稳定性的实验结果,并正确描述溶剂化的 46 个残基蛋白质(crambin)的太赫兹红外(IR)振动光谱。

图示:使用 GEMS 精确模拟聚丙氨酸系统。(来源:论文)

使用传统的经验 FF 很难实现这一点,传统的经验 FF 不考虑集体多体相互作用,因此产生最多是定性的大规模振动模式,通常会在 25 至 150 cm−1 光谱区域内出现峰结构的模糊和振幅的夸大。

GEMS 适用于模型肽和含 8205 个明确水分子(>25,000 个原子)的水溶液中的 46 残基蛋白质 Crambin 的 MD 模拟。与传统的 FF(例如 AMBER99SB-ILDN)相比,GEMS 更接近根据密度泛函理论计算的能量和力。

图示:Cambin 中的半胱氨酸/精氨酸残基。(来源:论文)

研究结果揭示了聚丙氨酸肽折叠途径中以前未知的中间体以及 α-螺旋和 310-螺旋之间的动态平衡。

在溶剂化 Crambin 的模拟中,GEMS 表明蛋白质运动在性质上有所不同,与传统 FF 的计算相比,PES 更平滑,振动更柔和,显示出对比的短时标和长时标动态。

低频振动模式很大程度上决定了蛋白质的自由能;该团队的结果表明,为了充分理解生物分子的动态过程,可能需要从头开始进行精确地计算模拟。

图示:Crambin 在太赫兹时间尺度上的红外光谱。(来源:论文)

结语

GEMS 的未来工作可能包括将其扩展到更大系统和更长时间尺度的模拟,以及可能的扩展包括纳入核量子效应,这些都可能为研究大分子系统的动态提供新的视角。

虽然 GEMS 在计算效率上优于从头算计算,但仍低于传统 FF。此外,GEMS 在评估时通常需要更多的内存,这限制了可模拟的最大系统大小。尽管如此,GEMS 仍然能够在保持从头算精度的同时模拟数千原子系统的几纳秒动态。

使用精确的 MLFF 的另一个优势在于能够获得任意导数,包括化学衍生物。这可能使得针对局部突变优化可观测量成为可能,从而在药物设计和蛋白质工程中发挥重要作用。

图示:实现精确的量子力学蛋白质-蛋白质相互作用:ACE2(蓝色)和 SARS-CoV 刺突蛋白 RBD(红色)的气相结合曲线。(来源:论文)

GEMS在模拟蛋白质-蛋白质相互作用方面展现出应用潜力,例如在模拟 ACE2 与 SARS-CoV-1 和 SARS-CoV-2 变体的 RBD 结合时,GEMS 提供了更强的结合能预测,这可能对理解病毒如何与宿主细胞相互作用具有重要意义。

虽然目前GEMS使用的片段是特定于系统的,但未来的发展可能会使其能够覆盖更广泛的系统范围,从而实现具有化学可转移性和尺寸可扩展性的「通用」MLFF,这将进一步推动 GEMS 在多个领域的应用。

论文链接:https://www.science.org/doi/10.1126/sciadv.adn4397

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
标签:
上一篇2025-08-07

相关推荐

  • 莱特帀手机钱包-莱特币手机钱包

    【莱特帀手机钱包】——您的虚拟货币安全助手随着数字货币的兴起,莱特帀作为一种备受关注的加密货币,越来越受到投资者的青睐,为了方便用户安全、便捷地管理莱特帀资

    2025-08-07 17:03:26
    2019
  • ttm数字货币币钱包-ttt数字货币

    TTM数字货币币钱包——您的虚拟货币钱包助手随着数字货币的普及,越来越多的人开始关注并投资数字货币,数字货币的安全存储问题成为了投资者们面临的一大挑战,为了解

    2025-08-07 17:03:26
    2011
  • 货币钱包转账违法吗

    虚拟货币钱包助手:揭秘钱包转账的合法性与风险尊敬的用户,您好!作为虚拟货币钱包助手,今天我们来探讨一下关于虚拟货币钱包转账的合法性与风险问题,什么是虚拟货币钱包

    2025-08-07 17:03:26
    2004
  • 派币今天价值多少钱(派币今日价值报告)

    派币今天价值多少钱(派币今日价值报告)如果你是一名投资者,特别是加密货币投资者,那么你可能会对派币的表现感兴趣。究竟,在今天的市场上,你的派币价值是多少呢?让我们

    2025-08-07 17:03:26
    2003
  • usdt钱包官方下载(高级版本V6.4.24)_USDT钱包是什么?

    USDT钱包是一款基于区块链技术的数字货币钱包,主要应用于泰达币(USDT)的存储、转账和交易,泰达币作为一种稳定币,其价值与美元挂钩,1 USDT兑换1美元,因此在数字货币市场

    2025-08-07 17:03:26
    2003
  • 虚拟币前十名的各币价格

    在数字货币的世界里,各种虚拟币的价格波动总是牵动着投资者的心,下面,我将为您详细介绍当前市值排名前十的虚拟币及其价格情况,帮助您更好地了解这个市场,我们需要明确

    2025-08-07 17:03:26
    2003
  • 鱼池sc钱包-鱼池钱包模式

    【鱼池SC钱包】——您的虚拟货币守护神随着区块链技术的不断发展,虚拟货币已经成为越来越多人的投资选择,为了方便用户安全、便捷地管理自己的虚拟货币资产,各种虚拟

    2025-08-07 17:03:26
    2003
  • 欧意交易所app最新下载安装_欧意OK交易平台App下载教程

    大家好,今天来跟大家分享一下如何下载安装欧意交易所的官方App,也就是欧意OK交易平台App,这个App可以帮助用户在手机上轻松进行数字资产的交易和管理,下面是详细的下

    2025-08-07 17:03:26
    2003