利用Transformer网络自动预测RNA 3D结构的南开&山大&北理工团队开发了trRosettaRNA

编辑 | 萝卜皮

RNA 3D 结构预测是一个长期存在的挑战。

受最近蛋白质结构预测领域突破的启发,南开大学、山东大学以及北京理工大学的研究团队开发了 trRosettaRNA,这是一种基于深度学习的自动化 RNA 3D 结构预测方法。

trRosettaRNA 流程包括两个主要步骤:通过transformer网络进行 1D 和 2D 几何形状预测;以及通过能量最小化进行的 3D 结构折叠。基准测试表明 trRosettaRNA 优于传统的自动化方法。

在CASP15和RNA-Puzzles的盲测中,trRosettaRNA对天然RNA的自动预测与人类的顶级预测具有竞争力。在使用均方根偏差的Z分数进行测量时,trRosettaRNA的性能也优于CASP15中其他基于深度学习的方法

该研究以「trRosettaRNA: automated prediction of RNA 3D structure with transformer network」为题,于 2023 年 11 月 9 日发布在《Nature Communications》。

学界对 RNA 3D 结构预测的需求与日俱增

RNA是活细胞中最重要的分子类型之一,它在许多基本的生物和细胞过程中发挥作用,例如作为遗传信息的转录本,具有催化、支架和结构功能。近几十年来,随着每年新型ncRNA的发现,人们对非编码RNA(ncRNA)的结构和功能,如转移RNA(tRNA)和核糖体RNA(rRNA),越来越感兴趣

与蛋白质相似,ncRNA分子的生物学功能通常由其三维结构决定。然而,由于主链的灵活性和长程三级相互作用的弱度,RNA的内在结构异质性比蛋白质更强,因此通过实验解决RNA的结构更具挑战性。例如,蛋白质数据库(PDB)中仅有大约6000个RNA结构,远少于存储的蛋白质结构数量(约190,000个)。因此,迫切需要开发有效的算法来预测RNA的三维结构

当前的RNA 3D结构预测仍然面临着巨大的挑战

当前的RNA 3D结构预测方法可以分为两种:基于模板的方法和从头方法。基于模板的方法利用PDB中同源模板来预测目标结构。例如,ModeRNA和MMB等代表性方法通过减少同源结构的采样空间来工作。一般而言,基于模板的方法在PDB中存在同源模板时,预测的结构模型是准确的。然而,由于已知RNA结构数量有限以及RNA序列比对的困难,基于模板的方法的进展缓慢

相反,从头开始的方法是通过模拟折叠过程来构建3D构象。FARNA5、FARFAR、FARFAR2、SimRNA、iFoldRNA、RNAComposer和3dRNA等方法利用分子动力学模拟或片段组装来对一些小RNA进行研究<100 个核苷酸)效果良好。然而,由于不准确的力场参数和巨大的采样空间,很难为具有复杂拓扑的大RNA生成精确的3D结构。为了部分解决这个问题,通过直接耦合分析(DCA)预测的核苷酸间接触已被用来指导结构模拟。

此外,考虑到 RNA 结构折叠的层次性质,一些方法从二级结构衍生出 3D 结构,例如 Vfold 和 MC-Fold。它们非常快,但建模精度很大程度上取决于输入二级结构的质量。RNA-Puzzles 实验表明,准确预测具有复杂结构的大 RNA 的结构仍然是一个巨大的挑战。

重新表述:在RNA 3D结构预测领域中,广泛应用了深度学习技术

深度学习最近被用来改进从头 RNA 3D 结构预测。残差卷积网络(ResNet)预测的核苷酸间接触比 DCA 准确约两倍,在一定程度上改善了 3D 结构预测。结果表明,通过从基于几何深度学习的评分系统 (ARES) 中选择模型,FARFAR2 协议在 RNA-Puzzles 实验的盲测中预测了四个目标的最准确模型。受 AlphaFold2 成功的启发,科学家开发了一些新的基于深度学习的方法,例如 DeepFoldRNA、RoseTTAFoldNA 和 RhoFold。

在最新的研究中,南开大学、山东大学和北京理工大学的研究团队开发了一种名为trRosettaRNA的基于深度学习的自动化RNA三维结构预测方法。这个方法的灵感部分来自于深度学习在蛋白质结构预测中的成功应用,特别是AlphaFold2和trRosetta。经过基准测试和盲测,trRosettaRNA显示出增强RNA结构预测的希望

trRosettaRNA的结构如图1所示。从RNA的核苷酸序列开始,首先使用rMSA和SPOT-RNA程序生成多重序列比对(MSA)和二级结构。然后将它们转换为MSA表示和配对表示,再输入到名为RNAformer的transformer网络中,以预测1D和2D的几何形状。与trRosetta类似,这些几何形状被转换为约束,用于指导基于能量最小化的3D结构折叠的最后步骤。除非另有说明,下面提到的RMSD是通过使用RNA-Puzzles社区提供的评估工具包,考虑所有原子来计算的

图1:trRosettaRNA 的总体架构。(来源:论文)

研究人员针对trRosettaRNA进行了严格评估,使用了两个独立的数据集和两个盲测。基准测试显示,trRosettaRNA的预测模型比其他自动化方法更准确。trRosettaRNA在两个实验中进行了盲评估,包括RNA-Puzzles(3个目标)和CASP15(12个目标)。RNA-Puzzles实验表明,trRosettaRNA的自动预测与人类对三分之二目标的预测具有竞争力。CASP15实验表明,trRosettaRNA在基于RMSD的累积Z分数方面优于其他基于深度学习的方法。该方法在8种天然RNA上达到了与顶级人类群体相当的准确性,而无需任何人为干预

局限性与未来

然而,研究人员发现在CASP15盲测中,天然RNA的平均RMSD(第一个模型为14.8 Å)高于两个基准数据集RNA的平均RMSD(30个独立RNA为8.5 Å,之前20个RNA-Puzzles靶标为10.5 Å)

建模准确性的差异可以通过目标难度和新颖性来解释。

(1)难度目标。大多数CASP15 RNA在构象方面表现出高度灵活性,可以采用多种不同的构象(除R1116和R1117外)。此外,还有两个二聚体(R1107和R1108)和两个蛋白质结合RNA(R1189和R1190),这些RNA具有许多单链区域。这些特征为SPOT-RNA预测可信的二级结构提出了挑战。为了说明这一点,与20个RNA-Puzzles目标相比,来自CASP15的8个天然RNA的SPOT-RNA预测的平均F1分数要低得多(分别为0.62和0.72)

(2)目标新颖。在非冗余的基准数据集中,有很大一部分RNA(其中30个中的20个)与之前已知的RNA表现出高度相似(TM-scoreRNA>0.6),这使得它们可以通过数据驱动的方法(如trRosettaRNA)进行预测。相反,CASP15的RNA没有表现出这样程度的相似性

重新写作后的内容:这显示了与trRosettaRNA和基准测试相关的一些限制。首先,trRosettaRNA的性能容易受到预测二级结构质量的影响。其次,尽管trRosettaRNA在内部基准测试中表现出令人鼓舞的准确性,但在新型RNA上的性能仍然有限。此外,自动预测合成RNA的结构仍然存在挑战

CASP15 实验中的盲测表明,RNA 结构预测的深度学习方法仍处于起步阶段。然而,随着持续发展,深度学习应该有望推进 RNA 结构预测。将基于物理的建模融入深度学习是未来改进的方向之一。

最直接的替代方案之一是将其与其他传统方法相结合,并针对未来那些代表性不足的 RNA 结构优化算法。例如,为了克服对已知 RNA 折叠的偏见,可以利用神经网络(例如基于物理的神经网络)来学习力场或识别/组装局部图案,而不是直接预测全局 3D 结构。

源代码:https://yanglab.qd.sdu.edu.cn/trRosettaRNA

请点击以下链接查看论文:https://www.nature.com/articles/s41467-023-42528-4

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
标签:
上一篇2025-08-11

相关推荐

  • 莱特帀手机钱包-莱特币手机钱包

    【莱特帀手机钱包】——您的虚拟货币安全助手随着数字货币的兴起,莱特帀作为一种备受关注的加密货币,越来越受到投资者的青睐,为了方便用户安全、便捷地管理莱特帀资

    2025-08-11 14:00:12
    2019
  • ttm数字货币币钱包-ttt数字货币

    TTM数字货币币钱包——您的虚拟货币钱包助手随着数字货币的普及,越来越多的人开始关注并投资数字货币,数字货币的安全存储问题成为了投资者们面临的一大挑战,为了解

    2025-08-11 14:00:12
    2012
  • 货币钱包转账违法吗

    虚拟货币钱包助手:揭秘钱包转账的合法性与风险尊敬的用户,您好!作为虚拟货币钱包助手,今天我们来探讨一下关于虚拟货币钱包转账的合法性与风险问题,什么是虚拟货币钱包

    2025-08-11 14:00:12
    2004
  • 派币今天价值多少钱(派币今日价值报告)

    派币今天价值多少钱(派币今日价值报告)如果你是一名投资者,特别是加密货币投资者,那么你可能会对派币的表现感兴趣。究竟,在今天的市场上,你的派币价值是多少呢?让我们

    2025-08-11 14:00:12
    2003
  • usdt钱包官方下载(高级版本V6.4.24)_USDT钱包是什么?

    USDT钱包是一款基于区块链技术的数字货币钱包,主要应用于泰达币(USDT)的存储、转账和交易,泰达币作为一种稳定币,其价值与美元挂钩,1 USDT兑换1美元,因此在数字货币市场

    2025-08-11 14:00:12
    2003
  • 虚拟币前十名的各币价格

    在数字货币的世界里,各种虚拟币的价格波动总是牵动着投资者的心,下面,我将为您详细介绍当前市值排名前十的虚拟币及其价格情况,帮助您更好地了解这个市场,我们需要明确

    2025-08-11 14:00:12
    2003
  • 鱼池sc钱包-鱼池钱包模式

    【鱼池SC钱包】——您的虚拟货币守护神随着区块链技术的不断发展,虚拟货币已经成为越来越多人的投资选择,为了方便用户安全、便捷地管理自己的虚拟货币资产,各种虚拟

    2025-08-11 14:00:12
    2003
  • 欧意交易所app最新下载安装_欧意OK交易平台App下载教程

    大家好,今天来跟大家分享一下如何下载安装欧意交易所的官方App,也就是欧意OK交易平台App,这个App可以帮助用户在手机上轻松进行数字资产的交易和管理,下面是详细的下

    2025-08-11 14:00:12
    2003