使用ESMFold、预训练语言模型和Graph Transformer技术,上海交大和中山大学合作预测蛋白质结合位点

萝卜皮是一种常见的食材,也是很多菜肴的主要材料之一。它通常是由新鲜的萝卜切成薄片或丝状,然后经过腌制或烹煮而成。萝卜皮在烹饪中可以发挥出独特的口感和

在理解相关的生物过程和进行药物设计时,识别蛋白质的功能位点非常重要。这些功能位点可以是蛋白质、肽或其他生物成分的结合位点。然而,目前已有的基于序列的方法在预测上存在一定的限制,因为它们只考虑了序列相邻的上下文特征,并且缺乏结构信息。 为了提高预测的准确性,研究人员开始探索结合序列和结构信息的方法。一种常见的方法是利用蛋白质的三维结构数据,例如通过X射线晶体学或核磁共

来自上海交通大学和中山大学的研究人员近日提出了一种名为DeepProSite的新方法,用于识别蛋白质结合位点。这种方法利用了蛋白质的结构和序列信息,能够更准确地确定蛋白质的结合位点。通过深度学习技术,DeepProSite能够从大量的蛋白质数据中学习,进而预测出蛋白质结合位点的位置。这项研

DeepProSite首先使用ESMFold生成蛋白质的结构,并利用预训练的语言模型生成序列表示。然后,它使用Graph Transformer,并将位点预测结合为图节点分类的方式。

DeepProSite已被证明在预测蛋白质-蛋白质/肽结合位点方面表现出很高的性能,其优于当前基于序列和结构的方法。此外,与基于结构的预测方法相比,DeepProSite在预测未结合结构时也能保持高水平的准确性。更令人印象深刻的是,DeepProSite还可以应用于预测核酸和其他配体的结合位点,这证明了它的泛化能力。

这项研究的题目是《DeepProSite: 结合 ESMFold 和预训练语言模型的结构感知蛋白结合位点预测》,发表于2023年11月28日的《Bioinformatics》杂志上。

蛋白质在生物过程中扮演着重要的角色,它与各种生物分子之间的相互作用构成了蛋白质功能的基础。这些相互作用包括与基因表达调控、信号转导和代谢途径调控相关的相互作用。通过与其他分子的相互作用,蛋白质能够参与调控基因的表达,传递细胞内外的信号以及调节代谢途径的运行

蛋白质-蛋白质相互作用在调节正常细胞功能方面起着重要作用,并在多种疾病的发病机制中扮演关键角色。举例来说,在肿瘤生长、自身免疫性疾病和病原体入侵等疾病中,蛋白质-蛋白质相互作用的失调可能导致病理生理过程的混乱。此外,治疗性肽因其具有与蛋白质结合并发挥治疗作用的特性而成为药物开发的重点关注对象。

因此,了解蛋白质结合位点的位置和特征对于理解蛋白质功能和药物设计至关重要。然而,传统的结合位点检测方法,如X射线晶体学、双杂交筛选、表面等离子共振技术和亲和纯化质谱法,不仅价格昂贵,而且耗时。

此外,一些技术挑战,包括肽尺寸小、结合亲和力弱、构象灵活性、高瞬时性和蛋白质-蛋白质相互作用的动力学,增加了准确识别结合残基的难度。所以,开发新的、快速的、准确的计算方法非常重要。

在最新的研究中,上海交通大学和中山大学的研究人员提出了 DeepProSite,是一种拓扑感知的 Graph Transformer 模型,它可以从蛋白质序列中生成有效的结构信息和序列信息表示,分别利用 ESMFold 和预训练的语言模型来预测蛋白质结合位点。

图示:DeepProSite 方法的整体流程。(来源:论文)

仅依靠蛋白质序列,DeepProSite 就实现了出色的预测性能,甚至超越了最先进的基于结构的方法,从而克服了现有基于序列和基于结构的方法的局限性。研究还表明,在预测未结合结构时,基于结构的竞争方法的准确性大大降低,而 DeepProSite 保持了与仅基于序列的预测器相当的性能,进一步证明了仅使用序列的无偏训练过程的好处。

图示:DeepProSite 与基于结构的方法对 31 种具有结合和未结合结构的蛋白质进行性能比较。(来源:论文)

与现有技术相比,DeepProSite 的卓越性能归因于三个因素:(i) ESMFold 预测的高质量结构,(ii) 预训练的蛋白质语言模型提供了增强预测质量的强大表示,(iii) 结构感知 Graph Transformer 有效识别和预测结合残基模式,从而提高该方法的整体效率。

同样 DeepProSite 方法也有某些方面还可以改进。例如,通过利用蛋白质一级序列构建异质性图,可以增强模型对不同结构预测质量的鲁棒性。此外,该方法仅限于仅根据蛋白质相关信息来识别可能的蛋白质结合残基,并且无法预测特定配体的结合模式。

总之,该方法可以为研究蛋白质-蛋白质/肽结合模式、突变的致病机制和药物开发提供有价值的见解。例如,一些疾病是由导致蛋白质-蛋白质/肽结合位点改变的突变引起的,从而导致蛋白质功能异常。了解这些位点的特征及其对突变的影响有助于揭示这些致病机制。

此外,蛋白质-蛋白质/肽结合位点的预测可以为药物开发提供有价值的信息,包括设计更精确的靶点以及提高药物选择性和亲和力。此类预测还可用于研究蛋白质相互作用网络和生物信号传导,以进一步了解蛋白质的生物学功能。

未来,研究人员打算增强 Graph Transformer 的设计,并结合多任务学习,将其应用扩展到其他各个领域。这涉及预测蛋白质与其他配体的结合位点并识别蛋白质的功能位点,例如甲基化位点、磷酸化位点和变构位点。

论文链接:https://academic.oup.com/bioinformatics/article/39/12/btad718/7453375

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
标签:
上一篇2025-08-10

相关推荐

  • 莱特帀手机钱包-莱特币手机钱包

    【莱特帀手机钱包】——您的虚拟货币安全助手随着数字货币的兴起,莱特帀作为一种备受关注的加密货币,越来越受到投资者的青睐,为了方便用户安全、便捷地管理莱特帀资

    2025-08-10 08:56:58
    2019
  • ttm数字货币币钱包-ttt数字货币

    TTM数字货币币钱包——您的虚拟货币钱包助手随着数字货币的普及,越来越多的人开始关注并投资数字货币,数字货币的安全存储问题成为了投资者们面临的一大挑战,为了解

    2025-08-10 08:56:58
    2012
  • 货币钱包转账违法吗

    虚拟货币钱包助手:揭秘钱包转账的合法性与风险尊敬的用户,您好!作为虚拟货币钱包助手,今天我们来探讨一下关于虚拟货币钱包转账的合法性与风险问题,什么是虚拟货币钱包

    2025-08-10 08:56:58
    2004
  • 派币今天价值多少钱(派币今日价值报告)

    派币今天价值多少钱(派币今日价值报告)如果你是一名投资者,特别是加密货币投资者,那么你可能会对派币的表现感兴趣。究竟,在今天的市场上,你的派币价值是多少呢?让我们

    2025-08-10 08:56:58
    2003
  • usdt钱包官方下载(高级版本V6.4.24)_USDT钱包是什么?

    USDT钱包是一款基于区块链技术的数字货币钱包,主要应用于泰达币(USDT)的存储、转账和交易,泰达币作为一种稳定币,其价值与美元挂钩,1 USDT兑换1美元,因此在数字货币市场

    2025-08-10 08:56:58
    2003
  • 虚拟币前十名的各币价格

    在数字货币的世界里,各种虚拟币的价格波动总是牵动着投资者的心,下面,我将为您详细介绍当前市值排名前十的虚拟币及其价格情况,帮助您更好地了解这个市场,我们需要明确

    2025-08-10 08:56:58
    2003
  • 鱼池sc钱包-鱼池钱包模式

    【鱼池SC钱包】——您的虚拟货币守护神随着区块链技术的不断发展,虚拟货币已经成为越来越多人的投资选择,为了方便用户安全、便捷地管理自己的虚拟货币资产,各种虚拟

    2025-08-10 08:56:58
    2003
  • 欧意交易所app最新下载安装_欧意OK交易平台App下载教程

    大家好,今天来跟大家分享一下如何下载安装欧意交易所的官方App,也就是欧意OK交易平台App,这个App可以帮助用户在手机上轻松进行数字资产的交易和管理,下面是详细的下

    2025-08-10 08:56:58
    2003