[爆卦] 2024诺贝尔化学奖

楼主: jackliao1990 (jack)   2024-10-09 17:47:51
https://www.nobelprize.org/prizes/chemistry/2024/popular-information/
瑞典皇家科学院决定颁发2024年诺贝尔化学奖
一半给
大卫贝克
1962 年出生于美国华盛顿州西雅图。 1989年获得美国加州大学柏克莱分校博士学位。美
国华盛顿州西雅图华盛顿大学教授。
“用于计算蛋白质设计”
另一半
D·哈萨比斯
1976年出生于英国伦敦。 2009年获得英国伦敦大学学院博士学位。 Google DeepMind
首席执行官,英国伦敦。
约翰·M·JUMPER
1985 年出生于美国阿肯色州小石城。 2017年获得美国伊利诺州芝加哥大学博士学位。英
国伦敦 Google DeepMind 资深研究科学家。
“用于蛋白质结构预测”
化学家长期以来一直梦想着完全理解和掌握生命的化学工具——蛋白质。这个梦想现在已
经触手可及。 Demis Hassabis 和 John M. Jumper 已成功利用人工智能来预测几乎所有
已知蛋白质的结构。 大卫贝克 学会如何掌握生命的建造模组并创造全新的蛋白质。他们
的发现潜力巨大。
他们透过计算和人工智能揭示了蛋白质的秘密
生命的旺盛化学反应如何变可能?这个问题的答案就是蛋白质的存在,而蛋白质可谓是绝
妙的化学工具。它们通常由20种氨基酸组成,可以以无数种方式组合。以 DNA 中储存的
资讯为蓝图,胺基酸在我们的细胞中连接在一起形成长串。
然后蛋白质的魔力发生了:一串氨基酸扭曲并折叠成一种独特的——有时是独特的——三
维结构。这种结构赋予了蛋白质功能。有些成为可以创造肌肉、角或羽毛的化学构件,而
有些则可能成为荷尔蒙或抗体。其中许多会形成酶,以惊人的精确度驱动生命的化学反应
。位于细胞表面的蛋白质也很重要,它们充当细胞与周围环境之间的沟通管道。
这 20 种胺基酸是生命的化学组成部分,其潜力怎么强调都不为过。 2024 年诺贝尔化学
奖旨在让人们在全新的水平上理解和掌握它们。一半的奖金授予 Demis Hassabis 和
John Jumper,他们利用人工智能成功解决了化学家 50 多年来一直困扰的问题:根据氨
基酸序列预测蛋白质的三维结构。这使得他们能够预测几乎所有 2 亿种已知蛋白质的结
构。奖金的另一半则颁给大卫贝克。他开发了电脑化方法来实现许多人认为不可能的事情
:创造以前不存在的蛋白质,并且在许多情况下具有全新的功能。
2024 年诺贝尔化学奖表彰了两项不同的发现,但正如您将看到的,它们密切相关。为了
了解今年的获奖者克服的挑战,我们必须回顾现代生物化学的黎明。
第一张蛋白质的颗粒状图片
化学家自 19 世纪以来就知道蛋白质对于生命过程很重要,但直到 20 世纪 50 年代化学
工具才足够精确,研究人员才开始更详细地探索蛋白质。剑桥研究人员 John Kendrew
和 Max Perutz 在本世纪末取得了突破性的发现,他们成功地使用一种称为 X 射线晶体
学的方法提出了第一个蛋白质的三维模型。为了表彰这项发现,他们于 1962 年获得了诺
贝尔化学奖。
随后,研究人员主要使用 X 射线晶体学(通常需要付出巨大的努力)成功产生约 20 万
种不同蛋白质的图像,这为 2024 年诺贝尔化学奖奠定了基础。
蛋白质如何找到其独特的结构?
克里斯蒂安·安芬森 美国科学家 还有一项早期发现。他利用各种化学技巧,成功地使现
有的蛋白质展开,然后再次折叠起来。有趣的观察是蛋白质每次都呈现完全相同的形状
。 1961年,他得出结论:蛋白质的三维结构完全由蛋白质中的胺基酸序列决定。这使他
于 1972 年荣获诺贝尔化学奖。
然而,安芬森的逻辑包含一个悖论,另一位美国人赛勒斯·莱文塔尔(Cyrus Levinthal)
在1969 年指出。蛋白质至少可以假设10 个氨基酸。 47 不同的三维结构。如果氨基酸链
随机折叠,则需要比宇宙年龄更长的时间才能找到正确的蛋白质结构。在细胞中,只需要
几毫秒。那么这串氨基酸实际上是如何被折叠的呢?
安芬森的发现和莱文塔尔的悖论暗示折叠是一个预定的过程。而且重要的是,有关蛋白质
如何折叠的所有资讯都必须存在于氨基酸序列中。
迎接生物化学的巨大挑战
上述见解导致了另一个决定性的认知——如果化学家知道蛋白质的胺基酸序列,他们应该
能够预测蛋白质的三维结构。这是一个令人兴奋的想法。如果他们成功了,他们将不再需
要使用繁琐的 X 射线晶体学,并且可以节省大量时间。他们还能够产生 X 射线晶体学不
适用的所有蛋白质的结构。
这些合乎逻辑的结论向生物化学面临的巨大挑战提出了挑战:预测问题。为了鼓励该领域
更快速的发展,研究人员于 1994 年启动了一个名为“ 蛋白质结构预测批判性评估”
(CASP) 的项目,该项目后来发展成为一项竞赛。每隔一年,来自世界各地的研究人员就
可以获得结构刚刚确定的蛋白质中的胺基酸序列。然而,这些结构对参与者保密。挑战是
根据已知的氨基酸序列预测蛋白质结构。
CASP 吸引了许多研究人员,但事实证明解决预测问题极为困难。研究人员在竞赛中输入
的预测与实际结构之间的一致性几乎没有任何改善。这一突破直到 2018 年才出现,当时
一位国际象棋大师、神经科学专家和人工智能先驱进入了这个领域。
桌游高手进入蛋白质奥林匹克
让我们快速了解 Demis Hassabis 的背景:他四岁开始下棋,13 岁达到大师水平。在他
十几岁的时候,他开始了程式设计师和成功的游戏开发人员的职业生涯。他开始探索人工
智慧并研究神经科学,并取得了多项革命性的发现。他利用自己对大脑的了解为人工智能
开发了更好的神经网络。 2010 年,他与他人共同创立了 DeepMind 公司,该公司为流行
的棋盘游戏开发精湛的人工智能模型。该公司于 2014 年出售给谷歌,两年后,当该公司
实现了当时许多人认为的人工智能圣杯:击败世界上最古老的棋盘游戏之一围棋的冠军选
手时,DeepMind 引起了全球关注。
然而,对 Hassabis 来说,Go 并不是目标,而是开发更好的 AI 模型的手段。这场胜利
之后,他的团队已经准备好解决对人类更重要的问题,因此在 2018 年,他报名参加了第
十三届 CASP 竞赛。
Demis Hassabis 的人工智能模型意外获胜
前几年,研究人员预测的 CASP 蛋白质结构的准确度最多只有 40%。借助 AI 模型
AlphaFold,Hassabis 的团队达到了近 60%。他们赢了,优异的成绩让很多人都大吃一惊
——这是意想不到的进步,但解决方案仍然不够好。为了获得成功,与目标结构相比,预
测的准确度必须达到 90%。
哈萨比斯和他的团队继续开发 AlphaFold——但是,无论他们如何努力,算法从未完全
成功。残酷的事实是,他们已经走进了死胡同。团队很疲惫,但一位相对较新的员工对如
何改进人工智能模型有决定性的想法:约翰詹珀 (John Jumper)。
约翰詹珀接受了生物化学的巨大挑战
约翰·詹珀对宇宙的迷恋促使他开始学习物理和数学。然而2008年当他开始在一家使用超
级电脑模拟蛋白质及其动力学的公司工作时,他意识到物理知识可以帮助解决医学问题。
2011 年,当詹珀开始攻读理论物理学博士学位时,他对蛋白质产生了新的兴趣。为了节
省电脑容量(大学里紧缺的东西),他开始开发更简单、更巧妙的方法来模拟蛋白质动力
学。很快,他也接受了生物化学这项巨大挑战的挑战。 2017 年,当他刚完成博士学位时
,他听到了Google DeepMind 已经开始秘密预测蛋白质结构的传言。他向他们发送了一份
工作申请。他在蛋白质模拟方面的经验意味着他对如何改善 AlphaFold 有创造性的想法
,因此,在团队开始停滞不前后,他得到了晋升。 Jumper 和 Hassabis 共同领导了从根
本上改革人工智能模型的工作。
改革后的人工智能模型取得了惊人的结果
新版本——AlphaFold2——是根据Jumper的蛋白质知识来着色的。该团队也开始使用人工
智慧最近的巨大突破背后的创新:称为 Transformer 的 神经网络。这些可以比以前更灵
活的方式在大量数据中找到模式,并有效地确定应该关注什么来实现特定目标。
团队利用所有已知蛋白质结构和胺基酸序列数据库中的大量资讯对 AlphaFold2 进行了训
练,新的 AI 架构开始及时为第十四届 CASP 竞赛提供良好的结果。
2020 年,当 CASP 的组织者评估结果时,他们明白生物化学长达 50 年的挑战已经结束
。在大多数情况下,AlphaFold2 的表现几乎与 X 射线晶体学一样好。
一本关于细胞的教科书让大卫贝克改变了方向
当大卫贝克开始在哈佛大学学习时,他选择了哲学和社会科学。然而在演化生物学课程中
,他偶然发现了现在经典教科书《细胞分子生物学》 。这导致他改变了人生的方向。他开
始探索细胞生物学,最终对蛋白质结构着迷。 1993 年,当他开始担任西雅图华盛顿大学
的小组组长时,他接受了生物化学领域的巨大挑战。透过巧妙的实验,他开始探索蛋白质
如何折叠。当他在 20 世纪 90 年代末开始开发可以预测蛋白质结构的电脑软件:Rosetta
时,这为他提供了深刻的见解。
Baker 在 1998 年使用 Rosetta 首次参加 CASP 比赛,与其他参赛者相比,表现非常好
。这一成功引发了一个新想法——大卫贝克的团队可以反向使用该软件。他们应该能够输
入所需的蛋白质结构并获得有关其氨基酸序列的建议,而不是在 Rosetta 中输入氨基酸
序列并得出蛋白质结构,这将使他们能够创造出全新的蛋白质。
贝克成为蛋白质构建者
蛋白质设计领域——研究人员创造具有新功能的客制化蛋白质——于 20 世纪 90 年代末
期开始起飞。在许多情况下,研究人员对现有的蛋白质进行了调整,这样它们就可以做一
些事情,例如分解有害物质或充当化学制造业的工具。
然而,天然蛋白质的范围是有限的。为了增加获得具有全新功能的蛋白质的潜力,贝克的
研究小组希望从头开始创造它们。正如贝克所说:“如果你想制造一架飞机,你不能从改
造一只鸟开始;相反,你了解空气动力学的首要原理,并根据这些原理建造飞行器。"
一种独特的蛋白质重见天日
建构全新蛋白质的领域称为 从头 设计。研究小组绘制了一种具有全新结构的蛋白质,然
后让 Rosetta 计算哪种类型的胺基酸序列可以产生所需的蛋白质。为此,Rosetta 搜寻
了所有已知蛋白质结构的数据库,并寻找与所需结构相似的蛋白质短片段。 Rosetta 利
用蛋白质能量景观的基础知识优化了这些片段并提出了胺基酸序列。
为了研究该软件的成功程度,贝克的研究小组在产生所需蛋白质的细菌中引入了建议氨基
酸序列的基因。然后他们使用 X 射线晶体学确定了蛋白质结构。
事实证明,Rosetta真的可以建造蛋白质。研究人员开发的蛋白质 Top7 几乎与他们设计的
结构完全相同。
贝克实验室的精彩创作
对于从事蛋白质设计的研究人员来说,Top7 是晴天霹雳。那些以前从头创造 蛋白质 的
人只能模仿现有的结构。 Top7的独特结构在自然界中并不存在。此外,该蛋白质含有
93 个氨基酸,比以前使用 从头 设计生产的任何蛋白质都要大。
贝克于 2003 年发表了他的发现。 Baker 实验室创造的众多令人惊叹的蛋白质中的一些。
曾经需要花费数年时间的工作现在只需几分钟
当 Demis Hassabis 和 John Jumper 确认 AlphaFold2 确实有效后,他们计算了所有人
类蛋白质的结构。然后,他们预测了研究人员迄今为止在绘制地球生物图时发现的几乎所
有 2 亿种蛋白质的结构。
Google DeepMind 也公开了 AlphaFold2 的程式码,任何人都可以存取它。人工智能模型
已成为研究人员的金矿。截至 2024 年 10 月,AlphaFold2 已被来自 190 个国家的超
过 200 万人使用。以前,如果有的话,通常需要数年时间才能获得蛋白质结构。现在只
需几分钟即可完成。人工智能模型并不完美,但它估计了其产生的结构的正确性,因此研
究人员知道预测的可靠性。
2020 年 CASP 竞赛结束后,当 David Baker 意识到基于 Transformer 的 AI 模型的潜
力时,他在 Rosetta 中加入了一个模型,这也促进了 从头 蛋白质的 设计。近年来,贝
克实验室不断创造出令人难以置信的蛋白质。
令人眼花撩乱的发展,造福人类
蛋白质作为化学工具的惊人多功能性体现在生命的巨大多样性上。我们现在可以如此轻松
地想像这些小分子机器的结构,这真是令人难以置信。它使我们能够更好地了解生命的运
作方式,包括为什么会出现一些疾病、抗生素抗药性是如何发生的或为什么一些微生物可
以分解塑胶。
创造具有新功能的蛋白质的能力同样令人震惊。这可以带来新的奈米材料、标靶药物、更
快速的疫苗开发、最小的传感器和更绿色的化学工业——仅举几个为人类带来最大利益的
应用。
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 111.82.233.52 (台湾)
※ 文章网址: https://www.ptt.cc/bbs/Gossiping/M.1728467273.A.32F.html

Links booklink

Contact Us: admin [ a t ] ucptt.com