图片来源:Cleo Abram
Z Highlights:
AI最好的用途,是改善人类健康。如果真正把这项技术用在科学和医学上,它不仅能解决今天最难的研究问题,也会打开药物发现和疾病理解的一整串下游可能性。
我一直把AI看作推进科学和医学的终极工具。对我来说,它不只是一个消费级产品,而是帮助最优秀的科学家处理海量信息、从中找到真正洞见的工具。
当我们意识到AlphaFold已经能在几秒内高精度预测结构时,结论其实非常直接:与其搭一个服务器按需返回结果,不如把所有已知蛋白质全部算出来,免费开放给全世界科学家。
我们不必等到AGI真正到来,才开始获得AI的好处。完全可以一边谨慎推进更通用的系统,一边先用像AlphaFold这样的专用型系统去治疗癌症、寻找新材料、发现新能源。
真正更值得担心的,其实不是一时的热闹,而是两类更大的问题:一类是有人把这些本来用于治病、推进科学和能源的技术拿去作恶;另一类是AI系统本身随着能力增强而偏离轨道。
我想把AI当作一种工具,帮助我们理解现实世界的本质。我并不预设答案应该是什么;无论最后答案通向意识、时间、现实还是宇宙本身,我只是想知道答案。
Demis Hassabis博士是Google DeepMind CEO,曾于2024年获诺贝尔化学奖,如今主导着Google最核心的AI研究,也持续推动AI在科学、医学、药物发现与量子计算等方向的落地。本次访谈由《Huge Conversations》主持人Cleo Abram在2026年4月发起,围绕AlphaFold、AlphaGo、AGI、AI安全与人类认知边界等话题展开,呈现了这位AI领军人物对技术未来的系统思考。
不只是聊天机器人:AI正在推进科学、医学与人类认知边界
Cleo Abram:在这场很可能成为我们一生中最大技术跃迁的浪潮里,Demis Hassabis是世界上最重要的人物之一。因为AI影响我们生活的最大方式,并不是我们看得见的那些东西。它不是聊天机器人,也不是图像生成器,而是那些大多数时候对我们不可见的工具:药物设计、自然灾害探测、核聚变、量子计算,而这些工具正是他和他的团队正在打造的。他创办DeepMind时的使命,是“解决智能”这个问题,而起点,只是用来玩电子游戏。后来他把这家公司卖给Google,原因正是Google承诺会让DeepMind专注于科学研究。如今,这一切已经演变成近代史上最激烈的技术竞赛之一,而Demis所负责的事情,也远远不止于此。现在,Google几乎所有AI相关的工作背后都有他的身影。他每天都在做出影响你、也影响数百万人生活的决定。那么,他究竟打算如何使用这份力量?
欢迎来到《Huge Conversations》。非常感谢你接受采访。你也知道,《Huge Conversations》是一种不太一样的访谈。我不会问你财务问题,也不会问你的管理风格,这些别处已经讲得很多了。我希望这场对话能像是我们一起做的一期explainer,帮助大家看清此刻AI到底在发生什么,以及你所看到的未来是什么样的。那你希望在这场对话里聊到什么?
Demis Hassabis:我30多年前之所以进入AI领域,一个很重要的原因,就是想推进科学和医学。我一直认为,AI可能是实现这件事的终极工具。所以我希望我们今天能聊到这些内容,因为这一直是我最有热情的方向——把AI应用到这些事情上。当然,AI也可以应用于很多很多别的领域。这会是一场很有趣的对话。
Cleo Abram:我认为,AI真正对人们生活产生深刻影响的方式,往往恰恰是那些大多数时候对人们不可见的东西。所以我想先从那个为你赢得诺贝尔奖的项目开始。我想把AlphaFold的故事讲出来,包括其中所有的戏剧性,因为有些人可能并不了解它。然后我会很快转到这个科学类别当前最前沿的地方。在这么多可能的方向里,你为什么决定去攻克这个问题?
AlphaFold改写了科研流程:从按需预测一个蛋白到向全球免费开放已知结构
Demis Hassabis:其实我是在剑桥读本科的时候接触到这个问题的。我当时有很多学的是生物学的朋友,其中有一个人尤其痴迷于所谓的“蛋白质折叠问题”。蛋白质是你身体里一切运作的基础。它让生物学成为可能,也让生命成为可能。蛋白质最重要的,是它的三维结构。因为在体内,蛋白质会折叠成某种三维形态,而这种结构决定了——或者至少在很大程度上决定了——它的功能。所以,蛋白质折叠问题,本质上就是:你能不能只凭一维的氨基酸序列,预测出它的三维结构?这是一个持续了大约50年的重大挑战。我喜欢挑战,我喜欢谜题。
从科学角度说,我根本无法抗拒这个问题。有人把它形容成“生物学界的费马大定理”,那谁会不感兴趣呢?而且我第一次听到这个问题的时候,就觉得它在某种意义上非常适合未来的AI来解决——尽管那是在90年代末,当时我们当然还没有任何真正能用来处理这类问题的AI。但我觉得,总有一天会有可能。最后还有一点,就是一旦你真的攻克了它,它能带来的影响会极其巨大。因为它会打开一整串下游研究的可能性,尤其是在药物发现和疾病理解方面。而我一直认为,把AI用在改善人类健康这件事上,是最重要的用途。
Cleo Abram:之所以这对人类健康意义重大,是因为在过去,如果我们想开发新药,就必须花上几十万美元、投入多年的人力,才能通过实验方法弄清一个蛋白质的结构。所以,虽然我们确实已经弄清楚了一些蛋白质结构,但这个过程一直既慢又昂贵。我这里当然跳过了你和你团队所做的大量艰苦工作。但我想说的是,从我提问的方式大家大概也已经能听出来:你们确实把这个问题解决了。一定存在那样一个时刻——你意识到,这个系统不仅真的有用,而且你已经解决了现代医学中最重要的未解难题之一。那是在2021年,你在开一个会。我真的非常庆幸,当时现场有摄像机在拍。因为那是我见过最不可思议的时刻之一。
Demis Hassabis:“我们能不能用AlphaFold去把这个问题彻底解决掉?”
Cleo Abram:我理解那场会原本是在讨论:要不要做一个系统,让科学家提交他们感兴趣的特定蛋白质,然后你们像搭一个网站那样,为他们“折叠”出对应结果并回传给他们。但之后,另一个完全不同的想法冒了出来。你能不能带我回到那场会议,讲讲当时到底发生了什么?因为你的反应太精彩了,我真的很想知道你脑子里当时在想什么。
Demis Hassabis:当然。首先,那天刚好有摄像机在场,这件事本身就很巧。拍摄团队其实很少跟着我们,但偏偏就在那场会,他们在。通常这类预测模型的传统使用方式,是你搭一个服务器,其他科学家把他们感兴趣的蛋白质序列发给你,说:“我在研究这个蛋白,能不能把你预测出的结构发给我?”这个领域过去40多年一直都是这么做的。原因是,大多数预测算法都很慢。也许算一个结构要花几天时间,然后你再把结果通过邮件发回去,接着等下一个请求。但在那场会里,我突然意识到的不只是我们折叠蛋白质有多准确,还有我们算得有多快——快到只需要几秒钟。于是我就开始在手机上做一些粗略估算:科学界目前已知、自然界中已知的蛋白质有多少?大概两亿。我们有多少计算机?还需要多少?如果每10秒折叠一个,会怎么样?然后我就在会议进行到一半的时候突然意识到:我们完全有可能在一年内把它全部算完。
既然如此,我们为什么还要费那么大劲去搭服务器、做数据库、写邮件客户端之类的东西?为什么不干脆我们自己把所有蛋白质全都算出来——把任何人今后可能会请求、可能会需要的蛋白质,全都提前折叠好,然后把它们免费放到一个数据库里,供全世界所有科学家使用?这个想法就是在那一刻一下子击中了我:我们应该直接这么干。现在我们已经可以做到这一点了,那为什么不呢?这显然是更好的方案。
Cleo Abram:你当时在会上的反应大概就是:“我们为什么不直接这么干?这不是好得多吗?显然就该这么做。”然后你们真的这么做了。于是,一个原本极其困难、极其缓慢的关键过程,突然之间变得又快又容易,而且现在正被世界各地的科学家使用。那个曾经巨大的未解难题,现在真的被解决了。我能不能这样说:我们现在已经预测出了几乎所有科学界已知蛋白质的结构?
Demis Hassabis:是的,而且我们还在持续更新。每当有人从海里舀起一桶海水,里面就有各种各样的生物体,然后他们把这些都做测序。自从人类基因组被测序以来,测序技术已经有了数量级级别的提升。所以以前真正拖后腿的是结构生物学——找出这些蛋白的三维结构这件事,远远落后于基因测序。现在有了AlphaFold 2这样的计算工具,我们终于能跟上了。比如,“这是我们刚从某种奇怪新生物里得到的一百万条新基因序列”,那么我们也可以同时给出它们的结构。我们在欧洲生物信息学研究所有一个小团队,持续每年更新当年新发现的所有序列。现在我们始终站在最前沿:基本上,我们都知道这些不同蛋白质结构大概长什么样了。
更让人惊喜的是,这对那些研究相对冷门生物、动物、植物的科研人员尤其有帮助。比如小麦。后来我才知道,很多植物拥有的基因组数据,竟然比哺乳动物甚至比人类还多。它们似乎有多份基因组拷贝之类的情况。植物世界在我看来是一个非常奇异、非常诡异的世界。而那些研究植物的科学家朋友告诉我,他们根本没有像“人类基因组计划”那样的资源。现在,我们能够让他们立刻跳到真正关心的科学问题上:比如研究某些蛋白质,帮助作物更耐受气候变化等等。他们可以直接进入自己真正感兴趣的问题,而不用被“怎么把我关心的蛋白结晶化”这件事卡住。
另一个巨大的帮助对象,是研究被忽视疾病的研究者。这些疾病主要影响发展中地区的人群,比如疟疾、查加斯病、利什曼病等——影响着全球数亿人口。但这些疾病在商业上并不赚钱,所以大型制药公司往往不会投入太多资源去研究和寻找疗法,因为患者主要在更贫穷的地区。因此,这些方向往往被忽视。当然,也有很多了不起的非营利组织在研究这些病,但它们没有很多钱,也没有太多资源。所以,如果我们把与这些疾病相关蛋白质的结构直接提供给他们,那对他们会是巨大的帮助,因为他们就可以直接进入药物发现阶段。
从结构预测到药物设计:AI正在进一步完善生命科学的链条
Cleo Abram:我在做研究时最难搞清楚的一点,就是:有那么一个时刻,全球科学家都可以用AlphaFold了。你能看到地图亮起来,你能看到大家都在用它。但我却不太容易找到一个足够具体、又足够典型的例子,来和你讨论:某位科学家用AlphaFold加快了一个药物流程,而最终这个流程产出的药,今天的我已经可以吃到了。在你看来,最喜欢的一个例子是什么?
Demis Hassabis:现在我们估计,已经有超过300万名科学家在使用AlphaFold,几乎可以说,世界上每一个生物学家都在用了。我曾经碰到一位制药公司的科学家,他对我说:从现在开始,未来几乎每一种新开发出来的药物,可能在研发流程中都会用到AlphaFold。这真的是非常令人震撼——它带来的影响就是这么大。不过,药物发现终究还是需要时间。所以目前我们大多还处在更基础的生物学阶段:先理解疾病本身——我们到底瞄准的是哪一个蛋白质?这是不是正确的生物学机制?据我了解,其中一些药物现在已经进入临床试验阶段。希望在未来几年,我们会真正看到几十种药物在某种程度上都受益于AlphaFold的帮助。
至于我最喜欢的一个“由AlphaFold帮助推动的突破”,其实更偏基础科学。那就是一个叫核孔复合体的东西。它是人体内最大的蛋白质复合体之一,功能非常重要——基本上它就是细胞核的大门,控制营养物质和各种分子进出细胞核。你可以把它想象成一个会开合的大型环状“门”。但直到最近,我们都不知道它长什么样,因为它太大、太复杂了,很难结晶,也很难真正看清它。而AlphaFold发布之后大概六个月到一年内,就有一些团队结合实验数据,终于弄清楚了这个“门”极其优美的结构。对我来说,这太惊人了——这是人体里最大的蛋白复合体之一,而AlphaFold在确定它的结构方面发挥了非常重要的作用。
Cleo Abram:也就是说,也许我们未来可以设计一些药物或治疗方式,以某种方式更好地利用它、接近它?
Demis Hassabis:对,理论上有这种可能。虽然我觉得那个案例更多还是基础生物学上的理解突破。不过,显然我们自己也在做这个方向。我们孵化出了一家新公司,叫Isomorphic Labs。它会在AlphaFold的基础上继续往前走,把它作为整个拼图中的一部分,去大幅加速药物发现。
你知道,平均来说,开发一种药物需要大约10年时间。这漫长得不可思议,需要投入极其巨大的艰苦努力,成本非常高,而且失败率也惊人——只有大约10%的药物最终能走完整个临床流程。如果我们真的想改善人类健康,就必须极大幅度地改善这一点。而我认为,改善的方法就是使用in silico的方式,也就是尽可能在计算机中进行模拟和设计,而AlphaFold 2只是其中一个组成部分。知道一个蛋白质的结构,只是药物发现流程中的一小部分。你还需要大量化学工作,比如:应该设计哪种化合物去和它结合?诸如此类。所以我们正在Isomorphic里构建这些“相邻系统”——你可以把它们理解为与AlphaFold协同工作的系统,可能是更先进版本的AlphaFold,比如AlphaFold 3、AlphaFold 4。我们的目标是端到端地创造这些药物,让它们副作用尽可能少,同时又能极其有效地作用于我们想解决的那类疾病。到目前为止,我们大概已经在推进18到19个不同的药物项目,涵盖从心血管疾病到癌症再到免疫学等非常广泛的领域。我认为,最终这类技术应该能帮助几乎所有治疗领域。
Cleo Abram:我在准备这期节目时,也和你的另一位诺奖共同得主John Jumper做过一次背景采访。他非常强调,AlphaFold只是药物发现这个更大问题中的一部分。这也正好把我们带到了今天真正的前沿。现在的最前沿到底是什么?
Demis Hassabis:我们现在正在构建很多可以彼此组合起来的组件。AlphaFold是其中一个关键枢纽,因为它解决的是蛋白质结构问题。但你想想看,假设你已经知道这个蛋白长什么形状了,也知道蛋白质上哪一部分才是真正执行功能的关键部位。接下来在药物发现中,如果你想阻断它的作用,或者以某种方式增强它的作用,你就要知道:你需要让一个化学化合物结合到蛋白质表面的哪个位置?然后你还要发现一种能准确黏到那个位置上的化合物,并且想知道:它结合得有多强?更重要的是,不只是它能不能结合到你感兴趣的目标上,而是要确保它不要结合到别的东西上,因为如果它也黏到别的蛋白上,那就会产生毒性。那就是我们说的副作用。我们当然希望尽可能减少这些副作用。
但现在,因为我们已经拥有这么多强大的算法工具,我们可以做一种“虚拟筛选”。比如,我们的一套AI系统会设计出一个候选化合物,然后预测它与目标蛋白表面结合的强度。接着,我们还能非常快地检查——比如在几小时内就能完成——这个化合物会不会黏到人体里其他2万种蛋白质中的某些上面。所以我们可以非常迅速地做这件事,然后不断修改这个化合物,让它在其他蛋白上产生的副作用越来越少,理想情况下对其他任何蛋白都不作用,但对我们真正想作用的那个目标蛋白,结合效果越来越强。你会发现,我刚刚其实描述的是一个“自我改进”或者“自我修改”的过程。如果这一切都能在计算机里完成,那它会极快、极高效。到最后一步,你才去做湿实验室验证。当然,你最终还是必须验证。你可以在计算机中做出所有这些预测、完成所有这些搜索,但最后还是要把最终提出的候选化合物放到真实湿实验中去检验,看它是否真的如预测那样表现。但你可以想象,这会节省多少时间:你可以比现在快几千倍,未来甚至可能快上几百万倍地搜索更多化合物。最后只需要验证少数最有希望的结果。这和今天有效上仍然是在湿实验室里完成搜索相比,效率要高得多。
AlphaGenome与CRISPR:AI开始解码那98%不编码蛋白质的基因组区域
Cleo Abram:另一个我很喜欢的项目是AlphaGenome。我还联系了另一位诺奖得主Jennifer Doudna博士——她也上过这个节目。她给你留了一个问题,我现在念给你听。她说:CRISPR,也就是她推动发展的那项基因编辑技术,现在几乎可以靶向任何DNA序列。但对于大多数遗传病,我们仍然没有完全理解,到底是DNA中哪些变化在驱动问题,尤其是在那占全基因组98%、并不编码蛋白质的部分。像AlphaGenome这样的工具,正在开始解码这98%的区域。那么你认为,我们距离这样一个时刻还有多远:AI能够可靠地指出,究竟是哪一个精确的基因变化导致了某位患者的疾病,从而让像CRISPR这样的技术去修复它?
Demis Hassabis:这是个非常棒的问题。其实我也和她讨论过这个。我觉得AlphaGenome真的很令人兴奋。它正是做这类事情的技术:输入很长的基因序列,然后预测——如果你在这个特定位置、这个特定碱基上发生了一个单点突变,它会不会是有害突变,会不会导致疾病,还是它只是良性的、什么也不会发生?而我们刚发布的AlphaGenome,是目前全世界在这方面预测能力最强的系统。所以,这正是你下一步真正想要的东西。如果它未来进一步提升到足够准确的程度,你就可以想象未来版本的AlphaGenome能非常明确地告诉你:哦,问题出在这个特定突变,再加上另一个突变。难点在于:很多疾病是多基因的,也就是多个突变级联在一起才引发问题。这比单个突变更难检测,但也正是AI特别适合帮助处理的那类复杂模式。然后,某一天,也许你就可以再结合CRISPR这样的技术,直接进去修复那个突变,从而解决问题。所以,AlphaGenome和CRISPR这类技术的结合,可能会极其强大。也希望未来有一天,我们能和Jennifer这样的人一起合作推进它。
技术节奏被彻底改写:AI没有更久留在实验室,而是被提前推向公众
Cleo Abram:去年你在接受《卫报》采访时说过一句让我印象很深的话。你说:“如果按我自己的意愿,我本来会把AI更长时间地留在实验室里,多做一些像AlphaFold这样的事情,也许先治愈癌症之类的。”从外部看,整个故事好像是这样的:你创办DeepMind,使命是解决智能,再用它去解决其他一切问题;然后你把公司卖给Google,正是因为他们承诺会让你拥有足够的自由,以这种方式去探索科学;在很长一段时间里,这都是你的唯一重点。接着,ChatGPT出现了,Google拉响了“红色警报”,你成了Google全部AI业务的负责人,包括那些你过去并没有花这么多时间在其上的消费级产品。而我从远处看这一切时,会觉得它某种程度上也映照了更广泛的AI发展:最近这几年发生了惊人的转变。那么,在这种转变中,得到了什么,又失去了什么?
Demis Hassabis:你描述得完全对。你刚才说的那个故事,从内部看,感受也差不多就是这样。正如我前面提到的,对我来说,AI最好的用途就是改善人类健康、加速科学发现。事实上,我最初之所以进入AI,本来就是因为我痴迷于世界上的那些“大问题”——现实的本质、意识的本质,诸如此类。我觉得,我们需要一种工具,帮助我们——甚至帮助最优秀的科学家——去理解外部海量的数据和信息,并从中找到洞见。而这一切现在确实正在发生。显然,AlphaFold是我们在这条道路上的第一个、到目前为止也是最好的表达之一。类似这样的问题,其实还有很多很多。
所以我一直觉得,鉴于AGI的重要性,以及它的变革性——也许会是人类历史上最具变革性的技术——那么,在我们进入打造它的后期阶段时,也就是现在这个阶段,最好的方式应该是:非常谨慎、非常精确、非常深思熟虑、非常严格地用科学方法来推进;让最优秀的科学家们,以一种有点像CERN那样的协作方式,一步一步地走向最终建成AGI的目标,并且确保每一步我们都真正理解了。在我看来,面对这样一种技术,这种方式是最合理的。当然,这可能会花更久的时间。也许会再多花10年,甚至20年。但考虑到我们正在处理的事情有多么重大,我觉得这才是合理的。
同时,我另一个想法是:我们并不一定非要等到AGI真正到来,才能开始获得AI的好处。我们完全可以先构建更多“专用型系统”,它们或许会用到我们为AGI开发的一般性算法,但它们本身并不是通用智能,而是“窄AI”,比如AlphaFold——它只做一件特定的事,而且只做那件事。所以,我们本来可以——而且其实我现在仍然在这样做,比如通过Isomorphic以及很多“AlphaFold式”的系统——一边用一种更谨慎、更科学的方式推进AGI,一边让人类先从这些系统的成果中受益,比如治疗癌症、找到新的能源、发现新材料等等。如果让我从20、30年前自己刚开始这条路的时候往回看,我会觉得,那原本应该是最理想的展开方式。
但事情并没有那样发生,因为技术发展本来就是不可预测的。事实上,后来发现,像“语言”这样的东西,比我们所有人原本预期的都要容易得多——甚至包括我们这些原本就对整项技术非常乐观的人。现在回头看会觉得有点好笑,但当时我们真以为:像语言、概念、抽象这些能力——也就是今天Gemini这样的基础模型做得极好的东西——在实现之前,也许还需要再有一两个、甚至三四个重大突破。但结果是,Transformer——这是我Google的同事们发明的——再加上一些强化学习,似乎就已经足以把像语言这样的东西“攻破”了。我们当时其实也在试这些,其他领先实验室也在试。但后来随着ChatGPT出现——公平地说,OpenAI确实做到了——他们把它规模化了,然后把它放了出来。我想,连他们自己都说,那最开始其实更像是一次科学实验、一次研究实验。他们也没料到它会迅速病毒式传播。我想,我们当时谁都没有想到。
我们那时其实也有差不多水平的系统。只是,当你身处技术开发最前沿时,你太清楚它不能做什么、它有哪些缺陷,所以你不会意识到:原来外面的人,哪怕它还会幻觉、还会犯很多我们现在依然在努力解决的问题,他们也依然会从中找到很多用途。比如总结内容、头脑风暴之类——这些今天大家都在用聊天机器人做的事。
当然,这样也有好处。第一,进展会更快。如今进展真的是快得像闪电一样。所以对所有“好的用例”来说,这当然是件好事。第二,所有观众、所有人,现在都能亲自用上最前沿的AI技术——可能只比实验室里真正最前沿的版本落后3到6个月。这本身就很令人难以置信。这也很好,因为它让每个人都可以亲身体验和前沿AI互动是什么感觉,知道它能做什么、不能做什么。我认为这对整个社会是件好事,因为它帮助大家逐步适应即将到来的巨大变化。相比于从“完全没有AGI”一下跳到“某一天突然有了AGI”,更渐进地让大家逐步接触这些系统,可能会更健康。还有最后一个我觉得也属于好处的点:你其实不可能在几百万人真实使用之前,就完全理解自己的系统。无论你的内部测试做得多好,让几百万聪明的人去尝试、去折腾、然后观察哪些问题浮上来、他们给出什么反馈,这对构建更鲁棒、更好的系统都非常重要。
所以,我觉得现在这条路既有好的一面,也有不好的一面。它并不是我多年前梦想中的那种路径——大家围绕这件事从哲学层面审慎思考,非常谨慎地走好每一步。我们现在不在那个世界里。不过,虽然我首先是一名科学家,但我同时也是一个务实的工程师。所以,我们必须接受世界现实的样子,然后尽最大努力在这个现实中把事情做好。我们现在做的,就是一方面继续推进前沿,另一方面在部署像Gemini、AlphaFold这样非常强大的技术时,尽可能做到负责任。
AlphaGo的第37手改变了一切:AI第一次以人类没见过的方式赢下复杂博弈
Cleo Abram:与此同时,另一条故事线也在展开。我还想回到你所担心的问题,回到你如何权衡那些担忧和对应代价。但在那之前,我觉得我们得先讲另一个故事:一个关于AI如何展现出极强创造力、甚至出人意料得疯狂的故事。而这个故事,就从这块木块开始。让我们回到2016年3月10日。当时,一位非常著名的围棋选手坐下来,与一个由你设计的系统对弈。在那之前,计算机已经在各种游戏中击败过人类,但围棋很特别,因为围棋中可能的走法比宇宙中的原子还多。双方一来一回地下着,然后你的系统下出了一手棋——它之所以震撼,是因为它极不可能是人类会想到的走法。第37手。你可以看到李世石坐在那里,一脸震惊,双手抱着头。我觉得,那真的是一个时刻——像你这样的人,在那一刻看见了AI中一种不同于我们前面谈到那些系统的“创造性前景”。有一类AI,是给它大量数据,让它做新的预测;当然我知道这是一种简化。但还有另一类,是你给它规则,比如数学、物理、或者围棋这样的游戏,然后它会在这些规则空间里展现出惊人的创造力。当时那一刻发生时,你人在哪里?你从那一刻看到的未来是什么?
Demis Hassabis:你描述的那个时刻,确实非常不可思议。而且,现在回头看,那几乎已经是10年前的事了——感觉却像过去了一个世纪。我其实认为,那在很多意义上就是现代AI时代的黎明。因为在那之前,也有很多AI程序能够在游戏中击败世界冠军,比如国际象棋。但那些是所谓的“专家系统”。也就是说,一群聪明的程序员和一群聪明的国际象棋特级大师坐在一起,试图把特级大师脑中的知识蒸馏成一整套规则和启发式,然后程序员再构建一个系统——像IBM当年用Deep Blue击败卡斯帕罗夫那样——依赖巨大的计算力,在超级计算机上把这些由人类专家提供的规则和启发式封装进去。然后系统再“傻乎乎地”执行这些规则,进行数以百万计的搜索,再根据这些启发式去推算哪一步最好。
而对我来说,这并不令人满意。我90年代读本科时看到这一类系统,就觉得:这不是真正意义上的AI。因为像Deep Blue这样的系统,当然,它在国际象棋上达到了世界冠军水平,但它什么别的事情都做不了。它不仅做不了语言、机器人之类的事,甚至连比国际象棋严格更简单的游戏——比如井字棋——它都不会玩。所以,这里面显然有什么不对劲。因为你不可能想象一个人类国际象棋大师学不会井字棋。这不合理,因为井字棋是严格更简单的任务。所以,问题就在于它的泛化能力非常差,而且它并不是“学会”的,而是别人把答案给了它。如果你问,像Deep Blue这样的系统里,智能到底存在于哪里?答案是:不在系统里。智能存在于国际象棋大师和程序员的大脑里。是他们把国际象棋这个问题解决了,然后再把解法实现出来。程序本身只是“傻傻地”执行解法而已。
而围棋,正如你刚才说的,是游戏领域里的最后一块高地。它是人类发明过的最复杂的游戏,也是最古老的游戏之一,本身就非常了不起,而且非常优美。在亚洲——中国、日本、韩国——围棋基本上占据了和西方国际象棋相对应的智力高地,但它又是一种更直觉化、更像艺术的游戏。你下出某些很美的形状,而这些形状恰恰会非常强。也正因为如此,这个游戏总带有一种近乎神秘的意味。顶尖棋手会说,围棋像是把宇宙的奥秘都封装进了这个游戏里。再加上它原始复杂度之高——围棋的局面数大约是10的170次方,比宇宙中的原子数量还多。这意味着,你根本不可能像对国际象棋那样,通过蛮力穷举去解决围棋。而且,因为围棋太直觉、太玄妙,所以你也很难把它归纳成那种可以轻易封装给机器遵循的规则。
你去问一位围棋大师:“你为什么下在那里?”和国际象棋大师不同,他们往往会说:“感觉对。”国际象棋大师可不会这么说。他们会说:“因为我算到了这一步、这一步、再这一步。”而那种“感觉”,显然很难直接写进程序里。你无法直接编程出那种直觉。所以,围棋是我们在DeepMind早期所开创的那些新技术——深度强化学习——的完美试验场。问题是:你能不能构建一种系统,让它直接从经验中学习?在AlphaGo里,AlphaGo一开始先看了互联网上所有人类下过的棋谱,学习人类通常会下什么样的棋。但同时,我们在它之上叠加了蒙特卡洛树搜索,让它能够从人类已有知识的基础上,继续去探索“知识之树”中新的分支,继续往前走。而这正是我们原本希望它发生的事。
所以,那场比赛真正神奇的地方在于——后来大概有2亿人观看了这场比赛——我们不仅赢了,这当然是首要目标,而且在第二局里,它下出了那个著名的第37手。那是一手充满创造力的棋。它下在棋盘第五线,而且还是在开局早期,在围棋里这几乎是个大忌。如果一位围棋老师教你下棋,你这样下,他会拍你的手,说你不能这么下,因为大家都觉得那是坏棋。但问题是,那不仅是一手好棋,而且它最终帮助AlphaGo赢下了那盘棋。大概在100手、200手以后,那颗子恰恰出现在了决定胜负的关键位置上。仿佛它早就预见到了未来,才把那颗子放在那里。所以,它不仅仅是一手令人惊讶的棋,更是后来决定全局的关键一手。当然,这也改变了所有围棋棋手后来下棋的方式。但对我来说,那一刻真正重要的是:我们花了6年构建这样的学习系统,而终于,它做到了过去任何系统都做不到的事——征服游戏AI的“珠穆朗玛峰”,也就是“能不能击败围棋世界冠军”这个终极前沿。更重要的是,它不仅赢了,而且赢的方式就是通过第37手这样的创造性新想法。而对我来说,那正是一个信号:我们已经准备好把这些方法转向科学问题了,比如AlphaFold。
从AlphaZero到AlphaTensor、AlphaChip:AI不只会预测,也会在规则空间里寻找新解
Cleo Abram:我想确认一下我是不是理解对了。之所以让想要理解未来的观众理解“第37手”和围棋这件事如此重要,是因为它意味着:如果DeepMind能构建一个做到这件事的系统,那么它也许就能构建一个能玩任何游戏的系统;它也许也能构建一个系统,在现实世界的问题里——比如量子计算、核聚变、矩阵乘法,或者芯片设计——去找出最佳解法。你能不能给我讲讲,这个方向今天的前沿是什么?你随便挑一个系统讲讲:其中“像第37手那样”的惊人、创造性的部分到底体现在哪里?
Demis Hassabis:我觉得AlphaZero很适合讲。它可以被看作是AlphaGo的进化版本。在我们赢得围棋、登顶这个领域、证明系统确实能在围棋中想出像第37手那样的新点子之后,我们进一步把这套思想泛化成了一个叫AlphaZero的系统。我认为,AlphaZero最终会被证明是一个极其重要的系统——甚至对今天也依然如此。因为在AlphaGo里,我们一开始用的是人类已经下过的所有棋谱;此外,还有一些围棋特有的东西被硬编码进系统里,比如棋盘的对称性等等。但我们想把这些假设统统拿掉,让系统真正从零开始,仿佛算法一开始根本不知道自己要做什么。这就是AlphaZero里“Zero”的意思:它像AlphaGo,但把所有人类提供的知识——无论是数据层面的,还是规则启发式层面的——都移除了。
AlphaZero一开始就像一块白板。当然,它本身还是一个学习系统,有神经网络,我们设定好参数,但没有给它任何关于围棋或其他游戏的领域知识。然后我们测试它的第一件事,就是:它能不能从零学会围棋,并打败AlphaGo?结果我们做到了。整个过程大概经过17轮“自我演化”。你可以这样想象:AlphaZero一开始是随机的。它只知道游戏规则,所以一开始当然下得很差。它先和自己下10万盘棋,生成自己的数据集。然后,它就能看到:哪些走法最后赢了,哪些输了。尽管最开始几乎是随机乱下,但总会有一些走法比另一些稍微更好一点。于是,它拿着这10万盘棋的数据,训练出“版本2”。版本2比版本1稍微好一点。这时候它虽然不再是随机了,但也仍然不算强,只是能下出“还行”的棋。然后,这些“还行”的棋又比完全随机好,再拿来训练出版本3、版本4……每一轮,新系统都会和旧系统对弈,看看它是否显著更强。结果发现,至少在围棋、国际象棋这类问题里,大概只需要16到17代,就足以从随机水平提升到超过世界冠军。
以国际象棋为例,我曾经亲眼看着这个过程实时发生,因为我自己也下棋,所以非常着迷。系统早上开始训练时还是随机乱下;到了中午,我勉强还能和它抗衡;到了下午茶时间,它就已经比所有特级大师都强;到了晚饭时间,它已经超过世界冠军了。而你就这样亲眼看着它从零完成了整个进化过程。更惊人的是,它下出的棋风非常新颖,连像Stockfish这种传统更接近专家系统、蛮力搜索型的国际象棋引擎,也没有发现过这些类型的新走法。
所以,AlphaZero是对AlphaGo思想的彻底泛化。而有意思的是,我认为今天在基础模型时代,我们实际上又需要把这类思想带回来。像Gemini这样的模型,你可以把它们看成是针对“一切”的通用模型——不仅是一个像围棋那样的狭窄游戏,而是语言、世界本身。但在这些模型之上,我们依然需要“搜索”“思考”“推理”的能力。有时候我们把这类模型称作“世界模型”。而我认为,怎么在这些世界模型之上真正实现有效的搜索与推理,这个问题今天还没有被完全解决。也就是说,要把AlphaGo式的思想重新带回来,只不过这一次不是应用到一个单独的游戏里,而是应用到整个世界模型上。
而且,也许还可以应用到科学中很多地方,比如材料设计、芯片设计、量子计算等等。你看,这里有这么多木块,真不敢相信我们居然真的同时在做这么多事,但这确实是真的。这也正是梦想所在:我热爱几乎每一个科学分支,而AI作为一种通用工具,真的可以对所有这些领域产生巨大影响。所以我得以“放纵”自己去涉猎这么多不同的科学方向。随便举一个例子:新材料设计。如果我们想得到一种具有特殊性质的材料,我们能不能超越今天材料科学已知的范畴,去找到全新的设计?我认为,AlphaGo式的过程对这件事就会非常有帮助。
Cleo Abram:所以,与“第37手”等价的那个时刻,可能就像AlphaTensor找到了一个让矩阵乘法更高效的新算法。
Demis Hassabis:完全正确,正是这样。而且最令人兴奋的是,你其实是在“算法空间”里应用这一点。这意味着算法本身会变快,于是就形成了某种循环式的自我改进。比如AlphaTensor,它只是把矩阵乘法提升了几个百分点,但你要知道,神经网络的基础几乎全部都是矩阵乘法。如果这件事哪怕只快5%,在如今整个行业花费数百亿美元训练模型的背景下,那都是巨大的成本节约。同样的逻辑也适用于芯片设计。比如一块芯片上怎么把元件布局得尽可能高效,怎么走线,这本质上有点像旅行商问题,是一种NP-hard的问题:你如何用最短路径把所有东西都连接起来?像AlphaChip这样的系统,在处理这类问题上,有时已经比人类芯片设计师还要好。所以我会说,我们现在只是刚刚开始触碰未来几年可能发生之事的表面。今天这些更通用的系统,再结合AlphaGo、AlphaZero里这类思想,我觉得它们会重新回来,而且会带来非常巨大的变化。
政府一定会使用AI:更大的风险来自滥用与更强智能体的失控问题
Cleo Abram:从AlphaFold开始的那条故事线,从AlphaGo开始的那条故事线,这两类AI都让我感到非常乐观。但我也认为,真正的乐观一定是认真去思考事情可能如何出错,以及我们能做什么来防止它出错。所以我想把另一块木块也插进来。之所以提这个,是因为它是一个实时战争游戏。而在那些系统把人类打得毫无还手之力的视频里,你可以看到工程师们在为自己系统的胜利欢呼。但当然,作为一个没有构建这套系统的人,我心里想的是:如果这是真实世界呢?而我们此刻谈话的这个时间点,正处在一个关于军队和政府使用AI的讨论极其热烈的时期。我希望这场对话在未来10年都还有意义,所以我不想讨论具体公司、也不想讨论具体服务条款。而且我觉得,在某种程度上,人们现在有点“只见树木,不见森林”了。因为从更大的图景看,各国政府一定会使用AI。所以,我真正想问的是:作为一个构建这些系统的人,如果你能挥一挥魔法棒,你会希望他们把AI用来做什么?
Demis Hassabis:首先,我认为政府应该使用AI。我们希望支持所有民主选举产生的政府。而我最希望看到他们使用AI的地方,是像改善公共卫生、改善教育这样的方向。这些领域都需要被重新思考。AI能带来的效率提升,以及它能为公民创造的公共价值,可能是惊人的。我觉得有些国家已经在这样做了,比如新加坡和阿联酋,它们就在积极拥抱这些用例。我也很希望看到AI被用在能源领域,比如优化电网。我们曾经在自己的数据中心这样做,结果仅冷却系统的能耗就降低了30%。我认为,把AI大规模应用到这些领域,会给整个社会带来巨大的收益。这一直是我所想象的方向,也是我希望政府会真正去使用AI的地方。而我们也愿意支持这些事情。
当然,现实世界的地缘政治非常复杂,而这些技术又是典型的“双重用途技术”。所以,我确实担心几类问题。如果从更大的图景来看——正如你说的,很多人会陷在细节里——但我认为真正需要担心的,大致有两类。第一类,是坏行为者。无论是个人,还是国家行为体,他们会把我们本来试图用于善的这些技术——比如治病、推进材料科学、推进能源——重新拿去做有害的事,无论是有意还是无意。第二类,是AI系统本身失控、越界,随着它们越来越强大而偏离轨道。
这还不是今天系统的状态,但也许在未来2、3、4年,尤其是当我们进入越来越强的“智能体时代”时,这会变成真正的问题。所谓“智能体”,就是那种能够自主完成整项任务的系统。我们当然想要这种东西,因为它们会非常有用,比如作为助手。但与此同时,这也意味着它们会越来越有能力、越来越自主。所以,问题就变成:作为前沿实验室之一,我们以及其他前沿实验室,要如何确保这些系统拥有足够牢固的护栏?如何确保它们真的只会去完成被明确告知的目标,而且这些目标本身足够清楚?如何防止它们绕开这些护栏,或者意外突破这些护栏?如果你去想象这些系统未来会变得多么强大、多么聪明、多么有能力,你就会意识到,这其实是一个极其艰难的技术挑战。
所以我真正担心的,更多是这两类问题。虽然3到4年严格说来根本算不上“中期”,但它们已经是现在这个阶段我觉得大家没有给予足够关注的事情了。而且我认为,如果我们真的要以对人类有利的方式走过AGI这个时刻,这些将会是我们必须认真面对的最大问题。
Cleo Abram:是的,我今天来见你时,脑子里最大的一个问题就是:下次当我再看到一条相关新闻标题时,我该如何权衡?在未来30年里,人们会担心很多事情——哪些是大家担心得过头了的?哪些又是大家担心得还远远不够的?
但说到底,我还是认为,这类问题与那些更大的问题相比,规模要小得多。真正更大的问题还是:当AGI本身变得非常强大时,我们如何确保它受到约束?我们如何真正理解这些系统随着接近AGI会具备什么能力?在这方面,我认为全行业都需要投入更多研究、更多努力。而且我非常希望看到国际合作,看到领先实验室之间围绕这些安全问题进行合作,也包括与AI Safety Institutes这样的机构、与学界合作,一起想清楚我们该如何走好下一步。因为打造这样一种技术,是人类从未经历过的事。
人类还特殊吗:意识、图灵机与现实本质仍是悬而未决的问题
Cleo Abram:如果我们继续把这件事往下推演,它的极限会是什么?你觉得,有哪些事情是人类能做而AI做不到的?你曾经把这称作你一生的核心问题。
Demis Hassabis:是的,确实如此。而且这和我很多科学偶像的思考非常相关,比如艾伦·图灵。图灵提出了图灵机的概念,那是一种理论构造,而现代计算机本质上都可以看作图灵机——也就是说,它们可以计算任何“可计算”的东西。凡是可以被描述为算法的,就能被这种机器计算。而我认为,我们正在构建的系统是“近似图灵机”。而很多神经科学家——包括我自己——也认为,也许人脑的一个不错模型,就是一种近似图灵机。于是问题就变成了:那它的极限到底是什么?当然,也有人持不同看法,比如我的朋友Roger Penrose。他认为,大脑中也许存在某种量子效应。我们围绕这个问题进行过很多非常友好的辩论。不过到目前为止,神经科学还没有发现大脑中存在量子效应。当然,这不意味着未来不会发现。但就目前而言,人们已经相当认真地找过了,还是没有发现。所以看起来,大脑里大多数运作更像是一种经典计算。如果是这样的话,那最终AI系统能做到什么、能模仿什么,好像就没有一个特别清晰的上限。
不过,我认为这最终是一个经验问题。就像“意识”一样——我觉得它本身并没有被很好地定义,但我们每个人都直觉地知道它是什么。而我觉得,我们现在踏上的这段“构建一个智能造物”的旅程,某种意义上会给我们提供一场关于人类心智的“对照实验”。在这个过程中,我们会慢慢看清:什么才是真正不同的,什么才是心智独有的。我对此保持非常开放的态度。我认为,确实有可能存在一些独特的东西。尤其是人与人之间的某些独特连接,也许永远不会被这些AI系统复制。但很多今天我们还觉得遥不可及的能力,比如长期规划、推理,甚至某些形式的创造力,我认为最终AI系统都是能够做到的。
Cleo Abram:我想坦白说一下我此刻脑子里正在发生什么。那就是:我正在做一件人类历史上一直都在做的事——我试图找出“我们为什么是特殊的”。“我们一定得是宇宙的中心。”——哦,等一下,我们不是。“那我们一定是情感上最细腻的生物。”——哦,等一下,大象也会举行葬礼。“那我们一定是能够创造艺术、具备创造性的那个存在。”——哦,等等,Gemini好像也可以。就是这种感觉:“不,我们一定得是特殊的。”当你描述这样一个未来时,你自己会不会也有这种反应?
Demis Hassabis:我觉得我们确实是特殊的。而且我认为,关于宇宙如何运作,仍然有很多深层的谜团——包括我们心智中的很多东西,也包括物理学中的很多东西。其实,这正是我小时候决定要做AI的原因。我小时候在学校里就沉迷于那些“大问题”。那时我最喜欢的学科其实是物理,因为如果你关心终极问题,通常大家会觉得你应该去学物理。但我在十几岁时读了很多科学书、很多伟大科学家的传记——像Richard Feynman就一直是我最崇拜的人之一——然后我逐渐意识到:虽然我们已经发现了很多,也知道了很多关于世界的事情,但我们仍然有太多太多不知道的东西。比如,我们甚至不知道“时间”到底是什么。这对我来说一直非常疯狂。我们就浸泡在时间里,可它究竟是什么?当然,你可以说它和熵有关等等,但这些答案在我看来都不真正令人满意。再比如,我们仍然没真正理解量子效应和引力如何统一,也没真正理解意识。
我觉得,那些我们最在乎的东西,恰恰有很多都还没搞懂。只是,大多数人好像会靠电视剧、游戏之类的东西,把自己整天分散掉注意力,不去太认真想这些问题。但我从来不是那样的人。这些深层的谜团一直都在我脑子里挥之不去。所以,我对最终答案到底会是什么保持非常开放的态度——关于究竟发生了什么,关于现实的本质。说到底,那才是我真正想追求的东西。而我希望把AI作为一种工具,帮助我们理解围绕我们的现实究竟是什么。无论最后答案是什么,我都可以接受。我想,这或许说明我确实是一个真正的科学家——我并没有预设自己想得到什么答案,我只是想知道答案本身。
如果AGI安全到来:它会先破解一批科学根问题,再把人类带向更远的未来
Cleo Abram:还有一种说法可以概括你正在做的事情:你并不是想造出一个只特别擅长这一项或那一项的系统,而是——正如你一直在说的——想造出AGI,通用人工智能。
Demis Hassabis:对,一个什么都擅长的系统。
Cleo Abram:我知道你很喜欢科幻,我也是。你能不能给我讲讲你脑海里的那部科幻电影剧情:在那个未来里,你真的把这件事做成了。
Demis Hassabis:当然。我也很爱科幻,甚至可能小时候看得太多了,也许这能解释很多事情。我最喜欢的一套作品之一,是Iain Banks的《文化》系列。我觉得它其实描绘了一个非常有意思的“后AGI世界”——虽然他没有用AGI这个词,但本质上讲的就是这个。那故事设定在一千年后,但我觉得其中一些事情,甚至在50年内都可能发生。前提是:我们安全地穿过了AGI这个时刻;它被构建出来,并真正有利于社会;它已经存在,也许甚至就在我们的口袋里;而且我们已经用它去攻克了我所谓的一些“根节点问题”。AlphaFold就是其中一个。如果你把所有知识想成一棵树,那么这些就是那些一旦被攻克,就能解锁整整一大支研究或应用的“根节点问题”。我认为还有很多其他问题也是这样,比如我们刚刚提到的核聚变,或者在常压下实现室温超导。如果这些再结合更优的电池技术等等,我相信,能源问题最终会被解决。也就是说,我们会拥有几乎免费的、可再生的、清洁的能源——不管是通过核聚变,还是更先进的太阳能。
而一旦解决了这一点,它就会真正解锁“走向群星”的能力。像Elon通过SpaceX做了很多了不起的事,但航天的最大成本仍然是燃料,也就是能量成本。如果那个成本因为我们攻克了核聚变而几乎变成零——比如我们可以从海水中制造几乎无限的火箭燃料,我们可以到处建催化工厂、海水淡化设施——那就真的会把太空彻底打开。之后,我们还能获得更多资源,因为我们可以去开采小行星。这些今天还属于科幻的事,我觉得在未来50年里都会变得非常现实。比如围绕太阳建戴森球;或者水星——它恰好就在一个合适的位置,而且材料组成似乎也很适合做这类工程——如果你仔细想想宇宙竟然是这样安排的,会觉得非常惊人。而这一切最终应该会通向人类最大程度的繁荣:我们治愈各种可怕的疾病,人们活得更久、更健康;我们走向群星,把意识带到银河系的其他地方。我觉得,那会是一个非常了不起的结果,而且我认为,它可能在未来50年内发生。
Cleo Abram:当你说这些的时候,我会觉得……我好像真的会相信你。
Demis Hassabis:至少,这就是我想努力去做的事。
如果最终被记住:希望那会是“这一生对人类有益”
Cleo Abram:这是我最后一个问题。如果有一天,在我自己的葬礼上,大家在说完“她爱她的丈夫、她的家人、她的朋友”之后,我希望他们还会说:她用自己的一生去帮助人们看见那些乐观的未来,让他们能够参与其中,推动它们更快发生,或者让它们变得更好、让更多人受益——总之,让人们能够对自己所看到的愿景采取行动。所以,我最后想问你的是:你希望人们将来会怎么评价你?
Demis Hassabis:我希望他们会说,我这一生对人类是有益的,是在为人类服务。我想,这就是我正在努力做的事。所以,如果最终能这样被记住,那也许就是最好的评价。
Cleo Abram:非常感谢你今天的时间。
Demis Hassabis:谢谢你,真的很有意思。
原视频:The Hardest Problem AI Ever Solved, with Google DeepMind CEO
https://www.youtube.com/watch?v=C0gErQtnNFE
编译:Yancheng Liu
请注意,本文编译自文未载明的原始链接,不代表Z Potentials立场。如果您对本文有任何想法或见解,欢迎在评论区留言互动探讨。