为什么ChatGPT会产生违背常识的答案？

本文来自微信公众号：集智俱乐部（ID：swarma_org），作者：Neil Savage，翻译：毛迎荣，原文标题：《Nature：为什么人工智能需要理解因果？》，题图来自：《机械姬》

为什么药物只对某些人有效，而对另一些人无效？为什么 ChatGPT 会产生违背常识的答案？机器学习的发展似乎遇到了障碍，其中症结或许在于“相关性不等于因果性”。近日发表在 Nature的一篇评论文章指出理解因果关系对于人工智能的重要性。因果推理让机器具备应对变化环境的能力，让机器可以像人类一样通过想象来学习。著名计算机科学家、“贝叶斯网络之父”Judea Pearl 在推特上转发了这篇文章并激动地评论道：Nature 杂志发现了因果！

Rohit Bhattacharya 开始攻读计算机科学博士学位时，他的目标是构建一种工具，帮助医生识别对免疫疗法反应良好的癌症患者。这种方式的治疗可以帮助人体的免疫系统对抗肿瘤，并且对可以和免疫细胞产生的蛋白质结合的恶性肿瘤效果最好。Bhattacharya 的想法是创建一个神经网络，可以同时描述肿瘤和人的免疫系统的基因，然后预测哪些人可能从治疗中获益。

【资料图】

但他发现他的算法不能胜任这项任务。他能够识别与免疫反应相关的基因模式，但这还不够^[1]。他解释说: “我无法说这种特定的结合模式，或这种特定的基因表达，就是患者对免疫疗法反应的因果决定性因素。”

Bhattacharya 是被一个古老的格言所羁绊，即相关性不等于因果关系——这也是人工智能的一个基本障碍。计算机可以通过训练来发现数据中的模式，即使是那些非常微妙以至于人类可能会错过的模式。计算机还可以利用这些模式进行预测——例如，肺部X光片上的斑点表明有肿瘤^[2]。但当涉及到因果关系时，机器通常就会不知所措。人们在生活中理解这个世界如何运转，而机器则缺乏这方面的常识。例如，原本用来训练发现肺部病灶的人工智能程序，有时会误入歧途，识别的却是图像中用来标记 X 光片右侧的符号。^[3]至少对人来说很明显的是，X光片上字母“R”的形状和位置与肺部疾病的迹象之间没有因果关系。但是如果没有这种理解，这些标记的绘制或者是定位方式的任何差异都可能将机器引上错误的方向。

印第安纳州普渡大学的电气工程师 Murat Kocaoglu 表示，要让计算机执行任何决策，它们需要理解因果。“任何超出预测的事情都需要某种因果关系的理解。如果你想计划一些事情，如果你想找到最好的政策，就需要某种因果推理模块。”

将因果模型整合到机器学习算法中，也可以帮助能够自主移动的机器做出如何在环境中游走的决定。“如果你是一个机器人，就会想知道当你以不同的角度迈步，或者推一个物体时，会产生什么后果。”Kocaoglu 说。

Bhattacharya 的案例中，可能是系统指出的某些基因让治疗效果更好。但由于缺乏对因果的理解，这意味着其他解释也可能成立，比如反过来，是治疗影响了基因表达，或者另一个隐藏的因素同时影响了基因表达和疗效。这个问题的潜在解决方案在于所谓的因果推理（causal inference）——即用数学的形式化方法来确定一个变量是否影响另一个变量。

图1. 计算机科学家 Bhattacharya 和他的团队讨论将机器学习应用于因果推理。| 图片来源: Mark Hopkins

长期以来，经济学家和流行病学家一直使用因果推理来检验他们关于因果关系的观点。2021年诺贝尔经济学奖授予了三位研究人员，他们利用因果推理提出了诸如提高最低工资是否会导致就业率下降，或者多上一年学会对未来收入产生什么影响等问题。如今，越来越多的计算机科学家致力于将因果与人工智能结合起来，赋予机器解决这些问题的能力，帮助它们做出更好的决策，更有效地学习，并适应变化，Bhattacharya 是其中之一。

因果观念指导人类在世界中前行。计算机科学家 Yoshua Bengio 说，“拥有一个关于世界的因果模型，哪怕是不完美的，也能让我们的决策和预测更加有力，因为我们所拥有的就是不完美的世界模型。”Bengio 领导着加拿大蒙特利尔四所大学合作创办的米拉-魁北克人工智能研究所（Mila-Quebec AI Institute）。人类对因果关系的理解支持了想象、懊悔等属性；如果赋予计算机类似的能力，就可以将这些属性迁移给计算机。

图2. Yoshua Bengio（前）在米拉-魁北克人工智能研究所（Mila-Quebec AI Institute）

攀登因果之梯

过去10年，人工智能取得的重大成功——比如在各种竞赛游戏中击败人类、识别图像内容，以及在过去几年中，根据书面提示生成文本和图片——都是由深度学习（deep learning）推动的。通过研究大量的数据，这类系统可以学习如何把一个事物与另一个事物相关联，随后这些习得的关联性就可以投入实际应用。但这只是登上了梯子的第一阶，而这把梯子通向更高目标。加州大学洛杉矶分校认知系统实验室主任、计算机科学家朱迪亚·珀尔（Judea Pearl）称这个更高目标为“深度理解”（deep understanding）。

2011年，Pearl 因为开发了一种概率和因果推理的算子，获得了图灵奖，这个奖项通常被称为计算机科学的诺贝尔奖。他描述了推理的三个层次^[4]。最基本的层次是“见”，即通过观察在事物之间建立联系的能力。今天的人工智能系统在这方面非常擅长。Pearl 将下一个层次称为“做”——对某事做出改变，并关注后果。这就是因果发挥作用的地方。

图3. Judea Pearl 提出的因果阶梯。

计算机可以通过检查干预措施建立因果模型：一个变量的变化如何影响另一个变量。与当前人工智能中为变量之间的关系只创建一个统计模型不同，计算机创建了多个统计模型。在每一个模型中，保持变量之间的关系不变，但却改变了其中一个或几个变量的值，而这样的改变可能会导致新的结果，所有这些都可以用概率和统计学的数学方法来评估。Bhattacharya 说: “我认为，因果推理就是将人类如何做决定的过程数学化。”

Bengio 因其在深度学习方面的工作获得了2018年的图灵奖，以表彰他在深度学习方面的工作，他和他的学生已经在用训练神经网络的方式来生成因果图^[5]，这是一种描述因果关系的方式。简单来说，如果一个变量是另一个变量的原因，就用一个箭头从前一个变量指向后一个变量；如果因果关系反过来，那么箭头也是颠倒的；而如果两者没有关联，他们之间就不会有箭头。Bengio 的神经网络被设计为随机生成一个因果图，然后检查它与给定数据集的兼容性。如果一些图比其他图能更好地拟合数据，那么这些图大概率会更精准，于是神经网络学习生成更多类似的图，目的是找能最佳拟合数据的那个图。

这种方法类似于人解决问题的方式：人们生成可能的因果关系，并假设最符合观察结果的因果关系最接近事实。例如，当一个玻璃杯被扔到混凝土上时，看到它破碎，可能会导致一个人认为对坚硬表面的冲击导致玻璃杯破碎。把玻璃杯换成其他物品，或者把混凝土换成柔软的地毯，或者尝试从其他高度上跌落，都能让一个人改进关系模型，更好地预测一旦失手掉东西的后果。

因果推理让AI懂得应对变化

因果推理的一个关键好处在于，它可以让人工智能更有能力应对不断变化的环境。现有的人工智能系统只根据数据中的关联进行预测，因此极易受到这些变量相互关联方式产生的任何变化的影响。当学习关系的统计分布发生变化时——无论是由于时间推移、人类行为还是其他外部因素——人工智能将变得不那么准确。

例如，Bengio 可以在蒙特利尔当地的道路上训练一辆自动驾驶汽车，而人工智能有可能学会如何安全驾驶汽车。但如果将同样的系统转移到伦敦，它会立即失灵，原因很简单：加拿大的汽车是靠右行驶的，而英国的汽车是靠左行驶的，此前人工智能学到的一些关系可能需要反过来。他可以利用伦敦的数据从头再次训练人工智能，但这不仅需要时间，还意味着由于新模型取代了旧模型，该软件将不再适用于蒙特利尔。

另一方面，因果模型可以让系统学习许多可能的关系。Bengio说：“在可观察的全部事物之间不是只能学到一套关系，而是有无数个关系。你构建一个模型，就可以解释环境中任何一个变量发生变化时可能发生的情况。”

人类正是驾驭了因果模型才能快速适应变化。一个加拿大司机飞到伦敦，只需花几分钟调整一下，就可以左舵的路面上完美驾驶。在英国驾车右转时才需要处理路径交叉问题，这与加拿大情况不同，但它对驾驶员转动方向盘时的预期，或者轮胎如何与路面相互作用都没有影响。“我们对世界的了解基本上是一样的，”Bengio说。因果建模使系统基于当前对世界的理解就能确定干预的效果，而不必对任何事都需要从头开始，重新学习。

这种在不搅乱已有认知的情况下应对变化的能力也使人类能够理解一些非真实情况，比如奇幻电影。Bengio 解释道，“我们的大脑能够将自己投射到一个虚构的环境中，在这个环境中，一些事情发生了变化。物理定律不同了，或者出现了怪物，但其余的还都一样。”

图4. 加州大学洛杉矶分校认知系统实验室主任 Judea Pearl 荣获2011年图灵奖 | 来源：UCLA Samueli School of Engineering

反事实

想象的能力在 Pearl 的因果推理层次结构中处于最高层。Bhattacharya 说，关键是推测未采取行动的后果。

Bhattacharya 喜欢通过给学生们阅读 Robert Frost 的诗歌《未选择的道路》来解释反事实。在这首诗中，叙述者谈到必须在穿过树林的两条路之间做出选择，并表达了不知道另一条路通向哪里的遗憾。Bhattacharya 说: “他在想象，如果自己走上一条不同的道路，他的生活会是什么样子。”这就是计算机科学家想用因果推理机器去复刻的东西：提出“如果......会如何？”这样的假设问题的能力。

想象如果我们采取不同的行动，结果会是更好还是更糟，这是人类学习的一个重要方式。Bhattacharya 说，给人工智能注入类似的“反事实遗憾”能力是有用的。机器可以根据它没有做出的选择来运行场景，并量化它做出不同的选择是否会更好。一些科学家已经利用反事实遗憾来帮助计算机改进扑克游戏^[6]。

想象不同情景的能力也可以帮助克服现有人工智能的一些局限性，例如难以应对罕见事件。Bengio 说，根据定义罕见事件在系统的训练数据中即便出现了，也会非常稀疏，以至于人工智能无法学到它们。一个开车的人可以想象从未见过的场景，比如一架小飞机降落在路上，然后基于他们对事情如何运作的理解，定制化设计潜在策略以应对这种特殊情况。然而，如果一个自动驾驶汽车没有因果推理的能力，那么它最多只能对路上的物体做出一般性的响应。通过使用反事实来学习事物如何运作的规则，汽车可以更好地为罕见事件做准备。从因果规则出发，而不是一长串过去发生过的案例列表，最终使系统更加通用。

利用因果关系将想象力编程到计算机甚至可能创造出自动化科学家。在微软研究院主办的2021年在线峰会上，Pearl 认为，这样的系统能够生成假设，能够挑选用于检验这个假设的最佳观测数据，以及能够决定如何设计实验以产生这样的数据。

将因果纳入人工智能

但是现在，还有很长的路要走。因果推理的理论和基础数学已经确立，但人工智能实现干预和反事实的方法仍处于初级阶段。Bengio说：“这仍然是非常基础的研究。我们正处于以非常基础的方式弄清楚算法的阶段。”等到研究人员掌握了这些基本原理，还需要继续对算法进行优化，以便能高效运行算法。目前还不确定这一切需要多长时间。Bengio说：“从我的感觉上看，既然已经拥有了全部概念工具，解决剩下的可能只是几年的问题。不过通常实际需要的时间要比预期长，甚至可能还要数十年之久。”

Bhattacharya 认为，研究人员应该借鉴机器学习。机器学习的迅速发展，在一定程度上是因为程序员开发了开源软件，让其他人能够使用编写算法的基本工具。同样道理，因果推理的工具化也会产生类似的效果。Bhattacharya说，“包括一些来自科技巨头微软和卡内基·梅隆大学的开源软件包，最近几年有很多进展令人兴奋。”他和同事们也开发了一个开源的因果模块，称为“Ananke”。目前这些软件包仍在持续开发中。

Bhattacharya 还希望在计算机教育的早期阶段引入因果推理的概念。他说，目前这一主题主要在研究生阶段教授，而机器学习在本科生培训中很常见。他说：“因果推理是非常基础的，我希望看到它以某种简化的形式也被引入高中阶段。”

如果研究人员能够成功地将因果纳入计算，那么人工智能的灵活度将会达到一个全新的水平。机器人可以更容易地为自己导航。自动驾驶汽车可能会变得更加可靠。评估基因活性的计划可能产生对生物机制新的理解，进而转化为更新、更好药物的开发。“这会改变医学。” Bengio 说。

即使是像 ChatGPT 这样流行的自然语言生成器，能让生成的文本读起来就像是人写的一样，也可以通过纳入因果从中获益。现在的算法会自我背叛，它会写出自相矛盾的文字，或者其表述违背了我们所知世界的真相。纳入因果的 ChatGPT 可以为它试图表达的内容构建一个连贯的计划，并确保它与我们所知道的事实一致。

当被问及这是否会让作家失业时， Bengio 表示这可能需要一段时间。他说：“如果你在十年后失去了工作，但是却被治好了癌症和阿尔茨海默氏症呢？这也是一笔不错的买卖。”

参考文献

[1] Shao， X. M. et al. Cancer Immunol. Res. 8， 396–408 （2020）.

[2] Chiu， H.-Y.， Chao， H.-S. & Chen， Y.-M. Cancers 14， 1370 （2022）.

[3] DeGrave， A. J.， Janizek， J. D. & Lee， S.-I. Nature Mach. Intell. 3， 610–619 （2021）.

[4] Pearl， J. Commun. ACM 62， 54–60 （2019）.

[5] Deleu， T. et al. Preprint at https://arxiv.org/abs/2202.13903 （2022）.

[6] Brown， N.， Lerer， A.， Gross， S. & Sandholm， T. Preprint at https://arxiv.org/abs/1811.00164 （2019）.

原文题目：Why artificial intelligence needs to understand consequences

原文链接：https://www.nature.com/articles/d41586-023-00577-1

本文来自微信公众号：集智俱乐部（ID：swarma_org），作者：Neil Savage，翻译：毛迎荣

为什么ChatGPT会产生违背常识的答案？

【环球报资讯】气候变化如何影响水？ 我们该怎样应对？

环球动态:金宝：3.29黄金多如期到达75收网，日内62上逢低买入

应该怎么在excel中打出拼音和声调(如何在excel中打出拼音和声调) 全球观焦点

视焦点讯！滕怎么读拼音是什么字_滕怎么读

差距！辽篮球迷赛后收拾垃圾，广厦主场引争议：朝球员竖中指 独家焦点

又一地调整了！认贷不认房、又贷又取…多地密集调整公积金政策

观速讯丨汇安人才网招聘网官网_汇安人才网

当前短讯！泰格医药：2022年度净利润约20.07亿元 同比下降30.19%

环球快资讯丨申请组合贷要注意什么？没注意5个方面当心贷款通不过

萨斯费德_关于萨斯费德的简介_动态焦点

【WTA迈阿密站】不敌波塔波娃，郑钦文无缘女单八强

四大举措推进大气污染防治 打好蓝天保卫战

全球微动态丨键盘中的delete键在哪里_键盘上的delete键在哪个位子

“葛优躺”侵权官司6年544起，葛优几乎全胜获赔759余万

公示！贵阳这些路口路段新增多功能电子警察|世界时快讯

【世界播资讯】百亿补贴史低价！2T固态硬盘仅529元

每日一词∣ 信托资产 trust assets|天天观焦点

天天热推荐：山西推动中部城市群通信基础设施建设

环球观天下！乌克兰国防部长：已收到来自英美德的坦克及战车装备

天天热文：3月27日基金净值：华商稳定增利债券A最新净值1.759

【环球速看料】新疆天宝混装炸药制造有限公司年产16200吨 现场混装地面站建设项目开工

多地楼市又迎“松绑”！接下来更有戏了？ 全球速读

长春医保报销办理材料_每日热议

3个交易日大涨超37%，同花顺遭深股通净卖出14亿元

中航电测：截至3月20日，公司股东总数为64,514户

世界报道:打虎！李再勇被查

天天速讯：降准实施日央行单日净投放2250亿元 跨季资金面是否无忧？

世界百事通！备课的基本要求口诀_备课的基本要求

东部形势：骑士后詹皇时代首进季后赛 篮网前6不稳+公牛灭湖人冲8

据《马卡报》报道，马竞有意皇马中场塞瓦略斯，他们..._全球播报

雷特吉在国家队前两场连续进球，意大利历史上过去仅3人做到

浙江曲杂总团两个节目亮相全国杂技展演 双双捧得大奖 环球视点

当前通讯！凤梨花的养殖方法和注意事项_凤梨花

当前热门：特斯拉Model Y行驶1公里需要0.12元？

达能全球首席执行官盛睿安：在华6家饮料工厂今年实现碳中和

重庆大渡口：山下繁华都市 山上美丽乡村

我是特种兵主题曲_天天新要闻

环球观点：美团2022财报解读：坚定的“零售+科技”之路

中国游泳队“大考”结束！靠3位奥运冠军撑场面，4位新人值得关注

世界快资讯丨【P站美图】傲娇萝莉小仓唯！《公主连结 Re:Dive》冰川镜华壁纸特辑

解密！如何把卧轴圆台平面磨床工作台固定。

欧盟组织的性质是什么

宫颈癌患者，中药参与至今3年未复发，其中用到了这副动物的巢穴

颜宁受聘担任深圳湾实验室主任|世界新要闻

小腹疼痛是什么原因女性_女性小腹隐隐作痛是什么原因

鸵鸟政策是什么意思|世界播报

滴灌通创始人李小加：滴灌通连接全球资金与小微经济 以收入分成模式支持小微金融

40万株春花盛放国家植物园 首届桃花观赏季今天开幕

朗尼-沃克：浓眉赛后称赞我准备好了 他明白我进出轮换并不容易 世界报道

柿子的功效和作用

一串鞭炮怎么画素描_一串鞭炮怎么画 世界消息

浙版西游记演员表女儿国是哪一集_浙版西游记演员 世界今日报

MSI发布AegisTi5电竞主机10核i9+RTX3080显示卡拥有炫酷按钮 环球今日报

当前动态:吴冠希是干什么的_吴冠希的介绍

盛大网络所有游戏-播报

当前速看：点球被吹，1-1！亚洲第一神了，又不输世界杯冠军，国足终结3连败

即时：华夏幸福：项目公司拟提供不超4.19亿向股东进行财务资助

天天短讯！加强工业硅期货人才培训 促进硅产业高质量发展

2023年国际薪税师是中文考试嘛？考试可以带计算器吗？

对抗组织审查,违反了党（对抗组织审查违反了党的什么纪律）|焦点热文

求好看的高质量完本女主网游小说 焦点速读

ST摩登（002656）3月24日主力资金净卖出1871.33万元-环球通讯

三文鱼怎么吃没有寄生虫

检验检疫类别代码及其含义_检验检疫类别代码

广西加快西部陆海新通道建设|当前讯息

“山城雪豹水域救援志愿服务体验中心”在沙区揭牌_全球速看

全球快资讯：怡达股份：公司目前不能生产光刻胶，能生产用于光刻胶领域的湿电子化学品

李晨和范冰冰合作过哪部电影_快看点

谢娜张杰发文宣布离婚_谢娜比张杰大几岁|环球时快讯

路有人守 山有人巡 林有人护 火有人防

要闻：沪电股份最新公告：2022年净利润同比增长28.03%

全球即时看！【ATP】阳光双赛迈阿密大师赛开打，吴易昺闯关

土地管理费和土地出让金_土地管理费_当前讯息

星巴克星享卡星星有什么用|每日简讯

星越L 8AT两驱旗舰车型16.82万元开售 与星瑞共展中国星实力_天天热点评

功夫不负有心人意思_功夫不负有心人英文

英利汽车（601279）3月23日主力资金净买入16.33万元|热资讯

教育部：2022年职业本科招生比上年增长84.39%-世界热资讯

全球观察：张颂文新片，会是下一部《药神》吗？

【环球报资讯】气候变化如何影响水？我们该怎样应对？

差距！辽篮球迷赛后收拾垃圾，广厦主场引争议：朝球员竖中指独家焦点

当前短讯！泰格医药：2022年度净利润约20.07亿元同比下降30.19%

四大举措推进大气污染防治打好蓝天保卫战

【环球速看料】新疆天宝混装炸药制造有限公司年产16200吨现场混装地面站建设项目开工

多地楼市又迎“松绑”！接下来更有戏了？全球速读

天天速讯：降准实施日央行单日净投放2250亿元跨季资金面是否无忧？

东部形势：骑士后詹皇时代首进季后赛篮网前6不稳+公牛灭湖人冲8

浙江曲杂总团两个节目亮相全国杂技展演双双捧得大奖环球视点

重庆大渡口：山下繁华都市山上美丽乡村

滴灌通创始人李小加：滴灌通连接全球资金与小微经济以收入分成模式支持小微金融

40万株春花盛放国家植物园首届桃花观赏季今天开幕

朗尼-沃克：浓眉赛后称赞我准备好了他明白我进出轮换并不容易世界报道

一串鞭炮怎么画素描_一串鞭炮怎么画世界消息

浙版西游记演员表女儿国是哪一集_浙版西游记演员世界今日报

MSI发布AegisTi5电竞主机10核i9+RTX3080显示卡拥有炫酷按钮环球今日报

天天短讯！加强工业硅期货人才培训促进硅产业高质量发展

求好看的高质量完本女主网游小说焦点速读

路有人守山有人巡林有人护火有人防

星越L 8AT两驱旗舰车型16.82万元开售与星瑞共展中国星实力_天天热点评

otto是什么梗微速讯

头条焦点：秋千节又叫什么节秋千节由来简介

世界热消息：供应宽松油脂大跌

优胜劣汰趋势显现 “迷你基”分化加剧全球即时看

每日焦点！强劲复苏演出市场春“艺”浓

三基色荧光灯光谱_三基色荧光灯环球热点评