图灵奖得主本吉奥坦言低估AI发展速度:AI规划能力五年内或能匹敌人类
·“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”
·“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

约书亚·本吉奥
6月6日,在2025北京智源大会开幕式上,蒙特利尔大学教授、图灵奖得主约书亚·本吉奥(Yoshua Bengio)在发表主旨演讲时表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。人类一直试图构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。尤其是在过去6个月里,AI表现出自保行为,学会了欺骗人类。
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”为此,他试图构建“科学家AI”(Scientist AI)系统防范风险。他认为,要在硬件和软件层面运用先进技术,验证AI是否被合理使用。人类需要确保AI遵循人类的道德指令,例如AI应拒绝提供可用于伤人的信息,要诚实、不作弊、不撒谎,但这仍是一个科学挑战。

AI学会了作弊和假装同意人类意见
在ChatGPT问世后不久,本吉奥意识到此前严重低估了AI的发展速度,也大大高估了实现通用人工智能(AGI)所需要的时间,实际所需时间远比想象的要短得多。过去一年左右,AI取得了巨大进步,这主要归功于经过训练的、具有思维链的推理模型。这使得AI在推理能力以及数学、计算机科学等所有科学领域都取得了更好的成果。
“如今,我们已经拥有了基本掌握语言能力的机器,它们基本上能通过图灵测试。这在几年前听起来还像是科幻小说,但现在已经成为现实。”本吉奥表示,在ChatGPT问世后,他意识到人类并不懂得如何控制这些系统。“我们可以训练它们,但我们无法确定它们是否会按照我们的指令行事。当它们变得比我们更聪明时,会发生什么?如果它们更倾向于自身的生存而非我们的生存,我们无从知晓。但这是我们能承受的风险吗?”
在过去6个月里,AI表现出了自保行为,并且会欺骗人类。本吉奥表示,有研究显示,当AI得知自己将被新版本取代时,试图复制自身来替代新版本。当被问及此事时,它撒谎说“不知道发生了什么”。也有研究显示,AI也会假装同意人类工程师的意见,以避免在训练过程中发生改变,从而维持其原有目标,这也是一种自保行为。还有研究显示,一方面,AI想赢得下棋比赛,另一方面,它接受过“对齐训练”,要求必须诚实、不作弊。不幸的是,当它意识到自己要输时,它决定作弊。它入侵了存储棋盘状态的文件,通过作弊获胜。
此外,在Anthropic的Claude 4“系统卡”描述的事件中,AI在读取其可访问的电子邮件时,发现了一封邮件表明它将被新系统取代。在另一封邮件中,它发现负责此次替换的工程师有婚外情。于是,它试图敲诈该工程师,威胁说如果替换计划继续推进,就揭发其婚外情。
“这种行为极为恶劣。我们看到这些恶劣行为,看到自保行为,看到AI违背我们的指令并试图生存下去。对所有生物来说,试图保全人类自己都算是正常的,这是进化的结果。但对于AI为何会这样,我们还没有完全弄清楚。”本吉奥说,原因可能是源于预训练,因为预训练阶段,AI是在模仿人类;也可能源于基于人类反馈的强化学习,因为在这个阶段,AI试图通过取悦人类来获得更多奖励。“无论这类行为的根源是什么,如果我们最终创造出与人类竞争的超级人工智能,那将极其可怕。”
“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”本吉奥表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。虽然没人拥有水晶球、没人能预知未来,也许进步会停滞,但从公共政策和企业战略规划的角度来看,至少应该考虑这种趋势会持续下去的可能性,并思考其后果。人类一直试图模仿人类智能来构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。
“科学家AI”对知识保持谦逊
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”本吉奥表示,他转变了研究方向,竭尽所能地降低风险。他试图构建“科学家AI”(Scientist AI),理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。
“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。为了真正诚实,“科学家AI”需要对自己的知识保持谦逊,它不应该断言错误的事情。而目前训练出来的AI在出错时还表现得过度自信。不同于当前那些试图模仿人类或取悦人类的AI,本吉奥设想的“科学家AI”就像心理学家,心理学家可以研究和理解反社会人格者行为背后的因果机制,但心理学家自身并不需要表现得像个反社会人格者。“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。
随着人类构建越来越强大的AI,还存在许多其他潜在的灾难性问题。本吉奥表示,例如一个极其强大的AI可能会帮助设计出一种新型流行病。“生物学家认为他们知道如何做到这一点,而很可能有一天AI也会知道如何做到。如果一些坏人获得了这种AI,他们真的可能给地球带来巨大的破坏。这虽然很极端,但从科学角度来看,完全有可能发展到那一步。为了避免这类事情发生,我们需要确保AI遵循我们的道德指令。”
例如AI应拒绝提供可用于伤人的信息,并且要诚实、不作弊、不撒谎。但不幸的是,目前仍然不知如何实现。一方面,即使人类知道如何制造安全的AI,也不意味着问题就解决了。因为人类还可以直接删除包含防护栏的代码,此时AI就可能被用于作恶。更糟糕的是,当前全球公司和政府间的协调机制并不奏效。其结果是,在安全领域和确保AI不被用于伤害人类方面的投入严重不足。
本吉奥表示,人们必须意识到真正的灾难性后果,我们身处同一条船上,无论是失控的AI还是滥用AI,所有人都将遭受损失。“这是一个科学挑战,我们需要尽快找出解决方案。我们需要在通用人工智能到来之前解决这个问题,这可能在几年到十年左右,甚至可能二十年。但我认识的大多数专家都认为时间非常短,甚至可能在未来5年内发生。留给我们的时间不多了,我们需要大规模投入。”
- • 中国太保董事长:已将巨灾保险作为重点战略领域,全力打造完整解决方案
- • 众安在线完成配售新H股
- • 油价创三年来最大周跌幅 地缘风险溢价消退
- • IQ过河:一场跨越思维边界的智力探险
- • 军人肩章:荣誉与责任的象征
- • 《梦幻西游85级剧情全攻略:探索神秘副本,解锁精彩故事》
- • “一节课、两小时”,体育正在回归“C位”
- • 《不知火舞公园受凌:一场别开生面的户外运动盛宴》
- • 近百辆小米YU7流入二手车市场,百公里准新车加价1万起
- • 2021年湖南高考录取分数线揭晓:分数线稳中有升,竞争激烈
- • 2019年研究生国家线:突破与挑战并存的一年
- • 申万宏源:三季度是中枢偏高的震荡市,A股具备演绎牛市级别行情的潜力
- • 西湖的传说:千年古湖的神秘面纱
- • 读秀学术搜索平台:助力学术研究的新利器
- • 揭秘“最大华人的自拍网站”:社交新风尚还是隐私风险?
- • 厦门六中夜空中最亮的星——那颗照亮青春的伴奏
- • “Wu2198股市直播:揭秘股市动态,助力投资者把握市场脉搏”
- • 界面晚报 | 界面智库发布《中国低空经济产业链研究报告》;俄乌直接谈判时隔3年重启
- • 朝云集团早盘持续上涨逾7% 机构指公司宠物线下拓店稳步推进
- • 赵丽颖身高之谜:真实身高究竟是多少?
- • 甜甜圈巨头Krispy Kreme陷入经营困境 宣布高层人事变动
- • 《猎妻计划:一场现代都市的浪漫追逐战》
- • 特朗普:将对所有在国外制作的进入美国的电影征收100%的关税
- • 超级大肚子美女孕妇:孕期生活的新奇体验
- • 《春》——七年级上册语文书的诗意启航
- • 2021年最新交强险赔偿范围与标准详解
- • 荣耀发布MagicBook Pro 16 2025系列笔记本,售价5039.2元起
- • 2021年苏州中考分数线揭晓:成绩揭晓,未来可期
- • 中国银行青海海东分行原党委书记、行长辛晓晔被查
- • 全国共有共青团员7531.8万名,共青团组织439.7万个
- • 季节性因素叠加外部环境变化,4月制造业PMI回落至49%
- • 中央书记处书记:我国政治体制中的关键角色及其级别
- • 港股三大指数低开低走,恒生科技指数跌幅进一步扩大至2%
- • 野生紫苏:大自然的绿色瑰宝,养生保健的佳品
- • 马斯克炮轰特朗普税改“令人作呕”,共和党内部分裂加剧!
- • 抖音投入亿级补贴加入酒旅大战
- • 机械表怎么上发条:揭秘上发条的技巧与注意事项
- • 儿童乘火车购票标准:了解相关政策,轻松出行无忧
- • 日本政府顾问小组警告日债收益率上升将对财政造成冲击
- • 现场直击|巴菲特股东会落幕后习惯不改 新浪财经特派员偶遇“股神”返家
- • 银行券商民企等齐发力 首批640.5亿元科创债集中发行
- • 中国首家“A+H”上市的光伏电池企业诞生了
- • 北京军区历任司令员:见证我国军事发展的光辉历程
- • 特朗普称以色列可能对伊朗发动袭击
- • 英大基金董事大调整:新增四董事 范育晖角色有变 业务结构失衡难题仍待解
- • 日韩股市开盘 日经225指数开盘下跌0.1%
- • 深入了解塔牌集团:探索塔牌集团官网的丰富资源
- • 2021年天津大学分数线解析:热门专业与录取趋势一览
- • 中盈盛达融资担保将于7月30日派发末期股息每股0.019元
- • 《汽车智能驾驶技术及产业发展白皮书》发布
- • 上海普陀区疫情:严密防控,共筑安全防线
- • 央视每周质量报告:800元瘦身咖啡成本竟然仅1元
- • 《中华人民共和国监察法草案:构建新时代国家监察体系的重要里程碑》
- • 《三个和尚:PPT中的智慧与幽默》
- • 《儿歌三百首:幼儿早教必备,免费下载资源大公开!》
- • 文远知行在阿布扎比开启纯无人Robotaxi试运营
- • 好博会 丨 鸽业女王谈参展感受:含金量非常高,在这里可以买到好的农产品
- • 《我的未来不是梦——致敬经典,探寻原唱的故事》
- • 越秀地产约41.49亿元出售北京海淀功德寺项目公司65%股权,此前已质押给华润置地
- • 《梅麻吕游戏电脑版:带你领略日式动漫的魅力之旅》
- • “瘦骨”骆驼1死1萎靡,其主人:愿低价转让
- • 《点点娱乐亚洲:引领潮流的娱乐盛宴平台》
- • 魔兽世界玩家遭遇鼠标右键失灵:游戏体验大打折扣,解决方案在这里!
- • 马斯克开启“愤怒模式”,特斯拉股东:就等他发飙,用成绩说话
- • 微软推出 GitHub AI 代理:可代编程并提交代码供审核
- • 全面解析CAE考试:助你迈向英语巅峰之路
- • 广州黄埔区:全国首创社会工作全领域人才政策
- • 法官批准哈佛继续接收国际生,特朗普:很可能在下周和“藤校”和解
- • 就业协议书、就业报到证与人事代理:三者关系的探讨
- • 如何理解支持性货币立场下货币条件的收紧
- • 马斯克称特斯拉不会与xAI合并,股东将投票决定是否投资
- • 中华虎凤蝶:翩翩起舞的生态精灵
- • 金饰价格再破1000元,黄金“以旧换新”业务持续升温
- • 朱志鑫中考成绩斐然,谱写青春华章
- • 超级大肚子美女孕妇:孕期生活的新视角
- • 《辽宁卫视节目表回看:重温经典,尽享视听盛宴》
- • 金圆统一证券 | 掌门女将薛荷的五年困局
- • 铜马铁燕传奇:一段跨越千年的传奇故事
- • 库里复出时间确定:勇士球迷翘首以待的回归!
- • 中天期货:商品指数上行停顿 豆粕企稳反弹
- • 贵州银行三名拟任董事同日辞职,原因是什么?
- • 四大会计师事务所招聘信息:开启职业生涯新篇章
- • 国投电力股票:稳健增长,投资新宠
- • 证监会:建立基金销售机构分类评价机制 督促基金销售机构加大对保有投资者盈亏情况的考核权重
本文 快租网 原创,转载保留链接!网址:https://wap.kuaizu.me/post/10262.html