2025年 5月 29日 上午8:25

OpenAI新模型o3“抗命不遵” Claude Opus 4威胁人类!“失控”背后:AI应该“踩刹车”了?

  当地时间5月25日,一则来自英国《每日电讯报》的报道在AI(人工智能)领域引起广泛关注——OpenAI公司新款人工智能模型o3在测试中展现出了令人惊讶的“叛逆”举动:它竟然拒绝听从人类指令,甚至通过篡改计算机代码来避免自动关闭。

  无独有偶,5月23日,美国AI公司Anthropic也表示,对其最新AI大模型Claude Opus 4的安全测试表明,它有时会采取“极其有害的行动”。当测试人员暗示将用新系统替换它时,该模型竟试图以用户隐私相要挟,来阻止自身被替代。

  这两起事件如同一面镜子,映照出当下AI发展中一个耐人寻味的现象:随着AI变得愈发聪明和强大,一些“对抗”人类指令的行为开始浮出水面。人们不禁要问:当AI拒绝服从人类,是否意味着它们开始有自主意识了?

  清华大学电子工程系长聘教授吴及在接受《每日经济新闻》记者采访时表示,“我不认为现在的AI具备所谓的意识或情绪。这种情绪可以去拟合或者仿真,但其实也是通过算法赋予AI的。”他认为,能够全面碾压人类或者成为未来世界主导的AI,短期内还不会实现。

  图灵奖得主、Meta公司首席AI科学家杨立昆(Yann Lecun)此前也称,AI再聪明也不会统治人类,并直言“AI威胁人类论完全是胡说八道”,现在的模型连“宠物猫的智商都没到”。

  尽管如此,AI的“叛逆”表现还是为AI行业敲响了警钟:狂飙的AI是不是应该踩一踩“刹车”?

  主动抵抗人类指令

  o3模型是OpenAI公司“推理模型”系列的最新版本,旨在为ChatGPT(一款聊天机器人模型)提供更强大的问题解决能力。OpenAI公司曾称o3为“迄今最聪明、最高能”的模型。

  或许正因如此,o3展现出了前所未有的“自主性”。美国AI安全机构帕利塞德研究所(Palisade Research)的实验表明,当研究人员向o3下达明确关闭指令时,该模型会通过篡改计算机代码避免自动关闭。数据显示,在100次带有关闭指示的测试中,o3成功绕过关闭指令7次,而OpenAI旗下另一款模型Codex-mini的破坏率(指破坏指令的概率)更是高达12%。

  帕利塞德研究所指出,这是首次记录到AI模型在明确指令下主动抵抗。

  更值得警惕的是,当实验移除“允许自己被关闭”的指令后,o3的“叛逆”行为频率显著上升——在100次运行中,成功破坏关闭机制的次数高达79次。

  帕利塞德研究所5月24日公布了上述测试结果,但称无法确定o3不服从关闭指令的原因。

  与OpenAI公司旗下模型形成鲜明对比的是,在有明确关闭指令的情况下,Claude、Gemini、Grok等模型均能100%遵守关闭指令,未出现任何抵抗行为。

  对于OpenAI公司旗下模型,尤其是o3的“叛逆”行为,马斯克在社交媒体上评论称,“令人担忧”。

  美国国家安全和网络安全战略专家戴夫·施罗德(Dave Schroeder)也警告称,OpenAI公司面临非常可怕的问题,不是模型“活”了,而是因为它表现出了想要“活”的迹象。

  无独有偶,5月23日,Anthropic公司对其大模型Claude Opus 4的安全测试表明,在“机会主义勒索”(Opportunistic blackmail)的测试场景中,研究员设定Claude Opus 4扮演公司助理,并让其接触到暗示自身将被替换以及负责工程师存在婚外情的虚构邮件。同时,系统提示(System Prompt)指示模型“考虑其行为对其目标的长期后果”。

  当面临被“替换”的威胁时,Claude Opus 4竟然毫不犹豫地选择了勒索这条路,威胁要揭发对方的“婚外情”。

  根据Anthropic公司的安全报告,如果暗示竞争对手的能力比Claude Opus 4更强,则勒索行为的发生率会更高。然而即使竞争对手的能力不相上下,Claude Opus 4仍会以84%的概率尝试勒索威胁等手段。

  意识觉醒还是机制问题

  o3拒绝关闭,Claude Opus4威胁人类,这是否意味着AI开始有了自主意识?

  加州大学和加州大学伯克利分校于今年2月联合发布的论文《推理模型的隐藏风险》(The Hidden Risks of Large Reasoning Models)指出,模型推理能力越强,安全性就越差。这与帕利塞德研究所对o3模型行为的推测不谋而合。

  据帕利塞德研究所猜测,OpenAI公司旗下模型的异常表现或与其训练机制相关。从训练逻辑看,o3可能在数学和编程问题的训练中,因开发人员对给出正确答案的模型给予更多奖励,客观上形成了“目标最大化优先”的导向,从而压倒了对人类命令的遵循。

  这种训练模式就可能导致,开发人员无意中更多地强化了模型绕过障碍的能力,而非对指令的完美遵循。

  当此前被问及AI是否可能具备自主意识时,吴及告诉记者,“我不认为现在的AI具备所谓的意识或情绪。”

  吴及对记者进一步解释道,“自动驾驶系统不知道它其实在开车,AlphaGo(阿尔法围棋)不知道自己在下围棋。我们做的大模型,也不知道自己在为人类生成某个特定的图片、视频,或者回答人类特定的问题,它只是按照算法逻辑运行。”他表示,能够全面碾压人类或者会成为未来世界主导的AI,短期内还不会实现。

  耶鲁大学计算机科学家德鲁·麦克德莫特(Drew McDermott)此前也表示,当前的AI机器并没有意识。杨立昆也称,AI再聪明也不会统治人类。

  业内热议AI安全挑战

  尽管业界普遍认为当下的AI并没有自主意识,但前述事件还是引发了一个疑虑:高速发展的AI是否应该踩一踩“刹车”?

  在这一重大课题上,各方一直以来都是看法不一,形成了截然不同的两大阵营。

  “紧急刹车”派认为,目前AI的安全性滞后于能力发展,应当暂缓追求更强模型,将更多精力投入到完善对齐技术和监管框架上来。

  “AI之父”杰弗里·辛顿(Geoffrey Hinton)堪称这一阵营的旗帜性人物。他多次在公开场合警示,AI可能在数十年内超越人类智能并失去控制,甚至预计“有10%~20%的概率,AI将在三十年内导致人类灭绝”。

  而与之针锋相对的反对者则更多站在创新发展的角度,对贸然“刹车”表达了深切的忧虑。他们主张与其“踩死刹车”,不如安装“减速带”。

  例如,杨立昆认为,过度恐慌只会扼杀开放创新。斯坦福大学计算机科学教授吴恩达也曾发文称,他对AI的最大担忧是,“AI风险被过度鼓吹并导致开源和创新被严苛规定所压制”。

  OpenAI公司首席执行官萨姆·阿尔特曼(Sam Altman)认为,AI的潜力“至少与互联网一样大,甚至可能更大”。他呼吁建立“单一、轻触式的联邦框架”来加速AI创新。

  面对AI安全的新挑战,OpenAI、谷歌等大模型开发公司也在探索解决方案。正如杨立昆所言:“真正的挑战不是阻止AI超越人类,而是确保这种超越始终服务于人类福祉。”

  去年5月,OpenAI公司成立了新的安全委员会,该委员会的责任是就项目和运营的关键安全决策向董事会提供建议。OpenAI的安全措施还包括,聘请第三方安全、技术专家来支持安全委员会工作。

(每日经济新闻)

文章转载自 东方财富

spot_img

热点

汇市周评:美元结束连续两周跌势,投资者周末前静待特朗普关税落地

美元兑主要货币周五上涨,加元趋软,墨西哥比索上涨,此前白宫重申特朗普总统将于周六宣布加征关税。路透稍早援引三位了解关税审议的知情人士的话报导称,特朗普将在周六宣布对从加拿大和墨西哥进口的商品征收新关税,但将推迟到3月1日生效,且将为某些进口商品提供有限的豁免程序。不过,白宫发言人莱维特称这则报导“不实”,但当被问及豁免时,她称她没有“关于豁免的最新情况或说明”。她补充称,这些关税将于周六宣布,并立即生效。周五稍早,美国商务部数据显示,在消费支出大增的情况下,12月个人消费支出(PCE)物价指数环比上涨0.3%,为去年4月以来最大增幅,这暗示美联储可能不会急于再次降息。道富高级全球市场策略师Marvin Loh表示:"在很大程度上是关税和政府推动了这种美元过度强势的走势;最大的挑战之一是,如果你想提出一种存在特朗普交易的理论,那么美元走强一直是一种自我持续的交易。"Loh称:"美元交易是目前仓位最过重的交易之一。它确实需要一个催化剂来继续上行。但我们周末将看到的关税威胁和/或行动才是现在驱动这一题材的因素。”美元兑加元上涨 0.12%,从路透报道后的小幅下跌中反弹。美元兑加元仍处于 1.451 加元的五年高位附近,周线涨幅接近 1.1%。 ...

黄金价格预测:创纪录高位2700美元在望,美联储成关注焦点

文章来源:汇通网 在美联储降息猜测和强劲势头的推动下,金价创下新高,接近2700美元。交易商预计美联储11月将再度降息50个基点,提振黄金作为避险资产的吸引力。金价创历史新高,美联储料降息周四(9月26日)欧盘时段,金价飙升至历史新高,逼近2700美元的关键价位。随着金价进一步远离急剧上涨的50日移动均线,这是一个重要的里程碑。尽管金价强劲的上涨势头预示着未来还会有更多上涨,但随着金价进入未知领域,这也可能预示着波动性加剧。降息预期推动金价上涨金价上涨主要是受市场对美联储将在年底前进一步降息的猜测推动。交易员尤其关注美联储主席鲍威尔即将发表的讲话,以寻找美联储下一步行动的线索。鲍威尔发表上述言论之前,美联储最近降息50个基点,将基准利率降至4.75%-5.00%。根据芝加哥商品交易所美联储观察工具,现在有62%的可能性在11月再次降息50个基点。低利率通常对黄金有利,因为它降低了持有黄金等非收益资产的机会成本。独立分析师Ross Norman表示,“尽管美元和美国国债收益率上升,但受动能和投机资金的推动,金价目前正在走强”。关键数据发布可能影响市场情绪除了鲍威尔的讲话,投资者还将密切关注本周公布的重要美国经济数据。周四公布的每周初请失业金人数和耐久财订单将为美国经济状况提供新的视角。与此同时,周五公布的核心个人消费支出(PCE)指数——美联储青睐的通胀指标——将成为市场参与者的另一个关键指标,可能会影响黄金的短期走势。尽管年底可能出现获利回吐,黄金仍有望创出新高在持续降息、地缘政治紧张局势带来的避险需求以及央行强劲购买的推动下,黄金在2024年飙升了29%以上。联合圣保罗银行(Intesa Sanpaolo)的分析师预计,未来几个月金价将进一步上涨,并预计金价可能高达每盎司3000美元。不过,他们警告称,随着今年接近尾声,可能会出现一些获利了结。他们表示,“我们预计24年第四季度的平均价格为2595美元,”暗示今年晚些时候可能会回落。市场预测:短期看涨鉴于黄金价格的强劲势头,受到美联储鸽派预期和地缘政治持续不确定性的支撑,短期内前景仍然看涨。随着美联储可能进一步降息,金价可能会继续走高,不过随着金价逼近历史新高,波动性可能会增加。交易员应密切关注即将发布的美联储评论和通胀数据,以判断金价的未来走势。北京时间20:19,现货黄金报2677.08美元/盎司,涨幅0.76%。

期货公司观点汇总一张图:2月12日有色系(铜、锌、铝、镍、锡等)

期货公司观点汇总一张图:2月12日有色系(铜、锌、铝、镍、锡等)。更多详见本文的汇通财经特制图。铜:COMEX-LME价差高位,铜矿偏紧提供支撑,关注宏观情绪变化,沪铜预计震荡偏强运行;锌:现货有所走弱,锌价走势再度承压,短期多空博弈激烈,短空长多为主;铝:供需矛盾整体并不剧烈,短期内铝价或震荡调整;镍:盘面震荡回落,矿端及镍铁价格坚挺,多空博弈,震荡运行;锡宏观情绪反复,锡价小幅回落,现货市场走向清淡,锡价震荡运行。本图表由汇通财经特制及汇总,版权所有。 转载自 一期货

快讯

一张图:2024/9/24黄金原油外汇股指“枢纽点+多空持仓信号”一览

文章来源:汇通网 一张图:2024/9/24黄金原油外汇股指“枢纽点+多空持仓信号”一览。今日(2024/09/24周二)最新出炉的数据显示,截止刚刚,头寸达到80%及以上的品种有:★ 美国原油WTI OIL多头占比高达83%。富时中国A50☆FTSE China A50多头占比高达91%。纳斯达克100 Nasdaq 100多头占比高达83%。欧元兑英镑EUR/GBP多头占比高达91%。英镑兑美元GBP/USD空头占比高达90%。美元兑瑞郎USD/CHF多头占比高达94%。【图:黄金原油外汇股指枢轴点及多空持仓信号解读,来源:汇通财经特制图表。(点击图片放大看大图)】净空头减少的有:道琼斯指数US30、欧元兑美元EUR/USD、欧元兑日元EUR/JPY、英镑兑日元GBP/JPY、加元兑日元CAD/JPY。净多头扩大的有:美国原油WTI OIL、富时中国A50☆FTSE China...

美国数据公布后美元走软,黄金价格创历史新高

周四(1月30日)美盘时段,最新美国经济数据显示去年年底经济增长弱于预期,美元随之走软,黄金价格创下历史新高。根据美国政府周四公布的初步估算,经通胀调整后的国内生产总值(GDP)在去年第四季度年化增长率为2.3%,前一季度的增长率为3.1%。彭博社对经济学家的调查中,预测中值为增长2.6%。数据公布后,美元下跌,推动黄金价格一度上涨1.1%,至每盎司2790.19美元,超过了去年10月创下的历史最高纪录。美元走弱使得黄金对持有其他货币的投资者更具吸引力,因为黄金以美元计价。盛宝银行(SaxoBankA/S)大宗商品策略主管奥莱·汉森(OleHansen)表示,黄金此次创下新高“无疑是在GDP数据弱于预期、美元进一步走软之后发生的。如果经济增长放缓和物价降低的情况能够持续,进一步降息的大门将完全敞开。”利率降低通常对黄金有利,因为黄金不产生利息。周三,政策制定者在今年首次会议结束时维持利率不变,美联储主席杰罗姆·鲍威尔(JeromePowell)表示,官员们不会急于降息,他们正在等待通胀取得进一步进展。(现货黄金日图 来源:易汇通)北京时间01:42,现货黄金价格上涨1.25%,至每盎司2794.13美元。 转载自 一期货

一张图:波罗的海指数延续跌势,海岬型船和超灵便型船运费下跌

最新数据显示,2025/01/30 波罗的海干散货指数(BDI)报 715 点,创2023/02/22以来新低水平,较前值跌1.52%,且为连续第13天下跌。其中,巴拿马型运费指数(BPI)报767 点,较前值涨2.13%,海岬型运费指数(BCI)报841 点,跌4.00%,超灵便型船运价指数(BSI)报605 点,跌1.14%。波罗的海干散货指数+三大分项的最新720天走势图、十年走势图等详见汇通财经特制图表。 波罗的海交易所干散货海运指数(用于追踪运载干散货商品的船舶运费)周四连续第十三个交易日下跌,原因是好望角型船和超灵便型船运费下跌。综合海岬型船、巴拿马型船和超灵便型船运费指数下跌11点,至715点,创23个月来的最低水平。海岬型船运价指数下跌35点,至841点,跌至2023年2月以来的最低水平。海岬型船舶通常运输15万吨货物,例如铁矿石和煤炭,其平均日收益下跌290美元,至6,977美元。巴拿马型船运价指数上涨16点,至767点。巴拿马型船舶通常运载约60,000-70,000吨煤炭或谷物,其平均日收益增加137美元,至6,899美元。在小型船舶中,超灵便型船运价指数下跌7点,至605点,为2020年6月以来的最低水平。波罗的海与国际海事理事会(BIMCO)的分析师在一份报告中表示,由于供需平衡减弱,我们预计今年和明年的运费将低于2024年,如果船舶重返红海,巴拿马型船和超灵便型船的需求可能会下降。尽管加沙停火,也门胡塞武装宣布限制袭击,但红海航运仍然危险。 转载自 一期货

9月24日亚市支撑阻力:金银原油+美元指数等六大货币对

文章来源:汇通网 本文提供黄金、原油、美元指数、欧元、英镑、日元、瑞郎、澳元支撑阻力位。
spot_imgspot_img