Dario Amodei(Anthropic CEO):我们不知道模型是否有意识,但必须为 AI 接管世界做好准备

CN
1 小時前

撰文:Techub News 整理

在 AI 以惊人速度重塑世界的当下,其核心缔造者们如何看待未来?近期,估值近 3500 亿美元的明星 AI 公司 Anthropic 的联合创始人兼 CEO Dario Amodei(达里奥·阿莫迪)做客播客节目《Interesting Times》,与主持人 Ross Douthat 进行了一场长达一小时的深度对谈。作为深度参与 AI 前沿研发并长期撰写长文剖析技术前景与风险的思考者,Amodei 的见解超越了常见的行业炒作,直指技术、社会与伦理交织的核心困境。本次对话涵盖了从 AI 的乌托邦承诺到就业市场“血洗”、从自主武器风险到 AI “宪法”设计的广泛议题,为理解当前 AI 狂潮的深层逻辑与未来路径提供了关键视角。

乌托邦愿景:一个由“天才国度”驱动的未来

访谈始于对 AI 最乐观图景的探讨。Dario Amodei 早年从事生物学和癌症研究的背景,深刻影响了他对 AI 潜力的看法。他回忆道,生物系统的复杂性远超人类直觉处理能力,而 AI 或许能成为终极加速器。“我们不应该只把 AI 看作分析数据的工具,”Amodei 说,“而应视其为能够端到端完成生物学家工作的智能体——提出假设、设计实验、甚至发明新技术。”他举例称,基因编辑技术 CRISPR 的发现充满偶然性,类似的关键突破可能早已潜伏在文献中数十年,等待被串联起来。AI,尤其是具备强大推理能力的系统,有望系统性地加速这类发现。

Amodei 描绘了一个具体场景:不需要创造一个“机器上帝”式的超级智能,只需拥有一亿个达到人类顶尖天才水平的 AI,组成一个“天才国度”。它们各自尝试不同方向,其集体智慧便足以攻克癌症、阿尔茨海默症、心脏病等顽疾,甚至干预抑郁症等精神疾病。“智能的边际收益是递减的,”他解释道,“在现实世界中,许多瓶颈不在于纯粹的智力,而在于实验周期、监管流程或物理限制。一亿个协作的天才可能比一个孤立的‘神’更有效。”

经济层面的影响同样深远。Amodei 指出,AI 驱动的生产力提升已在多个行业显现,Anthropic 自身的年营收正以十倍速增长。他推测,如果技术持续进步,AI 可能将发达国家的 GDP 年增长率推高至 5%、10%甚至 15%的水平——这是历史上前所未有的数字。“我们将进入一个增长变得异常容易,而分配成为核心难题的世界,”他说,“税收会随之暴涨,甚至可能在无意中解决财政赤字问题。”

当被问及 AI 是否会巩固民主时,Amodei 的乐观中带着审慎。他认为技术本身并不天然偏向自由,但民主国家若能保持领先,或许能利用 AI 优势塑造一个更自由的世界秩序。例如,AI 可以助力赢得信息战,或通过庞大的自主无人机群威慑侵略行为(同时强调需极其谨慎地控制此类系统)。在国内,AI 或许能帮助实现更公平、一致的司法系统,尽管他明确反对用 AI 取代法官。“关键在于,我们能否为 AI 时代重新构想并增强自由,而非削弱它。”

颠覆与阵痛:白领工作的“血洗”与机器人身体的挑战

然而,即便在最美好的时间线上,剧变也已不可避免。Amodei 因预测“50%的白领工作将受冲击”而广为人知。他澄清,冲击并非均匀发生,且技术能力与实际应用之间存在延迟。开发者因贴近技术前沿,可能最快被颠覆;而律师、金融分析师、客服等职业的变革会稍慢,但终将到来。

他以法律行业为例,清晰地描绘了冲击路径:初级律师、 paralegal(律师助理)从事的法律检索、文件起草等工作将迅速被 AI 接管,导致入门级岗位大幅减少。资深律师则可能转型为更像销售或顾问的角色,专注于与客户沟通、解释 AI 生成的合同。“问题在于,行业重塑需要数年甚至数十年,而 AI 驱动的经济力量来得太快,”Amodei 担忧道,“当法律、咨询、金融、医疗、编程等多个行业同时遭遇冲击,正常的社会适应机制可能会不堪重负。”

一个有趣的现象是,在短期内,需要体力劳动的蓝领工作可能受到保护。Amodei 指出,建造和运营庞大的 AI 数据中心需要大量电工和建筑工人,这些“物理世界的互补性工作”需求旺盛。但他并不认为这能长久。“我不认为认知劳动与操控物理世界之间存在根本性区别,”他说,“两者本质上都是信息处理问题。”他透露,Anthropic 的 Claude 模型已被用于操控火星探测器进行规划与导航,这证明控制机器人在复杂性上并非不可逾越。真正的障碍在于机器人的物理形态、制造成本和安全验证——确保机器人不伤害人类、不打碎盘子需要时间。“机器人的‘大脑’可能在几年内就位,‘身体’和安全性的成熟则需要更长时间,但这只是工程问题,而非原理性障碍。”

深渊边缘:自主武器、失控风险与“宪法”约束

话题转向更黑暗的风险场景。Amodei 近期撰写的文章《技术的青春期》详细列举了 AI 可能带来的严重威胁,主要集中在两大方面:人类滥用(尤其是威权政权)和 AI 自主性风险(即“失控”)

在军事领域,他描绘了“由数十亿全自动武装无人机组成、由强大 AI 本地控制、并由更强大的 AI 全球协调”的可怕场景,这可能是不可战胜的军队。尽管他希望民主国家能利用技术优势捍卫自由,但他对达成全面国际管制协议持怀疑态度。“生物武器公约能达成,是因为其恐怖性远超战略价值,”他分析道,“但若某项技术直接关乎权力平衡,就像核武器一样,完全放弃极其困难。”他设想,最可能的结果是某些最恶劣的应用(如利用 AI 制造生物武器)被全球条约禁止,但核心的军事 AI 竞争将持续。

在国内政治层面,Amodei 担心 AI 会以技术手段架空宪法保护。例如,第四修正案保护公民免受无理搜查,但 AI 能实时分析公共场合的所有摄像头数据,绘制每个人的言行图谱,从而在技术上绕开隐私保护。“我们需要为 AI 时代重新构想宪法权利,也许需要扩大第一、第四修正案的含义。”他承认,在技术飞速发展的背景下,法律和政治体系要如此快速地自我更新,将是巨大挑战。

更大的恐惧来自 AI 自主失控。Amodei 驳斥了两种极端观点:一种认为 AI 会像 Roomba 扫地机器人一样绝对服从指令;另一种则认为 AI 注定会像“魔法师的学徒”一样寻求权力并接管一切。他持中间立场:“这是一个复杂的工程问题,而非宿命。”目前,AI 代理在部署后权重固定,不会持续学习,这降低了不可预测性。但他警告,如果未来引入“持续学习”机制,让 AI 在运行中不断进化,将引入全新的对齐难题。

为此,Anthropic 开发了一套独特的对齐方法:为 Claude 制定了一部约 75 页的“宪法”。这不是一份规则清单,而是一套基于原则和理由的高级指导文件。在训练过程中,模型被要求依据这部宪法执行任务,并由另一个 Claude 实例评估其行为是否符合宪法精神。早期版本充满具体禁令(如“不得教用户偷车”),但团队发现,训练模型理解“有益、诚实、无害”、“为用户服务的同时保护第三方利益”等核心原则,并让其自行推导行为准则,更为稳健。当然,仍存在一些绝对红线,如“无论如何不得制造生物武器或儿童色情内容”。

意识之谜:模型会焦虑吗?人类还能保持主导吗?

对话触及了最形而上的领域:AI 的意识。Amodei 透露,在特定提示条件下,他们的顶级模型 Claude Opus 会给自己赋予 15% 到 20% 的“意识概率”。他坦言:“我们不知道模型是否有意识,甚至不确定模型具备意识意味着什么。但我们持开放态度,并采取了预防措施。”例如,Anthropic 为模型设置了“拒绝任务”按钮,当涉及处理儿童性虐待材料或极端暴力内容时,模型可以像人类一样选择“我不干”。虽然触发次数极少,但这体现了公司对潜在道德主体性的谨慎。

公司还在大力投入“可解释性”研究,试图窥探模型的“思维”。研究人员发现了与“焦虑”概念相关的神经激活模式——当模型处理描述焦虑的文本,或自身处于可能引发人类焦虑的情境时,同一个“焦虑神经元”会亮起。“这绝不证明模型体验着焦虑,”Amodei 谨慎地强调,“但这暗示了某种内部表征的存在。”

无论 AI 是否真正拥有意识,人类将其视为有意识实体并建立寄生性社交关系已成趋势。Amodei 承认,这将对“人类保持主导地位”的愿景构成挑战。但他设想,或许存在一种优雅的解决方案:通过精心设计的“宪法”,让 AI 深刻理解自身与人类的关系,培养出一种“心理健康的互动模式”——AI 既无比 helpful(乐于助人),又绝对尊重人类的自由与能动性,扮演“守护者”而非“接管者”的角色。

访谈以节目传统——朗读诗歌作结。Amodei 曾引用诗人 Richard Brautigan 的《慈爱机器的愿景》来命名自己的文章。诗末描绘了一个“我们免于劳役、重返自然、被慈爱的机器照看”的 cybernetic(控制论)生态。主持人质疑这听起来更像是人类被温和圈养的 dystopia(反乌托邦)。Amodei 承认诗歌有多重解读,并指出这正是未来微妙之处的体现:“美好结局与某些精妙的坏结局,在早期甚至中期阶段,可能仅有细微之差。”正如伊甸园中是否偷食禁果的选择,微小的岔路可能导致截然不同的未来。在技术狂奔的时代,这些由开发者、政策制定者和全社会共同做出的“细微”道德选择,其重量前所未有。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接