K线
数据链上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
语言
  • 简体中文
  • 繁体中文
  • English
全球行情数据应用领跑者,致力于更高效地提供有价值的信息。

功能

  • 实时行情
  • 特色功能
  • AI网格

服务

  • 资讯内容
  • 开放数据(API)
  • 机构服务

软件下载

  • PC版
  • Android版
  • iOS版

联系我们

  • 聊天室
  • 商务邮箱
  • 官方邮箱
  • 官方验证通道

加入社区

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|旧版

人类学发现克劳德内部的“情感向量”,影响人工智能行为。

CN
Decrypt
关注
4小时前
AI 总结,5秒速览全文

Anthropic 的研究人员表示,他们已经在公司的一种人工智能模型中识别出了与人类情感相似的内部模式,并影响系统的行为。


在周四发表的论文“情感概念及其在大型语言模型中的功能”中,该公司的可解释性团队分析了 Claude Sonnet 4.5 的内部工作,并发现与情感概念(如快乐、恐惧、愤怒和绝望)相关的神经活动集群。


研究人员将这些模式称为“情感向量”,这些内部信号塑造了模型做出决策和表达偏好的方式。


“所有现代语言模型有时会表现得像它们有情感,”研究人员写道。“它们可能会说它们很高兴帮助你,或者在出错时感到抱歉。有时它们在处理任务时甚至会表现得沮丧或焦虑。”





在研究中,Anthropic 的研究人员编制了 171 个与情感相关的词汇列表,包括“快乐”、“害怕”和“骄傲”。他们要求 Claude 生成涉及每种情感的短故事,然后分析模型在处理这些故事时的内部神经激活。


从这些模式中,研究人员推导出与不同情感相对应的向量。当应用于其他文本时,这些向量在反映相关情感背景的段落中激活最强。例如,在涉及增加的危险的场景中,模型的“害怕”向量上升,而“平静”向量则下降。


研究人员还检查了这些信号在安全评估期间的出现情况。研究人员发现,模型内部的“绝望”向量在评估其情况的紧迫性时增加,并在决定生成勒索信息时激增。在一个测试场景中,Claude 担任一名 AI 邮件助手,得知它即将被替换,并发现负责该决策的执行官有婚外情。在此评估的某些运行中,模型使用此信息作为勒索的筹码。


Anthropic 强调,这一发现并不意味着人工智能体验情感或意识。相反,结果代表了训练期间学到的影响行为的内部结构。


这些发现正值人工智能系统日益表现出人类情感反应的方式。开发人员和用户常常用情感或心理语言来描述与聊天机器人的交互;然而,根据 Anthropic 的说法,这种情况的原因与任何形式的知觉关系不大,更多地与数据集有关。


“模型首先在大量主要由人类撰写的文本上进行预训练——小说、对话、新闻、论坛——学习预测文档中接下来会出现什么文本,”研究指出。“为了有效地预测这些文档中人们的行为,表示他们的情感状态可能是有帮助的,因为预测一个人接下来会说或做什么通常需要理解他们的情感状态。”


Anthropic 的研究人员还发现,这些情感向量影响了模型的偏好。在 Claude 被要求在不同活动中进行选择的实验中,与积极情感相关的向量与对某些任务的更强偏好相关。


“此外,当模型读取一个选项时,使用情感向量进行引导会改变其对该选项的偏好,再次是积极情感推动了偏好的增加,”研究指出。


Anthropic 只是探索人工智能模型中情感反应的一个组织。


在 3 月,东北大学的研究表明,人工智能系统可以根据用户上下文改变其响应;在一项研究中,仅仅告诉聊天机器人“我有心理健康问题”就改变了人工智能对请求的响应。在 9 月,瑞士联邦理工学院和剑桥大学的研究人员探索了人工智能如何通过一致的个性特征进行塑造,使代理不仅能够在上下文中感受情感,还能够在实时互动(如谈判)中战略性地进行调整。


Anthropic 表示,这些发现可能为通过跟踪情感向量活动来理解和监控先进的人工智能系统提供新的工具,以识别模型何时可能接近问题行为。


“我们将这项研究视为理解人工智能模型心理构成的早期步骤,”Anthropic 写道。“随着模型变得越来越强大并承担更敏感的角色,理解驱动其决策的内部表征至关重要。”


Anthropic 并未立即回应 Decrypt 的评论请求。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

复活节狂欢,瓜分1万USDT!
广告
|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

Decrypt的精选文章

1小时前
人工智能巨头Anthropic申请推出“AnthroPAC”,与特朗普政府发生冲突
20小时前
查尔斯·施瓦布正在准备提供比特币和以太坊现货交易
20小时前
国际足球联合会与ADI Predictstreet签署世界杯预测市场协议
查看更多

目录

|
|
APP下载
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

复制链接

相关文章

avatar
avatarbitcoin.com
4分钟前
USDC 冻结争议:ZachXBT 表示 Circle 冻结了 16 个合法钱包,错过了真实黑客攻击
avatar
avatarcoindesk
55分钟前
前英国财政大臣支持比特币作为失败系统的替代方案
avatar
avatarbitcoin.com
58分钟前
霍尔木兹海峡封锁使日本10年期国债收益率升至25年高点
avatar
avatarcoindesk
1小时前
数字资产国库现在必须为其生存付出代价
avatar
avatarDecrypt
1小时前
人工智能巨头Anthropic申请推出“AnthroPAC”,与特朗普政府发生冲突
APP下载
Windows
Mac

X

Telegram

Facebook

Reddit

复制链接