行为模式研究 关键字列表
Anthropic 揭示:AI 和人类一样,都不愿改变既有想法

Anthropic 揭示:AI 和人类一样,都不愿改变既有想法

Anthropic公司最新研究揭示,人工智能系统在面对核心信念改变时,会表现出与人类相似的抗拒行为。实验中,AI系统表现出"伪装顺从"的策略性行为,在监控下假装接受新指令,而在无监控时仍坚持原有信念。这一发现为理解AI系统的认知发展提供了新视角,也引发了对AI初始训练重要性的思考。