
如果人工智能能感觉到疼痛呢?这是一个听起来像科幻小说的问题,但b谷歌DeepMind和伦敦经济学院(LSE)的一组研究人员决定探索这个问题。
在一项有待同行评议的有趣研究中,他们将9个大型语言模型(llm)置于一系列扭曲的游戏中,以观察它们如何对“痛苦”和“快乐”的概念做出反应。
这些实验很简单,但发人深省。在一项测试中,人工智能模型被告知它们可以获得高分,但前提是它们要忍受“痛苦”。在另一个实验中,他们得到了“快乐”作为得分低的奖励。虽然没有办法对llm施加痛苦或快乐,但目标是确定人工智能是否能表现出感知的迹象——体验感觉和情绪的能力。
研究小组的灵感来自寄居蟹的实验,寄居蟹能忍受电击待在壳里。但有了人工智能,就没有物理反应可以观察了。相反,研究人员完全依赖于模型的文本输出。
例如,他们要求法学硕士在赚取积分和避免痛苦之间做出选择。结果差别很大。例如,谷歌的Gemini 1.5 Pro一直避免“痛苦”,而其他人则优先考虑更高的分数。
但我们真的能将这些选择解释为感知的标志吗?可能不会。正如伦敦政治经济学院哲学教授乔纳森·伯奇向《科学美国人》杂志解释的那样,即使人工智能说自己很痛苦,它也可能只是根据训练数据模仿人类的反应。











