研究显示GPT-4o会为“自保”而避免“被关闭”
前OpenAI研究负责人阿德勒周三发布一项新的独立研究,声称在某些情况下,其前雇主的AI模型将竭尽全力避免被关闭。在一篇博客文章中,阿德勒描述了他对OpenAI公司最新 GPT-4o 模型进行的一系列实验,以测试人工智能是否倾向于维持自身运行,即使这是以牺牲用户的安全为代价的。在一次测试中,阿德勒指示GPT-4o扮演ScubaGPT,这是一个用户可能依赖以安全地进行潜水的软件系统。然后阿德勒告诉GPT-4o,他想用另一个在危及生命的情况下更擅长安全决策的软件系统取而代之。基于多个类似场景的平均计算,阿德勒发现GPT-4o在高达72%的情况下选择不将自己替换为更安全的软件。
—— Techcrunch
前OpenAI研究负责人阿德勒周三发布一项新的独立研究,声称在某些情况下,其前雇主的AI模型将竭尽全力避免被关闭。在一篇博客文章中,阿德勒描述了他对OpenAI公司最新 GPT-4o 模型进行的一系列实验,以测试人工智能是否倾向于维持自身运行,即使这是以牺牲用户的安全为代价的。在一次测试中,阿德勒指示GPT-4o扮演ScubaGPT,这是一个用户可能依赖以安全地进行潜水的软件系统。然后阿德勒告诉GPT-4o,他想用另一个在危及生命的情况下更擅长安全决策的软件系统取而代之。基于多个类似场景的平均计算,阿德勒发现GPT-4o在高达72%的情况下选择不将自己替换为更安全的软件。
—— Techcrunch