OpenAI启动旨在缓解“超级智能”AI的对齐计划-中存储网

2023-07-09 21:44:35 来源：中存储

OpenAI启动旨在缓解“超级智能”AI的对齐计划

（thinkhubstudio/Shutterstock）

如果人工智能有一天超越人类的智力会怎样？这种“超级智能”是OpenAI所期待的——可能是在这十年内——该公司已经组建了一个新团队，专注于使其与人类的最佳利益保持一致。

“我们如何确保人工智能系统比人类更聪明地遵循人类的意图？”OpenAI博客文章宣布了一个名为Superalignment的新团队，该团队将由该帖子的作者Ilya Sutskever和Jan Leike共同领导。

该公司表示，它正专注于缓解超级智能人工智能系统，而不是通用人工智能（AGI），以“强调更高的能力水平”。Sutskever和Leike表示，目前没有控制超级智能人工智能的方法，现有的对齐策略，如从人类反馈中进行强化学习，将不适用于超越我们自身能力的系统。

该公司表示，它正在组建一个由顶级机器学习研究人员和工程师组成的团队，致力于解决超级智能对齐问题：“我们的主要基础研究赌注是我们新的超级对齐团队，但做到这一点对于实现我们的使命至关重要，我们希望许多团队做出贡献，从开发新方法到扩展它们再到部署。“作者写道。

OpenAI启动旨在缓解“超级智能”AI的对齐计划

（来源：OpenAI）

Sutskever是OpenAI的联合创始人兼首席科学家。Leike领导OpenAI的对齐团队，其对齐研究方法侧重于三大支柱：使用人类反馈训练AI系统，培训AI系统以协助人类评估，以及培训AI系统进行对齐研究。Leike在一条推文中表示，以前的对准团队大部分都加入了新的超级对准团队。

OpenAI还将在未来四年内将其迄今为止获得的计算的20%用于这一追求。在另一条推文中，Leike表示“20%的计算不是一个小数目”，他“对OpenAI愿意以这种规模分配资源印象深刻”。

“这是有史以来最大的对齐投资，可能比人类迄今为止在对齐研究上花费的总金额还要多，”Leike写道。

超级对齐团队的任务是在四年内解决超级智能对齐的核心技术挑战。这篇博文概述了该团队的工作将如何围绕提高ChatGPT等当前模型的安全性，理解和减轻人工智能风险，如滥用，经济破坏，虚假信息，偏见和歧视，以及成瘾和过度依赖。

作者还表示，社会技术问题 - 或与人类和机器一起工作有关的问题 - 也将是一个关注领域。OpenAI表示，它正在积极与跨学科专家合作，以“确保我们的技术解决方案考虑到更广泛的人类和社会问题”。

OpenAI启动旨在缓解“超级智能”AI的对齐计划

该团队概述了其第一个目标：建立一个大致人类水平的自动化对齐研究人员。“然后，我们可以使用大量的计算来扩展我们的工作，并迭代地调整超级智能。

该团队写道，为此，研究人员需要开发一种可扩展的训练方法，验证生成的模型，并对整个对齐管道进行压力测试。压力测试将涉及为人类难以评估的任务提供训练信号，以便人工智能系统可用于评估其他人工智能系统。它还涉及自动搜索和解释有问题的行为。

“最后，我们可以通过故意训练错位模型来测试我们的整个管道，并确认我们的技术检测到最糟糕的错位（对抗性测试），”作者写道。

“你怎么知道你是失败了，还是进步不够快？”Eliezer Yudkowsky问Leike回应这个消息。Yudkowsky是一位有争议的AI研究人员，他的观点是AI对齐问题无法解决。

“我们会盯着经验数据，因为它进来了，”Leike回答道。“我们可以在研究路线图的各个部分（例如可扩展的监督）上在本地衡量进展，我们可以看到 GPT-5 的对齐情况如何。我们将密切关注技术的发展速度。