在 AI 发展进程中有一个非常有趣却有违常识的现象," 一些对人类而言相对困难的任务,例如下棋,对 AI 来说却相对容易实现;而在开放世界中与环境交互、进行规划和决策等对人类来说较简单的事,AI 却面临巨大挑战 ",这就是莫拉维克悖论。
(资料图片)
不过,现在 GITM 成功打破了这一悖论限制,在复杂且类似于现实世界的环境中取得突破,能够像人类一样生存,探索和创造了!
在紧密模拟真实世界的畅销游戏《我的世界》(Minecraft) 中,由商汤科技联合清华大学、上海人工智能实验室等机构研究者们共同提出的通才 AI 智能体 Ghost in the Minecraft ( GITM ) ,不但能够玩转《我的世界》,且比以往所有智能体都有更加优秀表现。
"Ghost in the Minecraft"(GITM)
像人类一样生存,探索和创造
此研究在向通用人工智能(AGI)方向迈出了重要一步。
广泛的任务覆盖:GITM 在《我的世界》内主世界的所有技术挑战上实现了 100% 的任务覆盖率(成功解锁了完整的科技树的 262 个物品),而此前所有智能体的总和只能覆盖 30%。(以往所有智能体方法包括 OpenAI 和 DeepMind 在内总共只解锁了 78 个)
高任务成功率:在最受关注的 " 获取钻石 " 任务上,GITM 取得了 67.5% 的成功率,相比于目前最佳成绩(OpenAI VPT)提高了 47.5%。
极高的训练效率:GITM 的训练效率也达到新高度。环境交互步数只需已有方法的万分之一,单一 CPU 节点训练 2 天即可完成,远远低于之前 OpenAI VPT 所需的 6480 个 GPU 天或 DeepMind DreamerV3 所需的 17 个 GPU 天。通才 AI 智能体 "Ghost in the Minecraft"(GITM)玩转《我的世界》游戏,生存模式白手起家,拿到主世界的所有物品,挖钻石不在话下,还能制作附魔书!GITM 面对各类地形、环境、白天黑夜场景,甚至遇到怪物也能自如应对
GITM 还可以进一步应用在《我的世界》更加复杂的任务中,比如生存所需的避难所、农田、铁傀儡,创造自动化设备所需的红石电路、进入下界所需的下界传送门等。
这些任务展示了 GITM 强大的能力和可扩展性,使得智能体能够在《我的世界》中长时间生存、发展,探索更加高级的世界。
通用人工智能突破加速 AI 产业化革命
研发攻克《我的世界》中所有技术挑战的 AI 智能体 GITM,目的是构建一个具备自主学习和掌握整个真实世界技能的通用人工智能方向。
GITM 打破了传统以 RL 为基础的架构,采用大型语言模型(LLM)作为智能体核心的新范式。
项目主页:https://github.com/OpenGVLab/GITM
这一创新也有助于推动通用人工智能(AGI)的研究目标加速实现,发展出能够在开放世界环境中像人一样进行感知、理解和交互的智能体,并为机器人和自动驾驶等产业带来巨大突破和进步,有效解决现实世界中复杂环境和各类长尾问题,推动 AI 技术更大规模的产业落地。
得益于 " 大模型 + 大算力 " 推进 AGI(通用人工智能)发展的战略布局,以及全栈大模型研发体系,商汤科技得以在多模态、多任务通用大模型领域快速发展,以 " 日日新 SenseNova" 大模型体系为核心,不断助力创新技术快速应用于智能汽车、智慧生活、智慧商业和智慧城市等领域,持续提升产业智能化渗透率。
同时,商汤也积极从产业应用中不断积累 Know-How,如早在 2016 年就开始布局智能汽车领域,并不断探索和解决自动驾驶应用中大量的规划和决策问题。2022 年中,商汤基于 OpenDILab 决策 AI 平台开发的 AI 模型 DI-star 在《星际争霸》中战胜了曾经的大中华区冠军,展示出强大的决策 AI 能力,有效推动自动驾驶打破规则限制,实现更高效的规划控制。今天,GITM 的成功将推动自动驾驶等应用处理复杂任务的能力更上一层楼,打破更高的技术天花板。
雷峰网
关键词: