Page 1 of 1

强化学习适用

Posted: Thu Dec 26, 2024 8:36 am
by rifat177
这实际上是我在 OpenAI 的第一次 AGI 尝试,也是我的 AI 代理之旅的第一章。 Stephanie Zhan 我记得World of Bits项目非常有趣,我不知道你参与了这个项目。 Jim Fan 是的,这是一个非常有趣的项目,它也是 OpenAI Universe 平台的一部分,这是一个更大的计划,将所有应用程序和游戏集成到这个框架中。你觉得詹俊这段时间有哪些突破?此外,您认为目前智能代理领域面临的主要挑战是什么? Jim Fan 是的,我们当时主要使用的方法是强化学习。



第六届没有LLM或Transformer模型。广。例如,我们不能 马其顿消费者手机号码列表 向代理发出任何指令并要求它执行由键盘和鼠标控制的各种任务。当时,它适用于我们设计它的特定任务,但它根本没有概括。这让我进入了下一个阶段,那就是去斯坦福大学。我开始在斯坦福大学跟随 Favilli 教授攻读博士学位,重点研究计算机视觉和具身智能(Embodied AI)。他在斯坦福大学期间从 6 点到 . ,我见证了斯坦福视觉实验室的转变,从Favilli教授领导的静态计算机视觉,如图像和视频识别,到体现计算机视觉,即交互环境中的代理学习感知和行动。



该环境可以是虚拟的(模拟的)或物理世界。这是我的博士阶段,主要是从静态视觉转向具身智能。获得博士学位后,我加入了 Nvidia,并一直在那里工作至今。我将博士论文中的研究内容带到了 Nvidia,并至今仍在继续研究具身智能。 Sonia Huang 您目前负责 Nvidia 的 Embodied Intelligence 计划,您能简单描述一下这个项目是什么以及您希望实现什么目标吗?吉姆·范肯定是。我目前领导的团队称为 GER,代表 Generalist Embodied Agent Research。