GenEM:利用大语言模型实现机器人行为的生成表达
**划重点:**
- 🤖 **挑战与需求:** 人机交互领域存在着许多挑战,其中之一是使机器人展示类似于人类的表达行为,特别是在多样化社交情境中。
- 🔄 **传统方法的限制:** 传统的基于规则和基于数据的方法在新的社交环境中需要更大的可扩展性,但数据驱动方法受到数据集的限制。
- 🔍 **GenEM方法:** Google DeepMind 和多伦多大学的研究人员提出了Generative Express Motion(GenEM)方法,专注于利用大型语言模型生成机器人的表达行为。
在人机交互领域存在许多挑战,其中之一是使机器人展示类似于人类的表达行为。传统的基于规则和基于数据的方法在新的社交环境中需要更大的可扩展性,而数据驱动方法受到数据集的限制。为了应对这一挑战,研究人员提出了Generative Express Motion(GenEM)方法,专注于利用大型语言模型(LLMs)生成机器人的表达行为。
GenEM方法利用LLMs提供的丰富社交背景,创造出适应性强、可组合的图形机器人运动。它采用少样本思维链激励,将人类语言指令转化为参数化的控制代码,使用机器人已有的和学到的技能。
行为生成包括多个步骤,从用户指令开始,最终生成机器人执行的代码。为了评估该方法,研究考虑了两项用户研究,将生成的行为与由专业动画师创建的行为进行比较。该方法在表达力和机器人行为的适应性方面优于传统的基于规则和基于数据的方法。研究人员还利用用户反馈来更新机器人的策略参数,并通过组合现有行为生成新的表达行为。
两项用户研究证明了GenEM的有效性,显示生成的行为被认为是有能力和可理解的。通过使用移动机器人和模拟四足动物进行的仿真实验表明,该方法优于直接将语言指令翻译成代码的版本。它还允许生成对机器体系结构不可知且可组合的行为。
GenEM利用LLMs的研究在机器人领域取得了显著的进展,展示了自主生成富有表现力、适应性强和可组合的机器人行为的能力。这一方法突显了LLMs在机器人领域的潜力,强调了它们通过自主生成富有表现力行为来促进有效的人机交互的作用。
- 0002
- 0000
- 0000
- 0004
- 0001