[新闻] 生成式AI赋予机器人跨领域通用能力

楼主: stpiknow (H)   2024-06-20 17:15:31
生成式AI赋予机器人跨领域通用能力
原文网址:
https://bit.ly/3VNW0pn
原文:
在机器人领域追求通用人工智能的路途上,资料的多样性和整合度一直是关键挑战。尽管
硬件设计已有长足进展,但要真正实现所谓“通用型人形机器人”,仍需突破训练数据的
限制。麻省理工学院(MIT)最新研究指出,运用生成式AI技术有望跨越这一障碍,为机器
人赋予跨领域的通用能力。
研究团队提出了一种名为“策略/政策组合”(Policy Composition, PoCo)的新方法,能
将不同来源、模态和任务的机器人数据集整合训练,并成功提高机器人执行多项工具使用
任务的能力。透过训练出拟效各数据集的“扩散模型”,再将其所学习到的策略加权组合
,最终得到一个通用策略,使机器人能在多样化环境中灵活运用工具完成任务。
传统机器人训练方式往往侷限于单一数据集,例如:某个仓储环境中的包装任务数据,难
以从中演绎出通用的策略应用于其他情境。研究人员表示,尽管目前各领域都在大量产生
庞大数据,但缺乏有效整合的方式,反而限制了这些资讯的潜力发挥。PoCo方法的核心概
念,就是将这些小而专一的数据集透过扩散模型学习出策略,再予以组合,让机器人能从
中萃取共通之处,帮助其泛化到更普遍的任务上。
所谓扩散模型(Diffusion Model),是一种新兴的生成式AI技术,通常用于生成影像。研
究团队的做法是,将其应用于生成机器人的动作轨迹。首先在训练数据集的动作轨迹中添
加噪声,然后让扩散模型逐步去除噪声,并最终产生一条清晰的动作轨迹,作为机器人的
操作策略。这种方式被称为“扩散策略”(Diffusion Policy),可从不同类型的数据中学
习策略。
研究人员透过不同数据集分别训练出多个扩散模型,每一个都学习到针对特定任务的最佳
策略。接着,他们将这些策略加权组合,经过反复调整后,得到一个能满足各个策略目标
的综合策略。这种策略组合的好处在于能同时获得不同数据集的优点,例如从实际演示数
据中获得技术熟练度,又从模拟数据中达到良好泛化性。
实验中,研究团队让机器人使用工具执行各种任务,包括用锤子钉钉子、用锅铲翻转物品
等。结果显示,采用PoCo策略组合技术后,机器人的任务执行表现比基准方法提升了20%
。研究人员注意到,经过调整的组合策略轨迹明显优于单一策略轨迹,展现出策略组合的
优势。
此项研究为机器人领域带来新的契机,有望突破长期以来训练数据的侷限性。未来,研究
人员希望能够将这项技术应用于更复杂的长期任务,例如让机器人先拿起一种工具使用,
再转换为另一种工具,展现出更强的任务切换能力。另一目标则是整合更大规模的机器人
数据集,进一步提升模型的性能表现。
不过,要取得通用人工智能的最终目标,单凭此一技术恐怕还不够,仍需要其他重要基础
。NVIDIA的高级研究科学家指出:“要在机器人领域取得成功,我们需要三种数据:网络
数据、模拟数据和真实机器人数据。如何有效整合这三种数据,将是一个价值百万美元的
问题。”显见策略组合只是迈向通用智慧的一小步,仍有许多挑战待克服。
MIT的这项研究对于实现通用型人形机器人迈进一步,为日后自动化机器人能够自由切换
工具、应对复杂多变的工作环境奠定基础。可以预想未来智慧化时代的场景,有不同制造
商生产的多功能机器人,不仅能在工厂内高效作业,更能在家庭和社区中协助人类完成家
务、维修等各式各样的劳务。对人类的劳动力分担是一大解放,而其中潜藏无限商机和社
会影响,也正是我们当前应为之做好准备的重大议题。

Links booklink

Contact Us: admin [ a t ] ucptt.com