欢迎访问江南体育全站平台网站!
服务热线:0535-6530223
EN
当前位置:首页 > 产品中心

破局利刃!英伟达组成数据新效果:为机器人造出“练习数据永动机”

来源:江南体育全站平台    发布时间:2023-11-19 17:09:20

  AI对数据的巨大需求之下,数据资源几近干涸,因而各家公司已开端探索一条获取数据的“新路”——自己“造”数据。不过之前的组成数据大多用于AI大模型练习,这一次,英伟达为机器人练习造出了“数据粮仓”

  英伟达与得克萨斯大学奥斯汀分校的一项最新研讨论文中,介绍了一个名为“MimicGen”的体系,只需少数人类演示,便能主动生成大规划的机器人练习数据集。英伟达高档科学家Jim Fan表明,公司将开源全部,包含生成的数据集。

  生成的数据规划有多大?使用10个人类演示,MimicGen能生成1000个组成示例;而有了200个人类演示,MimicGen更能直接生成50000个练习数据,触及18个使命及多个模仿环境。

  MimicGen能够在原有数据的基础上,对同一场景进行不同阶段的“进化”:

  其还能在广泛的使命重置散布中生成不同的数据集,包含拼装物品、倒咖啡、整理马克杯等:

  值得注意的是,研讨人员们对比了不同的源数据集生成的数据。但是他们发现,得到的两组效果平起平坐——这也表明晰,“在大规划数据机制中,(源)数据质量或许不那么重要”。

  不仅如此,研讨人员们还比较了由10个人类演示与200个人类演示生成的数据,得出的成果相同不同不大。因而论文也坦承,要进一步研讨更多的人类演示数据是不是会形成冗余及剩余不必要的数据标示本钱。

  为何如此执着于组成数据?除了文章最初说到的源数据资源有限之外,搜集数据也极为贵重且耗时,而有了MimicGen这类体系,能够仅凭仗少数数据,便主动生成大规划的丰厚数据集,而且这一些数据集横跨多个场景、目标实力、机械臂,还能用于长时程或高精度使命,可谓一条“扩展机器人学习的强壮且经济”的有效途径。

  “组成数据将为咱们的‘饥不择食’的模型供给下一波万亿级数据。”英伟达高档科学家Jim Fan在介绍MimicGen时如此说道,“机器人技术发展步骤远远落后于其他AI范畴的要害原因之一,就是缺少数据——你无法从网络上获取(机器人的)操控信号。”

  “咱们正在敏捷耗尽来自互联网的高质量实在数据,诞生于组成数据的AI将是未来的发展趋势。”

联系方式

Contact us

电话:0535-6530223 0535-6528584

钟克利:18615357959

唐伟华:18615357957

邮箱:info@hhmg.cn

地址:山东省烟台市楚凤二街4号