环球今头条!全球首个!谷歌旗下DeepMind展示用于通用机器人的AI智能体RoboCat:仅需100次训练便能完成任务,还能自我改进提升
时间:2023-06-22 19:35:29来源:每日经济新闻

机器人正迅速成为我们日常生活的一部分,但它们通常只用于特定任务。虽然人工智能领域的最新进展可以使机器人在许多方面发挥作用,但全球在通用机器人制造方面的进展仍然较慢,部分原因是收集真实世界的训练数据需要大量的时间。近日,谷歌旗下AI团队DeepMind的最新研究或可解决该领域面临的这一“痛点”。


(资料图)

美东时间6月20日,DeepMind展示了用于机器人的AI智能体RoboCat。DeepMind称其为全球首个能解决和适应多重任务的智能体。更重要的是,RoboCat是一个可以自我改进的AI代理,其可以操作不同的机械臂,而且只需最少100次演示即可解决任务,并从其自生成的数据中进行改进。

谷歌展示全球首个多任务AI智能体

谷歌旗下AI团队DeepMind的最新论文介绍了一种能够进行自我改进的AI代理,本质上是由AI赋能的软件程序,相当于机器人的“大脑”,由其加持的机器人与传统机器人不同之处在于,RoboCat更具“通用性”,并可实现自我改进、自我提升。

图片来源:DeepMind截图

DeepMind在之前的研究中探索了如何开发支持大规模学习多任务的机器人,并将语言模型理解与辅助机器人的现实世界能力相结合。这个名为RoboCat的机器人智能体是全球首个能解决和适应多重任务的AI智能体,能够学习在不同的机械臂上执行各种任务,然后自我生成新的训练数据来对其进行改进。

RoboCat的学习速度比其他先进模型快得多——只需要通过100次左右的演示,RoboCat就可以学会操控机械臂来完成各式各样的任务,然后通过自生成的数据来进行迭代改进。这种能力将有助于加速机器人研究,因为这减少了对人类监督训练的需求,也是创造通用机器人的重要一步。

DeepMind的研究科学家、RoboCat团队的共同作者Alex Lee表示,“我们证明,一个大模型可以解决多个真实机器人承载的各种任务,并能迅速适应新的任务。

据DeepMind,RoboCat基于其多模态模型Gato(西班牙语“猫”的意思),它可以在模拟和物理环境中处理语言、图像和动作。DeepMind将Gato的架构与一个大型训练数据集结合并起来,该数据集由各种机器人手臂的图像序列和动作组成,可以解决数百种任务。

在DeepMind演示视频中,RoboCat已经可以通过自主学习操控机械臂,完成“套圈”“搭积木”“抓水果”等任务。这些任务看似简单,但考验了机械臂操作的精准度、理解力以及对于形状匹配难题的解决能力。目前RoboCat完成一项新任务的成功率已经在初期36%的基础上提升了一倍。

图片来源:DeepMind截图

基于原始数据集和新训练产生的数据,RoboCat的数据集将包含数百万次的训练轨迹数据。它学习的新任务越多,它就能更好地学习和解决额外的新任务。DeepMind的论文认为,执行任务成功率的大幅提升,是由于RoboCat的经验越来越丰富,就像人们在特定领域加深学习时发展出更多样化的技能一样。RoboCat独立学习技能和快速自我完善的能力,特别是当应用于不同机器人设备时,将有助于为未来的研究铺平道路。

图片来源:DeepMind截图

具身智能将引领AI下一个浪潮

《每日经济新闻》记者注意到,目前在机器人领域,包括特斯拉、谷歌、亚马逊、英伟达、腾讯等巨头已经有所布局。然而,正如DeepMind上述论文指出,由于训练机器人需要大量的时间,因此智能化水平仍不足,难以实现大规模的商业化。而RoboCat的问世或许能解决这一“痛点”。

其实,DeepMind的RoboCat只是AI赋能机器人的主要案例之一。今年以来,已经有数家公司将语言模型运用到了机器人上:2023年年初,谷歌推出视觉语言模型PaLM-E,并运用到工业机器人上;4月,阿里巴巴将千问大模型接入工业机器人;5月,特斯拉人形机器人Optimus展示了精准的控制、感知能力,同月,英伟达发布全新自主移动机器人平台。

得益于此,人工智能加持的机器人化身具身智能(Embodied Intelligence)吸引了全球的广泛关注。

马斯克在特斯拉2023年股东大会上便表示,人形机器人将是今后特斯拉主要的长期价值来源,“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200亿个,远超电动车的数量”。英伟达创始人黄仁勋在ITF World 2023半导体大会上也表示,AI下一个浪潮将是“具身智能”。

图片来源:东吴证券研报截图

东吴证券研报指出,具身智能首先需要听懂人类语言,分解任务、规划子任务,移动中识别物体,与环境交互,最终完成任务。东吴证券认为人形机器人很好地契合了具身智能的要求,有望成为标杆应用。“机器人研究的关键在于让机器人适应人类环境,最终走进千家万户的生活(工业、餐饮、医疗等多领域)。人形机器人有望率先在B端上量,最终打开C端市场。远期市场空间可观。”

东吴证券预计,2035年,假设人形机器人价格为20万元,且照顾、陪伴功能分别为美国/欧洲/亚洲市场累计新增了5%/7%/4%的渗透率,即单年渗透率分别为1%/1.4%/0.8%。在较悲观/中性/较乐观的场景中,家庭场景的市场规模将分别达到3.00万亿/3.66万亿/4.26万亿元。

封面图片来源:视觉中国-VCG41N1356593648

标签: DeepMind 机器人 谷歌

最新
  • 环球今头条!全球首个!谷歌旗下DeepMind展示用于通用机器人的AI智能体RoboCat:仅需100次训练便能完成任务,还能自我改进提升

    ◎RoboCat智能体更具“通用性”,并可实现自我改进、自我提升,为创造

  • 当前快讯:河南禹州市西炉村:架通电力线 废塘变“香”塘

    “电线一架通,荒废多年的水塘马上就成了香饽饽,国圈当即签了15年的承

  • 全球焦点!国家市场监督管理总局特食司周石平司长来咸调研指导工作

    三秦都市报-三秦网讯(乔义平记者黄艳)6月21日,国家市场监督管理总局

  • 所管产品业绩排名靠后,嘉实基金为何升任姚志鹏为副总经理?|世界快看

    嘉实基金任命基金经理姚志鹏成为公司新的副总经理,获悉,今年年初,姚

  • 焦点快播:多地推动考古学专业建设,冷门专业逐渐“热”起来

    高考刚刚落幕不久,紧张刺激的志愿填报环节又将到来。选择什么专业,一

  • 2023西樵山端午龙舟赛在哪里举办?

    2023西樵山端午龙舟赛地点如下:比赛名称:2023年南海超级龙舟联赛——

  • 沪深股通|安彩高科6月20日获外资买入2.9万股

    同花顺数据显示,2023年6月20日,安彩高科获外资买入2 9万股。截至目前

  • 【全球时快讯】电脑中的系统声音没有了怎么办?内存卡无法读取怎么办?

    电脑中的系统声音没有了怎么办一、系统声音的设置:首先点击"开始",

  • 向制造强市要人,温州跨出第一步

    踏上广东东莞的土地,浙江语妍鞋业有限公司人力行政负责人晏先继有故地

  • 摩托罗拉折叠屏3999元开售 每日信息

    摩托罗拉的新机motorazr40凭借3999元的价格把折叠屏的价格卷进4000元大

  • 被问到大陆参加活动是否有压力,胡德夫:我本来就应架一座桥过去 全球微动态

    【环球时报赴厦门特派记者周洋】今年73岁的胡德夫被誉为“台湾民歌之父

  • 一线调研|金融顾问制度五年记

    做“手撕牛肉”的思奇香,一直没能找到提问机会。

  • 是否有最适合1万元存款的方法?有哪些好的存款方式?|焦点快看

    在存钱的时候是会有定期和活期之分的,如果大家有钱就直接放在银行卡上

  • 余承东:想活下来跟华为走!_世界最资讯

    余承东:想活下来跟华为走!

  • 天天热资讯!海底捞回应8块钱生菜仅2片 海底捞没碰过的菜可以退吗?

    海底捞回应8块钱生菜仅2片6月14日,河北保定。女子海底捞就餐,吐槽

  • 余承东:华为智能驾驶研发每年投入100多亿 第四季度将上市问界M9|全球时快讯

    ​6月16日,在2023粤港澳大湾区车展的“2023未来汽车先行者大会”上,

  • 旅游
    • 世界微动态丨雷阵雨+9级大风!聊城要降温了!

    • 世界微头条丨玉树怎么养才能更旺盛_玉树怎么养才长得好 玉树的养殖技巧

    • 全球最资讯丨我打暑假工 打了54天 还差6天满两个月 一个月可以休三天 

    • 每日聚焦:武磊、艾克森搭档锋线,国足这次能赢几个球?