1/0
智元机器人开源百万真机数据集AgiBot World
澎湃新闻2024-12-31 08:12:00

高质量数据集是具身智能训练的重要燃料,但当下缺乏真机数据成为人形机器人技术发展的一个瓶颈。12月30日,澎湃科技(www.thepaper.cn)上海机器人初创公司智元机器人处获悉,智元机器人联合上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,正式开源百万真机数据集AgiBot World,旨在支持更泛化和更通用的机器人大模型训练。智能机器人透露,后续该公司还将发布具身基座大模型。

据智元机器人介绍,AgiBot World是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。此前,具身智能训练领域大规模的开源数据集是Google的Open X-Embodiment。相较于前者,AgiBot World长程数据规模高出10倍,场景范围覆盖面扩大100倍,数据质量也从实验室级上升到工业级标准。

“在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是进入到人类日常生活的方方面面,既有抓取、放置、推、拉等基础操作,也有搅拌、折叠、熨烫等复杂动作。”智元机器人相关负责人介绍说。

据了解,AgiBot World数据集诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过4000平方米,包含3000多种真实物品,复刻了家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)五大核心场景,收录了80多种日常生活中的多样化技能视频。

当前,高质量的数据集对于当下人形机器人技术的发展尤为重要,但行业内高质量数据稀缺这一问题存在已久,有业内人士此前在接受澎湃科技采访时曾指出,尽管语音和图像数据可以通过互联网获取进行标注训练,但机器人需要的特定场景数据极为稀缺。

在数据采集方面,一直以来,业界也正积极补齐数据短缺这一短板。比如今年8月,特斯拉对外高薪招募“数据采集员”;12月27日,北京国地共建具身智能机器人创新数据采集基地亮相,同日,上海提出“搭建超大规模城市级的模拟应用场景,率先赋能具身智能、自动驾驶等大模型实训”。

据了解,AgiBot World是智元机器人本年度开源的第三个项目,相关数据将在HuggingFace、Github以及Agibot-world.com项目主页上分批上传。智元机器人方面称,将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781