在2024世界人工智能大会,比ChatGPT更火的是人形机器人
今年的世界人工智能大会,人形机器人大放异彩。
从北门进入世博展览馆,一排由人形机器人组成的“十八罗汉”几乎被观众围得水泄不通。除了这些人形机器人,本届大会展出了国内首秀的特斯拉人形机器人Optimus(擎天柱)二代,还发布了国内首个全尺寸开源通用人形机器人青龙,受到市场多方关注。
如果说2023年世界人工智能大会人人都在谈论的是ChatGPT,那么,在2024年的大会现场,人形机器人的热度已经不输通用大模型。在首日的人形机器人主题论坛上,甚至有企业家表示,“具身智能才是实现AGI(通用人工智能)的最有效途径,OpenAI的大方向大概率是错的”。
对于ChatGPT的迷信似乎正在打破。快速火热的人形机器人赛道,正在迎来产业化“蝶变”的关键时刻。
未来3到5年是关键时期
提出“具身智能是实现AGI的最有效途径”观点的企业家是宇树科技的CEO王兴兴。宇树科技是一家很有代表性的机器人创业企业,创始人王兴兴是90后,2016年创办了宇树科技。几年时间里,宇树科技从3人一路发展壮大到500人,连续拿下红杉中国、德迅投资等知名创投基金的投资,今年年初还完成了10亿元的B2轮融资。
“快”是这家企业发展的关键字。就在今年5月份,宇树科技发布了其最新的人形机器人产品——Unitree G1,市场售价仅9.9万元起,这让宇树科技一下子成为机器人市场的焦点。
9.9万元是什么概念?目前特斯拉公开的人形机器人Optimus二代,预计成本价在1万美元左右,市场售价在2万美元左右,9.9万元可以说是一个非常“接地气”的价格。展会现场,有工作人员向记者表示,目前这款机器人已经收到了全球不少订单。
在世博展览馆中厅,18台人形机器人组成的“十八金刚”先锋阵列。宇树科技人形机器人为左一。
不过,宇树科技目前发布的人形机器人并没有搭载大模型“大脑”,这是其与特斯拉Optimus二代的最大区别。业界通常将前者归类于一代人形机器人,将后者归类为二代人形机器人。目前,宇树科技将AI大模型运用在了其技术更成熟的四足机器人上。
特斯拉的Optimus仍然是业界的风向标。在本次世界人工智能大会上,特斯拉Optimus二代在上海首次亮相,吸引了大批的观众。
需要注意的是,此次特斯拉带来的Optimus二代人形机器人为静态模型机,并不能在现场进行动态展示。事实上,Optimus二代的动态效果此前只在特斯拉官方视频中进行过披露。现场有业内人士表示,特斯拉从未将原型机在线下展出可能出于两个原因:一是人形机器人仍在训练的过程中,产品功能还有待完善,二是为防止机器人商业信息提早泄露或被拆机,上市前不会让外界接触其原型机。
特斯拉Optimus人形机器人吸引了大批观众关注。
无论是出于哪一种考虑,在官方口径里,特斯拉的这款机器人会在2025年年底前量产上市,届时将有超过1000个Optimus二代被投放到特斯拉工厂,帮助员工完成生产工作。特斯拉的目标是在未来达到年产10亿台,占据市场10%以上份额。
这似乎像一个倒计时,不断地提醒着国内企业,人形机器人的产业化迫在眉睫。现场多家人形机器人企业的工作人员告诉记者,目前国内做人形机器人的企业越来越多,他们预计国产AI人形机器人的商业落地时间在3到5年。
不过,也有专家表示,如果3年之后,人形机器人还不能很好的实现AI与硬件的适配融合,完成商业落地,那么也不排除人形机器人赛道被摒弃,AGI向异形机器人赛道转变的可能。未来一段时间可能是人形机器人产业化的关键时期。
为什么是人形机器人?
回到开头的观点,人形机器人正在打破国内人工智能产业对ChatGPT的迷信,其背后原因也有一些中国特色。
本次世界人工智能大会上,另一款大热门人形机器人——青龙由国家地方共建人形机器人创新中心(简称“国地中心”)研发。国地中心技术负责人邢伯阳告诉记者,从开发到发布,这款人形机器人只花了6个月的时间。
人形机器人是集成度极高的产品,国地中心为什么能这么快完成?这与长三角的机器人产业基础有很大关系。
据介绍,青龙人形机器人的很多零部件都是长三角造,其安装的“大脑”朱雀也是由科大讯飞星火大模型和书生浦语大模型支持。
在青龙人形机器人展台业内人士对记者表示,国内工业自动化产业发展得早,近两年大模型又发展势头迅猛,基础良好。“上海有上海人工智能实验室,还有这么多互联网企业,要想实现AI+人形机器人其实很快”。
青龙人形机器人在展台进行动态演示。
中国有做机器人的基础,通过具身智能有可能更快地让人工智能产业落地、商业闭环,这是人形机器人赛道愈发火爆的关键原因。而反过来看,以ChatGPT为代表的大语言模型已经爆火近两年时间,产业化的问题在逐渐暴露,这也是更多人将眼光投向人形机器人赛道的重要原因。
王兴兴在展会论坛中表示,目前的大语言模型、多模态模型实际上对整体世界的理解非常差。“大模型对平面数据的理解做得非常好了,但对时间、空间的理解还远远不够。”王兴兴认为世界模型+具身智能才是通向AGI的最佳路径。他表示目前全球顶尖的科学家都在推动世界模型的构建,让机器人真正理解整个世界,进入到工厂、家庭这样的场景帮人类完成劳动。
规模化数据是行业最大痛点
一个赛道的迅速火热,必然伴随着浮躁。
邢伯阳表示,现在的人形机器人商业化现状企业有点混乱,一代人形机器人的方案已经比较成熟,甚至会有解决方案提供商专门卖控制算法,60万元就能让人形机器人动起来。但一代人形机器人的实际应用非常有限,要想实现广泛的商业应用,还是要让AI赋能人形机器人。
但AI赋能还面临着很多挑战。大模型植入机器人快,但要想适配应用场景还很难。目前市面上开发的二代机器人大多采用“大脑+小脑”的AI赋能模式。比如青龙,就配置了“朱雀”多模态大模型作为“大脑”,用于接收外界信息和任务决策;“玄武”模型作为“小脑”,用于控制机器人运动轨迹、具体任务执行。
“大脑”模型,即多模态大模型,这在当前国内市场有很多选择。但“小脑”模型需要每个人形机器人开发机构自己构建,并且针对未来人形机器人的应用场景,进行专门化的动作训练,才能适配应用场景。
在训练“小脑”的过程中,最难的数据积累。邢伯阳认为,人形机器人规模化数据是整个行业目前最大的痛点。现在人形机器人开发机构使用的数据,一方面是来源于国外的开源数据,一方面是来源于自己采集的数据。但自己采集数据的缺点在于,企业需要使用大量的人力进行重复动作,成本很高。
北京大学助理教授、北大—银河具身智能联合实验室主任王鹤在前述论坛中提到,在特斯拉的公开信息中,为训练Optimus二代人形机器人放置电池到红盒子里这一个动作,特斯拉就出动了40人的数据采集团队去做,用这样高成本的数据采集方式去替代一个可能几千元的人力成本,对商业转化是非常不友好的。
为了解决规模化数据的痛点,业界也做了不少尝试。王鹤认为,合成数据可能是获取大体量数据的关键技术。还有机构则在推动数据开源,通过共享来降低数据获取成本。
在本届世界人工智能大会上,国地中心除了发布青龙人形机器人,还推出了OpenLoong开源社区。建立开源社区就是为了能够聚集更多应用单位、人形机器人整机制造商以及核心部件的上下游企业,推动人形机器人领域的开源发展,加速技术创新和产业应用。