如何让机器人“从“读”<万卷书”>“到“”‘行万里’路”{?}

作者:三农最新资讯 | 发布时间:2026-03-18 22:11:01 | 阅读:7446

文章目录

3月14日,在上海东方枢纽国际商务合作区举办的“申...

3月14日,在上海东方枢纽国际商务合作区举办的“申城策源·智链终端”人工智能终端投融资峰会上,行业专家与投资者齐聚一堂,共同探讨了端侧AI领域的发展趋势。

与会者普遍认为,随着AI从云端走向手机、PC、汽车...

与会者普遍认为,随着AI从云端走向手机、PC、汽车乃至各类机器人,如何让这些智能终端理解并操作系统所在的物理环境,已成为产业爆发的核心命题。

具身智能的数据困境

“我们曾经讲过读万卷书不如行万里路。

”芯原股份创始人戴伟民在峰会上说,“现在机器人的‘...

”芯原股份创始人戴伟民在峰会上说,“现在机器人的‘小脑’(运动控制)做得很好,运动很灵活,但是‘大脑’(环境理解与决策)不行。

“大脑”的困境源于数据的缺失。

与语言模型可以轻易获取整个互联网的文本数据不同,具...

与语言模型可以轻易获取整个互联网的文本数据不同,具身智能需要的是与物理世界交互产生的数据,从中训练出真正可以理解真实世界的智能。

上海国投先导私募基金管理有限公司副总经理吴绪成指出...

上海国投先导私募基金管理有限公司副总经理吴绪成指出,当前整个具身智能产业的核心瓶颈是“数据供给严重不足”。

与此同时,获取数据的技术路线与训练“大脑”的大模型技术路线都尚未收敛。

究竟是采用直接学习“视觉-语言-行动”的VLA模型...

究竟是采用直接学习“视觉-语言-行动”的VLA模型,还是构建一个能预测物理世界变化的“世界模型”,业界仍在探索。

VLA(Vision-Language-Actio...

VLA(Vision-Language-Action)模型试图直接学习从“看到什么(视觉)、听到什么指令(语言)”到“该做什么(行动)”的映射关系,让机器人的行动变得可以用文字解释。

另一种世界模型(World Model)的思路则致...

另一种世界模型(World Model)的思路则致力于在模型内部构建一个关于物理世界的空间,真正做到理解物体、空间关系和物理规律,从而能够让机器像人一样预测行动的后果。

然而,无论是哪一种算法,都需要用物理世界的数据去训练。

在酷哇科技CEO何弢看来,整个具身智能赛道正陷入一...

在酷哇科技CEO何弢看来,整个具身智能赛道正陷入一个“先有规模还是先有智能”的先发悖论:没有足够智能的机器人,就无法在真实场景中大规模应用;而没有大规模应用,就无法收集到训练出更强“大脑”所必需的海量、高质量交互数据。

如何打破这个循环,成为所有从业者必须回答的问题。

“路测法”与“落地法”之争

“物理世界当中的交互数据怎么样能够有效地捕获,如何有效低成本地获取?

这是在端侧模型发展目前面临的首要问题。

”何弢在峰会的主题分享中提到,并借鉴自动驾驶领域的发展历程,提出了解决方案。

他将两种数据获取策略类比为谷歌Waymo的“路测法”和特斯拉的“落地法”。

“路测法”即直接部署专门的测试车队,一步到位地在真...

“路测法”即直接部署专门的测试车队,一步到位地在真实道路上采集高质量数据, 其优势在于目标纯粹、数据高保真,但缺点在于规模扩张极度依赖高昂的资本开支,属于典型的“烧钱模式”。

而“落地法”则另辟蹊径。

“特斯拉巧妙地利用了落地法,”何弢分析道,“先打磨...

“特斯拉巧妙地利用了落地法,”何弢分析道,“先打磨出一个具备生产力价值的产品,比如一辆人类可以舒适驾驶的车。

在交付产品、获得收入的同时,获取大量宝贵的数据。

”这种模式虽然前期获取数据的速度稍慢,但一旦产品形...

”这种模式虽然前期获取数据的速度稍慢,但一旦产品形成规模,就能在不依赖资本持续输血的情况下,形成一个“技术发展-商业落地-数据反馈”的良性飞轮。

遵循这一逻辑,何弢介绍道,酷哇科技致力于成为“世界模型驱动的城市具身智能全栈方案商”。

通过打造智慧城市管家机器人、智慧出行小巴、智慧物业...

通过打造智慧城市管家机器人、智慧出行小巴、智慧物业服务机器人等一系列能即刻产生商业价值的机器人产品,将其大规模部署到城市的大街小巷。

“我们通过打磨产品,在城市场景当中去把这个产品布出去了以后,一边作业一边获回馈数据。

”何弢说。

目前,酷哇的城市管家机器人已经占据市场上超过90%的份额,出货量超过1万台。

这些机器人构成了一个庞大的、持续运转的数据采集网络,已经收集了超过50PB的物理真值数据。

具身智能的终极图景:从城市迈向家庭

何弢表示,酷哇科技正在利用这些数据训练更加“聪明”的端侧机器人“大脑”。

这个系统中不仅包含一个“世界模型”,让机器人具备理...

这个系统中不仅包含一个“世界模型”,让机器人具备理解基本物理规律的直觉,也有部署在端侧和云端的推理模型,让它们能够进行逻辑推理这样的“慢思考”。

在他看来,这种数据与算法相互驱动的模式一旦成型,将带来显著的“马太效应”。

拥有最多落地场景和数据的企业,将能训练出最强大的“...

拥有最多落地场景和数据的企业,将能训练出最强大的“世界模型”大脑;而最强大的大脑又能驱动机器人提供更好的服务,从而收割更多的市场份额与数据资产。

“头部玩家的雪球越滚越大,底层推力正是数据与技术的飞轮效应。

机器人大脑的技术演进越快,商业护城河就越深。

”何弢说,即便现在已经出现使用AI合成的仿真数据来训练模型的方式,真实世界数据的价值也难以取代。

基于这些原因,何弢认为,比起现在还没有明确使用场景的人形机器人,具备精准场景定位、能迅速规模化落地的轮式或轮足机器人,例如自动驾驶汽车、商业清洁机器人、物流机器人等,反而可能是具身智能行业更好的起点,也能够收集到更多的真实数据。

他告诉澎湃科技,具身智能发展的第二个阶段可能是在更大范围但仍受限的场景中,实现多智能体的协同作业。

例如在一个社区或工业园区内,由一个统一的“世界模型”驱动无人小巴、配送机器人、清洁机器人协同服务,由一个“大脑”控制多个“身体”。

“我认为是在三年内就可以看到。

”他说。

何弢认为,机器人发展的最后一个阶段是真正进入家庭,成为“给大家当保姆、做服务员”的通用机器人。

他表示,家庭场景的复杂性和不确定性远超前两者,“居家机器人的能力,应该是结合上前面所有能力的集大成者。

标签: 创业 企业 互联网 商业 经济
上一篇:上一篇文章
下一篇:下一篇文章