【ZiDongHua 之“会展赛培坛”收录关键词: 自变量机器人 人工智能 机器人 数据融合 ChatGPT 具身智能
  

  自变量亮相深圳市委党校AI大讲堂:全景解读具身智能——技术趋势、行业展望与未来机遇

  
  近日,自变量机器人受邀在深圳市委党校的《AI大讲堂》中,为全市近千名领导干部进行专题讲座,分享具身智能的最新发展。
 
  
  深圳正在全力全速打造人工智能先锋城市,覆盖具身智能全链条的产业生态正在逐步成型,为进一步推动行业部门和公职人员懂AI、知AI、用AI,更好地服务深圳科技产业发展,更好地服务企业家、服务人才,今年9月开始,市委组织部、市委党校连续不定期的举办 《AI大讲堂》,邀请人工智能领域知名企业家、专家学者、高层次人才等分享行业最前沿的专业知识和实践经验。
  
  这也是《AI大讲堂》第二次内容分享。自变量聚焦自研通用具身智能大模型及人形机器人本体,是国内最早采用完全端到端路径实现通用具身智能大模型的公司之一,此次分享不仅解读了具身智能的技术趋势,也为深圳乃至全国的具身智能产业发展带来了新思路。
  
  “拥有身体的智能”,解决物理世界问题
  
  讲座中,自变量机器人创始人&CEO王潜明确具身智能的核心价值:彻底替代手工劳动,推动生产力指数级发展。
  
  回顾历史上工业革命发展历程,前两次革命以机器替代人工实现了效率跃升,但AI革命却因多集中于虚拟或信息世界而面临“索洛悖论”。如今,除芯片制造外,多数产业仍依赖手工劳动,增长呈线性模式。
  
  而具身智能正是推动生产力从“线性增长”转向“指数级增长”的核心,不同于传统机器人,它要让机器人像人一样“感知、思考、学习、使用工具”。
  
  长期以来,硬件常被误以为是具身智能的瓶颈,实则不然。王潜指出当前机器人硬件已超越人手,但操作多需预先编程或人工遥操,本质是AI能力不足。
  
  核心难点在于两方面:一是物理世界随机性强,各种细微的物理因素都可能导致任务失败;二是AI模型不适配,现有语言/多模态模型擅长处理虚拟信息,却无法理解物理世界的三维结构。
  
  自变量自研的通用具身智能基础模型,是平行于独立于语言模型之外的物理世界的基础模型,是虚拟世界的AI技术的延伸。
  
  自研端到端统一具身智能基础模型
  
  围绕“物理世界基础模型”,自变量团队构建了具备“端到端、统一模型、Scaling Up”三大特性的技术体系:
  
  端到端控制:摒弃传统分步骤操作易产生的“错误累积”弊端,机器人可直接将指令转化为执行动作,提升执行效率与准确性。统一模型能力:反直觉地让模型学习所有任务之间的共性,一个模型即可完成收纳整理、工业操作等多样化场景任务,仅需两天就能学会新动作;Scaling Up的拓展:突破 “静态数据学习” 局限,转为在环境中大规模部署,动态交互学习拓展边界。机器人能在长程柔性物体(绳子、布料)复杂操作环境中自主调整,展现卓越的抗干扰能力。
 
  
  泛化性是衡量具身智能模型能力的重要指标,涵盖了从低到高四个层次:基础环境泛化、物体属性泛化、动作指令泛化以及任务场景泛化;目前自变量团队已较好地实现了前两个层次的泛化,后两个层次也有较快进展。
  
  中期发展依靠数据,长期落地关键在于产品
  
  过去,行业聚焦算法与模型结构设计,靠人类预设规则教AI解决单一任务;2022 年 ChatGPT出现后,核心转为“给AI高质量数据,让其自主提炼规律”,无需复杂预设即可应对多任务,具身智能也得益于这一思路——物理世界的动态规律无法靠算法定义,只能依赖高质量数据积累。
  
  数据的核心价值在于质量,而非数量或多样性。尤其在具身智能领域,数据好坏无法靠人类判断,需要模型自主筛选高质量数据。
  
  王潜提到,中期来看,数据是最重要的,但长期还要考虑软硬一体、最终的品牌与产品……这也是自变量落地深圳的重要原因,国内尤其是深圳在供应链上的优势能够非常好地帮助自变量跨阶段发展。
  
  当前具身智能相当于语言模型GPT-2的发展阶段,随着技术突破,3-5年将有望出现 “ChatGPT级”的颠覆性模型。且其商业落地通道平缓,预计明年将出现首批正ROI的B端应用。
  
  放眼全球,美国在资本、算力投入上远超中国,且更注重“下一阶段技术要素”;中国则偏向“当前量产”,而具身智能是中国有望从起步阶段就实现领先的赛道——关键就在于从“跟随”转向“前沿探索”,加大技术投入。
 
  
  讲座后的提问环节,现场学员们也围绕多方面问题与王潜、王昊进行交流。关于深圳机器人供应链,团队表示其硬件供应链与集群响应速度全球领先,但核心零部与国外有差距,需加大AI投入以实现“AI牵引硬件创新”与“软硬协同”。在商业模式上,自变量初期从B端:工业、物流、养老、酒店等场景突破,长期目标是打造面向C端的通用机器人平台。
  
  针对核心技术与可持续性,团队表示机器人软硬件均国产化以避“卡脖子”风险,行业或经“泡沫破裂”但具身智能生产力价值不可替代,数据质量与模型迭代能力是技术可持续关键。在技术细节上,王昊称当前机器人推理慢是系统问题,消费级显卡可满足端侧推理需求,未来算力或成限制,泛化性将先解决“同一硬件本体场景泛化”,再借多元数据融合实现“跨硬件本体泛化”。
  
  “具身智能不是‘抢饭碗’,而是解放人类劳动,创造新需求”。此次市委党校的分享,清晰地预测、描绘了具身智能的现状与未来。随着技术突破与产业落地,自变量将持续积极实践,推动具身智能走向全球领先,为深圳加快建设国际国内领先的具身智能机器人产业注入新动能。