【ZiDongHua 之“自动化学院派”收录关键词:哈尔滨工业大学   自主智能系统  人工智能  机器学习  智能自动化 】

观点 | 北京加速布局具身智能产业 引领全国具身智能高质量发展

具身智能将人工智能与人形机器人、四足机器人等物理实体深度融合,使其不仅具备数据处理和决策能力,还能通过感知、运动与真实环境交互,实现自主学习和适应性行为。与传统的人工智能软件不同,具身智能强调“身体”与“智能”的结合,通过“感知—决策—行动一反馈”的闭环适应复杂现实场景。2025年政府工作报告提出“培育生物制造、量子科技、具身智能、6G等未来产业。大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备”。这标志着发展具身智能产业正式上升为国家战略。北京作为全国科技创新中心,在具身智能领域储备了良好的发展基础,正在引领全国具身智能高质量发展,着力打造全球具身智能产业高地。

具身智能技术实现新突破

近年来,北京市的具身智能产业加速产学研联动,汇聚创新合力,集聚了北京智源人工智能研究院、国家地方共建具身智能机器人创新中心(以下简称创新中心)等一批新型研发机构,人工智能创新指数排名全国第一、全球第二。

北京拥有全国最多的国家级人工智能科研平台及顶尖科研人才。北京大学、清华大学、北京理工大学、中国科学院等高校、科研院所积极投身具身智能基础研究与关键技术攻关,为产业发展源源不断地输送创新理论与前沿技术。相关研发机构在情感智能、工业机器人、电子皮肤、电子芯片等前沿领域持续创新。

北京人形机器人创新中心有限公司、北京优必选科技有限公司、北京理工华汇智能科技有限公司、北京银河通用机器人有限公司等人形机器人企业,积极与高校、科研院所开展合作,通过共建研发平台、联合承担科研项目、人才联合培养等多元模式,加速科技成果转化,推动具身智能技术从实验室走向市场,实现产业化应用。目前,数百家具身智能企业已在北京的多个园区显现出集群效应,在具身智能产业的人形化、人性化、应用化等方面取得重要突破,形成了以“大脑、小脑、本体”为核心的具身智能全产业链条。

在聚焦具身智能“认知—执行”双模态架构协同创新方面,具身“大脑”与“小脑”的深度耦合突破了技术瓶颈。具身“大脑”负责由AI大模型驱动的任务规划,能自然交互、感知空间、理解意图、分层规划和反思错误,具备多本体兼容、多场景适应和强大泛化能力。具身“小脑”负责协调数据驱动的端到端技能执行,操作子平台执行元技能库、泛化抓取等功能,运控子平台负责全身控制、双臂协作等任务。“大脑”规划任务,调用“小脑”技能库执行,控制肢体运动,再反馈形成闭环。

2025年3月12日,创新中心发布全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”,填补行业空白,为具身智能产业发展注入强大动力。该平台由AI大模型驱动的具身“大脑”与数据驱动的端到端技能执行具身“小脑”协同构成。配备“慧思开物”平台的人形机器人,能够精准解析自然语言指令,通过多模态信息融合与上下文理解,将复杂任务细化为可执行的子任务序列,并在执行过程中实时监测状态,借助自适应纠错与动态路径规划,确保任务高效、准确完成。

在具身智能的本体设计与研发领域,北京的创新主体已取得了显著的技术突破与产业化进展,形成从本体设计、运动控制到仿生交互的完整具身智能技术链条,为人工智能技术赋能物理世界提供了关键支撑。2024年8月,北京星动纪元科技有限公司正式发布其首款面向商业化应用的人形机器人产品星动STAR1,该机器人身高171厘米、体重63千克,采用高集成度电驱系统,可实现55个自由度的全域运动控制,其室外奔跑速度达3.6米/秒,刷新了电驱人形机器人运动性能的国际纪录。该机器人配备12个主动自由度全驱动的灵巧手,具备单手4指20千克负载能力,通过强化学习算法实现复杂操作泛化,可完成筷子夹取水饺、指尖操控骰子等高精度任务,并依托高密度触觉传感阵列,实现毫米级力控精度,支持超百种工具化操作场景,为工业制造、医疗护理、家庭服务等垂直领域提供技术验证平台。在运动控制基础之上,北京清飞科技有限公司突破仿生交互技术瓶颈,基于机器人本体开发出覆盖全身的弹性体表皮系统,通过多模态神经网络驱动面部42组仿生肌肉与表皮协同运动,实现六大类基础情绪的200余种动态表情生成,其唇形与语音的同步精度达98%,支持中、英、韩等多语种跨模态表达,为教育陪伴、服务咨询等场景构建了更具情感交互能力的具身智能终端。

具身智能生态日趋完善

政策构筑北京具身智能的创新基石。2025年2月28日,市科委、中关村管委会、市发展改革委、市经济和信息化局联合发布《北京具身智能科技创新与产业培育行动计划(2025-2027年)》(以下简称《行动计划》),为北京具身智能的未来发展锚定清晰航向。《行动计划》剑指关键技术攻坚,计划通过“揭榜挂帅”等创新机制,全力突破具身大脑模型、小脑技能库、智能芯片等“卡脖子”技术,全面提升具身机器人应对复杂任务的能力,旨在打造具有国际影响力的具身智能产业生态,推动具身大脑与小脑模型、智能芯片、全身运动控制等上下游产业链基本实现国产化。

创新中心还将联合高校、科研院所、集成商等具备人形机器人二次开发能力的机构,共同打造具身智能开源开放社区,重点推进数据、模型、场景验证等研究,为具身智能机器人大模型训练提供数据支持,加速通用本体的关键共性技术突破,推动具身智能机器人加速落地应用。

通过技术开源、数据共享、标准制定及产业协同,北京正在推进构建全球领先的具身智能开放生态。2024年11月11日,创新中心发布“天工开源计划”,开放通用机器人母平台“天工”的软件开发文档、结构设计文档,并计划逐步开源结构图纸、电气系统、运动控制框架等核心资源。在数据集开源方面,创新中心发布的首个标准化通用具身智能数据集(RoboMIND),适用于多平台、多场景、多技能,经多个模型验证有效,首批开放高质量具身智能数据10万条。在数据生态方面,创新中心数据采集涵盖6类机器人本体7个典型场景,支持模型训练与泛化能力提升。同时,创新中心牵头编制了《腿式机器人性能及试验方法标准》《人工智能具身智能数据采集规范》,推动了数据格式统一与行业规范化。

在2025中关村论坛年会“未来人工智能先锋论坛”上,北京智源人工智能研究院发布了全球首个跨本体具身大小脑协作框架RoboOS及开源具身大脑模型RoboBrain。该技术通过“大脑—小脑”分层架构与共享记忆系统,推动单机智能迈向群体智能,为构建具身智能开源统一生态、加速场景应用提供了底层技术支持,可应用于服务机器人、工业自动化、智慧物流、智能制造等领域,支撑复杂任务的多机协作需求。

目前,北京市具身智能正以蓬勃之势向多领域持续拓展应用,为各行业转型升级与社会生活品质提升注入强劲动力。在工业制造领域,具身智能推进提质增效。在汽车制造领域,具身智能机器人已深度嵌入生产流程。具备精准视觉识别与灵活机械臂操作能力的具身智能机器人,可承担零部件装配等任务。在医疗健康领域,北京已有多家三甲医院引入手术辅助机器人,依据术前影像数据,精准规划手术路径,术中通过机械臂实现毫米级精准操作,辅助医生完成高难度手术,降低手术创伤,提高手术成功率与患者康复速度。在教育科研领域,教学辅助机器人通过生动有趣的互动形式,激发学生学习兴趣。在科学实验课程中,机器人能模拟复杂实验操作,展示实验现象,帮助学生理解抽象科学知识。此外,在家庭服务领域,陪伴型机器人能陪老年人聊天解闷、提醒按时服药,为独居老人提供情感关怀与生活照料。

 

具身智能产业发展的挑战与趋势

在具身智能产业快速发展的同时,也面临着数据获取难题、模型能力仍待提升、标准与合规存在问题等挑战。

在数据获取方面,目前高质量机器人数据集缺失,收集真实世界的机器人数据耗时且昂贵,3D数据集建设也仍旧缓慢。行业中已经出现不少开源的机器人数据集,但数据质量参差不齐,无法实现跨场景、跨任务应用的通用机器人训练。

在模型能力方面,当前的多模态大模型仍然处于快速发展中,语言、视觉、触觉等多模态融合感知能力尚浅,无法支撑机器人在开放场景中运行,在复杂环境与长周期的任务执行能力不足。现有的智能体与计算能力无法实现知识的有效转移与泛化,任务规划器无法实现通用场景的适应性。

在标准与合规层面,具身智能技术、评测、安全伦理等标准缺失。因涉及跨人工智能、机械自动化等交叉学科技术,安全和伦理问题突出,标准化工作面临着系列挑战和难度。具身智能机器人的出现,不仅要考虑生命安全风险,还面临着信息安全、个人隐私等一系列伦理和社会学问题。当机器人与人类伦理发生冲突时,如何规范、合理地开发技术、使用智能产品,以及如何应对人机交互过程中可能出现的社会问题,成为亟待解决的问题,需要相关的监管标准和规范,明确机器人在各个场景中的应用边界和限制。

随着技术瓶颈的突破与生态的完善,具身智能将深入人们生活,重塑社会生产与生活方式,未来发展呈现出以下趋势。

技术创新发展。具身智能继续加深对智能本质的理解,将具备跨模态感知认知能力,形成“感知—决策—行动—反馈”闭环,理解复杂场景,世界模型是实现通用具身智能的关键。具身智能借助强化学习等技术将实现具身智能形态和行为的自适应优化,减少人类干预,提升自主决策和行为执行精确性。同时,构建智能体协作框架实现集体优化,未来或发展出高级群体智能算法和多智能体系统,完成复杂任务。

加速产业跨界整合。具身智能将深入工业制造领域,提升生产自动化与智能化水平,为医疗、教育、服务等行业带来全新变革。未来的机器人应用将更加多样化、个性化、智能化,跨界融合成为机器人应用的新趋势,促使不同产业相互学习、协同创新,创造出更多新的产品、服务与商业模式,全面推动产业结构优化升级。加速社会体系重构。具身智能代表着人工智能发展的新里程碑,预示着人类即将进入一个“知行合一”的新时代。智能将不再局限于冰冷的算法和数据,而是与现实世界紧密交织、共生共进。在劳动就业层面,传统的工作岗位将被自动化技术所取代,这要求社会对就业结构进行调整,并提供再培训和转岗的机会。在人机关系层面,具身智能可完成日常辅助工作与高级决策支持,让人类与机器的关系更加紧密。在社会关系层面,社会需提高公众对具身智能技术的认识和理解。此外,还要解决好具身智能的自主性和决策能力带来的伦理和法律问题。

 

文| 赵刚 董璞玉

(赛智产业研究院院长/赛智产业研究院高级咨询顾问)

排版 | 林晓彤