光轮智能携手 NVIDIA 联合开源发布 Isaac Lab-Arena 具身评测基准框架
随着机器人基础模型能力的持续提升,具身智能正进入一个关键阶段:模型是否真正具备可泛化、可复现、可规模化的能力,开始比单次训练结果或演示效果更加重要。在模型规模不断扩大的背景下,训练损失的下降与零散Demo的成功,已难以全面反映模型在真实环境中的综合能力。一些局部优化可能带来“好看”的展示,却无法保证在长时程执行、复杂物理交互、失败恢复以及分布变化条件下的稳定表现。
与此同时,机器人基础模型正从单任务能力,迈向跨任务、跨环境、跨本体的通用化运行,对评测提出了更高要求——评测不再只是验证“是否完成脚本”,而是需要系统性覆盖长时程执行、真实物理交互、异常处理能力与跨本体泛化等关键维度。在这一背景下,光轮智能与NVIDIA联合开源发布Isaac Lab-Arena,为机器人基础模型构建面向工业级应用的大规模评测基准框架,推动具身智能从“训练驱动”迈向“评测驱动”的新阶段。
Isaac Lab-Arena:光轮智能与 NVIDIA 深度共建的开源评测基准框架
Isaac Lab-Arena是由光轮智能与NVIDIA Robotics团队深度合作开发的大规模开源机器人策略评测基准框架。在过去一年中,双方围绕机器人评测的系统架构、任务抽象方式、大规模并行执行机制与物理一致性等关键问题,开展了持续、深入的技术共研。在NVIDIA CES 2026官方新闻稿中,NVIDIA将光轮智能列为Isaac Lab-Arena的核心共建方:
“NVIDIA Isaac Lab-Arena是一个开源框架,提供了一个用于大规模机器人策略评测和基准测试的协作系统,其评测层和任务层由光轮智能与NVIDIA深度合作设计开发。”

NVIDIA官方新闻稿中将光轮智能列为Isaac Lab-Arena的核心共建方 —《NVIDIA Releases New Physical AI Models as Global Partners Unveil Next-Generation Robots》
光轮智能与 NVIDIA Robotics 团队联合开发了 Isaac Lab-Arena,共同完成评测框架的系统架构、评测范式与任务体系设计,使机器人策略评测具备可规模化、可复现与工程化运行的能力。在此之上,光轮智能进一步构建了 LW-BenchHub,作为评测基准的执行与资源平台,持续沉淀可复用的任务集、场景与仿真资产,支撑更大规模与更复杂的评测需求。光轮智能团队与 NVIDIA 核心技术团队在美国圣克拉拉与瑞士苏黎世等地进行了多轮线下与远程协作,一起交付最终的框架。

Isaac Lab-Arena 将任务、机器人和场景完全分离,支持灵活组合,从而可以评测模型在不同机器人平台和环境下的泛化能力
Isaac Lab-Arena采用标准化的三层评测结构,实现对机器人策略能力的系统性覆盖:机器人本体层:支持宇树G1、Agilex PIPER、ARX X7s等主流平台,实现跨本体的统一评测。场景层:覆盖家居、工业、农业等多样化应用环境。任务层:涵盖操控、运动、移动操作一体化等核心能力维度。三者相互解耦、灵活组合,使“任意机器人 × 任意场景 × 任意任务”的评测配置成为可能,评测规模可随需求扩展,覆盖传统评测方法难以触及的能力空间,从系统层面重点解决了四个核心挑战:可复现性:Isaac Lab-Arena提供标准化的评测协议和固定的随机种子,确保不同团队、不同时间的评测结果可以直接对比,消除“各说各话”的行业困境。物理准确性:基于与NVIDIA Isaac Sim的深度集成,Isaac Lab-Arena能在高保真、物理一致性更强且可控的仿真环境中进行评测。大规模并行执行能力:传统评测流程中,由于不具备大规模并行能力,评测时间随任务量线性增长,Isaac Lab-Arena支持数千个评测实例同时运行,可大幅降低评测所需时间。评测驱动闭环机制:Isaac Lab-Arena支持在评测过程中记录可扩展的指标与数据,并与数据生成、训练流程紧密衔接,便于定位失败模式并把评测信号回流到后续训练迭代。
此外,随着Isaac Lab-Arena加入Hugging Face LeRobot生态,光轮智能开源的250+评测任务已面向全球开发者社区开放。

从基准框架到评测平台:光轮智能的全栈具身评测体系
光轮智能全栈评测架构
在Isaac Lab-Arena的基础上,光轮智能进一步构建了自下而上的完整评测体系:Isaac Lab-Arena:作为评测基准框架,提供标准化任务定义、可复现环境构建与统一评测接口,使多种任务、机器人和策略能够在单一框架内评测。LW-BenchHub:评测基准执行层与资源平台,为Isaac Lab-Arena与上层平台提供丰富的仿真资产与场景资源。RoboFinals:面向机器人基础模型的工业级规模化评测平台,引入真实世界任务定义与评测标准,已被阿里通义千问等多家顶尖模型团队用于内部评测。
共建开放、可持续演进的评测生态
当前具身智能行业普遍面临的问题,并非模型能力不足,而是缺乏可规模化、可复现、可比较的评测基础设施。只有当评测能力与模型能力同步扩展时,具身智能才能真正进入工业化的正循环。光轮智能与NVIDIA将持续围绕Isaac Lab-Arena展开深度技术共建,推动具身智能评测基准的持续演进。What gets measured gets improved. 评测不是终点,而是起点。光轮智能诚邀全球开发者、研究机构与产业伙伴共同参与开放仿真生态的构建,携手推动具身智能仿真评测基准的开发与普及,加速通用具身智能时代的到来。







评论排行