【ZiDongHua 之“智能自动化”标注关键词: 深势科技 自动化部署 智能体】
深势科技发布Deploy-Master并上线玻尔,一天内自动化部署5万个Agent-Ready科学工具
行入口,能够被真实使用、复用和自动化调用。 近日,深势科技玻尔(Bohrium)+ SciMaster 团队围绕科研工具大规模自动化部署的研究成果发表于 arXiv。论文报告了一项面向真实开源生态的规模化实践:从 50 万级开源候选仓库出发,系统检索、去重与筛选后,将 5 万余个科研工具候选纳入自动化编译与部署流程,并生成可复现、可验证的运行环境,形成可被科研人员与科研智能体直接调用的 Agent-Ready 工具单元。
Deploy-Master 已在玻尔平台上线并开放使用,面向科研社区提供自动化编译与部署服务:https://www.bohrium.com/apps/deploy-master
论文地址:https://arxiv.org/abs/2601.03513
规模化实践:
单日完成52,550次构建尝试,
验证通过50,112个工具根据论文介绍,在工具发现阶段,系统从 50 万级开源候选仓库出发,经过多轮去重与严格筛选,最终确定 52,550 个具备明确科研工具属性、可进入构建流程的候选对象。随后,系统在单日内对这 52,550 个仓库发起自动化构建尝试,并对产出的运行环境进行最小可执行验证,最终 50,112 个工具验证通过,整体成功率达到 95.36%。 这意味着,这些工具不仅“存在于仓库中”,还具备了可复现的运行环境与可检查的执行入口,能够被真实使用、复用和自动化调用。

配图 1:5 万+ Agent-Ready 工具覆盖生命科学、化学与材料、物理地学与空间科学、工程系统与科研基础设施等方向。
Deploy-Master如何工作:
智能体独立完成
发现、构建与验证
支撑上述结果的核心系统是 Deploy-Master。Deploy-Master 采用“智能体驱动”的方式,将科研工具从开源仓库自动转化为可运行、可验证的工具能力单元,形成“发现—构建—验证—发布”的自动部署闭环。
在本次实践中,Deploy-Master 主要由两类智能体协同完成任务:
工具发现智能体(Search Agent):面向科学与工程任务,对大规模开源仓库进行系统检索与迭代扩展,并基于明确的科研工具准入标准完成去重与过滤,逐步收敛至可进入构建验证的候选集合;
构建与验证智能体(Build Agent):对入选仓库自动推断构建方式与运行入口,完成环境封装与编译部署,并通过最小可执行命令对工具进行执行验证;
验证通过后形成可复用的 Agent-Ready 工具单元,进入统一发布与检索体系。在这一流程里,核心标准是 “可复现运行环境 + 最小可执行验证”,而非仅依赖文档说明或人工判断。

配图 2:Deploy-Master 通过工具发现智能体与构建验证智能体协同,把仓库转化为 Agent-Ready 的科学能力。
在统一的自动化流程下,系统也得以对大规模部署过程本身进行系统性观察。从实践结果看,大多数工具可以在约 7 分钟内完成构建,但整体分布呈现出明显的长尾特征:一部分工具仅包含轻量级脚本或解释型代码,而另一部分则涉及复杂编译流程、深层依赖以及系统级库配置,其构建时间显著更长。这种差异并不会阻断整体流程,但直接决定了规模化部署下的成本结构。
在成功部署的 50,112 个工具中,工具覆盖 170+ 种编程语言。Python 占比最大(52.3%),其余语言的部署成功率整体保持在较高水平。少数成功率相对较低的情况,主要集中在依赖复杂编译链或系统级库的场景,如 C/C++、Fortran 以及部分 R 工具。这并不意味着这些语言“天生更难部署”,而是反映了其工具链对底层环境的耦合程度更高,从而放大了构建规格中的不确定性。
在 2,438 次失败的构建尝试中,失败原因并非均匀分布,而是高度集中在构建流程与依赖/编译链不匹配等少数类别,明显多于资源不足、网络异常或权限问题。这些失败在规模化条件下反而成为系统暴露问题、持续优化调度策略与隔离机制的重要信号。
配图 3:部署实践总结(部署结果、许可证与语言分布、失败类型、应用层级与“语言规模—成功率”关系等)
Deploy-Master为
Agentic Science at Scale
提供可执行工具底
座长期以来,科研领域并不缺高质量开源软件,但由于编译复杂、依赖链深、环境假设强,许多工具往往只能在特定课题组或特定计算环境中稳定使用。结果是,大多数平台能够长期稳定维护与交付的科研工具规模,常常停留在数百级别,“把工具跑起来”本身就成为科研流程中的隐性成本。Deploy-Master 所展示的价值在于:当工具的发现、编译、部署与验证能够被自动化、系统化地处理,科研工具第一次具备了在大规模条件下被持续交付和复用的工程基础。对科研人员而言,这降低了复现与协作的门槛;对科研智能体而言,这意味着可以在统一、可靠的运行环境中调用真实工具,进一步组织与验证科研工作流。
Deploy-Master 并非孤立工作。它与玻尔平台的统一运行环境,以及 SciMaster 引领的科研智能体体系,共同构成了面向未来科研范式的重要基础设施组合:当大规模科研工具能够被稳定执行,当智能体可以调用真实工具并完成闭环验证,科研自动化与智能协作才可能从概念走向持续演进的现实系统。
关于深势科技
深势科技是全球 AI for Science 的开拓者和引领者,公司成立于2018年,在北京、上海、深圳、宜宾等地设有办公室和研发中心。以“加速科学发现,释放科学价值”为使命,致力于打造 AI 科学家(AI Scientist)及自主进行科学发现的智能系统。以深势·宇知®科学发现智能引擎为基座,深势构建了一系列“读文献、做计算、做实验”的智能科学工具,和各领域的科学智能体,构成了 Science as a Service 智能化科研产品和服务矩阵:玻尔·科学导航,玻尔·勒贝格智算以及 Hermite®、Piloteye® 等一系列研发软件,玻尔·赛博实验室,SciMaster 科学智能体及面向科学发现的“大装置”和研发服务,为基础科研、生命科学、物质科学等领域的科学家和研发型组织提供深宽兼顾、灵活组合的解决方案。作为国家高新技术企业、国家专精特新“小巨人”企业,深势科技科研技术团队由中国科学院院士领衔,汇集了超百位数学、物理、化学、生物、材料、计算机等多个领域的优秀青年科学家和工程师,其中博士及博士后在公司成员中占比超过35%。2020年,深势科技核心成员获得全球高性能计算领域的最高奖项“戈登贝尔奖”,相关工作入选2020年中国十大科技进展和全球 AI 领域十大技术突破。







评论排行