【ZiDongHua 之“创新自化成”标注关键词:词元工厂 人工智能 机器人 北京 】
北京首家“词元工厂”正式投用!像用电力一样用算力
6月9日,北京首家“词元工厂”——北京壹号词元工厂正式落地经开区信创园,今后算力将像电力一样成为稳定、普惠的公共资源。北京建设“人工智能之城”再落一子。
北京壹号词元工厂由软通动力信息技术股份有限公司(以下简称“软通动力”)建设,由一台台服务器组成,项目一期每日Token产能可达1.4万亿。软通动力同步向全球开源“词元工厂性能基准”(含评测框架LoadGen 2.0),这是行业首次针对智能体长时运行特征建立统一的性能度量标准,标志着大模型算力供给从粗放式吞吐比拼,进入标准化、工业化的Token流水线时代。

Token,即词元,是AI处理文字的最小单位。算力是服务器运算的能力,算力越强,每秒能处理的Token就越多,使用成本随之降低。就像人力气越大,干活儿就越快,能同时解决的事儿也越多。在人工智能时代,算力已经成为国家综合实力的核心指标。
01
智能体时代的“新型电厂”
大语言模型(LLM)正从简单的对话机器人,加速演进为能够自主规划、推理并采取行动以达成复杂目标的长时运行系统。一个简单的用户指令背后,可能是模型数十次推理循环、工具调用与自我反思的叠加。这意味着算力消耗不再是“一问一答”式的短时脉冲,而是长周期、多轮次、高不确定性的混沌负载。北京壹号词元工厂的解法,是做面向智能体时代的“新型电厂”,实现像用电一样用Token。

北京壹号词元工厂聚焦Agentic Serving(智能体服务)场景,通过极限工程化手段压榨硬件性能,集成前沿算力调度与KV Cache极致复用算法,以确定性的服务质量与极致的性价比,为智算时代提供确定性、高弹性的供应保障。
这不是简单堆算力,而是把底层资源高效转化为标准化的“数字燃料”——Token,像电网一样给出明确的服务质量承诺:服务可用性≥99.9%,对标电网供电可靠性≥99.9%;首字延迟P90<10秒、波动<20% ,对标电网电压合格率波动≤±5%;缓存命中率≥90%,对标电网功率因数,减少计算浪费。

词元工厂能实现7×24小时不间断运行,而且核心响应指标表现优异。一半的任务能在6秒内响应,九成的任务响应时间低于10秒,波动性控制在20%以内,全面适配各类复杂AI场景。
02
开源性能基准,打破“指标迷雾”
当前行业普遍缺少面向智能体场景的算力服务质量评测标准,导致“高分低能、参数虚标、用户选择困难”。为了精准捕捉并复现智能体服务环境中的极端压力,软通动力在仪式上正式发布并开源词元工厂性能基准,针对智能体长时运行特征建立统一性能度量标准,推动国内AI算力行业规范化、标准化发展。其不是单一工具,而是一个三层递进的完整评测体系,遵循“一个基准(刻画方法)”,采用“三类测试方法”,构建“分领域标准数据集”,实现对算力集群真实服务能力的精准评估与公平对比。
软通动力基于对大模型发展初期行业通用的MLPerf LoadGen进行深度重构,实现了从静态并发注入到动态行为仿真的跨越,推出了LoadGen 2.0,其核心突破在于成功在测试环境中定义并重现了真实的“混沌局面”。以此为根基,软通动力构建了三层递进的完整评测体系,底层混沌负载刻画方法、中层三类标准测试方法(额定功率/业务/精度正确性)、上层面向不同领域的标准数据集,确保评测结果可复现、可对比、与真实场景对齐。目前,LoadGen 2.0已完全开源(https://github.com/issair/loadgen2)。
下一步,词元工厂还将联动张家口、乌兰察布等绿电基地,构建京津冀一体化算力集群,让算力生产随着规模持续扩大,大幅降低各行各业使用AI算力的门槛,实现日产10万亿Token的远期目标。
业内评价,北京壹号词元工厂的落地不仅补齐了国内高端规模化算力供给短板,树立起算力服务与评测的行业标杆,还将进一步吸引AI上下游企业集聚,持续完善区域人工智能产业链。
来源:北京经信综合自“北京新闻广播”微信公众号、“软通动力”微信公众号







评论排行