紫东太初团队获得ICAIS 2025国际AI科学家挑战赛文献问答赛道第一名,刷新科学智能新高度
在全球 AI 领域焦点盛会 ——ICAIS 2025 国际 AI 科学家大会上,紫东太初依托多模态大模型的核心技术优势与成熟产品力,凭借领先架构 LEG-QA(Layout- and Evidence-Grounded Question Answering),在文献问答赛道强势突围,击败全球 101 支参赛队伍、223 位选手斩获冠军。这一成绩既是紫东太初多模态大模型技术实力的国际权威认证,更是其多模态深度推理能力在真实科研场景、商业落地前沿的硬核实战印证,彰显了多模态大模型的实际应用价值与领先竞争力。


文献问答赛道,代表的是最接近真实科研工作的场景化挑战,本次文献问答赛道直指科研核心痛点,设置三大严苛考验:面对多栏排版、公式图表密集的学术文献能否“读懂”,海量文献中能否“秒级定位” 关联信息,以及能否生成逻辑严谨的学术级回答。紫东太初 4.0 的 LEG-QA 架构凭借“细粒度多模态语义理解”核心技术,在近百轮高强度评审与真实科研问题测试中,连续保持高分稳定输出,成为本次赛事唯一同时兼具“读、找、思、答”一体化完整能力的系统,最终问鼎冠军——切实证明其深度推理能力不仅停留在模型性能指标上,而是真正具备科研思考能力与实际落地价值。


紫东太初 LEG-QA 一体化架构,聚焦科学论文解析与问答核心痛点,构建“文档解析 — 多源检索 — 证据推理 — 答案生成” 全流程技术体系,构建AI for Science领域的关键核心竞争力。LEG-QA方法架构图文档解析阶段,通过布局检测与字符识别组合模型,细粒度识别论文语义块与版式结构,关联内容与位置信息进行构建结构化表示,筑牢推理基础。文本建模环节,将上述信息映射为结构化单元,并保留元信息实现版面级证据管理,智能分块适配后续编码与推理需求。
多源检索阶段,采用 “致密嵌入模型 + 关键词检索模型” 双路框架,结合递归排序融合策略与领域领先的规则增强模块,将来自语义空间与关键词空间的排名进行统一加权,构建稳健候选证据集,并自适应强化相关证据源,动态调整证据权重,更加贴近科研人员真实的阅读与思考路径。
证据推理阶段,在获得候选证据集合之后,LEG-QA通过一个证据级推理与生成模块将结构化证据转化为可读答案。该模块基于通用大语言模型进行了面向科学论文场景的系统化对齐,专门针对“严格引用原文”、“解释图表含义”、“串联多处证据”等任务进行优化,全面降低大模型幻觉问题。
答案生成阶段,综合段落核心信息、图表说明及论文篇章结构,通过多证据对齐与逻辑约束保障事实一致性,同时显式返回页码与证据位置,实现答案可追溯,满足学术严谨性与人工复核需求。

作为全球首个 “深度推理 + 多模态” 大模型,紫东太初 4.0 坚持全栈国产化路线,完成350+算子的国产化适配与优化,代表了高阶语义理解与推理能力的重要突破。紫东太初4.0完成了从“文本思考”到“带图简单操作思考”,再到“细粒度多模态语义思考”的三阶段演进,融合多步动态思考机制,能够主动选择、加工并深度融合多模态信息,通过自我推理链构建,或联动外部工具,生成可解释、智能化的决策结果,实现从感知到认知再到推理的闭环能力,构建起不可复制的产品壁垒。两大应用支撑:首创一体化多模态检索技术的多模态知识库:支持视频、音频、富文档、纯文本、表格、公式等多种信息形态,通过多模态大模型的语义理解、关联建模与智能检索技术,构建 “可理解、可关联、可追溯” 的一体化知识存储与应用体系;动态聚焦、深度理解的视频问答新范式:深度支持180分钟长视频深度理解秒级精准作答,长视频推理问答、多模态检索取得6项数据集新SOTA。
六大核心能力:多模态理解、文本数学、逻辑思维、视觉问答、GUI智能体、工具调用等维度全面刷新 16 项国际 SOTA 纪录,带图思考能力超越 GPT-5。
全栈生态支撑:国内首个多模态原生协同云 “紫东太初云”构建 “算力底座 - 训推平台 - 开发工具 - 行业应用” 全栈协同生态,构建了算力服务、大模型训推与大模型服务三大平台,提供从底层算力到上层应用的全链路技术支撑,实现算力、算法、工具、场景的深度融合,在科学智能、具身智能、低空经济等场景多元的业务领域,为产业规模化落地提供稳定、高效、可扩展的生态支撑。立足全球 AI 产业竞争与国家数智化转型战略全局,紫东太初以多模态深度推理核心技术为基石,以全栈国产化生态为支撑,将 “商业化落地” 作为技术创新的终极目标与价值锚点。未来,公司将持续聚焦科学智能、具身智能、工业制造、智慧交通等核心赛道,深化“模型 + 云 + 行业场景” 一体化落地商业解决方案,以更精准的需求响应、更高效的落地能力、更开放的生态协同,赋能千行百业数智化转型,在全球 AI 商业化浪潮中树立中国标杆,为科技自立自强与产业高质量发展注入持续动能。






评论排行