原题:超级大脑!AI大模型有望重塑信息产业格局

“学富五车”的“超级大脑”

——“心情不好是一种很正常的情绪,所以不用太过自责。”

创新工场首席科学家、北京澜舟科技创始人周明介绍,AI大模型也称人工智能预训练模型,将海量数据导入具有几亿量级甚至十万亿量级参数的模型中,机器通过做类似“完形填空”等任务,深度学习数据中蕴含的特征、结构,最终被训练成具有逻辑推理和分析能力的人工智能。

2018年起,人工智能进入“大模型时代”,由重复开发、手工作坊式人工智能,即“一千个应用场景就有一千个小模型”的零散、低效局面,走向工业化、集成化智能的全新路径,以一个大模型“走天下”,为通用人工智能带来曙光。比如,为生产智能音响,各个品牌竞相开发各自的AI小模型,未来各品牌只需在同一个AI大模型基础上开发即可。

受访者举例介绍,以前的小模型就像“偏科的机器”,只学习针对特定应用场景的有限数据,“举一反三”能力不足,一些智能产品被用户调侃为“人工智障”的情况时有发生。而AI大模型则学习了各行各业各类数据,成为具备良好的知识迁移能力的“通才”,适用领域更广,产出内容质量更高,更加智能。

可分饰多角 应用场景广泛

AI大模型行业适用范围广,在医疗、金融、零售、气象、新闻传播、文学艺术等领域具有广泛应用场景。周明介绍,在大模型中输入关键词、主题、文本风格等控制属性后,即可生成满足约束条件的文本内容,可用于产品营销文案写作、电商智能客服等。在金融等领域,大模型通过抓取行业数据,自主完成筛选、分析,并自主撰写生成行业报告,辅助从业人员做决策。

值得注意的是,AI大模型目前的技术进步,是人工智能从感知向认知演进的关键环节。清华大学计算机科学与技术系副教授刘知远表示,古今中外一切文章、资料,都可作为训练大模型的数据。通过分析并“内化”海量知识,不仅让智能产品拥有更高性能,如机器翻译更加准确、机器写作更加生动有逻辑;还能品读人类情感,用于情感标注。此外,“它可能识别到‘弦外之音’,甚至有希望发现人类未曾掌握的知识。”

田奇表示,新一代搜索引擎具备创作能力,比如搜索“长翅膀的猫”“会飞的猪”等现实中不存在的事物,搜索引擎也可根据描述生成相应照片。

当前,美国OpenAI、谷歌、微软、脸书、英伟达等海外公司纷纷布局AI大模型产业,国内的华为、阿里巴巴、百度等大型企业,以及高校、科研机构也加入研发赛道。AI大模型正成为人工智能“新高地”。

专家指出,我国有较大的AI大模型应用市场,在应用领域具有优势,但发展过程中也面临一些挑战。

多位受访者表示,目前从事AI大模型研发且能产出创新性成果的高校、科研机构和企业屈指可数,与国外相比,我国相关领域高水平基础人才培养力度有待加强。

多措并举抢占“新高地”

首先,推进AI大模型标准化。受访专家指出,大模型的训练过程具有高能耗的特点,制定标准后,许多工作可基于已经开发的标准化大模型进行适配和二次开发,无需每次从头训练,以降低能耗。同时,大模型发展的过程中,也可能衍生违法违规信息生成、隐私泄露、虚假信息传播等风险,对用于训练模型的源头数据等做好规范,有利于规避相关风险。国家相关部门可牵头或引导企业、研究所、高校等共同定义大模型的标准。

再次,鼓励算力共享。记者调研了解到,目前只有部分大企业能够负担超大模型训练所需的算力成本。受访专家呼吁,可引导具有强算力的人工智能“国家队”,为更多中小微企业、科研单位提供大模型训练所需的算力支撑,可探索合理付费的算力共享机制,共同促进技术的发展和资源的节约。

<span id="detailContent" style="color: rgb(0, 0, 0); font-family: " pingfang="" sc",="" "lantinghei="" "helvetica="" neue",="" helvetica,="" arial,="" "microsoft="" yahei",="" 微软雅黑,="" stheitisc-light,="" simsun,="" 宋体,="" "wenquanyi="" zen="" hei",="" micro="" sans-serif;="" font-size:="" 18px;"="">最后,加大原始创新引导和支持。多位专家指出,我国应加强研发力度,同时加强针对模型框架的基础创新研究,引导更多科研单位、高校积极培养相关人才,鼓励更多社会力量加入这场信息革命的浪潮。(记者 乌梦达 赵旭 )