【ZiDongHua 之自动化学院派收录关键词:人工智能 通用大模型  】
  
  论坛回顾 | 聚焦通用大模型“主战场”,强化顶层设计——中国人工智能产业年会大模型与通用人工智能论坛圆满落幕
  
  4月14日上午,以“创新驱动•数智强国”为主题的第十三届吴文俊人工智能科学技术奖颁奖典礼暨2023中国人工智能产业年会——大模型与通用人工智能专题论坛在苏州工业园区希尔顿酒店圆满落幕。来自国内知名高校的专家学者汇聚一堂,观点碰撞,探究具身智能、多模态多任务学习、语义空间对齐等重要的AI技术的理论发展和智能人机交互、OCR、内容生成等AI技术落地应用等关键议题,共同探讨、分享人工智能的关键技术、创新难点及发展趋势。
 
  
  众抒己见
  
  拥抱人工智能大时代
  
  中国图象图形学学会青工委副主任、北京航空航天大学徐迈教授与中国电信人工智能研究院青年科学家赵健研究员共同担任论坛主席,上海交通大学电子信息与电气工程学院特聘教授熊红凯,华南理工大学二级教授金连文,中国科学院大学特聘教授叶齐祥,CAAI教育工委会主任、浙江大学人工智能研究所所长吴飞,阿里巴巴通义实验室人物AIGC负责人孙佰贵,北京航空航天大学电子信息工程学院教授李胜曦,深信服科技股份有限公司安全GPT业务主管訾然,西北工业大学副教授、上海人工智能实验室青年科学家赵斌等学术界与产业界的专家出席并在论坛上发表专题报告。中国电信人工智能研究院青年科学家赵健研究员担任论坛主持人。
 
  
  赵健研究员
  
  中国图象图形学学会青工委副主任、北京航空航天大学徐迈教授为本次论坛致欢迎词。致辞中提到:“随着人工智能技术的飞速发展,大模型已经成为推动社会进步,促进产业升级的重要力量,它们以强大的数字处理能力和深度学习能力,正在改变着我们的生活方式、工作模式乃至思想习惯。”
  
  他表示:“本次论坛汇聚了众多大模型领域的佼佼者,我们共同探讨大模型的最新研究成果、应用案例和未来趋势,我相信通过我们的交流合作,我们能够更好的理解大模型的潜力和挑战,更有效的推动大模型技术的发展和应用。”当下而言,大模型的发展并非一帆风顺,对计算资源的巨大需求,对数据质量的严格要求,以及可能带来的伦理和隐私问题,亟待领域学者、开发者、使用者共同努力,探索和创新,以确保大模型技术的健康发展和广泛应用。每一个人都要以更积极的态度,拥抱全新的趋势,面对新时代背景下技术逻辑、需求逻辑和场景方面的挑战。
 
  
  徐迈教授
  
  共赴AI大模型热潮
  
  聚焦时代机遇与挑战
  
  上海交通大学电子信息与电气工程学院特聘教授熊红凯作题为《面向通用视觉大模型的稀疏优化和泛化设计》的主题报告,他针对构建大模型的基本架构Transformer设计,与参会嘉宾共同讨论不同场景和几何结构数据的高效可泛化方法。他讨论了模态混合适配信息遗忘的问题,根据可逆归一化流进行信息无损的适应性调整,构建多任务的动态模型拓扑。拓展Transformer结构,形成可学习的各向异性滤波,实现多尺度几何频率分析。对于一般化的流形上信号,进行动态路由可学习构图,设计规范等变网络,提升在不同局部坐标系、不同三维网格结构及分辨率下的泛化性能。
  
  熊红凯教授
  
  华南理工大学二级教授金连文作题为《视觉基础模型与OCR垂直大模型的一些思考》的主题报告。随着大语言模型(LLMs)的兴起,面向自然语言处理领域的通用人工智能(AGI)取得了重大突破,近年来视觉基础模型、多模态大模型也引起了广泛的研究关注并取得了快速发展,但针对光学文字识别(OCR)垂直领域的大模型研究工作报道还不多。他在分享中简要回顾了近年来多模态大模型、视觉基础模型和OCR垂直领域基础模型等相关代表性技术进展,并向大众介绍了他所在团队的最新研究,也就是面向OCR的文档图像像素级底层处理基础大模型构建方法和技术路线。随后与参会嘉宾共同对大模型时代OCR等垂直领域的发展趋势与未来研究方向进行讨论和展望,为大家带来了非常新颖的见解。
  
  金连文教授
  
  国科学院大学特聘教授叶齐祥作题为《视觉表征模型的结构设计与物理启发》的主题报告,他首先分析了局部卷积运算与全局注意力运算的互补性及辩证关系,将局部特征与全局特征耦合形成Conformer网络结构,显著增强视觉表征能力,提升表征模型的性能下限。接着探讨了局部卷积运算造成的Mask Image Modeling (MIM)自监督学习信息泄露问题,提出了Token Merging操作,突破卷积或局部运算的局部约束,形成高效分层Transformer 表征(HiViT)与全预训练的Transformer 金字塔网络(iTPN)。这一系列研究,从模型结构设计角度将视觉目标检测、分割等任务性能提升到了一个新高度。
  
  叶齐祥教授
  
  探索大模型创新发展
  
  打通技术与典型场景应用壁垒
  
  深信服科技股份有限公司的安全GPT业务主管訾然作题为《大语言模型在网络安全领域的落地实践和研究》的主题报告。他在报告中首先介绍了国内外网络安全领域落地大语言模型的最新进展和落地实践,包括攻击检测、威胁研判、数据安全等。并探讨在RAG、超长上下文、AI agent等大语言模型新技术快速发展的当下,安全领域的大语言模型会如何发展。从更贴近实际产品的角度向大家介绍了安全领域大模型落地到底会给客户展现哪些更为直观的场景。
  
  訾然博士
  
  阿里巴巴通义实验室人物AIGC负责人孙佰贵结合自身丰富的研究经验分享了题为《AIGC FaceChain的应用与创新》的主题报告。他认为在AIGC技术浪潮推动下,图像内容生成已经在C端和B端展现出了广阔的应用潜力。结合实际应用,他向大家分享了facechain在人物写真、虚拟试衣、人物视频等热门应用场景的攻关成果。相关技术场景已在飞猪数字旅拍、通义万相写真馆等多个应用中成功落地,其开放API具有开箱即用、自定义模板、灵活配置风格以及免训练技术路径等优势。目前facechain团队积极推进开源社区建设,在GitHub上收获超过8.1K Star,已荣获6项国内外开源项目和个人奖项。他希望通过此次分享, facechain能被更多人了解,也更关注这方面的发展与未来应用。
  
  孙佰贵研究员
  
  北京航空航天大学电子信息工程学院教授李胜曦作题为《面向视觉语义重构的表征与压缩方法》的主题报告,他表示:大数据、大模型时代下,智能算法的不断进步常伴随其表征能力的稳步提升,而概率生成模型以无监督方式对信号进行概率表征,以其概率释义等优势在人工智能中扮演着极为关键的角色。报告围绕面向视觉语义重构的生成对抗网络表征与可逆化方法,分析生成对抗网络的表征性能,以特征函数为统计度量,进而介绍面向语义重构的生成对抗网络,其理论完备性可确保语义表征的完备性。
  
  李胜曦教授
  
  CAAI教育工委会主任、浙江大学人工智能研究所所长吴飞作题为《从文本合成到视频合成的技术链路与瓶颈挑战》的主题报告。他在报告中介绍了谷歌公司2016年提出能够捕获文本单词之间局部/全局关联的自注意力神经网络transformer、谷歌公司2021年将transformer从文本领域拓展到图像领域的Vision transformer、Stability AI 公司2022年提出的以文生图Stable Diffusion、加州大学伯克利分校和纽约大学2023年提出图像合成技术Diffusion Transformers (DiTs)等核心算法发展脉络,以及在这些核心算法的发展中,揭示了对合成内容中的最小单元进行有意义的关联组合的机理与天花板。
  
  在垂直领域的大模型或者通用大模型方面,他也提出了未来展望的研究热点。包括语言大模型跃升为跨媒体大模型;如何让大语言模型训练和赋能过程,实现数据和知识的双轮驱动;如何让大语言模型和环境进行交互,对智能体的动作行为进行指导或者是评估;如何设计更好的大语言模型工具,完成基础科学研究或者工程技术领域挑战的问题;以及如何通过端云协同链条化技术打通垂直领域大模型和端侧轻量级推理之间的障碍,形成大小模型端云协同的研究等。这些挑战,为大模型领域的发展提出了更具体的科研要求。
  
  吴飞教授
  
  西北工业大学副教授、上海人工智能实验室青年科学家赵斌为大家带来了题为《人工智能软硬件一体化》的主题报告。他提到,生命起源以来,生物智能的进化过程不仅体现在思维方式的演进,还包括体型和四肢等身体结构的转变。人工智能是参考生物智能所形成的系列技术,其理论发展和技术落地需要软硬件的协同。在这一思想的驱使下,有必要关注人工智能软硬件一体化研究,推动人工智能应用落地。
  
  他的分享内容主要凝练了生物智能“思维计算-实体控制-环境感知”的三元交互模式,重点介绍大模型驱动具身智能体的相关研究,包括高层语义理解、自身技能认知与复杂任务执行等技术,为大模型时代的人工智能软硬件发展提供新思路。他表示:“现在大模型的方案能力比较差,和真正环境交互的时候,还有很多长尾问题没有解决,这也引导了接下来做如何的研究。希望未来人工智能能够触及一切,让世界都变得好玩起来,涌现更多新的概念。”
  
  赵斌副教授
  
  围绕问题与挑战
  
  纵论大模型未来发展
  
  圆桌对话环节由部分报告嘉宾及特别邀请的中科院计算所山世光研究员共同参与,就“大模型对于视觉研究的影响”、“大模型会不会主导一切”、“通用人工智能的实现方式?专用人工智能与通用人工智能如何结合”这三个话题进行探讨。
  
  嘉宾们各抒己见,分别就上述话题发表了极具启发性的深刻见解,带领参会观众们更为清晰的认识了大模型的发展与通用人工智能的未来。嘉宾们表示:大模型不能主导一切,而未来人工智能学习肯定会回归到人类的学习上面。大模型将来能不能在自我创造、自我发明方面能够有所突破,这是一个长期且困难的事情。
  
  随着大模型推广,如何形成批量性、规模性的效益,是行业的共性话题。随着应用价值的体现,大模型在金融业的推广力度才会更大。大模型无疑会带来一个全新的时代,需要政、产、学、研、用深度合作、协同创新。
  
  激励创新,智能担当。本次论坛通过研讨大模型与通用人工智能技术与应用趋势,为数智产业发展提供新的思路和建议,同时促进了行业的交流与合作,推动AI创新技术普及和推广。未来,大会将持续分享人工智能领域的新科技、新政策和新趋势,搭建行业沟通桥梁,共同推动中国人工智能行业的高质量发展
  
  为期两天的第十三届吴文俊人工智能科学技术奖颁奖典礼暨2023中国人工智能产业年会已圆满落幕。本届大会大模型与通用人工智能专题论坛由中国人工智能学会主办,苏州工业园区管委会协办,中国人工智能学会吴文俊人工智能科学技术奖评选基地(苏州)、智博天宫(苏州)人工智能产业研究院、北京航空航天大学、西北工业大学、深信服科技承办。
  
  吴文俊人工智能科学技术奖
  
  “吴文俊人工智能科学技术奖”由中国人工智能学会发起主办,是我国智能科学技术领域唯一以人民科学家、人工智能开拓先驱、我国智能科学研究的开拓者和领军人、首届国家最高科学技术奖获得者、中国科学院院士、中国人工智能学会名誉理事长吴文俊先生命名,依托社会力量设立的科学技术奖(国科奖社证字第0218号),具备提名推荐国家科学技术奖资格,被誉为“中国智能科学技术最高奖”、“人工智能领域皇冠上的明珠”。旨在奖励在智能科学研究中取得重要发现,着力实现原始创新与突破,或在人工智能领域攻克关键核心技术,推动科学技术进步取得重大进展,创造巨大经济社会效益或者生态环境效益的单位或个人。迄今,“吴文俊人工智能科学技术奖”已成功召开十三届评审及表彰活动,为大力弘扬科学家精神,激励创新人才涌现,增强科技创新的内生动力,促进人工智能与传统产业转型融合,推动经济社会高质量发展提供了有力支撑,在我国智能科学技术领域享有盛誉。