【“ZiDongHua”之会展赛培坛:第七期开放计算技术沙龙】12月16日,由高效能服务器和存储技术国家重点实验室和开放计算中国社区联合主办的 “异构计算研究与实践”第七期开放计算技术沙龙在线上成功举行,由CSDN直播,浪潮信息、央链等平台转播,超1.7万人次观看。本期沙龙由高效能服务器和存储技术国家重点实验室首席研究员叶毓睿主持,汇集来自南开大学、鸿钧微电子、遇贤、数渡科技、矩向科技、澎峰科技等产学研用领域相关专家教授,围绕智能异构计算系统、芯片、超异构计算架构、互连技术(PCIe)、异构计算软件栈等话题,共同探讨异构计算的发展现状与趋势。

 

 

第七期开放计算技术沙龙成功举行 产学研用共话异构计算研究与实践

 

 

 

在当前数字经济时代,随着5G、AI、云计算等新兴领域对计算量的需求增长,传统的体系架构面临性能和功耗瓶颈,已无法处理更复杂、更多样的数据,难以满足日益高涨的算力需求,异构计算应需而生。作为算力突破的新抓手,异构计算能够提高算力和性能,降低功耗和成本,并具备多类型任务处理能力,在智算中心、云数据中心、边缘计算等场景有着广泛应用。

12月16日,由高效能服务器和存储技术国家重点实验室和开放计算中国社区联合主办的 “异构计算研究与实践”第七期开放计算技术沙龙在线上成功举行,由CSDN直播,浪潮信息、央链等平台转播,超1.7万人次观看。本期沙龙由高效能服务器和存储技术国家重点实验室首席研究员叶毓睿主持,汇集来自南开大学、鸿钧微电子、遇贤、数渡科技、矩向科技、澎峰科技等产学研用领域相关专家教授,围绕智能异构计算系统、芯片、超异构计算架构、互连技术(PCIe)、异构计算软件栈等话题,共同探讨异构计算的发展现状与趋势。

首先,主持人叶毓睿研究员在开场分享了高效能服务器和存储技术国家重点实验室最近的一些思考和观点。他表示,我们面临着算力多元化,需求猛增的情形,随着摩尔定律的放缓,以及功耗墙、登纳德缩放定律和阿姆达尔定律遭遇瓶颈,多元算力、异构计算、边缘计算、散热技术和一切皆计算机的硬件重构方向等趋势和相关技术的研究和实践,成为近些年来的热点。

在主题演讲环节,南开大学教授、博士生导师李涛分享了“智能异构计算系统研究及应用”。他指出,异构计算已经成为云计算和边缘计算等各种场景中的主流计算模式,GPU的出现已经使得这一模式得到快速发展和成功应用。以深度学习为代表的人工智能技术及其应用发展如火如荼,对以GPU为代表的异构加速技术以及算力设备产生了更大的需求,并形成良性循环。随着特定领域架构和RISC-V开源硬件等技术生态日渐完善,异构计算模式将会更好地实现“专业的硬件干专业的计算任务”,为新时代的智能社会和数字经济建设提供更好的算力支撑。

鸿钧微电子产品工程部副总裁潘国振就“数据中心异构计算探索”进行主题分享。他表示,异构计算技术来自于真真切切的业务场景需求、为了解决某个算力问题而存在,而业务需求是复杂的,计算热点经常是不明确的,软硬件之间的分割线更是模糊的,数据流的方向往往会出乎硬件人所料。所以需要深入一线业务调研软件栈细节,从全业务链路来找热点、定方案、做产品。如果只是具备某种硬件技术,硬往业务环境里面去套,可能会水土不服。 当然最好的办法是从两头往中间走,一边调研业务软件栈,一边深度打磨异构产品,最终找到最佳的结合点。

随着异构计算在云计算、智能计算、边缘计算等领域的应用不断深入,复杂多变的应用场景和多样化的算力形态也对异构计算系统提出了更高的要求。数渡科技合作部总监许胜分享了“异构计算中的互联技术应用与探讨”。他表示,为了获取高性能和高效率的计算能力,利用CPU、GPU、NPU、FPGA等类型计算单元构建出具有多元化计算能力的算力平台,这些计算单元之间通过异构融合和协同工作,来共同满足复杂场景下对计算的差异化需求。而统一的高速异构互联和高效的异构资源管理系统,将有助于提升不同算力单元之间的协同优化,降低多样性算力综合应用的开发难度,充分发挥异构计算系统架构在灵活性、高效性等方面的特点优势。

对于异构计算而言,“碎片化”是非常大的挑战。遇贤副总裁、首席架构师陈争胜发表了“打破边界,从芯片异构到系统异构”主题演讲,他指出,面对异构会带来的“碎片化”挑战,需要更多精心设计的抽象层级,使得有效算力能够最大化。从CPU的视角来看,存在多个层面的异构,首先是Die内的异构,比如大小核的异构;再就是Chiplet或者说封装内的异构,比如CPU+GPGPU MCM封装;还有系统层面的异构,如通过CXL总线构建一个多xPU、多级存储的“对等”计算系统。此外,如何打破多个层级的边界进行联合优化,如何降低硬件异构对软件架构的影响,也是一个值得关注的问题。以芯片原厂及系统厂商共同主导的异构生态,带来了一次产业链价值重构的机会。

关于未来计算架构的演进,矩向科技CEO黄朝波进行了“新一代计算架构:超异构计算”的主题分享。随着人工智能和元宇宙等创新应用的爆发,底层的计算能力需要千倍万倍的提升。计算架构从最开始的单核串行,走到多核并行;又进一步从同构并行走到异构并行;未来,会进一步走向超异构并行。黄朝波指出,串行编程符合人类的思维,并行编程难度较大,异构并行编程难度更大,超异构并行编程更是地狱级难度。如何驾驭超异构,是成败的关键,也是需要重点投入的方向。未来,大算力芯片需要实现算力的多个数量级提升,是现有三大芯片CPU、GPU、DPU功能的部分或全部融合,成为通用的超异构处理器。超异构处理器为算力网络提供超高算力密度的基础单元,是面向云计算、边缘计算以及自动驾驶终端等复杂计算场景的通用、综合、融合的单芯片解决方案。

在软件栈方面,澎峰科技CEO张先轶分享了“异构计算软件栈的国产自主与国际化愿景”。他指出,异构计算软件栈作为底层硬件和上层应用的桥梁,可以扩展芯片的应用范围,提升计算性能。国际主流芯片公司都投入大量资源建设异构计算软件栈,例如Intel oneAPI,NVIDIA CUDA-X等。国内异构计算芯片公司,要么在构建自主的语言、工具链,要么采取兼容CUDA语言的方式。从用户角度说,要么学习成本高,要么性能不佳。针对用户期望的性能高、兼容多、使用便利等需求,澎峰科技采用开源共建的模式,推出高性能计算库PerfMPL库解决性能问题,跨平台API编程PerfXAPI兼容更多硬件,PerfXPy科学计算平台平衡便利和性能。

在最后的圆桌讨论环节,遇贤副总裁、首席架构师陈争胜,数渡科技合作部总监许胜,矩向科技CEO黄朝波等嘉宾,共同就异构计算软硬件协同设计、如何实现不同加速器之间数据高效交互、超异构计算架构发展展望、如何发挥算力多元化的优势等议题进行了热烈探讨与交流,并和听众进行了深入的互动问答。