点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
●高性能计算之于计算机科学,如同哥德巴赫猜想之于数学
●每10年,超级计算机的运行速度就会提升1000倍
●与AI技术深度融合渐成最主要的应用
高性能计算:名副其实的“算力皇冠”
近年来,从金融到汽车、从教育到医疗,人工智能技术,特别是以ChatGPT为代表的生成式人工智能,正在给整个世界带来颠覆性体验。在如今这个“人工智能时代”,人工智能技术的发展离不开服务于AI算法训练和推理的高性能计算技术。
今天,我们就来聊一聊高性能计算。
计算机科学的“皇冠”
初次涉及高性能计算,可能许多人会按照字面意思理解为计算性能较好的算法,从而将其列入众多算法之一。其实这种看法并不全面。
高性能计算之于计算机科学,如同哥德巴赫猜想之于数学,是计算机学科领域内十分耀眼的存在。
在介绍高性能计算之前,我们要先介绍一下高性能计算机。
高性能计算机(HPC)是一种运算速度极快、存储容量极大、通信带宽极高的计算机,又被称作超级计算机,主要用于解决普通计算机解决不了的具有挑战性的问题。
高性能计算机发展经历了单计算机时代和多计算机时代。单计算机时代从20世纪60年代开始,以单一内存向量机和对称多处理器技术为主。20世纪90年代后逐步进入到多计算机时代,其中采用商用网络将计算机连接起来组成的集群逐步成为主流。直到今天,这依然是高性能计算系统构建的主要方式。集群是计算机和网络的结合。假如说,互联网是从外部将分立的计算机连接在一起,那么集群就是将网络内部化,让网络成为系统内部不同计算机的沟通桥梁。往简单里说,其实就是将网络连接的所有计算机看作一个整体,这个新的整体就是高性能计算集群。
或许这样乍一看有些难懂,引用电影《西虹市首富》里的一句台词来解释,就是“集中火力干事业”。就好比一台计算机,我们平日里用其写写文档、剪辑简单的日常生活视频可能还很流畅,但是如果想实现大型三维8K高清动画渲染,就难以胜任,这说明当前计算机的算力已经不支持完成当前的工作了。此时通过网络将多台计算机进行连接,把这些设备的算力进行叠加,就可以完成一台计算机完不成的任务。
高性能计算集群是将多个计算节点组织起来,通过高速网络连接在一起的大规模并行计算系统。如果将普通计算比作人脑,那么高性能计算集群就是许多人脑连接成矩阵的“超级大脑”。在短时间内,“超级大脑”具有强大的计算能力,可以完成更多计算任务。相较于普通计算机,高性能计算集群的运算速度能够达到令人难以想象的程度。
此外,高性能计算还可以通过大规模的分布式计算技术,将单个计算任务分解为多个子任务并行计算。好比如果需要烹制一桌宴席,一个团队择菜、切菜、炒菜分工明确,多环节同时进行,效率要比一个人独立完成整桌宴席快得多。
高性能计算机采用高可靠性设计,具有超低的故障率以及较好的稳定性和持续运行能力。这也奠定了高性能计算在计算机科学领域的“皇冠地位”。
没有最快,只有更快
谈及高性能计算,或许不少读者会以为这是近些年来伴随科技发展的新兴产物。殊不知,高性能计算已经诞生并发展了相当长一段时间。
随着计算机硬件和软件的不断发展,高性能计算在很早以前就成了一个重要的研究领域和技术领域。20世纪六七十年代,美国超级计算中心、法国原子能和替代能源委员会、日本计算机科学研究所等机构纷纷推出了一批超级计算机系统,奠定了高性能计算的发展基础。此后,超级计算机进入了快速发展期。各国投入更多的资金用于高性能计算的研发和应用。超级计算机性能速度不断提升,各种新兴应用也不断涌现。1983年12月,中国第一台每秒钟运算1亿次以上的“银河”巨型计算机成功问世,中国成为继美国、日本之后,第3个能独立设计和制造巨型计算机的国家。2013年6月至2015年11月,中国“天河二号”超级计算机实现世界超级计算机TOP500排行榜历史上的六连冠。
在高性能计算领域,有一个著名的千倍定律——每10年,超级计算机的运行速度就会提升1000倍。
2018年,超级计算机“顶点”以每秒20亿亿次的浮点运算速度峰值,名列全球超级计算机500强榜单榜首。4年后,在2022年6月公布的全球超级计算机500强榜单中,超级计算机“前沿”的浮点运算速度峰值已经超过每秒100亿亿次。这显示了超算技术惊人的发展速度。
每秒100亿亿次意味着什么呢?目前主流笔记本电脑运算速度大概每秒10亿次,要10亿个这样的笔记本同时计算,才能赶得上现在最快的超级计算机。
百亿亿次超算,又称E级超算,已成为国际上高端信息技术创新和竞争的制高点。目前,世界各国在全球超算领域你追我赶,竞争激烈。美、欧、日等国家和地区纷纷制定和推进百亿亿次超算研制计划。中国的3个E级(百亿亿次)计算机原型系统项目,已经全面启动。欧洲即将推出首台百亿亿次超级计算机“木星”,有望取得突破性的成就。
当然,研发E级超算,目的并非单纯比拼运算速度,促进大规模应用、解决国家面临的挑战性问题,才是关键。
算天、算海、算地、算人
仿真计算、交互终端、智能制造、医疗健康、交通出行……2023世界计算大会上,一幅“计算万物”的图景面向公众展开。谁也不能否认,“数智时代”已经来临,高性能计算因其对更高精度、更大基数的运算任务的优秀处理能力,正在被应用于越来越多的领域。
如今,业内人士常用“算天、算海、算地、算人”来形容高性能计算应用的无所不在。
算天——高性能计算广泛应用于天气预报、航天器设计、研究天体物理等。基于超算平台开发的精细数值天气预报系统,能以每12分钟实时刷新未来6小时的气象变化数据,并且准确预测未来15天以上气象变化情况;研制一架大飞机,做全机风动试验过去需耗费数年时间,利用超级计算机模拟仿真,几天就能完成相关工作;2019年人类历史上第一张黑洞照片终于问世,这张照片凝结了当时世界最先进的探测技术,也得益于超级计算机对海量数据的分析和处理。
算海——高性能计算在海洋环境预报、古气候模拟、海洋药物、海洋勘探等领域应用广泛,已经成为人类认识海洋、探索海洋的利器。
算地——高性能计算常用来支撑地质钻探、遥感测量、重大工程建设等。2023年5月,中国测绘科学研究院研究团队自主研发了合成孔径雷达干涉测量超算平台,服务于地面沉降防治、地质灾害隐患识别、地壳运动检测等,也可为油气田开采、采空区塌陷、大型基础设施健康诊断等提供信息支持。
算人——与人的生命健康有关的应用,比如新药研发、基因测序、脑科学等,都离不开高性能计算。近年来,各种新的检查检验设备、可穿戴设备等,使得医生和研究人员更容易获得个人的健康、疾病数据,有助于从更多维度了解疾病发生过程。高性能计算可以帮助研究者和医生从大量数据中摸索出规律,从而更加精准地诊断、治疗疾病或者研发药物。
当前,高性能计算最令人瞩目的应用,是超级计算机与人工智能的结合。有人形象地打了一个比方:如果说,人工智能是一座承载机器智能的摩天大楼,那么算法是设计图纸,数据是建筑材料,算力则是地基。一方面,当前人工智能对算力的需求呈指数式增长,需要更高性能的硬件系统提供算力支持。从ChatGPT3.0到ChatGPT4.0,其突破离不开人工智能大模型对海量数据的学习。另一方面,超级计算机并非简单地堆砌硬件就能达到更高性能,其发展需要复杂而繁多的网络、软件等的互联互通,这便离不开人工智能的支持。因此,超算系统需要从计算密集型向数据密集型转变,将传统超算、AI算法、大数据相结合,实现具备面向海量数据的高性能分析能力的智能超算。
人类对超算应用的需求没有止境。专家表示,超算一直在帮助人类拓展边界。宏观扩展如宇宙天体,微观深入像生命科学,还有对一些极端情况的模拟。超算将继续在这些尖端科学研究领域发挥作用。
未来发展或将超乎想象
花费约200秒,就能完成传统超算需要1万年才能完成的计算任务——2019年,谷歌公司团队宣布成功演示“量子霸权”。这个消息引起轩然大波,一场全球范围内的“量子霸权”争夺战由此愈发激烈。
量子计算是一种遵循量子力学规律调控量子信息单元进行计算的新型计算理论和技术。与经典计算机相比,量子计算机可以不受物理结构的局限,利用量子位及其相互作用在瞬间进行大量计算,理论上能够发挥出远超经典计算技术的计算性能。科学家们预言,当可以精确操纵的量子比特超过一定数目时,量子计算机的能力将会远超任何一台经典计算机。
那么,量子计算会取代原有的经典计算吗?今天,我们似乎有了一个明确的答案:不会,至少在短时间内,量子计算无法取代经典计算。
量子计算与经典计算基本原理不同、结构不同,二者所擅长计算的问题也不同,因此量子计算机与经典计算机并非“取代”与“被取代”的关系。从实际应用角度,量子计算永远不会完全取代传统超算,两者各有所长,将协同工作。
此外,对于量子计算研究来说,实现“量子霸权”只是第一个阶段性目标。目前来看,量子计算机还处于发展早期,技术上还存在许多挑战和难点。“量子霸权”只是证明了在某个特定问题上,量子计算机的计算能力超过现有最强的传统计算机。比起已经深入社会各行各业的高性能计算,量子计算想要实现商用还需要一段时间。
不过,这并不意味着高性能计算就能“高枕无忧”。近年来,经典计算和量子计算的有机融合,正在日渐成为重点研究方向。中、美、日、欧等传统高性能计算强国和地区,正在逐步开展量子计算和经典计算共同执行的混合算法,探索量子计算和经典计算的融合体系结构、计算系统等。
在高性能计算的未来发展中,量子计算技术的地位将愈加凸显。超级计算机将成为量子计算和经典计算的深度融合系统,二者互为重要算力补充,面向不同类型的计算问题各自发挥出更大的作用。未来的高性能计算,将超乎我们的想象。(逯心一 范 宽 高莉华)