研究展望:有关高性能计算的思考

发布时间:2015-02-17 11:36:00.0 放大 缩小

随着信息化社会的飞速发展,无论是科学研究,还是其他各项产业、事业的多元化发展,均对计算技术提出了更大的挑战,对高性能计算的需求也迅猛增长。2010年4月,IBM发布题为“Some Challenges on Road from Petascale to Exascale (从千万亿次到百亿亿次计算的挑战)” 的报告,报告指出,实现百亿亿次计算系统有五大瓶颈,即能耗瓶颈、内存瓶颈、通信瓶颈、可靠性瓶颈、编程瓶颈。

面对上述五个瓶颈的挑战,国防科技大学校长杨学军院士在为中国英文版科技综述类期刊《国家科学评论》撰写的观点文章“Thoughts on High-Performance Computing”(Natl. Sci. Rev., 2014, 1(3), 332-333, DOI: 10.1093/nsr/nwu002)中,精要阐述了其研究团队对瓶颈测量模型的探索,以及在系统结构和使能技术两方面研究中为突破瓶颈所做的一系列工作。

瓶颈测量模型的探索过程中,为了综合考虑可靠性与高性能,杨学军院士研究团队在容错系统开销的基础上来测量可靠性,提出了一个有容错功能的可靠加速模型来测量容错系统开销对系统加速性能的影响。

同时,该团队在系统结构和使能技术两方面研究中取得了一些突破。在系统结构方面,该团队设计的系统有如下特点:

1、这是一个为了适应软硬件相结合,综合平衡了通信效率与内存访问,并且集成了可执行环境的计算机系统;

2、芯片架构集成了通用核心与专用核心;

3、为应用软件提供一个框架;

4、最新的制冷技术,例如ICEOTOPE公司的制冷设备;

5、一个基于神经网络的SoC;

6、一种新的编程语言及其编译器;

7、一个大规模并行算法,可以支持成百上千甚至百万级别的节点;

8、一个面向域的高性能计算环境;

9、一个支持在指令、线程、多核、和多节点级别进行并行算法设计与执行的平台;

10、对内存访问在系统结构、操作系统、编译器级别的优化;

11、对能耗在芯片、系统结构、操作系统、编译器级别的优化;

12、在软件、硬件层级集成容错技术;

13、面向服务的云计算平台;等等。

 

在使能技术方面,随着纳米材料、量子计算、和生物信息学的快速发展,该团队把主要研究精力集中在:

1、量子游走Boson采样;

2、可编程的纳米级电路;

3、忆阻器;

4、全息光存储;

5、片上光学互联;

6、全系统光互联;等等。

 

杨学军院士认为,信息科学与信息技术互为补充。20世纪末,信息技术发展非常迅速。然而,过去40年里,信息技术的基础研究领域,亦即信息科学领域,并没有突破性进展。因此,我们需要加强基础理论研究,从工程领域提炼科学问题,先从理论上获得突破,再将理论突破付诸工程实践。我们还要强调跨学科研究的重要性,促进计算机科学与物理学、数学、材料科学、化学、微电子学等学科的交叉与融合,以增强学科的可持续发展能力。

 

(来源:科学网http://paper.sciencenet.cn/htmlpaper/201512615235567135556.shtm