第一款完全使用国产CPU的超算是“神威·蓝光”,这台超算的各项性能指标没有多少亮点,不过2016年第二台完全使用国产CPU的超算“神威·太湖之光”就已经在世界超算TOP500上独占鳌头了。
神威·太湖之光超级计算机峰值性能为12.5亿亿次每秒,持续性能为9.3亿亿次每秒,是天河二号的2.5倍左右。神威·太湖之光安装了40960个申威SW26010众核处理器,每颗CPU包含4个通用核和256个计算核,这是一种片上融合异构众核架构,与Intel Xeon Phi的设计思路相似。
申威SW26010主频为1.45GHz,双精度浮点峰值性能为3.06 TFLOPS,比相同频率的二代72核Xeon Phi略高一线,峰值能效比达10.559 GFLOPS/W,也和二代72核Xeon Phi相当。不过Xeon Phi二代是使用的Intel 14nm工艺,申威SW26010因为某些原因只能在国内生产,基于28nm工艺,在工艺存在代差的前提下,性能和能效比基本和Xeon Phi一致,很考验设计功力。
申威26010的指令集是申威自主设计的SW64,微结构也是自主设计,展现了国内CPU设计水平的飞速进步。神威·太湖之光中的其它硬件也都完全是国内生产,整台超算的国产化率达到了100%,这也说明我国半导体行业整体达到了相对较高的水平。
在2021年4月,与申威CPU相关的两家设计企业被美国列入“实体清单”,但因申威的自主程度明显高于飞腾,所以受到的干扰较小。
在2023年11月的“高性能计算、网络、存储和分析国际会议(The International Conference for High Performance Computing, Networking, Storage, and Analysis)”上,申威毫不避讳地展示了“申威SW26010”的升级版本“申威SW26010-Pro”,这算是对美国制裁的嘲讽吧。只有如申威、龙芯这样的完全自主的CPU才有这样的底气,其它的国产CPU企业从2020年至2024年都没有在公开场合发布过通用CPU产品。
申威SW26010-Pro的升级幅度极大,主频从1.45GHz提高到了2.1GHz,计算核心的数量从256个增加到了384个,内存控制器从DDR3升级到了DDR4。再加上微架构和系统结构的改进,FP64和FP32的吞吐量都提高到了4.75倍以上。下表是申威SW26010-Pro与同类CPU的性能对比,性能指标中只包括计算核心,没有包括通用核心:
从上表可以看到,申威的SW26010和SW26010-Pro制程落后但性能并不落后。申威的超算CPU都是以境内的工艺生产,SW26010-Pro的制程和功耗未公开,推测是使用14nm工艺,单芯片功耗在200W左右。在公开展示申威SW26010-Pro之前,基于这款CPU的“神威·海洋之光”超级计算机已经建造完成,这台超算仍然由江苏无锡的中国国家并行计算机工程技术研究中心研制,其性能是“神威·太湖之光”的11倍,是日本“富岳”的3倍,略低于美国的“前沿(Frontier)”超级计算机,2023年底排名世界第二。
神威·海洋之光使用了107136颗申威SW26010-Pro,总的核心数量超过了4100万个。峰值双精度浮点性能约为1.5百亿亿次每秒,即1.5EFLOPS,即持续性能超过峰值性能的85%,并行效率极高。
神威·海洋之光的高调亮相,说明只有完全自主的技术才能完全避免美国钳制,不需要遮遮掩掩。神威·太湖之光和神威·海洋之光都是我国完全依靠自主技术、自主元件,建造的世界一流水准的超算,美国限制我国超算发展的手段已经完全失效。
神威·太湖之光超级计算机峰值性能为12.5亿亿次每秒,持续性能为9.3亿亿次每秒,是天河二号的2.5倍左右。神威·太湖之光安装了40960个申威SW26010众核处理器,每颗CPU包含4个通用核和256个计算核,这是一种片上融合异构众核架构,与Intel Xeon Phi的设计思路相似。
申威SW26010主频为1.45GHz,双精度浮点峰值性能为3.06 TFLOPS,比相同频率的二代72核Xeon Phi略高一线,峰值能效比达10.559 GFLOPS/W,也和二代72核Xeon Phi相当。不过Xeon Phi二代是使用的Intel 14nm工艺,申威SW26010因为某些原因只能在国内生产,基于28nm工艺,在工艺存在代差的前提下,性能和能效比基本和Xeon Phi一致,很考验设计功力。
申威26010的指令集是申威自主设计的SW64,微结构也是自主设计,展现了国内CPU设计水平的飞速进步。神威·太湖之光中的其它硬件也都完全是国内生产,整台超算的国产化率达到了100%,这也说明我国半导体行业整体达到了相对较高的水平。
在2021年4月,与申威CPU相关的两家设计企业被美国列入“实体清单”,但因申威的自主程度明显高于飞腾,所以受到的干扰较小。
在2023年11月的“高性能计算、网络、存储和分析国际会议(The International Conference for High Performance Computing, Networking, Storage, and Analysis)”上,申威毫不避讳地展示了“申威SW26010”的升级版本“申威SW26010-Pro”,这算是对美国制裁的嘲讽吧。只有如申威、龙芯这样的完全自主的CPU才有这样的底气,其它的国产CPU企业从2020年至2024年都没有在公开场合发布过通用CPU产品。
申威SW26010-Pro的升级幅度极大,主频从1.45GHz提高到了2.1GHz,计算核心的数量从256个增加到了384个,内存控制器从DDR3升级到了DDR4。再加上微架构和系统结构的改进,FP64和FP32的吞吐量都提高到了4.75倍以上。下表是申威SW26010-Pro与同类CPU的性能对比,性能指标中只包括计算核心,没有包括通用核心:
从上表可以看到,申威的SW26010和SW26010-Pro制程落后但性能并不落后。申威的超算CPU都是以境内的工艺生产,SW26010-Pro的制程和功耗未公开,推测是使用14nm工艺,单芯片功耗在200W左右。在公开展示申威SW26010-Pro之前,基于这款CPU的“神威·海洋之光”超级计算机已经建造完成,这台超算仍然由江苏无锡的中国国家并行计算机工程技术研究中心研制,其性能是“神威·太湖之光”的11倍,是日本“富岳”的3倍,略低于美国的“前沿(Frontier)”超级计算机,2023年底排名世界第二。
神威·海洋之光使用了107136颗申威SW26010-Pro,总的核心数量超过了4100万个。峰值双精度浮点性能约为1.5百亿亿次每秒,即1.5EFLOPS,即持续性能超过峰值性能的85%,并行效率极高。
神威·海洋之光的高调亮相,说明只有完全自主的技术才能完全避免美国钳制,不需要遮遮掩掩。神威·太湖之光和神威·海洋之光都是我国完全依靠自主技术、自主元件,建造的世界一流水准的超算,美国限制我国超算发展的手段已经完全失效。