曙光5000的五大技术亮点

日期: 2008-06-26 来源:TechTarget中国

  6月24日,峰值运算能力为230万亿次每秒的曙光5000高性能计算机终于正式发布,这标志着我国高性能计算领域的一大突破。在更多人只关注其峰值能力的时候,让我们来盘点一下,与此前每秒10万亿次的曙光4000相比,曙光5000有那些技术亮点?


  一年两度的TOP 500超级计算机榜单发布,已经成为了一项该领域内的狂欢盛事。这项从学术界开始的超级计算机评比,每年的6月底和11月底各发布一次,引起了大众的无比兴趣,每年排名第一的超级计算机总是会被各种大众媒体热炒。今年排名第一的每秒千万亿次超级计算机Roadrunner就吸引了无数的眼球,也因此引发了大众对国产超级计算机发展进程的关注。


  从我们最初记忆中的每秒1亿次计算能力的巨型计算机银河1号,到后来10万亿次的曙光4000,国内对于每次超级计算机的突破都津津乐道。毕竟,就如著名科学家王大珩所说,“高性能计算机的作用,不亚于两弹一星。”


  因此,6月24日峰值运算能力为230万亿次每秒的曙光5000高性能计算机的正式发布,就立刻引起了广泛的关注。很多人都很好奇,与曙光4000相比,曙光5000在技术上到底有哪些突破?


  首次突破百万亿次


  曙光5000依然采用了与前一代产品曙光4000相同的集群架构,整个系统规模达到了1650个节点,采用4路4核刀片式服务器与8路4核机架式服务器作为胖节点的方式构成。整个系统都采用了AMD巴塞罗那四核处理器,其峰值浮点运算处理能够到230万亿次。


  不过,曙光公司副总裁聂华对记者表示,曙光5000交付用户使用时的计算能力将只有200万亿次,其Linkpack的速度预计也将会在160万亿次,这个速度将能够在2008年下半年Top 500发布的时候跻身前十。


  去年年初,曙光公司总裁历军宣称的将可能会在曙光5000中加入龙芯节点一事,并没有最终成真。不过历军表示,因为目前的体系架构的限制,有可能曙光在制造未来千万亿次超级计算机的时候采用龙芯作为协处理器。


  历军表示,到2010年左右,曙光千万亿次计算机将可能会诞生,并且其中国产CPU龙芯将成为主角。“那将具有划时代的意义。”历军说。


  高性能计算机发展的动力不仅仅是技术驱动,更重要的是需求拉动。曙光公司董事长李国杰院士表示,高性能计算机的应用需求并不是等出来的,而是“用”出来的。他介绍说,在十五期间上海超算中心购买曙光4000A时,绝没有想到两年后,机器运行如此饱满,许多用户要排上半个月才能轮到上机时间。


  “事实已经证明,运行十万亿次计算机后,很快就会产生百万亿次计算机的需求。可以肯定,当我们用上百万亿次计算机后,很快就会产生千万亿次计算机的需求。”李国杰表示。


  水冷技术


  为了实现高计算密度,曙光公司在其曙光5000中引入了水冷技术作为散热的设备。聂华介绍说,曙光5000中所配备的水冷系统与风冷系统实现了混合使用。在机柜中下部安装的水冷系统将把机柜中的热量通过水流带出,而在机柜内部采用风冷进行散热。


  这样就能够在提升散热效率的同时,减少水冷系统可能带来的系统威胁。并且,聂华表示,在曙光5000中的水冷系统跟其他的水冷系统不同,并不需要纯净水来作为循环用水,只需要普通的自来水即能够符合要求。“这也算是曙光公司的一项创新,不仅能够给用户降低水冷系统的部署费用,而且其高效的制冷效果也能够大幅度降低所需要的电力。”聂华说。


  正如本期Top 500中所引入的功耗因素一样,超级计算机系统也已经开始考虑能耗的问题。而此次曙光5000由于采用了低功耗的处理器和内存,以及水冷散热系统和刀片架构,使得其在峰值运算的情况下,耗电量只有700KW。


  高密度刀片


  与Top 500榜单中排名第一的IBM Roadrunner所采用的混合刀片节点不同,曙光5000采用的刀片为高密度4路4核刀片。


  此前历军在接受记者采访时就曾经表示,曙光4000所采用的机架式服务器节点已经不能再继续扩展成百万亿次的架构。毕竟如果单纯扩展服务器机架的数量,不仅节点间连接的性能将会急剧下降,而且其占地面积和功耗都将不可接受。


  据曙光公司介绍,此次曙光5000中所加入的四路四核刀片服务器节点,是采用了曙光公司自主研发的4路4核高密度刀片主板,研发了业界第一款7U高度的10片4路4核64位CPU的工业标准刀片服务器。


  聂华表示,与曙光公司的前代刀片服务器TC 2600相比,此次随曙光5000所发布的新型刀片服务器计算密度更高,单机箱能够实现40颗CPU、160核的计算密度。“这种计算密度,应该算是业界第一了,我们随后就会向业界发布这款刀片服务器,以便在更大的范围内使用这款刀片服务器。”聂华说。


  也正因为采用了如此高密度的计算节点,曙光5000成功实现了性能比曙光4000A提升20多倍的情况下,体积只有2/3、能耗只增加50%的成绩。


  高速互联


  与IBM的Roadrunner一样,曙光5000采用基于DDR的Infiniband高速网络实现计算网络和存储网络合一,它实现了20GB的节点间传输速度,实现业界最快的小于1.3us延时。此外,整个系统还部署了千兆以太网和万兆以太网作为Infiniband网络的备份和I/O节点与计算节点之间的连接。


  聂华解释说,这两种网络互联方式互为备份,主要是通过Infiniband实现计算节点之间的互联,以千兆以太网进行补充,另外在服务器与存储之间也是通过万兆和千兆以太网的互联。


  支持Linux和WCCS


  曙光公司在去年年底的时候与微软签订了有关WCCS的合作,因此此次所发布的曙光5000除了支持Linux之外,还支持WCCS,这意味着作为一款通用意义上的高性能计算机,曙光5000能够支持更多的高性能应用,这将能够促进曙光5000的落户单位上海超算中心能够向更广阔的范围内提供服务。


  链接:曙光5000关键数字


  单机柜性能7.5万亿次
  百万亿次计算耗电350KW
  百万亿次计算需要约14个机柜,占地约75平方米
  由1650个节点组成
  拥有6000多颗CPU
  拥有100TB海量内存

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

相关推荐

  • 全球最快天河二号面面观

    在第41届全球高性能计算机500强(TOP500)排行榜中,天河二号荣登榜首,成为全球最快的超级计算机。天河二号系统有多快?使用了哪些先进技术?

  • 中国TOP100发布:曙光再夺数量份额第一

    2010年10月28日,记者从在北京举办的中国高性能计算机学术年会上获知,曙光公司再次夺得中国TOP100数量份额第一名。

  • 高效计算带来的科技魅力

    在今天科技发展如日中天的时代,高性能计算机已经成为相关产业快速发展的重要工具,高性能计算机已经成为产业链中不可忽略的环节。

  • 曙光再显高端实力 助力生态环境研究

    随着世界经济的发展,环境问题日益突出,高性能计算集群系统的强大计算能力与细致的分析优势,成为了助力国家开展生态环境研究不可或缺的重要手段。