如果你有一台超级计算机,你会用它来做什么?
这是一个有意思的问题。
P.S. 其实,我心中的超级计算机长这样
有关超算的四个冷知识
文 | 史中
你手机里可能有一万个 App,它们通过手机芯片的计算力,帮你完成衣食住行、约撩开啪等各种需求。
作为一个追求世界本质的人,我发现:计算的本质其实就是模拟。
有意思吧?我给你举几个例子:
比如高德地图,模拟的就是我们真实道路的走向;
比如你用手机自拍,(如果没开滤镜)这张照片模拟的就是你的真实长相;
比如虾米音乐,里面的歌曲就是模拟真人和乐器的声音;
比如微信,里面的文字和声音就是模拟朋友面对面和你说的话。
所以,一个问题突然进入我的脑海:如果你有一台计算力不封顶的超级计算机,你会用它来做什么?
接下来就到了释放天性的时刻。
我问了身边几位同事,他们大概给出了如下的答案:
A:如果这台计算机可以记录所有人的思绪和行为,那么从理论上来说就可以模拟股票未来的走势,也同样可以预测楼市的走势。如此,我就可以炒股炒房赚大钱,迎娶白富美,走向人生淀粉。
B:直接用超级计算机做矿机挖比特币,保证更快赚大钱,迎娶白富美,走向。。。
C:把超算卖掉,直接赚大钱,迎娶白富美。。。
D:我只想用超算上草榴。。。
我觉得吧,它们对于超算的误会还是挺深的。于是我想从科普的角度,来讲几个有关超算的冷知识。
我想到在《三体》里,大刘有这么一段描述:
每秒500万亿次浮点运算的计算机,出现在“面壁计划”里。这是第二位面壁者雷迪亚兹看到的人类最强的计算力,用于顶尖的核爆模拟。
简单科普一下:浮点运算大概可以理解成对小数进行计算,是非常精细的运算模式。一般的应用场景例如剁手、约妹子等等程序背后的计算只用到少量的浮点运算,而真正的科学计算往往需要进行大量复杂的浮点运算。
你可能不知道的是,就在2008年,这部《三体II:黑暗森林》出版前的几个月,雷迪亚兹所使用的人类最快计算机,已经被当年排名第四的 IBM 蓝色基因超级计算机超越,实测已经达到了每秒478万次浮点运算,峰值更是达到了596.4万亿次浮点计算。而当时排名第一的超算 IBM Roadrunner 就把最快运算速度刷新到了每秒1026万次浮点运算。
我从百度百科上找到了一张图表,记录了从1942年到2013年,全人类超算的顶级速度,来感受一下:
(点开可以看大图,也可以上百度搜索“超级计算机”)
除去上世纪五六十年代那些巨大飞跃的年份,基本上每年全世界最快的Top500超算的计算力都会比之前翻倍或者是之前的三倍,全面超越了摩尔定律。
那么,现在世界上已知的最强计算机“神威·太湖之光”运算速度有多快呢?它的速度是每秒9.3亿亿次浮点运算。
简单算一下,它已经是《三体》中所描述的计算机的整整186倍。这说明科幻已经落后于现实了。
▲神威·太湖之光(猜猜是谁题的字)
你还记得在二战中最著名的英格玛密码机吗?人类最伟大的计算机之父阿兰·图灵率领一众数学家破译了三四年才取得成功,而同样的密码机使用神威·太湖之光来破译,大概只需要半秒钟。
▲二战期间每天帮助盟军破译3000条敌军信息的“炸弹机”
没错,人类计算力发展的速度,就是比科幻还科幻。
说到中国超算的历史,你可能需要了解下面几个大事:
1)从1942年到2009年将近70年时间,超算“Top1”几乎一直是美国人的专利(英国日本偶尔客串),和中国没有一毛钱关系;
2)2010年,中国的天河一号超算第一次力压群雄拿下全球超算排名第一;
3)2013-2015年,天河一号的“逆天升级版”天河二号连续三年六次蝉联世界超算第一名;
4)2016年,同样是中国的神威·太湖之光超算拿下世界超算第一名,并且一直保持至今。这个完全使用国产 CPU 的超算,还第一次拿下了有超算应用界诺贝尔奖之称的“戈登贝尔奖”。
▲超算第一名算力图增长曲线(注意看,这里面的Y轴坐标很有意思)
说到这里,我忍不住想起几段往事,请允许我唠叨几句。
1960年左右,美国和苏联同时对刚刚建国十年的新中国实施技术封锁。
当时,这两个超级大国不希望中国在原子能和计算机两个最有威慑力的领域取得技术突破,于是有关这两个领域的最前沿知识,被封锁得最厉害。
但就是在这样的封锁下,看看我们做到了什么:
1964年,中国第一颗原子弹爆炸成功;
1967年,中国第一颗氢弹试爆成功;
1970年,中国发射第一颗人造卫星。
1965年,中国研制成功第一块集成电路(仅仅比美国晚五年);
1972年,中国自主制造的诞生(仅比美国晚四年)。
但是,在改革开放以后,我们经历了一次重大的挫折。因为迅速和美帝恢复关系,所以很多顶尖科技瞬间对华解除封锁,我们的政策就变成了“市场换技术”,那时候流行一句话:“造不如买、买不如租”。
既然国外的东西又便宜又好,我们为什么还要自己造呢?于是从80年代开始,技术人才大量流失,到学校教书,甚至成为了图书管理员。以至于到最后,奉行“贸工技”的联想,沦为了一家计算机组装厂。
于是,80年代末,美国对中国计算机的第二次封锁又来了。
1989年,美国政府开始严格限制对中国出口高性能计算机,除了必须用天价采购价格以外,还要把计算机放在透明的玻璃房里,钥匙在美国人手中,每次使用的用途都要向美国人报告,请求批准。
这是莫大的民族耻辱。
经过这两次封锁,我们对美帝不再抱有幻想了,无论美国对中国是封锁还是开放,我们都要按部就班地发展自己的核心技术,于是就有了2006年开始的“核高基”专项。
从那时开始,我们民族的无数热血工程师开始独立研发“龙芯”“飞腾”“申威”芯片;开始研发麒麟操作系统;开始研发银河巨型机、天河系列超级计算机。
▲天河二号超级计算机
直到2013年,我们的超算天河二号六度蝉联世界超算 Top1,用两倍的运算速度远远地把美国的泰坦甩在身后。
这里需要说明一下,天河二号的主力计算芯片是英特尔至强处理器加上英特尔至强融核(Xeon Phi )协处理器卡(一种集合了 60多个核心的协处理器计算卡),不过超算的核心技术并不仅仅在于处理器硬件,还在于如何在上万片芯片中高速互联网络和合理调度任务的全套操作系统。
果不其然,面对中国超算的崛起,美国开始了第三次禁运。
2014年底,美国宣布对中国四大超算基地禁运英特尔至强芯片,理由是莫须有的“有确切证据表明芯片被用于核模拟计算” 。
但是,如今的中国已经有了强大的自信。既然美国都说不带我们玩了,不蒸馒头也要争口气,包括天河二号在内的所有超算基地马上加快了原本就已经进行多年的芯片国产化替代进程。
2016年,来自无锡超算中心的神威·太湖之光完全运用国产的申威芯片,以接近天河二号三倍的速度,直接接棒领跑超算 Top1。而天河二号雄风不减,仅次于太湖之光位列全球第二。
▲神威·太湖之光上使用的国产申威芯片
至此,经历了美国对华计算机技术的三次禁运潮,我们终于有底气说出来这句话:
禁运?我们其实不 Care。
正如我非常敬佩的中科院计算所研究员、龙芯之父胡伟武所说的那样:“中国人只要丢掉了幻想,什么人间奇迹都可以创造出来。”
▲目前全球超算速率比重(以面积表示计算速度)
刚才说了那么往事,确实让人唏嘘。不过我猜一定有人觉得:中国人好大喜功,搞出来这么牛X的超算会不会就是跑个分,然后就放在那吃灰呢?
我就来说说我们为什么这么迫切地需要超算吧。
所谓超算,只是对这种拥有强大能力的计算机的称呼。而超算所做的事情,叫做“高性能计算”。
那么我们在什么领域会需要高性能计算呢?
还记得我在文章的开头说,“计算的本质是模拟”吗?根据我的总结,如果你需要模拟一大堆无厘头的物体之间的相互关系,就一定需要“高性能计算”。
1)比如我们之前提到的“核模拟”就需要高性能计算
核反应是一个链式反应,原子裂变之后会影响到周围的原子,周围的原子又会影响它们周围的原子,对于这些原子行为模拟所需要的计算数量级,就迅速变成了指数型的关系。
这就需要非常强大的超算才能进行模拟。而且,要知道这种模拟对于计算力的要求是没有上限的。计算能力越强,模拟就能进行得更精准,从而能够发现更深层的规律。
气候预测也是高性能计算的一个巨大的应用方向。
2)气候预测同样需要高性能计算
气候预测,广泛来看就是对全球气流、洋流等等的预测,局限来看就是天气预报。
天气预报的基本原理,就是通过气象卫星捕捉地图上每一个点的云层和气流运动轨迹,然后通过大量的计算推导出他们未来的走向。
要知道,即使是今天,对于天气的预报,精度都难以达到80%以上。但是,你一定能感觉到,现在的天气预测已经比你小时候准确得多。这就是因为我们现在的高性能计算能力大幅提高了。
举个例子,之前气象计算的粒度是1个经纬度,大概是111公里,而现在我们气象计算的精度已经细到了3公里,气象科学家们已经把精度提高到1公里。这样的精度提升,对于计算力的要求可是指数级的。
▲用计算机预测云团的走向(图片来自北京大学科学可视化系统)
3)视频渲染也是高性能计算的需求“大户”
你还记得《阿凡达》吗?这部2009年上映的电影里,特效场景比例达到了70%。自从阿凡达之后,特效已经成为了电影的标配,甚至两个演员在绿布前就可以完成一部高质量的太空科幻电影。。。
支撑这些特效的,无疑就是巨大的高性能计算力。
举一个国内的例子。2016年元旦上映的国产动画神作《小门神》,就是追光动画租用了阿里云的高性能计算集群,用了2000台机器渲染出来的。
4)除此之外,高性能计算还可以进行天体物理计算、地震预测、材料科学计算、基因组测序、交通分析、人类组织系统研究等等等等。
▲通过计算进行地震模拟(图片来自中国地震局)
所有这些方面,中国都有着大量的计算需求。所以说中国的超算在闲置,应该是不合理的。
我在知乎上看到了一个曾经使用天河一号超算的研究员的发帖,他的大意如下:
以航空发动机材料计算为例,一个高可用高可靠的发动机,合金材料要进行精确配比实验,而随便一种合金材料,仅仅成分比例搭配就可以算到天荒地老。这种合金材料,有钱也不见得能造出来,必须经过非常长时间的高性能计算才能找到符合我们要求的材料。
事实上天津超算非常拥挤,各个研究团队要排队使用。
所以,实际上你刷的天气预报、看的电影、坐的飞机以及身边的一切都和超算相关。超算在中国不是太多了,而是太少了。
看张图吧,我截取了美国超算中心 NERSC 官网,上面闪动着目前各个项目对超算占用的节点和累计时长数,各个节点的使用时长累计起来,基本一个项目就达到上百万小时。
▲美国超算中心 NERSC 网站截图
我又打开了天津超算中心的网页,虽说没有美国主页那种大片的感觉,但是也可以理解。毕竟有了前车之鉴,我们的超算正在算什么,是不想让别人,尤其是美国人知道的。
▲国家超算天津中心的网站截图
4、其实我们每个人都可以用到超算。回到开头我们的YY,普通人真的可以用超算吗?
我听说,天河二号每年的用电量大概是一亿。。。给你一台天河,我就问你敢开机不?你还上草榴?你上得起一年一亿的草榴吗?
不过讲真,既然超算有这么多的应用场景,这些拥有大量计算资源的老板们是不会放过这个赚钱的好机会的。
看看满街的共享单车共享汽车共享充电宝共享睡眠仓共享男友共享女友,你有没有想到神马?
对啦,共享超算!当然,这不是什么我的发明。。。共享超算还有另一个名字:云计算。
不过,云计算厂商提供的标准主机,主要应付的是一般的网站需求,但其实各大厂商基本也都提供了高性能计算(HPC)的主机。
我特意上阿里云的网站上看了一下,高性能计算的顶配机大概可以提供每秒75万亿次的算力。云计算有一个好处,就是它的技术可以实现把无数台机器无缝拼接在一起。这样算下来,要是拼出一台大刘在《三体》里想象的每秒500万亿次的超算,只需要七台顶配云主机就够了。
看了下网站,一台主机的价格一小时是116,七台差不多要800块。800块钱就能干掉三体,还是挺叼的。
据我所知,有一家公司名叫华大基因,就在用阿里云的云主机做人类基因测序。虽然我觉得他们租用的云主机应该是挺多的,以至于连阿里爸爸都要叫他们客户爸爸。。。但无论如何云主机的价格肯定还是远远低于一台超算。另外,这家公司刚刚上市了,你们可以看看他的股票,就知道他们有多不差钱了。
结尾说了这么多,有两件事情值得我们再次思考:
1、计算的本质是模拟。它在用人脑无法企及的速度,帮助我们接近这个世界的真相,这就是科学。
2、几十年来美国对中国禁运的技术,除了武器,就是计算。
由此我们得出了一个结论,计算本身就是国家竞争的“超级武器”。
知道这些,我才能够理解中国无数超算中心,以及巨大的互联网商业所培育的浩瀚的底层计算力,对于我们这个国家究竟意味着什么。
本文作者史中,科技媒体人,微信:fungungun,欢迎交流。
--- END ---