全球最快计算机天河二号的研发意义是什么?

放在文章之前的p.s. 我批判的那遍文章(自称和这事儿比较近的那篇)在修改之时已经排到第三去了,我也欣慰我的批判起到了一点作用。而修改之时排在一楼的那位“拿天河一号来说”的匿名用户的观点不是我批判的对象。

-------------------------------------------------------------------------------------------------------------------------------------------

实在是看不下去了,这样一个漏洞百出、什么内行技术都不懂,其身份十分值得怀疑的人的答案,居然排在第一位!我的回答分为两个部分。一是说明高居一楼的那个匿名用户的答案的错误,二是回答为什么要制造天河二号,天河二号能做什么事。

xxxxxxxxxxxxxxxxxxxxx我是叉叉分割线 PART1. 破xxxxxxxxxxxxxxxxxxxxxxxxxxxxx

跟这事儿比较近,匿个名吧。

嗯。一楼作者真的和这事儿比较近吗?下面我会告诉大家,从下文的回复中可以看出,该作者不可能是一个和这事儿比较近的人,我看这纯粹是来灌糊水的。呵呵,选择匿名只是为了告诉大家“我是政府内人士,由于某某某原因,我不能直接站出来说话,但我说的都是真的哦,是可信的哦”吧!

作为给天河二找“意义”的工作相关的间接经历者,讲点你们不知道的。

请问什么是给天河二找“意义”?超级计算机制造之前的使用意义就如此明确,还需要你去找吗?我在第二部分会告诉大家天河二号到底有什么意义。

先说超算这东西NB不,按说技术指标什么的应该没什么假,最快就是最快,最大就是最大,但是建超级计算机这个东西如同盖摩天大楼,第一造出来也不代表你掌握了核心的技术,第二这东西不是美日不能建,而是建出来除了好看外,没有多大意义” 于是问题回到了“意义”上。天河二的意义在哪?很可惜,作为直接接触负责提供“意义”的政府部门的人士,我只能告诉你到现在为止,谁都没想好这货能干嘛。这也是为什么美日欧不搞这玩意的原因。

这段话的“第一”、“第二”不尊重实际、误导性十足,表明作者要么是什么都不懂,要么是故意来知乎上搅浑水。“第一造出来也不代表你掌握了核心的技术”的意思是:你造出了世界第一的计算机与你有没有掌握核心技术没有太大的关系,你可能掌握了,也可能没有掌握。显然,作者想表达的意思是,你虽然造出了世界第一的计算机,但是你没有掌握核心技术。这难道是说:即使没有掌握核心技术也能够造出世界第一的计算机来吗?这就真不能理解当年曼海姆大学的Hans Meuer教授(现任国际超级计算大会主席)为什么要搞出个

TOP500

榜单并且能够20多年来一直受到国际的重视了!

制造并运用一台超级计算机所需的技术包括核心处理器、网络互联、容错性、操作系统、编程平台、制造工艺、应用软件等。第一,如此多的CPU如何一起协同工作,提供高速运算,这是体系结构应当解决的问题。而天河二号中采用的新型异构多态体系结构是继天河一号多阵列可配置协同并行体系结构发展而来。多态异构体系结构技术是中国率先提出并使用的,当今处于国际领先地位。

第二,核心处理器也就是通常所说的CPU,但新型异构多态体系结构的天河二号中,它还包括用于加速运算的MIC(可以理解为GPU)等。天河二号采用的CPU是Intel的Xeon和自主生产的FT1500, MIC是Intel的Phi协处理器。Xeon + Phi构成了主要的计算结点,而FT1500组成服务阵列。处理器方面,天河二号采用了国外的CPU,FT1500的性能也是不错的,所以总体结论是中国在处理器的设计制造方面是落后国际先进水平的。

第三,多个处理器共同完成一项任务时,需要进行数据的交互,如同一个团队共同干一个活需要交流沟通一样。2个处理器的数据传输可很容易地实现;10个处理器的数据传输也可以轻易实现,但可想而知会略为复杂;当处理器的数目进一步增加,到达100个,100个,1w个,10w个,100w个时,这种复杂度的问题就不是那么容易解决的了。可以想象TCP/IP协议和全世界大大小小的路由节点就是为了解决这种问题而出现的。但超级计算机内部的数据传输与互联网之间的数据交流不同,超级计算机内部每个节点之间都可以进行数据传输,传输的量还很大,因此对带宽有着极高的要求。天河二号采用的光电混合的自主定制高速互连系统,性能是当前国际上最先进的商用互连系统的2,继续保持国际领先地位(详见:

“天河二号”超级计算机获核心关键技术突破

。我参加过新闻发布会,虽然引用只是新闻,但内容是可靠的)。

第四,容错性。同样的一个东西多了,有一个或几个出问题的可能就大了。如何保证在一个或多个部件出问题的条件下,其他部件继续有效地工作,是容错性设计应当解决的问题。这方面的技术我理解不深,从天河二号新闻发布会的情况了解,它也是处理国际先进水平的。

第五,操作系统。有了硬件,如何管理硬件来完成给定的任务,是操作系统的工作。平时我们所说的装机就是指装操作系统。家用台式机或笔记本的操作系统管理一个四核或八核的CPU算是很多的了。但超级计算机的操作系统需要管理三百万个处理器核,这个技术难度大家自己去想想吧。天河二号采用的是麒麟操作系统,由国防科大自主研制开发。

第六,制造工艺。现在的超级计算机的体积都很大,如何将这么多的处理器组装在一定的空间内,并进行良好的散热,是需要解决的问题。这里看数据:以高密度高精度结构工艺为例,天河二号共170个机柜,占地面积与天河一号基本相同,但性能却是它的11.6倍;与此前排名世界第一的美国“泰坦”系统相比,占地面积是它的85%,性能却是它的近两倍。(详见:

“天河二号”超级计算机获核心关键技术突破

第七,应用软件。应用软件的开发与维护是个长周期的过程,在这方面,一些国外软件具有它的优势。

有没有掌握核心技术,各位应该自有定论了吧。

第二这东西不是美日不能建,而是建出来除了好看外,没有多大“意义””,读完这话,可以看出两层意思:一是超级计算机没有多大的“意义”;二是,因为这个原因所以美日没有造,从而也就没有和中国去抢,所以中国才拿了世界第一。本文第二部分再来讲“意义”,我们先来看看top500的今年6月的统计(详见

List Statistics

):

就top500榜单上的超级计算机而言,美国有252台,中国66台,日本30台,英国29台,法国23台,等等。中国拥有的超级计算机数量是世界第二,而第一美国相当于中国的4倍!而近年来世界第一的计算机,2010年6月是美国橡树岭国家实验室的“美洲豹”(Jaguar),制造经费约为1.4亿美元,持续速度1.759 petaFLOPS(每秒…千万亿次);2010年11月是中国天津超算中心的“天河-1A”,制造经费约为6亿元人民币,持续速度2.566 petaFLOPS;2011年6月是日本神户的理化学研究所的“京”(K-Computer),持续速度8.162petaFLOPS;2011年11月仍然是“京”,技续速度10.510petaFLOPS;2012年6月是属于美国能源部和美国国家核安全管理局的“红衫”(Sequoia),持续速度16.325petaFLOPS;2012年11月是美国橡树岭国家实验室的“泰坦”(Titan),持续速度17.59petaFLOPS;2013年6月是中国广州超算中心的“天河二号”,持续速度33.862petaFLOPS。

美国252台,日本30台,欧盟约80台,真是不知道“这也是为什么美日欧不搞这玩意的原因。”这样一个结论是怎么来的!一楼作者根本是不知道行情啊。而如果HPC真的没有意义,美日又造这么多台做什么?连这点行情都不了解,笔者真心难以想象,会有人找你去给HPC拉应用。

采购这家伙花掉了广州市政府30个亿,每年的维护费用至少是几个亿,每年维护这货花的钱甚至可能就接近广州市政府一年的信息化经费总预算!

关于这点,一年的维护费用达到几个亿,除了几千万的电费之外,其他的开销还请一楼作者具体说明一下,或者是给出数据来源。

于是广州市到处在给这玩意找“意义”,可惜必须用到超级计算机的行业,基本上一只手就数得过来,无非是基础物理、天体物理、大气环境、灾难预测之类的国家投入的基础科研,这些整个广东省甚至华南都基本没有;至于可能用超级计算机的行业,比如生物医药、机械、材料甚至电脑动画之类的,对他们来说用这货的性价比无比之低,用超算几乎不会在这些公司的考虑范围之内。举个例子,某公司用自己的实验室做一个模拟花3天,用超算花10分钟就得,看起来提高了效率,但要用10分钟超算的费用可能就在百万级别,之前还要有N天到N星期的调试。。。哪个公司会愿意用?至于那些可能用得上的基础研究,很遗憾这项目虽然科技部挂了个名,但是是交给广州市自己搞并自付盈亏的,中央连个面都没兴趣露,不可能帮你找基础研究业务并买单,即便有,中科院能绕过不到200公里之外嫡系的深圳超算中心,去找广州这个?而广东省那几个头牌大学都跟基础研究不沾边,同样爱莫能助;至于给国外科研机构用嘛。。呵呵这可是国防科大建的计算机

首先,“广东省那几个头牌大学都跟基础研究不沾边”,真的是这样吗?就说华南理工大学,它就拥有高分子材料广东省教育厅重点实验室(

广东省重点实验室

),中山大学有广东省海洋资源与近岸工程重点实验室、广东省地质过程与矿产资源探查重点实验室等(

中山大学 SUN YAT-SEN UNIVERSITY

)。这里仅仅列出广东省几个头牌大学的基础研究相关的实验室,更多应用超级计算机的研究实验室我就不一一列举了。

第二,使用超级计算机的行业,从天津超算中心的官网的给出的应用案例来看,有石油勘探、动漫渲染、生物医药、高端设备制造、航空航天、天气预报、浩洋环境工程、遥感数据处理、大型土木工程应用、基础科学研究等,远不止一楼给出的那四项。

第三,“这些整个广东省甚至华南都基本没有”。退一步说,即使这些项目广东和华南没有,就不能建在广州了?难道一楼作者还认为当今是蒸汽朋克时代,工厂都要建在自家门口么?这种荒谬的距离逻辑还体现在“中科院能绕过不到200公里之外嫡系的深圳超算中心”里。HPC提供的是服务,你给我待处理的初始数据和处理应用程序,我就给你运算,并给出相应的运算结果。整个过程可以通过互联网的远程访问来实现。距离,在信息时代根本不是问题。再者,本文第二部分我会告诉大家,当计算量大了的时候,并非是超级计算机就可以用,而一定要用速度更快的机器。一楼作者在这里暴露了他的无知,笔者再次难以相信他是给HPC找“意义”的。如果说有“找意义”这一工作的话。

第四,“10分钟超算的费用可能就在百万级别”,关于这点,二楼回复中给出了一个回答,这里不赘述。

第五,“至于给国外科研机构用嘛。。呵呵这可是国防科大建的计算机”,这里作者的逻辑是,因为是作为军校的国防科大造的东西,所以就不能给外国用。这里(

中国超级计算机天河一号远程服务好莱坞

)是同样为国防科大造的天河一号用于好莱坞大片的渲染的介绍,这里(

欧盟超级计算合作项目在津启动 天河一号成主角

)是中国与欧盟超算中心在天河一号的基础上共同开展项目的介绍。

于是最大的可能是在年内组装完毕,取得世界记录后就分拆成低级别的计算中心,降低成本和维护费用(至少可以关一部分省点电,每年空转的耗电量都至少是大千万级的),以期吸引点用户 - 可惜即便如此,也仍然不会有多大用武之地。

取得世界记录后就分拆成低级别的计算中心”,这么多么外行的说法啊!前文已经提到,超级计算机与计算机集群相比的优势在于它可以处理节点交互密集型的计算任务。一楼作者认为这是计算机集群呢?仅仅是亚马逊提供云服务的平台呢?看来一楼作者是不知道了,现在拿了世界第一个天河二号还只是整个项目的一半而已,天河二号还要继续扩容,最终规模是现在的两倍左右。“至少可以关一部分省点电,每年空转的耗电量都至少是大千万级的”表达出作者以为超级计算机一开就必须全开,一关就得全关的想法。这个不多说了。

同时国防科大也会在湖南组一套差一点的超算中心,湖南省出钱。一机双卖,国防科大和Intel乐坏了。。。

一机双卖确实是一机双卖,但不知道一楼作者知不知道,卖给国家超算长沙中心的超级计算机是天河1A的一个小型版,那台机器都已经运转了两年了,只是近期才要搬到湖南大学刚修好的超算中心而已。这和天河二号完全是两码事。

补充下信息,据说这套系统功率是3万千瓦(此贴新闻说1.7万千瓦,说3万可能是包括精密空调等设备),电费自己算。

第一,据说,是据谁说的?第二,天河二号”峰值功率24MW,即2.4万千瓦,而非3万瓦。这包含了17.6MW的计算机功耗和6.4MW的散热功率。第三,这是峰值功耗,只有满负荷运转时才能达到这个功率,一般待机时可以给待机机柜断电,因此一般会低于这个功耗。当然,少是少了些钱,但这样算起来一年几千万应该还是有的。

=======================PART.2立===========================

关于应用,请参考国防科大卢宇彤教授的这篇文章《以天河2号为代表的中国超级计算机之吾问吾答(五问五答)》(原文链接:

有道云笔记

):

一问:世界各国的超级计算机都是单纯的商业行为吗?

一答:非也。世界各国超级计算发展计划都是由政府主导,像世界排名前列的千万亿次以上的系统如红杉、泰坦和京等顶级系统的研发均由美国和日本政府直接投资,分别由IBM、Cray、富士通等公司联合有关国家科研机构承研,中国超级计算机系统研制也是类似的模式。超级计算机的研发目标是解决涉及国家安全与发展的重大科学问题,增强综合国力,绝非单纯的市场行为和商业利益驱动。少数别有用心的人把美国、日本的超级计算机研制描述为单纯的市场行为,蓄意误导读者对我国高性能计算机发展策略和计划产生质疑,抹黑中国高性能计算技术发展的成就,我们要擦亮眼睛。

二问:天河2号超级计算机只是理论上最快吗?

二答:非也。国际TOP500排名不是按理论性能,而是以LINPACK应用实测性能为依据。天河2号系统理论峰值为54.9PFlops,以Linpack实测性能33.86PFLOPS三次排名Top500排行榜首位。国际高性能计算500强排名,从1993年诞生之日起就一直沿用LINPACK应用作为基准测试程序,是国际公认的、权威的系统排行标准。近年来由于技术和需求的发展,又衍生出其它一些应用的排行榜,如HPCC、Graph500、HPCG等,是以不同的测试程序代表了不同的应用模式,以衡量超级计算机系统在某些方面的应用性能,同一系统在不同排行榜上的排名上有所变化,是正常现象。例如,TOP500排名第三的美国红杉超级计算机,按HPCG排名并未上榜;TOP500排名第二的泰坦超级计算机,按Graph500排名也未上榜。相比较而言,天河二号在2014年6月德国超算上首次发布的HPCG排行榜上勇夺第一,只用了部分节点(8192)的Graph500测试结果排名第六,且尚有大量优化提升空间。那些宣扬天河2号只是理论上最快的人如若不是对超级计算排行榜太外行,就只能说是别有用心了。

三问:天河二号超级计算机太过耗电,不符合主流发展趋势吗?

三答: 非也。

天河二号超级计算机是一台节能高效的机器,按评价能效的Green500排行标准,天河二号的能效比(1.9GF/W)和世界排名前列的美国泰坦(2.14GF/W,TOP500排名第二)和红杉(2.17GF/W,TOP500排名第三)相当,远远优于日本的京(0.8GF/W,TOP500排名第四)。其采用的CPU+加速器的异构体系结构也是公认的未来E级系统主流技术发展方向之一。某些人故意隐瞒了系统的类型差异,蓄意拿一台性能低两个数量级的小系统Eurora(排名467),来和天河二号比能效,并在公开场合夸大天河2号的使用能耗,而不与美国、日本的顶级超级计算机比年耗电量,也是为了危言耸听,博取眼球。

四问:天河二号的应用不行吗?

四答: 非也。

天河二号的应用领域广泛,涵盖气象,能源,航空航天,生物医药,宇宙天体、工业制造等,用户单位涵盖国内外各大研究机构、大学、工业企业、政府行业关键部门等。仅4月份一个月,超过百万核的大规模实际领域应用就有6个之多,基于天河二号平台的大规模地震模拟应用Seissol,已入围国际上高性能计算应用的最高奖项戈登奖(Gordon Bell)。某些人蓄意贬低天河二号的应用成果,并夸张地说“‘天河二号’的一些用户甚至需要十年时间来编写必要的代码”,完全是混淆一些领域应用需要很长的开发周期与实际应用在天河2号上很短的移植调试周期,意在把水搅混,哗众取宠。

五问:天河2号的应用开发是系统研发单位一己之任吗?

五答:非也。

天河2号超级计算机系统的研制,是国家科技部审时度势,根据国际超级计算技术发展的趋势和我国的迫切需求立项的,选择了具有高性能计算系统研发悠久历史和成功经验的国防科技大学为承研单位,意在为我国多领域科学研究、技术进步、产业革命提供高性能计算服务,为其抢占优势地位打下坚实的基础。应该说,经过不懈努力,天河团队不辱使命,成功研制出国际上领先的超级计算系统,完成了类似美国IBM、Cray等超级计算厂商所完成的顶级超级计算机研制任务。但高性能应用软件的研发却不是能以国防科大的一己之力所能完成的,是依赖于整个国家的科学技术发展水平,需要领域专家和机构长期投入和创新研究,需要全国各学科领域的协同。“成功是成功之母”,天河2号超级计算机系统的研制成功为我国各领域科学与工程的可能成功打下了坚实的基础,但如何充分发挥系统的应用能力,需要以领域专家为主体的所有人共同努力。

当然,我们作为超级计算机系统研制方,还有很多技术方面需要完善,如研发新型使能技术和体系结构、降低能耗、优化系统软件、加大对应用软件的支持力度。但我们应充分认识到,以天河2号为代表的超级计算机系统只是高性能计算生态环境中的重要一环, 我们还需领域物理模型、大型应用软件、交叉人才的培养等多个环节,才能维持我国高性能计算的生态环境健康有序发展。希望大家都能本着知之为知之,不知为不知的理念,多些沟通,少些曲解;多些理解,少些挑拨;多些实干,少些空谈;多些鼓励,少些拍砖;使我国超级计算之路走向良性发展的轨道。

拿天河一号来说。

天河自从投入运行以来,除了需要维护的时间之外,基本都是满负荷运转。 时代不同了,什么东西不靠计算?航空、材料、气象、空间科学、地质、探矿、核物理、电子电路设计。。。都有大量数据计算。现在冶金配方不是一炉炉炼出来实验,很多都是计算机模拟出来的。航空设计很多都不需要在风洞里吹了,直接用流体方程算。石油钻探不像前一样到处钻井看看地下面是啥,而是测出震波之后做计算来分析。人工智能、生物技术之类的,没有大机器根本就没法做。至于核物理,几大流氓早就不进行真正的核试验了,全都是计算机仿真的。另外天河还有大量的计算能力分配给电影特效、动漫渲染、金融证券分析之类的任务,这些也都要靠巨型机。好莱坞大片一分钟的特效,计算机集群得渲染一天。没有大机器,大家看电影都没那么乐呵。

超算跟钱一样,是不嫌多的。(学经济的同学轻拍…)

========================================

关于收费

中国科学院超级计算环境收费细则

我找到的关于超算的收费标准,一般都是0.4~0.8元 /(核心.机时),(这是两年前的标准)

同时超算中心也会提供包年服务,另一个匿名用户(天呐,好多匿名用户)说10分钟的费用在百万级别,我不敢苟同

========================================

关于使用

天河二号这种级别超算的使用不会是个体独占的。使用是一群人每人用一部分而不是一个人用整个系统,按需购买按需使用。

对于固定的客户,提交作业在前几次调试后是轻车熟路,相比较自身模拟,并不需要额外花费很长的时间。

还是用钱作比喻吧,天河二号是一个很大的钱袋子,我们可以用它去买一辆以前买不起的劳斯莱斯,也可以用它去买比以前更多的奥迪A6。何乐而不为呢?

=========================================

关于核心

解密天河二号 八万颗英特尔处理器的背后

32000个12核心E5 2600 V2+48000个57(61-4)核心至强协处理器组成,共312万个。

但协处理器核心和E5的核心是不同的,计算价格单纯以312W*0.4并不妥。

当然,不管怎么计算,十几分钟百万级别都是很难以置信的。

=========================================

没想到原来鲜有人关注的这个问题现在人这么多,与题无关意气之争的内容编辑掉。

评论中与题无关的评论内容删掉,见谅。

恭喜中科院软件所杨超研究员研究团队获得中华人民共和国建国后第一个Gordon Bell Prize!!

杨老师做的工作我之前就听过报告,在天河1号和2号上都有实现,终于今天拿到奖项,实至名归。

此新闻一出,我愿修改我之前的答案。 ACM Gordon Bell Prize

中山大学学生,在超算中心先导系统那里当助理。目前中大东校三个集群,负责任地说,很多老师和外面企业使用,其中化学,环境,生科和数学几个学院用得比较多,整个系统基本每天都是满负荷在运行,有时也会出现节点down掉的情况(我们做的就是监控环境)。排名第一的回答正确性有待质疑,因为据我观察,很多老师的程序都是没日没夜地在上面运行的,而且节点的使用也是有数量和时间限制,照上面十分钟百万级说法,老师岂不得倾家荡产。

非常惊讶,一个误导性十足的答案居然会高居第一。澄清几个问题,欧美、日本不做。这个问题很简单就可以确定,在每年top500列表上,欧美、日本的超级计算机绝对是前列,恐怕高排位的应该大部分属于美国能源部旗下的实验室,如jaguar,Hopper等。这几年,随着摩尔定律的发威,单科颗cpu成本急剧降低,国内在这块也高速推进,远得不说,光讲上过top1的就有天河系列,魔方系列。

至于超级计算机有什么用,是否仅能作为基础科研的工具,这同样是错误十足的答案。超级计算在现代工业,国防均有举足轻重的作用,如材料损伤,汽车建模如汽车碰撞实验,风洞设计,热核模拟等等。这些应用性计算,无论对于设计的经济性,还是可靠性都不可或缺。至于更多的战略性要素或角度,暂时就不一一展开了。无论从好奇心或者实际效用来看,计算能力都是决定我们扩展疆域边界的核心力。

没想到写点自己经历的东西,招来不少“热血校园党”专门注册帐号来喷,实在是感觉为知乎的推广做了不少贡献,顺便想起自己当年一听到某TV里说“中国又取得了XX第一”就激动不已的单纯的学生时代。为表庆祝在文末再补点料。

(不过还是提醒知乎一下,用户低龄化是双刃剑,相较下Quora的活跃用户结构对自身发展更有利。)

温馨提示:本文讲的是”【天河二】这台广州市区两级财政花钱采购的【全球最快的计算机】意义何在‘,如果您在大声朗读问题后仍然表示您想看的是’超算的意义,对不起本文不提供,请在请教您语文老师后另开题目询问。

以下正文:

-------------------------------

跟这事儿比较近,匿个名吧。

作为给天河二找“意义”的工作相关的间接经历者,讲点你们不知道的。

先说超算这东西NB不,按说技术指标什么的应该没什么假,最快就是最快,最大就是最大,但是建超级计算机这个东西如同盖摩天大楼,第一造出来也不代表你掌握了核心的技术,第二这东西不是美日不能建,而是建出来除了好看外,没有多大“意义” 。

于是问题回到了“意义”上。天河二的意义在哪?很可惜,作为直接接触负责提供“意义”的政府部门的人士,我只能告诉你到现在为止,谁都没想好这货能干嘛

这也是为什么美日欧不搞这玩意的原因。

采购这家伙花掉了广州市政府近30个亿,每年的维护费用至少是几个亿,每年维护这货花的钱甚至可能就接近广州市政府一年的信息化经费总预算!

于是广州市到处在给这玩意找“意义”,可惜必须用到超级计算机的行业,基本上一只手就数得过来,无非是基础物理、天体物理、大气环境、灾难预测之类的国家投入的基础科研,这些整个广东省甚至华南都基本没有;至于可能用超级计算机的行业,比如生物医药、机械、材料甚至电脑动画之类的,对他们来说用这货的性价比无比之低,用超算几乎不会在这些公司的考虑范围之内。

举个例子,某公司用自己的实验室做一个模拟花3天,用超算花10分钟就得,看起来提高了效率,但要用这10分钟超算的费用可能就在百万级别,之前还要有N天到N星期的调试。。。哪个公司会愿意用?

至于那些可能用得上的基础研究,很遗憾这项目虽然科技部挂了个名,但是是交给广州市自己搞并自付盈亏的,中央连个面都没兴趣露,不可能帮你找基础研究业务并买单,即便有,中科院能绕过不到200公里之外嫡系的深圳超算中心,去找广州这个?

而广东省那几个头牌大学都跟基础研究不沾边,同样爱莫能助;至于给国外科研机构用嘛。。呵呵这可是国防科大建的计算机。

于是最大的可能是在年内组装完毕,取得世界记录后就分拆成低级别的计算中心,降低成本和维护费用(至少可以关一部分省点电,每年空转的耗电量都至少是大千万级的),以期吸引点用户 - 可惜即便如此,也仍然不会有多大用武之地。

(吐个槽。。。每回想到那每年几个亿的维护费用,就气不打一处来)

--------------------

既然竟有两百来人支持,就针对回复再补几句:

1. 匿名是因为跟很多直接相关的人熟,不想露脸,信息本身没什么秘密。

2. 我说的是“现在没找到意义”,不是说这玩意不会有意义,你能找到或建立需要用到世界顶尖超算能力还花得起钱的公司的话他们会很欢迎的,不过一个商用大电脑研究核武器什么的就算了吧那位孩纸。

3. 我在评论中回复的两条稍微修改补进来:

国防科大的超级计算机项目是国家资助的一个科研项目。“天河二”是广州市采购了这个项目的成果,组成了世界最快的超算中心,所以天河二不是科研项目,是商业项目,而且是广州市两级政府自掏腰包,自负盈亏的。同时国防科大也会在湖南组一套差一点的超算中心,湖南省出钱。 一机双卖,国防科大和Intel乐坏了。。。当初为什么上马这个倒也知道些,不过未经过交叉验证无法证实,就不说了,但当初决定要搞这个时的确没想好能干嘛是确定的,这本就不是政府强项。我此回复仅针对经济意义,政治意义您怎么说都有理。用一次的估价是猜测,是按照能收回运维成本的成本价估算,大家可以自己算一下要收支平衡得是什么成 本价(仅贷款利息一项每年就上亿了),你要赔本卖当然可以要多便宜有多便宜……

4. 补充下信息,据说这套系统功率是3万千瓦(此贴新闻说1.7万千瓦,说3万可能是包括精密空调等设备),电费自己算。

-----------------------

以为这个问题不用怎么解释,但是看来很多人还是纠结于收费问题,鉴于大量学生来看此贴,再添两句吧:

按照楼下提供的天河一的收费方式:0.4-0.8元/核心每小时来算。天河二的核心数是300万,算你用一半就能达到“全球最快”的速度,请自己算一下你用一次【全球最快计算机天河二号】要花多少钱。

------------------------

补点料:

(可惜要补的是个”负意义“,更让热血青年们失望了)

在决定采购此超算后,广州市在2012下半年开始基本停止了所有经费来源是市级财政的政府服务器采购项目,要求各部门的系统需要的计算资源用超算解决,这就是为什么在早期的宣传材料上一直把”政务应用“作为重要用途之一。实际上绝大多数的政府IT系统都是基于最简单的X86服务器,只有很少数后台用到了小型机,跟超算则是完全是不搭界,于是逐渐明白过来后在现在的宣传中”政务应用“也逐渐靠后,但这一年多的时间内政府的IT基础设施升级算是基本停滞了。

这也是为什么我说我是”间接相关“的原因,具体就不展开了。

这个每天实验室都有在用天河系统的必须匿名了

上次过来介绍(或者是推销?)的时候

听说最主要的客户是动画和石油探测(占用系统资源最多,当然给钱也最多)

然后现在各种科学研究都很难离开计算模拟这个事情,所以国内各个研究所大学很多研究小组也会购买使用权限来进行各种模拟计算

比如我们中心就是做磁流体的各种模拟研究,老师就会购买权限来提供计算。

转载一篇博文:高維世界與一維價值

我前幾天去德國萊比錫參加了ISC學生集羣大賽。這個比賽的內容是在限定功率(3000W)的條件下,優化集羣的計算性能。每個隊伍的集羣分別由贊助商提供,清華大學隊是浪潮公司贊助的。由於硬件實在沒法和別的學校比,我們只好從軟件上來優化,比賽的程序包括了LINPACK、HPCC、HPCG、Quantum ESPRESSO和Gadget。最終清華隊獲得了全球第三名,也算是盡力了——畢竟我們的集羣連GPU都沒,而許多隊伍配置極盡奢華,像愛丁堡大學連液冷系統都上了。

世界上「最快」的超級計算機

在ISC會議期間,我們得知了中國的「天河2號」以LINPACK峯值54902.4 TFlop/S的速度保持了超級計算機TOP500榜首,全球媒體爭相報道。但是在各個媒體的報道中,我們看到的是「天河2號」成爲「全球最快的超級計算機」,如Forbes的報道,而紛紛忽略了一個重要細節,即TOP500是以LINPACK的速度來排名的。LINPACK基準測試求解的問題是一個稠密的線性方程組,它完全是計算密集型的應用,其內存訪問、並行通信、磁盤讀寫都不成爲瓶頸。因此有人批評LINPACK提供的數值是「基本上無法到達的,卻有一小撮程序員在無聊地優化它的代碼,爲了使得他們的機器獲得更好的數值」。實際上衡量一個計算機性能的好壞,僅僅通過浮點計算密集型的應用來估計絕對是以偏概全,真實的系統性能還取決於整數計算性能、內存訪問性能、網絡通信性能和磁盤讀寫性能等等各個方面。哪怕是僅僅在科學計算領域,許多應用也不僅僅是在求解稠密線性方程組。許多時候可以認爲LINPACK數值完全不具備參考意義,因爲大多數科學計算應用的性能瓶頸根本不在這上面。

作爲「國家安全戰略投資」的天河2號,想必許多時候在求解的問題是破解密碼。然而一個可怕的事實是,大量密碼學算法,包括散列、非對稱加密(如MD5、RSA),都只進行整數計算,完全沒有任何浮點計算操作。如此看來,追求高LINPACK數值來提高密碼破解的性能,差不多是緣木求魚。

高維世界的序關係

說到CPU的性能,幾年前,大家在裝電腦的時候選購CPU只看主頻,頻率越高越好。於是英特爾爲了迎合市場,推出了奔騰四3.0GHz甚至3.6GHz主頻的CPU。後來進入多核時代,大家就看核心數,雙核的肯定比單核的好,四核的肯定比雙核的好。殊不知CPU的性能好壞有太多的參數,盲目追求高的主頻或者核心的數量沒有意義。不單單是CPU,想想看大家買數碼相機看什麼呢?許多人第一反應當然是像素啊。買單反鏡頭?光圈大小!買汽車?排量!買房?面積!

事實上這個道理淺顯易懂,但人們卻對它無能爲力。作爲沒有相關知識的普通消費者,面對這個世界紛繁複雜的參數真的是無能爲力,於是只好選擇一個「公認」的參數作爲基準了。

這一切的根源在於,向量和向量是無法比較大小的,只有標量纔能比較。向量只能通過一些函數變換到標量纔能比較,如模長,或者在某個空間上的投影。世界上的任何一件東西都可以用一個高維向量來表示,但爲了獲得序關係,我們通常只能把它映射到一個一維空間。在這個過程中,大量的信息都丟失了。對於同一組向量使用不同的函數,獲得序關係可以是完全不一樣的。

這是一個淺顯易懂的道理,而人們卻無能爲力。因爲人們天生傾向於用一個一維的數值來比較一切同類的事物(甚至不同類的事物),但事物天生是高維的。

價值觀是一個從高維空間到一維空間的映射

人們經常談論價值觀,譬如價值觀不同的人不要在一起,現代社會通過價值觀把人分爲不同的羣體。價值觀實際上是一個從高維空間到一維空間的映射,也就是一個高維向量的函數。人們面對紛繁複雜的事物,一個與生俱來的衝動就是對它進行評價,然後與其他事物相互比較。在這個過程中,不同價值觀的人使用了不同的函數,因此得出的結果是大相徑庭的。

商品的價格與價值

作爲一個通用的價值衡量工具,商品的價格成爲一個被廣泛使用的尺度。價格短期看來反應的是供求的關係,但本質上反映了一個長期的、多人的價值。用數學的語言方式表示,價格是一個高維的泛函(Functional),其中每一維的變量都是一個個體的價值觀函數,或者用以下代碼(OCaml)表示:

(* 價值觀是一個從任意向量到整數的函數 *) type value = (anything -> int) (* 價格是一個從多個價值觀函數到一個價值觀函數的函數(泛函) *) val price : (values_of_all : value list) -> value (* 一個簡單實現:價格即爲所有人價值觀的平均值 *) let price values_of_all = fun thing -> let sum = List.fold_left ( fun sum value_function -> sum + (value_function thing) ) 0 values_of_all in let number_of_people = (List.length values_of_all) in sum / number_of_people

換人話說,價格反映了全體生產者和消費者的價值觀,儘管可能各不相同,但卻用一個工具把它們統一了起來,變成了一個單一的可以衡量不同事物的價值的函數。對於一個個體來說,商品的價格可能偏離個人對商品的價值衡量,因此會有感覺便宜或者感覺貴。根據個人是否有錢,個人對價值的衡量也會不同,個人資產可以作爲價值觀函數的一個其他參數。

用價格衡量價值的方法看似簡單粗暴,有諸多弊端,卻也有着其他方法無可比擬的優點。其最大的優點就是簡單性,因爲人類對複雜事物的理解力實在有限。這也是爲什麼計劃經濟無法執行的一個原因,因爲沒有一個把萬物映射到一維的函數,或者這個函數取樣過於有限,只能反應少數統治者的意願。

價值多元化

一元價值儘管有着便於比較排序的優點,但卻會導致優化目標的單一化。譬如超級計算機只優化LINPACK或其他某個性能,學生爲了應付高考成爲做題機器,全社會「向錢看」道德淪喪等等。儘管着本身沒有什麼問題,卻會讓導致潛在的評估偏差風險。對此,價值多元化的主張被提了出來。價值多元化是把一維的價值標量變爲多維向量,也可以理解爲是多個價值函數的組合。價值多元化以後,價值本身重新變得不可比較,只能按照維度比較(或者價值向量的函數)。

在我看來,價值多元化沒有解決太多的問題,反而喪失了序關係,事實上是一種掩耳盜鈴的方法。價值多元化就等於沒有價值,只是把一個高維向量映射到了另一個向量,不僅丟失了信息,還無法比較。價值多元化可以當作進一步價值比較的「中間結果」,方便進一步計算而已,最終還是要歸結於一維。用金錢衡量一切的一元價值儘管不能解決許多問題,卻是人類目前能想到並實踐的最有效的方法。但願會有更好的方式被發明出來。

干一行,却不知道这一行的流行趋势,做一件事,却不知道自己为何要这么做,只是低头想当然的以为自己可以,自己能行。

美国日本不搞这些?你知道美国有多少超级计算机吗?难道LANL,LLNL,ORNL,NASA等等买的都是PS4和XBOX吗?现在中国只有天河能达到世界顶尖,排行可能随时会更新。

世界500个超级计算机美国就占了一半。难道它有钱难受烧着玩吗?

当别人提醒你的时候,满口答应,可是一旦到了遇事判断的时候自己的无知便占领了整个身心。恶狠狠的甩下一通让别人听到觉得你就是个傻逼的话。

曾经在中国最老的超算中心工作过8年,所以略懂点皮毛。在这里分享一下自己的认识。现在的超级计算机排名是每年德国ISC和美国SC大会上半年、下半年各发布次。这次的是ISC的排名。过去还没有出现GPU的时候,测的都是CPU。但是现在基本只要把大量的GPU堆一堆,Linpack指数就可以冲第一。用GPU堆的机器基本没有实际应用意义。至少在我离开超算中心之前,还没听说有哪家计算中心GPU用得好的,其中包括国外的。而国产CPU目前来说很难用。因为中国一向重硬件、轻软件,所以更不具有实际的应用意义。

从日后的应用来看(之前一直在研究超算中心的可持续发展),目前中国超算的发展不具有可持续性。建造超级计算机应该以计算需求为导线,而不是先造机器,再随便哪里放一放,挂个国家级计算中心的牌子,每年国家出钱付几亿电费和其他运营成本维持个4、5年(超级计算机基本5年需要更新),然后就没有然后了。我们目前的这种模式除了面子和形象外,基本属于烧钱,不利于整体行业的发展。

这个问题有很多层次。匿名用户(目前有两个匿名用户,这里指时间上较早的)回答了「超算的意义」是什么。但是「超算的意义」不等于「天河二号的意义」,「天河二号的意义」不等于「天河二号研发的意义」。就如同你问「汽车的意义」,不等于「国产一汽奥迪的意义」,也不等于「一汽要合资生产而不是进口奥迪的意义」,也不等于「某个部委购进了数台奥迪的意义」。

在我看来,在一个诚实、守信的国家,这些意义虽然不同,但是有着比较清晰,简单的关系。而在一个腐败、低效、政府不透明的国家,这些意义之间的关系充满不确定性。而且更多的是值得怀疑的负面性。

我认为,知乎上所谓「理性看待这些问题,不要随意归于体制」的呼声,看似理性,其实是用简单的「汽车的意义」来混淆了大多数人本来就理不清的这些特定意义。

======================================================

我的答案将「超算的意义」、「天河二号的意义」、「天河二号研发的意义」列为并列项目。不否认匿名用户的内容,也反对对问题本身意义的不全面误导。

知乎现在有这么一种人,认为世界上有两种人:和他观点一致的 vs. 政治正确的。

建议对自己不懂的事情少发表评论

先从文本表面来分析一下吧,新闻链接里面给了超算前五的排名,除了天河2号之外,其他4个都是归在具体的研究所/实验室名下的(而且没有一个是研究计算机的研究所/实验室,简单查了一下都是核能之类的基础研究为主)。

也就是说,前五的其他四个超级计算机都是有具体的需求(不是计算机研究的需求,而是具体的其他领域如核能的研究需求,也就是对运算能力的具体需求),根据这些需求来进行开发和组装的系统。

而天河2号从文本来看并非如此,它的客户是建成之后再去找的。而且从60家之多来看,根本就没有哪一个单个用户需要如此强大的运算能力。从平均来看,每个客户需要的运算能力还不到天河2号的2%,即使考虑到不同客户的需求不平均,估计也没有哪个客户需要的运算能力达到了天河2的10%

要知道弄一个计算能力为2的机器成本要大于弄两个计算能力为1的机器的,更加不要说弄一个运算能力为10的机器和弄10个运算能力为1的机器了。

个人希望未来中国的超算再建立和规划时不要再是要去成为第一,而是因为真的有一个用户有些不可(或者至少不便于)分割的运算任务真的需要那么大的运算能力。

确实 关于说的那个美日都不搞超算的事

我也觉得不可理喻啊 就比如说 那个TOP100还是500纯粹是刷存在感把

但是我记得我看过某年的这个表 几乎大国都在搞啊 而且我看的那一年 美国占大半啊

除非是美国的数据就是拿来搞蒙骗的么?忽悠各国搞“军事竞赛”?然后其实自己不玩的?

大家觉得呢?

为了仙剑奇侠传六流畅运行60帧

个人认为是大数据时代到来的必然产物,未来这些超级计算机数量只会增加不会减少。

高科技就是要烧钱,非常简单的道理。

天天反思不如干点实事,哪怕是一丁点实事。

1. 天河2有人用吗?

队列很满,需要抢。

2. 超算有经济效益吗?

大石油公司不差钱,只要你能算得好。

你可以猜猜海上钻口井的代价,以及没算好打歪了的代价。

3. 天朝为什么没有自己的软件?

过两年就有Gorden Bell了,政治原因可能只给final list。

别急。

挖坟。

说超算平台闲置没人用的,你们在上面提交过任务排过队嘛!!!!!

前面有个匿名用户,吐了很多槽。但是从我个人经验看,似乎并不是这样。所以有感而发。

就谈谈超算的使用问题吧。我个人还是看好超算中心模式的。

先讲下比较了解的天津超算-天河一号,我们是主要的大客户。据我了解,目前整个系统的租用率已经接近100%了(和使用率还有不同,使用率还与用户的应用方式有关)。非常高的租用率。今年初,想借个独立机柜做测试都一直没等到资源。但这个局面也不是天河一号一建好就达到的。这几年用户在逐步增长,市场也是需要培育的。

由于以前没有超速中心,过去咱们国家哪个单位需要HPC,那个单位就自己购置维护。这个惯性不会一下子改过来,一方面,现在很多经费渠道还不支持租用方式。另一方面,也有领导总是觉得放自己这最放心。但我相信慢慢会转变。其实真正技术上限制超算中心的主要还是通讯网络,尤其是跨省。联通、电信的报价太黑。建议大家可以找找别的资源,我们用的电力的,费用不到联通的十分之一。但这个就得自己协调资源了。

再说说自己运维HPC,其实问题真的蛮多。主要的两方面:1)运维费用。超算购置的时候除了机器钱,还得建配套(制冷、承重)。运行起来,一样大把花钱。像我们以前使用的IBM,一年维保100万(找的代理,官方更贵)。一年电费也近百万。2)人员占用,就算有了维保,平时运行也得靠自己管理。就相当于还要额外占用人力资源。其它像场地、供电等等都是小问题,但也让人头痛。这种HPC坏了,修好之前,业务就得停,让人很紧张。在超算中心,资源都在一个大池子里,基本不会出现这样的问题。

-------------------------------------------------------------------------------------------------------------------------------

另一方面,天河一号应该算是天津政府投资建设,后期运维升级费用全靠天津超算自己挣钱。我觉得这个方式还是挺好的。现在纯粹靠商业,估计没人会建这种规模的系统。这东西也可以理解成基础设施,就和修路建高铁一样。政府建了,后面会带动一大堆的应用,经济价值绝对划算。像是天津超算旁边,就是动漫产业园。超算的用户也明白,一年的租金基本也就和自己运行HPC的运维费差不多。建设费用全省了。

至于租给国外,我认为完全没必要。中国花了那么多钱才建好的系统,自己其实还不够用,没必要便宜外国人(只收个运维费)。

-------------------------------------------------------------------------------------------------------------------------------

当然问题也不少。一个就是,资源闲置的问题。如果能在系统建好之前,就先做市场也许会有帮助。另一个,我觉得就是运维水平还是比较低。我在使用国内和美国的超算对比,感觉在系统运维、用户服务上,其实差距还是挺大的。这块解决好,对于市场推广是帮助很大的。

我们在上天河一号前,因为对系统稳定性要求非常高,也是经历了很长时间的系统调试,自己投入了很大力量。如果超算中心能把这些都替用户做好,我想会有更多人愿意使用。

毕竟超算中心在国内起步还不到十年,专业人员也是逐步培养出来的。

------------------------------------------------------------------------------------------------------------------------------

长远看,建超算中心是利大于弊的。这种方式,比每个单位自己分散的建设和管理HPC系统,费效比要高很多。

------------------------------------------------------------------------------------------------------------------------------

说句最简单的话:只要是美国限制我们的,一定是对我们有利的

综合两位匿名的看法,我觉得问题主要出在了天河二号是一个商业项目,天河一号是政府拔款专用于科研,所以价格较低,天河二号是商业项目,还指望得赚钱还银行利息,价格当然高了,但科研单位经费有限,所以宁可排队上天河一号也不上天河二号,而民间的项目估计用到超算的机会不多,成本也不一定划算,因此天河二号地位就尴尬了。

这有点像建了一条超豪华的高速公路,有收不回成本的危险,不是面子工程而是延续之前的基建思维,我倒觉得降降价格不把他当商业项目当成一个不回收成本的基建,可能几年之后再看还是有益的。

大一本科生,非计算机专业,第一次答问题说的不对的地方希望大家理解

如大家所知,天河二号超级计算机所在地是广州 那么广州那么大块地,超算又放在哪里呢

实际上,在广州中山大学东校区里面有一个国家超级计算机中心,平是机器就是放在里面二楼

好吧,虽然作为一只中大狗,能进去超算中心的机会也不多(恩是几乎没有的说),超算中心每天都有好几个壮到飞起的保安把守,没什么事是不会让你进去的,不过好再之前沾一个教授的光,也是有幸进去参观了一下

先po上几张图:

这就是大名顶顶的天河二号啦

整个超计中心不高,只有几层楼

整个第二层除了一个大厅和接待室之外都是机房。然后机房是在一个密闭的空间里的,为的是在有突发情况(起火之类的)惰性气体可以及时补救,减少财产的损失,至于超算中心的一层和负一层就都是冷却系统

现在让我们来聚焦一下超级计算机。撇开我不懂的专业数据,以及大家已近知道的天河有多大有多屌这些,我们说一说一些其他的数据。

整个计算机的研发过程大约消耗资金30亿元,然后配套设施建设大约是为30亿元

现在为了省钱没有把所有机组打开,没年消耗的电费大约在6000万 然后现在还在机组升级 耗的钱就不说了

恩,总之就是个耗钱耗人力无力的大家伙

现在在回归到这个问题 国家花辣么多钱修健这个big guy 到底有什么用

当然是为了装逼 made in chian 嘛(大雾)

哦主要作用肯定不是装逼

按官方的说法(机房里面的宣传资料)

天河二号的诞生是为了推进我国工业 军事 信息化航天航空等多方面的建设(总之就是那些官方话 你懂的)

那到底有什么用呢?

事实也是官方说的那些话。

至少在我的理解范围内,超算为科研各方面的工程事业作做出了很大的贡献

随着科技的发展,尤其是我们这种建立在数学模型上的一种科技形式,每一个巨大的工程后面都对应了十分大量的数据,然而这些数据的计算量是非常巨大的,人来算基本不可能,而交给普通的计算机来说也可能算个几天几个月几年,还可能算出来一堆误差

这显然是不符合现在生产速度的需要的,这个时候就需要一台计算能力逆天的计算机来辅助计算

拿我们学院举例子,一个本来平均实验要要跑十几天的,然后后来接了条光缆到超算那边,之后的实验都很轻松了

但是为什么平时我们完全感觉不到超算的作用

直观来说 我们中的大多数都没有很直接地参与到这些大型工程的建设当中这是第一个原因

另一个原因呢就是商业化

正如前面的大神所说 虽然跑一个实验的确块了很多 但耗费的代价太大了 很多情况不值得

所以现在超算那边很努力地在实现商业化

比如超算的系统搭载的就是win xp

基本兼容了所有常用的软件

还搭建了一个超算云平台 让企业在家中就可以用超算

但是 致于最本源的价钱嘛 。。。。

嘛。。。。

恩。商业化的路还很长

大家就随便看看好啦啊

觉得ok就顺便赞一个

再随便吐槽一下我中山不放假大学到现在还不放假

考试周貌死手机码字回答

大家晚安

最直接,高超音速飞行器的模型是怎么设计出来的?靠超算;天气预报咋那么准?靠超算;J20怎么长那个样子?靠超算;我们怎么知道我们填海,美国不派兵?靠超算(我不告诉你是兵棋推演的结果)。来来来,要知后百年之国运,靠超算!(不是算出来的,有超算,本来就是国运的象征!)

天河,之前听闻中国自主研发,还是很自豪的。

我在美国念书,去年学操作系统老师是刚从英特尔退下来的一个负责人。有次去找他问问题,闲聊起来,他发现我是来自中国的,很开心的给我说你知道广州那个超算中心么,我之前在英特尔就负责给他们做架构弄cpu…

奶奶的让我这个愤青郁闷了好几天………

1.之前参加过广州天河二号上机培训。其他不说,作为一个zf.机构,感觉其办事效率低。申请天河二号上机机时,填表还要盖章,这就算了,申请了大半个月不给回复这怎么破啊。即使不是什么著名科研所,著名高校,但是好歹是去使用天河二号做科研实验的。最后还是导师提供美利坚某大学的超算平台。希望天河二号提高办事效率,让更多科研人员好好利用平台。

2.从天河二号超算中心提供的例子来看,在该平台上进行的科研实验案例偏少。正如上面所言,资源利用偏低。

3.上面某位人士说老师的程序都在节点上每日每夜的跑,问题是,要看产出。资源利用了,没产出,资源当然利用低。

4.国内做并行计算都是跟着外国走,任重而道远啊。

1)有关部门没有分享任何技术细节,非常让人失望。

2)国产处理器的存在莫名其妙,因为xeno+phi本来就算是异构,那个FT-1500是个啥?

猜测国产的芯片只是负责简单的控制平面的事情。

China’s Tianhe-2 Supercomputer Takes No. 1 Ranking on 41st TOP500 List

3)据说,phi用的是过时的技术堆砌起来的,die基于96年的奔腾

泰罗TaroXeon Phi用P54C架构来做是正确的选择,楼主可能不是很懂微架构,P6之后的架构能耗效率不够,可以做多核但不适合做众核,NVIDIA的SMX核心也同样是基于这样的简单核心做起来的。泰罗Taro 回复 Ryane Luo(作者)我觉得您可能不太懂微架构。这个改版P54C的基本构建思路与GPGPU有许多异曲同工处,同是SIMD,谓词执行,gather-scatter,同时保留了一些众核特色,每核心独立缓存,基于分布式目录的硬件一致性管理等。泰罗Taro 回复 Ryane Luo(作者)它和您所谓的全显卡浮点其实是由一种设计思路演化而来,都是堆积简单SIMD处理单元阵列,多线程隐藏访寸延迟,和P6以后的x86已经是不同的两条路,倒像是吸收了GPGPU长处的众核架构。它和GPGPU谁胜谁负还很难说。坂本番茄酱 回复 Ryane Luo(作者)Intel提供了什么什么的优惠,我们其实都知道,这没啥好讲的。但是Phi也没那么糟糕,MKL的Auto Offloading用起来还是很舒服的,而且,Native/Symmetric Mode下面跑的话,虽然效率不是特别高,但是省去了部分移植的开发周期带来的收益还是很可观的。Phi的关键在FPU上,拿奔腾内核说事没啥意思,人家连个branch prediction没有,就是专心做计算的http://www.nvidia.com/object/justthefacts.html

4)天河1A使用的是Nvidia公司的超算卡,2号突然换平台,是什么个节奏?

Tianhe-1A - NUDT YH MPP, Xeon X5670 6C 2.93 GHz, NVIDIA 2050

5)难道怕被绑死在一个平台上?

6)还是intel的xeno+phi捆绑销售更加便宜?

7)Linpack 是个很简单很简单的程序,它的跑分是很基础很基础的运算。

HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers

真正要用起来这么大个硬件干事情,完全是2码事。

8)风凉话说完,希望确实能有大型应用在上面能跑起来。

----------------------------

update: 把评论丢进去了,打不打脸无所谓。

NV员工,不做CUDA。

"全球最快计算机天河二号的研发意义"这个问题要分为几个问题回答:

a.研发超级计算机的意义.

b.研发全球最快的超级计算机的意义.

首先回答

a.研发超级计算机的意义.

由于非从业人员,所以,仅从普通学生的角度谈一下这个问题.

HPC的重要性可以体现在以下几个方面:

1,天气预报和气候变化;变量太多,数据量太大,仅有超级计算机可以胜任.

2,物理和化学研究;包括药学,本校的研究员研究HIV的药物,就得依靠HPC进行仿真.

http://www.chm.bris.ac.uk/pt/ajm/Site/Christopher.html

3,航空航天;在这里读航空的Phd,一直在抱怨,本校的超级计算机资源有效,排队时间过长,不能及时有效的进行仿真.

虽然我们学生可以用的超级计算机较老,可以申请的资源有限,但是,对程序进行并行化处理,处理时间得到几个数量级的提高,难道不是极大地提高了工作效率?工欲善其事,必先利其器.这是有价值的投资,我觉得国内很多土豪学校,搭建维护自己的小型超级计算机,也不算大投资.

对于超级计算机的存在的意义,这点其实争论较少.无论是商业应用,还是国防力量,都是必不可少的一环.其实主要争论在于b.

b.研发全球最快的超级计算机的意义.

即要不要做到全球最快?做到了有什么意义?

对于天河系统,确实以前我刚看到新闻的时候,对其理解也有误区.当时的想法跟不少人类似,即芯片不就是买一堆Intel,AMD,Nvdia的搭建起来,纯粹是拼财力,而不是技术.而转变,则是我在英国修HPC的课程之后.当然,课上会谈到当前世界最快的计算机是中国的天河二,很是自豪.但这仅仅是一时的感觉.

从身边的事例谈超级计算机"快的"意义.

有一名研究人员,Dr. Christopher J. Woods (

http://www.chm.bris.ac.uk/pt/ajm/Site/Christopher.html

)作为分子生物学的研究人员,因为我所在学校超级计算机计算能力的问题,做模拟实验,从02年到14年,连续12年.如今终于获得足够强大计算能力,可以在较短的时间内分析出药品和病毒变种产生抗药性的原因.比如,可以在一周内分析出肆虐中国的H7N9变种为何对Tamiflu(达菲)产生抗药性,而传统的实验室工作则需要3-6个月时间.这就是时间和人命在赛跑.

如果说建立"足够快"超级计算机的意义,那就是起码拥有了化不可能为可能的这种选择权利.

超级计算机是排队系统,类似于老式的mainframe,提交任务,然后,按照优先级进行调度,所以,据本校老师说,正常利用率可以达到90%以上.所以,此项投资,比买分布式的工作站,引起大量的闲置资源更为划算.

根据我校超级计算机的使用率,正常情况下(非假期),是稳定保持在90%以上.

以下是来自于我校超级计算机管理员整理的数据:

注:AUG, SEPT可能因为放假,直接关机,OCT是刚开学.

但这个"足够快",并不代表一定要"最快"才够.

根据Solidot | 天河二号运营成本高利用率低今日的新闻,据说天河二的使用率才为34%.虽然说,可以关掉一部分计算节点来省电,但这部分的硬件投资是的的确确浪费了的.

做到了第一,自然好,就像当年的日本一样,各项都想做到世界第一,后来也确实不少做到了,确实对科技界和工业界有促进作用,但在商业上,未必是个很好的策略.

国内其实一边缺投入缺资源,另一边,也有大量的资源闲置.要充分的有效利用,仍然是个需要不少时间才能解决的问题.在这一点上,天河二同样不能避免,不能不说是一个遗憾.这就是广义的"软件"了,基础设施建设不易,但搭建一个有人参与,有序有效使用的生态圈,不得不说,这个难度远大于研发"天河二"本身.

结论:

我个人支持修建"天河二"来试错,来证明有能力修建最快的,但软件服务等一系列问题仍然需要在运行中来逐步改善和解决,毕竟,我国在这一块,才刚刚迈入门槛,不能苛责,但有必要让如此大规模的投入不要打水漂.这点需要广大从业人员的努力,更关键的,"不能老想搞个大新闻".

。。。到底是在钓鱼,还是(滑稽)?

前几天的还和天河二号的联系 的确存在着利用率不高的问题 给我们了不小的折扣 还送了不少机时

美国今年前几个月决定禁止将高性能处理器卖给中国,理由是中国政府会利用这些东西模拟核试验。也许这就是超算的意义吧。

上学期上操作系统课的时候,老师讲过这东西。大数据时代的需求,Amazon和Microsft都已经在做这事了,只不过思路不同。一种是建超级计算机,另外一种就是多台计算机集群,像google,amazon那种,两种都谈不上孰优孰劣。Amazon就提供出租主机,按时间出租收费,现在已经有很多新兴的公司不自己购买主机建服务器了,因为不划算,Amazon收费不贵而且又能省下很多现金,何乐而不为?关于超级计算机,第一,这东西不好造,散热、功耗、操作系统都是难题,并非简单的把多个CPU叠加;第二,回到实际意义上来,这东西非常有用,LHC一个对撞的分析,人类DNA的数据分析,数据量多的你无法想象,需要这种超级计算机的运算能力。所以超级计算机,绝大多数用于科研,国防领域,这些还不重要吗?事实上,如果你看一下科研项目资金的用处,其实很大一部分就是用于计算机这方面。

再说回来,全球最快的计算机,宣传意义更重一点吧,不过真的不用太得瑟了,又不是神马新的领域突破或者模式创新,过不了两年,就会有巴西啊,美国啊,更厉害的计算机出来。

【问底】OpenStack在天河二号的大规模部署实践-CSDN.NET我认为这东西的作用是升级下一代GFW

首先,巨型机的研制意义我觉得不必多说,老外的top500就说明了一切,绝不是排着玩的;

其次,巨型机的研制就是为了实际应用,别不信,有些应用你不用巨型机还真玩不转;

最后,天河巨型机本身毫无问题,业主买了不用才是问题所在,使用维护肯定是要有耗费的,

但是合理使用创造出的价值,绝对比使用成本大得多,越不用越浪费啊!

想知道,广州投了那么多钱在这项目上,是不是得公开某些科研项目。。。。。北京和上海都不投,就你广州有钱。。。。。

你家村口泥泞小路也能走,为什么要建柏油大道?

顿顿吃红薯你也饿不死,为什么要吃肉吃蔬菜?

意义是什么?

天河二号是计算资源,是基础设施。原本各行各业包括科研人员要想着优化计算速度,花费大量时间精力。现在几乎不用多花钱就可以省下来,拿去做什么不好?

这种问题大家见得多了可能也不奇怪了,不过一个知识点给大家可以复习一下:

所有外国的东西都是核心科技,

所有中国造出来了的都是过时的废物

什么鬼,2022年了给我推这个问题?

软件用国外的没什么问题,国内需求在慢慢起来,这个要时间。

抖个机灵

可以造the machine

首先超级计算机的操作系统不是和你家里的电脑一样的,是特别优化的,这个机器主要用于科学和解密文档,有点核弹的意思,再就是各个科学领域的大规模计算。

首先回答提问。其意义就是证明了我国有能力建设一个世界第一的HPC硬件系统。这很NB。

----------------------------------------分割线---------------------但

。前面的回答有几个说的很对。其实真正需要用HPC的机构,基本都会选择自己建。为什么?因为一个HPC系统不可能是单机系统。它必然是一个分布式系统。而这样的系统往往在架构方面有很多差别。再具体点说就是如果你要发挥它的最大潜力,你需要在系统软件和应用软件方面做出有针对性的设计。系统软件相对好说。应用软件基本必须要靠自己了。也就是说具体用户必须了解整个HPC系统的特点和优势。这样才能得到最好的效果。所以自建基本是常态。因为你要搞一帮人在上面针对你的应用做软件。而这个周期可能不会比硬件建设周期短。。所以不要认为HPC和PC就差一个字母就觉得这个东西拿来插上电源就能用。就像ORNL和LLNL他们都养着一帮牛人。ORNL的人还相对好一些。每次和LLNL的人打交道都是很头痛的经历。因为他们对你的东西比你自己还清楚。而这样的人就是爬在自己的系统上每天修修补补。所以即使在国外,一个HPC系统也不是很容易得到的资源。就天河二来说,能造固然好,可是能真正用起来才是真的好。

1.欢迎讨论;

2.讨论请别包含意识形态;

3.太具体的东西就别说了,我还得在这个圈混。

我是这么理解的,中国的产业界具备把成熟技术和产能在经济价值上的潜力榨得干干的能力(这没什么不好的),但国家不能等到产业界把这个榨干过程完成后再向前走,所以我们需要做很多经济上不划算的事情,很多年以后我们会发现这是值得的,就这样。

核心硬件是intel,设计硬件的,肯定有最大发挥的软体,可能自身有更顶级的产品不卖。

关于超算的意义,美国的几个例子可供参考:

asci计划:

Advanced Simulation and Computing Program

HPCMP: http://en.wikipedia.org/wiki/HPCMP

SciDAC:

SciDAC - DOEs Scientific Discovery through Advanced Computing

去做Domestic Scale Regular Expression Matching吧。

如果单纯从资金维护和利益权衡上看这件事,超级计算机确实没有太多的用途。但不能因为它花了很多钱,对我们现实的用途又不大我们就抛弃它,那是典型的目光短浅。简单的来说,超级计算机技术并不仅仅体现在它能算得有多快,还体现在很多方面。一个简单的例子,超级计算机中运用几百几十万枚处理单元,怎么样协调它们工作获得效率,这就是一种进步。可以肯定的说,在利用较少的处理器获得同样的运算速度上,中国的水平一种比其他国家高出许多,甚至接近其他国家2倍的水平。

科学研究必然是要有投入的,不要仅仅因为现在投入了多少就否定一个项目。就像航天科技,当初我们研究的时候有想过对今天的通信,气象,定位等那么多的服务有作用吗?研究超级计算机的过程中,它的许多技术都被用于各种产业上,例如云计算的时代,多机器的协同就类似对cpu的协同,对我们的物流分配,服务器优化都有影响。

经费好歹要花掉

书到用时方恨少!一楼的也是醉了!业内人士?

说不知道,不明白的,肯定不在超算的圈子里。说自己知道,自己明白的,不一定就是这圈子里的人。国家发现项目的意图不需要让全地球人知道,即使是很多人认为最最开放的美国,也是一样。钱少当然要发展最关键项目,关系到国家存亡的事情没人敢开玩笑。像超算这样的东西还分公开和非公开的,为啥都要向LZ汇报?

研发意义无外呼科研意义和推动其他学科发展意义!前者大于后者,但不够经济实惠

美国人拿来干什么呢?估计也差不多,说计算能力,现在已经足够了吧,广州买这个不是政绩,是政治任务。

You are being watched. The government has a secret system, a machine that spies on you every hour of every day.

楼上的唐望是高级黑吗?果然高人!

非实际应用项目推动的计算排名没任何意义,天朝太多这样为了跑分而攒起来的东西。我很反对国家花钱建这些东西,这样的设备又不是基础理论研究,应该由具体项目推动,需求推动技术进步。做出来的东西才是有实际用途,这个钱才不白花。估计这个东西也就跑跑分,给研发者带来一些头衔,然后束之高阁。

砌墙

我知道这是没几个人会支持的气话,但我更不喜欢没人说这句话。

空谈误国,实干兴邦。

-------------------------------

与其这投入的十几亿和每年的几亿维护费用花在超算上,总好过省下来被官员给吃了吧?

做了被骂很正常,屁股决定立场,官员也不一定会考虑什么实际意义。

真正核心的架构还是花钱买的国外的东西- -被骂也很正常。

实在不行拿来挖矿应该也能捞不少电费回来吧。。。估计一天不到就能挖完去

用于彰显大国实力。天河二号和小米两者很相似,都靠着硬件堆出来所谓的“跑分高”,但是实际运算能力不行,原因在于软件。软件方面是中国超算方面的软肋,有着强大的机器没办法高效率应用。

在国内有些科研院所用的着超算。超算可以用来模拟核爆炸,模拟发动机整机运行。。。

从技术角度看,为什么不采用云方式,部署多台计算机的能力,而是用单台多核比较费解。追求单台的性能会优于多台的联机工作么?粗浅的看来,可扩展性就很差。而且很多都是国外的芯片,为什么不用国产的?