计算化学购机配置推荐

计算化学购机配置推荐

文/Sobereva @北京科音

First release: 2018-Oct-8  Last update: 2022-Jul-3


0 重要前言

经常有人问买机子做计算化学计算该用什么配置,这要根据预算、主要用的程序、主要做的任务类型、算的体系大小、对购买渠道有无限制等很多因素综合考虑。这里,笔者根据不同预算档次,给出相应预算下目前天朝能买到的性价比最的配置。这些配置对常规的量子化学、第一性原理计算都是非常适合的。而对于分子动力学,由于可以利用GPU加速达到比起用纯CPU的机子好几倍的性价比,故在文末单独给出了配置。

本文是给那些把经费当自己的钱看待、有节约意识,而且水平不是弱到连个操作系统都不会装的读者。而那些经费极度充裕(然而通常都是来自纳税人的血汗钱)、不仇视奸商、就算可能明知道被坑一倍的钱也不心疼的人就别看此文了,我对这些人彻底放弃治疗,这些人就去买那些看似是大品牌(记住除非是那种有制造、定制硬件能力的厂家,否则和淘宝上的组装的服务器没丝毫差别)、有所谓的上门售后(大多数品牌的技术服务其实很坑爹,未必能达到计算化学同行平均技术水平)、性价比通常也就是本文推荐的机子的一半甚至1/3的而且性能可能特别鸡肋的机子好了。

文中的这些服务器配置在淘宝(不是京东)上的很多卖服务器的商家处都可以买到。如果商家的动态评分都比,比如都是4.9或有个别4.8的,总出货量也(比如好几个钻或者有皇冠),卖家的评价也都没什么问题,并且通过淘宝旺旺与之沟通也比顺畅,那么这样的商家就是靠谱的,给出的机子的稳定性以及售后都不会有问题。这些商家都可以根据你的需要对配置进行灵活定制。他们不一定恰好能给出和文中一模一样的配置,但只要相仿佛即可。如果为了避嫌不方便以淘宝方式交易,也可以直接联系那些店家以其它方式交易,他们大多都有实体店,一般只要补上税点也都能开发票,直接淘宝旺旺咨询便知。强调一点,淘宝上这些服务器卖家大多都是正经公司性质的,我发现有人求助配置时居然以为他们自己去社会上找的一些服务器公司才是公司,真是糊涂。顶多也就是有的淘宝上的卖家不给上门服务,有问题需要把整机寄回去,维修服务自行咨询卖家便知。

由于配件、价格经常会有变动,新硬件也不断推出,所以本文也会时不时更新,注意看本文开头的最后更新日期,可能几个月或者半年更新一次。文中推荐的配置都是最后更新时最性价比配置,报价也都是最后更新时候的报价。大家没必要去给个配置单问我或其他人价格是否合理,淘宝上的服务器价格都很透明,自己去淘宝上查当下每种散件的价格,自行向加就知道卖家给的整机价格是否靠谱、有多少水分。

笔者强烈建议在阅读本文的同时阅读《淘宝店购买双路2696v3服务器的过程、使用感受和杂谈》(http://bbs.keinsci.com/thread-6310-1-1.html)了解一些关于购买服务器的基本知识,这也可以同时令你充分认识到只要商家选对了,从淘宝商家处购买服务器是100%可靠的。笔者很久很久之前还写过一篇《单路计算化学攒机配置推荐》(http://sobereva.com/243),里面做了不少硬件方面的讨论,但现在来看里面的配置已经过时了,但有兴趣的话仍可以看看。http://sobereva.com/datasheet.rar是笔者从2002年开始就一直维护至今一个硬件资料库,里面可以查到各种文中涉及的CPU和GPU型号。当你被型号搞糊涂的时候,查一下这个表格立刻就清楚了。

注意现在社会上的卖服务器的奸商奇多(不是指淘宝商家),猖獗至极!!!笔者在网上答疑时,经常看到有人贴出市面上商家给他的配置和报价,配置不仅很不合理,好多地方严重瞎糟蹋钱,而且本来性能也就值不到2万的机子,居然能报到5万左右;好点的配置,本来也就3万就能拿下来,愣是报7、8万乃至10万!注意这绝对不是小概率事件,而是极大概率事件!笔者见过太多太多了!如果你对配置、行情一点都不懂就到社会上去找服务器商家购买,9成几率血亏花大价钱就买了个很垃圾的服务器,扔了也不是,用着又慢,简直添堵。每次在答疑时看见奸商利用信息不对称,给硬件小白列的这种配置和报价我就很火大。如果你对计算机配置方面一无所知,除了看上述文章外,吐血建议阅读计算化学公社论坛的“硬件配置与采购板块”的帖子:http://bbs.keinsci.com/forum-61-1.html。花个一两个小时的时间看看,很快就能对行情、配置选择心里有数,碰见不靠谱的配置和报价很容易就能识破(但也不是说那个板块里所有人的发言都是很正确、合理的,不过凡是有严重不合理的言论出现,基本上都会有真正懂行的人斧正)。

PS:我发现计算化学圈里居然有公司把我本文的配置(或度类似的配置)大幅加价向计算化学工作者兜售,或者价格和本文差不多的情况下把CPU换成工程版来谋取暴利,笔者表示强烈鄙视!大家应当仔细看本文,弄清楚什么配置到底应该卖多少钱,别上黑心公司的当!

以下推荐的服务器配置里没包含显示器,要显示器的话就用推荐的PC机配置的显示器即可。由于不做GPU加速的时候显卡对计算性能没有丝毫影响,因此除了最后推荐的基于GPU加速的做动力学的配置外,用的显卡都是最低端的,因此可见用的要么是CPU集显或主板集显,要么用淘宝上的二手亮机卡(即远古时期的PCI-E显卡)。对于观看计算化学研究牵扯的3D模型,CPU集显和亮机卡的3D加速性能就已经够了。本文推荐的配置都没有包含固态硬盘,因为对于绝大部分类型的计算,硬盘速度不会明显影响计算速度,但牵扯到大量读写硬盘的任务用速固态硬盘则很有好处,如果你需要的话可以加一块,关于这点务必阅读《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397)。本文推荐的配置用的CPU,若无特殊说明,都是正式版CPU。虽然用工程版CPU便宜得多得多,但在稳定性和兼容性上会有一定风险,看RP,因此本文不考虑,但如果想省钱且不怕折腾的话则可以考虑用正显版。

有个别读者担心本文里某些配置用的CPU是二手什么的,这种担心完全是多余、毫无意义的!只有小白才担心这个。CPU又不是消耗品,不管是全新还是二手,只要能点亮机子就完全一样,使用上绝对没有丝毫差别(除非是商家拆机时不慎把CPU底部的电容给磕掉了,或者把触点弄伤了,那种情况肉眼能直接看得出来,可以让商家先给你拍个照片)。CPU只需要区分正式版和工程版,这有本质差异,而本文推荐的配置没有一个是用工程版的。同理,内存也不用管是新品还是二手的。至于文中的其它配件(亮机卡除外),价格都是全新品的价格。

有人问怎么我推荐的服务器的配置里的CPU那么便宜,而很多服务器公司给的配置单里差不多核数、频率的CPU报的价格是我文中的N倍。这是因为我文中用的Intel的CPU很多不是Intel ARK上能查到的明面上的型号。2696 v3、8173M、8375C之类特殊渠道流出来的OEM的CPU是在大陆等很少数地区的人能才能享受到的bug级福利,这些正式版的OEM CPU的体质、兼容性和明面上的型号没有任何差异,没有丝毫风险。显然,对于买自己用的机子,不选这些U而多花几倍的钱买同样性能的明面上的型号简直是傻子。

下面的配置越往后价格越,相应地性能也越好,应根据预算和实际需要来选择。影响计算速度最有决定性因素的是CPU的“频率*核数”(当然还有很多其它因素,如CPU架构、程序支持的指令集、并行效率等),因此可以看到随着配置价格的提升,大趋势是“频率*核数”逐渐增加的。

本文中给出的配置对于量子化学计算(如主流的Gaussian、ORCA等)以及第一性原理计算(如主流的CP2K、Quantum ESPRESSO等)都是完全适合的。如果你是做分子动力学的且计算程序支持GPU加速,一定要用GPU加速,远远比用CPU计算划算得多,在本文靠后部分专门说了。


1 可用于简单计算的PC机推荐配置

这个配置做一些小体系(几十个原子)非精度计算,或者就当做普通PC使用,都是适合的。如果需要时不时做一些耗内存大的后HF计算,可以把内存升到2*16 GB。注意这里硬盘的型号,这里用的这款东芝的硬盘是CMR(传统磁记录)的,东芝还有款更便宜的2TB 7200rpm是SMR(瓦叠盘)的版本,用后者储存数据比危险。

CPU:i5 11400(六核2.6G,盒装,集显)
主板:微星H510M BOMBER
CPU+主板套装价1510
散热器:酷冷至尊T400i  80
硬盘:东芝 2TB 64MB 7200rpm (HDWD120) 410
内存:2*8GB套条 金士顿骇客神条DDR4-3200 400
电源:振华铜皇450W(额定450W)270
机箱:任意 200
键盘鼠标:罗技MK200 多媒体套装 80
显示器:优派最便宜的 700
总价:约3600

目前强烈不建议用12代Intel CPU,那是面向游戏、桌面应用等领域的,性能核+能效核的混合设计并不怎么适合做计算,用那个还得顾虑计算任务在两种核上调度这种破事。

以下是基于AMD CPU的方案,价格比上面的贵一丁点而性能几分之一,性价比更。用AMD的CPU的潜在不足见后文。

CPU:AMD Ryzen 7 3700X(八核3.6G,盒装带散热器,无集显)
主板:微星B450M PRO-VDH MAX
CPU+主板套装价2000
显卡:淘宝/闲鱼上二手PCI-E亮机卡 30(若必须买新显卡,可以用市售最便宜的诸如小影霸GT610之类的,不到200块钱)
散热器:CPU自带
其它同上
总价:约4100


2 普通双路服务器推荐配置

这个机子的性能已经算挺不错了,性价比超,远强于上面的配置。这样的机子使用Gaussian用DFT方法结合像样的基组算200个原子以内的体系已经无压力了。由于XEON v3系列的CPU已经退出历史舞台了,因此价格非常便宜。这里配了固态硬盘,用于加速需要大量频繁读写硬盘的后HF任务,此硬盘建议仅作为存放临时文件使用。如果你以做DFT为主,由于读写硬盘量相对少,固态硬盘可以去掉。更多讨论参看《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397)。由于此配置的主板老,不自带M.2口,而PM981A固态硬盘是M.2口的,所以需要淘宝上花二三十块钱买个M.2口到PCI-E口的转换卡。

注意有些别有用心的商家会贬损说v3 CPU已经很过时了,让你换别的。绝对别听他们说的,他们的目的通常只是想让你换个对于他们而言利润更的CPU而已,然而对于你而言性价比则低得多得多得多。

CPU:2* XEON E5-2696 v3(18核2.3G,散,无集显)2*770
散热器:2*利民AS120 130*2
主板:超微 X10DRL-I(C612芯片组,集显) 1600
机械硬盘:希捷 企业级 银河Exos 4TB 256MB 7200rpm SATA3 (ST4000NM000A) 1070
固态硬盘:三星PM981a 1TB + M.2到PCI-E转换卡 650
内存:8* 三星DDR4-2400 ECC REG 16GB  8*220
电源:振华LEADEX HG 650W 670
机箱:追风者614PC 570
键盘鼠标:罗技MK200 多媒体套装  80
总价:约8200


3 基于AMD的单路服务器推荐配置

这个配置的价格和性能和上面2*2696 v3的机子差不多(由于核数更少,所以内存减半),好处是更省电,对于并行效率比低的程序性能更好些,想用的话也可以用。此机子的潜在缺点是对软件的兼容性可能个别情况下没有用Intel的CPU那么好,例如此帖http://bbs.keinsci.com/forum.php?mod=redirect&goto=findpost&ptid=15119&pid=109880&fromuid=1。用Intel的CPU比省心,所有计算程序对Intel CPU的兼容都是最完美的,而且Intel有自家的编译器和数学库,其编译器还有专门为自家的CPU优化的选项,这都是AMD不能及的优势。目前绝大多数超算中心用的也都是Intel的CPU。

值得一提的是5950X最多只能上128GB内存,所以不要指望用更多内存,毕竟不是服务器CPU。固态用的PM9A1是PCI-E 4.0 M.2口,当前的CPU+主板支持,速度明显超过PM981a。

CPU:AMD Ryzen 9 5950X(16核,3.4~4.9G,散装,无集显)
主板:华硕TUF B550M-PLUS 重炮手
CPU、主板套装价约4400
散热器:九州风神大霜塔 220
机械硬盘:希捷 企业级 银河Exos 4TB 256MB 7200rpm SATA3 (ST4000NM000A) 1070
固态硬盘:三星PM9A1 1TB 770
显卡:淘宝或闲鱼上二手PCI-E亮机卡 30
内存:2*金士顿DDR4-3200 32GB 2*830
电源:振华铜皇450W(额定450W)270
机箱:任意 200
键盘鼠标:罗技MK200 多媒体套装  80
总价:约8700


4 较好双路服务器推荐配置

这个配置的性能已经很好了。这个CPU比特殊,所以不能用超微的板子,而需要用永擎的。这个CPU每个有6个内存通道,因此插12条内存才能把内存通道全都利用上,以使得所有核满载的时候性能总是不会受到明显内存带宽的制约。

CPU:2* XEON Platinum 8175M正式版(24核2.5G,全核睿频到3.1G,散,无集显)2*3500
散热器:2* 金钱豹LGA3647 散热器  2*210
主板:永擎EP2C621D12 WS(C621芯片组,集显) 3800
机械硬盘:希捷 企业级 银河Exos 4TB 256MB 7200rpm SATA3 (ST4000NM000A) 1070
固态硬盘:三星PM981a 2TB 1400
内存:12* 三星DDR4-2666 ECC REG 16GB  12*300
电源:振华LEADEX HG 750W 840  
机箱:追风者614PC 570
键盘鼠标:罗技MK200 多媒体套装  80
总价:约18700


5 顶级双路服务器推荐配置

这个机子的性能在目前来说是绝对顶级的。这个CPU每个有8个内存通道,因此插16条内存才能把内存通道全都利用上,以使得所有核满载的时候性能总是不会受到明显内存带宽的制约。

CPU:2* XEON Platinum 8375C正式版(32核2.9G,全核睿频到3.5G,散,无集显)2*7400
散热器:2*金钱豹LGA4189 5热管双风扇散热器  2*310
主板:超微X12DAI-N6(C621A芯片组,集显) 4800
机械硬盘:希捷 企业级 银河Exos 4TB 256MB 7200rpm SATA3 (ST4000NM000A) 1070
固态硬盘:三星PM9A1 2TB 1650
内存:16*三星DDR4-3200 ECC REG 16GB  16*450
电源:海韵FOCUS GX1000 额定1000W  1400
机箱:追风者614PC 550
键盘鼠标:罗技MK200 多媒体套装  80
总价:约32200

以上配置是256 GB内存的,平均每个核4 GB,一般足够用。但如果你要跑一些耗内存非常的任务,比如ORCA跑DLPNO-CCSD(T)和DLPNO-STEOM-CCSD,对于大体系、大基组的话需要降低并行核数来让每个核有足够内存,像这种情况可以考虑16*32 GB=512 GB内存。固态硬盘用了大的2 TB,因为做一些大型后HF计算耗硬盘非常厉害,1T都往往不够。但如果你只是做做普通DFT泛函的计算、TDDFT计算,固态也可以不用。

8375C也有工程版(ES版),价格只有上面用的正式版的一半左右,这有一定风险,比如不稳定、做某些计算时出现奇怪问题等。还有比ES版更贵而稳妥度也更的正显版。这些如果你为了省钱不怕折腾可以试试,我在这里就不推荐了。

有人可能想用AMD顶级单路CPU线程撕裂者做计算,实际上其性价比相对于特殊渠道的Intel CPU来说低,而且不能组双路,主板还特别贵,因此本文不予推荐。(有人老拿线程撕裂者跟Intel官方的https://ark.intel.com页面上能查到的型号对比性价比,由此鼓吹AMD的U做计算多划算,这是极具误导性的)


6 超土豪双路服务器配置

如果你完全不在乎花多少钱的话,就是想要个最快的,可以用双路AMD的EPYC 7742,单颗64核128线程、8个内存通道,双路一共128核256线程、16个内存通道。用正式版的EPYC 7742并且内存插16条32GB=512GB的话(平均每个核4G,不算浪费),5万块钱左右,基础配置可以参考https://item.taobao.com/item.htm?spm=a1z10.5-c.w4002-8633537290.13.3fc9217b2N6cd5&id=605430666705。速度测试见http://bbs.keinsci.com/thread-19256-1-1.html。按照文中的说法,对于Gaussian的话,利用所有核心跑单个任务比8175M也就快百分之几十,在我来看完全不值得。但是如果同时跑很多个任务来让CPU计算能力最大化的话,这配置的总算力是2*8175M的2.5倍。值不值得花这个钱就根据自己的经济状况和要算的任务决定了。


7 GPU加速做分子动力学的推荐配置

如果你用GROMACS、AMBER(其中的PMEMD程序)、NAMD、Lammps、Desmond等支持GPU加速的分子动力学程序,做计算一定要用GPU加速,只需用一个中档的GPU就能达到极好的双路服务器的速度,因此性价比远远于纯用CPU来跑。分为以下几种情况:

(1) 预算有限:在“可用于简单计算的PC机推荐配置”的AMD配置基础上增加一块RTX3070(想省点钱可以用3060Ti,但不能再低了)。此时电源建议改为振华冰山金蝶550战斗版(额定550W)。

(2) 预算一般:在“基于AMD的单路服务器推荐配置”上增加一块RTX3080或顶级的RTX3080Ti,此时电源改用振华LEADEX HG 650W,CPU可降到5900X。做经典力场的分子动力学对内存需求量远低于做量子化学计算和第一性原理计算,因此可以在内存容量上缩水来节约费用,内存可降为2条16GB。可去掉固态硬盘。

(3) 预算极多:在“较好双路服务器推荐配置”上加两块RTX3080Ti,CPU降到明显更便宜的8124M(18核,3.0G),内存降为12条8GB。电源改用海韵旗舰金PRIME GX1300,是1300W,1900元。可去掉固态硬盘。

注:以上主要是针对GPU加速跑GROMACS的情况。如果是跑AMBER,对CPU要求比GROMACS低不少,因此GPU加速时可以用明显更便宜的CPU。预算一般的情况在“可用于简单计算的PC机推荐配置”基础上加一块RTX3080或3080Ti即可,预算很多的情况在“普通双路服务器推荐配置”上加两块RTX3080Ti即可(但此时主板需要改为有两个PCI-E 3.0 16x的X10DAL-i,而X10DRL-i只有一个这种接口)。相应地需要提升电源,而内存可以缩水,固态可以去掉。

买GPU可以选映众、索泰、影驰之类的牌子,性价比不错,质量也靠谱。

绝对不要买好几万的Tesla产品跑分子动力学,血亏,也不要用Titan系列产品,很不值。因为绝大多数分子动力学程序做GPU加速关键看的是GPU的单精度浮点运算性能,面向游戏用的GeForce系列显卡在这方面性价比是最的,其中最端产品的GPU加速性能和最端的Tesla产品是相仿佛的。绝对不要因为一些卖服务器的人一听说你要做GPU加速就给你推荐Tesla然后你就买了。

RTX3090完全没必要考虑,跑动力学性能仅比3080Ti强一丝,价格却远于与之,故没有丝毫性价比。这卡主要卖点是显存达24GB,但这对于加速经典力场的分子动力学完全用不着,白浪费。

不建议考虑AMD的显卡,因为支持AMD显卡做GPU加速的动力学程序少。而且虽然GROMACS等程序也支持AMD显卡上GPU加速,但是在功能上有限制,不建议折腾。

做分子动力学不需要配固态硬盘,因为分子动力学过程中硬盘读写量很小,故硬盘读写速度不会影响到跑动力学的速度。


附:买服务器划算还是租超算划算?

现在很多人都在用超算跑计算任务。据我所知(这里说的是2019年中旬的情况)主流超算中心的价格平均是1毛钱1核时(即一个核跑一个小时)。看起来很便宜,但相对于自己买服务器真的划算么?下面来算笔帐。本文2019年5月底更新的报价中,2*XEON E5-2696 v3的双路服务器是15600元,36核。如果把这个钱全用来租超算,就是15600*10=156000核时。如果用这个服务器来跑,就相当于跑156000/36=4333小时,折合180天。也就是说,你买这个服务器,只要满载跑超过半年,用超算的价格来衡量的话你就相当于回本了,显然对于专门长期做计算的人来说,自己买服务器划算得多。虽然也有人说自己跑还要出电费,但价格一点也不夸张。比如在北京城区,目前商业用电按照平段时间来算是0.87元每千瓦时,笔者实测这种配置CPU满载时整机功耗是455瓦,因此每天电费是0.87*0.455*24=9.5元,因此跑180天是1710元,只是买机子的钱的零头而已。用自己的服务器比用超算有很多优点,比如(1)安装软件方便、自由 (2)提交任务省事,不用排队 (3)上传、下载大文件速度比通过互联网快得多。虽然有人说自己买服务器得装系统、配置、编译什么的,需要一定技术才能搞定,但实际上这点技术根本就没啥复杂的,绝对不可能难倒任何一个以后在计算化学领域能稍有作为的研究者,碰到什么问题多Google、鼓捣鼓捣很容易就能解决,这都搞不定的话干脆别搞计算化学了。

不过如果你短期内需要大量的计算资源,超算倒是可以充分满足你的需求,这是用超算的主要一个好处。

PS:顺带一提,笔者强烈鄙视某些倒处偷偷摸摸发垃圾广告兜售超算资源的单位,甚至有的提供超算资源的单位还向购买机时者发红包返现,导致纳税人的钱流入私人口袋,真是非常恶劣的行为!希望读者不要从这些单位购买机时!