计算化学购机配置推荐

计算化学购机配置推荐

Recommendation on purchasing computers for computational chemistry

文/Sobereva @北京科音

Last update: 2024-Mar-6


1 重要前言

经常有人问买机子做计算化学计算该用什么配置,这要根据预算、主要用的程序、主要做的任务类型、算的体系大小、对购买渠道有无限制等很多因素综合考虑。这里,笔者根据不同预算档次,给出相应预算下目前天朝能买到的性价比最的配置。这些配置对常规的量子化学、第一性原理计算都是非常适合的。而对于分子动力学,由于可以利用GPU加速达到比起用纯CPU的机子好几倍的性价比,故在文末单独给出了配置。

本文是给那些把经费当自己的钱看待、有节约意识,而且水平不是弱到连个操作系统都不会装的读者。而那些经费极度充裕(然而通常都是来自纳税人的血汗钱)、不仇视奸商、就算可能明知道被坑一倍的钱也不心疼的人就别看此文了,我对这些人彻底放弃治疗,这些人就去买那些看似是大品牌(记住除非是那种有制造、定制硬件能力的厂家,否则和淘宝上的组装的服务器没丝毫差别)、有所谓的上门售后(大多数品牌的技术服务其实很坑爹,未必能达到计算化学同行平均技术水平)、性价比通常也就是本文推荐的机子的一半甚至1/3的而且性能可能特别鸡肋的机子好了。

文中的这些服务器配置在淘宝(不是京东)上的很多卖服务器的商家处都可以买到。如果商家的动态评分都比,比如都是4.9或有个别4.8的,总出货量也(比如好几个钻或者有皇冠),卖家的评价也都没什么问题,并且通过淘宝旺旺与之沟通也比顺畅,那么这样的商家就是靠谱的,给出的机子的稳定性以及售后都不会有问题。这些商家都可以根据你的需要对配置进行灵活定制。他们不一定恰好能给出和文中一模一样的配置,但只要相仿佛即可。如果为了避嫌不方便以淘宝方式交易,也可以直接联系那些店家以其它方式交易,他们大多都有实体店,一般只要补上税点也都能开发票,直接淘宝旺旺咨询便知。强调一点,淘宝上这些服务器卖家大多都是正经公司性质的,我发现有人求助配置时居然以为他们自己去社会上找的一些服务器公司才是公司,真是糊涂。顶多也就是有的淘宝上的卖家不给上门服务,有问题需要把整机寄回去,维修服务自行咨询卖家便知。

由于配件、价格经常会有变动,新硬件也不断推出,所以本文也会时不时更新,注意看本文开头的最后更新日期,可能几个月或者半年更新一次。文中推荐的配置都是最后更新时最性价比配置,报价也都是最后更新时候的报价。大家没必要去给个配置单问我或其他人价格是否合理,淘宝上的服务器价格都很透明,自己去淘宝上查当下每种散件的价格,自行向加就知道卖家给的整机价格是否靠谱、有多少水分。

笔者强烈建议在阅读本文的同时阅读《淘宝上购买的双路EPYC 7R32 96核服务器的使用感受和杂谈》(http://sobereva.com/653)和《淘宝店购买双路2696v3服务器的过程、使用感受和杂谈》(http://bbs.keinsci.com/thread-6310-1-1.html)了解一些关于购买服务器的基本知识,这也可以同时令你充分认识到只要商家选对了,从淘宝商家处购买服务器是100%可靠的。笔者很久很久之前还写过一篇《单路计算化学攒机配置推荐》(http://sobereva.com/243),里面做了不少硬件方面的讨论,但现在来看里面的配置已经过时了,但有兴趣的话仍可以看看。http://sobereva.com/datasheet.rar是笔者从2002年开始就一直维护至今一个硬件资料库,里面可以查到各种文中涉及的CPU和GPU型号。当你被型号搞糊涂的时候,查一下这个表格立刻就清楚了。

注意现在社会上的卖服务器的奸商奇多(不是指淘宝商家),猖獗至极!!!笔者在网上答疑时,经常看到有人贴出市面上商家给他的配置和报价,配置不仅很不合理,好多地方严重瞎糟蹋钱,而且本来性能也就值不到2万的机子,居然能报到5万左右;好点的配置,本来也就3万就能拿下来,愣是报7、8万乃至10万甚至十几万!注意这绝对不是小概率事件,而是极大概率事件!笔者见过太多太多了!如果你对配置、行情一点都不懂就到社会上去找服务器商家购买,9成几率血亏花大价钱就买了个很垃圾的服务器,扔了也不是,用着又慢,简直添堵。每次在答疑时看见奸商利用信息不对称,给硬件小白列的这种配置和报价我就很火大。如果你对计算机配置方面一无所知,除了看上述文章外,吐血建议阅读计算化学公社论坛的“硬件配置与采购板块”的帖子:http://bbs.keinsci.com/forum-61-1.html。花个一两个小时的时间看看,很快就能对行情、配置选择心里有数,碰见不靠谱的配置和报价很容易就能识破(但也不是说那个板块里所有人的发言都是很正确、合理的,不过凡是有严重不合理的言论出现,基本上都会有真正懂行的人斧正)。

PS:我发现计算化学圈里居然有公司把我本文的配置(或度类似的配置)大幅加价向计算化学工作者兜售,或者价格和本文差不多的情况下把CPU换成工程版来谋取暴利,笔者表示强烈鄙视!大家应当仔细看本文,弄清楚什么配置到底应该卖多少钱,别上黑心公司的当!

以下推荐的配置里没包含显示器,要显示器的话就花六百块钱左右买个最低端的即可,也可以闲鱼上一二百块钱买个二手的。由于不做GPU加速的时候显卡对计算性能没有丝毫影响,因此除了最后推荐的基于GPU加速的做动力学的配置外,用的显卡都是最低端的,因此可见用的要么是CPU集显或主板集显,要么用闲鱼上的二手亮机卡(即远古时期的PCI-E显卡)。对于观看计算化学研究涉及的3D模型,CPU集显和亮机卡的3D加速性能就已经够了。本文推荐的配置用的CPU,若无特殊说明,都是正式版CPU。虽然用工程版CPU便宜得多得多,但在稳定性和兼容性上会有一定风险,看RP,因此本文不考虑,但如果想省钱且不怕折腾的话则可以考虑用正显版。

有个别读者担心本文里某些配置用的CPU是二手什么的,这种担心完全是多余、毫无意义的!只有小白才担心这个。CPU又不是消耗品,不管是全新还是二手,只要能点亮机子就完全一样,使用上绝对没有丝毫差别(除非是商家拆机时不慎把CPU底部的电容给磕掉了,或者把触点弄伤了,那种情况肉眼能直接看得出来,可以让商家先给你拍个照片)。CPU只需要区分正式版和工程版,这有本质差异,而本文推荐的配置没有一个是用工程版的。同理,内存也不用管是新品还是二手的。至于文中的其它配件(亮机卡除外),价格都是全新品的价格。

有人问怎么我推荐的服务器的配置里的CPU那么便宜,而很多“大品牌”服务器公司给的配置单里差不多核数、频率的CPU报的价格是我文中的N倍。这是因为我文中用的Intel的CPU很多不是Intel ARK上能查到的明面上的型号。2696 v3、8173M、8375C、7R32之类特殊渠道流出来的OEM的CPU是在大陆等很少数地区的人能才能享受到的bug级福利,这些正式版的OEM CPU的体质、兼容性和明面上的型号没有任何差异,没有丝毫风险。显然,对于买自己用的机子,不选这些U而多花几倍的钱买同样性能的明面上的型号简直是傻子。

下文给出的CPU计算的配置越往后价格越,相应地性能也越好,应根据预算和实际需要来选择。影响计算速度最有决定性因素的是CPU的“频率*核数”(当然还有很多其它因素,如CPU架构、程序支持的指令集、并行效率等),因此可以看到随着配置价格的提升,大趋势是“频率*核数”逐渐增加的。

本文中给出的配置对于量子化学计算(如主流的Gaussian、ORCA等)以及第一性原理计算(如主流的CP2K、Quantum ESPRESSO等)都是完全适合的。如果你是做分子动力学的且计算程序支持GPU加速,一定要用GPU加速,远远比用CPU计算划算得多,在本文靠后部分专门说了。

本文推荐的硬件都是大概率在市面上有货的。如果供货商说没货,有可能是真碰巧没货,也可能是碰见奸商了,凡是油水少的配置都说成没货,然后推荐你买个性价比低、对他们油水大的。对后一种“假没货”的情况大家要谨慎识别,多在淘宝上问几家店,千万别只听信一家的说辞。如果问了好几家(且都不坑爹)的店,都说没货,而且你在淘宝上问专门卖相应产品散件的卖家也都说没货,那大概率就是暂时市场上真没货了。硬件什么时候有货什么时候没货这谁也说不准,都是一阵一阵的,如果确实期都铁定没货的产品在本文里肯定不会推荐。真没货时大家可以自主更换相近的配置,比如博文里推荐让你用RTX3070Ti或者RTX3080Ti,都赶上没货,那你可以用比前者更好点或者比后者更次一点的RTX3080。当商家因为没货推荐你改用其它配置时,一定要带着脑子自己想想商家推荐的到底有没有道理、性价比靠不靠谱,要多用Google调查调查、用淘宝自行查看相应硬件当下普遍的价格,明显是没道理的瞎推荐千万别中圈套。

关于电源,我强烈建议用海韵或者振华,在电源领域这二者都是顶级牌子,都可以很放心购买,本文里用的也都是它们的相应功率下性价比最高的产品。强烈不建议用长城、鑫谷、航嘉等大陆本土牌子的电源,它们的价格比海韵和振华便宜得多(特别是大功率的型号,相差好几百),而整体素质有很大差距。电源是最容易出毛病的部件之一,在电源上省钱买次牌子的产品是绝对得不偿失的。


2 白菜价双路服务器推荐配置

这样的机子在Gaussian、ORCA里用DFT方法结合像样的基组算200个原子以内的体系已经无压力了,用CP2K结合纯泛函跑几百个原子体系都很容易。由于XEON v3系列的CPU已经退出历史舞台了,因此价格非常便宜,真是白菜价。

这里配了固态硬盘,用于加速需要大量频繁读写硬盘的后HF任务,此硬盘建议仅作为存放临时文件使用。如果你以做DFT为主,由于读写硬盘量相对少,固态硬盘可以去掉,更多讨论参看《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397),后同。由于此配置的主板老,不自带M.2口,而PM981a固态硬盘是M.2口的,所以需要淘宝上花二三十块钱买个M.2口到PCI-E口的转换卡。

CPU:2* Intel XEON E5-2696 v3(单颗18核36线程,2.3G,无集显)2*230
散热器:2*利民AS120 130*2
主板:超微 X10DRL-I(C612芯片组,集显) 1200(拆机价)
机械硬盘:希捷 银河企业级 7E10 4TB 256MB 7200rpm SATA3 (ST4000NM000B)  960
固态硬盘:三星PM981a 1TB + M.2到PCI-E转换卡 450
内存:8* 三星/镁光DDR4-2400 ECC REG 16GB  8*150
电源:先马黑钻750W  550
机箱:先马黑洞5(支持E-ATX)  400
键盘鼠标:罗技MK200 多媒体套装  80
总价:约5500


3 较好AMD单路服务器推荐配置

此机子峰值性能比2*2696 v3更强,而且单核性能比2696v3强得多,对于并行效率低的任务或程序用此机子快得多(例如跑GFN-xTB)。此机子是单路,比双路机子更省电、占地方更小。这机子只有64GB内存,是因为本身核数就不多,平均每个核有4 GB也不小了。还有人问主板是四个内存槽为什么不插满、会不会因此损失性能,这是完全多余的担心,因为CPU本来就是双通道的,插四条没意义,而且插四条时内存频率还上不去反倒更吃亏。值得一提的是,早年间AMD的CPU对于个别科学计算程序有兼容性问题,但如今已经完全不必再担心这一点,放心用即可。

CPU:AMD Ryzen 9 7950X(16核,4.5~5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4650
散热器:利民FC140  300(如果希望散热更好,用瓦尔基里GL360水冷散热器 770元)
硬盘:希捷 银河企业级 7E10 4TB 256MB 7200rpm SATA3 (ST4000NM000B)  960
固态硬盘:三星PM9A1 1TB  500
内存:2*金士顿FURY 32GB DDR5-5200  2*680
电源:振华铜皇550W  370
机箱:先马黑洞标准版  270
键盘鼠标:罗技MK200 多媒体套装  80
总价:约8500

注:有人嫌此配置核数少,我在论坛里专门做了回复:

7950X甭光看核数。架构那么先进、频率那么高,再加上考虑到并行效率,一个核顶频率不很高的服务器CPU >=俩核,碰到并行效率低的任务更是吊打好几十核一U的服务器CPU。光从并行效率极佳的cinebench跑分上,7950X跟48核的7R32的差距仅在1/10。由于并行效率问题在实际中的表现更往往好于7R32。xtb就是非常典型的并行效率不高的程序,超过16核xtb就没多少速度进一步提升的空间,甚至核给太多了反倒更慢。
本来核数就不很多,自然内存用不着很多。


4 高级双路服务器推荐配置

本配置性价比超高,不到三万就能买到96个物理核心+512GB内存的机子。具体参看《淘宝上购买的双路EPYC 7R32 96核服务器的使用感受和杂谈》(http://sobereva.com/653)。买不到7R32的话大家可以改用其它的高性价比的核数多的EPYC CPU(因此不要找我抱怨7R32没货什么的),比如EPYC 7542(32核,基频2.9 GHz)、7K62(48核,基频2.6 GHz)、7B13(64核,基频2.25 GHz)。固态硬盘用了相对较大的2 TB,因为做一些大型后HF计算耗硬盘非常厉害,1T都往往不够。但如果你只是做做普通DFT泛函的计算、TDDFT计算,固态也可以不用。现在4TB的固态硬盘也不贵,直接上4TB也完全可以。

CPU:2*AMD EPYC 7R32(单颗48核96线程,基频2.8,全核满载3.3 GHz) 2*5800
主板:技嘉MZ72-HB0  5600
显卡:主板集显
内存:16*32GB=512GB 镁光/现代/三星DDR4-3200 ECC REG  16*320
硬盘:希捷 银河企业级 7E10 4TB 256MB 7200rpm SATA3 (ST4000NM000B)  960
固态硬盘:三星PM9A1 2TB  980
电源:先马黑钻1000W 700
机箱:追风者614PC + 3个普通14 cm机箱风扇  750
散热器:2*猫头鹰NH-U12S TR4-SP3双风扇  2*720
键盘鼠标:罗技MK200 多媒体套装  80
总价:约27000

2023-Jul-19添加:有些人非要用Intel的配置,姑且在这里给一个,性价比明显不如上面的。CPU用8374C(36核2.7G也可以)

CPU:2* XEON Platinum 8370C正式版(32核2.8G,散,无集显) 2*7800
主板:超微X12DAI-N6(C621A芯片组,集显) 4800
显卡:主板集显
内存:16*32GB=512GB 镁光/现代/三星DDR4-3200 ECC REG  16*320
机械硬盘:希捷 银河企业级 7E10 4TB 256MB 7200rpm SATA3 (ST4000NM000B)  960
固态硬盘:三星PM9A1 2TB  980
电源:先马黑钻1000W 700
机箱:追风者614PC + 3个普通14 cm机箱风扇  750
散热器:2*金钱豹LGA4189 5热管双风扇散热器  2*310
键盘鼠标:罗技MK200 多媒体套装  80
总价:约30000


5 GPU加速做分子动力学的推荐配置

如果你用GROMACS、AMBER(其中的PMEMD程序)、NAMD、Desmond等支持GPU加速的分子动力学程序,做计算一定要用GPU加速,只需用一个中档的GPU就能达到超过很好双路服务器的速度,因此性价比远远于纯用CPU来跑。

虽然GPU加速时绝大部分运算都是GPU来跑,但是使用高端GPU加速时CPU也不能成为瓶颈,否则GPU利用率上不去。对于GROMACS等很多程序,结合如今高端GPU做GPU加速时,对CPU单核性能有较高要求,因此搭配什么CPU合适看的并不是CPU的并行峰值运算能力。这里的GPU加速配置都是用的单核性能足够好的CPU。也不是不能用XEON等服务器CPU,前提是用的话必须选其中频率较高的(但这样的型号性价比普遍都不高,因此没有纳入推荐),否则GPU加速性能还不及用便宜得多的消费级CPU。

高性价比分子动力学推荐配置
CPU:Intel i5 13490F(10核,盒装,无集显)
主板:华硕 PRIME B760M-K D4
CPU+主板套装价2100
散热器:酷冷至尊T400i  80
显卡:索泰RTX 4070Ti X-GAMING OC 6500
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)  1230
内存:2*8GB 金士顿DDR4-3200  2*140
电源:先马黑钻750W  549
机箱:先马黑洞标准版  260
键盘鼠标:罗技MK200 多媒体套装  80
总价:约11100

极高性能分子动力学服务器推荐配置
CPU:AMD Ryzen 9 7950X(16核,4.5~5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4650
散热器:利民FC140 300(如果希望散热更好,可以用瓦尔基里GL360水冷散热器 770元)
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B)  1230
显卡:微星4090D-魔龙SLIM-24G  14000(预算不够的话用RTX4080 SUPER,8000多)
内存:2*金士顿FURY 16GB DDR5 5200  2*370
电源:海韵FOCUS GX-1000  1100
机箱:先马黑洞标准版  260
键盘鼠标:罗技MK200 多媒体套装  80
总价:约22300

绝对不要买好几万的Tesla产品跑分子动力学,血亏,也不要用Titan系列产品,很不值。因为绝大多数分子动力学程序做GPU加速关键看的是GPU的单精度浮点运算性能,面向游戏用的GeForce系列显卡在这方面性价比是最高的,其中最高端产品的GPU加速性能和最高端的Tesla产品是相仿佛的。绝对不要因为一些卖服务器的人一听说你要做GPU加速就给你推荐Tesla然后你就买了。

虽然GROMACS等一些分子动力学程序基于OpenCL也能支持在AMD的显卡上GPU加速,但有的在功能上有局限性。如果你不善于折腾、想用着省心,我优先推荐nVidia的产品,哪怕用AMD的显卡可能性价比更高。

做分子动力学不需要刻意配固态硬盘,因为分子动力学过程中硬盘读写量很小,故硬盘读写速度不会影响到跑动力学的速度。


附:买服务器划算还是租超算划算?

现在很多人都在用超算跑计算任务。据我所知(这里说的是2019年中旬的情况)主流超算中心的价格平均是1毛钱1核时(即一个核跑一个小时)。看起来很便宜,但相对于自己买服务器真的划算么?下面来算笔帐。本文2019年5月底更新的报价中,2*XEON E5-2696 v3的双路服务器是15600元,36核。如果把这个钱全用来租超算,就是15600*10=156000核时。如果用这个服务器来跑,就相当于跑156000/36=4333小时,折合180天。也就是说,你买这个服务器,只要满载跑超过半年,用超算的价格来衡量的话你就相当于回本了,显然对于专门期做计算的人来说,自己买服务器划算得多。虽然也有人说自己跑还要出电费,但价格一点也不夸张。比如在北京城区,目前商业用电按照平段时间来算是0.87元每千瓦时,笔者实测这种配置CPU满载时整机功耗是455瓦,因此每天电费是0.87*0.455*24=9.5元,因此跑180天是1710元,只是买机子的钱的零头而已。用自己的服务器比用超算有很多优点,比如(1)安装软件方便、自由 (2)提交任务省事,不用排队 (3)上传、下载大文件速度比通过互联网快得多。虽然有人说自己买服务器得装系统、配置、编译什么的,需要一定技术才能搞定,但实际上这点技术根本就没啥复杂的,绝对不可能难倒任何一个以后在计算化学领域能稍有作为的研究者,碰到什么问题多Google、鼓捣鼓捣很容易就能解决,这都搞不定的话干脆别搞计算化学了。

不过如果你短期内需要大量的计算资源,超算倒是可以充分满足你的需求,这是用超算的主要一个好处。

PS:顺带一提,笔者强烈鄙视某些倒处偷偷摸摸发垃圾广告兜售超算资源的单位,甚至有的提供超算资源的单位还向购买机时者发红包返现,导致纳税人的钱流入私人口袋,真是非常恶劣的行为!希望读者不要从这些单位购买机时!