计算化学购机配置推荐
计算化学购机配置推荐
Recommendation on purchasing computers for computational chemistry
文/Sobereva @北京科音
Last update: 2024-Nov-9
1 重要前言
经常有人问买机子做计算化学计算该用什么配置,这要根据预算、主要用的程序、主要做的任务类型、算的体系大小、对购买渠道有无限制等很多因素综合考虑。这里,笔者根据不同预算档次,给出相应预算下目前天朝能买到的性价比最高的配置。这些配置对常规的量子化学、第一性原理计算都是非常适合的。而对于分子动力学,由于可以利用GPU加速达到比起用纯CPU的机子好几倍的性价比,故在文末单独给出了配置。
本文是给那些把经费当自己的钱看待、有节约意识,而且水平不是弱到连个操作系统都不会装的读者。而那些经费极度充裕(然而通常都是来自纳税人的血汗钱)、不仇视奸商、就算可能明知道被坑一倍的钱也不心疼的人就别看此文了,我对这些人彻底放弃治疗,这些人就去买那些看似是大品牌(记住除非是那种有制造、定制硬件能力的厂家,否则和淘宝上的组装的服务器没丝毫差别)、有所谓的上门售后(大多数品牌的技术服务其实很坑爹,未必能达到计算化学同行平均技术水平)、性价比通常也就是本文推荐的机子的一半甚至1/3的而且性能可能特别鸡肋的机子好了。
文中的这些服务器配置在淘宝(不是京东)上的很多卖服务器的商家处都可以买到。如果商家的动态评分都比较高,比如都是4.9或有个别4.8的,总出货量也较高(比如好几个钻或者有皇冠),卖家的评价也都没什么问题,并且通过淘宝旺旺与之沟通也比较顺畅,那么这样的商家就是靠谱的,给出的机子的稳定性以及售后都不会有问题。这些商家都可以根据你的需要对配置进行灵活定制。他们不一定恰好能给出和文中一模一样的配置,但只要相仿佛即可。如果为了避嫌不方便以淘宝方式交易,也可以直接联系那些店家以其它方式交易,他们大多都有实体店,一般只要补上税点也都能开发票,直接淘宝旺旺咨询便知。强调一点,淘宝上这些服务器卖家大多都是正经公司性质的,我发现有人求助配置时居然以为他们自己去社会上找的一些服务器公司才是公司,真是糊涂。顶多也就是有的淘宝上的卖家不给上门服务,有问题需要把整机寄回去,维修服务自行咨询卖家便知。
由于配件、价格经常会有变动,新硬件也不断推出,所以本文也会时不时更新,注意看本文开头的最后更新日期,可能几个月或者半年更新一次。文中推荐的配置都是最后更新时最高性价比配置,报价也都是最后更新时候的报价。大家没必要去给个配置单问我或其他人价格是否合理,淘宝上的服务器价格都很透明,自己去淘宝上查当下每种散件的价格,自行相加就知道卖家给的整机价格是否靠谱、有多少水分。
笔者强烈建议在阅读本文的同时阅读《淘宝上购买的双路EPYC 7R32 96核服务器的使用感受和杂谈》(http://sobereva.com/653)和《淘宝店购买双路2696v3服务器的过程、使用感受和杂谈》(http://bbs.keinsci.com/thread-6310-1-1.html)了解一些关于购买服务器的基本知识,这也可以同时令你充分认识到只要商家选对了,从淘宝商家处购买服务器是100%可靠的。笔者很久很久之前还写过一篇《单路计算化学攒机配置推荐》(http://sobereva.com/243),里面做了不少硬件方面的讨论,但现在来看里面的配置已经过时了,但有兴趣的话仍可以看看。http://sobereva.com/datasheet.rar是笔者从2002年开始就一直维护至今一个硬件资料库,里面可以查到各种文中涉及的CPU和GPU型号。当你被型号搞糊涂的时候,查一下这个表格立刻就清楚了。
注意现在社会上的卖服务器的奸商奇多(不是指淘宝商家),猖獗至极!!!笔者在网上答疑时,经常看到有人贴出市面上商家给他的配置和报价,配置不仅很不合理,好多地方严重瞎糟蹋钱,而且本来性能也就值不到2万的机子,居然能报到5万左右;好点的配置,本来也就3万就能拿下来,愣是报7、8万乃至10万甚至十几万!注意这绝对不是小概率事件,而是极大概率事件!笔者见过太多太多了!如果你对配置、行情一点都不懂就到社会上去找服务器商家购买,9成几率血亏!花大价钱就买了个很垃圾的服务器,扔了也不是,用着又慢,简直添堵。每次在答疑时看见奸商利用信息不对称,给硬件小白列的这种配置和报价我就很火大。如果你对计算机配置方面一无所知,除了看上述文章外,吐血建议阅读计算化学公社论坛的“硬件配置与采购板块”的帖子:http://bbs.keinsci.com/forum-61-1.html。花个一两个小时的时间看看,很快就能对行情、配置选择心里有数,碰见不靠谱的配置和报价很容易就能识破(但也不是说那个板块里所有人的发言都是很正确、合理的,不过凡是有严重不合理的言论出现,基本上都会有真正懂行的人斧正)。
PS:我发现计算化学圈里居然有公司把我本文的配置(或高度类似的配置)大幅加价向计算化学工作者兜售,或者价格和本文差不多的情况下把CPU换成工程版来谋取暴利,笔者表示强烈鄙视!大家应当仔细看本文,弄清楚什么配置到底应该卖多少钱,别上黑心公司的当!
以下推荐的配置里没包含显示器,要显示器的话就花六百块钱左右买个最低端的即可,也可以闲鱼上一二百块钱买个二手的。由于不做GPU加速的时候显卡对计算性能没有丝毫影响,因此除了最后推荐的基于GPU加速的做动力学的配置外,用的显卡都是最低端的,因此可见用的要么是CPU集显或主板集显,要么用闲鱼上的二手亮机卡(即远古时期的PCI-E显卡)。对于观看计算化学研究涉及的3D模型,CPU集显和亮机卡的3D加速性能就已经够了。本文推荐的配置用的CPU,若无特殊说明,都是正式版CPU。虽然用工程版CPU便宜得多得多,但在稳定性和兼容性上会有一定风险,看RP,因此本文不考虑,但如果想省钱且不怕折腾的话则可以考虑用正显版。
有个别读者担心本文里某些配置用的CPU是二手什么的,这种担心完全是多余、毫无意义的!只有小白才担心这个。CPU又不是消耗品,不管是全新还是二手,只要能点亮机子就完全一样,使用上绝对没有丝毫差别(除非是商家拆机时不慎把CPU底部的电容给磕掉了,或者把触点弄伤了,那种情况肉眼能直接看得出来,可以让商家先给你拍个照片)。CPU只需要区分正式版和工程版,这有本质差异,而本文推荐的配置没有一个是用工程版的。同理,内存也不用管是新品还是二手的。至于文中的其它配件(亮机卡除外),价格都是全新品的价格。
有人问怎么我推荐的服务器的配置里的CPU那么便宜,而很多“大品牌”服务器公司给的配置单里差不多核数、频率的CPU报的价格是我文中的N倍。这是因为我文中用的Intel的CPU很多不是Intel ARK上能查到的明面上的型号。2696v3、8173M、8375C、7R32之类特殊渠道流出来的OEM的CPU是在大陆等很少数地区的人能才能享受到的bug级福利,这些正式版的OEM CPU的体质、兼容性和明面上的型号没有任何差异,没有丝毫风险。显然,对于买自己用的机子,不选这些U而多花几倍的钱买同样性能的明面上的型号简直是傻子。
下文给出的CPU计算的配置越往后价格越高,相应地性能也越好,应根据预算和实际需要来选择。影响计算速度最有决定性因素的是CPU的“频率*核数”(当然还有很多其它因素,如CPU架构、程序支持的指令集、并行效率等),因此可以看到随着配置价格的提升,大趋势是“频率*核数”逐渐增加的。
本文中给出的配置对于量子化学计算(如主流的Gaussian、ORCA等)以及第一性原理计算(如主流的CP2K、Quantum ESPRESSO等)都是完全适合的。如果你是做分子动力学的且计算程序支持GPU加速,一定要用GPU加速,远远比用CPU计算划算得多,在本文靠后部分专门说了。
本文推荐的硬件都是大概率在市面上有货的。如果供货商说没货,有可能是真碰巧没货,也可能是碰见奸商了,凡是油水少的配置都说成没货,然后推荐你买个性价比低、对他们油水大的。对后一种“假没货”的情况大家要谨慎识别,多在淘宝上问几家店,千万别只听信一家的说辞。如果问了好几家(且都不坑爹)的店,都说没货,而且你在淘宝上问专门卖相应产品散件的卖家也都说没货,那大概率就是暂时市场上真没货了。硬件什么时候有货什么时候没货这谁也说不准,都是一阵一阵的,如果确实长期都铁定没货的产品在本文里肯定不会推荐。真没货时大家可以自主更换相近的配置,比如博文里推荐让你用RTX3070Ti或者RTX3080Ti,都赶上没货,那你可以用比前者更好点或者比后者更次一点的RTX3080。当商家因为没货推荐你改用其它配置时,一定要带着脑子自己想想商家推荐的到底有没有道理、性价比靠不靠谱,要多用Google调查调查、用淘宝自行查看相应硬件当下普遍的价格,明显是没道理的瞎推荐千万别中圈套。
关于电源,我建议用海韵或者振华,在电源领域这二者都是顶级牌子,都可以很放心购买。强烈不建议用长城、鑫谷、航嘉等大陆牌子的电源,它们的价格比海韵和振华便宜得多(特别是大功率的型号,相差好几百),而整体素质有很大差距。电源是最容易出毛病的部件之一,在电源上省钱买次牌子的产品是绝对得不偿失的。先马的中高端电源倒是例外,对于不少功率范围,其产品其性价比比海韵和振华的高不少,而质量也不错,口碑较好,所以本文的一些不太高端的配置用了先马的电源。
2 入门级推荐配置
这是入门级做计算的机子。如果这都买不起的话,可以去二手平台买双路XEON 2696v3服务器,性能比7950X略弱但也更便宜。但那个由于太过时了,本文就不再推荐了。
这机子只有64GB内存,是因为本身核数就不多,平均每个核有4 GB也不小了。还有人问主板是四个内存槽为什么不插满、会不会因此损失性能,这是完全多余的担心,因为CPU本来就是双通道的,插四条没意义,而且插四条时内存频率还上不去反倒更吃亏。值得一提的是,早年间AMD的CPU对于个别科学计算程序有兼容性问题,但如今已经完全不必再担心这一点,放心用即可。
固态硬盘用了两个,一个专用来装操作系统、计算程序、个人文件,另一个用来作为临时文件读写盘。之所以分成两个1TB硬盘而不是弄一个2TB的,在于长期大量读写临时文件对固态硬盘读写量消耗较快(量子化学程序做后HF计算、大体系振动分析等任务经常需要大量连续读写临时文件),专用一个硬盘放临时文件用可以避免未来硬盘寿命耗尽导致操作系统、程序、个人文件无法访问而造成巨大损失。如果你只是用CP2K等程序做第一性原理计算,由于临时文件读写量普遍不大,也可以不专门用一个盘做临时文件读写用。后同。
CPU:AMD Ryzen 9 7950X(16核,4.5-5.7GHz,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4100
散热器:瓦尔基里GL360水冷 650元
固态硬盘1:三星PM9A1 1TB 500(系统/程序/个人文件盘)
固态硬盘2:三星PM9A1 1TB 500(临时文件读写盘)
内存:2*美商海盗船 32GB DDR5-5200 2*640
电源:振华铜皇550W 250
机箱:先马黑洞PRO 280
键盘鼠标:罗技MK200 多媒体套装 80
总价:约7600
注:有人嫌此配置核数少,我在论坛里专门做了回复:7950X甭光看核数。架构那么先进、频率那么高,再加上考虑到并行效率,一个核顶频率不很高的服务器CPU >=俩核,碰到并行效率低的任务更是吊打好几十核一U的服务器CPU。光从并行效率极佳的cinebench跑分上,7950X跟48核的7R32的差距仅在1/10。由于并行效率问题在实际中的表现更往往好于7R32。xtb就是非常典型的并行效率不高的程序,超过16核xtb就没多少速度进一步提升的空间,甚至核给太多了反倒更慢。
9950X是7950X的后继者,单核性能高12%左右,多核性能高6-9%,开启PBO自动超频后多线程性能进一步提升至11%。但9950X的价格也比7950X贵不少,从性价比来说并没优势。不开PBO时9950X的发热量远低于7950X,用便宜得多的中档的风冷就可以压住满载状态,可以选酷冷至尊暴雪T620S(170元)或九州风神大霜塔V5(150元),前者稍微强一丁点。主板可以配华硕GAMING B650M-PLUS或微星B650M 迫击炮,套装不到5000块。内存用2*美商海盗船 32GB DDR5-5600。
4 高级双路服务器推荐配置
本配置性价比超高,两万多就能买到96个物理核心+512GB内存的机子。具体参看《淘宝上购买的双路EPYC 7R32 96核服务器的使用感受和杂谈》(http://sobereva.com/653)。由于每个CPU是8通道的,所以共用了16条内存以全都利用上。买不到7R32或预算不足的话大家也可以改用其它的高性价比的核数多的EPYC CPU,比如7K62(48核,基频2.6 GHz,2000块左右,和7R32性能没区别)、7B13(64核,基频2.25 GHz)等等。
CPU:2*AMD EPYC 7R32(单颗48核96线程,满载3.3 GHz) 2*2600
主板:技嘉MZ72-HB2或超微H12DSi-N6 约5500(H12DSI-N6的拆机的便宜得多)
显卡:主板集显
内存:16*32GB=512GB 镁光/现代/三星DDR4-3200 ECC REG 16*320
固态硬盘1:三星PM9A1 2TB(系统/程序/个人文件盘) 1080
固态硬盘2:三星PM9A1 2TB(临时文件读写盘) 1080
M.2转PCI-E 4.0 4x卡(主板只有一个M.2口):20
电源:先马黑钻1000W 650
机箱:追风者614PC + 3个普通14 cm机箱风扇 750
散热器:2*猫头鹰NH-U12S TR4-SP3双风扇 2*700
键盘鼠标:罗技MK200 多媒体套装 80
总价:约21000
有些人可能觉得用上面的配置不如用单路EPYC 9654,也是96个物理核心,而且整体功耗更小、噪音更小、可以用普通个人电脑的机箱节约空间,同时性能还更好点。如果你觉得这几个方面对你很重要你可以用,但目前单路9654配置(搭配超微H13SSL-N主板、12条32GB DDR5-4800内存)价格达到33000左右,性价比显著低于上面的配置,因此若看重性价比的话我不建议用。
Intel的配置:有些人非要用Intel的配置,姑且在这里给一个,性价比明显不如上面的。CPU用8374C(36核2.7G)等也可以
CPU:2* XEON Platinum 8370C正式版(32核2.8G,散,无集显) 2*7200
主板:超微X12DAI-N6(C621A芯片组,集显) 4800
显卡:主板集显
内存:16*32GB=512GB 镁光/现代/三星DDR4-3200 ECC REG 16*320
固态硬盘1:三星PM9A1 2TB(系统/程序/个人文件盘) 1080
固态硬盘2:三星PM9A1 2TB(临时文件读写盘) 1080
电源:先马黑钻1000W 650
机箱:追风者614PC + 3个普通14 cm机箱风扇 750
散热器:2*金钱豹LGA4189 5热管双风扇散热器 2*310
键盘鼠标:罗技MK200 多媒体套装 80
总价:约28600
5 顶级双路服务器推荐配置
这是目前的顶配了,192个物理核心。由于每个CPU是12通道的,所以共用了24条内存以全都利用上。临时文件读写盘用的很大,这是因为有些任务就是特别耗硬盘,比如ORCA做很大体系的DLPNO-STEOM-CCSD、DLPNO-CCSD(T)等(以前计算化学公社论坛上有人为了跑大体系的DLPNO-STEOM-CCSD任务甚至用了8TB固态才跑成功)。若要想散热更好,也可以改用极伦寒峰一拖二双路SP5水冷,2000元
CPU:2*AMD EPYC 9654(单颗96核192线程,满载3.55 GHz) 2*14400
主板:技嘉MZ73-LM1 7600
显卡:主板AST2600集显
内存:24*32GB=768GB 镁光/现代/三星DDR5-4800 ECC REG 24*900
固态硬盘1:三星PM9A1 2TB(系统/程序/个人文件盘) 1080
固态硬盘2:致态TiPlus7100 4TB(临时文件盘) 1800
M.2转PCI-E 4.0 4x卡(主板只有一个M.2口):20
电源:振华LEADEX III 1300W ATX3.1 1000
机箱:追风者614PC + 3个普通14 cm机箱风扇 750
散热器:2*金钱豹SP5 4U-M98 6热管双风扇 2*310
键盘鼠标:罗技MK200 多媒体套装 80
6 GPU加速做分子动力学的推荐配置
如果你用GROMACS、AMBER(其中的PMEMD程序)、NAMD、Desmond等支持GPU加速的分子动力学程序,做计算一定要用GPU加速,只需用一个中档的GPU就能达到超过很好双路服务器的速度,因此性价比远远高于纯用CPU来跑。
虽然GPU加速时绝大部分运算都是GPU来跑,但是使用高端GPU加速时CPU也不能成为瓶颈,否则GPU利用率上不去。对于GROMACS等很多程序,结合如今高端GPU做GPU加速时,对CPU单核性能有较高要求,因此搭配什么CPU合适看的并不是CPU的并行峰值运算能力。这里的GPU加速配置都是用的单核性能足够好的CPU。也不是不能用XEON等服务器CPU,前提是用的话必须选其中频率较高的(但这样的型号性价比普遍都不高,因此没有纳入推荐),否则GPU加速性能还不及用便宜得多的消费级CPU。
分子动力学过程对硬盘速度没有要求,但大体系长时间的模拟会产生很大的轨迹文件,因此用的是速度慢但便宜的机械硬盘。而且为了确保可靠性,用的是企业级硬盘。
高性价比分子动力学推荐配置
CPU:Intel i5 13490F(10核,盒装,无集显,无散热器)
主板:华硕 PRIME B760M-K D4
CPU+主板套装价2000
散热器:酷冷至尊T400i简包 80
显卡:索泰RTX4070 SUPER X-GAMING 4800
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B) 1330
内存:2*8GB 金士顿DDR4-3200 2*190
电源:先马黑钻750W 550
机箱:先马黑洞标准版 270
键盘鼠标:罗技MK200 多媒体套装 80
总价:约9500
极高性能分子动力学服务器推荐配置
CPU:AMD Ryzen 9 7950X(16核,4.5-5.7G,集显)
主板:技嘉B650M AORUS ELITE AX 小雕
CPU、主板套装价约4250
散热器:瓦尔基里GL360水冷 630元
硬盘:希捷 银河企业级 8TB 256MB 7200rpm SATA3 (ST8000NM017B) 1330
显卡:微星4090D-魔龙SLIM-24G 15000(预算不够的话用微星万图师RTX 4080 SUPER 16G VENTUS 3X OC,9000)
内存:2*金士顿FURY 32GB DDR5-5200 2*650
电源:海韵FOCUS GX-1000 ATX3 1300
机箱:先马黑洞X 390
键盘鼠标:罗技MK200 多媒体套装 80
总价:约24300
绝对不要买好几万的Tesla产品跑分子动力学,血亏,也不要用Titan系列产品,很不值。因为绝大多数分子动力学程序做GPU加速关键看的是GPU的单精度浮点运算性能,面向游戏用的GeForce系列显卡在这方面性价比是最高的,其中最高端产品的GPU加速性能和最高端的Tesla产品是相仿佛的。绝对不要因为一些卖服务器的人一听说你要做GPU加速就给你推荐Tesla然后你就买了。
虽然GROMACS等一些分子动力学程序基于OpenCL也能支持在AMD的显卡上GPU加速,但有的在功能上有局限性。如果你不善于折腾、想用着省心,我优先推荐nVidia的产品,哪怕用AMD的显卡可能性价比更高。
附:买服务器划算还是租超算划算?(以下是2019年中旬写的)
现在很多人都在用超算跑计算任务。据我所知主流超算中心的价格平均是1毛钱1核时(即一个核跑一个小时)。看起来很便宜,但相对于自己买服务器真的划算么?下面来算笔帐。本文2019年5月底更新的报价中,2*XEON E5-2696 v3的双路服务器是15600元,36核。如果把这个钱全用来租超算,就是15600*10=156000核时。如果用这个服务器来跑,就相当于跑156000/36=4333小时,折合180天。也就是说,你买这个服务器,只要满载跑超过半年,用超算的价格来衡量的话你就相当于回本了,显然对于专门长期做计算的人来说,自己买服务器划算得多。虽然也有人说自己跑还要出电费,但价格一点也不夸张。比如在北京城区,目前商业用电按照平段时间来算是0.87元每千瓦时,笔者实测这种配置CPU满载时整机功耗是455瓦,因此每天电费是0.87*0.455*24=9.5元,因此跑180天是1710元,只是买机子的钱的零头而已。用自己的服务器比用超算有很多优点,比如(1)安装软件方便、自由 (2)提交任务省事,不用排队 (3)上传、下载大文件速度比通过互联网快得多。虽然有人说自己买服务器得装系统、配置、编译什么的,需要一定技术才能搞定,但实际上这点技术根本就没啥复杂的,绝对不可能难倒任何一个以后在计算化学领域能稍有作为的研究者,碰到什么问题多Google、鼓捣鼓捣很容易就能解决,这都搞不定的话干脆别搞计算化学了。
不过如果你短期内需要大量的计算资源,超算倒是可以充分满足你的需求,这是用超算的主要好处。
PS:顺带一提,笔者强烈鄙视某些倒处偷偷摸摸发垃圾广告兜售超算资源的单位,甚至有的提供超算资源的单位还向购买机时者发红包返现,导致纳税人的钱流入私人口袋,真是非常恶劣的行为!希望读者不要从这些单位购买机时!