计算化学中的一些常见不良写法和用词

计算化学中的一些常见不良写法和用词

文/Sobereva(2)
First release:2015-Jun-28   Last update:2016-Aug-27


经常在看一些文章、帖子,以及回答一些人的问题的时候,看到很多词汇误用和不良写法,令寡人不悦。在这里就举一些最典型的说说。有的地方其实也只是个人发发牢骚而已。


1 NBO电荷应当叫做NPA电荷

很多文章里都用“NBO电荷”来代表NBO程序产生的原子电荷。这个称呼是严重不合理的,应该叫做“NPA电荷”!NPA的全称是Natural population analysis(自然布居分析)。

NBO是程序名,NBO分析则是这个程序能实现的一大套波函数分析方法的统称。这一大套分析方法里包含许多具体的方法和概念,如NPA、NAO、NHO、NBO、NLMO、NRT、NBBP、NEDA、E2、NBO deletion、NBCP等等,几乎所有这些都是基于NAO(自然原子轨道)的。因此NBO程序做各种NBO分析前,第一步就是先生成NAO。有了NAO,才能做接下来的NBO、E2分析之类。而一旦产生了NAO,就得到了以NAO为基表示的密度矩阵,并立刻得到每个NAO以及每个原子的布居数,以及与原子布居数相对应的原子电荷,这个过程就是NPA分析。这是为什么NBO程序在输出NBO轨道信息之前就已经把原子电荷都输出出来了。如果只需要这部分NPA分析而不需要后续的,在Gaussian中写pop=NPA即可。因此,NBO程序产生的电荷叫做“NPA电荷”才是绝对正确的。NBO程序在输出原子电荷时,前面的标题也是"Summary of Natural Population Analysis:"。无论是NBO程序,还是发展NBO理论的人,都从来都没用过“NBO电荷”这个词!

之所以有大量人错误地使用NBO电荷这个词,原因有二:(1)这个电荷是NBO程序产生的 (2)这是NBO理论框架下诞生的电荷。但这都显然绝不足矣将这种电荷命名为NBO电荷。使用NBO电荷这个词的人,充分暴露出其对NBO分析方法基本原理的认识的严重匮乏。

NBO电荷这个词真是以讹传讹,知道“NPA电荷”这个正确写法的人是少数,用“NBO电荷”这个误称的人却是大多数。搞笑的是,曾经投一篇文章比较各种原子电荷的计算方法(物理化学学报,28(1),1-18),里面已经详细比较了NPA电荷,居然审稿人还问,怎么没比较很常用的NBO电荷?简直正不压邪!!!而且,连gview的观看原子电荷的界面里(Results-Charge Distribution),选择原子电荷类型时都有一项NBO,说明gview的开发者都误把NPA电荷称为了NBO电荷。

每当看到有人用NBO电荷这个词,我一定会提一句,NBO电荷是NPA电荷的谬称,或者我在回复里会改用NPA电荷这个词,如果对方问NPA电荷是什么,我一定顺便强烈批判一下NBO电荷这个词。


2 不要误拼人名

Mulliken这个名字出现在研究文章里一般都是以“Mulliken电荷”或“Mulliken分析”这个词来出现的。无数文章、无数帖子里却误写成“Milliken电荷”,而实际上根本就没有叫Milliken的人!知名的只有两个,一个是刚才说的Mulliken(马利肯),这是分子轨道理论的提出者,另一个是做油滴实验的Millikan(密立根),两个人都是诺贝尔奖得主。很多人竟把两个人的名字特征合并到一起创造了一个新的人Milliken。有趣的是,用google搜“Milliken电荷”能搜到,却似乎没有人误写成过“Millikan电荷”。

很多低水平的文章和学位论文里,甚至一些量化书里,总把Hartree拼成Hatree。希望初学者牢记Hartree的拼法。顺带一提,提到物理学家Feynman(费恩曼)的时候,不要误拼成Feynmann或者Feyman或者Feymann,这也是诸多人常犯的错误。

范德华的正确拼法是van der Waals (vdW),注意打头的v是小写,很多人都写成了大写。

“Koopmans定理”里的这个人名不要拼成Koopman或Koopmann。


3 注意基组的大小写

Dunning的相关一致性基组应该写为诸如cc-pVDZ这样,但很多文章不注意大小写,写为诸如cc-pvdz、cc-PVDZ,这是不好的。这种基组全称是correlation consistent polarized Valence Double Zeta。大小写如果没弄对,会反映出作者比较业余或者不够谨慎。

其它基组也要注意大小写,比如6-31G*也不要写成6-31g*,def2-TZVP不要写成def2tzvp。


4 不要把Multiwfn随意简写!

很多人提到Multiwfn的时候总是写成什么mwfn、mfn、wfn,甚至multi,居然还有人写成Mullikenwfn,还有的人直接叫成什么“多功能波函数”,这会令开发者很生气,无论是谁自己的名字总被别人叫错肯定不高兴。这个程序名很好记,Multi(多)+wfn(波函数),是A multifunctional wavefunction analyzer的简写,真是搞不懂为什么一些人就是不把程序名好好写全。Multiwfn的第一个字母建议大写,如果大小写都写对了那就更好了。


5 拓扑分析里的critical point不要称为关键点

实空间函数的拓扑分析(最常见的就是AIM里对电子密度的拓扑分析)里面有critical point这个概念,指的是函数梯度模为0的点。很多人把critical point叫做“关键点”,这不妥,应该叫做“临界点”。关键点的英文对应的是key point,临界点才是critical point。比如众所周知的critical pressure,被翻译成临界压力,没有被翻译成关键压力的。我很纳闷,为什么明明翻译成临界点是显然对的,大多人却都非要错误地用关键点这个词,也不知道是谁教的、哪儿看来的。

另外,总有人把bond critical point (BCP,键临界点)叫成什么键鞍点。虽然BCP处电子密度梯度为0,是电子密度的二阶鞍点,但直译成键临界点多好,干嘛添油加醋。


6 关于对实空间函数的称呼

量化计算里有很多三维实空间函数,每个坐标上都有一个数值,如电子密度、自旋密度、静电势、福井函数、双描述符等等。考察它们的分布一般只能作图来研究,在这点上Multiwfn(http://sobereva.com/multiwfn)是最方便的工具,可以画它们的曲线图、平面图、等值面图。我们经常需要研究这些函数在每个原子上的分布,这就需要对这些函数在各个原子空间内进行积分,这样每个原子上就有一个数值,便于不同原子之间进行定量比较。这样转化后,称呼也变了,比如:

电子密度 --> 原子的电子布居数,或简称原子布居数 (Atomic population)
自旋密度 --> 原子的自旋布居数,或简称原子自旋布居 (Atomic spin population)
福井函数 --> 简缩福井函数 (Condensed Fukui function)
双描述符 --> 简缩双描述符 (Condensed dual descriptor)
Parr函数 --> 简缩Parr函数 (Condensed Parr function)
...

称呼的时候一定要正确,避免混淆,比如“XX原子的电子密度是8.3”、“XX原子的福井函数是0.02”这样的说法就明显错了,应该说这个原子的布居数、简缩福井函数是多少。

有各种各样的原子空间划分方式,如Mulliken、Hirshfeld、Becke等,基于这些不同划分得到的每个原子上的值也不同。比如说,用Mulliken方法计算原子的自旋布居数,就称为Mulliken原子布居,这个结果当然和基于Hirshfeld划分得到的Hirshfeld原子布居是不同的,推荐使用后者(可以由Multiwfn很方便地计算)。

注意,Gaussian计算开壳层体系输出Mulliken自旋布居时显示的是“Mulliken atomic spin densities”,这在概念上是严重错误的!为什么错,看了上面的讨论想必已经明白。自旋密度是三维函数,三维空间中每个点一个值,岂能说原子的自旋密度?对很多人都被这输出所误导,当我指出错误时,居然有的人还显得挺有理,说Gaussian就是这么写的。


7 不要把密度差称为差分密度

在网上的讨论中,我发现大多数人把density difference称为“差分密度”(或者“密度差分”,乃至更难听的“电荷差分”),我很不喜欢这种称呼,我从来都只用“密度差”这个词。“密度差”比“差分密度”少一个字,而且和英文更为对应,干嘛非要用“差分密度”这个词?


8 慎用“电荷”这个词

描述问题时一定要慎用“电荷”这个词,因为指代不明。电子、原子核都带有电荷,而且,电子的电荷值还是负值,这很容易造成歧义。比如,对某个化学过程,说A片段的电荷减少了,B的电荷增加了,那么这到底是A的电子转移到了B,还是B的电子转移到了A?这要是理解错了就太要命了。两种理解哪个从语义上都对,假定作者这里把“电荷”等价于“电子”,那就是A的电子向B转移;如果是按照电荷的数值来说的,由于电子的电荷值为负,A的电荷减少了就应理解为B的电子向A转移了。

所以我很讨厌用电荷这个词。应该明确地说电子的增减、电子是怎么转移的,就不会有歧义了。


9 分清基组和方法

很多低水平文章中,把基组称为方法,把方法称为基组,真是屡见不鲜,立刻就暴露出作者甚至量化都没入门。这样的低级错误太多的话,可能直接惹怒审稿人,导致惨遭大斧。HF、B3LYP、MP2、CCSD(T)、PM7这些都叫做“理论方法”(Theoretical method),也可以简称为方法或理论;6-31G*、cc-pVDZ、def2-TZVP等都是基组(Basis-set);合在一起说,可以说比如“本文所有计算在B3LYP/6-31G*级别(Level)下进行”,不要写成“...使用B3LYP/6-31G*方法”。


10 分清CCSDT和CCSD(T)

很多人提问的时候,老是说我用CCSDT算了XXX,然后出现某某报错。99.99999%的情况提问者说的是CCSD(T)!CCSDT和CCSD(T)完全是两回事,后者是前者的近似,耗时远远不是一个数量级的,而且绝大多数主流量化程序,包括Gaussian,是不支持CCSDT而只支持CCSD(T)的。所以初学者一定不要搞混这两个,同时劝初学者一定要好好学学基础的理论知识,连自己用的方法的名字都叫不对这太糟糕了。


11 没有“静电势能面”这个词!

好几次网上有人问我问题时都扯到“静电势能面”,而这个词根本不存在!看这个词完全不知道对方想说什么,说出这个词的人明显都没把最基本的概念搞清楚。要分清楚这些词:
(1)势能面:E(R1,R2,R3...)。不同的几何坐标{R}下体系有不同的能量,是个3N-6维函数
(2)分子表面:有许多不同定义,对于范德华表面,通常定义为电子密度=0.001 a.u.的等值面
(3)静电势:V(r)。三维空间中不同位置r下有不同的静电势值,是个3N维函数。不懂静电势的人看此贴的资源:http://bbs.keinsci.com/forum.php?mod=viewthread&tid=219
(4)静电势等值面:可视化展现V(r)在三维空间中分布的一种做法,显示出来的面上的每个点的静电势值都恰与你设的静电势的isovalue值相同
(5)静电势映射的分子表面:可视化展现V(r)在三维空间中分布的最常用做法。也就是利用电子密度数据如上构建出范德华表面,然后把范德华表面上各个点的静电势的值以不同颜色显示出来以便于考察。这也叫静电势填色的分子表面。例如这些帖子所绘制的:《在GaussView里绘制分子表面静电势填色图的过程》(http://sobereva.com/253)、《使用Multiwfn结合VMD分析和绘制分子表面静电势分布》(http://sobereva.com/196


12 其它

一些文章中,写了自己用了某某关键词,比如什么guess=mix、int=ultrafine,但是却没有加以说明,这是不好的。Gaussian用户自然知道是怎么回事,但非Gaussian用户就不知道这是干什么的了。所以应该在旁边也注明关键词的含义和使用它的目的。有些人还写用了什么IOp,这就更不好了,一些偏门的IOp连Gaussian老鸟都记不住,如果不做相应解释的话一般读者就更难以理解了。

某些人说自己用B3算了某某某,这又是明显体现基本知识不过关,B3LYP、B3PW91、B3PBE等等组合多了去了,具体指什么?如果就是指最常用的B3LYP,何故省略LYP三个字母却给别人的理解带来不便?

无数人提问时说自己用了6-31G(或6-311G)算了某某某。每次看到这样的提问我就想,这人到底是用的什么基组?是6-31G*但为了在提问时少打字把*或(d)之类极化函数符号略去了,还是说计算时用的基组本身确实就没带极化函数,就是个干巴巴的6-31G?如果是前者,提问时不要偷工减料,要认真把自己的情况全面、如实描述清楚;如果是后者,那计算结果根本没法用,结果太烂,这属于基组的基础知识都没掌握。

Pople基组用加号代表加弥散函数,这必须写在G的前头。很多人写Pople基组的时候,老是误把弥散函数的加号写到G的后头去,比如6-31G+、6-311G+(d,p),这是严重错误的,暴露出研究者比较菜。错误的书写还对很多其他人有误导,人问我文献中6-31G+是什么意思,和6-31+G有什么区别...

不要把Gaussian(高斯)拼成Guassian(瓜斯)或Gaussion(高身)。而且也不要把GaussView写成Gaussian View。这都是诸多菜鸟文章里常见错误。

不要把LUMO拼成LOMO,不要把HOMO拼成HUMO。这种常见的低级错误令人看着很不爽,估计误拼的人8成都不知道英文全称怎么拼。

π的英文拼法是pi,老有人按照汉语拼音拼成pai,说什么pai键、pai-pai堆积之类,显得此人特别low。

仅有一条评论

  1. 杨小狗

    刚接触量化,这样的错误对初学者很致命,看完之后深有所思。。

评论已关闭