Multiwfn支持的预测化学体系反应位点和反应活性的方法一览
Multiwfn支持的预测化学体系反应位点和反应活性的方法一览
An overview of methods supported by Multiwfn for predicting reaction sites and reactivity of chemical systems
文/Sobereva@北京科音
First release: 2026-Mar-31 Last update: 2026-Apr-1
0 前言
一个分子的不同位置倾向于发生什么类型的反应,以及反应是否容易发生,是化学家们超级关心的问题。目前在波函数分析领域已经有大量方法可以用于预测亲电/亲核/自由基反应位点(区域选择性, regioselectivity)和反应的难易程度(反应活性,reactivity),以及讨论反应机理,绝大部分这些分析方法都可以通过量子化学程序(如Gaussian、ORCA等)结合笔者开发的波函数分析程序Multiwfn很容易、快速地实现,我之前也写过大量与此相关的博文、在计算化学公社论坛和思想家公社QQ群里回答过海量相关问题。这些方法的相关信息很多且颇为零散,很多人难以一次性了解都有哪些方法、可以在什么时候用,每次我在网上回答相关问题的时候也麻烦,因此笔者在本文把这些方法做一个完整的汇总,使得读者能得到一个简明的知识框架、知道该进一步了解什么相关信息(文献、笔者的博文、Multiwfn手册的章节等)。我之前发现大量计算化学研究者对这方面分析方法知之甚少,很多人甚至只知道用本科化学教科书里讲的前线分子轨道理论讨论这些问题,殊不知还有诸多更好、更严格、更可靠的选择,本文很建议他们阅读。文本内容仅限于分子、团簇这样的孤立体系,用于周期性体系的情况未来可能另文介绍。
注意本文的目的绝对不是详细具体介绍各个分析方法的原理与应用,而主要只是给出方法的列举。这些方法涉及的相关背景知识、公式、细节极多,还需要用大量图片来说明。在笔者讲授的“量子化学波函数分析与Multiwfn程序培训班”(http://www.keinsci.com/WFN)中专门有一节“反应位点的预测与反应活性分析”对这些内容做极其全面细致且深入浅出的讲解,并给出利用Multiwfn计算的丰富的示例和很多技巧,幻灯片远超100页,十分推荐想一次性学完整的读者参加!培训里还会介绍很多本文完全没提到的相对小众或较新方法,如键反应性描述符、核福井函数、Parr函数、FMOL、GPRI、FF-EP等等。
注:第10届此培训班将于2026年5月4-8日在北京举办,报名正在进行中,详见http://www.keinsci.com/workshop/10WFN。
本文介绍的许多方法在笔者的以下两篇文章里有简明扼要的介绍,并且对预测的准确度做了全面的对比分析和讨论,是十分重要的文章,非常推荐本文的读者阅读:
• 亲电取代反应中活性位点预测方法的比较, 物理化学学报, 30, 628 (2014)(https://doi.org/10.3866/PKU.WHXB201401211)
• Comparative study on the methods for predicting the reactive site of nucleophilic reaction, Science China Chemistry, 58, 1845 (2015)(https://doi.org/10.1007/s11426-015-5494-7)
为了避免混淆,这里强调一下本文的用词,也是主流习俗:说某个分子的某个位点容易发生亲电反应(亲电反应位点),是指这里容易被另外的物质亲电进攻而反应,也相当于这个位点是比较亲核的。对亲核反应位点同理。
本文介绍的方法主要是用于亲电反应、亲核反应,有的方法还能用于自由基反应,需要根据反应机理选择合适的预测位点的方法。不是所有反应都可以用本文提到的方法预测,像是热解离反应,就不是本文的方法能预测的了,而衡量键强的方法才与此密切相关,参考《Multiwfn支持的分析化学键的方法一览》(http://sobereva.com/471)。
本文的方法预测出的一些容易反应的位点可能出现在你已知不可能发生反应的位置,或者出现在你完全不感兴趣的区域,这些预测出的位点可以直接无视。即你只需要关心实际有可能出现你感兴趣的反应的区域中这些方法预测出的位点就行了。比如预测苯酚的亲电反应位点时,只需要关心取代基的临位、对位、间位碳。
本文介绍的方法有一些普遍的局限性,因此不能盲目使用,在文章最后会简要说明。
对于构象较多的柔性分子体系,一般应当取对最稳定的构型/构象进行分析,十分推荐用笔者开发的完全免费、十分流行的构型/构象搜索程序molclus(http://www.keinsci.com/research/molclus.html)实现。但注意某些分子发生某些反应是在较高能的构型/构象下进行的,此时用能量最低构象做分析可能不是最佳选择。
本文介绍的方法用Multiwfn都可以容易地实现,对Multiwfn不了解者强烈建议阅读:《Multiwfn FAQ》(http://sobereva.com/452)、《Multiwfn入门tips》(http://sobereva.com/167)、《详谈Multiwfn支持的输入文件类型、产生方法以及相互转换》(http://sobereva.com/379)。Multiwfn可以在主页http://sobereva.com/multiwfn免费下载。
1 关于预测方法与化学反应标准研究方式之间的关系
有一个问题值得先提一下。做量子化学或第一性原理研究的人,研究反应容易在哪发生、发生难度如何,普遍都是先估计反应机理和反应位点,然后找过渡态,再计算势垒(更确切来说是自由能垒,参考《谈谈如何通过势垒判断反应是否容易发生》http://sobereva.com/506),下文管这叫“标准研究方式”。这种研究方式确实严格、被接受程度最高,那本文介绍的方法还有何意义?这些方法的重要意义在于:
(1)方便快捷:本文介绍的方法直接就能预测出来一个分子在哪倾向于发生什么类型的反应以及反应难易,整个过程耗时通常很低,而且不需要提供另一个反应物分子的信息
(2)节约试错时间:标准研究方式的整个计算过程不仅往往很费时费力,而且还往往需要一一尝试凭感觉估计出的可能发生反应的位点、对比算出来的势垒,令花费的计算资源和精力明显更高。而如果先通过本文介绍的方法把不太可能反应的位点/方式排除掉,能省去大量无意义的计算花费
(3)能对反应特征予以解释:本文介绍的很多方法能基于反应物分子的电子结构特征解释清楚某些反应为什么倾向于在某些位点上发生,以及什么内在因素影响了反应的难易,并且有的分析方法甚至还能预测和解释反应时的立体结构。只有在“标准化”的计算基础上进一步提供这种physical insight,文章才有深度、更有亮点和启发性。因此哪怕你对某体系可以很容易地完成标准方式的研究,本文介绍的方法依然很有意义
(4)其它:本文介绍的很多方法给出的是分子、原子、键描述符,这些都可能用于机器学习训练用于不同问题的模型。本文涉及的部分方法给出的信息在《Multiwfn可以计算的分子描述符一览》(http://sobereva.com/601)里也提到过。
当然,本文介绍的这些方法无法代替标准研究方式。比如你用本文的某种方法预测出某个原子容易发生亲电反应,并不一定真的就是这样,毕竟本文介绍的分析方法所基于的思想都有局限性、物理模型都较为简单,所以若要给出最有说服力的结果,条件允许的话还是应当再辅以标准研究方式进行验证。如果发现你在得当的计算方式下得到的结果(过渡态特征、决速步自由能垒)和预测的不符,那大概率就是预测的不准确。某些情况下不同预测方法的结论还可能相互矛盾,比如有的预测是间位反应活性最大,有的预测是对位,如果你拿不准哪个更靠谱,就更得计算验证了。
2 概念密度泛函理论框架下的方法
Robert Parr提出的概念密度泛函理论(conceptual DFT, CDFT)是一个基于DFT范畴中诸多可观测量所发展的分析化学反应问题的理论框架,后来又被大量研究者进一步丰富和扩展,如今已经极其知名、被海量论文使用。本节下面提到的都是CDFT领域的分析方法,相关理论知识大多在《概念密度泛函综述和重要文献合集》(http://bbs.keinsci.com/thread-384-1-1.html)里给出的论文、综述中有充分的介绍。Multiwfn的主功能22是专门做各种CDFT分析的强大和方便的模块,能够计算CDFT框架下定义的几乎所有有普遍实际价值的量,强烈建议读者阅读《使用Multiwfn超级方便地计算出概念密度泛函理论中定义的各种量》(http://sobereva.com/484),对Multiwfn的CDFT模块的基本使用有具体介绍。在Multiwfn手册3.25.1节有所有这个模块能算的所有量的计算公式的全面、清晰的罗列,因此下文就不给出任何公式了。另外,2022年Wiley出版的Conceptual Density Functional Theory一书中笔者专门写了一节Realization of Conceptual Density Functional Theory and Information-Theoretic Approach in Multiwfn Program,充分介绍了这个模块,推荐阅读:https://doi.org/10.1002/9783527829941.ch31。
注意量子化学领域里约束性DFT(constraint DFT)也可以简写为CDFT,介绍见《谈谈约束性DFT(CDFT)》(http://sobereva.com/271),这和本文说的CDFT八竿子打不着。读者在网上交流时用CDFT一词之前必须说清楚指的是哪个CDFT,免得造成歧义。
2.1 福井函数
福井函数(Fukui function)是外势不变条件下电子密度对电子数的一阶导数,一般基于有限差分近似来算这个导数,向前差分、向后差分、中间差分的形式分别对应于f-、f+、f0,都需要用两个不同电子数的状态下的电子密度求差来计算,因此是一种特定形式的电子密度差。比如体系原本有N个电子,f-就对应于N电子数状态下的电子密度与N-1电子数状态下的电子密度的差值。注意对各个电子态产生电子密度用的几何结构都必须是N态的极小点结构。
福井函数是三维实空间函数,最常见的考察其分布的方式是绘制等值面图,由此可以直观看出体系什么区域福井函数明显为正或为负。还有一种相对少见的方法是把福井函数根据数值以不同颜色投影到分子表面上观看。一般关心的是福井函数正值最显著的区域。f+和f-为显著正值的区域分别暗示此处容易发生亲核反应和亲电反应,并且越正这种倾向性越强。f0则适合用于预测电子净转移量接近0的反应的位点,如很多自由基反应的情况。f-预测亲电反应位点的准确度还可以,而f+预测亲核反应位点的准确度挺烂的,不建议用,见前述《Comparative study on the methods for predicting the reactive site of nucleophilic reaction》文中的对比。
福井函数可以用Multiwfn按照《使用Multiwfn作电子密度差图》(http://sobereva.com/113)的方式手动绘制密度差等值面图考察,Multiwfn手册里4.5.4节也有完整例子,而最推荐且步骤最简单的做法是用前述的Multiwfn的CDFT模块计算福井函数,http://sobereva.com/484里给了具体例子。如果要绘制福井函数在分子表面上的彩色投影图,可参考《基于Multiwfn产生的cube文件在VMD和GaussView中绘制填色等值面图的方法》(http://sobereva.com/402)里给出的例子。
福井函数还有一种很粗糙的计算方式是利用轨道冻结近似,使得轨道弛豫效应被忽略,此时f+恰等于LUMO轨道的概率密度分布、f-恰等于HOMO轨道的概率密度分布。因此都不用计算两个电子态的密度求差了,只要有N态的波函数文件就够了,用Multiwfn按照《使用Multiwfn观看分子轨道》(http://sobereva.com/269)里说的方法绘制绘制轨道概率密度图即可。但我极其不推荐用这种形式的福井函数,因为按照前述标准的方式计算福井函数也并不昂贵,何故用这种粗糙的近似形式来算,不仅很可能预测的准确度更差,还容易挨内行审稿人批。
Multiwfn的一个独特功能是可以计算分子轨道、NBO轨道、定域化分子轨道等各种形式的轨道对密度差的贡献,也因此可以讨论它们对福井函数的贡献,详见《使用Multiwfn考察分子轨道、NBO等轨道对密度差、福井函数的贡献》(http://sobereva.com/502)。这个功能有明显的价值。比如NBO轨道里面有一类是BD型轨道,它们与化学键相对应,因此用Multiwfn考察BD型轨道对福井函数的贡献,就可以直接了解福井函数在哪些键上有显著正值分布,因而哪些键容易发生特定类型的反应。这也可以称为“基于NBO的键反应性指数”。再比如能够与原子轨道相对应的NAO轨道也可以用Multiwfn的这个功能考察它们对福井函数的贡献,从而能了解哪些原子轨道与分子的反应性有密切关系。
2.2 双描述符
双描述符(dual descriptor)在文献里往往用f(2)或Δf符号表示,通常以f+与f-求差的形式来计算,同时要用到N、N-1和N+1态的电子密度。双描述符相对于福井函数的优点之一是它的正值和负值都有意义,靠一个函数就能代替f+和f-两个函数的用处。双描述符明显为正的区域对应容易发生亲核反应的位点,明显为负的区域对应容易发生亲电反应的位点。而从实际来讲,符号的正负不倒是重点,更应理解为越正(越负)发生亲核(亲电)反应的倾向性越强。双描述符比福井函数的另一个优势是预测得整体更为准确(特别是亲核反应位点),这点在前述的《亲电取代反应中活性位点预测方法的比较》和Comparative study on the methods for predicting the reactive site of nucleophilic reaction文章的对比测试中明确体现了出来。由于双描述符的优点,如今它非常流行、使用广泛。
2.3 福井势和双描述符势
福井势和双描述符势也都是三维函数,在预测反应位点方面分别比福井函数和双描述符原理上更为严格,但代价是需要计算静电势,因而对大体系的计算代价显著更高。它们的介绍和计算方法见《使用Multiwfn计算双描述符势预测反应位点》(http://sobereva.com/708)。如果你的体系较小或者不那么介意耗时,双描述符势很值得优先使用,而且其等值面比双描述符更为平滑,因此往往更容易通过图像讨论。
2.4 前线轨道存在简并的情况的考虑
平时我们研究的大多数体系的HOMO不是简并的,LUMO也不是简并的,或者说它们的简并度都是1。但有一些有点群对称性的体系的HOMO、LUMO是有简并性的,比如C60富勒烯、18碳环(http://sobereva.com/highlight.html里面有我大量相关研究的汇总)。这种情况就不能简单按照上述方式通过N/N-1/N+1之间密度求差的方式计算福井函数和双描述符了,否则它们的空间分布与体系的结构对称性不符,明显是错的、会造成误导。对于这样的体系有两种合理计算福井函数和双描述符的方法,都能令结果满足体系对称性:
(1)使用轨道权重形式,在《通过轨道权重福井函数和轨道权重双描述符预测亲核和亲电反应位点》(http://sobereva.com/533)里做了详细介绍。此时只需要提供给Multiwfn N态的波函数文件就可以计算,但由于利用了轨道冻结近似,因此对于前线轨道本来就是非简并的体系不应该用,否则结果会更差。
(2)使用N+p和N-q态分别代替N+1和N-1态,p和q分别是LUMO和HOMO轨道的简并度,这是J. Comput. Chem., 37, 2279 (2016)提出的做法,详细介绍见Multiwfn手册3.25.4节。Multiwfn的CDFT模块也可以直接用这种形式计算,实例见Multiwfn手册4.22.3节。下文涉及的与福井函数/双描述符有关的各种其它函数或原子/键的指数都可以在Multiwfn中以这种方式在考虑前线轨道简并的情况下合理计算。
2.5 简缩福井函数与简缩双描述符
简缩福井函数(condensed Fukui function)可以视为一种原子描述符,它体现福井函数在各个原子上分布的量,明显比福井函数更便于在原子之间做定量对比,展示的时候可以列表或者在分子结构图上标注数值,还可以按照《使用Multiwfn+VMD以原子着色方式表现原子电荷、自旋布居、电荷转移、简缩福井函数》(http://sobereva.com/425)的方法对原子着色。简缩福井函数可以理解为福井函数在各个原子空间中的积分值,实际中通常靠不同电子态的原子电荷求差来计算,比如某原子的简缩福井函数f-计算为N-1态和N态的原子电荷求差。具体介绍见Multiwfn手册4.7.3节。
简缩双描述符(condensed dual descriptor)就是f+和f-形式的简缩双描述符之间求差,用于定量衡量双描述符在各个原子上的分布。Multiwfn的CDFT模块可以直接把所有原子的简缩福井函数和简缩双描述符一次性给出,十分方便,计算时用的原子电荷是Hirshfeld原子电荷。
原子电荷计算方法多了去了,见我的综述文章《一篇深入浅出、完整全面介绍原子电荷的综述文章已发表!》(http://sobereva.com/714)和《原子电荷计算方法的对比》(物理化学学报, 28, 1 (2012) https://doi.org/10.3866/PKU.WHXB2012281)里的全面介绍。“TCA上的一篇对比不同原子电荷预测反应位点、亲电/亲核性的文章”(http://bbs.keinsci.com/thread-15512-1-1.html)帖子里提到的刘述斌等人的Theor. Chem. Acc., 138, 124 (2019)文章的对比测试体现出Hirshfeld原子电荷最适合用于计算简缩福井函数的目的,前述的我发表的《亲电取代反应中活性位点预测方法的比较》也有相同的结论,这充分体现出Multiwfn的CDFT模块基于Hirshfeld电荷计算简缩福井函数和双描述符的合理性。
2.6 键双描述符
键福井函数(bond Fukui function)和键双描述符(bond dual descriptor)可以定量体现哪些键上容易发生亲电或亲核反应,在《使用Multiwfn计算键双描述符考察不同化学键的反应性》(http://sobereva.com/766)有详细介绍和示例。
2.7 (简缩)局部(超)软度与相对亲电/亲核指数
电子的硬度(hardness)体现体系对电子数改变的抗拒程度,有限差分方式计算时写为第一垂直电离能与第一垂直电子亲和能的差值。软度(softness, S)是硬度的倒数,越大体现电子越容易被极化,也暗示越容易参与化学反应。软度和硬度是分子的全局指数。
福井函数适合用于预测一个分子内的反应位点,一般不适用于在不同分子间比较谁的哪个位点更容易反应。局部软度(local softness)定义为S与福井函数的乘积,比如讨论亲电反应难易的s-形式的局部软度就是S与f-的乘积。而用于定量在原子间对比的简缩局部软度就是S与简缩福井函数的乘积。由于考虑了描述分子反应性的软度参数,(简缩)局部软度原理上可以在不同分子间对比位点的反应活性的高低。
根据J. Math. Chem., 62, 461 (2024)的讨论,局部超软度s(2)可以计算为S的平方与双描述符的乘积。此文章强调福井函数、双描述符缺乏尺寸一致性,往往不适合在不同大小体系之间进行对比。因为福井函数全空间积分为1,若福井函数分布范围很广(如对于富勒烯分布在整体),体系越大其数值会倾向于越小。而局部软度、局部超软度则没有明显这种问题。
还有人提出相对亲电指数,定义为s+/s-,数值越大的位点越容易发生亲核反应
;以及相对亲核指数,定义为s-/s+,数值越大的位点越容易发生亲电反应。并且认为s+/s-大于s-/s+的位点更倾向于发生亲电反应,反之亦然。类似简缩局部软度,相对亲电/亲核指数也有定量描述原子的简缩形式。
局部和简缩局部(超)软度、(简缩)相对亲电指数都可以由Multiwfn的CDFT模块方便地得到。
2.8 亲电/亲核指数及其局部形式
一个分子的亲核指数(nucleophilicity index)越大,其亲核性越强。J. Org. Chem., 73, 4615 (2008)给出了一种亲核指数的简单定义,是被研究的亲核分子的HOMO能量与四氰基代乙烯(TCE)的HOMO能量的差值。局部亲核指数被定义为了亲核指数与f-的乘积,而定量描述原子的简缩局部亲核指数是亲核指数与简缩f-的乘积。简缩局部亲核指数越大的原子亲核性越强,也暗示越容易发生亲电反应。
一个分子的亲电指数(electrophilicity index)越大,说明得电子能力越强,也暗示越容易与亲核分子反应。最早Parr给出了一种亲电指数的定义,依赖于化学势和硬度。亲电指数与f+相乘对应局部亲电指数,可以作图考察;亲电指数与简缩f+相乘对应简缩局部亲电指数,数值越大的原子亲电性越高,也越可能是优先的亲核反应位点。
如同(简缩)局部软度,(简缩)局部亲核/亲电指数可以在不同体系间对比。Multiwfn的CDFT模块可以很便利地计算出这些函数和量。
值得一提的是,J. Phys. Chem. A, 124, 2090 (2020)定义了另一种亲电指数ω_cubic,相对于Parr的形式考虑了含超硬度的更高阶项、更为严格和理想。Int. J. Quantum Chem., 124, e27366 (2024)还定义了亲电描述符,与Mayr亲电参数E的相关性远好于Parr定义的亲电指数。这两个分子的全局指数也可以由Multiwfn的CDFT模块直接算出来,http://sobereva.com/484里都有说明。
3 前线轨道理论
福井谦一(Fukui)的前线轨道(frontier molecular orbital, FMO)理论是在本科化学教材都会涉及的东西,这曾被计算化学研究者广泛用于预测反应位点和分析化学反应中的轨道相互作用。在预测反应位点上,FMO理论认为HOMO轨道分布量越大的位点越容易发生亲电反应,LUMO轨道分布量越大的位点越容易发生亲核反应。HOMO和LUMO的分布可以按照《使用Multiwfn观看分子轨道》(http://sobereva.com/269)说的作图考察,如果要定量对比在不同原子上的分布量,应当用《谈谈轨道成份的计算方法》(http://sobereva.com/131)介绍的方法通过Multiwfn计算轨道中各个原子所占成份,一般基于Hirshfeld划分的方式计算即可。此文也介绍了计算分子轨道中原子轨道的成份的方法,因此也可以通过计算原子轨道对HOMO、LUMO的贡献考察哪些原子轨道和亲电、亲核反应关系密切。
在预测亲电、亲核反应位点上,用FMO理论明显不如用概念密度泛函理论。因为分析HOMO、LUMO的分布分别等价于在轨道冻结近似下考察f-和f+的分布,而轨道冻结近似是很粗糙的近似,有时候可能带来误导性的结论。而且很多时候前线轨道是简并或者近简并的,这种情况下仅仅考虑HOMO、LUMO这两个轨道显而易见会带来不准确或荒谬的结论!前面介绍的轨道权重福井函数虽然用了轨道冻结近似,但也比FMO理论更好,因为它还额外考虑了与HOMO/LUMO完全简并或能量与之接近(与之近简并)的分子轨道。所以FMO理论预测反应位点在如今已经很不推荐了、没必要用了,明明本文介绍了其它严格得多、实际结果也更可靠的预测方法。
极个别文献用所谓的前线电子密度(frontier electron density, FED)预测反应位点,我强烈不建议效仿。用这个方法预测亲电位点和FMO理论通过HOMO轨道成份预测完全等价;对于预测自由基进攻位点,FED和基于轨道冻结近似的福井函数f0完全一样。因此在我来看FED是一个完全多余、没有任何存在意义的东西。
4 基于电子分布的分析
我在《谈谈怎么考察、计算、分析化学体系的电子密度》(http://sobereva.com/715)中全面盘点过各种可以考察化学体系电子分布的方法。原子电荷(atomic charge)也叫分数电荷(partial charge),描述了原子在化学体系中所带的净电荷量,这也可以用于预测反应位点,原理简单易懂。原子电荷越负的原子越容易吸引亲电物质在此处发生亲电反应,原子电荷越正的原子越容易吸引亲核物质在此处发生亲核反应。对原子电荷没概念的读者建议阅读《一篇深入浅出、完整全面介绍原子电荷的综述文章已发表!》(http://sobereva.com/714)介绍的我的综述系统了解一遍。
计算原子电荷的方法极多,如ADCH、Mulliken、NPA、CHELPG、Hirshfeld等等都是常见的方法。虽然Hirshfeld原子电荷有很多弊病,但根据前述的笔者的《Comparative study on the methods for predicting the reactive site of nucleophilic reaction》文章和Theor. Chem. Acc., 138, 124 (2019)的对比,Hirshfeld电荷在预测反应位点方面是各种原子电荷里表现整体最理想的,特别是在预测亲核反应位点方面比f+靠谱得多。Hirshfeld电荷可以通过Multiwfn非常方便快速地计算出来。
原子电荷还可以在不同体系间预测和解释特定位点发生亲电、亲核反应的难易。Theor. Chem. Acc., 138, 124 (2019)的测试体现了Hirshfeld电荷与实验亲电性、亲核性关系极为理想。在http://sobereva.com/714我的综述里介绍原子电荷实际价值的部分(6.1.2节)还给出了原子电荷与反应势垒间存在高度相关性的范例。也推荐读者阅读以下两篇我参与的文章:
Hirshfeld Charge as a Quantitative Measure of Electrophilicity and
Nucleophilicity: Nitrogen-Containing Systems, 物理化学学报, 30, 2055 (2014) https://doi.org/10.3866/PKU.WHXB201409193
Information Conservation Principle Determines Electrophilicity,
Nucleophilicity, and Regioselectivity, J. Phys. Chem. A, 118, 3698 (2014)
对于与pi电子关系特别密切的亲电反应,比如取代苯上的碳发生的亲电反应,根据pi电子的分布也可以预测优先发生亲电反应的位点,在前述的《亲电取代反应中活性位点预测方法的比较》文章中对取代苯计算了碳原子的pz轨道布居数(pz是指垂直于苯环的p轨道),体现出它可以很好地预测不同位点发生亲电反应的优先顺序,且预测结果比任何原子电荷都好(只考察pi电子分布可以排除sigma电子的干扰)。通过Multiwfn可以容易地对平面和非平面的体系计算原子的pi电子数,方法见《在Multiwfn中单独考察pi电子结构特征》(http://sobereva.com/432)。
5 平均局部离子化能
平均局部离子化能(average local ionization energy, ALIE)是Politzer提出的一个三维函数,利用占据轨道波函数和轨道能量来计算,它衡量特定位置的电子的电离的难易程度,某处的ALIE数值越小说明此处的电子越易电离,相当于被束缚得弱、易被极化、容易参与反应。这里说的反应主要是亲电反应,对于自由基反应在一定程度上也能用,而和亲核反应无关。ALIE的更多信息见《静电势与平均局部离子化能相关资料合集》(http://bbs.keinsci.com/thread-219-1-1.html)。根据第0节提到的方法横测文章,ALIE预测亲电反应位点的可靠度整体来说是很不错的。
ALIE的分布特征可以作图考察,通常是将电子密度等值面定义的分子表面上不同位置的ALIE的数值以不同颜色展现,做法见《使用Multiwfn和VMD绘制平均局部离子化能(ALIE)着色的分子表面图(含视频演示)》(http://sobereva.com/514)。
如果想定量分析ALIE,有两种做法:
(1)用Multiwfn搜索分子表面上ALIE的极小点(相对周围表面区域来说电子最活泼的位置),然后考察极小点上ALIE的数值,例子见《使用Multiwfn的定量分子表面分析功能预测反应位点、分析分子间相互作用》(http://sobereva.com/159)。如果有几个原子是潜在的反应位点,分子表面上ALIE极小点只出现在某个原子上,就说明这正是最容易反应的位点;如果有多个原子上都有极小点,谁的数值越小谁的反应活性就越大。但这种分析的缺点是如果感兴趣的原子上都没有极小点,那就没法对比了。
(2)在各个原子局部表面上做ALIE的积分得到平均值。我曾提出局部定量分子表面分析方法,这个方法把整个分子表面分解为属于各个原子的区域,即原子局部表面,细节见Multiwfn手册3.15.2.2节。在原子局部表面上可以用Multiwfn对ALIE做积分再除以面积从而得到平均值。哪个原子的这个数值越小,哪个原子就越优先发生反应。因此,凡是暴露在分子表面上的原子都可以以这种方式考察。显然对包埋在内部的原子无法输出数据,本身这些原子也不会接触到另外的反应物而反应。这种分析方法可参考《谈谈怎么计算“原子的静电势”》(http://sobereva.com/641)中的“原子局部范德华表面的静电势平均值”部分,操作都一样,只不过在Multiwfn的主功能12里开始分析前用选项2把被分析的函数从静电势改为ALIE即可。
也可以把福井函数投影到分子表面并用上述两种分析方法定量分析,具体例子见Multiwfn手册4.12.4节。
6 局部电子附着能的分析
我之前专门写过一篇文章对局部电子附着能(local electron attachment energy, LEAE)做了非常详细的介绍并给了分析例子:《使用Multiwfn通过局部电子附着能(LEAE)考察亲核反应位点、难易及弱相互作用》(http://sobereva.com/676)。LEAE和ALIE很相似,只不过LEAE是利用能量低于0的空轨道信息计算。LEAE较负说明在此处有能级较负的空轨道出现,因此这个地方比较亲电、当电子来到这里后体系能量降低得较多,同时也说明这种地方倾向于被亲核进攻。对于多个LEAE都较负的地方,谁越负谁越亲电、谁被亲核进攻的优先级越高。LEAE也可以在不同体系之间对比。LEAE的分析手段和ALIE一样,可以绘制填色投影图,也可以通过分子表面定量分析考察,详见上述博文。LEAE提出得较晚,因此没有ALIE那么流行,但价值同样高。
7 静电势的分析
静电势(electrostatic potential, ESP)是非常知名、重要的一种实空间函数,相关知识见《静电势与平均局部离子化能相关资料合集》(http://bbs.keinsci.com/thread-219-1-1.html)里面提到的各种资料和我写过的大量文章。静电势被广泛用来考察分子间静电主导的相互作用,简要介绍见《Angew. Chem.上发表了全面介绍各种共价和非共价相互作用可视化分析方法的综述》(http://sobereva.com/746)提到的笔者的综述中的静电势部分。静电势也可以用来预测反应位点,原理简单易懂,可惜预测效果不好(详见第0节提到的我发表的预测反应位点方法的对比文章),因此在这方面并不太流行。和ALIE、LEAE一样,在预测反应位点时静电势一般投影到分子表面上考察,某处静电势为负说明此处易发生亲电反应,为正说明此处易发生亲核反应,并且数值大小越大说明这种倾向性越强。静电势可以作图和在分子表面上做定量分析(极大点、极小点分析,以及原子局部表面积分),做法见下文
《使用Multiwfn+VMD快速地绘制静电势着色的分子范德华表面图和分子间穿透图(含视频演示)》(http://sobereva.com/443)
《使用Multiwfn的定量分子表面分析功能预测反应位点、分析分子间相互作用》(http://sobereva.com/159)
《谈谈怎么计算“原子的静电势”》(http://sobereva.com/641)
8 其它方法
刘述斌等人将概念密度泛函理论和信息论相结合,发表了很多通过Shannon熵、信息增益等概念预测反应位点和活性的文章,参考比如J. Phys. Chem. A, 119, 8216 (2015)、物理化学学报, 32, 98 (2016)、WIREs Comput. Mol. Sci., 10, e1461 (2019)、J. Phys. Chem. A, 125, 3802 (2021)以及《用Hirshfeld电荷和信息增益研究亲电性和亲核性》(http://sobereva.com/257)。这一类分析方法涉及的量都可以用Multiwfn计算出来,见《使用Multiwfn计算各种与信息论相关的量(information-theoretic quantities)》(http://sobereva.com/537)。
电子定域化函数(ELF)的知识见《ELF综述和重要文献小合集》(http://bbs.keinsci.com/thread-2100-1-1.html),Muliwfn是做ELF分析最强大的程序。ELF在预测和解释反应发生的方位方面有一定应用价值,典型例子见《通过电子定域化函数(ELF)、价层电子密度分析讨论亲核进攻的方向》(http://sobereva.com/606)。电子密度拉普拉斯函数也有类似的作用。
9 分析方法归纳
下面对本文提到的各种概念和方法做一下归纳
全局指数:软度、超软度、亲电指数、亲核指数、亲电描述符
三维函数:福井函数、双描述符、局部软度、局部亲电/亲核指数、ALIE、LEAE、静电势、HOMO/LUMO概率密度分布
直接讨论原子的:简缩福井函数、简缩双描述符、简缩局部(超)软度、(简缩)局部亲电/亲核指数、原子电荷、原子的pi电子布居数、HOMO/LUMO在原子上的成份、ALIE/LEAE/静电势在原子上的极值点数值(如果有极值点的话)以及在局部原子表面上的平均值
直接讨论键的方法:键双描述符、基于NBO的键反应性指数、ALIE/LEAE/静电势在键上方的极值点数值(如果有极值点的话)
用于不同类型的反应位点预测可用的方法:
• 亲电反应:(简缩)福井函数、(简缩)双描述符、键双描述符、(简缩)局部(超)软度、(简缩)局部亲电指数、相对亲电指数、HOMO在原子上的成份、原子电荷、原子的pi电子布居数、ALIE、静电势
• 亲核反应:(简缩)福井函数、(简缩)双描述符、键双描述符、(简缩)局部(超)软度、(简缩)局部亲核指数、相对亲核指数、LUMO在原子上的成份、原子电荷、LEAE、静电势
• 自由基反应:ALIE、(简缩)福井函数、(简缩)局部软度
可以在不同体系间横向对比的方法:(简缩)局部软度、(简缩)局部亲电/亲核指数、原子电荷、ALIE、LEAE、静电势。
10 各种反应位点预测方法的局限性
所有前述预测反应位点、活性的方法都是基于比较简单的物理思想、考虑的模型都比较简单,而有很多影响反应的因素是那些方法都没考虑到的。当它们不可忽视时,本文列举的预测方法都可能明显不准确、与实验观测结果不符。这些因素我总结如下。
• 位阻效应:一些原子可能挡着另一个反应物与反应位点接触而难以反应。反应进行过程中周围的原子也可能起到明显阻碍作用,提升了过渡态的能量
• 反应物结构的扭曲:反应过程中分子结构可能会受迫发生显著变形,令体系能量、势垒明显升高
• 弱相互作用:反应位点周围的基团与反应物之间可能有不可忽视的静电或范德华作用影响反应进行,《直观解释分子间相互作用如何影响不对称催化:Nature Chemistry上一个很好的IGMH分析范例》(http://sobereva.com/700)是一个典型情况
• 特殊电子结构效应:比如在某个位点反应时在过渡态结构下由于显著的超共轭作用明显降低势垒
• 协同效应:在一个位点反应时,可能还同步伴随着其它成键/断键过程
• 溶剂效应:溶剂环境对反应物产生的外场效应,以及溶质-溶剂间氢键等明确的相互作用
• 反应物和产物的扩散运动能力
• 逆反应的快慢、产物的稳定化、多步反应的后续步骤、实验上存在的催化效应等