在Gaussian中计算IRC的方法和常见问题

在Gaussian中计算IRC的方法和常见问题

Methods and FAQs for calculating IRC in Gaussian

First release: 2018-Jan-4 Last update: 2020-Sep-14

0 前言

IRC是量子化学研究化学反应的重要概念，它是质权坐标下连接势能面相邻两个极小点的能量最低路径，描述了化学过程在不考虑热运动因素下最理想的结构变化轨迹，对于讨论微观化学过程至关重要，而且也是验证过渡态找没找对的最决定性的方法。在无数年前笔者写的《过渡态、反应路径的计算方法及相关问题》（http://sobereva.com/44）中有很多介绍和讨论，建议看看。

在Gaussian中计算IRC的问题是笔者在网上被问及最多的问题类型之一，在计算化学公社论坛(http://bbs.keinsci.com)和思想家公社QQ群里属于半周经问题。为了免得日后反复重复回答大量相似问题，决定写个文章专门说一下。下文先说一下Gaussian中产生IRC的方法，然后再集中回答一下我常被问及的各种与IRC有关的问题。还有很多其它和做IRC有关的知识，限于时间精力以及表达形式的限制就不写在这里了，在笔者讲授的北京科音初级量子化学培训班（http://www.keinsci.com/workshop/KEQC_content.html）里对IRC和相关问题有比本文全面详细得多的讲解，给了十分丰富的例子。在面向已有一定基础的研究者开设的北京科音基础（中级）量子化学培训班（http://www.keinsci.com/workshop/KBQC_content.html）里对这部分内容讲授得明显更深入，并传授更多经验技巧，欢迎参加！

笔者还另外写了一篇和IRC有密切关系的文章《谈谈Gaussian产生downhill路径的功能》（http://sobereva.com/571），是Gaussian的IRC功能的一个特殊用法，推荐在看完本文后阅读。

本文内容适用于Gaussian09和16。

1 在Gaussian中产生IRC的方法

在产生IRC之前，必须先进行过渡态(TS)优化。必须以过渡态的结构为初始结构，才能进行IRC任务。既可以将优化出的TS结构直接写在IRC输入文件里，也可以用geom=check关键词从优化TS任务的.chk文件里读取最后一帧结构。

下面是一个最简单、典型的找TS+走IRC的过程：
(a)在gview里凭借化学直觉将体系摆成尽可能接近于过渡态的结构，保存输入文件为TS.gjf。
(b)将TS.gjf里的关键词设为# B3LYP/6-31G* opt(calcfc,noeigen,TS)，用Gaussian执行之
(c)打开上一步任务的输出文件，保存成输入文件IRC.gjf
(d)将IRC.gjf里的关键词设为# B3LYP/6-31G* IRC=calcfc，用Gaussian运行即可得到IRC。此任务出现报错几率很大，仔细耐心阅读完本文就知道怎么办了。

IRC任务特别需要注意的一点是，产生IRC和找过渡态用的计算级别必须严格一样！确切来说，任何影响势能面的设定必须严格相同（如果你不知道哪些会产生影响，比较修改前后单点能是否有差异便知）。比如找过渡态用了int=ultrafine scrf(SMD,solvent=ethanol)，那么产生IRC的时候也必须写上int=ultrafine scrf(SMD,solvent=ethanol)，否则相当于两个任务的势能面并不相同，走IRC也就不是从势能面的准确的一阶鞍点来走的，此时IRC任务要么出错，要么结果无意义。

Gaussian09/16支持多种产生IRC的算法，比较主要的三个在这里说一下：
LQA(Local quadratic approximation)：这是非常传统的一种IRC产生算法，1988年提出了，每一步都需要利用Hessian矩阵。
HPC(Hessian-based Predictor-Corrector)：2004年由Gaussian作者之一Schlegel提出，这是G09/16默认的算法。这个方法产生IRC每一个点的时候，是将LQA方法作为预测步(predictor)，再用修改的Bulrisch-Stoer方法做为校正步(corrector)。这样“预测+校正”结合起来，精度比只用LQA更好，而耗时增加不多。此方法校正步的计算过程是一个迭代过程，众所周知，只要有迭代，就会伴随着不收敛的可能。HPC方法的一个最大问题，正是做校正步的时候经常不收敛，导致网上问Gaussian的IRC问题的多半都是问这个。
GS2：1989年提出，GS是Gonzalez-Schlegel的缩写。这是G03默认的算法，在《过渡态、反应路径的计算方法及相关问题》里有详细介绍。此方法之所以不再是如今版本默认的，是因为此方法耗时比HPC高很多，每一步都相当于做一次限制性优化。
Gaussian里还支持其它方法，诸如DVV、EulerPC等，由于平时用不到，所以就不提了。

走IRC时，对初始结构需通过calcfc关键词来产生精确的Hessian矩阵。LQA和HPC方法走每一步的时候也都需要Hessian矩阵，默认情况下是通过Bofill方法基于梯度和前一步的Hessian近似产生的。如果你在IRC里用calcall关键词代替calcfc，则每一步的Hessian矩阵都会精确生成，显然IRC走得也会更准确，但是耗时会暴增一个数量级甚至更多。也可以在写calcfc的同时用recalc=n关键词，此时每n步才会精确重算一次Hessian矩阵。显然，n越小越准确，耗时也越高，n=1时和calcall是等价的。

走IRC默认是先往反应路径一边走，之后再往另一边走，两边的路径和初始的TS结构合在一起就是完整的IRC。IRC每一帧结构对应一个反应坐标和一个能量，通常将IRC以“能量vs反应坐标”绘制成曲线图表示。在Gaussian中IRC任务的初始结构（过渡态结构）被作为反应坐标的零点，往反应物一侧反应坐标为负，往产物一侧反应坐标为正（但有时也可能是和实际情况反过来的，看后文）。Gaussian给出的反应坐标单位是amu^1/2 Bohr，这里amu是指atomic mass unit，有amu^1/2这项是因为IRC是在质权坐标下定义的。

由于IRC是在质权坐标下定义的，因此结果受同位素质量设定的影响，这里有具体例子展现同位素产生的影响《谈谈温度、压力、同位素设定对量子化学计算结果产生的影响》（http://sobereva.com/423）。如果在IRC里写上Cartesian关键词，代表在笛卡尔坐标下执行IRC任务，此时结果就不叫IRC了，确切来说叫做MEP（minimal energy path，极小能量路径）。笔者时不时看到有的菜鸟莫名其妙地在IRC里写了个cartesian关键词，明明他都不知道这是什么含义就瞎写，明显是被以讹传讹了，而且还是不求甚解就知道盲目模仿。

在IRC里可以用Reverse或Forward关键词让程序只往逆方向或者正方向一侧走IRC。经常有人问诸如怎么我写的是Reverse，但是Gaussian反倒往产物方向走了？或者，我让程序往两边走，走出来的IRC怎么左边是产物右边是反应物？那是因为哪边是反应物哪边是产物只有研究者自己知道，Gaussian知道的只是那是两个不同方向而已。如果你想明确让Gaussian知道指定哪边是正方向哪边是逆方向，需要在IRC里利用Phase关键词定义。

走完IRC后，可以用gview打开输出文件，在窗口左上角切换帧号可观看IRC每一帧结构，或者点绿色圆点播放IRC轨迹。IRC轨迹动画可以通过File - Save Movie - Save Movie File保存出来。IRC的“能量vs反应坐标”图可以用Results - IRC/Path来观看，点击图的左上角的Plots - Plot Molecular Property还可以把几何参数等信息随反应坐标的图绘制出来，在图上点右键还可以将数据点导出，用来在Origin之类程序里绘制和调节达到更好效果。

走IRC有两个参数非常关键：
(1)Maxpoints：设定的是每个方向走的步数，默认为10。比如设Maxpoints=20且让IRC往两边走，则IRC总共最多走1+2*20=41个点，其中1是过渡态那个点。注意maxpoints设的是步数上限，因为走IRC时，如果已经走到了被程序自动判断是离极小点很近的位置了，则IRC就认为这个方向的IRC已经产生完毕了，会提示PES minimum detected，然后就开始走另一头了。如果两头都走完了，就输出汇总信息然后正常结束了。maxpoints设的越大，显然IRC可能走的点数就越多，总耗时也会越高。
(2)Stepsize：设的是IRC步长，默认为10。如果设的是正值，则单位是0.01 Bohr，如果设的是负值，则单位是0.01 amu^1/2 Bohr。比如你设stepsize=20，则步长就是0.2 Bohr，由于默认情况下IRC任务是在质权坐标下做的，因此程序会自动转换为以amu^1/2 Bohr为单位的质权坐标下的步长，仔细看输出文件就能找到相应信息。stepsize设得越小，IRC越准确、曲线越光滑，IRC轨迹震荡情况越不容易出现；stepsize设得越大，则IRC越不准确，曲线越可能出现褶皱，观看IRC轨迹时也越可能看到结构震荡现象，在用HPC方法的时候还越容易出现校正步不收敛而报错的问题。

为了更直观看到stepsize对IRC产生的影响，以及LQA和HPC的差异，这里给出HPC原文里的图，这是对一个模型势能面Muller-Brown surface走IRC的情况：

由图可见，相同步长情况下，右图的HPC方法跑出的IRC的点比左图的LQA方法更接近于精确的IRC曲线（实线），因为引入了校正步。而带来的代价就是在实际研究中很容易出现校正步不收敛问题。从上图也看出，IRC步长设得越小，走的IRC点也越接近精确路径，反之误差越大。在LQA方法结合0.2 Bohr步长（默认的stepsize的两倍）时走出的IRC已经误差挺明显了。

maxpoints和stepsize共同决定IRC最多能走多长，即每一侧长度上限是maxpoints*stepsize。默认设定下，IRC只能跑出与TS比较接近的一段，如果你想让IRC跑得更长，显然要么增加maxpoints要么增大stepsize。增大maxpoints会增加耗时，而增大stepsize，则会导致IRC精度下降、HPC方法容易因校正步不收敛而出错。

不同反应的反应路径的总长度是不同的，可能某个设定下对A反应已经把IRC跑得很完整了，但是对于B反应，IRC的两个端点距离反应物和产物极小点还尚有不小距离。要判断IRC是否跑得比较完整，可以看“能量vs反应坐标”两端曲线是否已经接近水平了，也可以看gview在“能量vs反应坐标”图下方给出的“受力vs反应坐标”图，如果两端的点的受力已经比较接近0了，也说明接近极小点了，跑得较完整了。

到底maxpoints和stepsize应该怎么设合适？这要看你跑IRC到底想干嘛，以下是笔者的建议：
(a)验证过渡态找没找对：对于这个目的，IRC只要跑一小段就足够看出趋势了，也不需要IRC跑得质量多高。maxpoints用默认即可，stepsize可以设大到15或20，从而在不增加计算量的前提下能比默认时稍微跑长一些。建议加上LQA关键词避免HPC方法因校正步不收敛而中断。
(b)获得近似的反应物和产物结构：一切同上，但是把maxpoints设50甚至更大，从而使IRC尽可能跑完整。
(c)获得高质量、完整的IRC曲线：这主要是用于发文章目的，粗糙、不光滑的IRC曲线图放到文章中肯定会遭人嫌，我们也希望IRC尽量跑完整从而能够充分描述整个反应历程。为了让IRC质量高，可以把stepsize设小到5。由于设小了步长，又想要IRC完整，maxpoints必须设很大，比如200。如果此时跑出来的IRC还是不平滑，或者因HPC方法的校正步不收敛而中途报错中断，应再加上calcall重新跑。如果计算能力不足用不起calcall，也可以用比如recalc=3或5。

2 一些与IRC相关的常见问题

看这一节之前应确保已经仔细阅读、充分理解了上一节的文字。

Q：IRC任务报错啦！末尾提示Maximum number of corrector steps exceded咋办？
A：这就是前面反复说的HPC方法校正步不收敛。有以下办法：
(1)用LQA，比如IRC(calcfc,LQA)，由于此时不涉及校正步了，因此100%解决问题。但这容易造成IRC不够准确、不光滑。
(2)如果你不希望用LQA在避免报错的同时牺牲IRC精度，则尝试减小步长（越小避免报错的几率越高），比如用IRC(calcfc,stepsize=5)。或者加上calcall，若嫌太昂贵就改用recalc=x（x越小避免报错的几率越高，但也越昂贵）。
(3)改用GS2算法，即IRC(calcfc,GS2)，可完全避免以上报错。耗时比LQA高得多，但精度也比LQA好。
(4)IRC里加上ReCorrect=never，这使得HPC方法不做校正步，故也完全避免以上报错。此时耗时和LQA相同，但所得IRC精度不如LQA，因此强烈不建议用。
(5)IRC里加上maxcyc=N（N应大于默认的20）来加大HPC校正步迭代次数上限。笔者时常在菜鸟的IRC输入文件里看到这关键词，笔者强烈不建议用。虽然此方法不是说解决问题的可能性精确为0%，但可能性实在甚微，没有试的必要。“不收敛就直接加大循环次数上限”是菜鸟最常见的思维方式。

顺带一提，有时笔者看到有人的IRC输入文件里在IRC里用了tight，这是用来把校正步收敛限设得更严的，用这个完全是莫名其妙，也不知道从哪里学来的。本来默认的收敛限下就容易不收敛，居然还给设得更严，明显会导致出现上述报错的几率大增。

Q：怎么IRC刚走了几步就正常结束了？怎么IRC走出来的两侧的曲线是相同的？
A：此问题是继上一个问题在网上被问得最多的与IRC有关的问题。出现这种问题都是因为优化过渡态时定位准确度不够。看下图，当优化出的过渡态位置不准确时，结构就不是在IRC的极大点了，而是稍微偏离一些的红球的地方

出现这种情况时，往右边产生IRC能正常产生，但是从红球位置往左边产生IRC时，还没怎么走，程序就发现能量升高了，误以为IRC已经走到了离极小点很近的位置，于是就不再继续走了，就正常结束了。还有一种情况，是刚往左边走IRC，由于体系受力是冲着右边的，导致马上转了个弯就往右边走了，就呈现了IRC左右两边曲线都一样的结果。

对这个问题，应按照以下方式排查和尝试解决
(1)先确保初始结构是之前优化TS得到的结构，而且过渡态优化和走IRC都是在严格相同级别下进行的。
(2)提高过渡态定位精度。在找过渡态时候用tight，对于DFT再同时结合int=ultrafine（此时产生IRC也必须用int=ultrafine）。如果还不行，优化过渡态时用calcall（或者用诸如recalc=3）。
(3)如果反复尝试了(2)的方法还是不行，或者你不想尝试(2)，毕竟会增加很多耗时，那也可以尝试增大IRC步长，比如20乃至30。由于步长大了，从上图红球的位置往左走的时候可能一下子就越过了TS，之后就能正常继续往左产生IRC了。不过步长大了容易导致HPC校正步不收敛、IRC不准确不平滑等问题，怎么考虑和处理前面已经说了。

另外，出现这种问题还有一种可能是在IRC任务中，基于自动初猜的波函数做SCF后收敛到的波函数与找过渡态任务最终得到的波函数不同，此时相当于IRC任务所在的势能面和过渡态搜索任务所在的势能面不同，这也会导致IRC异常，因为类似于违背了前述的走IRC的“任何影响势能面的设定必须严格相同”的这个前提。出现这种情况时，你会发现IRC任务第一次输出的SCF Done能量和找过渡态最后一步的SCF Done能量明显不同。为解决此问题，走IRC的时候可以用guess=read关键词，从优化过渡态的chk文件中读取最后的波函数（并且最好用forward和reverse关键词通过两个任务分别跑正向和逆向IRC），这样通常可以确保IRC任务所在的势能面和优化过渡态时相同。

用SMD溶剂模型时，也可能个别时候由于数值噪音问题出现IRC走几步就停了的现象。可将优化和走IRC用的溶剂模型都改为IEFPCM再试，说不定能解决。

Q：我的IRC怎么成这样了？怎么有个点跑到下头去了？

A：即便IRC任务还在算着，也可以用gview打开输出文件看看走到第多少步了，检查是否正常。当IRC还没有走完的时候就打开输出文件，或者看的是IRC失败的任务的输出文件，往往就会看到中间有一个点突然掉下去的现象。任务正常结束后再看就不会有这个现象。

Q：走出来的IRC最两端的点是反应物和产物结构么？
A：否。IRC和几何优化不一样，几何优化的步长是随机应变的，而IRC的步长是固定的。从TS开始走，即便把maxpoints设得非常大，stepsize设得很小，来让IRC跑得又完整质量又高，也注定不可能恰好有一个IRC点正好落在与反应物或产物对应的极小点的位置。因此，必须对IRC两端的点进一步做几何优化才能得到准确的反应物或产物结构。

Q：为什么我看IRC趋势是对的，我对IRC两边的点优化，优化得到的结构却不是我想要的极小点结构？
A：有两种可能：
(1)与这个TS直接连通的极小点本来就是那样。由于你的IRC跑得还太短，在加上你的化学直觉不准，导致并没有估计对真正极小点结构。可以让IRC尽量跑完整一些来检验。
(2)优化的时候由于走得步子太大，或者Hessian矩阵不准确，导致优化到了其它邻近的极小点去。此时可以在优化时用较小的步长上限并结合notrust（相关信息看《量子化学计算中帮助几何优化收敛的常用方法》http://sobereva.com/164），或者结合calcall/recalc=x提供精确Hessian矩阵，或者先把IRC跑得尽量长一些，使两端结构尽可能接近极小点时再做几何优化。

Q：柔性扫描和IRC有什么区别？柔性扫描能代替IRC么？
A：二者概念完全不同，不能代替。IRC是从TS开始顺着虚频方向，沿着梯度负方向移动结构走出来的轨迹，所有坐标是同步变化的。而柔性扫描，是令某个（或某些）坐标以特定方式不断改变，每次都优化其余所有变量所得到的（限制性优化），故所有变量间的变化不是协同的，得到的能量变化曲线与IRC也是大相径庭的。柔性扫描曲线及其轨迹经常会出现突跃，而不像IRC那样总是平滑变化。不过，当某个化学过程主要只涉及一个变量发生变化的话，柔性扫描这个变量和走IRC产生的曲线倒是比较相近，此时如果你用的计算级别没有解析Hessian而不容易走IRC的话，用柔性扫描也未尝不可（比如当年没有TDDFT解析Hessian的时代，由于不方便找TS走IRC，对激发态质子转移过程的研究经常是靠柔性扫描来代替）。

关于柔性扫描，建议阅读《详谈使用Gaussian做势能面扫描》（http://sobereva.com/474）。

Q：我的IRC曲线在过渡态位置怎么特别尖/不平滑，貌似不对劲？
A：应当确认初始结构是优化过的过渡态结构，并且找过渡态和走IRC用的计算级别（包括任何能够影响单点能的因素）严格相同。如果你就是这样做的，那么尝试增加过渡态的定位精度，比如优化过渡态时用tight收敛限、calcall/recalc=x、增加积分格点精度等。如果这些也都试了，走IRC时用GS2算法，或加上calcall试试。另外也要确保IRC任务第一步收敛到的波函数与过渡态搜索最后一步相同，这在前面已经说过了。

Q：IRC任务如何续算？
在IRC里添加restart关键词即可，例如IRC(restart,maxpoint=15) b3lyp/6-31g(d)。此时%chk应当和之前中断的IRC任务相同。

Q：我发现之前IRC跑得不够长，如何在不完全重算的前提下在两侧再增加一些点？
A：比如maxpoints=15的设定下IRC任务已经正常跑完，现在还想两个方向各增加5个，执行IRC(restart,maxpoint=20)，%chk应当和之前的IRC任务相同。

注意gview观看restart得到的IRC轨迹要打开chk/fch文件，而不要打开out/log文件，否则看到的只是续跑出来的点。

Q：IRC任务出现L502错误怎么办？
A：这是走IRC过程中出现了SCF不收敛所导致。按照常规解决SCF不收敛的方法尝试添加适当的关键词解决，见《解决SCF不收敛问题的方法》（http://sobereva.com/61）。除此以外，如果是IRC任务第一次做SCF就没收敛，而且之前opt任务的chk文件还在，可以做IRC任务时加上guess=read读取其中收敛的波函数当初猜。如果是IRC中途某个点SCF不收敛，也可以减小IRC步长，因为IRC的每个点会自动沿用上个点收敛的波函数当初猜，显然二者结构相差越小，那么上个点收敛的波函数就是这个点越好的初猜波函数。

Q：我的IRC看起来比较怪，合理么？怎么边上还凸起来一块？（下图为笔者随便找的例子）

A：很正常。只要确信自己计算流程合理，而且轨迹看着无异常，TS位置曲线也平滑，就没有问题。出现诸如肩峰往往暗示这个反应涉及的电子结构变化复杂，可能整个反应虽然是一步，却呈现出两个阶段，应当结合结构变化特征、波函数分析手段（比如用Multiwfn分析反应过程中键级、ELF、密度差、原子电荷变化等）予以考察。

Q：我的理论方法支持解析梯度但不支持解析Hessian（比如CCSD），怎么跑找TS并且跑IRC？
A：先说此时怎么找TS。有两类做法：
(1)纯依赖于梯度的方法
用CCSD/cc-pVDZ opt(TS,modRedundant,noeigen)或者opt(TS,gediis,noeigen)或QST2/3，这些过渡态搜索关键词都不需要提供初始Hessian
(2)基于半数值Hessian的方法
把初猜TS结构的Hessian矩阵存到chk文件里：# CCSD/cc-pVDZ freq（这步耗时很高）
从chk里读Hessian矩阵并优化TS：# CCSD/cc-pVDZ opt(TS,noeigen,readfc)

找到TS结构后，使用这个关键词即可生成IRC：CCSD/cc-pVDZ IRC(gradientonly,euler)。这里gradientonly代表使用只依赖于梯度的IRC算法，默认是DVV方法，由于结果烂到爆，所以改成相对好点的Euler方法，但质量也不怎么样，经常震荡得很厉害。

Q：我怎么对IRC过程做波函数分析，考察电子结构随反应过程的变化？
A：参看《产生Gaussian的IRC和SCAN任务每个点的波函数文件的工具》（http://sobereva.com/199）、《通过键级曲线和ELF/LOL/RDG等值面动画研究化学反应过程》（http://sobereva.com/200）。

Q：我之前对过渡态已经做过振动分析了，chk里已经有了过渡态结构下的Hessian矩阵，能否在IRC计算时直接读取之，避免用calcfc计算Hessian以节约时间？
A：完全可以，对较大体系也推荐这么做。在IRC里加上rcfc关键词即可，此时就不需要写calcfc了，程序会从%chk文件中直接读取Hessian矩阵来用。

0 前言

1 在Gaussian中产生IRC的方法

2 一些与IRC相关的常见问题

分类

友情链接

其它