为什么我极度鄙视和厌恶百毒

为什么我极度鄙视和厌恶百毒

Why do I despise and hate Baidu so much?

文/Sobereva

 First release: 2018-Dec-3  Last update: 2020-Oct-25


我对百毒的鄙视和厌恶由来已久,早就想写此文,但一直没空。正好昨天有个人在我的一个两千多人的专业的科研群里大肆鼓吹使用百毒、百毒学术、百毒文库,结果被笔者和群友一通批判。我对百毒真是不吐不快,借此机会我把此文写出来,使他人能全面了解笔者对百毒的态度。本文仅代表我现阶段的看法和我撰文时的情况。

有人竟以为我不了解百毒,还说我对百毒的态度不客观,怎么可能?我向来不会对我不了解的事物轻易做出评价,我但凡批判某个产品、服务,我必然亲自体验过。我从零几年那会儿开始使用百毒,当时没觉得百毒糟糕到如今这份儿上,觉得搜搜中文的东西还行,那时候Google也还在国内市场。在Google被迫害得不得不为了尊严退出天朝后,逐渐地,百毒做出的各种事越来越令我唾弃和生气。如今我但凡在我的群和论坛里看到有人提到“用百毒”、“百毒一下”,我就很不愉快。

下面我就对百毒的各种产品依次说说我的看法和使用经历。


1 百毒搜索

我从来不会对任何东西一棒子打死,百毒搜索在某些方面确实不错,搜索三俗、八卦、天朝娱乐、市井生活、闲人关注的国内社会头条之类的信息,或许Google还真比不上,但是但凡搜索点专业性、有知识性的东西,百毒和Google比完全是废柴,搜索质量差得远,如果还要搜英文,那百毒基本就是废物,用bing也比那强得多得多。

我在一篇介绍量子化学研究怎么入门的文章里,为了避免初学者们用他们平日最爱用的百毒搜索专业性资料结果搜出烂七八糟低劣信息而误入歧途、搜不到真正有价值的信息而导致科研无法有效进展,笔者对百毒给予了这样的描述,充分表达了我的态度:

千万别用百毒!百毒是搜什么的?那是用来搜娱乐八卦、有害、坑爹、低级趣味信息的,这么low的东西怎么能用来搜索学术信息?在笔者来看,百毒搜索是几乎最下作、最没素质、最唯利是图的公司搞的最糟糕的搜索引擎,搜索出的信息质量极差,对你最有价值的信息多数情况搜不到,反倒是垃圾、无意义、低水平的信息的权重贼老高,占满了搜索呈现页面,往往你得翻好几页才能找到点靠谱的信息,笔者对此体会太深了。而且,除了计算化学公社论坛、思想家公社blog等地方外,富有价值的量化方面的资料大部分是外文的,百毒这种东西连中文的学术方面的信息都搜不利落,用它试图搜索出对你有用的外文资料那更是天方夜谭。根本甭指望百毒对你的科研工作能有什么帮助,它纯粹是在浪费你的时间,越用百毒科研水平越低,而勤用Google才能令你登上更高台阶。千万别在高水平的讨论群和论坛说什么“我用百毒搜了xxx”、“百毒一下”,这一定会遭被群嘲。搜索学术信息,百毒至多至多给本科生用,而研究生及以上的人还用百毒这么弱智的东西只会被同行笑话。

百毒作为本土搜索引擎,搜英文信息的能力跟Google比基本为0。由于定位不同,这可以接受,然而百毒搜中文稍带点专业性的信息还那么差劲,还比外来的Google差那么多,这怎么说得过去?最为关键的是,百毒搜出来的中文信息还经常有严重误导性!这使我不仅瞧不起百毒,更是极度反感百毒!

我同时运营网站、论坛、博客,我对百毒搜索的认识不可能比自己不运营站点的百毒的用户低。百毒搜索的权重机制极其坑爹。经常关注互联网计算化学的内行人,我想大多都能体会到计算化学公社论坛里的信息水准比某虫强不知多少、可靠度和价值不知高多少,甚至用金子vs泥巴的比喻都不过分。然而搜索一个关键词,如果是公社和某虫里的帖子都有涉及的话,某虫的权重总是比公社高得多得多,于是初学者们就傻乎乎地点开头的几个页面,进入某虫的帖子,被一些低水平、小白充大神的言论给坑了,或者看到的都是一些为了赚积分发的垃圾回复,顿感失望。然而这种现象用Google就决不会出现,Google总是能把有价值的、靠谱、有用的信息呈现在最上面,或者至少在第一页里,公社论坛的连接在Google里很容易得到呈现。

可能有对SEO一知半解的人会说,这种情况是你不搞SEO所致。这些人岂知我在公社论坛对百毒的SEO上已经算是煞费苦心(虽然我根本不用百毒搜正经东西,但奈何初学者、外行人总用百毒),甚至为此还花钱买了一些专门的插件主动向百毒搜索推送,奈何百毒的权重机制实在太垃圾,不管怎么搞,想让百毒搜索呈现出论坛信息能达到Google的哪怕1/5的质量,都是不可能的。而我对Google根本没有做任何特意的SEO,Google都能认清公社论坛上信息的高质量和原创性,能很好地把公社论坛上的信息呈现给搜索者。

百毒搜索在抓取帖子方面也非常蠢。很多百毒搜出来的公社论坛链接,点进去只能进入论坛首页,而没法抵达对应的帖子。不要说这是论坛自己的问题,因为Google就根本没这个问题。而且,百毒对公社论坛帖子的收录也非常差,大量高质量的帖子是根本就没被索引进去,即便用户将搜索范围限定于公社论坛的域名,也根本搜不到帖子。这是为什么我在公社论坛首页只给了公社论坛全文的Google搜索框而没有百毒搜索框,而且特意在旁边写了一句:绝对不要用百毒搜索本论坛!

或许有人觉得批百毒的文章怎么成了给论坛做广告的文章了。笔者绝非给自己做广告,而是阐明百毒搜索质量烂的普遍的现象。有无数高度专业性、讨论内容颇具价值的论坛都使用了和公社论坛相仿佛的架构,百毒难以呈现公社论坛,也就意味着无法很好呈现那些论坛的信息(我专门尝试和验证过)。因此好好想想,用百毒搜索专业性内容时,会错失多少对自己特别重要、有价值的信息?

百毒对于原创性的判断也巨烂。比如我在我的博客上明确强调,他人不得把文章向其它站点转载(只能转链接),可总是有不守规矩的人肆意转载我的博文到其它地方去,用百毒搜索文章标题或内容的时候,经常看到竟然我原始发布博文的地址的权重比起未经授权瞎转载的还低!这种事,在Google上就不会发生,起码我还没见过我首发文章的地方的权重被他人转载的地方压下去过。

百毒编入索引的效率也非常差劲。比如我在我的博客上写个新文章,<=两天就可以被Google搜到,然而要被百毒搜到,往往得十天半个月,甚至根本一直也搜不到。而且这还是我给博客刻意装了向百毒推送的插件的情况(每次新文章发布都会自动向百毒推送),结果百毒还这么烂,真是无可救药。

就算抛开专业性信息的搜索不谈,即便在很多老百姓眼里,百毒口碑也是很烂、即便倒闭也丝毫不值得同情的。百毒的竞价排名众所周知,一些为非作歹的机构花钱把自己的宣传搞到百毒搜索最显眼的位置,导致很多人被坑得家破人亡。现在在百毒上随便搜点什么,一开始的N条往往全都是广告信息,非常讨厌。

之前我还经常接到电话,问我要不要花钱做百毒推广,这帮人真是一心就想着捞钱,可讨厌可没素质了!

还有值得一提的事就是之前公社论坛出现了山寨版,而且还不止一次。简单来说,是一些下作之人,利用反向代理技术,使得他人访问某个非公社论坛的域名时会连到公社论坛的服务器上,而呈现给访问者的页面中被那些歹人自动加上广告条,甚至还把论坛里的我的论坛和博文的链接地址全都自动给替换掉。这些人的伎俩在我不懈努力下最后终于通过技术手段解决了。在此之前,这些山寨版论坛大肆出现在百毒搜索结果里,而且假论坛的地址居然还经常出现在原版论坛链接地址的前面,可见百毒权重是何等愚蠢;而Google上也会搜到假论坛链接,但从没被排到原版论坛前头。我曾在百毒搜索结果上点击举报,花了好几百字,上传了截图,将情况十分详细地进行了描述。稍微有点判断能力的人都知道哪个是真的哪个是假的,我提供的证据绝对足够翔实、确凿,只要百毒直接把山寨站点从搜索结果中屏蔽就能圆满解决。可百毒反馈的结果是,非得让我提供各种个人和机构的各种证件,记得还得提供什么律师事务所提供的什么资料,得寄过去,要求的内容简直就跟打官司一样!这明摆着体现出百毒对自己搜出来的东西毫不负责任,就算明知道有假冒害人的东西堂而皇之出现于搜索结果之中,只要和百毒自己的利益没有半毛关系,也完全坐视不理。

另外我再举个例子说明Google总是比百毒聪明得多。Multiwfn的主页2017年4月的时候就从multiwfn.codeplex.com迁移到了现在的sobereva.com/multiwfn。目前用Google搜Multiwfn,排位第一的是现在的站点,排位第二的是我最希望所有Multiwfn初学者看到的《Multiwfn入门tips》,这也确实是浏览量最大的Multiwfn相关博文之一;而百度搜Multiwfn,第一位的还是旧的站点,第二位的是不那么重要的关于Multiwfn 3.5发布的帖子。可见Google可以更好地把使用者引向他们最需要的地方去。

2019-Jan-23补充:最近有一篇《搜索引擎百度已死》在网上迅速流传,可以看看这个帖子里给的链接http://bbs.keinsci.com/thread-12040-1-1.html。这文章说得太对了,百毒自己旗下的东西、经由百毒提供的平台发布的东西,不分质量、不分可靠性、不分对错,权重都贼老高,简直沦为了自家私有信息的搜索工具。这帖子的回帖中还有位学术水平很高的教授,是百毒百科的严重受害者,当初为了图方便用了百毒,得到了完全错误的信息,结果白耽误了三个月的科研。如果当初用Google搜Sc的话,第一条就是wiki,进去立刻就可以看到正确的同位素信息。QQ群群友Liyuanhe还对比了用Google和百毒分别搜Sc isotope,google第一条就给出正确答案,而百毒第一页根本都没有网址对应的是Sc的同位素信息,唯一一条和同位素有关的页面竟然还是Co的。可见百毒对于学术研究来说是纯粹搞笑用的,对科研工作者祸害无穷。

2020-Oct-25补充:近来有个人在思想家公社QQ群里问

看得我要吐血,搜两条两条都是错的,这充分体现出百毒有多坑!在Google上,直接搜kcal kJ,立马就告诉你正确答案1 kcal=4.184 kJ,比百毒强百倍不止!

2021-Feb-5补充:思想家公社2号群有一天有人提到“百毒也不能用了,查julia这个语言,它出来娱乐圈动态”,我就顺手一搜,真是震惊了,这真是又一个鲜活地体现巨大差距的例子啊!


2 百毒学术

Google学术搜索简直好得不能再好,是我从事科研必不可少的工具。然而百毒学术完全就是Google学术搜索的极其低劣的山寨版。百毒学术里搜一篇我的JCC的文章,进去后,居然整个页面里连一个原文链接都找不到!就光凭这一点,百毒学术有什么用?里面杂七杂八的链接到不少,万方、ResearchGate、ProQuest、NCBI之类一大堆,甚至还有其它出版社的,非得点击“查看更多”才能最终找到Wiley上的原文链接,明摆着设计百毒学术的人要么自己没搞过科研,要么就是别有用心。居然这么差劲的百毒学术还有人用,还用得挺开心,真是匪夷所思。这文章页面里也有DOI号,有DOI号通过http://www.doi.org就可以到达原文链接,但干嘛百毒学术的页面里不直接根据DOI给个通过http://www.doi.org连过去的链接?真是不可理喻。

而且百毒学术的“引用走势”也极其荒诞,比如我2012年的一篇文章,上面显示1980年就已经有一次引用了,真是开玩笑。而且统计出的引用的累加量只有Web of science或者Google学术统计出来的不到三分之一。这种引用走势,要么取消,要保留就不要误导使用者。

还有文章的关键词,也是胡搞瞎搞,比如文章内容是波函数分析,居然自动产生这种跟内容毫不沾边的关键词:program interface/ A0365G Solutions of wave equations: bound state in quantum theory A0240 Geometry, differential geometry, and topology B7210N Network and spectrum analysers。

而且,点击文章页面里的作者名,居然提示“您是不是要找:  titan lu”,中国人哪有名里面有titan的?瞎出什么馊主意?

百毒学术纳入新文章的效率也特别低,期刊上近期出版的文章,Google学术上立马就有了,而百毒学术上根本就搜不到。

还有人用百毒学术导出文章引用,还自以为很方便,然而这引用根本都不和规矩,甚至严重坑爹。比如DOI: 10.1063/1.4949536这一篇,明明作者是Jonathon Witte, Jeffrey B. Neaton, Martin Head-Gordon,居然百毒学术给出的引用是Neaton, Jeffrey B , and M. Headgordon,第一作者都没了,最后一个作者的姓还不对。而且文章本来是J. Chem. Phys. 144, 194306 (2016),居然百毒学术里给的页码居然是A1133,而A1133是从这篇文章引用的第一篇文章W. Kohn and L. Sham, Phys. Rev. 140, A1133 (1965)里来的。百毒学术之愚蠢真是难以置信!有的人似乎还以为只有百毒学术能导出引用,竟然不知道Google学术、出版社的文章页面里全都能导出引用,而且引用还是完全靠谱的。

百毒还弄了个文献求助平台,还得要什么财富值,真是无聊透顶。

总之,真是难以置信百毒学术这么差的东西居然在国内还能有市场。或许在底端学术圈还真有市场,比如本科生范畴。


3 百毒百科

百毒百科的条目质量给普通不懂学术的老百姓用用还行,对于专门搞研究的人基本毫无参考价值,经常会严重误导外行人。可信度比中文wiki差得远,更是比英文wiki差十万八千里。

百毒百科曾经最令我火的一次是因为我开发的Multiwfn程序的百毒百科条目,我在这里对情况有充分的描述:http://bbs.keinsci.com/thread-5521-1-1.html,本文不再累述。


4 百毒文库

百毒文库可谓百毒的无耻的集大成表现。很多人写的博文、文档都是免费发在互联网上的,却被一些人在未经原作者允许的情况下传到百毒文库里,下载需要下载券,得付费才能获得。笔者在博客里写过的大量计算化学相关博文,就被一些小人这么给转过去了,而且更可恶的是,转过去的时候把我的署名还都给删了,真是卑鄙!不仅如此,我的文章被残缺不全地搞到百毒文库后,搜索我文章里的相关内容时,百毒文库里这些非法转载的资料出现的权重却经常远高于我的博文原始地址!

百毒文库里还有不少期刊文章,那些文章有的本来是免费就能访问的,有的是在出版机构网站上需要付费访问的,但这些资料被弄到百毒文库去之后经常成了需要下载券的。对比一下sci-hub,sci-hub虽然从法律上说确实侵权、确实不妥,但那上面海量论文、书籍,都是完全免费下载的,sci-hub是真心为了学术自由、提升全人类科技水平的整体进步而创立的,创建者有着高尚的情操,笔者从sci-hub上下载过的文章无数,受益极大(我还主动向sci-hub捐过100刀)。相比之下,百毒文库是何等卑微!可能有人觉得那些资料不是百毒自己传上去的,但百毒在监管上负有不可推卸的责任,很多明摆着不是上传者自己原创的东西,有什么资格在下载时候要下载券?审核时候怎么不把关?虽然百毒文库上有举报侵权按钮,但还得提供保证函、身份证复印件,还得扫描发过去,大多数人根本懒得折腾,何况提交上去后极大可能还会因为百毒声称提交的证据不足而拒绝把资料撤下来。此外,百毒文库上还有大批量的广告,相当讨厌。


5 百毒空间

最早本博客是在百毒空间上建立的,大概是07年吧,当时感觉用着还马马虎虎,就是觉得词语过滤特别讨厌,有时候发一篇一两万字的博文,提示有禁词,我就得反复把博文删减,反复尝试,最终才能弄明白到底是哪个词触犯了所谓的禁词(大多数情况完全就是愚蠢的系统误判)。

后来百毒干了件非常令我火大的事,就是把百毒空间的服务给关了,而且从宣布关闭开始几乎没留什么缓冲时间。这一度导致无数我博文的读者找不到我的博文,还导致我当年博士论文上我引用的几十篇博客文章全部失效。百毒这一举动显示出百毒是何等的唯利是图,而且对自己的用户的权益是多么漠视。通过百毒空间赚不到钱了,直接就把服务给砍了,也不想想给曾经使用百毒空间的无数用户造成了多大的损失!相比之下,微软曾经有codeplex开源项目,后来也关闭了,但是起码微软从宣布关闭开始到使用者禁止编辑页面期间已经给足了时间,而且还提供了迁移功能,而且到禁止编辑页面的时间点后,之前的codeplex页面镜像是永久保留的,不会导致用旧链接访问的时候直接找不到网址(使用者可以在旧页面上声明新页面已经迁移到了何处去),这体现出微软比百毒有责任心不知多少。而维持百毒空间的镜像本身就用不着多少流量,也不会给服务器造成多大的压力,不给用户什么迁移的时间直接就彻底给关了真是太不像话。


6 百毒网盘

再说说百毒网盘。这东西,当年一开始用着还行,现在限速越来越变态,下载只有十几KB/s几乎已成了一般现象,甚至往往有的时候速度为0!想要不限速,就得去买颇贵的超级会员,这网盘的目的性实在太强了。起初先是靠着免费快速大容量的优势,靠赔钱把国内其它网盘服务商都挤垮,等对手都消失殆尽了,又仗着国外优秀的网盘都被屏蔽而无法被国内用户所使用这一点,百毒网盘就开始肆意胡作非为,靠变态的限速逼迫以前的用户交钱成为会员;而如果用户不想交钱,又基本没有其它可选余地,而且他们之前很多数据都已经存到百毒网盘了,换其它网盘又要折腾,代价太高。百毒网盘的运作真是充分彰显出百毒的邪恶嘴脸。卑鄙恶人的垄断经营实在太可怕。虽然有人会说,百毒也不是搞慈善的,也是以营利为目的的公司,但哪会有有道德底线的公司翻脸会翻得这么厉害的?

等以后百毒网盘感觉不太赚钱的时候,以百毒之流的作风,100%立马会把网盘服务直接砍掉,到时候不知得有多少珍贵的资料从世界上永久消失(很多人以为资料传到百毒网盘上就成永久保存的了,实在是太naive)。之前百毒网盘曾搞过次大清洗,几乎什么都分享不了,最过分的是,明明是我自己开发的Multiwfn的压缩包,居然链接也被删了,完全是一群没有脑子的人在胡搞瞎搞。


7 其它

百毒杀毒我没用过,当年貌似弄这个东西就是和360狗咬狗互撕,才5年就终止了,可见百毒提供的产品的目的性实在太强了、可持续性太差了。

百毒贴吧,如今弄得也是乱七八糟,信息混乱,广告位极度妨碍观看,好多贴吧还都禁言了。虽然有一些吧被吧主管理得还可以,但整体贴吧给人的感觉就是low得不行,水得不行,乱得不行,专业人士讨论有水准问题的都不会去那种地方。

仅有的一个我用着还感觉凑合的是百毒地图,但由于笔者深居简出,对这个使用率很低,所以不多做评价。据经常远行的人说这东西到了偏僻地方就坑爹起来,比如自驾游的路线能导到田埂上。


百毒和Google经常会被放在一起对比,百毒大部分的服务说白了就是在山寨Google。我觉得用“伟大”这个词评价Google在某种程度上并不太过分。在我眼里,Google是有真心实意想为人类社会和科技做出积极贡献的,确实,Google在大部分方面都做得很出色,令人佩服,而且表面上也几乎完全看不出他们在刻意盈利。相比之下,百毒给人的感觉完全就是家利益熏心、唯利是图的公司,变着法儿的想着捞钱。这个时代不能没有Google,若没有Google的创意和领军,互联网不可能有现在这样繁荣和便利。而没有百毒,则完全没有问题,不少方面还会变得更好。比如没有百毒搜索,国内能直接访问的还有360、搜狗、bing等可用;没有百毒地图,还有高德地图;没有百毒网盘,还有迅雷磁力链接等可以分享文件...

数月前李彦宏还口出妄言:“如果Google决定回到中国,我们非常有信心再PK一次,再赢一次。”,看到这句话时,百毒对我的恶心又厚重地加深了一层。

有些初入科研领域的人还在抱着弱爆的百毒不放,甚至有的明知道巨烂却还在用,若问其原因,理由往往是因为Google在国内访问不了。然而有那么多镜像可用,唾手可得,那么轻微的障碍都克服不了,还搞什么研究?对于科研工作者,我毫不夸张地说,不善用Google搜索/学术,你就比别人少了条腿。