注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

破破的桥

本博目标:共同探讨提高智力。北大计算机系博士。兴趣:网站舆论与网民心理。

 
 
 

日志

 
 

对《韩寒代笔探讨:强质疑、弱质疑、和忽悠》一文意见的简要回复  

2012-02-03 12:10:00|  分类: 杂谈 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
对《韩寒代笔探讨:强质疑、弱质疑、和忽悠》一文意见的简要回复

尽管收到了很多回复和信件,但由于这篇文章本来就是写着玩的,所以不准备一一回复了。写个公开的回复吧。

1.来信收到

    有人指出,标题顿号用错了。谢谢:) 

    还有人说这篇貌似公允云云。我文章开头就写了,由于大家关心站队,为了防止大家说我“公允,各打50大板”之类的废话,所以我对此事的判断在文章一开始就列出了:从目前的证据看,韩寒长篇和竞赛作品代笔可能性非常小,善意推定的话,韩寒早期作品和博客,也应该是他自己的作品。

    尤其是说《三重门》是韩仁均代笔的,其荒谬程度就好像指证墨武的《武林高手在校园》是金庸代笔的一样,装中立都显得很搞笑。大家是没看过《三重门》还是怎么着?是不是以为是部巨作啊?完全不理解。这只是当年各种中学校园笑话段子、动漫、流行歌曲横行的一本畅销书而已。上次的文章发出后,有人来信问我的文章里“卧石答春绿”是什么意思?这是一个中学笑话段子,韩寒在《三重门》中用来讽刺读死书的人。有人问“Wait and See”是什么意思,这是90年代初中期的热门动画片《兔子,等着瞧》每集都有的片头台词。张放老师识别不了流行歌曲歌词以及这些段子不是因为他笨,而是两代人的代沟是极其深广的。韩仁均要有这本事装成这样还畅销,那他以前早成名了。

    有人说韩仁均装年轻人是因为能打进青春校园类图书这块市场。说这话的不知道这个市场竞争可比中年市场残酷多了,韩寒十六岁的作品,论文笔,比不上吴子尤十岁后在《谁的青春有我狂》里的一些作品,论题材,比不上蒋方舟十一岁的同性恋题材作品《正在发育》,论心理细腻,更是远比不上张爱玲十二岁的《迟暮》,还有其它几千种同类作品。他当时突围而出,有很复杂的时势因素。但到了后来,就是靠真本事了。

    还有很多朋友痛心疾首地说,为什么不在更有意义的地方吵呢?从小说里翻罪行这种事,都会有这么多人信,中国社会怎么办?这些朋友想的太多了。掐架就是掐架,影响不了中国社会。越认真越吃亏。这种根本不存在证伪可能性,相互指责,毫无胜负标准和结果的争吵,必然会令双方的言论、证据,在观众中的信用逐渐降低。你要是放轻松,那么根据网络的传播规律,再过一段时间,吵得乱七八糟以后,这事肯定会走向喜剧化和闹剧化,成为全民娱乐活动。但你要是很在意,那就会和韩寒《他的国》里面的左小龙一样,明明上楼顶是为了看看风景,却被底下热切的围观群众怂恿着跳了楼。

2.大家对强质疑(有基本确定的证据)和忽悠的意见不是很大。主要对弱质疑提了很多意见。我详细讲讲。

(1).弱质疑有什么用?多个弱质疑可以结合成强证据么?

    没什么用,只能八卦用。很难结合成强证据。一是因为弱质疑往往有相关性,由同一原因引起,很大数量的弱质疑都可能仅仅因为“记错了”这一个原因引起。二是因为所有弱质疑都是从很大的样本中挑出的,一百句话挑出四五句有矛盾的,太正常了。在数学上对最终概率的影响非常微小,现实中毫无意义。

    文中链接的文章中还做了一个很简单的计算。如果文章中有100句和代笔有关并且原因相互独立,其中找到有4句有严重的问题,在没代笔的情况下,每句只有10%的几率发生这样的问题,即弱证据,如果一开始做善意推定(即默认为没代笔),那么最终挑出4条以上弱证据几率有多大?有些人算出来是万分之一,有些人觉得没那么大,其实简单的概率计算没代笔的几率是98%左右。这件事是反直觉的,所以很容易成为逻辑陷阱。但并非反常识的,常识上对应的说法是:“捕风捉影是不可信的”。

    当然有人要说了,你这模型太不精确。咱们用贝叶斯模型分析韩寒代笔,讨论了一个长篇又一个长篇,还到处爱特给那些完全不明白的大V,把那些可怜的家伙都给折腾楞了。这事我放到最后头说。

(2).弱质疑有多弱?

    文章一发,很多人写信过来说。破桥,你不厚道,强弱质疑都是你自己定义的。像《求医》这篇文章的分析和漏洞,还有《杯中窥人》几个人说法自相矛盾,我觉得这质疑很靠谱,明明是强质疑,你却说是弱质疑?我说那些东西,那种分析方法,发稍微有点品位的八卦杂志,都是百分百拒稿,连弱质疑都不是,只是忽悠。还有人给我寄来了惊天大发现:韩仁均贴出的信纸的图片,和他贴出的信封图片叠在一起,发现信纸不能放在信封里,这是造假!面对这样的“发现”我真是笑到无力,尤其发信的很多还是以前不错的朋友,还不得不回:你们真是陷入魔怔状态了。

    弱质疑到底有多弱?那些拿着小说里的字句分析找证据的,我就不讲了。说多了我都会以为我自己智力有问题。有一大块弱质疑是针对“自相矛盾”的,大家可以自己做个实验,两人一组,甲做质疑方,乙(比如破桥)做辩护方。

    某天,甲对破桥说:破桥啊,你这几天写的博客水平很有问题,我觉得你不是考上北大的,是十几年前,有个叫烂桥的人给你代考的。由于烂桥和你交情很好,我高度怀疑你们是好基友,所以代考的事儿他死活也不肯承认,但没关系,我有办法。

破桥:高考当然是我自己考的。

甲问:那你有当年准考证么?有没有监考老师证明当年去的是你?

破桥:这不笑话么,都十几年了我去哪找去?监考的家伙我根本不认识,就算认识他他也不认识我啊。

甲说:没事儿。记不清不要紧。我们绝对不会随便怀疑你的。这样吧,我问几个问题,方便我把当时的场景还原出来。你是几月几号考的啊?

破桥:那怎么能记得?

甲:那是在哪个学校的考场考的?

破桥:呃。。。A校?

甲:不对,我上网搜索了,当年你们校区是在B校考的,A校从来就没有做过考场。为了保险起见,我再问个问题。语文数学英语物理化学,是分别在三天里考的,是按什么顺序考的呢?语文作文题是什么?英语的阅读题是讲什么的?数学最后的大题是考解析几何还是立体几何?能讲讲么?

破桥:我靠,这过那么久了,我哪里记得起来啊?

甲:这已经非常充分地说明了你当年根本就没有高考,连高考这种人生大事,你都会不记得?都被我问成这样了,你还说不是烂桥代考的?当然,我们不会随便冤枉人的,你想洗清冤枉很简单,这是当年的高考数学卷子,给你两个半小时,你把它做完看看考分多少?别考太差了哦。你还可以谈谈当年是怎么复习的,用的是哪些参考书?做的是哪些测试卷?模拟考多少分?排名班里第几?

破桥:。。。。。。

甲:你无话可说了吧?无论你怎么看待高考,这都是你人生最重要的事件之一,对于你自己的高考,只有你才最了解。连你自己都对高考毫无了解,不能出示准考证,不记得自己在哪个学校的考点考的,不记得科目顺序,不记得所有科目的大题,不记得复习的参考书、模拟考、测试卷。连高考考卷都不会做。居然还敢说你是自己通过高考上了北大的?

旧桥:甲兄,你这么玩可不行啊。
断桥:这种游戏实在奉陪不起。
豆腐渣桥:这么搞我们还有命么?

甲(傲娇地):瞧你们这熊样,就知道个个心里都有鬼!中国的高考代考现象太普遍了,真是令人揪心啊。

    有人想了解弱质疑到底有多弱,以上都是典型的弱质疑。而且,更有趣的是,你越解释,提供的信息越多,漏洞也就越多,破绽也就越大,越来越不能自圆其说。于是最后很快你就被“铁证如山”了。这个实验欢迎大家互相做。那么,怎么让你提供更多的信息呢?很简单,抛出一个你无法证伪的命题,然后你就会不断地试图去解释,解释的越多,出错的也就越多,就越可疑,你自己的话,公信力就越来越弱,然后你就臭掉了。而对质疑者以及旁观者来说,一旦陷入了恶意猜测,也会在同样的思维死循环里越陷越深,无视任何有利证据,甚至从有利证据里再去挖“弱质疑”试图否定它。在中国有个寓言叫《智子疑邻》,家里被偷了,邻人什么举动都是越看越可疑,越看越像贼。直到陷入类似于“魔怔”的状态。这个在常识上的说法很简单,就是先入为主,为了把三重门说成是韩仁均写的,会挑出几个文本,信的死去活来。却选择性的无视里头大量的中学生段子,无视韩仁均故事会上的那些烂文,无视手稿,无视当年的同学、老师的佐证。还觉得这样的铁证别人居然不信,居然认为是无理取闹,特委屈。至于十几年没发现韩寒是个中年老汉代笔的编辑们,那理所当然是一大群傻瓜和合谋者。

    那弱质疑有啥用呢?有强证据的情况下,弱质疑有补充作用。没有强证据的话,它有八卦娱乐作用。当然,也可以用来消耗对手体力,上篇文章讲过了。

3.人造韩寒

    很多倒韩者,根本就不信什么代笔,但也愿意支持倒韩。事发在于,韩的三论动摇了韩寒的群众基础,有些人反对并仇视其观点,而有些人则认为,韩寒的学识和他的社会声誉差距过大。细数韩寒的成名过程,有很大程度的媒体“合谋”(也就是某种虚拟“团队”),比如成名时明明非常努力地读书写书,到处投稿求人,最终成了名作家,但是炒作时则是叛逆的“七门红灯,照我前程”。后来靠着影响力和文笔写了一些轻快的社评,结果成了“公民、公敌,揭穿皇帝新衣的小孩”。现在是该还债的时候了。

    这方面的文章推荐@杨早 的《韩方之战的四个关键词》http://www.weibo.com/1194991743/y3vm2zeAO 我对这种看法没有太大意见,但是媒体属于共同负债人,不要到时摇身变成催债人。代笔是代笔,神话是神话,要区分开。还有就是不要制造新的神话,什么写《三重门》旁征博引读了那么多书等等,其实在豆瓣上找个文艺初中生都比他读得多。因为时代不同了。这个时代的竞争力已经不在于书的数量了。

4.其它

    有人问米国这种事控告诽谤真的赢面不大,那老方怎么不敢在米国这么干?在米国赢面真的不是很大,因为一般法院考虑到公共人物,都会保障质疑者言论自由权而弱化其名誉权,但万一输了,罚款往往是个大数字,所以风险也不能算小。

5.贝叶斯(大家看到这里的应该不多了,建议现在就可以解散了)。。。。

    Oh my god。上次韩寒说到文科生不要学数学,现在救命要用到数学了吧?上次文章贴出后有不少人给我说贝叶斯分析。不好意思,这东东我不懂。你们讨论时N个长微博更是爱特给很多可怜的文科老师几千次,太不厚道了。对此感兴趣的朋友可以看《死理性派是怎样判断漂亮女孩是不是单身的?》http://songshuhui.net/archives/62770 。

    这个方法套用到韩寒事件身上,大多数用贝叶斯模型处理韩寒是否代笔概率文章主要的问题在于建模。运算还不是问题。韩寒代笔的先验概率是多少?是个主观值么?光这个值就够讨论几周的了。如果尽量取客观值,是中国所有作家代笔的平均几率呢?还是畅销书作家代笔的平均几率呢?还是什么?特征选择呢?还是主观的?似然率呢?还是主观的?

    我对此的回复其实很简单,和PCA分析一样,请在写之前,把数学抛掉,想想拿出稿纸、信件、和病历这种证据,都能被解读为“这都能拿出来?更可疑了”的情况下,你还觉得这不是无理取闹?还想做这种贝叶斯这种主观性影响极大的分析?合适么?最终也只能从偏执变成魔怔,魔怔变成边缘化群体。数学最终还是要回归到常识上的,而不是忽悠。

    另外还有一位朋友问,钱云会时候大家用相似的方法分析你怎么看?这个问题很好,可以向做贝叶斯的朋友请教先验概率。

-------------------------------------------------
以下是2月4日补充:

1.有人回复,用强证据反击弱质疑。如高考,数学大题虽不记得,但我能记得某题先尝试解法A,后划掉用解法B。只要当年卷子有划痕,就证实我高考没代考。方法对,但实践中犯了提供新信息的错误,因为任何新信息都能产生新的弱质疑:题目不记得却记得划痕,这符合记忆规律吗?代考者专门划的吧?太可疑了。牢记一点:任何强证据都要从现有的材料中去选择,如果你抛出新的材料,哪怕是强证据,只要有材料就有新的弱质疑,人类的特征就是在怀疑的倾向下,会有意识地记住弱质疑而忽视强证据。最终你材料越抛越多,质疑越来越多,最后就会臭掉。

2.有人回复。我也觉得质疑捕风捉影,但对回复很不满。要反驳质疑就能拿点象样的证据,结果拿出封信,压根和代笔没关系,这也行?的确,那信是韩寒老爸翻箱倒柜找证据时顺手翻出来的,和代笔确实毫无关联,信是真的,对证明没有代笔也没什么作用。但奇特的是,自问:毫无关联的信,很多人为啥怎么看都觉得假?是否陷入了某种状态?

3.关于贝叶斯。我不很懂,意见:贝叶斯对弱证据建模要慎重,很多贝叶斯分析者将“弱证据”建模为某个特征的“不利条件”。实际上不是这样的,因为这种弱证据天然就存在,比如作家可能30%的概率记不住自己10年以前所写的书的名字,情节,主角,只要他提供的回忆信息越多,这种漏洞、自相矛盾也就必然越多,按贝叶斯概率一加总,这不就铁证如山了么?实际上我们要考虑必然存在某个几率的弱证据。比如作家只记错了15%的书名、主角、情节,考虑到样本总量后,相反是贝叶斯中的“有利条件”,说明他记错的比实际几率要好。仅因偏见和人们的认知差异视为弱证据(这是反直觉的)。但是到底应该记错多少呢?这个值是很难得到的一个主观值。比如我们找100位作家来问他们10年前的作品查看记错的几率。但这样不行,因为每个人作品数量不同,作品上花的时间不同,取名的标准不同,记忆力也不同,你无法知道这个应有的概率是多少。所以我个人认为该模型是无法用于这个事件的。


  评论这张
 
阅读(107)| 评论(50)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017