这个研究并不是孤例 。早在2000年,有人曾综合调查过136项研究,包括了各式各样的预测主题,比如黄疸病的诊断、服兵役的适应性、婚姻的满意度等等比较复杂的判断,结果是:
其中63项机械判断更准确 , 65项是机械判断和临床判断同样好,而只有8项是临床判断更好 。
这里我们还没有计算决策的成本问题,机械判断显然比临床判断快得多,而且根本不需要请专家,可谓省时省力省钱 。
可这是为什么呢?奥秘其实很简单:只要是人做判断,就必定会伴随各种不可预知的干扰 , 我们之前有介绍过,这个东西叫做“噪声” 。(点击回顾关于“噪声”的解读)
还是开头的例子,为什么专家不会同意简单的取平均分方法呢?因为专家认为这太一刀切了 。
比如我们都听过,有的数学天才,从小就是迷恋数学,但是英语非常差 , 如果取平均分,那这种数学天才肯定上不了大学了,我们不应该仅仅因为英语不好就抹杀一个天才,对吗?
专家的逻辑是:我们应该具体问题具体分析 。这听起来好像非常合情合理 。
但是请注意,毛病恰恰出在这里——
我们往往高估了“具体问题具体分析”的有效性和可实操性 。
开头例子里的候选B,表达得分是满分10分,这真的说明他是一个表达天才吗?在只有两个候选人的情况下,其中一个人表达得到了10分,这个10分只能被看做是一个“比较级”,而很可能不是“最高级” , 这种情况下押宝在一项指标上,很冒险,并不靠谱 。
更有可能的情况是:你以为的特殊情况,只不过是一般情况,你给自以为的特殊情况打了满分,这个分数虚高的可能性 , 要大于他真的值一个满分 。
所以“英语差的数学天才”,这个故事模型也是经不起实操的,极少数真正的天才,的确可以通过自主招生之类的方式被录取 , 但99.99%的学生不可能走这条路——

文章插图
到韦神这个级别,也许可以聊聊保送北大的事你以为自己是个数学天才,其实放到最顶级的那群人中间,可能又相形见绌了,所以想考好大学,请尽量把各科分数都提上去 。这本身就是最公平的选拔方式 。
我们来总结一下 , 机械判断和临床判断的区别到底是什么:
机械判断的不足是,好像抹杀了一些“特殊情况”,缺少“微妙考虑” , 但研究结果告诉我们,这些所谓微妙考虑带来的收益,不如那些噪声的破坏力大 。
机械模型,没有喜怒哀乐,哪怕用非常简单的甚至不合理的模型(比如在开头例子中 , 随机选一个打分项作为高权重) , 最后也有77%的概率比专家们强 。
丹尼尔·卡尼曼对此有一句经典评价:“你几乎不可能制造一个比专家表现更差的模型 。”

文章插图
实际上 , 用“机械判断”,而不是遇事就请教专家,上世纪50年代就有例子 。
1953年 , 麻醉学家阿普加就设计了一个判断新生儿是否健康的模型,也叫阿普加评分(Apgar Scale),一共五个指标:
肤色、心率、刺激反应、肌肉张力、呼吸
然后,医生对每一项进行打分,可以打0分、1分或2分,比如肤色 , 全身是粉红色给2分,四肢有青紫色给1分,全身青紫色给0分 。

文章插图
最后只需要把5项得分简单相加就行,不需要加权平均 。这个模型满分是10分 , 只要婴儿总分达到7分,就是健康,4-6分 , 不太健康,0-3分,需要立刻采取急救措施 。
相关经验推荐
- “播出了这一幕后,CNN记者被乌克兰禁了”
- “俄罗斯没有袭击波兰,有人想挑起北约与俄军事冲突”
- 印尼向加拿大提议建“镍OPEC”:分别为第一和第六大生产国
- 什么是流调?
- 淘特上线两款智能新品“微店铺”和“心动搜索”
- 万亿茅台的电商“野心”:高流量下有望成百亿平台 一瓶难求频遭吐槽
- 波兰邀国际专家入境调查,土耳其站到俄罗斯一边,6个北约国已表态
- 不出意外,五角大楼全面审计“五连跪”
- 英国通胀率创41年新高,财相“发预警”
- 时隔8年,腾讯美团“和平分手”
