“建议专家不要建议”为什么是对的？( 二 ) _科学

这个研究并不是孤例。早在2000年，有人曾综合调查过136项研究，包括了各式各样的预测主题，比如黄疸病的诊断、服兵役的适应性、婚姻的满意度等等比较复杂的判断，结果是：
其中63项机械判断更准确， 65项是机械判断和临床判断同样好，而只有8项是临床判断更好。
这里我们还没有计算决策的成本问题，机械判断显然比临床判断快得多，而且根本不需要请专家，可谓省时省力省钱。
可这是为什么呢？奥秘其实很简单：只要是人做判断，就必定会伴随各种不可预知的干扰，我们之前有介绍过，这个东西叫做“噪声” 。（点击回顾关于“噪声”的解读）
还是开头的例子，为什么专家不会同意简单的取平均分方法呢？因为专家认为这太一刀切了。
比如我们都听过，有的数学天才，从小就是迷恋数学，但是英语非常差，如果取平均分，那这种数学天才肯定上不了大学了，我们不应该仅仅因为英语不好就抹杀一个天才，对吗？
专家的逻辑是：我们应该具体问题具体分析。这听起来好像非常合情合理。
但是请注意，毛病恰恰出在这里——
我们往往高估了“具体问题具体分析”的有效性和可实操性。
开头例子里的候选B，表达得分是满分10分，这真的说明他是一个表达天才吗？在只有两个候选人的情况下，其中一个人表达得到了10分，这个10分只能被看做是一个“比较级”，而很可能不是“最高级” ，这种情况下押宝在一项指标上，很冒险，并不靠谱。
更有可能的情况是：你以为的特殊情况，只不过是一般情况，你给自以为的特殊情况打了满分，这个分数虚高的可能性，要大于他真的值一个满分。
所以“英语差的数学天才”，这个故事模型也是经不起实操的，极少数真正的天才，的确可以通过自主招生之类的方式被录取，但99.99%的学生不可能走这条路——

文章插图
到韦神这个级别，也许可以聊聊保送北大的事你以为自己是个数学天才，其实放到最顶级的那群人中间，可能又相形见绌了，所以想考好大学，请尽量把各科分数都提上去。这本身就是最公平的选拔方式。
我们来总结一下，机械判断和临床判断的区别到底是什么：
机械判断的不足是，好像抹杀了一些“特殊情况”，缺少“微妙考虑” ，但研究结果告诉我们，这些所谓微妙考虑带来的收益，不如那些噪声的破坏力大。
机械模型，没有喜怒哀乐，哪怕用非常简单的甚至不合理的模型（比如在开头例子中，随机选一个打分项作为高权重），最后也有77%的概率比专家们强。
丹尼尔·卡尼曼对此有一句经典评价：“你几乎不可能制造一个比专家表现更差的模型。”

文章插图
实际上，用“机械判断”，而不是遇事就请教专家，上世纪50年代就有例子。
1953年，麻醉学家阿普加就设计了一个判断新生儿是否健康的模型，也叫阿普加评分（Apgar Scale），一共五个指标：
肤色、心率、刺激反应、肌肉张力、呼吸
然后，医生对每一项进行打分，可以打0分、1分或2分，比如肤色，全身是粉红色给2分，四肢有青紫色给1分，全身青紫色给0分。