3 如何对只有本人才知道的信息进行推断?
通过飞机的引擎声辨别机种
章鱼哥以仅仅3.7%的惊人概率猜中了球赛的比赛结果,当我们听到这则新闻的时候,可能没有人会认为“章鱼是通过可靠信息才猜中的”。但是,如果猜中比赛结果的是人呢?比如,某位绅士说“把我的眼睛蒙上,仅凭引擎声,我就能辨别飞机的机种”,然后开始听声音辨机种。飞机的引擎声里可能有某种一般人无法辨识的差异,所以当这个人连续猜中机种之后,我们就会说:“这个人的确有本事,他没有唬人。”
不仅是猜飞机,铁路迷们估计也能通过听火车声音分辨出不同车型的火车。
红茶先还是牛奶先?猜猜看!
接下来,我要给大家讲一个例子。
这是一个统计学里非常有名的故事,被称为“红茶夫人”。
英国有一位贵妇说:“奶茶的调制顺序对风味有很大的影响,把红茶加进牛奶里与把牛奶加进红茶里,喝起来口味会完全不同。我能品出一杯奶茶是先倒的红茶还是先倒的牛奶。”此言一出,身边的绅士小姐们便开始议论纷纷。
绝大部分人都觉得这滑稽可笑:“这两种混合方式的化学成分有什么差异吗?红茶加入牛奶里和牛奶加入红茶里味道会有什么不同吗?真是莫名其妙,开玩笑的吧!”
其中有一位绅士表现出了兴趣,他提议说:“这可真是一个有趣的话题啊,我们不妨来试一试。”他认真地设计了实验步骤,包括要准备多少杯红茶、按照什么顺序给这位贵妇喝等。这位绅士就是统计学的鼻祖罗纳德·费希尔。
贵妇所说的究竟是真是假?她是确有这本事还是在开玩笑?这里就涉及“旁观者如何根据观察进行判断”的问题(本书采用与费希尔不同的思考方式)。
启示就来自章鱼哥拉比奥。
旁观者如何进行判断?
:这个故事有趣吧。大和,你怎么看?
:学姐你先告诉我,思考这个红茶故事有什么用处?
:有什么用处?你可真是性急啊!它可以运用到诸如设计安保系统或者AI声控等复杂的工程上。但是,如果不懂其中的原理的话,就什么用处都没有了。究竟有什么用,我们待会儿再说,先回到红茶的话题上。
如果只用一杯红茶来做实验,那么贵妇不管是说真话还是撒谎,都只是一个二选一的问题,也就是说,回答正确的概率是1/2(50%)。想必“红茶夫人”也不会为了赌这1/2的概率接受挑战。
那么,连着做两次实验呢?她回答正确的概率就变成1/2×1/2=1/4,即25%了。就算这样,也有可能在4次里有1次碰巧猜中,这还远不能说服那些确信“这不可能是真的”的绅士小姐们。
那就连猜3次好了,猜中的概率变成1/2×1/2×1/2=1/8,即12.5%。3次嫌少就继续猜第4次吧,概率变为1/6,即6.25%;连续5次猜中的概率为1/32, 即3.125%。6次、7次、8次呢?
究竟要做多少次实验、连续猜中多少次才能让人们相信她是真的有这个本事”呢?有没有一个好的判定方法能为这无休无止的实验做一个了断呢?
非数学证明?
:如果是我的话,连续3次或4次猜中是先倒的红茶还是先倒的牛奶,我就会折服了:“哇,调制顺序不一样,真的味道就不一样哎,贵妇没有撒谎!”那么,实际上究竟连续猜中多少次才能得到人们的认可,这需要通过数学方式来证明。
:哈哈!你在说什么呀?数学证明?那是不可能的。就算用最新的传感器测试出了奶茶味道的不同,这里面仍然有一个问题,那就是,“贵妇是真的通过尝出了味道的异同做出的判断,还是随便说说的”,对此我们该如何辨别?
最终,“是真的还是假的”,只有贵妇自己才知道,第三者是不可能“证明”什么的! 我想说的是,要找一个能从外部进行判别的方法。
:啊?这个我们怎么可能通过外观来分辨呢?只有贵妇本人才知道吧。
有没有一个被多数人“认可的界限”?
的确,正如大和所说,只有本人才知道的真伪,要让我们这些旁观者来进行正确与否的判断,实在是太难了。或者说,这是不可能的。就算用上测谎仪,也不一定能百分之百判断正确。
那可如何是好?
:我们可以用“画线思维”。我再给你们一点提示,我们可以用“概率”来思考。“红茶夫人”的故事,你们会不会觉得像是在做一个猜谜游戏?而这也正是现代统计学初始阶段的重要主题。
我们在前文中说过,统计学大致分为“描述统计学”和推断统计学”,现代统计学以推断统计学为中心。推断统计学以总体中的部分(样本)为基础,用随机抽样的数量特征信息来推断总体的数量特征,从而做出具有一定可靠性保证的估计或检验。
这个话题我们到后文中再说,总之,还是先来听听两个人的对话吧。
:现代统计学初始阶段的重要主题?这么难的问题啊?我觉得对我来说就是猜谜。学姐,给点提示吧。
:好吧。首先要认识到根本就没有百分之百猜对的情况。那我们是不是可以退而求其次,找一个让大多数人都能接受的妥协点,也就是考虑一个能预计出的结论。
:妥协点?这的确跟数学没啥关系了哈。
:就是大多数人都能接受的点。比如,如此小概率发生的事情,那就绝对不是“偶然事件”或“碰巧”了,必须得相信!也就是大多数人都能接受的一个程度,我们来定一下这个度吧。
:这个是人为决定的吗?这么勉强,好意外哦。
:如果连续20次都猜对了,那概率就是百万分之一了,这可是一个天文数字哦!这种情况,你还能说是偶然吗?
:一百万次才有一次正确?这样的话谁都不会否认“红茶夫人有真本事”了。百万分之一,这概率也太低了,想要猜中一次的确是太难了。
:百万分之一的概率,大和你应该承认“红茶夫人”的本事了吧?那么,如果是万分之一的概率呢?你还会这么想吗?
:是的,万分之一的概率,我也信。其他人也会这么想吧。
:那么,1%的概率呢?也信?好吧,那多大的概率你才会认为不是偶然、不是碰巧,而是凭本事的判断呢?
:这个嘛, 10%?也就是10次里有1次猜对,呃,这好像要求有点儿太低了哈。那就5%吧,当出现20次里才有1次猜对的情况时,我会认为“偶然”的可能性很低。
“5%=20次里有1次猜对”的概率,就好像让20人抽阿弥陀签(日本常见的抽签游戏),给其中唯一抽到签的那个人发奖金,或者让他在宴会上表演一样,概率很低。下面就是一幅阿弥陀签图,相邻的平行线间任意各画两条横线。
详细说明就此省去,不过,当阿弥陀签的横签只有一根或者两根的时候(这种情况很常见),如果事先知道一头一尾数字对应的那根签中签的概率比较高的话,也许在实际抽签时能有一定帮助哦。
是不是偶然,取决于这5%?
:5%吗?从常识上来讲是这样的,统计学里也的确有一条5%的误差线。所以,如果发生5%以内非常小概率的事情,我们就不认为这是偶然和碰巧了。相反,发生大于5%概率的事件,我们就会考虑这是偶然。
:哦哦,我明白了!4连中(1/16)的话,概率是6.15%,高于5%;5连中(1/32)的话,概率是3.125%,低于5%。这的确是非常严格的界定啊!如果在破5%之前出现了错误,“红茶夫人”可能会为自己找个借口吧。www:她可能会说:“哈哈,开个玩笑罢了。英国绅士们都不知道这是在开玩笑吗?”
与5%误差线相对应,也可以说,只要是没有进入95%的概率范围即可。在“红茶夫人”一例中,我们只是单方面考虑了她是否猜中,如下左图,这在统计学里被称为“单向检验”。
如果把持续偏差的小概率事件也一并考虑进去,那么,双误差率合为5%,这就是“双向检验”了。是采用双向检验还是单向检验,在判断上会有截然不同的差异出现(本书不涉及“检验”内容)。
如果“红茶夫人”连续5次(3.125%)猜中,从单向检验的角度来看(5%),的确可以认定“红茶夫人”所言的正确性;但从双向检验的角度来看,因为其概率为3.125%,没有进入2.5%范围,所以,如果再猜一次没有猜中的话,她就不会被认可(“红茶夫人”的例子里采用的是单向检验,不算严格)。
到底是采用单向检验还是双向检验?哪种检验方法更合适?这在我们最初画误差线时,就有必要事先决定好。
不过,需要知道的是,无论概率多么低,都会有偶然连续命中的可能。所以,世上没有100%的正确率,也没有绝对的正确,这就是统计学的观点。
总结
虽然没有绝对,但我们可以定一条被大多数人接受的误差线,统计学通常把这条误差线画在5%。