见证常识如何颠覆传统学科
常识,是指人们在生活与活动中总结出来的经验与知识。下面,我们通过一个实例来看一下常识怎么转换为数学公式,怎么颠覆传统学科? 一、常识如何演变为公式? 一所学校里面有60%的男生,40%的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。有了这些信息之后我们可以容易地计算“随机选取一个学生,他(她)穿长裤的概率和穿裙子的概率是多大”,这个就是“正向概率”的计算。然而,假设你走在校园中,迎面走来一个穿长裤的学生(很不幸的是你高度近似,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别),你能够推断出他(她)是男生的概率是多大吗? 在这里,我们不妨把问题重新叙述成:你在校园里面随机游走,遇到了N个穿长裤的人(仍然假设你无法直接观察到他们的性别),问这N个人里面有多少个女生多少个男生。你说,这还不简单:算出学校里面有多少穿长裤的,然后在这些人里面再算出有多少女生,不就行了? 我们来算一算:假设学校里面人的总数是U个。60%的男生都穿长裤,于是我们得到了U*P(Boy)*P(Pants Boy)个穿长裤的(男生)(其中P(Boy)是男生的概率=60%,这里可以简单的理解为男生的比例;P(Pants Boy)是条件概率,即在Boy这个条件下穿长裤的概率是多大,这里是%,因为所有男生都穿长裤)。40%的女生里面又有一半(50%)是穿长裤的,于是我们又得到了U*P(Girl)*P(Pants Girl)个穿长裤的(女生)。加起来一共是U*P(Boy)*P(Pants Boy)+U*P(Girl)*P(Pants Girl)个穿长裤的,其中有U*P(Girl)*P(Pants Girl)个女生。两者一比就是你要求的答案。 到目前为止,小学生除了上面的英文单词不会(PS:我们那个时代的,现在的小学生都会吧),除了符号不熟悉外,其他的应该还是小菜一碟吧,因为目前用到的都是一些常识,下面让我们来对这个答案一般化,看看将会发生什么? 下面我们把这个答案形式化一下:我们要求的是P(Girl Pants)(穿长裤的人里面有多少女生),我们计算的结果是: U*P(Girl)*P(Pants Girl)/[U*P(Boy)*P(Pants Boy)+U*P(Girl)*P(Pants Girl)] 容易发现这里校园内人的总数是无关的,可以消去。于是得到: P(Girl Pants)=P(Girl)*P(Pants Girl)/[P(Boy)*P(Pants Boy)+P(Girl)*P(Pants Girl)] 注意,如果把上式收缩起来,分母其实就是P(Pants),分子其实就是P(Pants,Girl)。而这个比例很自然地就读作:在穿长裤的人(P(Pants))里面有多少(穿长裤)的女孩(P(Pants,Girl))。上式中的Pants和Boy/Girl可以指代一切东西 所以其一般形式就是: P(B A)=P(A B)*P(B)/[P(A B)*P(B)+P(A ~B)*P(~B)] 收缩起来就是:P(B A)=P(AB)/P(A) 其实这个就等于:P(B A)*P(A)=P(AB) 由简单的全等替换可得: P(AB)=P(B A)*P(A)=P(B)*P(A B) 这便是著名的贝叶斯公式。 二、贝叶斯定理如何颠覆传统? 第二次世界大战期间,阿兰·图灵发展贝叶斯法则,破解了德国海军的密码。 贝叶斯法则是一个被抛弃了的隐晦的科学争议,它是对处于绝对真理和完全不确定之间的灰色地带的广泛生活进行推理的逻辑。我们经常只对我们思考的问题的一小部分拥有信息,但我们都想以自己过去的经验为基础做出预测,我们在得到新的信息时改变我们的信念。 从一个有些根据的信念(直觉、猜想)出发,贝叶斯和他的后继者设计了一种方法,测算新增信息是增加还是减少了一个人最初的信念正确的概率。但反对者说它太主观,所以直到21世纪初,它仍是一个争论不休的问题。 关于贝叶斯法则的争议涉及不同的认识论之间的竞争,贝叶斯的理论或认识论上的敌手是频率论。对频率论者来说,信念毫无意义,客观性和有效性只能得自重复地观察到一个可复制的现象,直到为一个有意义的样本积累了足够多的数据。频率论者的理论结构假定,过去没有发生过的事情将来也永远不会发生。这扭曲了现实。如麦克雷尼所说,在频率论者看来,从统计的角度说,飞机不会在半空相撞。直到它们相撞的时候它们才撞上了,但那时再去计算犯错的可能性和确定精算表时已经晚了。 麦格瑞恩说,贝叶斯法则之争涉及一个更广泛、更基本的问题:我们如何分析证据,在得到新信息时改变主意,面对不确定性做出理性的决定。贝叶斯法则与现代科学所要求的客观性和准确性背道而驰,它衡量的是信念。它认为,我们可以从遗失的、不充分的数据、从近似性和无知中学到东西。 贝叶斯法则诞生以来,在保守的数学界激起了强烈反响。麦克雷尼详细叙述了这场论战,但他的重心是这条法则在历史和现实中的实际应用。阿尔弗雷德·德雷弗斯的辩护人用它证明他的无辜(年,法国犹太军官德雷弗斯被错误地指控是德国人的间谍,几乎唯一的证据是他卖给了德国人一封信。刑事犯罪学家阿尔封斯·贝蒂荣作证时说,根据概率论,基本可以肯定是德雷弗斯写了那封信。年审判时,他的辩护律师邀请法国著名数学家庞加莱出庭作证。庞加莱相信的是以频率为基础的统计学,但被问到文件是不是德雷弗斯所写时,他援引了贝叶斯法则,他认为,法庭唯一合理的做法是用新的证据更新最初的假设)。 再比如垃圾邮件的过滤,从某一个账户发出的邮件的主题里有“伟哥”这个词,并不见得它就是垃圾邮件。贝叶斯派拦截垃圾邮件的方法是用信息中的词和句子来确定该信息是垃圾的可能性。这是一种高度发达的方法,使用了背景线索,每当一个垃圾邮件抵达拒收文件夹,算法就有更多的理由相信它之前的直觉。 现在,贝叶斯法则正在革新机器人设计。贝叶斯法则用概率分布来表达所有的信息,可以从稀少和不确定的证据中产生可靠的估计。谷歌的无人驾驶汽车接收车顶传感器搜集到的路况和交通数据,更新从地图上获得的信息。 美国城市大学研究员迈克尔·沃什伯恩评论说:“贝叶斯的实用主义使它在军事行动、商业和克服个人遇到的障碍而非纯粹研究上非常成功。它没有激发出创新,但它能解决问题。随着我们的世界变得日益复杂,科学家们向自己提供了一个躲避不确定性的避难所。但是在大学里,纯粹研究不在乎它,仅仅一个事例对研究者来说没多大意义,结果我们生活的世界和被研究的世界之间发生了断裂。”理论因为抽象、纯粹,所以不同理论之间的对立和分歧会显得很尖锐,但现实比理论有着更大的张力,同时容得下贝叶斯法则和频率论。 在人们不断的争议与诋毁中,它已经在现实世界中被运用。第二次世界大战期间,阿兰·图灵发展贝叶斯法则,破解了德国海军的密码。当理论家们把贝叶斯法则视作禁忌时,它把贝尔电话系统从年的金融恐慌中拯救了出来,保险精算师用它确定赔率;它指引联军的炮火,找到德国人的潜艇;它确定地震的震中,英国地球物理学家哈罗德·杰弗里斯用它推测出地核是液态的——也许是熔化的铁,或者混合了少量镍。“冷战”期间,贝叶斯法则帮助预测了“挑战者号”的悲剧,证明抽烟会致癌、高胆固醇会引发心脏病等等。 今天,贝叶斯法则把色情图片过滤到我们电脑的回收站中。当船沉的时候,海岸警卫队用它寻找也许会在海上漂浮数周的幸存者。科学家发现了基因是如何被控制的。在网上,贝叶斯法则在网上爬梳,售出歌曲和电影。它渗透到了计算机科学、人工智能、机器的学习、华尔街、天文学和物理学、国土安全部、微软和谷歌。它帮助电脑把一种语言翻译成另一种语言。它成了我们的大脑如何学习和运转的一个比喻。杰出的贝叶斯论者甚至给政府部门就教育、能源和科研提出建议。 赞赏 |
转载请注明地址:http://www.keboencheng.com/kbecrk/32.html
- 上一篇文章: 没有了
- 下一篇文章: 不走寻常路,另类小众旅行地