Skip to content

Latest commit

 

History

History
54 lines (23 loc) · 9.25 KB

吉仁泽 教你10分钟 学会 贝叶斯分析 .md

File metadata and controls

54 lines (23 loc) · 9.25 KB

吉仁泽 教你10分钟 学会 贝叶斯分析

是一个非常基础性的一个呃思想领域,呃,然后杨老师今天也今天也说了,人工智能其实也分不同的一些流派啊,分成呃计算流派或者BS流派,

那杨老师本身也是一个贝叶斯流派的这样的一个认识科学家好的,那我和其实和各位同学看到这个题,看到这一张,呃,这个视频截图之后,其实都是一样的,感受啊就是这是这是什么啊,我完全不知道这个该怎么去算啊,这个概率先应该先验概率后验概率,然后papb什么的,就是感觉呃特别的特别的混乱了,不知道该怎么样去处理,那在计算的时候也是。大胆的放心啊,这些词学不懂并不是你的智商有问题,为什么这么说说呢?因为狄仁杰啊,他做了大量的缘分系,也就是说他对和这个贝叶斯教学相关的一些研究,他做的一个汇总,然后呢,发现不管是平常人还是有丰富的经验的物理学家,大家都知道,物理学家一般都是智商非常高的人都没有办法本能地去进行贝叶斯的计算,那其中有一个案例就是有12 30名,德国的物理学家工作时间也很长,但是他们在解题的时候只有10%的正确率,所以卡尼曼和托尔斯基也说,人类根本就不是这个贝叶斯是一个计算者,然后嗯同时呢,这个呃兼任者,他也去研究了各种各样的一些类似相关的一些教学方法,也基本上被证明无效,这个在随时间的衰减的速度会非常非常的。但是人类真的不是被诗诗的一个思考者吗?啊,所以呢,这个吉仁泽他觉得并不是这样子,所以他设计了三个不同的对照实验,用传统的这种规则,教学法和以及另外两种呃更具象的一些方法来进行教学,那我们先看这个具体的其中应用到的一个案例啊,这个案例是说啊,你在一家门诊工作,那历史记录发现有10%的人都有败血症,今天有一个病人来了医院,有这样子有这样一些症状,然后教科书上的记录的话,就是如果这个人有败血症,可能有百分之八十的患者,百分之八十的白血病患者都会有类似的一些症状,那如果这个人没有办学证,他依然会有百分之十的概率会出现这些症状,好的那我们看用传统的这次厄第一种方法用传统的这个贝叶斯的公式然后和公司里面进行计算,那这个就是我们刚刚说的,不管是普通人还是物理学家,都只能获得10%左右的正确率的这样的,一种呃刑事一个考试的形式,然后呢,但是其实他们呃发现了还有另外一种方法啊,能够大幅的提升,贝叶斯基上的成功率非常非常显著啊,从10%提升到46%,而且啊不光是对高智商人士起作用,对普通的大学生也起作用。这样的一个认识科学家,我完全不知道这个该怎么说呢,因为就是在意,就是有让他们在同时呢,这个嗯非常的快,但是这个三个不同的对照实验,用传统的这种嗯规则教学法会,以及另外两种嗯更具象的一些方法来进行教学,那我们先看这个具体的其中应用到的一个案例啊,这个案例是说嗯,你在一家门诊工作那历史记录发现有10%的人都有败血症,今天有一个病人来了医院,有这样有这样一些症状,那教科书上的记录的话,就是如果这个人有败血症,可能有百分之。80的患者80%的败血症患者都会有类似的一些症状啊,如果这个人没有败血症,他依然会有10%的概率会出现这些症状好的,那我们看用传统的这是第1种方法,用传统的这个贝叶斯的公式,然后把这些数据放在边上啊,让你去套在这个公式里面进行计算,那这个就是我们刚刚说的,不管是普通人还是物理学家,都只能获得10%左右的正确率的,这样的一种呃刑事以考试的形式,然后呢,但是其实他们呃发现了还有另外一种方法啊,能够大幅的提升,贝叶斯计算的成功率非常非常显著啊,从10%提升到46%,而且呃不光是对高智商人士起作用,对普通的大学生也起作用。那这个其实就是我们所谓的一个叫具象化的概率表征,那具体什么叫最像化的概率表征呢?那我们把这个题目换一个方式来来进行解题,我们把它变成这样的一个呃格子状,那进行一个10×10也就是100个格子,那我们代表着呃,我们可以可以看下一张图啊,啊,这里面就非常清楚了,灰色的这个格子,灰色的格图上,灰色底色的格子呢代表着画呃,每100个人里面有10个是实际的伴随症患者,

那其中呢,我们说这个每10个人里面会有百会有80%,它确实会有类似的症状,那在这个灰色的格子里面又会打上一个圆圈,然后加加号了就是它会出现这样的一个症状,同时那在90个没有败血症的患者之中,还会有10%的误报率,那我们把这10%的误报率体现在这上面,那就是啊,就是10个9个这样的一个。所以那它总共的这个就是我们讲到这个病人,他带了这些症状进到你的医院之后,让他真正患上这个病的概率是多少呢?其实就是8÷8+9就是所有有症状的人,然后啊这是它的一个分就是它的嗯分母,然后呢就是实际上既有症状又患病的人啊,那最终最终算出来就47%,

这样的一个方法呢就是计算的时候,会比我们传统的方法要快得多。多而且也非常容易理解,还有另外一种方法也是成功率同样同样同样比较高的,前面这个呢叫做概率表啊,就叫做概率表,这个呢叫做概率数,也是做一个简单的一个这个诉状的一个区分,我们把实际患者和并非患者,然后患者里面有症状和没症状,没有患者里面有症状和没症状,把这个数据一层一层进行分解,那也很快就能算出这个呃算出这个呃病人患病的一个概率,那这背后是什么呢?其实啊其实是呃杰恩泽提出的这样的一个假设啊,就是呃,像数理统计概率论这些知识都是近代才有的,那我们的大脑实际上在嗯大脑实际上的进化,并没有随着我们知识的发展来来一起进化,所以呢,就像是你拿着一个计算器啊,这个计算机平常是处理实际性质的一些数据,那你打一下。或者16进制的数据塞到计算器里面,它自然是处理不了啊,这个就是我们这个吉恩泽老先生的一个核心假设,大脑是被自个被进化,调整成一个更是嗯更容易接受具象化的概率,表现的这样的一个形式。分析,然后它通过呃这个一个锯木头的一个形状,首先第1步把它一个基础概率进行切分,然后呢同时把基础呃把患病,这其中会有严重症状的和没患病者,其中会有严严重症状的,给经营切开标上不同的颜色,然后把这一块挑出来,把这两块合到一起进行除是和我们前面的那个呃概率表啊是完全一样的一个意思,那这个更计算化一些,更生动一些。好的,我们最后啊,这个思路上其实非常简单啊,就是呃用具象的东西,然后用实际的数字来代替频率啊呃代替这些小数百分数,那我们最后来膜拜一下大神啊,吉人泽是德国的心理学家,他最重要的研究呢就是在有限理性和启发式,在这个过程之中可以说上一节的这个,呃,认知偏差里面其实有大量的,呃,其实其原则在这个里面呢做出了大量的一些贡献好的那关,于贝叶斯的这个分享,我们今天就就到此为止。

属羊的 ,高概率离婚 , 一定低概率 离婚,一定不属羊

这个药 一定有效果 ,没有效果 ,一度没有服这个药

寻找可证伪性

问题1,已知一本书在豆瓣是4.0星,问估计这本书是(我认为的)好书的概率是多少?好,先来估计一下整个豆瓣(我认为的)好书的比例,假设是百分之一;再来估计一下好书中是4.0星的概率,假设30%(有的被标3.0、3.5、4.5等),接着估计一下所有不好的书中是4星的概率,假设10%。那么计算一下,得到P(H|E)为2.94%,97%的概率不是好书。