20丨朴素贝叶斯分类(上):如何让机器判断男女?
20丨朴素贝叶斯分类(上):如何让机器判断男女?
讲述:陈旸
时长14:03大小12.88M
贝叶斯原理
朴素贝叶斯分类工作原理
朴素贝叶斯分类器工作流程
赞 24
提建议
精选留言(77)
- lianlian2019-01-28老师的数学理论和实战能力一定很强(✪▽✪),思考题:1.出轨,对应隐变量,则出轨的概率根据经验得到,为先验概率;2.暧昧短信的出现为观测变量,在出轨的条件下,求出现暧昧短信的概率,即在隐变量的条件下,计算对应观测变量的概率,此为条件概率;3.在出现暧昧短信的条件下,求出轨的概率,即在观测变量的条件下,计算对应隐变量的概率,此为后验概率,然而后验概率属于条件概率中的一种。
编辑回复: 谢谢认可,关于三个问题对应的概率解释的不错。
共 2 条评论47 - 深白浅黑2019-02-02答案依次是: 1、先验概率,以经验进行判断。 2、后验概率,以结果进行判断。 3、条件概率,在某种条件下,发生结果的概率。
编辑回复: 分析的正确,顺序应该如下 1、先验概率,以经验进行判断。 2、条件概率,在某种条件下,发生结果的概率。 3、后验概率,以结果进行判断。
共 5 条评论22 - 文晟2019-01-28在朴素贝叶斯中,我们要统计的是属性的条件概率,也就是假设取出来的是白色的棋子,那么它属于盒子 A 的概率是 2/3。 这个我算的是3/5,跟老师的不一样,老师可以给一下详细步骤吗
编辑回复: 不少同学都遇到了这个问题,我来统一解答下。 这里我们需要运用贝叶斯公式(我在文章中也给出了),即: P(Bi|A)=P(Bi)P(A|Bi) / (P(B1)*P(A|B1)+P(B2)*P(A|B2)) 假设A代表白棋子,B1代表A盒,B2代表B盒。带入贝叶斯公式,我们可以得到: P(B1|A)=P(B1)P(A|B1) / (P(B1)*P(A|B1)+P(B2)*P(A|B2))=(4/7 * 1/2) / ( 4/7 * 1/2 + 3/7 * 1/3) = 2/3 其中P(B1)代表A盒的概率,7个棋子,A盒有4个,所以P(B1)=4/7。 P(B2)代表B盒的概率,7个棋子,B盒有3个,所以P(B2)=3/7。 最终求得取出来的是白色的棋子,那么它属于 A盒的概率P(B1|A)= 2/3。
共 10 条评论22 - 周飞2019-03-091.离散型变量可以直接计算概率,连续型变量需要看成正态分布,然后计算期望和标准差,来计算概率。 2.你在没有任何情况下,出轨的概率 是先验概率 如果你出轨了,那么你的手机里有暧昧短信的概率。是后验概率 也是 条件概率 在你的手机里发现了暧昧短信,认为你出轨的概率。是条件概率展开
作者回复: 很好的总结
13 - james2019-02-04检查出为阳性患有贝叶死和没有患有贝叶死这两个公式不好理解,希望能详细解释,没看懂
编辑回复: 我们假设:A表示 测出为阳性,B1表示患有贝叶死,B2表示没有患贝叶死。 检查出为阳性患有贝叶死 检查出阳性&患有贝叶死的概率,实际上是联合概率,也就是同时符合这两个条件的概率,我们用P(B1, A)代表。 那联合概率和条件概率是什么关系呢?实际上有个公式: P(X=a|Y=b) = P(X=a, Y=b) / P(Y=b) 这个公式告诉我们,如果想要求Y=b的条件下X=a的概率,等于我们知道同时符合 X=a和Y=b的概率,除以Y=b的概率。 因此你可以得出P(X=a, Y=b) = P(X=a|Y=b) * P(Y=b) 同样,带入我们想求的P(B1, A) = P(A, B1) = P(B1) * P(A|B1) 这个公式如果理解了,我在文章中计算了P(A|B1)=99.9%,P(B1)=0.01%,带入求得 0.01% * 99.9% = 0.00999% 同理,你也可以知道检查出阳性&没有患有贝叶死的概率,也就是P(B2, A),原理和P(B1, A)是一样的。 上面统计的是联合概率。如果是条件概率,比如P(B1|A)代表的是,在检查为阳性的情况下,患有贝叶死的概率。
10 - 凛冬里的匍匐者2019-01-291,第一个概率是先验概率,可以理解为是根据经验统计得到的(【出轨】与【未出轨】可以理解成是类别) 2,第二个是条件概率,可以理解是在【出轨】类别的情况下,【有暧昧短信】的概率。 3,第三个是后验概率,可以理解是在【有暧昧短信】的情况下,是【出轨】类别的概率,这个就是贝叶斯算法要解决的问题。可以这么计算: P(【出轨】|【有暧昧短信】) = P【出轨】*P(【有暧昧短信】|【出轨】)/( P【出轨】*P(【有暧昧短信】|【出轨】) + P【未出轨】*P(【有暧昧短信】|【未出轨】))展开9
- Geek_dancer2019-02-241. 再取出是白棋的条件下,该白棋来自于A盒的概率为A2/3的计算。思路是取出的是白棋已经是事实了,这时候可以排除黑棋干扰,A盒2个白棋,B盒1个白棋,那么来自A盒的概率自然为2/3. 贝叶斯公式计算:P(A | 白) = P(白 | A)P(A)/{P(白 | A)P(A) + P(白 | B)P(B)}=(1/2)*(4/7)/{(1/2)*(4/7)+(1/3)*(3/7)} = 2/3. P(A)的含义是,在无论取出什么颜色的棋子,来自A盒的概率值,即4/7 2.”在检查出阳性的情况下,患病的可能性“ 反而小于 “在检查出阳性的情况下,不患病的可能性”,和我们平时去医院体检,检查出xx呈阳性,就知道我们大概率患了xx疾病,感觉例子和现实是两个概念啊。是不是因为这个例子中,检测发生错误的概率(0.1%)远高于患病发生的概率(0.01%)的原因导致。 而且P(B1 | A)=0.01/(0.01+0.1)和P(B2 | A)=0.1/(0.01+0.1)的计算式,前面也应该是约等于吧,毕竟计算的时候将99.9%和99.99%做近似处理了,可以套用贝叶斯公式反推看看。展开共 1 条评论4
- FeiFei2019-07-09四个基础知识: 先验概率:经验推测。 条件概率:在某条件下,另一件事发生的概率。 后验概率:在事情已经发生后,推测原因。 拟然函数:关于统计参数的函数。
作者回复: Good 总结的不错
3 - 求知鸟2019-05-291、你在没有任何情况下,出轨的概率;(先验概率) 2、在你的手机里发现了暧昧短信,认为你出轨的概率。(条件概率) 3、如果你出轨了,那么你的手机里有暧昧短信的概率;(后验概率) 对应到贝叶斯案例 1、假设有一种病叫做“贝叶死”,它的发病率是万分之一, 2、现有一种测试可以检验一个人是否得病的准确率是 99.9%,它的误报率是 0.1% 3、那么现在的问题是,如果一个人被查出来患有“叶贝死”,实际上患有的可能性有多大?展开
作者回复: 2、现有一种测试可以检验一个人是否得病的准确率是 99.9%,它的误报率是 0.1%。这个不是条件概率。其他都正确
共 2 条评论2 - 圆圆的大食客2019-03-061. 离散变量可以直接求出概率,从而计算条件概率。连续变量需要假设密度函数(例如正态分布),然后通过带入值算出某一点的密度函数值。 2. 1)先验概率 2)后验概率 3)条件概率2
- FORWARD―MOUNT2019-01-29从连续到离散的转化就相当于是降维的过程。2
- 小强2020-09-08我们假定 Ai 之间是相互独立的,那么: P(A1A2A3|Cj)=P(A1|Cj)P(A2|Cj)P(A3|Cj)这公式怎么推到出来的呢?共 2 条评论1
- hellojd_gk2020-04-19我的思路和大家不太一样。人都有出轨的可能性,是个共识问题,所以,可以认为【你在没有任何情况下,出轨的概率】,是先验概率。暧昧短信 VS 出轨 两者,出轨可能性是最终关注的结果,所以,【在你的手机里发现了暧昧短信,认为你出轨的概率。】是后验概率;至于暧昧短信,是出轨的多个表象之一,属于条件概率。 有暧昧短信也不代表真出轨了,出轨应该是真办事了。1
- Simon2020-04-07p(B1 | A)的计算结果没问题,但从分子、分母的数据看,不是常规计算。常规计算应该是 0.00999% / (0.00999% + 0.09999%)。所以当前的算式是什么意思?1
- sasuke2019-07-06陈老师,对于贝叶斯公式的推导,P(B1|A)=P(B1,A)/P(A)对吧?进而由P(A)=P(A|B1)P(B1)+P(A|B2)P(B2) ,所以P(B1|A)=P(B1,A)/(P(A|B1)P(B1)+P(A|B2)P(B2))=0.00999%/(0.00999%+0.0999%)=0.09083469721767595; 而按照文中所给的计算P(B1|A)=0.01%/(0.01%+0.1%)=0.09090909090909091; 二者结果相近却不相同。此外按照求解式子理解,P(B1|A)=0.01%/(0.01%+0.1%)=》P(B1|A)=P(B1)/(P(B1)+P(A|B2)), 这个岂不是跟贝叶斯不同么?还是我理解有误?请指教。展开共 5 条评论1
- dragonstreak_12019-05-23检查出阳性,且患有贝叶死的概率详解: 1 个真患病的/ (1个真患病的 + 10个误诊的)1
- 滨滨2019-03-24贝叶斯分类本质就是计算每一个分类的概率,概率大的就是结果,在已知身高体重鞋码的情况下,判断男女的概率分别是多少。贝叶斯是一种后验概率,计算的时候是通过先验概率计算的,而先验概率是通过训练集计算的。1
- 蜗牛行天下2019-02-16个人认为思考题里,暧昧短信是一个特征,而出轨是目标值。所以区分先验概率后验概率的标准应该是是否出轨。1)任何情况下的出轨概率是一个不存在前提条件的目标概率,所以是先验概率;2)出轨的前提下,说明目标值已发生,因此考察的是目标值发生下的某个特征值的概率,所以是后验概率;3)发现暧昧短信前提下出轨的概率,是在满足某个特征值条件下的目标值概率,因此应该是条件概率。不知道我的理解是否准确?1
- Chino2019-02-05这里如果把 是否有暧昧短信视为原因 是否出轨视为结果 1. 先验概率 2. 后验概率 (因为说明了如果出轨了 问有暧昧短信的概率) 跟原文中的后验概率的原理一样 "发生结果之后,推测原因的概率" 3. 条件概率 另外对于朴素贝叶斯开头那里的例子 "在朴素贝叶斯中,我们要统计的是属性的条件概率,也就是假设取出来的是白色的棋子,那么它属于盒子 A 的概率是 2/3." 2/3是怎么算的呢 我也是算出3/5展开1
- 每天晒白牙2019-01-30第一个问题:离散数据可以方便计算出分类概率和条件概率,然后代入公式。但连续数据因为变量是连续的,不能采用离线的方法计算概率,这就需要根据数据具体的特点转化成特定的函数,用函数的特点计算 第二个问题:先验概率、后验概率、条件概率
编辑回复: 正确,计算了K折交叉验证的准确率,同时也给出了决策树的可视化。
1