22 | 朴素贝叶斯:如何让计算机学会自动分类?
22 | 朴素贝叶斯:如何让计算机学会自动分类?
讲述:黄申
时长11:35大小10.58M
如何将原始信息转化为计算机能看懂的数据?
朴素贝叶斯的核心思想
朴素贝叶斯分类 VS 其他分类算法
总结
思考题
赞 20
提建议
精选留言(45)
- Joe2019-02-11朴素贝叶斯,朴素的原因是假设各个特征是相互独立的。共 2 条评论43
- 冰冷的梦2019-03-07请问老师p(c|fi,fj) = p(c|fi) * p(c|fj)这一步是怎么推导出来的呀?共 7 条评论16
- 山中清泉明月照2019-07-07p(c|f1,f2)=p(c|f1)*p(c|f2)/p(c) 应该是这样子吧
作者回复: 严格来说,应该这样推导 p(c|f1,f2)=p(c,f1,f2)/p(f1,f2)=p(c)*p(f1|c)*p(f2|f1,c)/p(f1,f2) 由于朴素贝叶斯中的马尔科夫假设,f1和f2独立,p(c)*p(f1|c)*p(f2|f1,c)=p(c)*p(f1|c)*p(f2|c),而p(f1,f2)=p(f1)*p(f2),所以p(c)*p(f1|c)*p(f2|f1,c)/p(f1,f2) = p(c)*p(f1|c)*p(f2|c)/(p(f1)*p(f2))
共 7 条评论15 - Bora.Don2019-03-02感觉老师讲得特别好,谢谢老师!同时还在极客上购买了人工智能和数据分析的课程,都讲了朴素贝叶斯,在这讲得最明白
作者回复: 感谢支持🙏
共 2 条评论14 - 机智的捞球布2019-06-02请问老师: P(c|fi)的值不也是可以直接从训练样本中统计出来的么,为什么要用贝叶斯定理转换成p(fi|c) * p(c) / p(fi), 用另外三个统计值计算出来呢。
作者回复: 这是一个非常好的问题。确实从实现的角度来说,我们也可以直接统计p(c|fi),不过这需要一些额外的数据结构,例如类似搜索引擎的倒排索引,以及对应的预处理。这会引入一些额外的空间和实际复杂度开销,特别是在大规模并行处理的时候,更加复杂一点。
共 5 条评论11 - 邓艺晋_Jim2019-03-25为何三个概率加起来不是等于1,新来的水果不是苹果就是橙子或者西瓜啊,另外想问极客的机器学习课程在哪里有,谢谢
作者回复: 需要把三个概率再归一化,因为这个概率都只是近似值,是根据贝叶斯规则推算的,所以不是真实的概率,只是一个推算值,看相对大小。 另外,极客时间里有机器学习的课程,你可以看看专栏或者视频课程的列表
共 4 条评论7 - 唯她命2019-02-16朴素贝叶斯 必须各个特征相互独立的吗?
作者回复: 是的,朴素贝叶斯的“朴素”或者说naive就是指这个“天真”的假设。当然,很多时候并不成立,我们可以使用多阶马尔科夫模型来稍作修改,后面几节会有介绍。
7 - temool2019-02-11越看到后面越吃力,前面的也要再重新捋一遍
作者回复: 反复阅读和练习,就能加深印象,加油!
6 - 2012009862020-03-22终于明白朴素贝叶斯在分类中的原理了,给定的训练集其实包含训练集中每个类别的概率 每个特征的概率以及在已知类别下特征的条件概率,最终可以利用贝叶斯求得在给定特征下类别的概率,从而根据特征求得其属于哪个分类。不知道我这个理解对不对?
作者回复: 是的👍
5 - oillie2020-02-03垃圾邮件可以用贝叶斯分类
作者回复: 确实是
2 - 🐻🔫🐸2019-07-03太牛逼了,以前看过数学之美,就立志以后得安排一下数学,这次看老师的文章,真正意义上进行正面接触了,而且讲的相当接地气,易于理解。👍🏻
作者回复: 很高兴这个专栏对你有价值
2 - A君2020-06-27哦log原来是用于将计算机无法处理的小数转成绝对值大于1的数
作者回复: 是的
1 - zhengfan2020-04-28黄老师您好。 问题较多,列举如下: 1. 例子中列举的属性很多,但是只使用了两个参与贝叶斯公式计算,得到分类预测结果依然被认为是有效的,是因为假定了属性正交吗? 2. 为什么参与计算的属性越多,所有分类的预测概率越低?似乎有点反直觉。难道这样获得预测结果只是定序而非定量? 3. 为什么不同分类的概率之和不是全集呢?展开
作者回复: 1. 只是举一个例子,可以将多个属性都考虑进来。 2. 这是因为咱们做了很多贝叶斯方法的假设和简化。就如你所说,我们是要一个相对值,看看属于哪个分类的概率最高就行。 3. 这也是因为咱们已经做了很多假设和简化,这也是贝叶斯方法的核心思想,实际上严格来算的概率不是这样的。我们可以在计算出多个概率之后,进行概率的归一化,保证多个类的概率加起来为1.0
1 - 罗耀龙@坐忘2020-04-14茶艺师学编程 思考题 朴素贝叶斯也能用在以下方面: 1、科技领域 短信过滤 黑白名单 垃圾短信 机器学习——半监督学习 链接(路)预测 2、金融学 股票预测(基于“股票并不是随机漫步”的假设之上) 信用风险 3、交通 常规公交 城市交通 车载自组织网络 4、气象学 降水预报展开1
- 失火的夏天2019-12-29之前拉下的,现在回来补一补,概率统计居然有这么大的作用,我已经决定把大学里概率论与数理统计那本书翻出来重新复习了,O(∩_∩)O哈哈~
作者回复: 很高兴对你有所启发
1 - 刘清斌2019-10-28老师,这一讲真的很清楚明白,比其他的书籍和教程讲的形象和容易理解
作者回复: 感谢支持!
2 - Paul Shan2019-09-02我个人觉得联合分布是贝叶斯公式的枢纽,由已知的条件概率求出联合分布,再由联合分布求出待求的条件概率,老师这样理解正确吗,多谢!
作者回复: 是的
1 - 大秦岭2019-06-12看了两边,照猫画虎了好几遍,貌似懂了,继续加油中........ 谢谢老师~
作者回复: 可以自己动手实现一个NB的分类器,加深印象
1 - 大熊2019-05-20重点还是对贝叶斯公式的理解,后面的都是基于公式的变形
作者回复: 没错👍
1 - 予悠悠2019-05-02老师朴素贝叶斯和逻辑回归有什么区别呢?
作者回复: 两者理论基础不一样,朴素贝叶斯是从概率论的角度出发,而逻辑回归在回归时和线性回归类似,不过把输出转换成非线性的输出,而且把连续的数值分为两个类别。
共 2 条评论1