目录
前言
在ML中如KNN、LR、决策树等模型都是判别方式,也就是直接学出特征Y和特征X之间的关系(P(Y|X))。但是朴素贝叶斯是生成算法,他直接找出特征输出Y和特征X的联合分布P(X,Y),进而通过贝叶斯公式计算的出结果判定。
朴素贝叶斯公式
贝叶斯公式:
- P(B):先验概率
- P(B|A):后验概率
- P(A|B):条件概率,一般根据历史统计数据得到
当然我们换个表达式会变的明朗好多:
实例分析
若有以下数据:
问题:假如某男(帅,性格不好,不上进)向女生求婚,该女生嫁还是不嫁?
那实际上我们需要计算 P(嫁 | 帅 性格不好 不上进) 和 P(不嫁 | 帅 性格不好 不上进),即:
通过全概率公式计算分母:
对表中数据统计可得:
则对于类别“嫁”的贝叶斯分子为:
对于类别“不嫁”的贝叶斯分子为:
最终计算结果: