p(An | B)= p(An)p(B | An)/p(B)
公式應用:
已知有100封電子郵件,其中包括70封正常電子郵件和30封垃圾郵件。“兼職”這個詞在普通郵件中出現了10次,在垃圾郵件中出現了20次。
需要解決:包含“兼職”壹詞的郵件是垃圾郵件的概率有多大?
p(垃圾郵件|兼職工作)=p(垃圾郵件)p(兼職工作|垃圾郵件)/p(兼職工作)
p(垃圾郵件)= 30/(70+30)= 0.3
p(兼職)=(10+20)/100 = 0.3
p(兼職|垃圾郵件)= 20/30
p(垃圾郵件|兼職工作)=0.3*0.67/0.3=0.67
樸素貝葉斯是壹種簡單但極其強大的預測建模算法,因此被稱為樸素貝葉斯,因為他假設的每個特征都是獨立的。
比如:
簡化為: