當前位置:股票大全官網 - 財經資訊 - 貝葉斯和樸素貝葉斯

貝葉斯和樸素貝葉斯

英國數學家。貝葉斯於1702年出生於倫敦,主要研究數學中的概率論,在統計決策函數、統計推斷和統計估計方面做出了貢獻。他的統計概率理論被稱為貝葉斯托馬斯·貝葉斯。在貝葉斯寫這篇文章之前,人們已經能夠計算出“正概率”,例如“假設袋子裏有N個白球和M個黑球,如果妳把手伸進去觸摸它們,找到黑球的概率是M/(M+N)”。壹個自然的問題是反過來的:“如果我們事先不知道袋子中黑白球的比例,但閉著眼睛觸摸出壹個(或幾個)球並觀察這些球的顏色,那麽我們可以對袋子中黑白球的比例進行壹些猜測。”這個問題就是所謂的逆概率問題。貝葉斯就是為了解決這種逆概率而生的。

p(An | B)= p(An)p(B | An)/p(B)

公式應用:

已知有100封電子郵件,其中包括70封正常電子郵件和30封垃圾郵件。“兼職”這個詞在普通郵件中出現了10次,在垃圾郵件中出現了20次。

需要解決:包含“兼職”壹詞的郵件是垃圾郵件的概率有多大?

p(垃圾郵件|兼職工作)=p(垃圾郵件)p(兼職工作|垃圾郵件)/p(兼職工作)

p(垃圾郵件)= 30/(70+30)= 0.3

p(兼職)=(10+20)/100 = 0.3

p(兼職|垃圾郵件)= 20/30

p(垃圾郵件|兼職工作)=0.3*0.67/0.3=0.67

樸素貝葉斯是壹種簡單但極其強大的預測建模算法,因此被稱為樸素貝葉斯,因為他假設的每個特征都是獨立的。

比如:

簡化為: