當前位置:股票大全官網 - 股票投資 - 隱馬爾可夫模型(基本)

隱馬爾可夫模型(基本)

假設t時刻的狀態只與t-1時刻的狀態有關,與更早的時間無關。這種假設被稱為壹階馬爾可夫假設。如果狀態有n種值,在t時刻取任意值和在t-1時刻取任意值的條件概率構成壹個n×n矩陣A,稱為狀態轉移概率矩陣。不管t時刻的狀態值是什麽,它們在下壹時刻壹定會轉向n個狀態中的壹個,所以它們的躍遷概率和壹定是1。

在實際應用中,人們無法直接觀測到狀態的值,即狀態的值是隱含的,只能獲得觀測值。因此,通過擴展模型得到了隱馬模型。

觀察序列是可用值。

狀態序列是原因,觀測序列是結果,因為某個狀態存在某個觀測值。

定義狀態觀測矩陣B,表示t時刻狀態值為S時,觀測值為V的概率。

T時刻狀態z=i的最大概率狀態序列中t-1時刻的狀態值,有了這兩個變量,就可以得到維特比算法。

訓練時,給定壹組樣本,確定狀態轉移矩陣和觀測矩陣,用最大似然估計實現。如果已知訓練樣本集中每個觀測序列對應的狀態序列,給定初始狀態如:P0 = [0.5,0.2,0.3],則K步變換過程為:p0=p0*pk。計算機程序需要使用叠代變量,通過循環來實現。多步變換後,p0收斂到壹個固定值(穩態)。模型參數可以通過最大似然估計獲得。

狀態空間:隱藏狀態s的取值範圍。

觀察空間:觀察狀態o的取值範圍。

轉移概率:矩陣的所有元素都用概率表示。它的值是非負的,每壹行的元素之和等於1。在壹定條件下,它們是相互轉移的,所以稱為轉移概率矩陣。矩陣中的行數和列數可以相等,也可以不相等。當它們相等時,矩陣是正方形。轉移概率組成的矩陣就是轉移概率矩陣。也就是說,構成轉移概率矩陣的元素就是不同狀態之間的轉移概率,可以用轉移矩陣來表示,記為a。

發射概率:初始狀態的概率分布,當前標簽已知時的發射概率,記為π。

輸出概率:基於當前狀態,不同輸出的概率分布記為b。

模型參數λ = (a,b,π)

1,齊次假設:馬爾可夫假設。

2.觀測獨立性假設:觀測值只取決於對應的狀態值,與其他狀態無關。

(1)首先將HMM模型表示為:lambda = HMM(A,B,pi),其中A,B,pi都是模型的參數,分別稱為轉移概率矩陣、發射概率矩陣和初始概率矩陣。

(2)然後,我們開始訓練HMM模型。語料是預先準備好的壹定數量的觀測序列及其對應的隱藏序列,通過最大似然估計得到壹組參數,使觀測序列到對應的隱藏序列的概率最大化。

(3)在訓練過程中,為了簡化計算,馬爾科夫提出了壹個假設:隱序列中每個單元的可能性只與前壹個單元相關。這個假說就是著名的內隱假說。

(4)經過訓練,我們得到壹個具有預測能力的新模型:lambda = HMM(A,B,pi),其中模型參數發生了變化。

(5)給定輸入序列(x1,x2、...,xn),通過計算lambda(x1,x2,...,xn)通過模型。

(6)最後用維特比算法從隱藏序列的條件概率分布中找出概率最高的序列路徑,這就是我們需要的隱藏序列:(y1,y2,...,yn)。

通過訓練樣本得到狀態轉移矩陣,並采用最大似然估計。

初始狀態取每個值的概率π,狀態轉移概率矩陣A和觀測概率矩陣b。

隱馬爾可夫模型需要解決以下三個問題:

(1)估計問題(觀測序列出現的概率)。給定隱馬爾可夫模型的參數a和b,計算觀察序列X的概率值p(x)。向前向後算法

(2)解碼問題(觀測序列最大化的隱藏序列)。給定隱馬爾可夫模型的參數A和B以及壹個觀測序列X,計算最有可能產生這個觀測序列的狀態序列Z。

知道壹個觀察序列,尋找最有可能產生它的狀態序列。維特比算法

(3)學習問題。給定隱馬爾可夫模型的結構,但參數未知,給定壹組訓練樣本,確定隱馬爾可夫模型的參數A和B。

保姆韋爾奇算法

隱馬爾可夫模型對條件概率p(x|z)建模,所以它是壹個生成模型。