當前位置:股票大全官網 - 財經新聞 - 什麽是"小豬跟隨策略"?

什麽是"小豬跟隨策略"?

又稱智豬策略,解釋為:

假設豬圈裏有兩頭豬同在壹個食槽裏進食,壹頭大豬,壹頭小豬。我們假設它們都是有著認識和實現自身利益的充分理性的“智豬”,豬圈兩頭距離很遠,壹頭安裝了壹只控制飼料供應的踏板,另壹頭是飼料的出口和食槽。豬每踩壹下踏板,另壹頭就會有相當於10份的飼料進槽,但是踩踏板以及跑到食槽所需要付出的“勞動”,加起來要消耗相當於2份的飼料。

兩頭豬可以選擇的策略有兩個:自己去踩踏板或等待另壹頭豬去踩踏板。如果某壹頭豬做出自己去踩踏板的選擇,不僅要付出勞動,消耗掉2份飼料,而且由於踏板遠離飼料,它將比另壹頭豬後到食槽,從而減少吃到飼料的數量。我們假定:若大豬先到(即小豬踩踏板),大豬將吃到9份的飼料,小豬只能吃到1份的飼料,最後雙方得益為9,-1;若小豬先到(即大豬踩踏板),大豬和小豬將分別吃到6份和4份的飼料。最後雙方得益為4,4;若兩頭豬同時踩踏板,同時跑向食槽,大豬吃到7份的飼料,小豬吃到3份的飼料,即雙方得益為5,1;若兩頭豬都選擇等待,那就都吃不到飼料,即雙方得益均為0。

智豬博弈的收益矩陣可以用下表所示、表中的數字表示不同選擇下每頭豬所能吃到的飼料數量減去前去踩踏板的成本之後的凈收益水平。

大豬行動 大豬等待

小豬行動 5, 1 9, -1

小豬等待 4, 4 0, 0

智豬博弈的收益矩陣

那麽這個博弈的均衡解是什麽呢?這個博弈的均衡解是大豬選擇去踩踏板,小豬選擇等待,這時,大豬和小豬的凈收益水平均為4個單位。這是壹個“多勞不多得,少勞不少得”的均衡。

在找出上述智豬博弈的均衡解時,我們實際上是按照“重復剔除嚴格劣勢策略”的邏輯思路進行的。這壹思路可以歸納如下:首先找出某參與人的嚴格劣勢策略,將它剔除,重新構造壹個不包括已剔除策略的新博弈;然後,繼續剔除這個新的博弈中某壹參與人的嚴格劣勢策略;重復進行這壹過程,直到剩下唯壹的策略組合為止。剩下這個唯壹的策略組合,就是這個博弈的均衡解,稱為“重復剔除的占有策略均衡”。

在智豬博弈收益矩陣中可以看出:小豬踩踏板其能得到l份甚至損失1份,不踩踏板反而能得到4份。對小豬而言,無論大豬是否踩動踏板,小豬采取“搭便車”策略,也就是舒舒服服地等在食槽邊,都是最好的選擇。

大豬行動 大豬等待

小豬行動 5, 1 9, -1

小豬等待 4, 4 0, 0

剔除後的智豬博弈的收益矩陣

由於小豬有“等待”這個優勢策略,大豬只剩下了兩個選擇:等待就吃不到;踩踏板得到4份。所以“等待”就變成了大豬的劣勢策略,當大豬知道小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強,只好為自己的4份飼料不知疲倦地奔忙於踏板和食槽之間。

也就是說,無論大豬選擇什麽策略,選擇踩踏板對小豬都是壹個嚴格劣勢策略,我們首先加以剔除。在剔除小豬踩踏板這壹選擇後的新博弈中,小豬只有等待壹個選擇,而大豬則有兩個可供選擇的策略。在大豬這兩個可供選擇的策略中,選擇等待是壹個嚴格劣勢策略,我們再剔除新博弈中大豬的嚴格劣勢策略等待。剩下的新博弈中只有小豬等待、大豬踩踏板這壹個可供選擇的策略,這就是智豬博弈的最後均衡解,達到重復剔除的優勢策略均衡。

智豬博弈與囚徒困境的不同之處在於:囚徒困境中的犯罪嫌疑人都有自己的嚴格優勢策略;而智豬博弈中,只有小豬有嚴格優勢策略,而大豬沒有。