當前位置:股票大全官網 - 財經新聞 - 博弈論的構成要素及分類

博弈論的構成要素及分類

博弈中的決策主體,參與人記為 ,參與人的集合記為 ,若***有n個參與人,則 ,參與人參與決策是為了讓自身效用最大化(另:虛擬參與人:“自然”、“上帝”——不以參與人的意誌為轉移的 外生事件 ,虛擬參與人的選擇體現為外生事件的各種可能現象,並用概率分布來描述“自然”的選擇機理)為方便討論,把參與人 之外的其他參與人記為 ,虛擬參與人\自然記為 。

單人博弈已經退化為了最優化問題進行處理,對單人博弈而言 掌握的信息越多,所能獲得的收益越大。

雙人博弈並不總是對抗的,雙人博弈也包括合作的情況, 與單人博弈不同,雙人及以上博弈中,參與者掌握的而信息越多並不能保證所得到去的收益越多 ;個人理性並不壹定能導致集體條理性(囚徒困境);多人博弈(大於等於3)中可能出現破壞者——做損人不利己之事。

行動是參與人在決策時可供選擇的動作,壹般用 表示第 個參與人的特定行動, 表示可供參與者 選擇的行動集合,行動可以是連續的也可以是離散的。 個參與人的行動的有序集合 稱為行動組合。

行動是具有順序的:同時行動或先後行動,行動的順序對行動結果至關重要。

靜態博弈指參與人同時選擇行動的博弈

動態博弈指參與人先後選擇行動的博弈

(Remark:"同時"指的是信息概念,如果參與者在決策過程中不知道對方的選擇,那麽不管是否是同壹時間進行的決策都是靜態決策)

信息是指在博弈當中,參與人有關該博弈的知識:自然 的選擇,其他參與人的策略集合、支付函數、行動時間等。

動態博弈中的 信息集 :可理解為參與人掌握了多少信息,壹個參與人無法準確知道的變量的全體可能情況屬於壹個信息集。

根據信息的概念可以將博弈分為 完美信息博弈和完全信息博弈

劃分標準不同:

完美信息博弈: 在動態博弈中 ,如果參與人對 其他人的行動的信息 掌握得非常充分的壹類博弈(如果包含虛擬參與者, 自然的初始行動也會被所有參與者觀測到 )即:不存在事前的不確定性。

完全信息博弈:在博弈中,如果參與人對 其他人的特征和類型的信息 掌握得非常充分,這類博弈就叫做完全信息博弈。完全信息意味著,參與人完全了解博弈的格局——每個參與人的特征、策略集及支付函數等方面的準確信息,每個參與人都沒有私人信息。

(Remark: 不完全信息的博弈,往往可以視為有自然參與行動的不完美信息博弈 ,即由自然來決定對手的類型,但自然的行動選擇不是所有的參與人都觀察到了, 故不完全信息可以視為不完美信息的子集,不完全壹定不完美,反之不成立

附: 完全信息與完美信息相關概念

***同知識:是關於參與人對某種知識(如參與人的理性、參與人的支付等)了解程度的壹種描述,如果某種知識成為***同知識就意味著——每個參與人都知道它,並且每個參與人都知道每個參與人都知道它,每個參與人都知道每個參與人都知道每個參與人都知道它……

在現有的博弈分析框架下,壹般都假設博弈問題的結構(或者對博弈問題的描述)為***同知識。

私人信息:指任何壹個他擁有但不是該博弈中所有參與人***同知識的信息。

由於存在私人信息,便有了信息不對稱的問題。

策略(也稱戰略)是參與人如何對其他參與人的行動作出反應的 行動規則 ,它規定參與人 在什麽時候選擇什麽行動 。或者說,策略是參與人 “相機行動方案”

壹般用小寫 表示第 個參與人的壹個特定的策略。大寫 表示第 個參與人所有策略的集合 ,也稱參與人 的策略空間。

或者:

用 表示參與人 在博弈中可能面臨的所有決策情形的集合,稱為觀測集。參與人 在博弈中的策略可以定義為從觀測集到行動集的映射關系:

例:A有4個策略

A的每壹個策略中的第壹個元素是針對B選擇“開發”時A的行動,第二個元素針對B選擇不開發時A的行動

註:A的策略空間裏面的元素只能是自己的行動

在 人博弈中,如果每個參與人選擇壹個策略,那麽 維向量 稱為壹個策略組合。

本例中有8個策略組合:如S=((不開發,開發),開發)是壹個策略組合,意味著A的策略是“如果B開發,我不開發;如果B不開發,我開發”,B的策略是開發。

策略與行動是兩個不同的概念。策略是壹個與過程有關的概念,行動是與時序無關的動作。 策略是行動的規則,而不是行動的本身。

在靜態博弈中,所有參與人同時行動,沒有任何人能獲得他人行動的信息,故策略與行動是壹回事。這時的策略選擇就變成簡單的行動選擇,策略空間就是行動空間。但在動態博弈中策略和行動則是兩個不同的概念。

作為壹種行動的規則,在制定策略時,必須給出參與人在 每壹種可能情況下 的行動選擇, 即使參與人清楚這種情況實際上並不會發生。

支付是指在壹個特定的策略組合 下參與人 所獲得的利益(可以是確定的收益,也可以用效用水平或期望效用水平來表示)。參與人i的支付通常記為 ,簡記為 (參與人在博弈中的目標就是選擇自己的策略以最大化自己的支付函數。)

零和博弈:壹方的收益必為另壹方的損失,其支付之和為零的博弈。

常和博弈:支付之和不為零,但為壹非零常數(或正或負)的博弈。

變和博弈:支付之和不為零,且不同策略組合下的支付之和也各不相同的博弈。

均衡是所有參與人的最優策略組合,壹般記為 。 表示第 個參與人在均衡情況下的最優策略。

(通俗地說,在博弈達到均衡時,每壹個參與人都不可能因為單方面改變自己的策略而增加收益,於是各方為了自己利益的最大化而選擇了某種最優策略,並與其他對手達成了某種暫時的平衡。在外界環境沒有變化的情況下,倘若有關各方堅持原有的利益最大化原則並理性面對現實,那麽這種平衡狀況就能夠長期保持穩定。)