主題
Search

博弈期望


payoff matrix 中的元素表示為 a_(ij),其中 i 是玩家 A 的 策略j 是玩家 B 的 策略。玩家 A 至少可以獲得

 min_(j<=n)a_(ij)
(1)

對於 策略 i。玩家 B 可以迫使玩家 A 獲得的收益不超過 max_(j<=m)a_(ij) 對於 策略 j。因此,玩家 A 的最佳策略

 max_(i<=m)min_(j<=n)a_(ij),
(2)

玩家 B 的最佳策略

 min_(j<=n)max_(i<=m)a_(ij).
(3)

一般來說,

 max_(i<=m)min_(j<=n)a_(ij)<=min_(j<=n)max_(i<=m)a_(ij).
(4)

等式僅在存在博弈鞍點時成立,在這種情況下,該量被稱為博弈的價值


另請參閱

博弈, 博弈鞍點, 收益矩陣, 策略, 價值

使用 探索

引用為

Weisstein, Eric W. "Game Expectation." 來自 —— 資源。 https://mathworld.tw/GameExpectation.html

主題分類