矩阵对策问题及其解法
矩阵对策问题及其解法
背景
对策论研究具有竞争性质的现象。有权决定自身行为的对策参加者称为局中人,所有局中人构成集合 I,在一局对策中可供剧中人选择的一个实际可行的完整的行动方案成为策略,对于任意剧中人 i∈I,都有自己的策略集 Si。一局对策中由各剧中人选定的策略构成的策略组称为局势 s=(s1,...,sn),而全体局势集合 S=S1×...×Sn。
局势决定了对策的结果,对局势 s∈S,局中人 i 可以得到收益 Hi(s),也称为局中人 i 的赢得函数。
矩阵对策即二人有限零和对策,是一类较为简单的对策模型。
矩阵对策基础
我们假设,局中人 I 有纯策略 α1,...,αm,局中人 II 有纯策略 β1,...,βn,二者各选择一个纯策略则构成 m×n 个纯局势 (αi,βj),将 (αi,βj) 下 I 的赢得值记为 ai,j,设矩阵 A=[ai,j],称为 I 的赢得矩阵或 II 的支付矩阵。局中人 II 的赢得矩阵就是 −AT。
最优纯策略
若纯局势 (ai∗,bj∗) 满足
maximinjai,j=minjmaxiai,j=ai∗,j∗
则称为矩阵对策 {S1,S2;A} 的最优纯策略。显然,最有纯策略在赢得矩阵中对应的元素一定满足,其是所在行的最小元素,也是所在列的最大元素,即矩阵的鞍点。
混合策略
当纯策略不存在时,我们希望给出一个选取不同策略的概率分布。我们记 I,II 的概率分布向量分别为 x,y,所有概率分布向量构成的集合为 S1,S2,则局中人 I 的赢得函数为 E(x,y)=xTAy。纯策略是混合策略的特例。
若混合局势 (x∗,y∗) 满足
maxxminyE(x,y)=minymaxxE(x,y)=E(x∗,y∗)
则称为矩阵对策 {S1,S2;A} 的最优混合策略。同样,混合策略 (x∗,y∗) 是最有混合策略的充要条件也是 (x∗,y∗) 是函数 E(x,y) 的鞍点。
可以证明,任意矩阵对策一定存在混合策略意义下的解。
超优原则
若矩阵 A 中第 i 行元素均不小于第 j 行对应元素,则称 I 的纯策略 ai 超优于 aj。推广一下,超优者也可以是若干纯策略的线性组合。
如果局中人 I 的纯策略 ai 被其它纯策略或若干纯策略的线性组合超优时,可以将 ai 删去而不影响结果,称为超优原则。超优原则在一些情况下可以简化计算。
矩阵对策的解法
公式法
公式法用于求解 2×2 矩阵对策问题。
考虑当 A 没有鞍点时,如何求解最优混合策略。因为没有鞍点,所以对于 I 的行动,有
a11x1+a21x2=a12x1+a22x2=v,x1+x2=1
对 II 也是同理。在没有鞍点的条件下方程组一定严格非负解。
图解法
图解法用于求解 2×n 或 m×2 矩阵对策问题。
对于一个 2×n 的矩阵对策问题,考虑局中人 I 的混合策略 (x,1−x)T,x∈[0,1],过数轴上 (0,0),(1,0) 分别作垂线一条,垂线上点的纵坐标值分别表示局中人 I 采取纯策略 α1=(1,0)T,α2=(0,1)T 时,I 的赢得值。
当局中人 I 选择每一策略 (x,1−x)T 时,他最少可能收入为所有局中人 II 选择确定的若干条直线在 x 处的纵坐标的最小者。要使得 I 在最坏情况下的收入尽可能多,它应当使得直线 x 与那若干条直线交出的点的纵坐标最小值最大。这转化成了一个非常直观的问题,作出若干条直线,列方程求解交点坐标,原问题得以解决。此时,局中人 I 通常取了混合策略,而局中人 II 取的是纯策略。
现在考虑 m×2 的矩阵对策问题,我们将局中人 I 的 m 种纯策略作出直线,然后考虑每个横坐标处的交点最大值即可。此时,局中人 II 取的通常是混合策略,而局中人 I 取纯策略。
先前提到的超优原则在图解法上的体现则更加直观。对于 2×n 矩阵对策问题,若 II 的纯策略 βi 超优于 βj,则 i 所对应的线段始终不出现在 j 的上方。此时它对求解最大的最小值没有任何影响,因此可以删去。当然,删去后虽然最优解的值不变,但可能会导致解集变小。
线性方程组法
线性方程组法是对公式法的推广 ,即将 2×2 推广到 m×n 的情形,其思路是相同的,在此不作赘述。
线性规划方法
根据
∑iaijxi≥v,∑ixi=1,xi≥0
以及
∑jaijyj≤v,∑jyj=1,yj≥0
对其进行变换,令 x′i=xi/v,y′j=yj/v,得线性规划问题 P
minz=∑ix′i,∑iaijx′i≥1,x′i≥0
对后者进行变换可得其对偶问题 D。
一般先求问题 D 的解,而问题 P 的解可以从问题 D 的解的最后一个单纯形表上得到。
来源https://www.cnblogs.com/mollnn/p/14831120.html