EC417 Advanced Macroeconomics

What is a Phase Diagram?

、

EC423 Labour Economics

What is $f$ in Mincer Model (p15 lecture 1)

$Φ$ ↑ 峰值 • ← 纳什均衡 /|
/ |
/ |
/ |
•————————• → 行动空间 A

上坡：势函数增加 = 某个参与人有激励改变
峰值：势函数局部最大 = 纳什均衡（没人想改变）

关键性质

1. 纯策略纳什均衡存在

定理：有限势博弈至少有一个纯策略纳什均衡。

证明思路：

$Φ$ 是定义在有限集合 $A$ 上的实值函数
必有最大值点 $a^{*} = ar g max_{a \in A} Φ (a)$
在 $a^{*}$ 处，任何参与人单方面偏离都不会增加 $Φ$
因此也不会增加自己的收益
所以 $a^{*}$ 是纳什均衡！

2. 最优化等价性

找纳什均衡 = 最大化势函数：

$NE \subseteq ar g max_{a \in A} Φ (a)$

（注意：反向包含不一定成立）

3. 学习动态收敛

在势博弈中，很多自然学习过程会收敛到NE：

Best-response dynamics
Fictitious play
学习算法

因为势函数提供了一个”全局目标”。

经典例子1：拥堵博弈（Congestion Games）

设定

$N$ 个参与人选择路径，每条路径的成本取决于使用人数。

例子：两个人，两条路

起点 ———路1——→ 终点
  \          /
   \—路2—→/

成本函数：

路1： $c_{1} (n) = n$ （ $n$ 是使用人数）
路2： $c_{2} (n) = 3 n$

收益矩阵（收益 = -成本）：

& \text{路1} & \text{路2} \\ \hline \text{路1} & -2,-2 & -1,-3 \\ \text{路2} & -3,-1 & -6,-6 \end{array}$$ ### 势函数 $$\Phi(a) = -\sum_{\text{路}} \sum_{k=1}^{n_{\text{路}}(a)} c_{\text{路}}(k)$$ 其中 $n_{\text{路}}(a)$ 是选择该路的人数。 对上面的例子： - $\Phi(\text{路1, 路1}) = -(1+2) = -3$ - $\Phi(\text{路1, 路2}) = -1 - 3 = -4$ - $\Phi(\text{路2, 路2}) = -(3+6) = -9$ **验证势博弈性质**： P1从"路1,路2"偏离到"路2,路2"： - 个人收益变化：$-6 - (-3) = -3$ - 势函数变化：$-9 - (-4) = -5$... 等等，这不对！让我重新算... 实际上标准的拥堵博弈势函数是： $$\Phi(a) = -\sum_{\text{资源}r} \sum_{k=1}^{n_r(a)} c_r(k)$$ 这确保了势博弈性质。 ## 经典例子2：Cournot竞争 ### 同质产品Cournot 两企业，产量 $q_1, q_2$，价格 $P(Q) = a - Q$，成本 $c \cdot q_i$。 利润： $$\pi_i(q_i, q_j) = (a - q_i - q_j)q_i - cq_i$$ ### 势函数 $$\Phi(q_1, q_2) = (a-c)(q_1 + q_2) - \frac{1}{2}(q_1 + q_2)^2 - \frac{1}{2}(q_1^2 + q_2^2)$$ 或更简洁地： $$\Phi(q_1, q_2) = \sum_i \pi_i - \frac{1}{2}\sum_i q_i^2$$ **验证**： P1改变产量从 $q_1$ 到 $q_1'$： $$\pi_1(q_1', q_2) - \pi_1(q_1, q_2) = (a - q_1' - q_2 - c)(q_1' - q_1) - \frac{1}{2}((q_1')^2 - q_1^2)$$ $$\Phi(q_1', q_2) - \Phi(q_1, q_2) = \text{（同样的表达式）}$$ 可以验证相等！✓ ## 例子3：简单协调博弈 $$\begin{array}{c|cc} & L & R \\ \hline U & 3,3 & 0,0 \\ D & 0,0 & 1,1 \end{array}$$ ### 势函数 $$\Phi = \begin{array}{c|cc} & L & R \\ \hline U & 3 & 0 \\ D & 0 & 1 \end{array}$$ **验证**： P1从U改到D（P2选L）： - 个人收益变化：$0 - 3 = -3$ - 势函数变化：$0 - 3 = -3$ ✓ P1从U改到D（P2选R）： - 个人收益变化：$1 - 0 = 1$ - 势函数变化：$1 - 0 = 1$ ✓ ## Potential Games vs Supermodular Games 你的讲义讲了**超模博弈**，两者有关系但不同： | 特性 | Potential Games | Supermodular Games | |------|----------------|-------------------| | **核心特征** | 存在势函数 | 策略互补性 | | **NE存在性** | ✅ 总存在纯策略NE | ✅ 总存在纯策略NE | | **NE唯一性** | ❌ 一般不唯一 | ❌ 可能多个（但有最大最小NE） | | **单调比较静态** | ❌ 不一定 | ✅ 有 | | **学习收敛** | ✅ 容易收敛 | ✅ 某些算法收敛 | | **关系** | 某些超模博弈是势博弈 | 某些势博弈是超模博弈 | ### 例子：同时是两者 **Cournot竞争（替代品）**： - ✅ 是势博弈（如上所示） - ❌ 不是超模博弈（策略替代） **技术采用博弈**： - ✅ 可能是势博弈 - ✅ 可能是超模博弈（网络效应） ## 为什么Potential Games重要？ ### 1. 理论意义 - **简化分析**：把多人博弈转化为单一优化问题 - **保证均衡存在**：有限势博弈必有纯策略NE - **学习收敛**：动态过程有良好性质 ### 2. 实际应用 **网络拥堵**： - 交通网络 - 通信网络 - 云计算资源分配 **市场竞争**： - Cournot竞争 - 某些价格竞争模型 **协调问题**： - 标准采用 - 技术选择 ## 与你的课程的联系 在你的讲义中： 1. **关联均衡**（Lecture 3前半部分）： - 势博弈的所有NE都是关联均衡 - 势函数最大值对应的NE可能是"最好的"关联均衡 2. **超模博弈**（Lecture 2）： - 有些博弈既是势博弈又是超模博弈 - 两者都保证纯策略NE存在 3. **学习和动态**： - 势博弈中best-response dynamics收敛 - 这与rationalizability的迭代删除过程相关 ## 如何识别Potential Game？ ### 方法1：直接构造 尝试找 $\Phi$ 使得势博弈条件满足。 ### 方法2：对称性 如果所有参与人的收益函数"相似"，可能是势博弈。 ### 方法3：拥堵结构 如果收益只依赖于"多少人选了什么"，通常是势博弈。 ## 总结 ``` Potential Games 的核心 ├─ 定义：存在势函数 Φ，单人收益变化 = Φ 变化 ├─ 性质： │ ├─ 纯策略 NE 必存在 │ ├─ NE ⊆ arg max Φ │ └─ 学习动态收敛 ├─ 例子： │ ├─ 拥堵博弈 │ ├─ Cournot 竞争 │ └─ 某些协调博弈 └─ 重要性： ├─ 多人博弈 → 单一优化 └─ 网络/市场应用广泛

HZD's Digital Garden

Running List