🎯 项目核心:RCT评估框架
研究问题:
教育补贴项目是否有效降低了学校辍学率?
- 干预措施: 2010-2012年,给6年级学生发放3年教育补贴
- 评估方法: 随机对照试验(RCT)
- 主要结果: 辍学率(school dropout)
- 次要结果: 早婚、怀孕、生育
📋 任务明确要求回答3个问题:
问题1:Are schools comparable across treatment groups? Are student cohorts?
→ Balance checks(平衡性检验)
问题2:What were the effects of the intervention on the outcomes of interest after 3 and 5 years?
→ Treatment effects(处理效应)
问题3:Were the effects on school evasion different for girls and boys?
→ Heterogeneous effects(异质性分析)
🗺️ 完整的分析路线图
第一部分:Balance Checks(平衡性检验)
├─ 目的:证明随机化有效,treatment和control可比
├─ 学生层面:
│ ├─ ✅ 性别分布(你刚做完!)
│ └─ ✅ 年龄分布(我们已经检查了)
└─ 学校层面:
├─ 教师数量、学生数量
├─ 教师年龄、学生成绩
└─ 学校设施(厕所数量)
第二部分:Attrition Analysis(流失分析)
└─ 目的:确认调查响应率高,结果可信
├─ Year 3响应率
└─ Year 5响应率
第三部分:Main Results(主要结果)
└─ 目的:回答"项目有效吗?"
├─ Year 3 dropout率对比
├─ Year 5 dropout率对比
└─ Treatment effect大小
第四部分:Heterogeneity(异质性分析)
└─ 目的:回答"对男生女生效果一样吗?"
├─ 男生的treatment effect
├─ 女生的treatment effect
└─ 差异是否显著
第五部分:Secondary Outcomes(次要结果)
└─ 目的:看是否有spillover effects
├─ 婚姻率
├─ 怀孕率
└─ 生育率
📊 Expected Outputs(期望产出)
1. 图表(至少10个):
Balance Checks:
- Fig 1: 学校baseline特征对比(柱状图或点图)
- Fig 2: 学生性别平衡(你刚做的!)
- Fig 3: 学生年龄分布(可选)
Attrition:
- Fig 4: 调查响应率(折线图)
Main Results:
- Fig 5: Dropout率时间趋势(Treatment vs Control)
- Fig 6: Treatment effect大小(带置信区间)
Heterogeneity:
- Fig 7: 按性别分组的dropout率
- Fig 8: 按性别的treatment effects对比
Secondary Outcomes:
- Fig 9: 婚姻/怀孕结果对比
Summary:
- Fig 10: 关键发现汇总图
2. 回归表格(LaTeX格式):
- Table 1: Balance tests
- Table 2: Main treatment effects
- Table 3: Heterogeneity by gender
- Table 4: Secondary outcomes
3. 最终报告(PDF):
- Abstract
- Introduction
- Methods
- Results(包含所有图表)
- Discussion
🎓 分析的逻辑:标准RCT评估流程
1. 证明baseline可比 → Balance checks
↓
2. 证明follow-up数据质量好 → Attrition analysis
↓
3. 估计因果效应 → Treatment effects
↓
4. 探索机制和异质性 → Subgroup analysis
↓
5. 政策建议 → Discussion
💡 你现在的位置:
✅ 已完成:
- 数据探索和清理
- 学生性别平衡检查
🔄 正在做:
- Balance checks
⏳ 接下来:
- 学校平衡 → 主要结果 → 异质性 → 报告
🤔 关键理念:
为什么要Balance Checks?
→ 证明treatment和control在接受干预之前就是相似的 → 这样后来的差异就可以归因于项目本身
为什么看Year 3和Year 5?
→ Year 3:项目结束时的短期效应 → Year 5:项目结束2年后的持续效应
为什么要看性别差异?
→ 政策相关:女生辍学问题可能更严重 → 了解项目对不同群体的效果
📝 你的可视化角色:
作为负责可视化的人,你需要:
- 清晰展示balance(证明随机化有效)
- 有力展示treatment effects(主要发现)
- 精准展示heterogeneity(性别差异)
- 所有图表publication-quality(可直接用于报告)
现在清楚了吗?我们现在在做Balance Checks的第二部分(学校层面),然后会移到主要结果!
有任何问题吗?还是我们继续做学校平衡的可视化? 😊