杂谈

🎯 项目核心:RCT评估框架

研究问题:

教育补贴项目是否有效降低了学校辍学率?

  • 干预措施: 2010-2012年,给6年级学生发放3年教育补贴
  • 评估方法: 随机对照试验(RCT)
  • 主要结果: 辍学率(school dropout)
  • 次要结果: 早婚、怀孕、生育

📋 任务明确要求回答3个问题:

问题1:Are schools comparable across treatment groups? Are student cohorts?

Balance checks(平衡性检验)

问题2:What were the effects of the intervention on the outcomes of interest after 3 and 5 years?

Treatment effects(处理效应)

问题3:Were the effects on school evasion different for girls and boys?

Heterogeneous effects(异质性分析)


🗺️ 完整的分析路线图

第一部分:Balance Checks(平衡性检验)
├─ 目的:证明随机化有效,treatment和control可比
├─ 学生层面:
│  ├─ ✅ 性别分布(你刚做完!)
│  └─ ✅ 年龄分布(我们已经检查了)
└─ 学校层面:
   ├─ 教师数量、学生数量
   ├─ 教师年龄、学生成绩
   └─ 学校设施(厕所数量)
   
第二部分:Attrition Analysis(流失分析)
└─ 目的:确认调查响应率高,结果可信
   ├─ Year 3响应率
   └─ Year 5响应率

第三部分:Main Results(主要结果)
└─ 目的:回答"项目有效吗?"
   ├─ Year 3 dropout率对比
   ├─ Year 5 dropout率对比
   └─ Treatment effect大小

第四部分:Heterogeneity(异质性分析)
└─ 目的:回答"对男生女生效果一样吗?"
   ├─ 男生的treatment effect
   ├─ 女生的treatment effect
   └─ 差异是否显著

第五部分:Secondary Outcomes(次要结果)
└─ 目的:看是否有spillover effects
   ├─ 婚姻率
   ├─ 怀孕率
   └─ 生育率

📊 Expected Outputs(期望产出)

1. 图表(至少10个):

Balance Checks:

  • Fig 1: 学校baseline特征对比(柱状图或点图)
  • Fig 2: 学生性别平衡(你刚做的!)
  • Fig 3: 学生年龄分布(可选)

Attrition:

  • Fig 4: 调查响应率(折线图)

Main Results:

  • Fig 5: Dropout率时间趋势(Treatment vs Control)
  • Fig 6: Treatment effect大小(带置信区间)

Heterogeneity:

  • Fig 7: 按性别分组的dropout率
  • Fig 8: 按性别的treatment effects对比

Secondary Outcomes:

  • Fig 9: 婚姻/怀孕结果对比

Summary:

  • Fig 10: 关键发现汇总图

2. 回归表格(LaTeX格式):

  • Table 1: Balance tests
  • Table 2: Main treatment effects
  • Table 3: Heterogeneity by gender
  • Table 4: Secondary outcomes

3. 最终报告(PDF):

  • Abstract
  • Introduction
  • Methods
  • Results(包含所有图表)
  • Discussion

🎓 分析的逻辑:标准RCT评估流程

1. 证明baseline可比 → Balance checks
   ↓
2. 证明follow-up数据质量好 → Attrition analysis  
   ↓
3. 估计因果效应 → Treatment effects
   ↓
4. 探索机制和异质性 → Subgroup analysis
   ↓
5. 政策建议 → Discussion

💡 你现在的位置:

✅ 已完成:
   - 数据探索和清理
   - 学生性别平衡检查
   
🔄 正在做:
   - Balance checks
   
⏳ 接下来:
   - 学校平衡 → 主要结果 → 异质性 → 报告

🤔 关键理念:

为什么要Balance Checks?

→ 证明treatment和control在接受干预之前就是相似的 → 这样后来的差异就可以归因于项目本身

为什么看Year 3和Year 5?

→ Year 3:项目结束时的短期效应 → Year 5:项目结束2年后的持续效应

为什么要看性别差异?

→ 政策相关:女生辍学问题可能更严重 → 了解项目对不同群体的效果


📝 你的可视化角色:

作为负责可视化的人,你需要:

  1. 清晰展示balance(证明随机化有效)
  2. 有力展示treatment effects(主要发现)
  3. 精准展示heterogeneity(性别差异)
  4. 所有图表publication-quality(可直接用于报告)

现在清楚了吗?我们现在在做Balance Checks的第二部分(学校层面),然后会移到主要结果!

有任何问题吗?还是我们继续做学校平衡的可视化? 😊