回归分析基于一系列假设。如果这些假设不成立,回归结果可能不可靠。回归诊断帮助你检验这些假设。
🔬 四大核心诊断
- 残差正态性 - 残差应服从正态分布。使用 Shapiro-Wilk 检验。
违反影响:置信区间和假设检验可能不准确
- 同方差性 - 残差的方差应保持恒定。使用 Breusch-Pagan 检验。
违反影响:标准误估计有偏,t检验和F检验失效
- 无自相关 - 残差之间应相互独立。使用 Durbin-Watson 检验。
违反影响:标准误被低估,显著性被夸大
- 多重共线性 - 自变量之间不应高度相关。使用 VIF(方差膨胀因子)。
违反影响:系数估计不稳定,难以解释各变量的独立影响
📊 判断标准
- Shapiro-Wilk - p > 0.05 表示残差近似正态
- Breusch-Pagan - p > 0.05 表示同方差性成立
- Durbin-Watson - 接近2表示无自相关(1.5-2.5通常可接受)
- VIF - VIF < 5 可接受,VIF > 10 有严重共线性问题
🛠 如果诊断不通过怎么办?
- 非正态 → 考虑变量转换(如对数转换)或使用稳健回归
- 异方差 → 使用稳健标准误或加权最小二乘法
- 自相关 → 检查是否遗漏重要变量,或使用时间序列模型
- 多重共线性 → 删除高相关变量、使用主成分回归或岭回归