在机器学习领域,回归模型的表现评估至关重要。今天,让我们用Python实现几个常用的回归评估指标,包括总平方和(SST)、残差平方和(SSE)、回归平方和(SSR)以及决定系数(R²)。这些指标能帮助我们了解模型的拟合优度和预测能力。
首先,我们需要准备数据和真实值。假设我们有预测值`y_pred`和实际值`y_true`。通过以下公式可以轻松计算各项指标:
- SST(总平方和) = Σ(y_true - y_true.mean())²
- SSE(残差平方和) = Σ(y_true - y_pred)²
- SSR(回归平方和) = SST - SSE
- R²(决定系数) = 1 - (SSE / SST)
此外,还可以计算相关系数R,它衡量了变量间的线性关系强度。通过`numpy`或`scipy.stats`可以快速完成这一任务。
代码示例:
```python
import numpy as np
示例数据
y_true = np.array([1, 2, 3, 4, 5])
y_pred = np.array([1.1, 1.9, 3.1, 3.9, 5.2])
计算SST、SSE、SSR和R²
SST = np.sum((y_true - y_true.mean()) 2)
SSE = np.sum((y_true - y_pred) 2)
SSR = SST - SSE
R2 = 1 - (SSE / SST)
print(f"SST: {SST}, SSE: {SSE}, SSR: {SSR}, R²: {R2}")
```
掌握这些基础指标后,你就能更科学地优化回归模型啦!💪