R² (Coeficiente de Determinación)

El R² responde una pregunta diferente: "¿Qué proporción de la variación en los datos explica mi modelo?"

A diferencia de MAE o RMSE que miden el error absoluto, R² te dice qué tan bien tu modelo captura los patrones en los datos comparado con simplemente predecir el promedio.

La fórmula

R^2 = 1 - \frac{SS_{res}}{SS_{tot}} = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2}

¿Qué significa cada parte?

$y_i$ — Valor real de la observación $i$
$\hat{y}_i$ — Valor predicho por el modelo
$\bar{y}$ — Promedio de todos los valores reales
$SS_{res} = \sum(y_i - \hat{y}_i)^2$ — Suma de errores cuadrados del modelo (residuos)
$SS_{tot} = \sum(y_i - \bar{y})^2$ — Variación total en los datos

La intuición

Imagina que no tienes ningún modelo y solo predices el promedio para todo. El error sería $SS_{tot}$ .

Ahora, con tu modelo, el error es $SS_{res}$ .

R² mide cuánto mejoró tu modelo respecto a ese baseline:

Si $SS_{res} = 0$ (predicción perfecta) entonces R² = 1
Si $SS_{res} = SS_{tot}$ (igual que el promedio) entonces R² = 0
Si $SS_{res} > SS_{tot}$ (peor que el promedio) entonces R² < 0

Ejemplo numérico

Datos: [2, 4, 6, 8] con promedio = 5

y	y predicho	(y - y pred)²	(y - promedio)²
2	2.5	0.25	9
4	4.0	0	1
6	5.5	0.25	1
8	8.0	0	9

SS res = 0.5, SS tot = 20

$R^2 = 1 - \frac{0.5}{20} = 1 - 0.025 = 0.975$

El modelo explica el 97.5% de la variación en los datos.

Implementación

MinervaR2.java

import com.minerva.metrics.RegressionMetrics.RegressionMetrics;
 
RegressionMetrics metrics = new RegressionMetrics();
double r2 = metrics.R2(actual, predicted);

API Reference

`R2(Vector actual, Vector predicted)`

Example.java

double r2 = metrics.R2(actual, predicted);

Parámetro	Tipo	Descripción
`actual`	`Vector`	Valores reales
`predicted`	`Vector`	Valores predichos

Retorna: double

Interpretación

Valor de R²	Significado
1.0	Predicción perfecta
0.9+	Excelente
0.7 - 0.9	Bueno
0.5 - 0.7	Moderado
0 - 0.5	Débil
< 0	Peor que predecir el promedio

¿Cuándo usar R²?

Recomendado:

Para evaluar qué tan bien el modelo captura patrones
Para comparar con un baseline simple

No recomendado:

Para comparar modelos con diferente número de features (usa R² Ajustado)