RMSE (Root Mean Squared Error)
El Error Cuadrático Medio Raíz (RMSE) es simplemente la raíz cuadrada del MSE. Esta transformación aparentemente trivial tiene una consecuencia importante: las unidades vuelven a ser interpretables.
Definición
Sea un conjunto de observaciones con valores reales y valores predichos .
El RMSE se define como:
Desglose de la fórmula
| Símbolo | Nombre | Significado |
|---|---|---|
| Raíz cuadrada | Deshace el efecto del cuadrado en las unidades | |
| MSE | El error cuadrático medio |
Propiedades matemáticas
Propiedad 1: Unidades originales
El RMSE tiene las mismas unidades que la variable objetivo:
Esto lo hace directamente comparable con la escala de los datos, a diferencia del MSE.
Propiedad 2: Relación con MSE
El RMSE y el MSE están relacionados de forma monotónica:
Minimizar RMSE es equivalente a minimizar MSE, pero RMSE es más interpretable.
Propiedad 3: Cota inferior por MAE
El RMSE siempre es mayor o igual que el MAE:
Demostración: Por la desigualdad de las medias (QM-AM):
La igualdad se da solo cuando todos los errores son iguales en valor absoluto.
Propiedad 4: Relación con desviación estándar
El RMSE puede interpretarse como una desviación estándar de los errores (asumiendo que la media de los errores es cero):
Si el modelo no tiene sesgo sistemático (), el RMSE aproxima la desviación estándar de los residuos.
Interpretación geométrica
El RMSE es proporcional a la distancia euclidiana entre los vectores de valores reales y predichos:
donde es la norma euclidiana.
Comparación con MAE
| Aspecto | MAE | RMSE |
|---|---|---|
| Fórmula base | Valor absoluto | Cuadrado |
| Sensibilidad a outliers | Baja | Alta |
| Diferenciabilidad | No (en 0) | Sí |
| Penalización | Lineal | Cuadrática |
| Optimizador natural | Mediana | Media |
Cuándo RMSE > MAE significativamente
Si es mucho mayor que 1, indica que hay errores grandes (outliers) en las predicciones.
Ejemplo numérico
Continuando con el ejemplo de MSE:
Interpretación: El error típico del modelo es de aproximadamente $11,730.
Comparemos con el MAE del mismo ejemplo:
El ratio cercano a 1 indica que los errores son relativamente homogéneos.
Implementación
import com.minerva.core.primitives.Vector;import com.minerva.metrics.RegressionMetrics.RegressionMetrics; public class RMSEExample { public static void main(String[] args) { Vector actual = new Vector(new double[] {250, 300, 180, 420}); Vector predicted = new Vector(new double[] {245, 310, 175, 400}); RegressionMetrics metrics = new RegressionMetrics(); double rmse = metrics.RMSE(actual, predicted); System.out.println("RMSE: " + rmse); }}RMSE: 11.726039399558574
Ver también
Bonus: Análisis avanzado del RMSE
Advertencia
Esta sección requiere conocimientos de estadística matemática y teoría de la medida. Puedes saltarla sin perder continuidad.
Desigualdad de Jensen y el ratio RMSE/MAE
La relación es una consecuencia de la desigualdad de Jensen.
Para una función convexa (como ):
Aplicando con (cóncava) sobre :
Por lo tanto: .
Cotas del ratio RMSE/MAE
El ratio está acotado:
Cota inferior (): Cuando todos los errores tienen el mismo valor absoluto:
Cota superior (): Cuando solo un error es no-cero:
Entonces: , , y .
Distribución muestral del RMSE
Bajo normalidad de errores ():
donde son los grados de libertad residuales.
Por lo tanto:
Intervalos de confianza para RMSE
Un intervalo de confianza para (y por ende para RMSE esperado) es:
Convergencia asintótica
Para muestras grandes, por el teorema central del límite:
Esto permite construir intervalos de confianza asintóticos simples.