Descripción general
Los modelos de regresión son un instrumento vital para prever resultados y reconocer relaciones vitales entre variables. Para evaluar un modelo de regresión, comúnmente se utilizan métricas como exactitud, precisión, recuperación, puntuación F1, R-cuadrado, R-cuadrado ajustado, error absoluto medio y error cuadrático medio.
Introducción
- Por ejemplo, una empresa está tratando de predecir el valor de por vida de sus clientes.
Para hacer esto, tienen que construir un modelo de regresión que pueda reconocer las variables que afectan la confiabilidad y la inversión del cliente. Para determinar qué tan bien está funcionando el modelo, la empresa debe utilizar medidas como la precisión, el error absoluto medio y el error cuadrático medio.
- La precisión mide la regularidad con la que la demostración obtiene el resultado correcto. El error absoluto medio mide la distinción entre el valor anticipado y el valor real. El error cuadrático medio mide la diferencia promedio entre el valor anticipado y el valor real.
- La compañía puede utilizar estas medidas para evaluar la ejecución del programa y realizar cambios si es necesario. Estas métricas brindan a la empresa el conocimiento de qué tan bien el programa está haciendo pronósticos y pueden ofrecerles asistencia para elegir si podría ser una buena opción para sus necesidades.
Existen diversas medidas que se utilizan para comprobar si nuestro modelo está funcionando bien o no. Hablaremos de eso uno por uno en esta lección.
Error cuadrático medio (MSE)
El error cuadrático medio (MSE) podría ser una métrica utilizada para evaluar la ejecución de modelos de regresión. Mide la diferencia cuadrática promedio entre los valores anticipados y reales. El MSE se calcula tomando la suma de las diferencias al cuadrado entre los valores predichos y reales, dividiéndolo por el número de percepciones y luego sacando la raíz cuadrada del resultado. Cuanto menor sea el MSE, mejor será la pantalla en la predicción de resultados. El MSE puede ser una métrica valiosa para evaluar la precisión del modelo porque nos permite comparar la ejecución del modelo con la de diversos modelos.
- El error cuadrático medio (MSE) se calcula de la siguiente manera:
El error cuadrático medio (MSE) se calcula de la siguiente manera:
MSE = 1/N * Σ(yi - ŷi)2
Donde N es el número de observaciones e yi y ŷi son los valores reales y predichos para la observación i, respectivamente.
El error cuadrático medio puede ser un grado de la diferencia promedio entre los valores anticipados y reales. Se calcula tomando la totalidad de los contrastes al cuadrado entre los valores anticipados y reales, dividiéndolo por el número de percepciones y luego sacando la raíz cuadrada del resultado. Cuanto menor sea el MSE, mejor será el modelo para anticipar resultados.
Error cuadrático medio (RMSE)
El error cuadrático medio (RMSE) podría ser una métrica utilizada para evaluar la ejecución de modelos de regresión. Es esencialmente la raíz cuadrada del error cuadrático medio (MSE) y se utiliza regularmente como una métrica más interpretable que MSE, porque se comunica dentro de las mismas unidades que la variable objetivo.
El RMSE se calcula tomando la raíz cuadrada del MSE, que se calcula tomando la suma de los cuadrados de los contrastes entre los valores anticipados y reales, dividiéndolo por el número de percepciones, y luego sacando la raíz cuadrada del resultado. Cuanto más bajo es el RMSE, mejor es la pantalla para anticipar resultados. El RMSE podría ser una métrica valiosa para evaluar la exactitud del modelo, porque nos permite comparar la ejecución del modelo con la de modelos distintivos.
El error cuadrático medio (RMSE) se calcula de la siguiente manera:
RMSE =√(MSE)
Donde MSE es el error cuadrático medio y se calcula tomando la totalidad de los contrastes al cuadrado entre los valores anticipados y reales, dividiéndolo por el número de percepciones y luego sacando la raíz cuadrada del resultado.
El RMSE puede ser una métrica utilizada para evaluar la ejecución de modelos de regresión. Es esencialmente la raíz cuadrada del MSE y se utiliza regularmente como una métrica más interpretable que el MSE, porque se comunica dentro de las mismas unidades que la variable objetivo. Cuanto menor sea el RMSE, mejor será el modelo para anticipar resultados. El RMSE podría ser una métrica valiosa para evaluar la exactitud de los modelos porque nos permite comparar la ejecución del modelo con la de modelos distintivos.
Error absoluto medio (MAE)
Error absoluto medio (MAE): El MAE es otra métrica común utilizada en la regresión. Mide la diferencia absoluta promedio entre los valores predichos y reales.
El error absoluto medio (MAE) se calcula de la siguiente manera:
ES = 1/N*S|yi-ŷi|
Donde N es el número de observaciones e yi y ŷi son los valores reales y predichos para la observación i, respectivamente.
El error absoluto medio puede ser un grado de la diferencia absoluta media entre los valores previstos y reales. Se calcula tomando la diferencia absoluta entre los valores anticipados y genuinos, y dividiéndola por el número de percepciones. Cuanto más bajo es el MAE, mejor es el modelo para prever los resultados. El MAE puede ser una métrica valiosa para determinar la exactitud de un modelo porque nos permite comparar el rendimiento del modelo con el de diversos modelos.
R-cuadrado
El R-cuadrado (o coeficiente de determinación) es una medida de qué tan bien se ajusta el modelo de regresión aldata.Itrepresenta la proporción de varianza en la variable objetivo que puede ser explicada por las variables predictoras en el modelo. Se calcula de la siguiente manera:
R-cuadrado = 1- (SSE/SST)
Donde SSE es la suma de los errores al cuadrado (o residuos) y SST es la suma total de los cuadrados.
El R-cuadrado es una métrica utilizada para evaluar el rendimiento de los modelos de regresión. Representa la proporción de varianza en la variable objetivo que puede ser explicada por las variables predictoras en el modelo. Cuanto mayor sea el R-cuadrado, mejor será el modelo para predecir la variable objetivo. El R-cuadrado es una métrica útil para evaluar la precisión de un modelo, ya que nos permite comparar el rendimiento del modelo con el de diferentes modelos.
Propiedades de R2
- R2 oscila entre 0* y 1.
- R2 de 0 significa que no hay correlación entre la variable dependiente y la independiente.
- R2 de 1 significa que la variable dependiente se puede predecir a partir de la variable independiente sin ningún error.
- Un R2 de 0,20 significa que el 20 % de variación en Y es predecible a partir de X; un R2 de 0,40 significa que es predecible una variación del 40 %.
Nota: la puntuación R2 puede oscilar entre -∞ y 1 si no se utiliza OLS para obtener las predicciones.
R-cuadrado ajustado
El R-cuadrado ajustado es una medida de la bondad de ajuste de un modelo de regresión que se ajusta por el número de predictores en el modelo. El R-cuadrado ajustado es una versión modificada del R-cuadrado que tiene en cuenta el número de variables predictoras en el modelo. Penaliza los modelos que incluyen variables innecesarias que no mejoran el ajuste de lamodelo.esse calcula como
EquilibradoR-cuadrado =1- (n-1)/(notario público-1)*(1-R^2),
donde n es el tamaño de la muestra y p es el número de predictores en el modelo. El R-cuadrado ajustado puede oscilar entre -∞ y 1, y su valor aumenta a medida que se agregan más predictores al modelo. Un alto R-cuadrado ajustado indica que el modelo se ajusta bien a los datos. El R-cuadrado ajustado siempre disminuye a medida que se agregan más predictores al modelo, incluso si la adición del predictor mejora el ajuste del modelo. Esto se debe a que el R-cuadrado ajustado penaliza los modelos con más predictores.
Error porcentual absoluto medio (MAPE)
El error porcentual absoluto medio (MAPE) es una medida de precisión de predicción que compara el valor real de un punto de datos dado con el valor predicho. Se calcula como el promedio de los errores porcentuales absolutos de cada punto de datos. Se expresa como un porcentaje y se calcula tomando el valor absoluto de la diferencia entre los valores real y pronosticado, dividiéndolo por el valor real y luego multiplicándolo por 100. La ecuación para MAPE es la siguiente:
MAPA = (∑|Actual– Predicho|/∑ real) *100
donde ∑ representa la suma de las diferencias absolutas entre los valores reales y predichos. El MAPE es más útil cuando hay una amplia gama de valores objetivo, ya que es más sensible a los errores en los extremos del conjunto de datos. El MAPE no es apropiado para conjuntos de datos con valores cero o cercanos a cero, ya que puede dar resultados engañosos.
Error porcentual medio (MPE):
El MPE mide la diferencia porcentual promedio entre los valores previstos y reales. A diferencia del MAPE, no tiene en cuenta la dirección de los errores. Se calcula mediante la siguiente ecuación:
MPE = (1/norte) *S(Predicho Valor - Actual Valor)/Actual Valor
donde n es el número de observaciones.
Conclusión
Después de evaluar el rendimiento de la demostración de regresión, la empresa pudo distinguir las variables que afectan la dedicación y la inversión del cliente. El modelo pudo prever con precisión el tiempo de vida del cliente. La compañía pudo utilizar estas medidas para realizar cambios en la demostración y avanzar en su ejecución. El modelo mejorado ahora es capaz de anticipar con precisión el valor de vida del cliente y ayudar a la empresa a tomar mejores decisiones.
Conclusiones clave
- Error cuadrático medio (MSE): esta métrica mide la normalidad de los cuadrados de los errores.
- Error cuadrático medio (RMSE): esta métrica es la raíz cuadrada del MSE y podría ser un grado más interpretable del error.
- R-Squared (R²): esta métrica mide la cantidad de variación aclarada por el programa.
- R-cuadrado ajustado (R²): esta métrica se ajusta según la cantidad de indicadores dentro del programa.
- Error absoluto medio (MAE): esta métrica mide la diferencia absoluta promedio entre los valores anticipados y los valores genuinos.
Prueba
- ¿Qué métrica se usa más comúnmente para evaluar el desempeño de un modelo de regresión?
- Error absoluto medio (MAE)
- Error cuadrático medio (MSE)
- R2
- R2 ajustado
Respuesta:b. Error cuadrático medio (MSE)
- ¿Cómo se determina el error cuadrático medio (RMSE)?
- RMSE es la raíz cuadrada de la suma de los errores al cuadrado
- RMSE es la raíz cuadrada de la media de los errores al cuadrado
- RMSE es la media de los errores al cuadrado
- RMSE es la suma de los errores al cuadrado
Respuesta: b. RMSE es la raíz cuadrada de la media de los errores al cuadrado
- ¿Cómo se determina el R2 ajustado?
- R2 ajustado es la diferencia entre el R2 y el error cuadrático medio
- R2 ajustado es la diferencia entre el R2 y el error absoluto medio
- R2 ajustado es la relación entre la suma de los errores al cuadrado y la suma de los errores
- R2 ajustado es la relación entre la suma de los errores al cuadrado y la suma de los residuos al cuadrado
Respuesta: d. R2 ajustado es la relación entre la suma de los errores al cuadrado y la suma de los residuos al cuadrado
- ¿Cuál es el propósito de usar una métrica como el Error Absoluto Medio (MAE)?
- Para medir la precisión del modelo.
- Medir la variabilidad del modelo
- Para medir la precisión de las predicciones.
- Para medir el grado de error en el modelo
Respuesta: C. Para medir la precisión de las predicciones.