- Educación
- Matemáticas
- Estadísticas
- Cómo calcular una línea de regresión
Libro Relacionado
INDICE
Estadísticas para tontos, 2ª edición
Por Deborah J. Rumsey
En estadística, se puede calcular una línea de regresión para dos variables si su gráfica de dispersión muestra un patrón lineal y la correlación entre las variables es muy fuerte (por ejemplo, r = 0,98). Una línea de regresión es simplemente una sola línea que mejor se ajusta a los datos (en términos de tener la menor distancia total desde la línea hasta los puntos). Los estadísticos llaman a esta técnica para encontrar la línea que mejor encaje, un simple análisis de regresión lineal usando el método de los mínimos cuadrados.
Diagrama de dispersión de los chirridos de cricket en relación con la temperatura exterior.
La fórmula para la línea de mejor ajuste (o línea de regresión) es y = mx + b, donde m es la pendiente de la línea y b es la intersección y. Esta ecuación en sí misma es la misma que se usa para encontrar una recta en álgebra; pero recuerda, en estadística, los puntos no se encuentran perfectamente en una recta – la recta es un modelo alrededor del cual se encuentran los datos si existe un patrón lineal fuerte.
- La pendiente de una recta es el cambio en Y sobre el cambio en X. Por ejemplo, una pendiente de medios a medida que el valor de x aumenta (se mueve hacia la derecha) en 3 unidades, el valor de y se mueve hacia arriba en 10 unidades en promedio.
- La intersección y es el valor en el eje y donde la línea se cruza. Por ejemplo, en la ecuación y=2x – 6, la recta cruza el eje y con el valor b= -6. Las coordenadas de este punto son (0, -6); cuando una línea cruza el eje y, el valor de x es siempre 0.
Usted puede estar pensando que tiene que probar muchas y muchas líneas diferentes para ver cuál se ajusta mejor. Afortunadamente, usted tiene una opción más directa (aunque ver una línea en la gráfica de dispersión le ayuda a pensar en lo que esperaría que fuera la respuesta). La línea que mejor se ajusta tiene una pendiente e intersección en y que se puede calcular usando fórmulas (y estas fórmulas no son muy difíciles de calcular).
Para ahorrar mucho tiempo calculando la mejor línea de adaptación, primero encuentre los «cinco grandes», cinco estadísticas de resumen que necesitará en sus cálculos:
- La media de los valores de x
- La media de los valores de y
- La desviación estándar de los valores de x (denotados como sx)
- La desviación estándar de los valores de y (denota sy)
- La correlación entre X e Y (denotada como r)
Encontrar la pendiente de una línea de regresión
La fórmula para la pendiente, m, de la línea mejor ajustada es
donde r es la correlación entre X e Y, y sx y sy son las desviaciones estándar de los valores de x y y, respectivamente. Simplemente divide sy por sx y multiplica el resultado por r.
Tenga en cuenta que la pendiente de la línea que mejor se ajuste puede ser un número negativo porque la correlación puede ser un número negativo. Una pendiente negativa indica que la línea va cuesta abajo. Por ejemplo, si un aumento en el número de agentes de policía está relacionado con una disminución lineal del número de delitos, entonces la correlación y, por lo tanto, la pendiente de la línea que mejor se ajusta es negativa en este caso.
La correlación y la pendiente de la línea que mejor se ajusta no son las mismas. La fórmula para la pendiente toma la correlación (una medida sin unidades) y le agrega unidades. Piense en sy dividido por sx como la variación (parecida a un cambio) en Y sobre la variación en X, en unidades de X e Y. Por ejemplo, la variación en temperatura (grados Fahrenheit) sobre la variación en el número de chirridos de grillos (en 15 segundos).
Encontrar la intersección y de una línea de regresión
La fórmula para la intersección en y, b, de la línea que mejor se ajusta es
son los medios de los valores de x y de y, respectivamente, y m es la pendiente.
Así que para calcular la intersección en y, b, de la línea que mejor encaje, empiezas por encontrar la pendiente, m, de la línea que mejor encaje usando los pasos anteriores. Luego para encontrar la intersección y, multiplicas m por
Calcule siempre la pendiente antes de la intersección y.
La fórmula para la intersección y contiene la pendiente!