Saltar al contenido principal

Diagrama de dispersión y línea de regresión

Descripción

En un diagrama de dispersión, se presenta gráficamente la relación entre dos variables numéricas. Una variable (la variable independiente X) define el eje horizontal y la otra (la variable dependiente Y) define el eje vertical. Los valores de las dos variables en la misma fila de la hoja de cálculo de datos representan los puntos del diagrama.

Entrada requerida

El cuadro de diálogo para el diagrama de dispersión es similar al de Regresión:

Cuadro de diálogo para diagrama de dispersión con línea de regresión

Variables

  • Variable Y y Variable X: seleccione las variables dependientes e independientes Y y X.
  • Ponderaciones: seleccione una variable que contenga las ponderaciones relativas que se asignarán a cada observación (para la regresión de mínimos cuadrados ponderada). Seleccione la variable ficticia. '*** AutoWeight 1/SD^2 ***' Para un procedimiento automático de regresión ponderada que corrige la heterocedasticidad (Neter et al., 1996). Esta variable ficticia aparece como el primer elemento en la lista desplegable de Ponderaciones.
  • Filtro: también puede ingresar un filtro de datos para incluir solo un subgrupo seleccionado de casos en el análisis estadístico.

Ecuación de regresión

Por defecto, la opción Incluir constante en la ecuación está seleccionada. Esta es la opción recomendada para obtener una regresión por mínimos cuadrados ordinarios. Si necesita una regresión a través del origen (sin una constante a en la ecuación), puede desmarcar esta opción (en Eisenhauer, 2003, se ofrece un ejemplo de cuándo esto es apropiado).

MedCalc ofrece una selección de 5 ecuaciones de regresión diferentes (x representa la variable independiente e y la variable dependiente):

y = a + bxlínea recta
y = a + b log(x)curva logarítmica
pesado) = a + bxcurva exponencial
pesado) = a + b log(x)curva geométrica
y = a + bx + cx 2regresión cuadrática (parábola)

Cuando selecciona una ecuación que contiene una transformación logarítmica para una de las variables, el programa utilizará una escala logarítmica para la variable correspondiente.

Opciones

  • Confianza del 95 %: Se dibujarán dos curvas junto a la línea de regresión. Estas curvas representan un intervalo de confianza del 95% para la línea de regresión. Este intervalo incluye la línea de regresión real con una probabilidad del 95%.
  • Predicción del 95 %: se dibujarán dos curvas junto a la línea de regresión. Estas curvas representan el intervalo de predicción al 95 % para la curva de regresión. El intervalo de predicción al 95 % es mucho más amplio que el intervalo de confianza al 95 %. Para cualquier valor dado de la variable independiente, este intervalo representa la probabilidad del 95 % para los valores de la variable dependiente.
  • Línea de igualdad: opción para dibujar una línea de igualdad (y = x) en el gráfico.
  • Mapa de calor: opción para mostrar un mapa de calor, donde el color de fondo indica la densidad de los puntos, sugiriendo agrupamientos de observaciones.

Residuos

En el análisis de regresión, los residuos son las diferencias entre los valores predichos y los valores observados de la variable dependiente. El gráfico de residuos permite una evaluación visual del ajuste del modelo seleccionado.

Para obtener un gráfico de residuos, seleccione esta opción en el cuadro de diálogo. Este gráfico se mostrará en una segunda ventana.

Subgrupos

Haga clic en el botón Subgrupos si desea identificar subgrupos en el diagrama de dispersión. Se mostrará un nuevo cuadro de diálogo en el que podrá seleccionar una variable categórica. El gráfico utilizará distintos marcadores para las diferentes categorías de esta variable y, opcionalmente, mostrará líneas de regresión para todos los casos y para cada subgrupo.

Ejemplos

Diagrama de dispersión con línea de regresión
Diagrama de dispersión con línea de regresión

Línea de regresión e intervalo de confianza del 95%
Línea de regresión e intervalo de confianza al 95 %

Línea de regresión e intervalo de predicción del 95%
Línea de regresión e intervalo de predicción al 95 %

Línea de regresión, intervalo de confianza del 95% e intervalo de predicción del 95%
ínea de regresión, intervalo de confianza al 95 % e intervalo de predicción al 95 %

Línea de regresión con mapa de calor
Línea de regresión y mapa de calor

 

Cuando hace clic en un punto de la línea de regresión, el programa mostrará el valor de x y el valor de f(x) calculado mediante la ecuación de regresión.

La línea de regresión muestra f(x)

Puede presionar Ctrl   P para imprimir el diagrama de dispersión, o la tecla de función F10 para guardar la imagen como archivo en el disco. Para definir otros títulos o colores en el gráfico, o cambiar la escala de los ejes, consulte Formato del gráfico.

Si desea repetir el diagrama de dispersión, posiblemente para seleccionar una ecuación de regresión diferente, solo tiene que presionar la tecla de función F7. El cuadro de diálogo volverá a aparecer con las entradas anteriores (consulte Recordar cuadro de diálogo).

Extrapolación

MedCalc solo muestra la línea de regresión dentro del rango de los valores observados. Como norma general, no se recomienda extrapolar la línea de regresión más allá del rango observado. Sin embargo, para aplicaciones particulares, como la evaluación de datos de estabilidad, la extrapolación puede ser útil; consulte por ejemplo la directriz de la ICH Evaluation of Stability Data (PDF).

TPara permitir la extrapolación, haga clic con el botón derecho en el gráfico y seleccione Permitir extrapolación en el menú contextual.

Permitir la extrapolación

Gráfico de residuos

Al seleccionar la opción Gráfico de residuos en el cuadro de diálogo Línea de regresión, el programa mostrará una segunda ventana con el gráfico de residuos. Los residuos son las diferencias entre los valores predichos y los valores observados para la variable dependiente. El gráfico de residuos permite evaluar visualmente el ajuste del modelo o ecuación seleccionados. Los residuos pueden indicar posibles valores atípicos (valores inusuales) en los datos o problemas con el modelo de regresión. Si los residuos muestran un patrón determinado, debería considerar seleccionar un modelo de regresión diferente.

Gráfico de residuos

Literatura

  • Altman DG (1991) Practical statistics for medical research. London: Chapman and Hall.
  • Eisenhauer JG (2003) Regression through the origin. Teaching Statistics 25:76-80.
  • Neter J, Kutner MH, Nachtsheim CJ, Wasserman W (1996) Applied linear statistical models. 4th ed. Boston: McGraw-Hill.

Véase también