Gráficos de comparación múltiple
Comando: | Gráficos ![]() ![]() |
Descripción
Los gráficos de comparación múltiple permiten visualizar las diferencias entre subgrupos de una variable, o la influencia de un factor cualitativo (discreto) sobre otra variable (continua).
El gráfico puede estar compuesto de diferentes elementos: barras, líneas horizontales, marcadores y/o líneas de conexión para la media o la mediana, con opción de diferentes barras de error para la media (IC del 95 %, 1 SEM, 1 DE, 2 DE, 3 DE, rango) o mediana (IC del 95 %, percentiles 25-75, percentiles 10-90, percentiles 5-95, percentiles 2,5-97,5, percentiles 1-99, rango), diagrama de caja y bigotes o diagrama de caja y bigotes con muescas, diagrama de violín y/o diagrama de puntos (muestra todos los datos).
Entrada requerida
En el cuadro de diálogo, debe introducir lo siguiente: en Datos, seleccione una variable continua y, en Códigos de factor, un factor cualitativo. El factor cualitativo puede ser un código de caracteres o numérico. Estos códigos se utilizan para dividir los datos en varios subgrupos.
Cuando desee utilizar una variable continua como factor cualitativo discreto, puede convertir los datos continuos utilizando las herramientas Crear grupos.
Se pueden seleccionar varios elementos para componer el gráfico y algunos de ellos se pueden combinar.
- Barras, líneas horizontales, marcadores y/o líneas de conexión para medias o medianas.
- Barras de error : las siguientes barras de error están disponibles si se selecciona al menos uno de los tipos de gráficos Barras, Líneas horizontales, Marcadores y/o Líneas de conexión :
Si se selecciona media : (ninguna), o IC del 95 % para la media, 1 DE, 2 DE, 3 DE, 1 SEM y rango.
- Tenga en cuenta que 2 SEM no se incluye en esta lista: cuando el número de casos es elevado, la media ± 2 SEM corresponde al intervalo de confianza (IC) del 95 % para la media. Cuando el número de casos es pequeño, el intervalo IC del 95 % se calcula como media ± t * SEM, donde t se obtiene de una tabla t con gl = n−1 y área A = 95 % (véase también SEM).
- Although 1 SEM gives more narrow error bars, this option is not recommended since the resulting error bar may be highly misleading, especially when the number of cases in the groups is different. Preferably the 95% CI for the mean is used for providing a valid graphical comparison of means (Pocock, 1984), or use 2 SD as an indication for the variability of the data.
- When the number of cases is small, it is possible that the 95% CI for the median is not defined and that it will not be displayed in the graph.
- When you use percentile ranges, take into account the number of observations: you need at least 100 observations for 1-99 percentiles, at least 20 for 5-95 percentiles, at least 10 for 10-90 percentile and at least 4 for 25-75th percentiles.
- Box-and-Whisker plot (Tukey, 1977) or Notched box-and-whisker plot (McGill et al., 1978). A Notched box-and-whisker plot is a variation of the box-and-whisker plot in which confidence intervals for the medians are shown by means of notches surrounding the medians. If the notches about two medians do not overlap, the medians are significantly different at a ± 95% confidence level. For a detailed description of a Box-and-Whisker plot and Notched Box-and-Whisker plot, see Construction of a Box-and-Whisker plot.
- Violin plot. The violin plot (Hintze & Nelson, 1998) shows the density trace of the data. It is recommended to combine the violin plot with a box-and-whisker plot (select both options).
- When you select Dots (plot all data, all observations will be displayed in the graph.
The box-and-whisker plot in combination with dot plot has the advantage of displaying a statistical summary of the data (range, quartiles and median), without concealing the data.
If the data require a logarithmic transformation, select the Logarithmic transformation option.
Examples
Chart with bars representing the mean age of patients in a multicenter study.
'Error bars' represent 95% confidence intervals.
Chart with all data points for systolic blood pressure.
'Error bars' represent 95% confidence intervals.
A line connects the mean of the two treatment groups (coded 0 and 1).
Chart with the evolution of sperm motility during 12 years.
The means for every year are connected by a line.
Error bars represent 95% confidence intervals for the mean.
Literature
- Altman DG (1991) Practical statistics for medical research. London: Chapman and Hall.
- Hintze JL, Nelson RD (1998) Violin Plots: A Box Plot-Density Trace Synergism. The American Statistician 52:181-184.
- McGill R, Tukey JW, Larsen WA (1978) Variations of box plots. The American Statistician 32:12-16.
- Tukey JW (1977) Exploratory data analysis. Reading, Mass: Addison-Wesley Publishing Company.