Prueba t de muestras independientes
Comando: | Estadística ![]() ![]() ![]() ![]() |
Descripción
La prueba t de muestras independientes (o de dos muestras) se utiliza para comparar las medias de dos muestras independientes.
Entrada requerida
Seleccione las variables para la muestra 1 y la muestra 2. Las diferencias se calcularán como Muestra2−Muestra1.
Advertencia: si las dos variables son las mismas, entonces los dos filtros deben definir grupos distintos para que el mismo caso no se incluya en las dos muestras.
Opciones
- Transformación logarítmica: si los datos requieren una transformación logarítmica (por ejemplo, cuando los datos están sesgados positivamente), seleccione la opción Transformación logarítmica.
- Intervalo de confianza: seleccione el intervalo de confianza requerido para la diferencia entre las medias. Un intervalo de confianza del 95 % es la opción habitual; seleccione un intervalo de confianza del 90 % para las pruebas de equivalencia.
- Corrección de varianzas desiguales: permite seleccionar la prueba t (suponiendo varianzas iguales) o la prueba t corregida para varianzas desiguales (prueba de Welch, Armitage et al., 2002). Con la opción 'Automático', el software seleccionará la prueba adecuada basándose en la prueba F (comparación de varianzas).
- Residuos: opcionalmente, seleccione una prueba de distribución normal de los residuos. En la prueba t para muestras independientes, los residuos son las diferencias entre las observaciones y la media de su grupo o muestra.
Resultados
Las ventanas de resultados de la prueba t de muestras independientes muestran las estadísticas de resumen de las dos muestras, seguidas de las pruebas estadísticas.
Primero se realiza una prueba F. Si el valor p es bajo (P<0,05), no se puede asumir que las varianzas de las dos muestras sean iguales, por lo que se debe considerar el uso de la prueba t con corrección para varianzas desiguales (prueba de Welch) (véase más arriba).
La prueba t para muestras independientes se utiliza para contrastar la hipótesis de que la diferencia entre las medias de dos muestras es igual a 0 (esta hipótesis se denomina, por lo tanto, hipótesis nula). El programa muestra la diferencia entre las dos medias y su intervalo de confianza (IC). A continuación, se presentan el estadístico de prueba t, los grados de libertad (GL) y la probabilidad bilateral P. Cuando el valor p es inferior al 0,05 convencional, se rechaza la hipótesis nula y se concluye que las dos medias difieren significativamente.
Muestra 1 | |
---|---|
Variable | Testosterone |
Filtro | Tratamiento="A" |
Muestra 2 | |
Variable | Testosterone |
Filtro | Tratamiento="B" |
| Muestra 1 | Muestra 2 |
---|---|---|
Tamaño muestral | 50 | 50 |
Media aritmética | 534.0400 | 668.4600 |
IC del 95 % para la media | 484.6964 a 583.3836 | 605.8856 a 731.0344 |
Varianza | 30145.5086 | 48479.0698 |
Desviación estándar | 173.6246 | 220.1796 |
Error estándar de la media | 24.5542 | 31.1381 |
Prueba F para varianzas iguales | P = 0.100 |
---|
Prueba T (asumiendo varianzas iguales)
Diferencia | 134.4200 |
---|---|
Desviación estándar combinada | 198.2733 |
Error estándar | 39.6547 |
IC del 95 % de la diferencia | 55.7266 a 213.1134 |
Estadística de prueba t | 3.390 |
Grados de libertad (GL) | 98 |
Probabilidad bilateral | P = 0.0010 |
![]() ![]() | Guardar residuos Gráfico de comparación de datos |
Transformación logarítmica
Si seleccionó la opción de transformación logarítmica, el programa realiza los cálculos sobre los logaritmos de las observaciones, pero informa las estadísticas de resumen transformadas inversamente.
Para la prueba t, se dan la diferencia y su intervalo de confianza, y la prueba se realiza en la escala transformada logarítmicamente.
A continuación, los resultados de la prueba t se transforman nuevamente y la interpretación es la siguiente: la diferencia transformada nuevamente de las medias de los logaritmos es la relación de las medias geométricas de las dos muestras (véase Bland, 2000).
Distribución normal de residuos
Para la prueba t de muestras independientes, se asume que los residuos (las diferencias entre las observaciones y su media de grupo o muestra) siguen una distribución normal. Esta suposición puede evaluarse mediante una prueba formal o métodos gráficos.
Las diferentes pruebas formales para la distribución normal podrían no tener la potencia suficiente para detectar desviaciones de la distribución normal cuando el tamaño de la muestra es pequeño. Por otro lado, cuando el tamaño de la muestra es grande, el requisito de una distribución normal es menos estricto debido al teorema del límite central.
Por lo tanto, a menudo se prefiere evaluar visualmente la simetría y la agudeza de la distribución de los residuos utilizando el histograma, el diagrama de caja y bigotes o el diagrama normal.
Para ello, haga clic en el enlace 'Guardar residuos' en la ventana de resultados. Esto guardará los valores residuales como una nueva variable en la hoja de cálculo. Posteriormente, podrá usar esta nueva variable en los diferentes gráficos de distribución.
Pruebas unilaterales o bilaterales
En MedCalc, los valores P son siempre bilaterales (como lo recomiendan Fleiss, 1981 y Altman, 1991) y no unilaterales.
Un valor P de dos caras (o de dos colas) es apropiado cuando la diferencia entre las dos medias puede ocurrir en ambas direcciones: puede ser negativa o positiva, la media de una muestra puede ser menor o mayor que la de la otra muestra.
Una prueba unilateral solo debe realizarse cuando, antes del inicio del estudio, se haya establecido que una diferencia solo puede ocurrir en una dirección. Por ejemplo, cuando la media de la muestra A debe ser mayor que la media de la muestra B por razones ajenas a la(s) muestra(s).
Interpretación de los valores P
Los valores p no deben interpretarse de forma demasiado estricta. Si bien un nivel de significancia del 5 % se acepta generalmente como punto de corte para distinguir entre un resultado significativo y uno no significativo, sería un error interpretar un cambio en el valor p, por ejemplo, de 0,045 a 0,055, como un cambio de significativo a no significativo. Por lo tanto, es preferible informar los valores p reales (p = 0,045 o p = 0,055) en lugar de p < 0,05 o p > 0,05, para que el lector pueda hacer su propia interpretación.
Con respecto a la interpretación de los valores p como significativos o no significativos, se ha recomendado seleccionar un nivel de significancia menor, por ejemplo, 0,01, cuando sea necesario tener la certeza absoluta de que existe una diferencia antes de aceptarla. Cuando un estudio está diseñado para descubrir una diferencia, o cuando se estudia un fármaco vital, deberíamos estar dispuestos a aceptar que existe una diferencia incluso cuando el valor p sea tan alto como 0,10 o incluso 0,20 (Lentner, 1982). Estos últimos autores afirman que «la tendencia en las investigaciones médicas y biológicas es utilizar una probabilidad de significancia demasiado baja».
Intervalos de confianza
Mientras que el valor P puede brindar información sobre la significancia estadística del resultado, el intervalo de confianza del 95% brinda información para evaluar la importancia clínica del resultado.
Cuando el número de casos incluidos en el estudio es elevado, una diferencia biológicamente poco importante puede ser estadísticamente muy significativa. Un resultado estadísticamente significativo no necesariamente indica una diferencia biológica real.
Por otro lado, un valor p alto puede llevar a la conclusión de una diferencia estadísticamente no significativa, aunque esta sea clínicamente significativa y relevante, especialmente cuando el número de casos es pequeño. Un resultado no significativo no implica que no exista una diferencia biológica real.
Por lo tanto, los intervalos de confianza son útiles para interpretar una diferencia, sea o no estadísticamente significativa (Altman et al., 1983).
Presentación de resultados
Se recomienda informar los resultados de la prueba t (y otras pruebas) no mediante una declaración simple como P < 0,05, sino brindando información estadística completa, como en el siguiente ejemplo de Gardner y Altman (1986):
La diferencia entre la presión arterial sistólica media de la muestra en diabéticos y no diabéticos fue de 6,0 mm Hg, con un intervalo de confianza del 95% de 1,1 a 10,9 mm Hg; la estadística de prueba t fue de 2,4, con 198 grados de libertad y un valor P asociado de P = 0,02.
En breve:
Media 6,0 mmHg, IC del 95% 1,1 a 10,9; t=2,4, gl=198, P=0,02
Literatura
- Altman DG, Gore SM, Gardner MJ, Pocock SJ (1983) Statistical guidelines for contributors to medical journals. British Medical Journal, 286, 1489-1493.
- Armitage P, Berry G, Matthews JNS (2002) Statistical methods in medical research. 4th ed. Blackwell Science.
- Bland M (2000) An introduction to medical statistics, 3rd ed. Oxford: Oxford University Press.
- Fleiss JL (1981) Statistical methods for rates and proportions, 2nd ed. New York: John Wiley & Sons.
- Gardner MJ, Altman DG (1986) Confidence intervals rather than P values: estimation rather than hypothesis testing. British Medical Journal, 292, 746-750.
- Lentner C (ed) (1982) Geigy Scientific Tables, 8th edition, Volume 2. Basle: Ciba-Geigy Limited.