Saltar al contenido principal

Esta página fue traducida del inglés usando IA. Puedes encontrar el original aquí.

Prueba de Chi-cuadrado

Descripción

La prueba de Chi-cuadrado se puede utilizar para lo siguiente:

Una variable - clasificación unidireccional

Para probar la hipótesis de que, para una tabla de clasificación (p. ej., género), todos los niveles de clasificación tienen la misma frecuencia, solo se debe identificar una variable discreta en el cuadro de diálogo, y la hipótesis nula es que todos los niveles de clasificación tienen la misma frecuencia. Si el valor p calculado es pequeño (<0,05), se rechaza la hipótesis nula y se acepta la hipótesis alternativa de que existe una diferencia significativa entre las frecuencias de los diferentes niveles de clasificación.

Dos variables: clasificación de dos vías

Para comprobar la relación entre dos factores de clasificación (p. ej., género y profesión). En este caso, se deben identificar dos variables discretas en el cuadro de diálogo, y la hipótesis nula es que ambos factores son independientes. Si el valor p calculado es pequeño (<0,05), se rechaza la hipótesis nula y se acepta la hipótesis alternativa de que existe una relación entre ambos factores.

Cómo introducir datos

En el siguiente ejemplo, tenemos dos variables categóricas. Para la variable RESULTADO, se introduce el código 1 para un resultado positivo y el código 0 para un resultado negativo. Para la variable FUMAR, se utiliza el código 1 para los sujetos que fuman y el código 0 para los que no fuman. Los datos de cada caso se introducen en una fila de la hoja de cálculo.

Datos de ejemplo para la prueba de Chi-cuadrado

Entrada requerida

En el cuadro de diálogo de la prueba Chi-cuadrado, se deben identificar una o dos variables discretas con los datos de clasificación. Los datos de clasificación pueden ser valores numéricos o alfanuméricos (cadena). Si es necesario, puede convertir una variable continua en una variable discreta mediante la función SI (véase en otro lugar).

Cuadro de diálogo para la prueba de Chi-cuadrado

Opción Mostrar todos los porcentajes (sólo disponible para clasificación bidireccional): vea el ejemplo a continuación.

Resultados

Después de completar el cuadro de diálogo, haga clic en Aceptar para obtener la tabla de frecuencias con las estadísticas relevantes.

Tabla de clasificación

Resultados de la prueba de chi-cuadrado

Al seleccionar la opción Mostrar todos los porcentajes en el cuadro de diálogo, todos los porcentajes se muestran en la tabla de la siguiente manera:

Resultados de la prueba de chi-cuadrado con todos los porcentajes mostrados

In this example the number 42 in the upper left cell (for both Codes X and Coded Y equal to 0) is 67.7% of the row total of 62 cases; 75% of the column total of 56 cases and 42% of the grand total of 100 cases.

Chi-squared test

The Chi-squared statistic is the sum of the squares of the differences of observed and expected frequency divided by the expected frequency for every cell:

$$ \chi^2 = \sum{ \frac {(observed\ count\ -\ expected\ count)^2} {expected\ count}} $$

Single classification factor

When you want to test the hypothesis that for one single classification table (e.g. gender), all classification levels have the same frequency, then identify only one discrete variable in the dialog form. In this case the null hypothesis is that all classification levels have the same frequency. If the calculated P-value is low (P<0.05), then you reject the null hypothesis and the alternative hypothesis that there is a significant difference between the frequencies of the different classification levels must be accepted.

In a single classification table the mode of the observations is the most common observation or category (the observation with the highest frequency). A unimodal distribution has one mode; a bimodal distribution, two modes.

Two classification factors

When you want to study the relationship between two classification factors (e.g. gender and profession), then identify the two discrete variables in the dialog form. In this case the null hypothesis is that the two factors are independent. If the calculated P-value is low (P<0.05), then the null hypothesis is rejected and you accept the alternative hypothesis that there is a relation between the two factors.

Chi-squared test for trend

If the table has two columns and three or more rows (or two rows and three or more columns), and the categories can be quantified, MedCalc will also perform the Chi-squared test for trend. The Cochran-Armitage test for trend (Cochran, 1954; Armitage, 1955) tests whether there is a linear trend between row (or column) number and the fraction of subjects in the left column (or top row). The Cochran-Armitage test for trend provides a more powerful test than the unordered independence test above.

If there is no meaningful order in the row (or column) categories, then you should ignore this calculation.

Analysis of 2x2 table

  • For a 2x2 table, MedCalc uses the 'N−1' Chi-squared test as recommended by Campbell (2007) and Richardson (2011). In the 'N−1' Chi-squared test, χ 2 as given above is multiplied by a factor (N-1)/N. The use of Yates' continuity correction is no longer recommended.
  • Cuando los dos factores de clasificación no son independientes, o cuando se desea probar la diferencia entre proporciones en observaciones relacionadas o pareadas (por ejemplo, en estudios en los que los pacientes sirven como su propio control), se debe utilizar la prueba de McNemar.

Frecuencias esperadas pequeñas

Es un error común pensar que la prueba de Chi-cuadrado no es confiable cuando hay una o más celdas con frecuencias esperadas menores a 5.

Al buscar en Internet, es posible que encuentre muchos sitios que lo indiquen, pero ninguno de ellos cita una referencia.

Pero según Pagano y Gauvreau (2000):

'Ninguna celda de la tabla debe tener un recuento esperado menor que 1, y no más del 20% de las celdas deben tener un recuento esperado menor que 5' (con referencia a Cochran, 1954).

Y de hecho, según Cochran (1954):

' La tabla 2x2. Utilice la prueba exacta de Fisher (i) si el N total de la tabla <2 0, (ii) si 20 < N < 40 y la expectativa más pequeña es menor que 5.
Tablas de contingencia con más de 1 gl Si relativamente pocas expectativas son menores que 5 (digamos en 1 celda de 5 o más, o 2 celdas de 10 o más), se permite una expectativa mínima de 1 para calcular χ 2.';

y

'Si χ 2 tiene menos de 30 grados de libertad y la expectativa mínima es 2 o más, el uso de las tablas χ 2 ordinarias suele ser adecuado'.

Un estudio de Koehler y Lartnz (1980) (citado por Connover 1999, p. 241) considera que la aproximación de Chi-cuadrado es adecuada siempre que N ≥ 10, c ≥ 3, N 2 / c ≥ 10 y todos los E j ≥ 0,25 (siendo c el número de celdas y E j el número esperado en la celda j).

Literatura

  • Altman DG (1991) Practical statistics for medical research. London: Chapman and Hall.
  • Armitage P (1955) Tests for linear trends in proportions and frequencies. Biometrics 11:375-386.
  • Campbell I (2007) Chi-squared and Fisher-Irwin tests of two-by-two tables with small sample recommendations. Statistics in Medicine 26:3661-3675. PubMed
  • Cochran WG (1954) Some methods for strengthening the common χ 2 tests. Biometrics 10:417-451.
  • Conover WJ (1999) Practical non-parametric statistics, 3rd edition. New York: John Wiley & Sons.
  • Koehler KJ, Lartnz K (1980) An empirical investigation of goodness-of-fit statistics for sparse multinomials. Journal of the American Statistical Association 75:336-344.
  • Pagano M, Gauvreau K (2000) Principles of biostatistics, 2nd ed. Brooks/Cole, Cengage Learning.
  • Richardson JTE (2011) The analysis of 2 x 2 contingency tables - Yet again. Statistics in Medicine 30:890. PubMed

Véase también