Saltar al contenido principal

Esta página fue traducida del inglés usando IA. Puedes encontrar el original aquí.

Estadísticas resumidas

Descripción

Permite calcular estadísticas de resumen: media, mediana, desviación estándar, percentiles, etc.

Entrada requerida

En el cuadro de diálogo Resumen de estadísticas, seleccione la variable de interés. También puede introducir un filtro en el campo Seleccionar para incluir solo un subgrupo de casos seleccionado, como se describe en la Introducción de este manual.

Dialog box for summary statistics

Puede hacer clic en el Botón desplegablebotón para obtener una lista de variables. En esta lista, puede seleccionar una variable haciendo clic en su nombre.

Opciones

  • Transformación logarítmica : si los datos requieren una transformación logarítmica (por ejemplo, cuando los datos están sesgados positivamente), seleccione la opción Transformación logarítmica.
  • Prueba de distribución normal : ver Pruebas de distribución normal.
  • Haga clic en el botón Más opciones para ver opciones adicionales:

    Opciones adicionales

    • Percentiles: permite seleccionar los percentiles de interés.
    • Otros promedios
      • Media recortada: opción para calcular una media recortada. Seleccione el porcentaje de observaciones que se recortarán. Por ejemplo, si selecciona el 10 %, se omitirán el 5 % inferior y el 5 % superior de las observaciones para el cálculo de la media recortada. Consulte Cálculo de la media recortada, EE e intervalo de confianza para obtener más detalles.
      • Media geométrica. La media geométrica viene dada por:
        $$\left (\prod_{i=1}^n{x_i} \right) ^\tfrac1n = \sqrt[n]{x_1 x_2 \cdots x_n} = \exp\left[\frac1n\sum_{i=1}^n\ln x_i\right] $$
        Esta opción no está disponible cuando se selecciona la transformación logarítmica (cuando se selecciona la transformación logarítmica, la media informada ya es la media geométrica).
      • Media armónica. La media armónica viene dada por:
        $$\frac{n}{\frac1{x_1} + \frac1{x_2} + \cdots + \frac1{x_n}} = \frac{n}{\sum\limits_{i=1}^n \frac1{x_i}} $$
        Esta opción no está disponible cuando se selecciona la transformación logarítmica.
    • Subgrupos: (opcionalmente) seleccione una variable categórica para dividir los datos en varios subgrupos (máximo 8). Se proporcionarán estadísticas de resumen para todos los datos y subgrupos.

Resultados

Estadísticas resumidas

Variable

WEIGHT

Tamaño muestral

100

Valor más bajo

59.0000

Valor más alto

105.0000

Media aritmética

77.0400

IC del 95 % para la media aritmética

75.1377 a 78.9423

Mediana

77.0000

IC del 95 % para la mediana

74.0000 a 79.0000

Varianza

91.9176

Desviación típica

9.5874

Desviación típica relativa

0.1244 (12.44%)

Error típico de la media

0.9587

Coeficiente de asimetría

0.3684 (P=0.1242)

Coeficiente de curtosis

-0.2175 (P=0.7336)

Prueba de Shapiro-Wilk
para la distribución normal

W=0.9835
aceptar Normalidad (P=0.2462)

Percentiles

 

Intervalo de confianza del 95 %

2.5

60.0000

 

5

62.5000

59.0000 a 65.1396

10

65.5000

62.0539 a 67.7165

25

70.0000

68.0000 a 72.0000

75

83.5000

80.0000 a 86.0000

90

90.0000

86.0000 a 94.9461

95

94.5000

90.7207 a 99.8311

97.5

95.0000

 

Tamaño de la muestra : el número de casos n es el número de entradas numéricas para la variable que cumplen el filtro.

El valor más bajo y el valor más alto de todas las observaciones (rango).

Media aritmética : la media aritmética $\bar{x}$ es la suma de todas las observaciones dividida por el número de observaciones n :

$$\begin{align} \bar{x} & = \frac{x_1+x_2+\cdots +x_n}{n} \\ & = {1 \over n} \sum_{i=1}^{n}{x_i} \\ & = {1 \over n} \sum_{}^{}{x} \end{align}$$

Intervalo de confianza (IC) del 95% para la media : se trata de un rango de valores, calculado utilizando el método descrito más adelante (ver Error estándar de la media), que contiene la media de la población con una probabilidad del 95%.

Mediana : cuando se tienen n observaciones, ordenadas de menor a mayor, la mediana es igual al valor con número de orden (n+1)/2. La mediana es igual al percentil 50. Si la distribución de los datos es normal, la mediana es igual a la media aritmética. La mediana no es sensible a valores extremos ni atípicos, por lo que puede ser una mejor medida de tendencia central que la media aritmética.

Intervalo de confianza (IC) del 95 % para la mediana : se trata de un rango de valores que contiene la mediana poblacional con una probabilidad del 95 % (Campbell y Gardner, 1988). Este intervalo de confianza del 95 % solo puede calcularse cuando el tamaño de la muestra no es demasiado pequeño.

Varianza : La varianza es la media del cuadrado de las diferencias de todos los valores con la media aritmética. La varianza () se calcula mediante la fórmula:

$$s^2 = \frac{\sum_{}^{}{(x-\bar{x})^2}}{n-1} $$

Desviación estándar : la desviación estándar (s o SD) es la raíz cuadrada de la varianza y es una medida de la dispersión de los datos:

$$s = \sqrt{\frac{\sum_{}^{}{(x-\bar{x})^2}}{n-1}} $$

Cuando la distribución de las observaciones es Normal, entonces se puede asumir que el 95% de todas las observaciones están ubicadas en el intervalo media - 1,96 DE a media + 1,96 DE (para otros valores ver tabla: Valores de la distribución Normal).

Normal distribution

Este intervalo no debe confundirse con el intervalo de confianza del 95 % (IC 95 %) más pequeño para la media. La media del intervalo - 1,96 DE a la media + 1,96 DE representa un rango de confianza descriptivo del 95 % para las observaciones individuales, mientras que el IC 95 % para la media representa la incertidumbre estadística de la media aritmética.

Desviación estándar relativa (DER) : es la desviación estándar dividida entre la media. Si corresponde, este número puede expresarse como porcentaje multiplicándolo por 100 para obtener el coeficiente de variación.

Error estándar de la media (SEM) : se calcula dividiendo la desviación estándar por la raíz cuadrada del tamaño de la muestra.

$$SEM = \frac{s}{\sqrt{n}} $$

El SEM se utiliza para calcular los intervalos de confianza de la media. Cuando la distribución de las observaciones es normal o aproximadamente normal, existe un 95 % de confianza en que la media poblacional se encuentra en el intervalo  ±  t  SEM, donde t se obtiene de la distribución t con n−1 grados de libertad y una confianza del 95 % (véase la tabla ' Valores de la distribución t'). Para muestras de gran tamaño, t se acerca a 1,96.

Oblicuidad

El coeficiente de asimetría mide el grado de simetría en la distribución de una variable. Si el valor p correspondiente es bajo (P<0,05), la simetría de la variable es significativamente diferente a la de una distribución normal, cuyo coeficiente de asimetría es igual a 0 (Sheskin, 2011).

Distribución sesgada negativamente Distribución normal Distribución sesgada positivamente
Distribución sesgada negativamente
o sesgada hacia la izquierda.
Sesgo <0.
Distribución normal Asimetría
simétrica
= 0
Distribución sesgada positivamente
o sesgada hacia la derecha.
Sesgo > 0

Curtosis

El coeficiente de curtosis mide el grado de cola en la distribución de la variable (Westfall, 2014). Si el valor p correspondiente es bajo (P<0,05), la cola de la variable es significativamente diferente de la de una distribución normal, cuyo coeficiente de curtosis es igual a 0 (Sheskin, 2011).

Curtosis: distribución platicúrtica Curtosis: distribución normal Curtosis: distribución leptocúrtica
Distribución platicúrtica
Colas más delgadas
Curtosis <0
Distribución normal
Distribución mesocúrtica
Curtosis = 0
Distribución leptocúrtica
Colas más gruesas
Curtosis > 0

Prueba de distribución normal : El resultado de esta prueba se expresa como ' aceptar normalidad ' o ' rechazar normalidad ', con un valor p. Si p es mayor que 0,05, se puede asumir que los datos tienen una distribución normal y se muestra la conclusión ' aceptar normalidad '.

Si el valor p es menor que 0,05, se rechaza la hipótesis de que la distribución de las observaciones en la muestra es normal y se muestra la conclusión ' Rechazar normalidad '. En este último caso, la muestra no puede describirse con precisión mediante la media aritmética y la desviación estándar, y dichas muestras no deben someterse a ninguna prueba o procedimiento estadístico paramétrico, como, por ejemplo, una prueba t. Para comprobar la posible diferencia entre muestras con una distribución no normal, se puede utilizar la prueba de Wilcoxon y la correlación se puede estimar mediante la correlación de rangos.

Cuando el tamaño de la muestra es pequeño, puede que no sea posible realizar la prueba seleccionada y aparecerá un mensaje al respecto. En este caso, puede evaluar visualmente la simetría y la agudeza de la distribución mediante el histograma o la distribución de frecuencias acumuladas.

Percentiles (o 'centiles'): Cuando tienes n observaciones, y estas están ordenadas de menor a mayor, entonces el percentil p es igual a la observación con número de rango (Lentner, 1982; Schoonjans et al., 2011):

$$ R(p) = 0.5 + \frac {p \times n} {100} $$

Cuando el número de rango R(p) es un número entero, entonces el percentil coincide con el valor de la muestra; si R(p) es una fracción, entonces el percentil se encuentra entre los valores con rangos adyacentes a R(p y en este caso MedCalc utiliza interpolación para calcular el percentil.

La fórmula para R(p) sólo es válida cuando

$$ \frac {1}{n} \leq \frac {p}{100} \leq \frac {n-1}{n} $$

Por ejemplo, los percentiles 5 y 95 solo se pueden estimar cuando n ≥ 20, ya que

$$ \frac {1}{20} \leq \frac {5}{100} \; \text{y} \; \frac {95}{100} \leq \frac {20-1}{20} $$

Por lo tanto, no tiene sentido citar los percentiles 5 y 95 cuando el tamaño de la muestra es inferior a 20. En este caso se aconseja citar los percentiles 10 y 90, al menos si el tamaño de la muestra no es inferior a 10.

Los percentiles se pueden interpretar de la siguiente manera: p % de las observaciones se encuentran por debajo del percentil p, por ejemplo, el 10 % de las observaciones se encuentran por debajo del percentil 10.

El percentil 25 se denomina primer cuartil, el percentil 50 es el segundo cuartil (y es igual a la mediana) y el percentil 75 es el tercer cuartil.

La diferencia numérica entre los percentiles 25 y 75 constituye el rango intercuartil. Entre los percentiles 2,5 y< 97,5 se encuentra el 95 % de los valores, y este rango se denomina rango central del 95 %. El rango central del 90 % se define mediante los percentiles 5 y 95, y los percentiles 10 y 90 definen elrango central del 80 %.

Transformación logarítmica

Si se seleccionó la opción Transformación logarítmica, el programa mostrará los resultados retrotransformados. La media retrotransformada se denomina media geométrica. La varianza, la desviación estándar y el error estándar de la media no se pueden retrotransformar de forma significativa y no se informan.

Presentación de resultados

La descripción de los datos en una publicación incluirá el tamaño de la muestra y la media aritmética. La desviación típica puede indicar la variabilidad de los datos: la media fue de 25,6 mm (DE: 3,2 mm). El error típico de la media puede indicarse para mostrar su precisión: la media fue de 25,6 mm (EE: 1,6 mm).

Cuando se desea hacer una inferencia sobre la media de la población, se puede dar la media y el intervalo de confianza del 95% de la media: la media fue 25,6 (IC del 95%: 22,4 a 28,8).

Si la distribución de la variable presenta una asimetría positiva, se puede aplicar una transformación matemática de los datos para obtener una distribución normal, por ejemplo, una transformación logarítmica o de raíz cuadrada. Tras los cálculos, se pueden convertir los resultados de nuevo a la escala original. En ese caso, resulta inútil informar la desviación estándar o el error estándar de la media retrotransformados. En su lugar, se puede aplicar el antilogaritmo del intervalo de confianza en caso de que se haya aplicado una transformación logarítmica, o elevarlo al cuadrado si se ha aplicado una transformación de raíz cuadrada (Altman et al., 1983). El intervalo de confianza resultante no será simétrico, lo que refleja la forma de la distribución. Si, por ejemplo, tras la transformación logarítmica de los datos, la media es 1,408 y el intervalo de confianza del 95 % es de 1,334 a 1,482, se aplicará el antilogaritmo de estos estadísticos e informará: la media fue de 25,6 mm (IC del 95 %: 21,6 a 30,3).

Si la distribución de la variable no es normal, incluso tras una transformación logarítmica u otra, es mejor indicar la mediana y un rango de percentiles, por ejemplo, el rango intercuartil o el rango central del 90 % o del 95 %: la mediana fue de 25,6 mm (rango central del 95 %: 19,6 a 33,5 mm). El tamaño de la muestra se tendrá en cuenta al decidir si se utiliza el rango intercuartil o el rango central del 90 % o del 95 % (véase percentiles) (Altman, 1980).

La precisión de las estadísticas reportadas debe corresponder a la de los datos originales. La media y el IC del 95% pueden expresarse con un decimal más que los datos brutos, mientras que la desviación estándar y el error estándar pueden expresarse con un decimal adicional (Altman et al., 1983).

Por último, las estadísticas de resumen en el texto o en la tabla pueden complementarse con un gráfico (ver gráficos de distribución).

Literatura

  • Altman DG (1980) Statistics and ethics in medical research. VI - Presentation of results. British Medical Journal 281:1542-1544. PubMed
  • Altman DG (1991) Practical statistics for medical research. London: Chapman and Hall.
  • Altman DG, Gore SM, Gardner MJ, Pocock SJ (1983) Statistical guidelines for contributors to medical journals. British Medical Journal 286:1489-1493. PubMed
  • Campbell MJ, Gardner MJ (1988) Calculating confidence intervals for some non-parametric analyses. British Medical Journal 296:1454-1456. PubMed
  • Lentner C (ed) (1982) Geigy Scientific Tables, 8th edition, Volume 2. Basle: Ciba-Geigy Limited.
  • Schoonjans F, De Bacquer D, Schmid P (2011) Estimation of population percentiles. Epidemiology 22: 750-751. PubMed
  • Sheskin DJ (2011) Handbook of parametric and non-parametric statistical procedures. 5th ed. Boca Raton: Chapman & Hall /CRC.
  • Westfall PH (2014) Kurtosis as Peakedness, 1905 - 2014. R.I.P. The American Statistician 68:191-195. PubMed

Véase también