Regresión no lineal
Comando: | Estadística ![]() ![]() ![]() ![]() |
Descripción
La regresión no lineal es una técnica de regresión en la que se utiliza un modelo matemático no lineal para describir la relación entre dos variables (Glantz y Slinker, 2001).
Por ejemplo:
y = 1/(1+exp(a+b*x))
dónde
- y es la variable dependiente
- x es la variable independiente
- a y b son los parámetros que debe determinar el software
Para encontrar los parámetros del modelo, MedCalc utiliza el procedimiento iterativo Levenberg-Marquardt (Press et al., 2007) que requiere que el usuario proporcione estimaciones iniciales o las mejores conjeturas de los parámetros.
Entrada requerida
- Ecuación de regresión : seleccione o introduzca el modelo que se va a ajustar, por ejemplo: y = 1/(1+exp(a+b*x)) (tenga en cuenta que 'y=' ya se muestra y no es necesario introducirlo). En este ejemplo, a y b son los parámetros que se van a estimar. La ecuación de regresión no lineal debe incluir el símbolo x, que se refiere a la variable independiente que se selecciona en un cuadro de entrada diferente (ver a continuación). Los diferentes parámetros se pueden representar con caracteres individuales a.. z, excluyendo los caracteres x e y. También se pueden representar con nombres más significativos, como por ejemplo, 'pendiente'. Los nombres de los parámetros no deben ser iguales a ningún nombre de variable en la hoja de cálculo; al igual que las variables, no pueden incluir espacios ni los siguientes caracteres: - + / * = < > # & @ $ | ^ :, ;. () ' ' [ ] { }. Además, los nombres de los parámetros no deben comenzar con un número y deben ser distintos de palabras reservadas como TRUE, FALSE, ROW y COLUMN.
- Variable Y : seleccione la variable dependiente.
- Variable X : seleccione la variable independiente.
- Filtro : espacio para un filtro opcional para incluir un subconjunto de datos en el análisis.
- Parámetros
- Obtener parámetros de la ecuación : permite que el programa extraiga los nombres de los parámetros de la ecuación de regresión. Si no se extraen todos los parámetros deseados, probablemente se haya cometido algún error al nombrarlos o en la ecuación de regresión.
- Lista de parámetros y valores iniciales : ingrese valores iniciales (mejores estimaciones) para los diferentes parámetros. Para introducir valores iniciales, puede utilizar las diferentes funciones estadísticas de la hoja de cálculo para las variables. Estas funciones pueden referirse a las variables X e Y seleccionadas mediante los símbolos &X y &Y, respectivamente. El símbolo &FILTER puede utilizarse para referirse al filtro de datos seleccionado. Por ejemplo: cuando se selecciona 'Respuesta' como variable dependiente, puede utilizar la función VMAX(&Y) como valor inicial de un parámetro, y VMAX(&Y) devolverá el valor máximo de la variable 'Respuesta'. Nota: &X, &Y y &FILTER solo se pueden usar de la manera descrita aquí en el contexto de la inicialización de parámetros para la regresión no lineal. Estos símbolos no tienen relevancia en ninguna otra parte del programa.
- Opciones de ajuste
- Tolerancia de convergencia : el proceso de iteración finaliza cuando la diferencia entre los sucesivos ajustes del modelo es menor que este valor. La tolerancia de convergencia influye en la precisión de las estimaciones de los parámetros. Puede ingresar un número pequeño en notación E: escriba 10 × 10 como 1E-10
- Número máximo de iteraciones : el proceso de iteración se detiene cuando se alcanza el número máximo de iteraciones (cuando el número de iteraciones es inesperadamente grande, los valores del modelo o de los parámetros iniciales pueden ser inexactos).
- Opciones de gráficos
- Mostrar diagrama de dispersión y línea ajustada : opción para crear un diagrama de dispersión con línea ajustada.
- Mostrar ventana de residuos : opción para crear un gráfico de residuos.
Resultados
Iteraciones
Esta sección muestra la configuración de tolerancia e iteraciones.
A continuación se da el motivo de la terminación del proceso de iteración:
- Criterio de tolerancia de convergencia cumplido : el proceso de iteración se completó porque la diferencia entre los ajustes sucesivos del modelo se volvió menor que el valor de tolerancia de convergencia.
- Se superó el número máximo de iteraciones : el proceso de iteración se detuvo porque se alcanzó el número máximo de iteraciones. Esto puede indicar un ajuste deficiente del modelo o valores iniciales de los parámetros inadecuados.
- Modelo incorrecto o parámetros iniciales incorrectos : el programa no pudo encontrar una solución para el modelo dado utilizando los parámetros iniciales proporcionados.
- Función no definida para todos los valores de la variable independiente : el cálculo del modelo resultó en un error, por ejemplo una división por cero.
Resultados
- Tamaño de la muestra : el número de pares de datos (seleccionados).
- Desviación estándar residual : la desviación estándar de los residuos.
ecuación de regresión
Las estimaciones de los parámetros se presentan con su error estándar y un intervalo de confianza del 95%. El intervalo de confianza se utiliza para comprobar si una estimación de un parámetro difiere significativamente de un valor k. Si un valor k no se encuentra dentro del intervalo de confianza, se puede concluir que la estimación del parámetro difiere significativamente de k.
Por ejemplo, cuando la estimación del parámetro es 1,28 con un IC del 95 % de 1,10 a 1,46, entonces esta estimación del parámetro es significativamente diferente (P<0,05) de 1.
Análisis de varianza
Las tablas de Análisis de Varianza muestran el modelo de regresión, los residuos y la suma total de cuadrados. Cuando MedCalc determina que el modelo no incluye un intercepto, se reporta la suma de cuadrados 'sin corregir' y se utiliza para la prueba F. Cuando MedCalc determina que el modelo sí incluye un intercepto, se reporta la suma de cuadrados 'corregida' y se utiliza para la prueba F.
Correlación de estimaciones de parámetros
Esta tabla muestra los coeficientes de correlación entre las diferentes estimaciones de parámetros. Si encuentra que dos o más parámetros presentan una alta correlación, puede considerar reducir el número de parámetros o seleccionar otro modelo.
Diagrama de dispersión y línea ajustada
Este gráfico muestra un diagrama de dispersión y la línea de regresión no lineal ajustada.
Gráfico de residuos
Los residuos son las diferencias entre los valores predichos y los valores observados para la variable dependiente.
El gráfico de residuos permite evaluar visualmente el ajuste del modelo. Los residuos pueden indicar posibles valores atípicos (valores inusuales) en los datos o problemas con el modelo ajustado. Si los residuos muestran un patrón determinado, el modelo seleccionado podría ser inexacto.
Literatura
- Glantz SA, Slinker BK (2001) Primer of applied regression & analysis of variance. 2nd ed. McGraw-Hill.
- Press WH, Teukolsky SA, Vetterling WT, Flannery BP (2007) Numerical Recipes. The Art of Scientific Computing. Third Edition. New York: Cambridge University Press.