TEMA 12: CONCORDANCIA Y
CORRELACIÓN
RELACIÓN ENTRE DOS VARIABLES CUANTITATIVAS
Objetivo: Reconocer si existe relación entre las variables, el tipo y si se puede predecir el valor de una en función de la otra.
Para valores de X por encima de la media, tenemos valores de Y por encima y por debajo en proporciones similares. INCORRELACIÓN.
Para valores de X mayores que la media, le corresponden valores de Y mayores también, y lo mismo pasa por debajo de la media. FUERTE RELACIÓN DIRECTA.
Para valores de X mayores que la media le corresponden valores de Y menores. CIERTA RELACIÓN INVERSA
Dependencia Funcional: puntos
exactamente sobre la línea recta o curva.
Pero en estadística no se suele dar este
tipo de casos
Dependencia Estocástica: no están todos
los puntos exactamente sobre el modelo,
sino que existe una tendencia.
MODELOS DE ANÁLISIS DE REGRESIÓN
• Se trata de estudiar la asociación lineal entre dos
variables cuantitativas
• Ejemplo: influencia de la edad en las cifras de Tensión arterial Sistólica
• Regresión lineal simple: una sóla variable independiente
• Regresión lineal múltiple: más de una variable independiente
• Ecuación de la recta: y = ax + b (ej: TAS=a· edad +b)
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Pendiente de la recta a = β1
• Punto de intersección con el eje de coordenadas b=β0
• Β1 expresa la cantidad de cambio que se produce en la variable dependiente
por unidad de cambio de la variable independiente
• Β0 expresa cuál es el valor de la variable dependiente cuando la
independiente vale cero
• Modelos lineales deterministas: la variable independiente determine el valor
de la variable dependiente. Entonces para cada valor de la variable
independiente sólo habría un valor de la dependiente
• Modelos lineales probabilísticos: Para cada valor de la variable
independiente existe una distribución de probabilidad de valores de la
dependiente, con una probabilidad entre 0 y 1.
• La recta a determinar es aquélla con la menor distancia de cada punto a ella
• Y = β1 · x + β0
• Yi= β1 · x + β0 + ei
• Y sería la media de la variable dependiente en un grupo
con el mismo valor de la variable independiente Yi= y + ei
• Para construir un modelo de regresión lineal hace falta
conocer: Punto de intersección con el eje de coordenadas=β0 y la Pendiente de
la recta a = β1
• No hay un modelo determinista: hay una nube de puntos y
buscamos la recta que mejor explica el comportamiento de la variable
dependiente en función de la variable independiente.
• Coeficiente de correlación (Pearson y Spearman): Número
adimensional (entre -1 y 1) que mide la fuerza y el sentido de la relación
lineal entre dos variables.
• r= β1 • sx /sy
• Coeficiente de determinación: número adimensional (entre 0
y 1) que da idea de la relación entre las variables relacionadas linealmente.
Es r2
COEFICIENTE DE CORRELACIÓN
- Coeficiente
de correlación de Pearson: Paramétricas,por lo que requiere que la
distribución siga la normalidad
- Coeficiente
de correlación de Sperman: No paramétricas,no sigue la normalidad
Coeficiente de Correlación r de Pearson (r), (Rxy): Es un
coeficiente que mide el grado de la relación de dependencia que existe entre
las variables (x,y), cuyos valores van desde –1, correspondiente a una
correlación negativa perfecta, hasta 1, correspondiente a una correlación
positiva perfecta.
Alguna de las formas de comprobar la normalidad de los datos es a través de métodos gráficos (como el histograma), métodos descriptivos (como la prueba de lápiz grueso) o con pruebas de normalidad (como la prueba de Kolmogorov-Smirnov y la prueba de Sharipo-Wilk).
Comentarios
Publicar un comentario