/ / Método de análisis de correlación: ejemplo. El análisis de correlación es ...

Método de análisis de correlación: un ejemplo. El análisis de correlación es ...

En la investigación científica a menudo surgeLa necesidad de encontrar una conexión entre las variables productivas y factoriales (rendimiento del cultivo y precipitación, altura y peso de una persona en grupos homogéneos por sexo y edad, frecuencia del pulso y temperatura corporal, etc.).

El segundo son signos que contribuyen al cambio de aquellos asociados con ellos (el primero).

El concepto de análisis de correlación.

Hay muchas definiciones del término.Con base en lo anterior, podemos decir que el análisis de correlación es un método utilizado para probar la hipótesis de la significación estadística de dos o más variables, si el investigador puede medirlas, pero no cambiarlas.

Есть и другие определения рассматриваемого conceptos El análisis de correlación es un método de procesamiento de datos estadísticos, que consiste en estudiar los coeficientes de correlación entre variables. En este caso, los coeficientes de correlación entre un par o una pluralidad de pares de características se comparan para establecer relaciones estadísticas entre ellos. El análisis de correlación es un método para estudiar la relación estadística entre variables aleatorias con la presencia opcional de una naturaleza funcional estricta, en la que la dinámica de una variable aleatoria conduce a la dinámica de la expectativa matemática de otra.

El concepto de correlación falsa.

Al realizar un análisis de correlación, es necesariotenga en cuenta que puede llevarse a cabo en relación con cualquier conjunto de signos, a menudo absurdos en relación entre sí. A veces no tienen una relación causal entre sí.

En este caso, hablan de una falsa correlación.

Tareas de análisis de correlación

En base a las definiciones anteriores, podemosformular las siguientes tareas del método descrito: obtener información sobre una de las variables deseadas utilizando la otra; Determinar la estrechez de la relación entre las variables estudiadas.

El análisis de correlación implica determinar la relación entre las características estudiadas, en relación con la cual las tareas de análisis de correlación pueden complementarse con lo siguiente:

  • identificación de los factores que tienen el mayor impacto en el signo efectivo;
  • identificación de causas de comunicación previamente inexploradas;
  • construir un modelo de correlación con su análisis paramétrico;
  • Estudio de la importancia de los parámetros de comunicación y su evaluación de intervalos.

Relación entre análisis de correlación y análisis de regresión.

Método de análisis de correlación y regresión.
El método de análisis de correlación a menudo no eslimitado a encontrar la cercanía de la relación entre los valores estudiados. A veces se complementa con la compilación de ecuaciones de regresión, que se obtienen mediante el análisis del mismo nombre, y que son una descripción de la correlación entre el (los) signo (s) factorial (factorial) resultante. Este método, junto con el análisis en cuestión, constituye el método de análisis de correlación y regresión.

Términos del método

Los factores productivos dependen de uno aVarios factores. El método de análisis de correlación se puede aplicar si hay un gran número de observaciones sobre el valor de los indicadores (factores) efectivos y factoriales, mientras que los factores estudiados deben ser cuantitativos y reflejados en fuentes específicas. El primero puede determinarse mediante una ley normal: en este caso, el resultado del análisis de correlación son los coeficientes de correlación de Pearson o, si los signos no obedecen esta ley, se utiliza el coeficiente de correlación de rango de Spearman.

El análisis de correlación es

Reglas para seleccionar factores para el análisis de correlación

Al aplicar este método, es necesarioDeterminar los factores que influyen en los indicadores de desempeño. Se seleccionan teniendo en cuenta que las relaciones causales deben estar presentes entre los indicadores. En el caso de crear un modelo de correlación multivariante, se seleccionan aquellos que tienen un impacto significativo en el indicador resultante, mientras que es preferible no incluir factores interdependientes con un coeficiente de correlación de par de más de 0.85 en el modelo de correlación, así como aquellos en los que la relación con el parámetro resultante no es lineal o funcional en la naturaleza.

Mostrar resultados

Los resultados del análisis de correlación se pueden presentar en texto y formas gráficas. En el primer caso, se presentan como un coeficiente de correlación, en el segundo, en forma de diagrama de dispersión.

Resultados del análisis de correlación

En ausencia de correlación entre los parámetros puntualesestán dispuestos aleatoriamente en el diagrama, el grado promedio de conexión se caracteriza por un mayor grado de ordenamiento y se caracteriza por una lejanía más o menos uniforme de las marcas aplicadas desde la mediana. Una conexión fuerte tiende a una línea recta y para r = 1 el gráfico de puntos representa una línea recta. La correlación inversa es diferente en la dirección del gráfico desde la esquina superior izquierda a la esquina inferior derecha, la línea recta, desde la esquina inferior izquierda a la esquina superior derecha.

Representación tridimensional del gráfico de dispersión.

Además de la representación tradicional en 2D del diagrama de dispersión, actualmente se utiliza la visualización en 3D de la representación gráfica del análisis de correlación.

Factores de análisis de correlación

También se usa una matriz de matriz de dispersión,que muestra todos los gráficos emparejados en una imagen en formato matricial. Para n variables, la matriz contiene n filas yn columnas. El diagrama ubicado en la intersección de la fila i-ésima y la columna j-ésima es un gráfico de las variables Xi en comparación con Xj. Por lo tanto, cada fila y columna son una dimensión, una celda separada muestra un gráfico de dispersión de dos dimensiones.

Solución de análisis de correlación

Grado de estanqueidad de la comunicación.

La rigidez de la correlación está determinada porcoeficiente de correlación (r): fuerte - r = ± 0.7 a ± 1, medio - r = ± 0.3 a ± 0.699, débil - r = 0 a ± 0.299. Esta clasificación no es estricta. La figura muestra un esquema ligeramente diferente.

Método de análisis de correlación

Un ejemplo de aplicación del método de análisis de correlación.

Se ha realizado un interesante estudio en el Reino Unido. Está dedicado a la relación del tabaquismo con el cáncer de pulmón y se realizó mediante análisis de correlación. Esta observación se presenta a continuación.

Fuente de datos para el análisis de correlación

Grupo profesional

fumar

mortalidad

Agricultores, silvicultores y pescadores.

77

84

Mineros y canteras

137

116

Fabricantes de gas, coque y productos químicos.

117

123

Fabricantes de vidrio y cerámica.

94

128

Trabajadores en hornos, forjas, fundiciones y laminadores.

116

155

Trabajadores de electricidad y electrónica

102

101

Ingeniería y profesiones afines

111

118

Industria de la madera

93

113

Curtidores

88

104

Trabajadores textiles

102

88

Fabricantes de ropa de trabajo

91

104

Trabajadores de alimentos, bebidas y tabaco.

104

129

Fabricantes de papel e imprenta

107

86

Fabricantes de otros productos

112

96

Constructores

113

144

Artistas y decoradores

110

139

Conductores de motores estacionarios, grúas, etc.

125

113

Trabajadores no clasificados en otra parte

133

146

Trabajadores de transporte y comunicaciones.

115

128

Trabajadores de almacén, almacenistas, empacadores y trabajadores de máquinas de llenado.

105

115

Trabajadores administrativos

87

79

Vendedores

91

85

Trabajadores de deportes y recreación

100

120

Administradores y Gerentes

76

60

Profesionales, técnicos y artistas.

66

51

Comenzamos el análisis de correlación. Es mejor comenzar la solución para la claridad con el método gráfico, para el cual construimos un diagrama de dispersión (dispersión).

Ejemplo de análisis de correlación

Ella demuestra una conexión directa.Sin embargo, basándose solo en el método gráfico, es difícil llegar a una conclusión inequívoca. Por lo tanto, continuamos realizando análisis de correlación. A continuación se presenta un ejemplo de cálculo del coeficiente de correlación.

С помощью программных средств (на примере MS Excel se describirá más adelante) determinamos el coeficiente de correlación, que es 0.716, lo que significa una fuerte relación entre los parámetros estudiados. Determinamos la confiabilidad estadística del valor obtenido de acuerdo con la tabla correspondiente, para la cual necesitamos restar 2 de 25 pares de valores, como resultado de lo cual obtenemos 23 y de esta fila en la tabla encontramos r crítico para p = 0.01 (ya que estos son datos médicos, el la dependencia, en otros casos, p = 0.05) es suficiente, que es 0.51 para este análisis de correlación. Un ejemplo ha demostrado que la r calculada es mayor que la r crítica, el valor del coeficiente de correlación se considera estadísticamente significativo.

Uso de software para análisis de correlación.

Описываемый вид статистической обработки данных puede llevarse a cabo utilizando software, en particular, MS Excel. El análisis de correlación de Excel implica calcular los siguientes parámetros utilizando funciones:

1. El coeficiente de correlación se determina utilizando la función CORREL (matriz1; matriz2). Matriz 1.2: celda del intervalo de valores de variables productivas y factoriales.

El coeficiente de correlación lineal también se denomina coeficiente de correlación de Pearson y, por lo tanto, a partir de Excel 2007, puede usar la función PEARSON con las mismas matrices.

Se realiza una visualización gráfica del análisis de correlación en Excel utilizando el panel Gráficos con la opción de Gráfico de dispersión.

Después de especificar los datos de origen, obtenemos un gráfico.

2. Evaluación de la importancia del coeficiente de correlación de pares usando la prueba t-student. El valor calculado de la prueba t se compara con el valor tabular (crítico)este indicador de la tabla de valores correspondiente del parámetro en cuestión, teniendo en cuenta un determinado nivel de significación y el número de grados de libertad. Esta evaluación se lleva a cabo utilizando la función STUDUSTER (probabilidad; grados de libertad).

3. La matriz de coeficientes de correlación de pares.El análisis se realiza utilizando la herramienta "Análisis de datos", en la que se selecciona "Correlación". Se realiza una evaluación estadística de los coeficientes de correlación de pares comparando su valor absoluto con un valor tabular (crítico). Si el coeficiente calculado de correlación de par excede el crítico, podemos decir, teniendo en cuenta el grado de probabilidad dado, que la hipótesis nula sobre la importancia de la comunicación lineal no se rechaza.

En conclusión

Использование в научных исследованиях метода El análisis de correlación le permite determinar la relación entre varios factores e indicadores efectivos. Debe tenerse en cuenta que también se puede obtener un coeficiente de correlación alto a partir de un par o conjunto de datos absurdos y, por lo tanto, este tipo de análisis debe llevarse a cabo en una matriz de datos suficientemente grande.

Después de recibir el valor calculado de r itEs deseable comparar con r crítico para confirmar la confiabilidad estadística de cierto valor. El análisis de correlación puede llevarse a cabo manualmente usando fórmulas o herramientas de software, en particular MS Excel. Aquí también puede construir un diagrama de dispersión (dispersión) con el fin de visualizar la relación entre los factores estudiados del análisis de correlación y el atributo resultante.

Me gustó:
0
Publicaciones populares
Desarrollo Espiritual
Comida
yup