En la investigación científica a menudo surgeLa necesidad de encontrar una conexión entre las variables productivas y factoriales (rendimiento del cultivo y precipitación, altura y peso de una persona en grupos homogéneos por sexo y edad, frecuencia del pulso y temperatura corporal, etc.).
El segundo son signos que contribuyen al cambio de aquellos asociados con ellos (el primero).
Hay muchas definiciones del término.Con base en lo anterior, podemos decir que el análisis de correlación es un método utilizado para probar la hipótesis de la significación estadística de dos o más variables, si el investigador puede medirlas, pero no cambiarlas.
Есть и другие определения рассматриваемого conceptos El análisis de correlación es un método de procesamiento de datos estadísticos, que consiste en estudiar los coeficientes de correlación entre variables. En este caso, los coeficientes de correlación entre un par o una pluralidad de pares de características se comparan para establecer relaciones estadísticas entre ellos. El análisis de correlación es un método para estudiar la relación estadística entre variables aleatorias con la presencia opcional de una naturaleza funcional estricta, en la que la dinámica de una variable aleatoria conduce a la dinámica de la expectativa matemática de otra.
Al realizar un análisis de correlación, es necesariotenga en cuenta que puede llevarse a cabo en relación con cualquier conjunto de signos, a menudo absurdos en relación entre sí. A veces no tienen una relación causal entre sí.
En este caso, hablan de una falsa correlación.
En base a las definiciones anteriores, podemosformular las siguientes tareas del método descrito: obtener información sobre una de las variables deseadas utilizando la otra; Determinar la estrechez de la relación entre las variables estudiadas.
El análisis de correlación implica determinar la relación entre las características estudiadas, en relación con la cual las tareas de análisis de correlación pueden complementarse con lo siguiente:
Los factores productivos dependen de uno aVarios factores. El método de análisis de correlación se puede aplicar si hay un gran número de observaciones sobre el valor de los indicadores (factores) efectivos y factoriales, mientras que los factores estudiados deben ser cuantitativos y reflejados en fuentes específicas. El primero puede determinarse mediante una ley normal: en este caso, el resultado del análisis de correlación son los coeficientes de correlación de Pearson o, si los signos no obedecen esta ley, se utiliza el coeficiente de correlación de rango de Spearman.
Al aplicar este método, es necesarioDeterminar los factores que influyen en los indicadores de desempeño. Se seleccionan teniendo en cuenta que las relaciones causales deben estar presentes entre los indicadores. En el caso de crear un modelo de correlación multivariante, se seleccionan aquellos que tienen un impacto significativo en el indicador resultante, mientras que es preferible no incluir factores interdependientes con un coeficiente de correlación de par de más de 0.85 en el modelo de correlación, así como aquellos en los que la relación con el parámetro resultante no es lineal o funcional en la naturaleza.
Los resultados del análisis de correlación se pueden presentar en texto y formas gráficas. En el primer caso, se presentan como un coeficiente de correlación, en el segundo, en forma de diagrama de dispersión.
En ausencia de correlación entre los parámetros puntualesestán dispuestos aleatoriamente en el diagrama, el grado promedio de conexión se caracteriza por un mayor grado de ordenamiento y se caracteriza por una lejanía más o menos uniforme de las marcas aplicadas desde la mediana. Una conexión fuerte tiende a una línea recta y para r = 1 el gráfico de puntos representa una línea recta. La correlación inversa es diferente en la dirección del gráfico desde la esquina superior izquierda a la esquina inferior derecha, la línea recta, desde la esquina inferior izquierda a la esquina superior derecha.
Además de la representación tradicional en 2D del diagrama de dispersión, actualmente se utiliza la visualización en 3D de la representación gráfica del análisis de correlación.
También se usa una matriz de matriz de dispersión,que muestra todos los gráficos emparejados en una imagen en formato matricial. Para n variables, la matriz contiene n filas yn columnas. El diagrama ubicado en la intersección de la fila i-ésima y la columna j-ésima es un gráfico de las variables Xi en comparación con Xj. Por lo tanto, cada fila y columna son una dimensión, una celda separada muestra un gráfico de dispersión de dos dimensiones.
La rigidez de la correlación está determinada porcoeficiente de correlación (r): fuerte - r = ± 0.7 a ± 1, medio - r = ± 0.3 a ± 0.699, débil - r = 0 a ± 0.299. Esta clasificación no es estricta. La figura muestra un esquema ligeramente diferente.
Se ha realizado un interesante estudio en el Reino Unido. Está dedicado a la relación del tabaquismo con el cáncer de pulmón y se realizó mediante análisis de correlación. Esta observación se presenta a continuación.
Grupo profesional | fumar | mortalidad |
Agricultores, silvicultores y pescadores. | 77 | 84 |
Mineros y canteras | 137 | 116 |
Fabricantes de gas, coque y productos químicos. | 117 | 123 |
Fabricantes de vidrio y cerámica. | 94 | 128 |
Trabajadores en hornos, forjas, fundiciones y laminadores. | 116 | 155 |
Trabajadores de electricidad y electrónica | 102 | 101 |
Ingeniería y profesiones afines | 111 | 118 |
Industria de la madera | 93 | 113 |
Curtidores | 88 | 104 |
Trabajadores textiles | 102 | 88 |
Fabricantes de ropa de trabajo | 91 | 104 |
Trabajadores de alimentos, bebidas y tabaco. | 104 | 129 |
Fabricantes de papel e imprenta | 107 | 86 |
Fabricantes de otros productos | 112 | 96 |
Constructores | 113 | 144 |
Artistas y decoradores | 110 | 139 |
Conductores de motores estacionarios, grúas, etc. | 125 | 113 |
Trabajadores no clasificados en otra parte | 133 | 146 |
Trabajadores de transporte y comunicaciones. | 115 | 128 |
Trabajadores de almacén, almacenistas, empacadores y trabajadores de máquinas de llenado. | 105 | 115 |
Trabajadores administrativos | 87 | 79 |
Vendedores | 91 | 85 |
Trabajadores de deportes y recreación | 100 | 120 |
Administradores y Gerentes | 76 | 60 |
Profesionales, técnicos y artistas. | 66 | 51 |
Comenzamos el análisis de correlación. Es mejor comenzar la solución para la claridad con el método gráfico, para el cual construimos un diagrama de dispersión (dispersión).
Ella demuestra una conexión directa.Sin embargo, basándose solo en el método gráfico, es difícil llegar a una conclusión inequívoca. Por lo tanto, continuamos realizando análisis de correlación. A continuación se presenta un ejemplo de cálculo del coeficiente de correlación.
С помощью программных средств (на примере MS Excel se describirá más adelante) determinamos el coeficiente de correlación, que es 0.716, lo que significa una fuerte relación entre los parámetros estudiados. Determinamos la confiabilidad estadística del valor obtenido de acuerdo con la tabla correspondiente, para la cual necesitamos restar 2 de 25 pares de valores, como resultado de lo cual obtenemos 23 y de esta fila en la tabla encontramos r crítico para p = 0.01 (ya que estos son datos médicos, el la dependencia, en otros casos, p = 0.05) es suficiente, que es 0.51 para este análisis de correlación. Un ejemplo ha demostrado que la r calculada es mayor que la r crítica, el valor del coeficiente de correlación se considera estadísticamente significativo.
Описываемый вид статистической обработки данных puede llevarse a cabo utilizando software, en particular, MS Excel. El análisis de correlación de Excel implica calcular los siguientes parámetros utilizando funciones:
1. El coeficiente de correlación se determina utilizando la función CORREL (matriz1; matriz2). Matriz 1.2: celda del intervalo de valores de variables productivas y factoriales.
El coeficiente de correlación lineal también se denomina coeficiente de correlación de Pearson y, por lo tanto, a partir de Excel 2007, puede usar la función PEARSON con las mismas matrices.
Se realiza una visualización gráfica del análisis de correlación en Excel utilizando el panel Gráficos con la opción de Gráfico de dispersión.
Después de especificar los datos de origen, obtenemos un gráfico.
2. Evaluación de la importancia del coeficiente de correlación de pares usando la prueba t-student. El valor calculado de la prueba t se compara con el valor tabular (crítico)este indicador de la tabla de valores correspondiente del parámetro en cuestión, teniendo en cuenta un determinado nivel de significación y el número de grados de libertad. Esta evaluación se lleva a cabo utilizando la función STUDUSTER (probabilidad; grados de libertad).
3. La matriz de coeficientes de correlación de pares.El análisis se realiza utilizando la herramienta "Análisis de datos", en la que se selecciona "Correlación". Se realiza una evaluación estadística de los coeficientes de correlación de pares comparando su valor absoluto con un valor tabular (crítico). Si el coeficiente calculado de correlación de par excede el crítico, podemos decir, teniendo en cuenta el grado de probabilidad dado, que la hipótesis nula sobre la importancia de la comunicación lineal no se rechaza.
Использование в научных исследованиях метода El análisis de correlación le permite determinar la relación entre varios factores e indicadores efectivos. Debe tenerse en cuenta que también se puede obtener un coeficiente de correlación alto a partir de un par o conjunto de datos absurdos y, por lo tanto, este tipo de análisis debe llevarse a cabo en una matriz de datos suficientemente grande.
Después de recibir el valor calculado de r itEs deseable comparar con r crítico para confirmar la confiabilidad estadística de cierto valor. El análisis de correlación puede llevarse a cabo manualmente usando fórmulas o herramientas de software, en particular MS Excel. Aquí también puede construir un diagrama de dispersión (dispersión) con el fin de visualizar la relación entre los factores estudiados del análisis de correlación y el atributo resultante.