Ve vědeckém výzkumu často vznikápotřeba najít souvislost mezi produktivními a faktorovými proměnnými (výnos plodiny a srážky, výška a hmotnost osoby v homogenních skupinách podle pohlaví a věku, tepové frekvence a tělesné teploty atd.).
Druhým jsou znaky, které přispívají ke změně těch, které jsou s nimi spojeny (první).
Existuje mnoho definic tohoto termínu.Na základě výše uvedeného můžeme říci, že korelační analýza je metoda používaná k testování hypotézy statistické významnosti dvou nebo více proměnných, pokud je vědec může měřit, ale nezměnit je.
Есть и другие определения рассматриваемого koncepty. Korelační analýza je metoda zpracování statistických dat, která spočívá ve studiu korelačních koeficientů mezi proměnnými. V tomto případě jsou korelační koeficienty mezi jedním párem nebo množstvím párů funkcí porovnány, aby se mezi nimi vytvořily statistické vztahy. Korelační analýza je metoda pro studium statistického vztahu mezi náhodnými proměnnými s volitelnou přítomností přísné funkční povahy, ve kterém dynamika jedné náhodné proměnné vede k dynamice matematického očekávání jiné.
Při provádění korelační analýzy je to nezbytnévezměte v úvahu, že může být provedeno ve vztahu k jakémukoli souboru znaků, často absurdních ve vztahu k sobě navzájem. Někdy mezi sebou nemají žádný kauzální vztah.
V tomto případě se mluví o falešné korelaci.
Na základě výše uvedených definic můžemeformulovat následující úkoly popsané metody: získat informace o jedné z požadovaných proměnných pomocí druhé; určit těsnost vztahu mezi studovanými proměnnými.
Korelační analýza zahrnuje stanovení vztahu mezi studovanými charakteristikami, v souvislosti s nimiž lze úkoly korelační analýzy doplnit:
Produktivní faktory závisejí na jednomněkolik faktorů. Metodu korelační analýzy lze použít, existuje-li velké množství pozorování o hodnotě účinných a faktorových ukazatelů (faktorů), zatímco studované faktory by měly být kvantitativní a měly by se odrážet ve specifických zdrojích. První lze určit běžným zákonem - v tomto případě je výsledkem korelační analýzy Pearsonovy korelační koeficienty, nebo, pokud znaky tento zákon neuposlechnou, použije se korelační koeficient Spearmanovy hodnosti.
Při použití této metody je nutnéurčit faktory, které ovlivňují výkonnostní ukazatele. Jsou vybíráni s ohledem na to, že mezi indikátory musí být příčinné vztahy. V případě vytvoření vícerozměrného korelačního modelu jsou vybrány ty, které mají významný dopad na výsledný indikátor, zatímco je vhodnější nezahrnout vzájemně závislé faktory s párovým korelačním koeficientem více než 0,85 do korelačního modelu, jakož i ty, ve kterých je vztah s výsledným parametrem nelineární. nebo funkční povahy.
Výsledky korelační analýzy mohou být prezentovány v textové a grafické podobě. V prvním případě jsou prezentovány jako korelační koeficient, ve druhém - ve formě rozptylového diagramu.
Při neexistenci korelace mezi parametry bodujsou na diagramu náhodně uspořádány, průměrný stupeň spojení je charakterizován větším stupněm uspořádání a je charakterizován více či méně rovnoměrnou vzdáleností aplikovaných značek od mediánu. Silné spojení má sklon k přímce a pro r = 1 představuje tečkovaný graf přímku. Inverzní korelace je odlišná ve směru grafu od levého horního k pravému dolnímu, přímá čára - od dolního levého do pravého horního rohu.
Kromě tradičního 2D zobrazení rozptylového diagramu se v současné době používá 3D zobrazení grafické reprezentace korelační analýzy.
Používá se také matice rozptylové matice,který zobrazuje všechny spárované grafy na jednom obrázku v maticovém formátu. Pro proměnné n obsahuje matice n řádků a sloupců n. Diagram umístěný v průsečíku i-tého řádku a j-tého sloupce je grafem proměnných Xi ve srovnání s Xj. Takže každý řádek a sloupec jsou jedna dimenze, samostatná buňka zobrazuje rozptylový graf dvou rozměrů.
Těsnost korelace je určena pomocíkorelační koeficient (r): silný - r = ± 0,7 až ± 1, střední - r = ± 0,3 až ± 0,699, slabý - r = 0 až ± 0,299. Tato klasifikace není přísná. Obrázek ukazuje mírně odlišné schéma.
Ve Velké Británii byla provedena zajímavá studie. Je věnována vztahu kouření s rakovinou plic a byla provedena korelační analýzou. Toto pozorování je uvedeno níže.
Profesionální skupina | kouření | úmrtnost |
Zemědělci, lesníci a rybáři | 77 | 84 |
Horníci a lomové dělníky | 137 | 116 |
Výrobci plynu, koksu a chemikálií | 117 | 123 |
Výrobci skla a keramiky | 94 | 128 |
Pracovníci v pecích, kovárnách, slévárnách a válcovnách | 116 | 155 |
Elektrické a elektronické pracovníky | 102 | 101 |
Inženýrství a související profese | 111 | 118 |
Dřevařský průmysl | 93 | 113 |
Tanners | 88 | 104 |
Textilní dělníci | 102 | 88 |
Výrobci pracovních oděvů | 91 | 104 |
Pracovníci v oblasti potravin, nápojů a tabáku | 104 | 129 |
Výrobci papíru a tisk | 107 | 86 |
Výrobci ostatních produktů | 112 | 96 |
Stavitelé | 113 | 144 |
Umělci a malíři | 110 | 139 |
Ovladače stacionárních motorů, jeřábů atd. | 125 | 113 |
Pracovníci jinde nezařazení | 133 | 146 |
Pracovníci dopravy a spojů | 115 | 128 |
Pracovníci skladu, skladovatelé, balírny a pracovníci plnicích strojů | 105 | 115 |
Administrativní pracovníci | 87 | 79 |
Prodejci | 91 | 85 |
Sportovní a rekreační pracovníci | 100 | 120 |
Správci a správci | 76 | 60 |
Profesionálové, technici a umělci | 66 | 51 |
Začneme korelační analýzu. Pro lepší přehlednost je lepší začít s grafickou metodou, pro kterou vytvoříme rozptylový (rozptylový) diagram.
Ukazuje přímé spojení.Je však obtížné učinit jednoznačný závěr pouze na základě grafické metody. Proto pokračujeme v provádění korelační analýzy. Příklad výpočtu korelačního koeficientu je uveden níže.
Používání softwarových nástrojů (například MSExcel bude popsán později) určíme korelační koeficient, který je 0,716, což znamená silný vztah mezi studovanými parametry. Statistickou spolehlivost získané hodnoty určujeme z příslušné tabulky, pro kterou potřebujeme odečíst 2 od 25 párů hodnot, v důsledku čehož dostaneme 23 a z tohoto řádku v tabulce najdeme r kritické pro p = 0,01 (protože to jsou lékařské údaje, používáme přísnější závislost, v jiných případech, p = 0,05), což je 0,51 pro tuto korelační analýzu. Příklad prokázal, že vypočtené r je větší než r kritické, hodnota korelačního koeficientu je považována za statisticky významnou.
Popisovaný typ statistického zpracování datlze provést pomocí softwaru, zejména MS Excel. Excel korelační analýza zahrnuje výpočet následujících parametrů pomocí funkcí:
1. Korelační koeficient je stanoven pomocí funkce CORREL (matice1; matice2). Pole 1.2 - buňka intervalu hodnot produkčních a faktorových proměnných.
Koeficient lineární korelace se také nazývá Pearsonův korelační koeficient, a proto od Excelu 2007 můžete používat funkci PEARSON se stejnými poli.
Grafické zobrazení korelační analýzy v Excelu se provádí pomocí panelu Grafy s výběrem Scatter Chart.
Po zadání zdrojových dat získáme graf.
2. Posouzení významu koeficientu korelace páru pomocí t-studentského testu. Vypočtená hodnota t-testu porovnává s tabulkovou (kritickou) hodnotoutento ukazatel z odpovídající tabulky hodnot příslušného parametru s přihlédnutím k dané úrovni významnosti a počtu stupňů volnosti. Toto hodnocení se provádí pomocí funkce STUDIO DISPLAY (pravděpodobnost; stupně volnosti).
3. Matice párových korelačních koeficientů.Analýza se provádí pomocí nástroje „Analýza dat“, ve kterém je vybrána možnost „Korelace“. Statistické vyhodnocení korelačních koeficientů páru se provádí porovnáním jeho absolutní hodnoty s tabulkovou (kritickou) hodnotou. Pokud vypočtený koeficient korelace páru přesáhne kritický, můžeme s ohledem na daný stupeň pravděpodobnosti říci, že nulová hypotéza o významnosti lineární komunikace není odmítnuta.
Использование в научных исследованиях метода korelační analýza umožňuje určit vztah mezi různými faktory a účinnými ukazateli. Je třeba mít na paměti, že vysoký korelační koeficient lze také získat z absurdního páru nebo sady dat, a proto musí být tento typ analýzy proveden na dostatečně velkém datovém poli.
Po obdržení vypočtené hodnoty r jeje žádoucí porovnat s r kritickým pro potvrzení statistické spolehlivosti určité hodnoty. Korelační analýzu lze provést ručně pomocí vzorců nebo pomocí softwarových nástrojů, zejména MS Excel. Zde můžete také vytvořit rozptylový (rozptylový) diagram za účelem vizualizace vztahu mezi studovanými faktory korelační analýzy a výsledným atributem.