I vitenskapelig forskning oppstår oftebehovet for å finne en sammenheng mellom produktive og faktorvariabler (avling og nedbør, høyden og vekten til en person i homogene grupper etter kjønn og alder, pulsfrekvens og kroppstemperatur, etc.).
Det andre er tegn som bidrar til endring av de som er tilknyttet dem (den første).
Существует множество определений термина.Basert på det foregående kan vi si at korrelasjonsanalyse er en metode som brukes til å teste hypotesen om den statistiske betydningen av to eller flere variabler, hvis forskeren kan måle dem, men ikke endre dem.
Det er andre definisjoner som vurderes.konsepter. Korrelasjonsanalyse er en metode for å behandle statistiske data, som består i å studere korrelasjonskoeffisientene mellom variabler. I dette tilfellet sammenlignes korrelasjonskoeffisientene mellom ett par eller en rekke par par funksjoner for å etablere statistiske forhold mellom dem. Korrelasjonsanalyse er en metode for å studere det statistiske forholdet mellom tilfeldige variabler med valgfri tilstedeværelse av en streng funksjonell karakter, der dynamikken til en tilfeldig variabel fører til dynamikken i den matematiske forventningen til en annen.
Når du utfører en korrelasjonsanalyse, er det nødvendigta i betraktning at det kan utføres i forhold til ethvert sett med tegn, ofte absurd i forhold til hverandre. Noen ganger har de ingen årsakssammenheng med hverandre.
I dette tilfellet snakker de om en falsk sammenheng.
Basert på definisjonene ovenfor, kan vi gjøre detformulere følgende oppgaver med den beskrevne metoden: få informasjon om en av de ønskede variablene ved å bruke den andre; bestemme tettheten i forholdet mellom de studerte variablene.
Korrelasjonsanalyse innebærer å bestemme forholdet mellom de studerte egenskapene, i forbindelse med at oppgavene til korrelasjonsanalyse kan suppleres med følgende:
Результативные факторы зависят от одного до flere faktorer. Metoden for korrelasjonsanalyse kan brukes hvis det er et stort antall observasjoner om verdien av effektive og faktorindikatorer (faktorer), mens de studerte faktorene skal være kvantitative og reflekteres i spesifikke kilder. Den første kan bestemmes av en normal lov - i dette tilfellet er resultatet av korrelasjonsanalysen Pearson-korrelasjonskoeffisientene, eller, hvis tegnene ikke overholder denne loven, brukes Spearman rangskorrelasjonskoeffisienten.
Når du bruker denne metoden, er det nødvendigbestemme faktorene som påvirker resultatindikatorene. De velges under hensyntagen til at årsakssammenhenger må være til stede mellom indikatorene. Når det gjelder å lage en multivariat korrelasjonsmodell, velges de som har en betydelig innvirkning på den resulterende indikatoren, mens det er å foretrekke ikke å inkludere interafhængige faktorer med en par korrelasjonskoeffisient på mer enn 0,85 i korrelasjonsmodellen, så vel som de der forholdet til den resulterende parameteren er ikke-lineær eller funksjonell karakter.
Resultatene fra korrelasjonsanalyse kan presenteres i tekst og grafiske former. I det første tilfellet blir de presentert som en korrelasjonskoeffisient, i det andre - i form av et spredningsdiagram.
При отсутствии корреляции между параметрами точки er tilfeldig anordnet på diagrammet, er den gjennomsnittlige forbindelsesgraden preget av en større grad av rekkefølge og er preget av en mer eller mindre ensartet avstand fra anvendte merker fra median. En sterk forbindelse har en tendens til en rett linje og for r = 1 representerer den stiplede grafen en rett linje. Den omvendte korrelasjonen er forskjellig i retning av grafen fra øvre venstre til nedre høyre, den rette linjen - fra nedre venstre til øvre høyre hjørne.
I tillegg til den tradisjonelle 2D-representasjonen av spredningsdiagrammet, brukes for øyeblikket 3D-visning av den grafiske representasjonen av korrelasjonsanalyse.
Также используется матрица диаграммы рассеивания, som viser alle sammenkoblede grafer i ett bilde i matriksformat. For n variabler inneholder matrisen n rader og n kolonner. Diagrammet som ligger i skjæringspunktet mellom den i-th rad og den j-th kolonnen er en graf over variablene Xi sammenlignet med Xj. Dermed er hver rad og kolonne en dimensjon, en egen celle viser et spredningskart over to dimensjoner.
Korrelasjonens tetthet bestemmes avkorrelasjonskoeffisient (r): sterk - r = ± 0,7 til ± 1, medium - r = ± 0,3 til ± 0,699, svak - r = 0 til ± 0,299. Denne klassifiseringen er ikke streng. Figuren viser et litt annet opplegg.
Det er utført en interessant studie i Storbritannia. Det er viet forholdet mellom røyking og lungekreft, og ble utført ved korrelasjonsanalyse. Denne observasjonen er presentert nedenfor.
Profesjonell gruppe | røyke | dødelighet |
Bønder, skogbrukere og fiskere | 77 | 84 |
Gruvearbeidere og steinleggere | 137 | 116 |
Produsenter av gass, koks og kjemikalier | 117 | 123 |
Glass- og keramikkprodusenter | 94 | 128 |
Arbeidere i ovner, smier, støperier og valser | 116 | 155 |
Elektriske og elektroniske arbeidere | 102 | 101 |
Ingeniørfag og beslektede yrker | 111 | 118 |
Trebearbeiding industri | 93 | 113 |
tanners | 88 | 104 |
Tekstilarbeidere | 102 | 88 |
Produsenter av arbeidstøy | 91 | 104 |
Mat-, drikke- og tobakksarbeidere | 104 | 129 |
Produsenter av papir og trykking | 107 | 86 |
Produsenter av andre produkter | 112 | 96 |
utbyggere | 113 | 144 |
Kunstnere og dekoratører | 110 | 139 |
Drivere av stasjonære motorer, kraner, etc. | 125 | 113 |
Arbeidere som ikke er klassifisert andre steder | 133 | 146 |
Transport- og kommunikasjonsarbeidere | 115 | 128 |
Lagerarbeidere, lagere, pakker og fyllmaskinarbeidere | 105 | 115 |
Geistlige arbeidere | 87 | 79 |
selgere | 91 | 85 |
Idretts- og fritidsarbeidere | 100 | 120 |
Administratorer og ledere | 76 | 60 |
Fagfolk, teknikere og kunstnere | 66 | 51 |
Vi begynner korrelasjonsanalysen. Det er bedre å starte løsningen for klarhet med den grafiske metoden, som vi konstruerer et spredningsdiagram for.
Hun demonstrerer en direkte forbindelse.På bakgrunn av bare den grafiske metoden er det imidlertid vanskelig å komme med en entydig konklusjon. Derfor fortsetter vi å utføre korrelasjonsanalyse. Et eksempel på beregning av korrelasjonskoeffisienten er presentert nedenfor.
Bruke programvareverktøy (bruker MS som eksempel)Excel vil bli beskrevet senere) vi bestemmer korrelasjonskoeffisienten, som er 0,716, som betyr en sterk sammenheng mellom de undersøkte parametrene. Vi bestemmer den statistiske påliteligheten til den oppnådde verdien fra den tilsvarende tabellen, som vi trenger å trekke fra 2 fra 25 par verdier, som et resultat av at vi får 23 og på denne raden i tabellen finner vi r kritisk for p = 0.01 (siden dette er medisinske data, bruker vi strengere avhengighet, i andre tilfeller er p = 0,05) nok, noe som er 0,51 for denne korrelasjonsanalysen. Et eksempel har vist at den beregnede r er større enn den kritiske r, vurderes verdien av korrelasjonskoeffisienten som statistisk signifikant.
Den beskrevne typen statistisk databehandlingkan utføres ved hjelp av programvare, spesielt MS Excel. Excel-korrelasjonsanalyse innebærer å beregne følgende parametere ved hjelp av funksjoner:
1. Korrelasjonskoeffisienten bestemmes ved hjelp av CORREL-funksjonen (array1; array2). Array1,2 - celle med verdiområdet til de resulterende og faktorielle variablene.
Den lineære korrelasjonskoeffisienten kalles også Pearson-korrelasjonskoeffisienten, og fra Excel 2007 kan du derfor bruke PEARSON-funksjonen med de samme matriser.
En grafisk visning av korrelasjonsanalyse i Excel blir utført ved hjelp av diagrammerpanelet med valg av Scatter Chart.
Etter å ha spesifisert de opprinnelige dataene, får vi en graf.
2. Vurdering av betydningen av parets korrelasjonskoeffisient ved bruk av Studentens t-test. Beregnet t-testverdi sammenlignet med tabellverdien (kritisk)av denne indikatoren fra den tilsvarende verditabellen til den aktuelle parameteren, med tanke på gitt nivå av betydning og antall frihetsgrader. Dette estimatet utføres ved hjelp av funksjonen TDRESTR (sannsynlighet; frihetsgrader).
3. Matrise av parkorrelasjonskoeffisienter.Analysen utføres ved hjelp av dataanalyseverktøyet der korrelasjon er valgt. Den statistiske vurderingen av parets korrelasjonskoeffisienter utføres ved å sammenligne den absolutte verdien med den tabellverdien (kritiske) verdien. Hvis den beregnede parkorrelasjonskoeffisienten overskrides over den kritiske, kan vi si, med tanke på en gitt grad av sannsynlighet, at nullhypotesen om betydningen av det lineære forholdet ikke avvises.
Bruk i vitenskapelig forskning av metodenkorrelasjonsanalyse lar deg bestemme forholdet mellom ulike faktorer og ytelsesindikatorer. Det bør tas i betraktning at en høy korrelasjonskoeffisient også kan oppnås fra et absurd par eller datasett, i forbindelse som denne typen analyser må utføres på et tilstrekkelig stort datasett.
Etter å ha oppnådd den beregnede verdien av r, er detdet er ønskelig å sammenligne med r kritisk for å bekrefte den statistiske signifikansen til en viss verdi. Korrelasjonsanalyse kan utføres manuelt ved hjelp av formler, eller ved hjelp av programvareverktøy, spesielt MS Excel. Her kan du lage et spredningsdiagram for å visualisere forholdet mellom de studerte faktorene i korrelasjonsanalysen og den effektive indikatoren.