Paulturner-Mitchell.com / dannelse / Metode for korrelasjonsanalyse: eksempel. Korrelasjonsanalyse er ...

Korrelasjonsanalysemetode: et eksempel. Korrelasjonsanalyse er ...

I vitenskapelig forskning oppstår oftebehovet for å finne en sammenheng mellom produktive og faktorvariabler (avling og nedbør, høyden og vekten til en person i homogene grupper etter kjønn og alder, pulsfrekvens og kroppstemperatur, etc.).

Det andre er tegn som bidrar til endring av de som er tilknyttet dem (den første).

Begrepet korrelasjonsanalyse

Существует множество определений термина.Basert på det foregående kan vi si at korrelasjonsanalyse er en metode som brukes til å teste hypotesen om den statistiske betydningen av to eller flere variabler, hvis forskeren kan måle dem, men ikke endre dem.

Det er andre definisjoner som vurderes.konsepter. Korrelasjonsanalyse er en metode for å behandle statistiske data, som består i å studere korrelasjonskoeffisientene mellom variabler. I dette tilfellet sammenlignes korrelasjonskoeffisientene mellom ett par eller en rekke par par funksjoner for å etablere statistiske forhold mellom dem. Korrelasjonsanalyse er en metode for å studere det statistiske forholdet mellom tilfeldige variabler med valgfri tilstedeværelse av en streng funksjonell karakter, der dynamikken til en tilfeldig variabel fører til dynamikken i den matematiske forventningen til en annen.

Begrepet falsk korrelasjon

Når du utfører en korrelasjonsanalyse, er det nødvendigta i betraktning at det kan utføres i forhold til ethvert sett med tegn, ofte absurd i forhold til hverandre. Noen ganger har de ingen årsakssammenheng med hverandre.

I dette tilfellet snakker de om en falsk sammenheng.

Oppgaver med korrelasjonsanalyse

Basert på definisjonene ovenfor, kan vi gjøre detformulere følgende oppgaver med den beskrevne metoden: få informasjon om en av de ønskede variablene ved å bruke den andre; bestemme tettheten i forholdet mellom de studerte variablene.

Korrelasjonsanalyse innebærer å bestemme forholdet mellom de studerte egenskapene, i forbindelse med at oppgavene til korrelasjonsanalyse kan suppleres med følgende:

identifisering av faktorer som har størst innvirkning på det effektive tegnet;
identifisering av tidligere uutforskede årsaker til kommunikasjon;
bygge en korrelasjonsmodell med sin parametriske analyse;
studere betydningen av kommunikasjonsparametere og deres intervallvurdering.

Forholdet mellom korrelasjonsanalyse og regresjonsanalyse

Metode for korrelasjon og regresjonsanalyse

Korrelasjonsanalysemetoden er ofte ikkebegrenset til å finne nærheten i forholdet mellom de studerte verdiene. Noen ganger blir det supplert med sammenstillingen av regresjonsligninger, som oppnås ved bruk av analysen med samme navn, og som er en beskrivelse av sammenhengen mellom det resulterende og faktorielle (faktorielle) tegnet. Denne metoden utgjør sammen med den aktuelle analysen metoden for korrelasjons- og regresjonsanalyse.

Metodevilkår

Результативные факторы зависят от одного до flere faktorer. Metoden for korrelasjonsanalyse kan brukes hvis det er et stort antall observasjoner om verdien av effektive og faktorindikatorer (faktorer), mens de studerte faktorene skal være kvantitative og reflekteres i spesifikke kilder. Den første kan bestemmes av en normal lov - i dette tilfellet er resultatet av korrelasjonsanalysen Pearson-korrelasjonskoeffisientene, eller, hvis tegnene ikke overholder denne loven, brukes Spearman rangskorrelasjonskoeffisienten.

Regler for valg av faktorer for korrelasjonsanalyse

Når du bruker denne metoden, er det nødvendigbestemme faktorene som påvirker resultatindikatorene. De velges under hensyntagen til at årsakssammenhenger må være til stede mellom indikatorene. Når det gjelder å lage en multivariat korrelasjonsmodell, velges de som har en betydelig innvirkning på den resulterende indikatoren, mens det er å foretrekke ikke å inkludere interafhængige faktorer med en par korrelasjonskoeffisient på mer enn 0,85 i korrelasjonsmodellen, så vel som de der forholdet til den resulterende parameteren er ikke-lineær eller funksjonell karakter.

Vis resultater

Resultatene fra korrelasjonsanalyse kan presenteres i tekst og grafiske former. I det første tilfellet blir de presentert som en korrelasjonskoeffisient, i det andre - i form av et spredningsdiagram.

При отсутствии корреляции между параметрами точки er tilfeldig anordnet på diagrammet, er den gjennomsnittlige forbindelsesgraden preget av en større grad av rekkefølge og er preget av en mer eller mindre ensartet avstand fra anvendte merker fra median. En sterk forbindelse har en tendens til en rett linje og for r = 1 representerer den stiplede grafen en rett linje. Den omvendte korrelasjonen er forskjellig i retning av grafen fra øvre venstre til nedre høyre, den rette linjen - fra nedre venstre til øvre høyre hjørne.

Tredimensjonal representasjon av spredningskartet

I tillegg til den tradisjonelle 2D-representasjonen av spredningsdiagrammet, brukes for øyeblikket 3D-visning av den grafiske representasjonen av korrelasjonsanalyse.

Также используется матрица диаграммы рассеивания, som viser alle sammenkoblede grafer i ett bilde i matriksformat. For n variabler inneholder matrisen n rader og n kolonner. Diagrammet som ligger i skjæringspunktet mellom den i-th rad og den j-th kolonnen er en graf over variablene Xi sammenlignet med Xj. Dermed er hver rad og kolonne en dimensjon, en egen celle viser et spredningskart over to dimensjoner.

Vurdering av kommunikasjonstetthet

Korrelasjonens tetthet bestemmes avkorrelasjonskoeffisient (r): sterk - r = ± 0,7 til ± 1, medium - r = ± 0,3 til ± 0,699, svak - r = 0 til ± 0,299. Denne klassifiseringen er ikke streng. Figuren viser et litt annet opplegg.

Et eksempel på anvendelse av metoden for korrelasjonsanalyse

Det er utført en interessant studie i Storbritannia. Det er viet forholdet mellom røyking og lungekreft, og ble utført ved korrelasjonsanalyse. Denne observasjonen er presentert nedenfor.

Kildedata for korrelasjonsanalyse
Profesjonell gruppe	røyke	dødelighet
Bønder, skogbrukere og fiskere	77	84
Gruvearbeidere og steinleggere	137	116
Produsenter av gass, koks og kjemikalier	117	123
Glass- og keramikkprodusenter	94	128
Arbeidere i ovner, smier, støperier og valser	116	155
Elektriske og elektroniske arbeidere	102	101
Ingeniørfag og beslektede yrker	111	118
Trebearbeiding industri	93	113
tanners	88	104
Tekstilarbeidere	102	88
Produsenter av arbeidstøy	91	104
Mat-, drikke- og tobakksarbeidere	104	129
Produsenter av papir og trykking	107	86
Produsenter av andre produkter	112	96
utbyggere	113	144
Kunstnere og dekoratører	110	139
Drivere av stasjonære motorer, kraner, etc.	125	113
Arbeidere som ikke er klassifisert andre steder	133	146
Transport- og kommunikasjonsarbeidere	115	128
Lagerarbeidere, lagere, pakker og fyllmaskinarbeidere	105	115
Geistlige arbeidere	87	79
selgere	91	85
Idretts- og fritidsarbeidere	100	120
Administratorer og ledere	76	60
Fagfolk, teknikere og kunstnere	66	51

Vi begynner korrelasjonsanalysen. Det er bedre å starte løsningen for klarhet med den grafiske metoden, som vi konstruerer et spredningsdiagram for.

Hun demonstrerer en direkte forbindelse.På bakgrunn av bare den grafiske metoden er det imidlertid vanskelig å komme med en entydig konklusjon. Derfor fortsetter vi å utføre korrelasjonsanalyse. Et eksempel på beregning av korrelasjonskoeffisienten er presentert nedenfor.

Bruke programvareverktøy (bruker MS som eksempel)Excel vil bli beskrevet senere) vi bestemmer korrelasjonskoeffisienten, som er 0,716, som betyr en sterk sammenheng mellom de undersøkte parametrene. Vi bestemmer den statistiske påliteligheten til den oppnådde verdien fra den tilsvarende tabellen, som vi trenger å trekke fra 2 fra 25 par verdier, som et resultat av at vi får 23 og på denne raden i tabellen finner vi r kritisk for p = 0.01 (siden dette er medisinske data, bruker vi strengere avhengighet, i andre tilfeller er p = 0,05) nok, noe som er 0,51 for denne korrelasjonsanalysen. Et eksempel har vist at den beregnede r er større enn den kritiske r, vurderes verdien av korrelasjonskoeffisienten som statistisk signifikant.

Bruke programvare for korrelasjonsanalyse

Den beskrevne typen statistisk databehandlingkan utføres ved hjelp av programvare, spesielt MS Excel. Excel-korrelasjonsanalyse innebærer å beregne følgende parametere ved hjelp av funksjoner:

1. Korrelasjonskoeffisienten bestemmes ved hjelp av CORREL-funksjonen (array1; array2). Array1,2 - celle med verdiområdet til de resulterende og faktorielle variablene.

Den lineære korrelasjonskoeffisienten kalles også Pearson-korrelasjonskoeffisienten, og fra Excel 2007 kan du derfor bruke PEARSON-funksjonen med de samme matriser.

En grafisk visning av korrelasjonsanalyse i Excel blir utført ved hjelp av diagrammerpanelet med valg av Scatter Chart.

Etter å ha spesifisert de opprinnelige dataene, får vi en graf.

2. Vurdering av betydningen av parets korrelasjonskoeffisient ved bruk av Studentens t-test. Beregnet t-testverdi sammenlignet med tabellverdien (kritisk)av denne indikatoren fra den tilsvarende verditabellen til den aktuelle parameteren, med tanke på gitt nivå av betydning og antall frihetsgrader. Dette estimatet utføres ved hjelp av funksjonen TDRESTR (sannsynlighet; frihetsgrader).

3. Matrise av parkorrelasjonskoeffisienter.Analysen utføres ved hjelp av dataanalyseverktøyet der korrelasjon er valgt. Den statistiske vurderingen av parets korrelasjonskoeffisienter utføres ved å sammenligne den absolutte verdien med den tabellverdien (kritiske) verdien. Hvis den beregnede parkorrelasjonskoeffisienten overskrides over den kritiske, kan vi si, med tanke på en gitt grad av sannsynlighet, at nullhypotesen om betydningen av det lineære forholdet ikke avvises.

Som konklusjon

Bruk i vitenskapelig forskning av metodenkorrelasjonsanalyse lar deg bestemme forholdet mellom ulike faktorer og ytelsesindikatorer. Det bør tas i betraktning at en høy korrelasjonskoeffisient også kan oppnås fra et absurd par eller datasett, i forbindelse som denne typen analyser må utføres på et tilstrekkelig stort datasett.

Etter å ha oppnådd den beregnede verdien av r, er detdet er ønskelig å sammenligne med r kritisk for å bekrefte den statistiske signifikansen til en viss verdi. Korrelasjonsanalyse kan utføres manuelt ved hjelp av formler, eller ved hjelp av programvareverktøy, spesielt MS Excel. Her kan du lage et spredningsdiagram for å visualisere forholdet mellom de studerte faktorene i korrelasjonsanalysen og den effektive indikatoren.

likte: