/ / Metode for korrelasjonsanalyse: eksempel. Korrelasjonsanalyse er ...

Korrelasjonsanalysemetode: et eksempel. Korrelasjonsanalyse er ...

I vitenskapelig forskning oppstår oftebehovet for å finne en sammenheng mellom produktive og faktorvariabler (avling og nedbør, høyden og vekten til en person i homogene grupper etter kjønn og alder, pulsfrekvens og kroppstemperatur, etc.).

Det andre er tegn som bidrar til endring av de som er tilknyttet dem (den første).

Begrepet korrelasjonsanalyse

Существует множество определений термина.Basert på det foregående kan vi si at korrelasjonsanalyse er en metode som brukes til å teste hypotesen om den statistiske betydningen av to eller flere variabler, hvis forskeren kan måle dem, men ikke endre dem.

Det er andre definisjoner som vurderes.konsepter. Korrelasjonsanalyse er en metode for å behandle statistiske data, som består i å studere korrelasjonskoeffisientene mellom variabler. I dette tilfellet sammenlignes korrelasjonskoeffisientene mellom ett par eller en rekke par par funksjoner for å etablere statistiske forhold mellom dem. Korrelasjonsanalyse er en metode for å studere det statistiske forholdet mellom tilfeldige variabler med valgfri tilstedeværelse av en streng funksjonell karakter, der dynamikken til en tilfeldig variabel fører til dynamikken i den matematiske forventningen til en annen.

Begrepet falsk korrelasjon

Når du utfører en korrelasjonsanalyse, er det nødvendigta i betraktning at det kan utføres i forhold til ethvert sett med tegn, ofte absurd i forhold til hverandre. Noen ganger har de ingen årsakssammenheng med hverandre.

I dette tilfellet snakker de om en falsk sammenheng.

Oppgaver med korrelasjonsanalyse

Basert på definisjonene ovenfor, kan vi gjøre detformulere følgende oppgaver med den beskrevne metoden: få informasjon om en av de ønskede variablene ved å bruke den andre; bestemme tettheten i forholdet mellom de studerte variablene.

Korrelasjonsanalyse innebærer å bestemme forholdet mellom de studerte egenskapene, i forbindelse med at oppgavene til korrelasjonsanalyse kan suppleres med følgende:

  • identifisering av faktorer som har størst innvirkning på det effektive tegnet;
  • identifisering av tidligere uutforskede årsaker til kommunikasjon;
  • bygge en korrelasjonsmodell med sin parametriske analyse;
  • studere betydningen av kommunikasjonsparametere og deres intervallvurdering.

Forholdet mellom korrelasjonsanalyse og regresjonsanalyse

Metode for korrelasjon og regresjonsanalyse
Korrelasjonsanalysemetoden er ofte ikkebegrenset til å finne nærheten i forholdet mellom de studerte verdiene. Noen ganger blir det supplert med sammenstillingen av regresjonsligninger, som oppnås ved bruk av analysen med samme navn, og som er en beskrivelse av sammenhengen mellom det resulterende og faktorielle (faktorielle) tegnet. Denne metoden utgjør sammen med den aktuelle analysen metoden for korrelasjons- og regresjonsanalyse.

Metodevilkår

Результативные факторы зависят от одного до flere faktorer. Metoden for korrelasjonsanalyse kan brukes hvis det er et stort antall observasjoner om verdien av effektive og faktorindikatorer (faktorer), mens de studerte faktorene skal være kvantitative og reflekteres i spesifikke kilder. Den første kan bestemmes av en normal lov - i dette tilfellet er resultatet av korrelasjonsanalysen Pearson-korrelasjonskoeffisientene, eller, hvis tegnene ikke overholder denne loven, brukes Spearman rangskorrelasjonskoeffisienten.

Korrelasjonsanalyse er

Regler for valg av faktorer for korrelasjonsanalyse

Når du bruker denne metoden, er det nødvendigbestemme faktorene som påvirker resultatindikatorene. De velges under hensyntagen til at årsakssammenhenger må være til stede mellom indikatorene. Når det gjelder å lage en multivariat korrelasjonsmodell, velges de som har en betydelig innvirkning på den resulterende indikatoren, mens det er å foretrekke ikke å inkludere interafhængige faktorer med en par korrelasjonskoeffisient på mer enn 0,85 i korrelasjonsmodellen, så vel som de der forholdet til den resulterende parameteren er ikke-lineær eller funksjonell karakter.

Vis resultater

Resultatene fra korrelasjonsanalyse kan presenteres i tekst og grafiske former. I det første tilfellet blir de presentert som en korrelasjonskoeffisient, i det andre - i form av et spredningsdiagram.

Korrelasjonsanalyseresultater

При отсутствии корреляции между параметрами точки er tilfeldig anordnet på diagrammet, er den gjennomsnittlige forbindelsesgraden preget av en større grad av rekkefølge og er preget av en mer eller mindre ensartet avstand fra anvendte merker fra median. En sterk forbindelse har en tendens til en rett linje og for r = 1 representerer den stiplede grafen en rett linje. Den omvendte korrelasjonen er forskjellig i retning av grafen fra øvre venstre til nedre høyre, den rette linjen - fra nedre venstre til øvre høyre hjørne.

Tredimensjonal representasjon av spredningskartet

I tillegg til den tradisjonelle 2D-representasjonen av spredningsdiagrammet, brukes for øyeblikket 3D-visning av den grafiske representasjonen av korrelasjonsanalyse.

Korrelasjonsanalysefaktorer

Также используется матрица диаграммы рассеивания, som viser alle sammenkoblede grafer i ett bilde i matriksformat. For n variabler inneholder matrisen n rader og n kolonner. Diagrammet som ligger i skjæringspunktet mellom den i-th rad og den j-th kolonnen er en graf over variablene Xi sammenlignet med Xj. Dermed er hver rad og kolonne en dimensjon, en egen celle viser et spredningskart over to dimensjoner.

Korrelasjonsanalyseløsning

Vurdering av kommunikasjonstetthet

Korrelasjonens tetthet bestemmes avkorrelasjonskoeffisient (r): sterk - r = ± 0,7 til ± 1, medium - r = ± 0,3 til ± 0,699, svak - r = 0 til ± 0,299. Denne klassifiseringen er ikke streng. Figuren viser et litt annet opplegg.

Korrelasjonsanalysemetode

Et eksempel på anvendelse av metoden for korrelasjonsanalyse

Det er utført en interessant studie i Storbritannia. Det er viet forholdet mellom røyking og lungekreft, og ble utført ved korrelasjonsanalyse. Denne observasjonen er presentert nedenfor.

Kildedata for korrelasjonsanalyse

Profesjonell gruppe

røyke

dødelighet

Bønder, skogbrukere og fiskere

77

84

Gruvearbeidere og steinleggere

137

116

Produsenter av gass, koks og kjemikalier

117

123

Glass- og keramikkprodusenter

94

128

Arbeidere i ovner, smier, støperier og valser

116

155

Elektriske og elektroniske arbeidere

102

101

Ingeniørfag og beslektede yrker

111

118

Trebearbeiding industri

93

113

tanners

88

104

Tekstilarbeidere

102

88

Produsenter av arbeidstøy

91

104

Mat-, drikke- og tobakksarbeidere

104

129

Produsenter av papir og trykking

107

86

Produsenter av andre produkter

112

96

utbyggere

113

144

Kunstnere og dekoratører

110

139

Drivere av stasjonære motorer, kraner, etc.

125

113

Arbeidere som ikke er klassifisert andre steder

133

146

Transport- og kommunikasjonsarbeidere

115

128

Lagerarbeidere, lagere, pakker og fyllmaskinarbeidere

105

115

Geistlige arbeidere

87

79

selgere

91

85

Idretts- og fritidsarbeidere

100

120

Administratorer og ledere

76

60

Fagfolk, teknikere og kunstnere

66

51

Vi begynner korrelasjonsanalysen. Det er bedre å starte løsningen for klarhet med den grafiske metoden, som vi konstruerer et spredningsdiagram for.

Eksempel på korrelasjonsanalyse

Hun demonstrerer en direkte forbindelse.På bakgrunn av bare den grafiske metoden er det imidlertid vanskelig å komme med en entydig konklusjon. Derfor fortsetter vi å utføre korrelasjonsanalyse. Et eksempel på beregning av korrelasjonskoeffisienten er presentert nedenfor.

Bruke programvareverktøy (bruker MS som eksempel)Excel vil bli beskrevet senere) vi bestemmer korrelasjonskoeffisienten, som er 0,716, som betyr en sterk sammenheng mellom de undersøkte parametrene. Vi bestemmer den statistiske påliteligheten til den oppnådde verdien fra den tilsvarende tabellen, som vi trenger å trekke fra 2 fra 25 par verdier, som et resultat av at vi får 23 og på denne raden i tabellen finner vi r kritisk for p = 0.01 (siden dette er medisinske data, bruker vi strengere avhengighet, i andre tilfeller er p = 0,05) nok, noe som er 0,51 for denne korrelasjonsanalysen. Et eksempel har vist at den beregnede r er større enn den kritiske r, vurderes verdien av korrelasjonskoeffisienten som statistisk signifikant.

Bruke programvare for korrelasjonsanalyse

Den beskrevne typen statistisk databehandlingkan utføres ved hjelp av programvare, spesielt MS Excel. Excel-korrelasjonsanalyse innebærer å beregne følgende parametere ved hjelp av funksjoner:

1. Korrelasjonskoeffisienten bestemmes ved hjelp av CORREL-funksjonen (array1; array2). Array1,2 - celle med verdiområdet til de resulterende og faktorielle variablene.

Den lineære korrelasjonskoeffisienten kalles også Pearson-korrelasjonskoeffisienten, og fra Excel 2007 kan du derfor bruke PEARSON-funksjonen med de samme matriser.

En grafisk visning av korrelasjonsanalyse i Excel blir utført ved hjelp av diagrammerpanelet med valg av Scatter Chart.

Etter å ha spesifisert de opprinnelige dataene, får vi en graf.

2. Vurdering av betydningen av parets korrelasjonskoeffisient ved bruk av Studentens t-test. Beregnet t-testverdi sammenlignet med tabellverdien (kritisk)av denne indikatoren fra den tilsvarende verditabellen til den aktuelle parameteren, med tanke på gitt nivå av betydning og antall frihetsgrader. Dette estimatet utføres ved hjelp av funksjonen TDRESTR (sannsynlighet; frihetsgrader).

3. Matrise av parkorrelasjonskoeffisienter.Analysen utføres ved hjelp av dataanalyseverktøyet der korrelasjon er valgt. Den statistiske vurderingen av parets korrelasjonskoeffisienter utføres ved å sammenligne den absolutte verdien med den tabellverdien (kritiske) verdien. Hvis den beregnede parkorrelasjonskoeffisienten overskrides over den kritiske, kan vi si, med tanke på en gitt grad av sannsynlighet, at nullhypotesen om betydningen av det lineære forholdet ikke avvises.

Som konklusjon

Bruk i vitenskapelig forskning av metodenkorrelasjonsanalyse lar deg bestemme forholdet mellom ulike faktorer og ytelsesindikatorer. Det bør tas i betraktning at en høy korrelasjonskoeffisient også kan oppnås fra et absurd par eller datasett, i forbindelse som denne typen analyser må utføres på et tilstrekkelig stort datasett.

Etter å ha oppnådd den beregnede verdien av r, er detdet er ønskelig å sammenligne med r kritisk for å bekrefte den statistiske signifikansen til en viss verdi. Korrelasjonsanalyse kan utføres manuelt ved hjelp av formler, eller ved hjelp av programvareverktøy, spesielt MS Excel. Her kan du lage et spredningsdiagram for å visualisere forholdet mellom de studerte faktorene i korrelasjonsanalysen og den effektive indikatoren.

likte:
0
Populære innlegg
Åndelig utvikling
mat
y