У научним истраживањима често постојипотреба за проналажењем везе између производних и фактор фактора (принос усева и количина падавина, висина и тежина особе у хомогеним групама према полу и старости, срчаном ритму и телесној температури итд.)
Други су знаци који доприносе промени оних који су с њима повезани (први).
Постоје многе дефиниције појма.На основу претходног, можемо рећи да је корелациона анализа метода која се користи за тестирање хипотезе о статистичкој значајности две или више променљивих ако их истраживач може измерити, али не и променити.
Постоје и друге дефиниције разматранихконцепти. Корелациона анализа је статистичка техника обраде података која испитује коефицијенте корелације између променљивих. У овом случају, коефицијенти корелације се упоређују између једног пара или мноштва парова обележја како би се успоставили статистички односи између њих. Корелациона анализа је метода за проучавање статистичке зависности између случајних променљивих са необавезним присуством строге функционалне природе, у којој динамика једне случајне променљиве доводи до динамике математичког очекивања друге.
При спровођењу корелационе анализе неопходно јеузети у обзир да се то може извести у односу на било који скуп знакова, често апсурдних у односу једни на друге. Понекад немају узрочну везу једни с другима.
У овом случају говоре о лажној корелацији.
На основу горњих дефиниција може седа формулише следеће задатке описане методе: да добије информације о једној од тражених променљивих користећи другу; утврдити блискост односа између проучаваних променљивих.
Корелациона анализа подразумева утврђивање односа између проучаваних карактеристика, у вези са чиме се задаци корелационе анализе могу допунити следећим:
Ефективни фактори варирају од једног до другогнеколико фактора. Метода корелационе анализе може се користити ако постоји велики број запажања о вредности ефективних и факторских показатеља (фактора), док би фактори који се проучавају требало да буду квантитативни и да се одражавају у одређеним изворима. Прво се може одредити нормалним законом - у овом случају, Пеарсонови коефицијенти корелације су резултат корелационе анализе, или, ако карактеристике не поштују овај закон, користи се Спеарманов коефицијент корелације ранга.
При примени ове методе је неопходноутврдити факторе који утичу на показатеље учинка. Одабрани су узимајући у обзир чињеницу да између индикатора морају постојати узрочно-последичне везе. У случају стварања мултиваријантног модела корелације одабиру се они од њих који имају значајан утицај на резултујући показатељ, док међузависни фактори са коефицијентом корелације пара више од 0,85 не би требало да буду укључени у модел корелације, као и они код којих је однос са ефективним параметром непрактилан. или функционалне природе.
Резултати корелационе анализе могу се представити у текстуалном и графичком облику. У првом случају су представљени као коефицијент корелације, у другом - у облику дијаграма расејања.
Ако не постоји корелација између параметара тачкераспоређени су хаотично на дијаграму, просечан степен повезаности карактерише виши степен уређености и карактерише га мање или више једнолична удаљеност обележених ознака од медијане. Јака веза тежи правој линији и за р = 1 тачка је права линија. Обрнуту корелацију карактерише правац графика од горњег левог ка доњем десном, праве линије - од доњег левог ка горњем десном углу.
Поред традиционалне 2Д табеле распршења, сада се користи 3Д графички приказ корелационе анализе.
Такође се користи распршена матрица,који приказује све упарене графике на једној слици у матричном формату. За н променљивих, матрица садржи н редова и н ступаца. Дијаграм који се налази на пресеку и-тог реда и ј-те колоне је графикон променљивих Кси наспрам Ксј. Дакле, сваки ред и колона су једна димензија, једна ћелија приказује распршени дијаграм две димензије.
Чврстоћа корелације одређује се помоћукоефицијент корелације (р): јак - р = ± 0,7 до ± 1, средњи - р = ± 0,3 до ± 0,699, слаб - р = 0 до ± 0,299. Ова класификација није строга. На слици је приказана мало другачија шема.
У Великој Британији је спроведена занимљива студија. Посвећен је односу пушења и рака плућа, а спроведен је помоћу корелационе анализе. Ово запажање је представљено у наставку.
Професионална група | пушење | морталитет |
Пољопривредници, шумари и рибари | 77 | 84 |
Рудари и радници у каменоломима | 137 | 116 |
Произвођачи гаса, кокса и хемикалија | 117 | 123 |
Произвођачи стакла и керамике | 94 | 128 |
Радници у пећима, ковачницама, ливницама и ваљаоницама | 116 | 155 |
Електрични и електронски радници | 102 | 101 |
Инжењерске и сродне струке | 111 | 118 |
Производња за обраду дрвета | 93 | 113 |
Таннерс | 88 | 104 |
Текстилни радници | 102 | 88 |
Произвођачи радне одеће | 91 | 104 |
Радници у индустрији хране, пића и дувана | 104 | 129 |
Произвођачи папира и штампе | 107 | 86 |
Произвођачи осталих производа | 112 | 96 |
Буилдерс | 113 | 144 |
Уметници и декоратери | 110 | 139 |
Возачи стационарних мотора, дизалица и др. | 125 | 113 |
Радници који нису обухваћени другде | 133 | 146 |
Радници саобраћаја и веза | 115 | 128 |
Радници магацина, магационери, пакери и радници на машинама за пуњење | 105 | 115 |
канцеларијски радници | 87 | 79 |
Продавци | 91 | 85 |
Радници у служби за спорт и рекреацију | 100 | 120 |
Администратори и менаџери | 76 | 60 |
Професионалци, техничари и уметници | 66 | 51 |
Почињемо са анализом корелације. Боље је започети решење за јасноћу графичком методом, за коју ћемо изградити дијаграм распршивања (сцаттер).
Она показује директну везу.Међутим, само на основу графичке методе тешко је извући недвосмислен закључак. Због тога ћемо наставити са анализом корелације. Пример израчунавања коефицијента корелације је приказан у наставку.
Уз помоћ софтвера (на примеру МСЕкцел ће бити описан касније), одређујемо коефицијент корелације који износи 0,716, што значи јаку везу између проучаваних параметара. Одредимо статистичку значајност добијене вредности према одговарајућој табели, за коју треба да одузмемо 2 од 25 парова вредности, као резултат добијамо 23 и за ову линију у табели налазимо р критично за п = 0,01 ( пошто се ради о медицинским подацима, строжија зависност, у осталим случајевима је довољна п=0,05), што је 0,51 за ову корелацију. Пример је показао да је израчунато р веће од критичног р, а вредност коефицијента корелације се сматра статистички значајном.
Описани тип статистичке обраде податакаможе се извршити коришћењем софтвера, посебно МС Екцел-а. Анализа корелације у Екцел-у укључује израчунавање следећих параметара помоћу функција:
1. Коефицијент корелације се одређује помоћу функције ЦОРРЕЛ [ЦОРРЕЛ](низ1; низ2). Низ1,2 је ћелија опсега вредности резултујућих и факторских променљивих.
Коефицијент линеарне корелације се такође назива Пирсонов коефицијент корелације, и стога, почевши од Екцел 2007, можете користити ПЕАРСОН функцију са истим низовима.
Графички приказ корелационе анализе у Екцел-у се врши коришћењем панела „Графикони“ са избором „Распој“.
Након навођења почетних података, добијамо график.
2. Процена значајности коефицијента корелације парова коришћењем Студентовог т-теста. Израчуната вредност т-теста у поређењу са табеларном (критичном) вредношћуовог индикатора из одговарајуће табеле вредности параметра који се разматра, узимајући у обзир дати ниво значаја и број степени слободе. Ова процена се врши коришћењем функције СТУДИВ(вероватноћа; степени_слободе).
3. Матрица коефицијената корелације парова.Анализа се врши помоћу алата „Анализа података“ у коме се бира „Корелација“. Статистичка процена коефицијената корелације пара врши се упоређивањем његове апсолутне вредности са табеларном (критичном) вредношћу. Ако израчунати коефицијент парне корелације прелази тај критични, можемо рећи, узимајући у обзир дати степен вероватноће, да се нулта хипотеза о значају линеарне везе не одбацује.
Употреба у научним истраживањима методеанализа корелације вам омогућава да утврдите однос између различитих фактора и индикатора учинка. Истовремено, треба имати у виду да се висок коефицијент корелације може добити и из апсурдног пара или скупа података, те се стога ова врста анализе мора спровести на довољно великом низу података.
Након пријема израчунате вредности р, њенпожељно је упоређивање са р критичним да би се потврдила статистичка значајност одређене вредности. Корелациона анализа се може спровести ручно коришћењем формула, или коришћењем софтверских алата, посебно МС Екцел-а. Овде можете изградити и дијаграм распршивања (сцаттер) у сврху визуелног приказа односа између проучаваних фактора корелационе анализе и резултујуће карактеристике.