वैज्ञानिक अनुसंधान में, अक्सर होता हैउत्पादक और कारक चर (फसल की उपज और वर्षा की मात्रा, सेक्स और उम्र, हृदय गति और शरीर के तापमान, आदि द्वारा सजातीय समूहों में एक व्यक्ति की ऊंचाई और वजन) के बीच संबंध खोजने की आवश्यकता है।
दूसरे संकेत हैं जो उनके (पहले) से जुड़े लोगों के परिवर्तन में योगदान करते हैं।
शब्द की कई परिभाषाएँ हैं।पूर्वगामी के आधार पर, हम कह सकते हैं कि सहसंबंध विश्लेषण दो या दो से अधिक चर के सांख्यिकीय महत्व के बारे में परिकल्पना का परीक्षण करने के लिए प्रयोग किया जाता है यदि शोधकर्ता उन्हें माप सकता है, लेकिन उन्हें नहीं बदल सकता है।
विचार की अन्य परिभाषाएँ हैंअवधारणाओं। सहसंबंध विश्लेषण एक सांख्यिकीय डेटा प्रसंस्करण तकनीक है जो चर के बीच सहसंबंध गुणांक की जांच करती है। इस मामले में, सहसंबंध गुणांक की तुलना उनके बीच सांख्यिकीय संबंधों को स्थापित करने के लिए एक जोड़ी या सुविधाओं के जोड़े के सेट के बीच की जाती है। सहसंबंध विश्लेषण एक सख्त कार्यात्मक प्रकृति की वैकल्पिक उपस्थिति के साथ यादृच्छिक चर के बीच सांख्यिकीय निर्भरता का अध्ययन करने के लिए एक विधि है, जिसमें एक यादृच्छिक चर की गतिशीलता दूसरे की गणितीय अपेक्षा की गतिशीलता की ओर जाता है।
सहसंबंध विश्लेषण का संचालन करते समय, यह आवश्यक हैयह ध्यान रखें कि यह किसी भी संकेत के संबंध में किया जा सकता है, अक्सर एक दूसरे के संबंध में बेतुका है। कभी-कभी उनका एक-दूसरे के साथ कोई कारण नहीं होता है।
इस मामले में, वे एक झूठी सहसंबंध की बात करते हैं।
उपरोक्त परिभाषाओं के आधार पर, कोई भी कर सकता हैवर्णित विधि के निम्नलिखित कार्यों को तैयार करने के लिए: दूसरे का उपयोग करके मांग किए गए चर में से एक के बारे में जानकारी प्राप्त करने के लिए; अध्ययन किए गए चर के बीच संबंध की निकटता निर्धारित करें।
सहसंबंध विश्लेषण में अध्ययनित विशेषताओं के बीच संबंध का निर्धारण शामिल है, और इसलिए सहसंबंध विश्लेषण के कार्यों को निम्नलिखित के लिए पूरक किया जा सकता है:
प्रभावी कारक एक से भिन्न होते हैंकई कारण। सहसंबंध विश्लेषण की विधि का उपयोग तब किया जा सकता है जब प्रभावी और कारक संकेतकों (कारकों) के मूल्य पर बड़ी संख्या में अवलोकन होते हैं, जबकि अध्ययन के तहत कारक विशिष्ट स्रोतों में मात्रात्मक और प्रतिबिंबित होने चाहिए। पहले सामान्य कानून द्वारा निर्धारित किया जा सकता है - इस मामले में, पियर्सन के सहसंबंध गुणांक सहसंबंध विश्लेषण का परिणाम है, या, यदि सुविधाएँ इस कानून का पालन नहीं करती हैं, तो स्पीयरमैन के रैंक सहसंबंध गुणांक का उपयोग किया जाता है।
इस विधि को लागू करते समय, यह आवश्यक हैप्रदर्शन संकेतकों को प्रभावित करने वाले कारकों को निर्धारित करें। उन्हें इस तथ्य को ध्यान में रखते हुए चुना जाता है कि संकेतक के बीच कारण संबंध होना चाहिए। बहुभिन्नरूपी सहसंबंध मॉडल बनाने के मामले में, उनमें से उन का चयन किया जाता है जो परिणामस्वरूप संकेतक पर एक महत्वपूर्ण प्रभाव डालते हैं, जबकि 0.85 से अधिक की जोड़ी सहसंबंध गुणांक के साथ अन्योन्याश्रित कारकों को अधिमानतः सहसंबंध मॉडल में शामिल नहीं किया जाना चाहिए, साथ ही साथ जिसमें प्रभावी पैरामीटर के साथ संबंध सीधे नहीं है। या प्रकृति में कार्यात्मक।
सहसंबंध विश्लेषण के परिणाम पाठ और ग्राफिक रूपों में प्रस्तुत किए जा सकते हैं। पहले मामले में, उन्हें सहसंबंध गुणांक के रूप में प्रस्तुत किया जाता है, दूसरे में - एक तितर बितर चित्र के रूप में।
यदि बिंदु मापदंडों के बीच कोई संबंध नहीं हैवे आरेख पर पूरी तरह से स्थित हैं, कनेक्शन की औसत डिग्री को ऑर्डर की एक बड़ी डिग्री की विशेषता है और मध्यिका से चिह्नित चिह्नों की अधिक या कम समान दूरी की विशेषता है। एक मजबूत बॉन्ड एक सीधी रेखा में जाता है और r = 1 के लिए डॉट प्लॉट एक सीधी रेखा है। उलटा सहसंबंध ग्राफ की दिशा में ऊपरी बाएं से निचले दाएं, सीधी रेखा - निचले बाएं से ऊपरी दाएं कोने तक भिन्न होता है।
पारंपरिक 2 डी स्कैटर प्लॉट के अलावा, सहसंबंध विश्लेषण का एक 3 डी चित्रमय प्रतिनिधित्व अब उपयोग किया जाता है।
एक स्कैल्पलॉट मैट्रिक्स का उपयोग भी किया जाता है,जो मैट्रिक्स फॉर्मेट में सभी युग्मित भूखंडों को एक आकृति में प्रदर्शित करता है। N चरों के लिए, मैट्रिक्स में n रो और n कॉलम होते हैं। I-th रो और j-th कॉलम के चौराहे पर स्थित आरेख चर बनाम XJ का एक ग्राफ है। इस प्रकार, प्रत्येक पंक्ति और स्तंभ एक आयाम है, एक एकल कक्ष दो आयामों का एक स्कैल्पल प्रदर्शित करता है।
सहसंबंध की जकड़न से निर्धारित होता हैसहसंबंध गुणांक (आर): मजबूत - आर = ± 0.7 से fficient 1, मध्यम - आर = ± 0.3 से to 0.699, कमजोर - आर = 0 से 99 0.299। यह वर्गीकरण सख्त नहीं है। आंकड़ा थोड़ा अलग योजना दिखाता है।
ब्रिटेन में एक दिलचस्प अध्ययन किया गया है। यह धूम्रपान और फेफड़ों के कैंसर के बीच के संबंध के लिए समर्पित है, और सहसंबंध विश्लेषण के माध्यम से किया गया था। यह अवलोकन नीचे प्रस्तुत किया गया है।
पेशेवर समूह | धूम्रपान | नश्वरता |
किसान, वनवासी और मछुआरे | 77 | 84 |
खदान और खदान मजदूर | 137 | 116 |
गैस, कोक और रसायनों के निर्माता | 117 | 123 |
ग्लास और सिरेमिक निर्माता | 94 | 128 |
भट्टियों, फोर्जिंग, फाउंड्री और रोलिंग मिलों में श्रमिक | 116 | 155 |
इलेक्ट्रिकल और इलेक्ट्रॉनिक्स कार्यकर्ता | 102 | 101 |
इंजीनियरिंग और संबंधित व्यवसायों | 111 | 118 |
लकड़ी का उत्पादन | 93 | 113 |
चर्मकार | 88 | 104 |
कपड़ा मजदूर | 102 | 88 |
काम करने वाले निर्माता | 91 | 104 |
भोजन, पेय और तंबाकू उद्योगों में श्रमिक | 104 | 129 |
कागज और छपाई के निर्माता | 107 | 86 |
अन्य उत्पादों के निर्माता | 112 | 96 |
बिल्डर्स | 113 | 144 |
चित्रकार और सज्जाकार | 110 | 139 |
स्थिर इंजन ड्राइवर, क्रेन, आदि। | 125 | 113 |
श्रमिकों को कहीं और शामिल नहीं किया गया | 133 | 146 |
परिवहन और संचार कार्यकर्ता | 115 | 128 |
वेयरहाउस श्रमिक, स्टोरकीपर, पैकर्स और फिलिंग मशीन श्रमिक | 105 | 115 |
लिपिक श्रमिकों | 87 | 79 |
सेलर्स | 91 | 85 |
खेल और मनोरंजन कार्यकर्ता | 100 | 120 |
प्रशासक और प्रबंधक | 76 | 60 |
पेशेवर, तकनीशियन और कलाकार | 66 | 51 |
चलो सहसंबंध विश्लेषण शुरू करते हैं। स्पष्टता के लिए, ग्राफिकल विधि के साथ समाधान शुरू करना बेहतर है, जिसके लिए हम एक बिखरे हुए आरेख (स्कैटर) का निर्माण करेंगे।
यह एक सीधा संबंध प्रदर्शित करता है।हालांकि, केवल चित्रमय पद्धति के आधार पर एक अस्पष्ट निष्कर्ष निकालना मुश्किल है। इसलिए, हम सहसंबंध विश्लेषण करना जारी रखेंगे। सहसंबंध गुणांक की गणना करने का एक उदाहरण नीचे प्रस्तुत किया गया है।
सॉफ्टवेयर का उपयोग करना (उदाहरण के लिए, एमएसएक्सेल को बाद में वर्णित किया जाएगा), हम सहसंबंध गुणांक का निर्धारण करते हैं, जो 0.716 है, जिसका अर्थ है अध्ययन किए गए मापदंडों के बीच एक मजबूत संबंध। आइए हम संबंधित तालिका के अनुसार प्राप्त मूल्य की सांख्यिकीय विश्वसनीयता निर्धारित करते हैं, जिसके लिए हमें 25 जोड़े मूल्यों में से 2 को घटाना होगा, जिसके परिणामस्वरूप हमें 23 मिलते हैं और तालिका में इस पंक्ति से हम p = 0.01 के लिए महत्वपूर्ण पाते हैं (क्योंकि यह चिकित्सा डेटा है, एक अधिक सख्त) निर्भरता, अन्य मामलों में, पी = 0.05 पर्याप्त है), जो इस सहसंबंध विश्लेषण के लिए 0.51 है। उदाहरण ने प्रदर्शित किया कि गणना की गई आर महत्वपूर्ण आर से अधिक है, सहसंबंध गुणांक का मूल्य सांख्यिकीय रूप से महत्वपूर्ण माना जाता है।
सांख्यिकीय डेटा प्रसंस्करण का वर्णित प्रकारसॉफ्टवेयर, विशेष रूप से, एमएस एक्सेल का उपयोग करके किया जा सकता है। एक्सेल में सहसंबंध विश्लेषण में कार्यों का उपयोग करते हुए निम्नलिखित मापदंडों की गणना करना शामिल है:
1. सहसंबंध गुणांक CORREL फ़ंक्शन (array1; array2) का उपयोग करके निर्धारित किया जाता है। Array1,2 - परिणामी और भाज्य चर के मूल्यों की श्रेणी का सेल।
रैखिक सहसंबंध गुणांक को पियर्सन सहसंबंध गुणांक भी कहा जाता है, इसलिए, Excel 2007 से शुरू करके, आप समान सरणियों के साथ PEARSON फ़ंक्शन का उपयोग कर सकते हैं।
एक्सेल में सहसंबंध विश्लेषण का चित्रमय प्रदर्शन "चार्ट चार्ट" चयन के साथ "चार्ट" पैनल का उपयोग करके किया जाता है।
प्रारंभिक डेटा को निर्दिष्ट करने के बाद, हमें एक ग्राफ मिलता है।
2. छात्र के टी-टेस्ट का उपयोग करके जोड़ी सहसंबंध गुणांक के महत्व का आकलन। परिकलित टी-परीक्षण मान सारणीबद्ध (महत्वपूर्ण) मूल्य के साथ तुलना मेंविचाराधीन पैरामीटर के मूल्यों की इसी तालिका से इस सूचक को, महत्व के निर्दिष्ट स्तर और स्वतंत्रता की डिग्री की संख्या को ध्यान में रखते हुए। यह अनुमान फ़ंक्शन TDRESTR (प्रायिकता; डिग्री_फ्रीडम) का उपयोग करके किया जाता है।
3. जोड़ी सहसंबंध गुणांक के मैट्रिक्स।डेटा विश्लेषण उपकरण का उपयोग करके विश्लेषण किया जाता है, जिसमें सहसंबंध का चयन किया जाता है। जोड़ी सहसंबंध के गुणांक का सांख्यिकीय मूल्यांकन सारणीबद्ध (महत्वपूर्ण) मान के साथ इसके निरपेक्ष मूल्य की तुलना करके किया जाता है। यदि गणना की गई जोड़ी सहसंबंध गुणांक उस महत्वपूर्ण एक से अधिक है, तो हम कह सकते हैं, ध्यान में रखते हुए संभाव्यता की एक डिग्री दी जाती है, कि रैखिक संबंध के महत्व के बारे में शून्य परिकल्पना अस्वीकार नहीं की जाती है।
वैज्ञानिक अनुसंधान में विधि का उपयोगसहसंबंध विश्लेषण आपको विभिन्न कारकों और प्रदर्शन संकेतकों के बीच संबंध निर्धारित करने की अनुमति देता है। यह ध्यान में रखा जाना चाहिए कि एक उच्च सहसंबंध गुणांक भी एक बेतुका जोड़ी या डेटा के सेट से प्राप्त किया जा सकता है, जिसके संबंध में इस प्रकार के विश्लेषण को पर्याप्त रूप से बड़े डेटा सेट पर किया जाना चाहिए।
गणना मूल्य प्राप्त करने के बाद, आरएक निश्चित मूल्य के सांख्यिकीय महत्व की पुष्टि करने के लिए आर क्रिटिकल के साथ तुलना करना वांछनीय है। सहसंबंध विश्लेषण विशेष रूप से एमएस एक्सेल में सूत्रों का उपयोग करके या सॉफ्टवेयर का उपयोग करके मैन्युअल रूप से किया जा सकता है। यहां, आप सहसंबंध विश्लेषण के प्रभावी कारकों और प्रभावी संकेतक के बीच संबंधों की कल्पना करने के लिए एक तितर बितर (तितर बितर) आरेख का निर्माण कर सकते हैं।