في البحث العلمي ، هناك في كثير من الأحيانالحاجة إلى إيجاد علاقة بين متغيرات الإنتاج والعامل (عائد المحصول وكمية الهطول ، طول ووزن الشخص في مجموعات متجانسة حسب الجنس والعمر ومعدل ضربات القلب ودرجة حرارة الجسم ، إلخ).
والثاني علامات تساهم في تغيير المرتبطين بها (الأولى).
هناك العديد من التعريفات للمصطلح. بناءً على ما تقدم ، يمكننا القول أن تحليل الارتباط هو طريقة مستخدمة لاختبار الفرضية المتعلقة بالدلالة الإحصائية لمتغيرين أو أكثر إذا كان الباحث يستطيع قياسهما دون تغييرهما.
هناك تعريفات أخرى للنظر فيهاالمفاهيم. تحليل الارتباط هو تقنية معالجة بيانات إحصائية تبحث في معاملات الارتباط بين المتغيرات. في هذه الحالة ، تتم مقارنة معاملات الارتباط بين زوج واحد أو مجموعة من أزواج الميزات ، لإنشاء علاقات إحصائية بينهما. تحليل الارتباط هو طريقة لدراسة الاعتماد الإحصائي بين المتغيرات العشوائية مع الوجود الاختياري لطبيعة وظيفية صارمة ، حيث تؤدي ديناميكيات أحد المتغيرات العشوائية إلى ديناميكيات التوقع الرياضي لمتغير آخر.
عند إجراء تحليل الارتباط ، من الضروريضع في اعتبارك أنه يمكن تنفيذها فيما يتعلق بأي مجموعة من العلامات ، غالبًا ما تكون سخيفة فيما يتعلق ببعضها البعض. في بعض الأحيان ليس لديهم علاقة سببية مع بعضهم البعض.
في هذه الحالة يتحدثون عن علاقة خاطئة.
بناءً على التعريفات أعلاه ، يمكن للمرءلصياغة المهام التالية للطريقة الموصوفة: للحصول على معلومات حول أحد المتغيرات المطلوبة باستخدام آخر ؛ تحديد مدى قرب العلاقة بين المتغيرات المدروسة.
يتضمن تحليل الارتباط تحديد العلاقة بين السمات المدروسة ، وبالتالي يمكن استكمال مهام تحليل الارتباط بما يلي:
تختلف العوامل الفعالة من واحد إلىعدة عوامل. يمكن استخدام طريقة تحليل الارتباط إذا كان هناك عدد كبير من الملاحظات على قيمة المؤثرات الفعالة ومؤشرات العامل (العوامل) ، بينما يجب أن تكون العوامل قيد الدراسة كمية وأن تنعكس في مصادر محددة. يمكن تحديد الأول من خلال القانون العادي - في هذه الحالة ، تكون معاملات ارتباط بيرسون نتيجة لتحليل الارتباط ، أو إذا كانت الميزات لا تمتثل لهذا القانون ، يتم استخدام معامل ارتباط رتبة سبيرمان.
عند تطبيق هذه الطريقة ، فمن الضروريتحديد العوامل التي تؤثر على مؤشرات الأداء. يتم اختيارهم مع مراعاة حقيقة أنه يجب أن تكون هناك علاقات سببية بين المؤشرات. في حالة إنشاء نموذج ارتباط متعدد المتغيرات ، يتم اختيار تلك التي لها تأثير كبير على المؤشر الناتج ، بينما يفضل عدم تضمين العوامل المترابطة التي يزيد معامل الارتباط بها عن 0.85 في نموذج الارتباط ، وكذلك تلك التي تكون فيها العلاقة مع المعلمة الفعالة غير مستقيمة. أو وظيفية في الطبيعة.
يمكن تقديم نتائج تحليل الارتباط في أشكال نصية ورسومية. في الحالة الأولى ، يتم تقديمها كمعامل ارتباط ، في الحالة الثانية - في شكل مخطط مبعثر.
إذا لم يكن هناك ارتباط بين معلمات النقطةيتم ترتيبها بشكل عشوائي على الرسم التخطيطي ، ودرجة الاتصال المتوسطة تتميز بدرجة أكبر من الترتيب وتتميز بمسافة موحدة إلى حد ما بين العلامات المميزة من الوسيط. تميل الرابطة القوية إلى خط مستقيم ، وبالنسبة لـ r = 1 ، تكون قطعة الأرض عبارة عن خط مستقيم. يختلف الارتباط العكسي في اتجاه الرسم البياني من أعلى اليسار إلى أسفل اليمين ، الخط المستقيم - من أسفل اليسار إلى الزاوية اليمنى العليا.
بالإضافة إلى مخطط التبعثر التقليدي ثنائي الأبعاد ، يتم الآن استخدام تمثيل رسومي ثلاثي الأبعاد لتحليل الارتباط.
يتم أيضًا استخدام مصفوفة مخطط التشتت ،التي تعرض جميع المؤامرات المقترنة في شكل واحد بتنسيق المصفوفة. بالنسبة لمتغيرات n ، تحتوي المصفوفة على n من الصفوف و n من الأعمدة. الرسم البياني الموجود عند تقاطع الصف الأول والعمود ي هو رسم بياني للمتغيرات Xi مقابل Xj. وبالتالي ، يكون كل صف وعمود بعدًا واحدًا ، حيث تعرض خلية واحدة مخطط مبعثر من بعدين.
يتم تحديد ضيق الارتباط بواسطةمعامل الارتباط (r): قوي - r = ± 0.7 إلى ± 1 ، متوسط - r = ± 0.3 إلى ± 0.699 ، ضعيف - r = 0 إلى ± 0.299. هذا التصنيف ليس صارم. يوضح الشكل مخططًا مختلفًا قليلاً.
تم إجراء دراسة مثيرة للاهتمام في المملكة المتحدة. وهو مكرس للعلاقة بين التدخين وسرطان الرئة ، وتم إجراؤه عن طريق تحليل الارتباط. يتم عرض هذه الملاحظة أدناه.
مجموعة مهنية | التدخين | معدل الوفيات |
المزارعين والغابات والصيادين | 77 | 84 |
عمال المناجم والمحاجر | 137 | 116 |
منتجي الغاز وفحم الكوك والكيماويات | 117 | 123 |
مصنعي الزجاج والسيراميك | 94 | 128 |
العاملون في الأفران والحدادة والمسابك ومصانع الدرفلة | 116 | 155 |
عمال الكهرباء والإلكترونيات | 102 | 101 |
الهندسة والمهن ذات الصلة | 111 | 118 |
إنتاج النجارة | 93 | 113 |
الدباغون | 88 | 104 |
عمال النسيج | 102 | 88 |
مصنعي ملابس العمل | 91 | 104 |
العاملون في صناعات الأغذية والمشروبات والتبغ | 104 | 129 |
مصنعي الورق والطباعة | 107 | 86 |
الشركات المصنعة للمنتجات الأخرى | 112 | 96 |
بناة | 113 | 144 |
الرسامين والديكور | 110 | 139 |
سائقي المحركات الثابتة ، الرافعات ، إلخ. | 125 | 113 |
العمال غير المشمولين في أي مكان آخر | 133 | 146 |
عمال النقل والاتصالات | 115 | 128 |
عمال المستودعات وأمناء المخازن والتعبئة وعمال آلات التعبئة | 105 | 115 |
موظفين | 87 | 79 |
الباعة | 91 | 85 |
العاملون في مجال الرياضة والترفيه | 100 | 120 |
الإداريين والمديرين | 76 | 60 |
المهنيين والفنيين والفنانين | 66 | 51 |
لنبدأ تحليل الارتباط. من أجل الوضوح ، من الأفضل أن نبدأ الحل بالطريقة الرسومية ، والتي سنبني لها مخططًا مبعثرًا.
يوضح وجود اتصال مباشر. ومع ذلك ، من الصعب استخلاص استنتاج لا لبس فيه يعتمد فقط على الطريقة الرسومية. لذلك ، سنستمر في إجراء تحليل الارتباط. فيما يلي مثال لحساب معامل الارتباط.
استخدام البرامج (على سبيل المثال ، MSسيتم وصف Excel أدناه) نحدد معامل الارتباط وهو 0.716 مما يعني وجود علاقة قوية بين المعلمات المدروسة. دعونا نحدد الموثوقية الإحصائية للقيمة التي تم الحصول عليها وفقًا للجدول المقابل ، والتي نحتاج إلى طرح 2 من 25 زوجًا من القيم ، ونتيجة لذلك نحصل على 23 ومن هذا الصف في الجدول نجد r حرجًا لـ p = 0.01 (نظرًا لأن هذه بيانات طبية ، فهي أكثر صرامة الاعتماد ، في حالات أخرى ، p = 0.05 كافٍ) ، وهو 0.51 لتحليل الارتباط هذا. أوضح المثال أن r المحسوب أكبر من r الحرج ، وتعتبر قيمة معامل الارتباط ذات دلالة إحصائية.
النوع الموصوف لمعالجة البيانات الإحصائيةيمكن القيام به باستخدام البرامج ، ولا سيما MS Excel. يتضمن تحليل الارتباط في Excel حساب المعلمات التالية باستخدام الوظائف:
1. يتم تحديد معامل الارتباط باستخدام دالة CORREL (المصفوفة 1 ؛ المصفوفة 2). صفيف 1،2 - خلية نطاق قيم المتغيرات الناتجة والعاملة.
يُطلق على معامل الارتباط الخطي أيضًا اسم معامل ارتباط بيرسون ، لذلك ، بدءًا من Excel 2007 ، يمكنك استخدام دالة PEARSON مع نفس المصفوفات.
يتم تنفيذ العرض الرسومي لتحليل الارتباط في Excel باستخدام لوحة "الرسوم البيانية" مع تحديد "مخطط مبعثر".
بعد تحديد البيانات الأولية ، نحصل على رسم بياني.
2. تقييم أهمية معامل الارتباط الزوجي باستخدام اختبار الطالب t. قيمة اختبار t المحسوبة مقارنة بالقيمة الجدولية (الحرجة)من هذا المؤشر من الجدول المقابل لقيم المعلمة قيد النظر ، مع مراعاة مستوى الأهمية المعطى وعدد درجات الحرية. يتم هذا التقدير باستخدام الدالة TDRESTR (الاحتمال ؛ درجات_الحرية).
3. مصفوفة معاملات الارتباط الزوجية. يتم إجراء التحليل باستخدام أداة تحليل البيانات ، حيث يتم تحديد الارتباط. يتم إجراء التقييم الإحصائي لمعاملات الارتباط الزوجي من خلال مقارنة قيمته المطلقة مع القيمة الجدولية (الحرجة). إذا تم تجاوز معامل الارتباط الزوجي المحسوب على ذلك المعامل الحرج ، فيمكننا القول ، مع الأخذ في الاعتبار درجة معينة من الاحتمال ، أن الفرضية الصفرية حول أهمية العلاقة الخطية لم يتم رفضها.
طريقة الاستخدام في البحث العلمييسمح لك تحليل الارتباط بتحديد العلاقة بين العوامل المختلفة ومؤشرات الأداء. يجب أن يؤخذ في الاعتبار أنه يمكن أيضًا الحصول على معامل الارتباط العالي من زوج سخيف أو مجموعة من البيانات ، وبالتالي يجب إجراء هذا النوع من التحليل على مجموعة بيانات كبيرة بما فيه الكفاية.
بعد الحصول على القيمة المحسوبة ص ، لهامن المستحسن المقارنة مع r الحرجة لتأكيد الأهمية الإحصائية لقيمة معينة. يمكن إجراء تحليل الارتباط يدويًا باستخدام الصيغ ، أو باستخدام أدوات البرامج ، ولا سيما MS Excel. هنا ، يمكنك إنشاء مخطط مبعثر (مبعثر) من أجل تصور العلاقة بين العوامل المدروسة لتحليل الارتباط والمؤشر الفعال.