במחקר מדעי עולה לעיתים קרובותהצורך למצוא קשר בין משתנים פרודוקטיביים לגורמים (תפוקת יבול וגשם, גובה ומשקל של אדם בקבוצות הומוגניות לפי מין וגיל, דופק וטמפרטורת גוף וכו ').
השני הם סימנים התורמים לשינוי של אלה הקשורים אליהם (הראשון).
יש הרבה הגדרות למונח.בהתבסס על האמור לעיל, אנו יכולים לומר כי ניתוח מתאם הוא שיטה המשמשת לבדיקת ההשערה של המשמעות הסטטיסטית של שני משתנים או יותר, אם החוקר יכול למדוד אותם, אך לא לשנות אותם.
ישנן הגדרות אחרות הנחשבות.מושגים. ניתוח מתאם הוא שיטה לעיבוד נתונים סטטיסטיים, אשר מורכבת בחקר מקדמי המתאם בין משתנים. במקרה זה, מושווים מקדמי המתאם בין זוג אחד או ריבוי זוגות של תכונות כדי ליצור קשרים סטטיסטיים ביניהם. ניתוח מתאם הוא שיטה לבחינת הקשר הסטטיסטי בין משתנים אקראיים עם נוכחות אופציונלית בעלת אופי תפקודי קפדני, בה הדינמיקה של משתנה אקראי אחד מובילה לדינמיקה של הציפייה המתמטית של אחר.
כאשר מבצעים ניתוח מתאם, יש צורך בכךקחו בחשבון שזה יכול להתבצע ביחס לכל מערכת שלטים, לעתים קרובות אבסורדית ביחס זה לזה. לפעמים אין להם קשר סיבתי זה עם זה.
במקרה זה, הם מדברים על מתאם שגוי.
בהתבסס על ההגדרות לעיל, נוכללנסח את המשימות הבאות של השיטה המתוארת: להשיג מידע על אחד המשתנים הרצויים באמצעות האחר; לקבוע את ההידוק של הקשר בין המשתנים הנחקרים.
ניתוח מתאם כולל קביעת הקשר בין המאפיינים שנחקרו, בקשר אליו ניתן להוסיף למשימות ניתוח המתאם את הדברים הבאים:
גורמים פרודוקטיביים תלויים באחד מהםמספר גורמים. ניתן להשתמש בשיטת ניתוח המתאם אם יש מספר גדול של תצפיות על גודל המדדים האפקטיביים והגורמים (גורמים), בעוד שהגורמים הנחקרים צריכים להיות כמותיים ומשתקפים במקורות ספציפיים. את הראשון ניתן לקבוע על ידי חוק רגיל - במקרה זה, התוצאה של ניתוח המתאם היא מקדמי המתאם של פירסון, או אם הסימנים אינם מצייתים לחוק זה, נעשה שימוש במקדם המתאם לדרג Spearman.
בעת יישום שיטה זו יש צורך בכךקבעו את הגורמים המשפיעים על מדדי הביצועים. הם נבחרים תוך התחשבות בכך שיש קשרים סיבתיים בין האינדיקטורים. במקרה של יצירת מודל מתאם רב-משתני, נבחרים אלה שיש להם השפעה משמעותית על האינדיקטור שהתקבל, בעוד שעדיף לא לכלול גורמים תלויים זה בזה עם מקדם מתאם זוגי של יותר מ 0.85 במודל המתאם, כמו גם אלה שבהם הקשר עם הפרמטר האפקטיבי אינו ליניארי. או פונקציונלי באופיו.
ניתן להציג את תוצאות ניתוח המתאם בטקסטים ובצורות גרפיות. במקרה הראשון הם מוצגים כמקדם מתאם, בשני - בצורה של דיאגרמת פיזור.
אם אין קורלציה בין הפרמטרים הנקודתייםהם ממוקמים כאוטי בתרשים, מידת החיבור הממוצעת מאופיינת במידת סדר גדולה יותר ומאופיינת במרחק אחיד פחות או יותר של הסימנים המסומנים מהחציון. קשר חזק נוטה לקו ישר ועבור r = 1 עלילת הנקודה היא קו ישר. מתאם הפוך שונה בכיוון הגרף משמאל עליון לימין תחתון, קו ישר - משמאל תחתון לפינה ימנית עליונה.
בנוסף לעלילת הפיזור הדו-ממדית המסורתית, נעשה כעת שימוש בייצוג גרפי תלת-ממדי של ניתוח המתאם.
נעשה שימוש גם במטריקס Scatterplot,המציג את כל העלילות המותאמות באיור אחד בפורמט מטריצה. עבור n משתנים, המטריצה מכילה n שורות ו- n עמודות. התרשים הממוקם בצומת השורה ה- I והעמודה ה- J הוא גרף של המשתנים Xi לעומת Xj. לפיכך, כל שורה ועמודה הם מימד אחד, תא בודד מציג פיזור של שני ממדים.
אטימות המתאם נקבעת על ידימקדם המתאם (r): חזק - r = ± 0.7 עד ± 1, בינוני - r = ± 0.3 עד ± 0.699, חלש - r = 0 עד ± 0.299. סיווג זה אינו קפדני. האיור מראה תוכנית שונה במקצת.
מחקר מעניין נערך בבריטניה. הוא מוקדש לקשר בין עישון לסרטן ריאות, ובוצע על ידי ניתוח מתאם. תצפית זו מוצגת להלן.
קבוצה מקצועית | לעשן | תמותה |
חקלאים, יערנים ודייגים | 77 | 84 |
כורים ועובדי מחצבות | 137 | 116 |
יצרני גז, קוקה כימיקלים | 117 | 123 |
יצרני זכוכית וקרמיקה | 94 | 128 |
עובדים בתנורים, בזיוף, בבתי יציקה ובגלגלים | 116 | 155 |
עובדי חשמל ואלקטרוניקה | 102 | 101 |
מקצועות הנדסיים וקשורים | 111 | 118 |
ייצור עבודות עץ | 93 | 113 |
בורסקאים | 88 | 104 |
עובדי טקסטיל | 102 | 88 |
יצרני בגדי עבודה | 91 | 104 |
עובדים בתעשיית המזון, המשקאות והטבק | 104 | 129 |
יצרני נייר והדפסה | 107 | 86 |
יצרני מוצרים אחרים | 112 | 96 |
בונים | 113 | 144 |
ציירים ומעצבים | 110 | 139 |
נהגי מנועים נייחים, מנופים וכו '. | 125 | 113 |
עובדים שלא נכללים במקום אחר | 133 | 146 |
עובדי תחבורה ותקשורת | 115 | 128 |
עובדי מחסנים, מחסנים, אורזים ועובדי מכונות מילוי | 105 | 115 |
עובדי משרדים | 87 | 79 |
מוכרים | 91 | 85 |
עובדי ספורט ונופש | 100 | 120 |
מנהלים ומנהלים | 76 | 60 |
אנשי מקצוע, טכנאים ואמנים | 66 | 51 |
נתחיל בניתוח המתאם. לשם הבהרה, עדיף להתחיל את הפיתרון בשיטה הגרפית, עבורה נבנה דיאגרמת פיזור (פיזור).
זה מדגים קשר ישיר.עם זאת, קשה להסיק מסקנה חד משמעית המבוססת רק על השיטה הגרפית. לכן, נמשיך לבצע ניתוח מתאם. דוגמה לחישוב מקדם המתאם מוצגת להלן.
שימוש בתוכנה (למשל, MSExcel יתואר בהמשך), אנו קובעים את מקדם המתאם, שהוא 0.716, כלומר קשר חזק בין הפרמטרים שנחקרו. הבה נקבע את המהימנות הסטטיסטית של הערך המתקבל על פי הטבלה המקבילה, עליה אנו צריכים להפחית 2 מ -25 זוגות ערכים, וכתוצאה מכך נקבל 23 ומשורה זו בטבלה אנו מוצאים קריטי עבור = 0.01 (מכיוון שמדובר בנתונים רפואיים, תלות מחמירה יותר, במקרים אחרים, מספיק p = 0.05), שזה 0.51 לניתוח המתאם הזה. הדוגמה הוכיחה כי ה- r המחושב גדול מה- r הקריטי, ערך מקדם המתאם נחשב למובהק סטטיסטית.
הסוג המתואר של עיבוד נתונים סטטיסטייםניתן לבצע באמצעות תוכנה, בפרט, MS Excel. ניתוח המתאם ב- Excel כולל חישוב הפרמטרים הבאים באמצעות פונקציות:
1. מקדם המתאם נקבע באמצעות פונקציית CORREL (מערך 1; מערך 2). מערך 1,2 - תא של טווח הערכים של המשתנים התוצאתיים והעובדיים.
מקדם מתאם ליניארי נקרא גם מקדם מתאם פירסון, לכן, החל מ- Excel 2007, אתה יכול להשתמש בפונקציה PEARSON עם אותם מערכים.
תצוגה גרפית של ניתוח המתאם ב- Excel מתבצעת באמצעות החלונית "תרשימים" עם הבחירה "תרשים פיזור".
לאחר ציון הנתונים הראשוניים, נקבל גרף.
2. הערכת המשמעות של מקדם המתאם הזוגי באמצעות מבחן t של הסטודנט. ערך מבחן t מחושב בהשוואה לערך הטבלאי (הקריטי)של אינדיקטור זה מטבלת הערכים המקבילה של הפרמטר הנדון, תוך התחשבות ברמת המשמעות הנתונה ובמספר דרגות החופש. הערכה זו נעשית באמצעות הפונקציה TDRESTR (הסתברות; חופש מעלות).
3. מטריצה של מקדמי קורלציה זוגית.הניתוח מתבצע באמצעות כלי ניתוח הנתונים, בו נבחר המתאם. ההערכה הסטטיסטית של מקדמי המתאם הזוגיים מתבצעת על ידי השוואת הערך המוחלט שלו לערך הטבלאי (הקריטי). אם חורג ממקדם המתאם הזוגי המחושב על פני אותו קריטי, אנו יכולים לומר, בהתחשב במידת ההסתברות הנתונה, כי ההשערה האפסית לגבי חשיבות הקשר הליניארי אינה נדחית.
שימוש בשיטות במחקר מדעיניתוח המתאם מאפשר לך לקבוע את הקשר בין גורמים שונים למדדי ביצוע. יש לזכור כי ניתן לקבל מקדם מתאם גבוה גם מצמד אבסורדי או ממערך נתונים, ולכן יש לבצע ניתוח מסוג זה על מערך נתונים גדול מספיק.
לאחר קבלת הערך המחושב r, שלורצוי להשוות עם r קריטי כדי לאשר את המשמעות הסטטיסטית של ערך מסוים. ניתוח המתאם יכול להתבצע באופן ידני באמצעות נוסחאות, או באמצעות כלי תוכנה, בפרט MS Excel. כאן תוכלו לבנות תרשים פיזור (פיזור) על מנת לדמיין את הקשר בין הגורמים הנחקרים של ניתוח המתאם לבין המדד היעיל.