ضریب همبستگی چیست؟

افوض امری الی الله
قطع العلم عذر المتعللین: علم راه بهانه جویان را میبندد. امام علی(ع)
سنجش و اندازه گیری به ارزیابی، ارزشیابی، سنجش و اندازه گیری صفات، ویژگی ها و خصوصیات انسانی می پردازد. این کار از طریق ابزارهای مختلف و متفاوتی انجام می شود و گستره ای از روش های کیفی محض تا کمی محض را شامل می شود. با گشتی در آرشیو موضوعات با حوزه ای از فعالیت های این رشته آشنا خواهید شد.
راه تماس
ایمیل:[email protected]
سنجش و اندازه گیری
مبانی، روش ها و تکنیک های سنجش واندازه گیری، پژوهش، مدلبندی و تحلیل دادههای روانشناسی و علوم وابسته
ضرایب همبستگی برای مقیاس های مختلف اندازه گیری
همانطور که می دانید شدت وابستگي دو متغير به يكديگر را با همبستگي تعريف مي كنيم. ممكن است علاوه بر شدت همبستگي جهت همبستگي نيز مورد نياز ما باشد. اگر تمایل دارید بدانید روش صحیح انتخاب ضریب همبستگی چیست ادامه مطلب را بخوانید.
ضرايب همبستگي بين 1- تا 1 تغيير مي كند و مي تواند مثبت يا منفي باشد مانند ميزان رضایت شغلی یک کارمند و میزان حقوق و مزایای دریافتی وی. ضريب همبستگي يك رابطه متقارن ميباشد، هر چه ضريب همبستگي به يك نزديكتر باشد ميزان وابستگي دو متغير بيشتر است، اما دقت داشته باشید كه:
1- اين وابستگي به معناي رابطه علت و معلولي نيست و ضريب همبستگي نشان نمی دهد که كدام متغیر علت و كدام متغیر معلول است به ميان نمي آورد.
2- براي اطمینان از صحت آنچه ضریب همبستگی بیان می دارد مي توان ابتدا وجود رابطه غيرخطي بين دو متغير همبسته را در حالي كه ضريب همبستگي به غلط آن را نشان نميدهد، بررسي كرد.
3- ضريب همبستگي را ميتوان براي سنجش ميزان خطاي موجود در دادهها نيز استفاده كرد، از جمله زير فاصله ها و يا برشهاي مصنوعي دامنه داده ها
4- محاسبه ضرايب همبستگي تا حدود زيادي متاثر از مقياس اندازه گيري متغير ها است، بعنوان مثال براي متغيرهاي اسمي جهت رابطه اصلا معني ندارد، بين جنس و معدل تنها ميتوان گفت كه شدت وابستگي چه مقدار است اما افزايش يا كاهش جنس معني ندارد.
5- آزمون ضریب همبستگی به شدت تایع حجم نمونه است. تا جائی که امکان دارد حجم نمونه را افزایش دهید
با توجه به نوع متغير ها ضريب همبستگي ميتواند يكي از حالت هاي زير را داشته باشد.
1- دو متغير اسمي
2- دو متغير رتبه اي
3- دو متغير فاصله اي-نسبي
4- متغير اسمي و متغير رتبه اي
5- متغير اسمي و متغير فاصله اي - نسبي
6- متغير رتبه اي و متغير فاصله اي - نسبي
براي هر كدام از حالت هاي بالا ضرايب همبستگي متفاوتي وجود دارند
الف) دو متغير اسمي هستند و يا يكي اسمي و ديگري رتبه اي است
داده های اسمی یا nominal که مربوط به متغير يا خواص کيفی مانند جنس يا گروه خونی است و بيانگر عضويت در يک گروه خاص می باشد.
داده های رتبه ای یا Ordinal : مانند کیفیت درسی یک دانش آموز (ضعیف، متوسط و قوی) و یا رتبه بندی هتل ها ( یک ستاره، دو ستاره و .
در این حالت می توانید از یکی از ضریب های همبستگی زیر استفاده کنید:
1) ضريب همبستگي كرامر و فی: معمولا بین دو متغیر اسمی مانند اینکه بخواهیم بدانیم که آیا بين جنس و گرايشات سياسي رابطه وجود دارد يا خير
2) ضريب توافقي C: معمولا بین دو متغير اسمي و يا يكي اسمي و يكي رتبه اي
3) ضريب همبستگي لاندا: معمولا بین دو متغير اسمي و يا يكي اسمي و يكي رتبه اي مانند اینکه بخواهیم بدانیم بین مسئولیت پذیری کارکنان و منطقه خدمتی آنها رابطه وجود دارد یا خیر؟
4) ضريب همبستگي تاو گودمن و كروسكال: براي ارزيابي شدت رابطه بين متغيرهايي كه هر دو اسمي يا يكي اسمي و ديگري رتبه اي باشد بكار ميرود
ب) هر دو متغير داراي مقياس رتبه اي باشند
فرض کنید شما در حال تحقیق این فرضيه هستید که بين تحصيلات كاركنان و رضایت شغلی آنها رابطه مثبت و معني داري وجود دارد یا خیر؟ اين فرضيه دو متغير دارد، تحصيلات كاركنان با طبقه بندی های ديپلم و كمتر، فوق ديپلم، ليسانس و بالاتر و رضایت شغلی با طبقه بندی های كم، متوسط و زياد).
بر خلاف متغير هاي اسمي كه جهت رابطه در آنها مفهومی نداشت در اين جا بنا به ماهيت متغیر رتبه ای جهت رابطه مفهوم دارد. لذا قبل از هرچيز بايستي بررسي کنید كه رابطه در اينحالت به چه معني می باشد.
در این حالت می توانید از یکی از ضریب های همبستگی زیر استفاده کنید:
1- ضريب همبستگي گاما: حاصل تعامل زوج های هماهنگ و معکوس و نادیده گرفتن زوج های گره خورده با توضیحات مثال یک
2- ضريب همبستگي تاو كندال b: حاصل تعامل زوج های هماهنگ و معکوس و زوج های گره خورده با توضیحات مثال یک
3 ضريب تاو كندال C : حاصل تعامل تعداد زوج های هماهنگ و معکوس با توضیحات مثال یک
4 – ضريب d سامرز: شکل خاصی از ضریب همبستگی گاما که یکی از متغیر ها به عنوان متغیر وابسته در نظر گرفته می شود
مثال یک: فرض كنيد نمره 3 دانش آموز را در دو درس مختلف داريم، پس هر دانش آموز دو نمره دارد. حال اگر نمره
يك دانش آموز با دانش آموز ديگر مقايسه شود، ميتوان بيان داشت كه اين دو دانش آموز یعنی این دو زوج نسبت به هم يك زوج معكوس را تشكيل ميدهند يا يك زوج هماهنگ. اگر با افزايش نمره یکی، نمره ديگری نیز افزايش يابد به آن دو زوج هماهنگ می گوئیم و اگر با افزايش يكي ديگري كاهش يابد زوج معكوس و چنانچه با افزايش يا كاهش يكی ديگری تغييري نكند به آن دو زوج گره خورده می گوئیم. ضریب همبستگی گاما برای این حالت کاربرد خوبی دارد
ج) هر دو متغير داراي مقياس فاصلی ای نسبی باشند
داده های فاصله ای: به عنوان مثال داده هایی که متغیر ضریب هوشی را در بین چند نفر توصیف می کنند عبارتند از: 80، 110، 75، 97 و 117، چون این داده ها عدد هستند پس داده های ما کمی هستند اما می دانیم که IQ نمی تواند صفر باشد و صفر در اینجا فقط مبنایی است تا سایر مقادیر IQ در فاصله ای منظم از صفر و یکدیگر قرار گیرند پس این داده ها فاصله ای اند.
داده های نسبتی: داده های نسبتی داده هایی هستند که با عدد نوشته می شوند اما صفر آنها واقعی است. اکثریت داده های کمی این گونه اند و حقیقتاً دارای صفر هستند. به عنوان مثال داده هایی که متغیر طول پاره خط بر حسب سانتی متر را توصیف می کنند عبارتند از: 20، 15، 35، 8 و 23، چون این داده ها عدد هستند پس داده های ما کمی اند و چون صفر در اینجا واقعاً وجود دارد این داده نسبتی تلقی می شوند.
در این حالت هر دو متغیر کمیت پذیرند.
اول مشخص کنید که متغیر شما پارامتریک است یا ناپارامتریک
اگر پارامتریک بود یعنی متغیر دارای توزیع نرمال بود و مقادیر پرت در مشاهدات وجود نداشت ضریب همبستگی پیرسون
توجه: اگر یکی از متغیر ها دارای توزع پیوسته نرمال بود و متغیر دیگر دو حالتی بود مثل (زن/مرد یا قبول/رد) می توانید از ضریب همبستگی پیرسون (همبستگی دو رشته ای نقطه ای) استفاده کنید. مثل رابطه جنسیت با تعداد حوادث
اگر ناپارامتریک بودیعنی متغیر دارای توزیع غیر نرمال ضریب همبستگی اسپرمن
د) متغيرهايي با مقياس اسمي- رتبه اي و متغيرهاي با مقياس فاصله اي-نسبي
هنگامي كه يك متغير داراي مقياس اسمي و رتبه ای باشد مثل جنس، نژاد، ميزان رضايت و . و متغير ديگر مقياس فاصلهاي يا نسبي داشته باشد مانند درآمد، معدل، اندازه قد و . آنگاه بايستي شاخصي انتخاب شود كه از روي يك متغير بتوان متغير ديگر را پيش بيني كرد. از جمله اين شاخص ها شاخص نسبت همبستگی می باشد که آن را ضریب همبستگی مجذور اتا می نامیم.
1) ضریب همبستگی مجذور اتا
فرض کنید می خواهیم بدانیم که آيا بين جنس و معدل دانشجويان رابطه وجود دارد. در اينجا جنس يك متغير كيفي يا اسمي است و معدل يك مقياس فاصله اي يا نسبي
2) ضریب همبستگی چند رشته ای
فرض کنید مي خواهيم همبستگي بين يك متغير فاصله اي را با متغير دو حالتي يا ترتيبي كه فرض شده است كه متغير اساسا پيوسته اي را منعكس ميكند بررسي كنيم. اين ضريب همبستگي را ميتوان تا حدود زيادي مانند ضريب همبستگي پيرسون تعبير کرد.
1- ضریب همبستگی کاپای کوهن
فرض كنيد می خواهیم ميزان توافق بين مديران و معاونان را در خصوص ميزان اهميت مشتري در سازمانی ارزيابي كنیم. هر فرد اعم از مدير يا معاون ميتواند نظر خود را بصورت ضریب همبستگی چیست؟ زياد و كم بيان كند. در اين حالت كه هر دو متغير اسمي دوتايي ميباشند ميتوان از ضريب همبستگي كاپاي كوهن كه بطور معادل در بعضي مواقع ضريب همبستگي كاپا نيز ناميده ميشود، استفاده ميشود.
2- ضریب همبستگی چند حالتی
ضريب همبستگي چند حالتي زماني مورد استفاده قرار ميگيرد كه هر دو متغير دو حالتي يا هر دو متغير ترتيبي باشند، البته توجه كنيد كه مانند ضريب همبستگي چند رشته اي در هر دو متغير فرض شده است كه اين متغير ها اساسا تغييرات متغير پيوسته اي را منعكس ميكنند، علي الخصوص زماني كه از مقياس ليكرت استفاده ميشود بايستي از اين ضريب همبستگي استفاده كرد.
منابع:ضریب همبستگی چیست؟
نجیبی، سید مرتضی، انواع ضریب همبستگی و محاسبه آنها، 1388، http://daneshamari.blogfa.ir
میرزاده، محمد رضا، ضریب همبستگی، http://m-mirzadeh.blogfa.com
بسم الله الرحمن الرحیم
افوض امری الی الله
قطع العلم عذر المتعللین: علم راه بهانه جویان را میبندد. امام علی(ع)
سنجش و اندازه گیری به ارزیابی، ارزشیابی، سنجش و اندازه گیری صفات، ویژگی ها و خصوصیات انسانی می پردازد. این کار از طریق ابزارهای مختلف و متفاوتی انجام می شود و گستره ای از روش های کیفی محض تا کمی محض را شامل می شود. با گشتی در آرشیو موضوعات با حوزه ای از فعالیت های این رشته آشنا خواهید شد.
راه تماس
ایمیل:[email protected]
ضریب همبستگی + مثال سهام خودرویی
ضریب همبستگی یک معیار آماری از قدرت رابطه بین حرکات نسبی دو متغیر است. از این ضریب در بورس، برای مقایسه سهام و یا شاخص های مختلف بسیار استفاده می شود. در این مقاله به صورت کاربردی و همراه با مثال این ضریب را برای شما تشریح کرده ایم.
مقادیر ضریب همبستگی بین ۱/۰- تا ۱/۰+ است. اگر عدد محاسبه شده بزرگتر از ۱/۰+ یا کمتر از۱/۰- به این معنی است که در اندازه گیری همبستگی خطایی رخ داده است. همبستگی ۱/۰- یک همبستگی منفی کامل را نشان می دهد، در حالی که همبستگی ۱/۰+ یک همبستگی مثبت کامل را نشان می دهد. همبستگی ۰/۰ هیچ رابطه خطی بین دو متغییر نشان نمی دهد.
از آمار همبستگی می توان در امور مالی و سرمایه گذاری استفاده کرد. به عنوان مثال، می توان ضریب همبستگی را برای تعیین سطح همبستگی بین قیمت نفت خام و قیمت سهام یک شرکت تولید کننده نفت محاسبه کرد. از آنجا که شرکت های نفتی با افزایش قیمت نفت سود بیشتری می کنند، همبستگی بین دو متغیر بسیار مثبت است.
درک ضریب همبستگی
چندین نوع ضریب همبستگی وجود دارد، اما یکی از رایج ترین آنها ضریب همبستگی پیرسون است. این امر قدرت و جهت رابطه خطی بین دو متغیر را اندازه گیری می کند. نمی تواند روابط غیر خطی بین دو متغییر را ثبت کند و نمی تواند بین متغیر های وابسته و مستقل تفاوت قائل شود.
میزان رابطه بر حسب میزان ضریب همبستگی در درجه متفاوت است. به عنوان مثال، مقدار۲/۰ نشان می دهد که بین دو متغیر همبستگی مثبت وجود دارد، اما ضعیف است و احتمالا بی اهمیت است. تحلیلگران برخی از زمینه های مطالعاتی تا زمانی که مقدار حداقل ۸/۰ فراتر نرود، همبستگی را مهم نمی دانند. با این حال، ضریب همبستگی با مقدار مطلق ۹/۰ یا بیشتر نشان دهنده ی یک رابطه بسیار قوی است.
سرمایه گذاران می توانند از تغییرات در آمار همبستگی برای شناسایی روندهای جدید در بازارهای مالی، اقتصاد و قیمت سهام استفاده کنند.
آمار همبستگی و سرمایه گذاری
همبستگی بین دو متغیر هنگام سرمایه گذاری در بازار های مالی بسیار مفید است. برای مثال، یک همبستگی می تواند در تعیین میزان عملکرد یک صندوق سرمایه گذاری نسبت به شاخص معیار خود، یا صندوق یا کلاس دارایی دیگر مفید باشد. با افزودن صندوق سرمایه گذاری متقابل کم یا وابسته منفی به سبد موجود، سرمایه گذار از مزایای تنوع برخوردار می شود.
به عبارت دیگر، سرمایه گذاران می توانند از دارایی ها یا اوراق بهادار همبسته منفی برای پرتفوی خود و کاهش ریسک بازار به دلیل نوسانات یا نوسانات شدید قیمت استفاده کنند. بسیاری از سرمایه گذاران ریسک قیمت یک پرتفوی را تحت پوشش قرار می دهند، که به طور موثر هر گونه سود یا زیان سرمایه ای را کاهش می دهد زیرا آنها سود سهام یا اوراق بهادار را می خواهند.
آمار همبستگی همچنین به سرمایه گذاران این امکان را می دهد که زمان تغییر همبستگی بین دو متغییر را تعیین کنند. به عنوان مثال، سهام بانک ها به طور معمول با نرخ های بهره همبستگی بالایی دارند زیرا نرخ های وام اغلب بر اساس نرخ های سود بازار محاسبه می شود.
اگر قیمت سهام یک بانک در حال افزایش باشد در حالی که نرخ بهره در حال افزایش است، سرمایه گذاران می توانند بدانند که چیزی ناخواسته است. اگر قیمت سهام بانک های مشابه در این بخش نیز در حال افزایش است، سرمایه گذاران می توانند نتیجه بگیرند که کاهش سهام بانک به دلیل نرخ بهره نیست. در عوض، این بانک با عملکرد ضعیف به احتمال زیاد با یک مسئله داخلی و اساسی برخورد می کنند.
معادله ضریب همبستگی
برای محاسبه همبستگی محصول- لحظه پیرسون، ابتدا باید کوواریانس دو متغیر مورد نظر را تعیین کرد. در مرحله بعد، باید انحراف معیار هر متغییر را محاسبه کرد. ضریب همبستگی با تقسیم کوواریانس بر حاصلضرب انحراف استداندارد دو متغییر تعیین می شود.
xi: متغیر ایکس i ام
yi: متغیر وای i ام
x: میانگین متغیر x
y: میانگین متغیر y
منظور از ضریب همبستگی چیست؟
ضریب همبستگی نحوه حرکت یک متغیر در رابطه با دیگری را توصیف می کند. یک همبستگی مثبت نشان می دهد که این دو در یک جهت حرکت می کنند، هنگامی که آنها پشت سر هم حرکت کنند ۱/۰+ همبستگی دارند. ضریب همبستگی منفی به شما می گویند که آنها در جهت خلاف هم حرکت می کنند. همبستگی صفر نشان می دهد که هیچ ارتباطی وجود ندارد.
چگونه از ضریب همبستگی در سرمایه گذاری استفاده می شود؟
ضرایب همبستگی یک معیار آماری پرکاربرد در سرمایه گذاری است. آنها نقش بسیار مهمی در زمینه هایی مانند ترکیب سبد سهام، معاملات کمی و ارزیابی عملکرد ایفا می کنند. به عنوان مثال، برخی از مدیران سبد سهام بر ضرایب همبستگی دارایی های جداگانه در پرتفوی خود نظارت می کنند تا اطمینان حاصل شود که نوسان کلی سبد سهام آنها در محدوده قابل قبول حفظ می شود.
به طور مشابه، تحلیلگران گاهی از ضرایب همبستگی استفاده می کنند تا پیش بینی کنند که چگونه دارایی خاص تحت تاثیر یک عامل خارجی، مانند قیمت کالا یا نرخ بهره، تحت تاثیر قرار می گیرد.
در تمام بازار های دنیا این نکته حائز اهمیت است که وقتی می خواهیم سهمی را بخریم، باید وضعیت این سهم روبه رشد باشد تا ریسک معاملاتمان پایین تر بیاید.
برای بررسی این موضوع ابتدا نمودار شاخص کل را چک می کنیم که ببینیم در گذشته چه اصلاح هایی داشته است.
سپس قسمتی را که اصلاح شاخص شروع شده تا قسمتی که اصلاح به پایان رسیده مشخص می کنیم.
بعد بررسی می کنیم که آیا در زمانی که شاخص کل اصلاح داشته صنعت های مختلف نیز اصلاح داشته اند یا خیر. صنعت هایی که اصلاح کمتری نسبت به شاخص داشته اند می توانند حائز اهمیت باشند. برای تفکیک این صنعت ها بر روی گزینه compare (مقایسه) کلیک می کنیم.
با انتخاب این گزینه یک پنجره برایمان باز می شود در این پنجره شما می توانید به دلخواه یک حرف تایپ کنید. با تایپ حرف مورد نظر گزینه های متفاوتی بر روی صفحه نمایش داده می شود که با انتخاب گزینه شاخص تمامی شاخص ها را نشان می دهد.
شاخص ها را یک به یک با همین روش انتخاب می کنیم و نمودار آنها نمایش داده می شود. در بین این صنعت ها ۳ الی ۴ صنعت برای ما بیشتر اهمیت ندارد.
صنعت هایی را که نمودار آنها خیلی پایین تر از نمودار شاخص است پاک می کنیم. صنعت هایی را هم که خیلی بالاتر از نمودار شاخص هستند را نیز پاک می کنیم زیرا امکان دارد یک همبستگی منفی با شاخص داشته باشد. یعنی موقعی که شاخص بالا برود این ها نیز بالا بروند. پس ما به صنعت هایی که خیلی بالاتر از نمودار شاخص کل هستند اعتماد زیادی نمی کنیم، پس آنها را نیز پاک می کنیم.
صنایعی که پایین تر از نمودار شاخص هستند امکان دارد از لحاظ بنیادی ضعیف باشند چرا که تا شاخص منفی شده است این صنعت ها دو برابر منفی شده اند. نهایتا هدف شناسایی صنعت هایی است که نمودار آنها به نمودار شاخص نزدیک است.
برای مثال ما در این مقاله صنعت خودرو را بررسی می کنبم.
برای پیدا کردن سهام های موجود در صنعت خودر ابتدا وارد سایت tsetmc.com می شویم.
در آنجا در سمت چپ بالای صفحه بر روی دیدبان بازار کلیک می کنیم. در آنجا تمامی صنعت ها و همه ی سهام های موجود در آن صنعت نمایش داده می شود .
سپس تک تک سهم های خودرویی را بر روی نمودار compare می آورم. با کلیک روی گزینه compare اسم سهام مورد نظر را وارد می کنیم و در دسته بندی بالای آن گزینه سهام را انتخاب می کنیم تا نمودار سهام مورد نظر نمایش داده شود. با نمایش تمامی سهام خودرویی آنهایی را که نمودارشان بالاتر و پایین تر است حذف می کنیم تا ۱ الی ۲ سهم باقی بماند.
سپس بررسی می کنیم که تا به امروز چند درصد سود داده اند. انتخاب ما سهام هایی است که از شاخص کل بورس بیشتر سود داده اند. هدف ما از این کار، پیدا کردن بهترین صنعت و بهترین سهام موجود در آن صنعت از طریق ضریب همبستگی شاخص است.
سوالات متداول
در ادامه سوالاتی که امکان دارد برای شما در رابطه با موضوع «ضریب همبستگی» به وجود بیاید، آماده کرده ایم:
ضریب همبستگی چیست؟
ضریب همبستگی یک معیار آماری از قدرت رابطه بین حرکات نسبی دو متغیر است. مقادیر بین ۱/۰- تا ۱/۰+ است.
کاربرد ضریب همبستگی چیست؟
سرمایه گذاران می توانند از تغییرات در آمار همبستگی برای شناسایی روندهای جدید در بازارهای مالی، اقتصاد و قیمت سهام استفاده کنند.
فرمول ضریب همبستگی پیرسون چیست؟
برای محاسبه همبستگی محصول- لحظه پیرسون، ابتدا باید کوواریانس دو متغیر مورد نظر را تعیین کرد. در مرحله بعد، باید انحراف معیار هر متغیر را محاسبه کرد. ضریب همبستگی با تقسیم کوواریانس بر حاصلضرب انحراف استداندارد دو متغییر تعیین می شود.
برای ارتقای هرچه بیشتر مقالات رینگ اسپرت ، به خصوص مقالات بازارچک ، می توانید نظرات و سوالات خود را زیر این پست برای ما کامنت کنید.
ضریب همبستگی: فرمول ها ، محاسبه ، تفسیر ، مثال
ضریب همبستگی در آمار ، این شاخصی است که گرایش دو متغیر کمی X و Y را برای داشتن یک رابطه خطی یا متناسب بین آنها اندازه گیری می کند.
به طور کلی ، جفت متغیرهای X و Y دو ویژگی یک جمعیت هستند. به عنوان مثال ، X می تواند قد فرد و Y وزن او باشد.
در این حالت ، ضریب همبستگی نشان می دهد که آیا روشی به رابطه متناسب بین قد و وزن در یک جمعیت معین وجود دارد یا خیر.
ضریب همبستگی خطی پیرسون با حرف مشخص می شود ر حروف کوچک و حداقل و حداکثر مقادیر آن به ترتیب -1 و +1 می باشد.
مقدار r = 1 نشان می دهد که مجموعه ای از جفت ها (X ، Y) کاملاً تراز هستند و وقتی X رشد می کند ، Y نیز به همان نسبت رشد می کند. از طرف دیگر ، اگر اتفاق می افتد که ضریب همبستگی چیست؟ r = -1 ، مجموعه جفت ها نیز کاملاً تراز می شوند ، اما در این حالت وقتی X افزایش می یابد ، Y به همان نسبت کاهش می یابد.
از طرف دیگر ، مقدار r = 0 نشان می دهد که هیچ همبستگی خطی بین متغیرهای X و Y وجود ندارد. در حالی که مقدار r = +0.8 نشان می دهد که جفت ها (X ، Y) تمایل دارند از یک طرف جمع شوند و دیگری از یک خط خاص
فرمول محاسبه ضریب همبستگی r به شرح زیر است:
چگونه ضریب همبستگی را محاسبه کنیم؟
ضریب همبستگی خطی کمیت آماری است که در ماشین حسابهای علمی ، بیشتر صفحات گسترده و برنامه های آماری تعبیه شده است.
با این حال ، راحت است که بدانید فرمولی که آن را تعریف می کند چگونه اعمال می شود ، و برای این منظور یک محاسبه دقیق در یک مجموعه داده کوچک نشان داده می شود.
و همانطور که در بخش قبلی بیان شد ، ضریب همبستگی کوواریانس Sxy است که بر حاصل از انحراف استاندارد Sx برای متغیرهای X و Sy برای متغیر Y تقسیم می شود.
کوواریانس و واریانس
کواریانس Sxy به شرح زیر است:
Sxy = [Σ (Xi - ) (یی - )] / (N-1)
جایی که مجموع از 1 به N جفت داده می رسد (Xi ، Yi). و به ترتیب محاسبات داده های Xi و Yi هستند.
به نوبه خود ، انحراف استاندارد برای متغیر X ریشه مربع واریانس مجموعه داده های Xi است ، با i از 1 تا N:
Sx = √ [Σ (Xi - ) ^ 2) / (N-1)]
به طور مشابه ، انحراف استاندارد برای متغیر Y ریشه مربع واریانس مجموعه داده Yi است ، با i از 1 تا N:
Sy = √ [Σ (یی - ) 2 ) / (N-1)]
مورد مصور
به منظور نشان دادن جزئیات نحوه محاسبه ضریب همبستگی ، مجموعه چهار جفت داده زیر را خواهیم گرفت
ابتدا میانگین محاسبه را برای X و Y محاسبه می کنیم ، به شرح زیر:
= (1 + 2 + 3 + 4) / 4 = 2.5
= (1 + 3 + 6 + 7) / 4 = 4.25
سپس پارامترهای باقیمانده محاسبه می شوند:
کوواریانس سکسی
Sxy = [(1 - 2.5) (1 - 4.25) + (2 - 2.5) (3 - 4.25) + (3 - 2.5) (6 - 4.25) + …. (4 - 2.5) (7 - 4.25)] / (4-1)
Sxy = [(-1.5) (- 3.25) + (-0.5) (- 1.25) + (0.5) (1.75) +
….(1.5)(2.75) ] / (3) = 10.5 / 3 = 3.5
انحراف استاندارد Sx
Sx = √ [(-1.5) 2 + (-0.5) 2 + (0.5) 2 + (1.5) 2 ) / (4-1)] = √[5/3] = 1.29
انحراف استاندارد
Sx = √ [(-3.25) 2 + (-1.25) 2 + (1.75) 2 ضریب همبستگی چیست؟ + (2.75) 2 ) / (4-1)] =
√[22.75/3] = 2.75
ضریب همبستگی r
r = 3.5 / (1.29 * 2.75) = 0.98
تفسیر
در مجموعه داده های مورد قبلی ، یک همبستگی خطی قوی بین متغیرهای X و Y مشاهده می شود ، که هم در نمودار پراکندگی (در شکل 1 نشان داده شده است) و هم در ضریب همبستگی آشکار می شود ، که یک ارزش کاملاً نزدیک به وحدت است.
تا آنجا که ضریب همبستگی به 1 یا -1 نزدیکتر باشد ، منطبق تر بودن داده ها در یک خط ، نتیجه رگرسیون خطی است.
رگرسیون خطی
خط رگرسیون خطی از بدست می آید روش حداقل مربعات.که در آن پارامترهای خط رگرسیون از به حداقل رساندن مجموع مربع اختلاف بین مقدار Y برآورد شده و Yi داده N بدست می آیند.
از طرف دیگر ، پارامترهای a و b خط رگرسیون y = a + bx که با استفاده از روش حداقل مربعات بدست آمده اند ، عبارتند از:
* b = Sxy / (Sx 2 ) برای شیب
* a = - ب برای تقاطع خط رگرسیون با محور Y.
به یاد بیاورید که Sxy کوواریانس تعریف شده در بالا و Sx است 2 واریانس یا مربع انحراف استاندارد تعریف شده در بالا است. و به ترتیب محاسبات داده های X و Y هستند.
مثال
برای تعیین وجود همبستگی خطی بین دو متغیر از ضریب همبستگی استفاده می شود. وقتی متغیرهای مورد مطالعه کمی باشند قابل اجرا است و علاوه بر این ، فرض بر این است که آنها از یک توزیع نوع طبیعی پیروی می کنند.
ما یک مثال گویا در زیر داریم: معیاری برای میزان چاقی ، شاخص توده بدن است که با تقسیم وزن فرد بر کیلوگرم به قد مربع همان در واحد متر مربع بدست می آید.
شما می خواهید بدانید که آیا بین شاخص توده بدن و غلظت کلسترول HDL در خون ، اندازه گیری شده بر حسب میلی مول بر لیتر ، ارتباط زیادی وجود دارد یا خیر. برای این منظور ، یک مطالعه با 533 نفر انجام شده است که در نمودار زیر خلاصه شده است ، که در آن هر نقطه داده های یک نفر را نشان می دهد.
مشاهده دقیق نمودار نشان می دهد که بین غلظت کلسترول HDL و شاخص توده بدنی روند خطی خاصی وجود دارد (خیلی مشخص نیست). معیار کمی این روند ضریب همبستگی است که برای این مورد معادل r = -0.276 است.
تفاوت بین کواریانس و همبستگی(correlation)
در تئوری احتمال و آمار عبارت کواریانس و همبستگی (correlation) خیلی شبیه هم هستند. هر دو پارامتر میزان ارتباط خطی بین دو تا متغیر را توصیف می کنند و با کمک کواریانس و همبستگی میتوان میزان وابستگی یک متغیر را به یک متغیر دیگه بررسی کرد. ولی تفاوت این دو در چی هست؟
در آمار از کواریانس و همبستگی برای بررسی ارتباط خطی دو بین دو متغیر و اندازه گیری میزان وابستگی آنها ضریب همبستگی چیست؟ به همدیگر استفاده میکنند! ولی آیا هر دو عین هم هستند؟ خیر!
همبستگی جهت و شدت ارتباط بین دو متغیر را مشخص میکند، در حالی که کواریانس تنها جهت ارتباط بین دو متغیر را مشخص میکند.
اجازه بدهید با یک مثال ساده این مسئله را بررسی کنیم، فرض کنید که در یک مطالعه ای میخواهید قد افراد در جامعه ایران را بررسی کنید و ببینید قد افراد به چه صورت توزیع شده است. برای اینکار یک تعداد افراد از جامعه را به صورت کاملا تصادفی انتخاب میکنید و قد این افراد را اندازه گیری میکنید. فرض کنید که قد افرادی که بررسی کردید به صورت زیر است.
الان شما یک مجموعهای تک متغیره دارید و اگر بخواهید این مجموعه را از لحاظ آماری بررسی کنید نیاز به محاسبه میانگین و واریانس قد افراد دارید.
میانگین
حد وسط یک داده را مشخص میکند. در این مثال میانگین قد افراد در جامعه را مشخص میکند.
واریانس
میزان تغییرات حول میانگین را مشخص می کند. واریانس کمتر به این معنی است که قد افراد جامعه خیلی شبیه هم هست ولی اگر واریانس زیاد باشد نشان میدهید که قد افراد در جامعه رنج تغییرات زیادی دارد.
خب با همین دو پارامتر میتوانیم به صورت آماری یک مجموعه تک متغیره را بررسی کنیم.
حال بیایید مثال را تغییر بدهیم، فرض کنید که میخواهید ارتباط بین وزن و قد افراد را بررسی کنید. و برای همین منظور تعدادی از افراد جامعه را به صورت کاملا تصادفی انتخاب میکنید، و وزن و قد این افراد را اندازه گیری میکنید .
در این مسئله میخواهیم بدانیم که چه ارتباط خطی بین قد و وزن افراد وجود دارد. برای مثال میخواهیم بدانیم آیا با تغییر قد افراد وزن افراد هم تغییر کرده یا نه. و اگر تغییر کرده این تغییرات به چه شکل بوده است. برای بررسی ارتباط خطی بین دو تا مجموعه تک متغیره از کواریانس و همبستگی استفاده می کنند.
کواریانس
کواریانس دو تا متغیر را میتوان طبق رابطه زیر محاسبه کرد و مقدار بدست آمده یک عددی بین [-∞ :+ ∞] است.
کواریانس تنها جهت(direction) ارتباط بین دو متغیر را مشخص میکند. بعنی مشخص میکند که ارتباط بین دو متغیر مثبت ، منفی و یا صفر است.
- اگر کواریانس بین قد و وزن افراد مثبت باشد، یعنی با افزایش قد افراد جامعه، وزنها انها هم افزایش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز کاهش می یابد
- اگر کواریانس بین قد و وزن افراد منفی باشد، یعنی با افزایش قد افراد جامعه، وزنها افراد کاهش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز افزایش می یابد
- اگر کواریانس بین قد و وزن افراد صفر باشد، یعنی با افزایش یا کاهش قد افراد جامعه، وزنها انها تغییری نمیکند.
حال فرض کنید کواریانس بین دو تا متغیر شده عدد 15، به نظر شما این عدد چه چیزی را مشخص میکند؟ آیا میتوان گفت ارتباط خطی بین دو متغیر بسیار زیاد هست؟ نه نمیتوان گفت. ما از روی کواریانس بدست آمده تنها جهت ارتباط بین دو متغیر را میتوانیم متوجه شویم، ولی اینکه شدت ارتباط بین دو متغیر چقدر هست را نمیتوان متوجه شد!
همبستگی
همسبتگی همان کواریانس نرمال شده است و طبق رابطه زیر میتوانیم همبتسگی بین دو متغیر را بدست آوریم.
همسبتگی یک عدد بین [-1:+1] هست و جهت(direction) و شدت-میزان (strength) ارتباط خطی بین دو متغیر را مشخص میکند.
هر چقدر همبستگی به عدد +1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی مثبت زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد هم افزایش پیدا میکند و برعکس. یک ارتباط مستقیم بین دو متغیر وجود دارد.
هر چقدر همبستگی به عدد -1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی منفی زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد کاهش پیدا میکند و برعکس. یک ارتباط عکس بین دو متغیر وجود دارد.
اگر همبستگی دو متغیر نزدیک به عدد 0 باشد معنیش این است که با تغییرات مقدار یک متغیر، تغییر در مقدار متغیر دوم اتفاق نمی افتد!
حالا سوال اینه که اگر هر دو مجموعه به جای تک متغیره، چند متغیره باشند چیکار کنیم؟ از چه ابزاری برای بررسی ارتباط بین دو مجموعه چند متغیره استفاده کنیم؟
یکی از الگوریتمهای معروفی که میتوان با کمک آن ارتباط خطی بین دو مجموعه چند متغیره را بررسی کرد الگوریتم CCA ، تجزیه همسبتگی کانونی است. در دوره واسط مغز کامپیوتر مبتنی بر SSVEP به طور کامل تئوری این روش رو توضیح داده و پیاده سازی کرده ایم.
ضریب همبستگی چيست؟
یادگیری ضریب همبستگی، کارکرد و انواع آن از اولین ملزومات به کارگیری روشهای محاسباتی در تحقیقات علی – معلولی می باشد . ضریب همبستگی مبنای محاسبات مربوط به تحلیل مسیر و در نتیجه معادلات ساختاری می باشد.
ضريب همبستگي ارتباط بین دو متغیر را نشان می دهد.این ضریب ابزاری است آماری که به وسیله آن می توان درجه ای را که یک متغیر به متغیر مرتبط است را اندازه گیری کرد.
انواع روابط بین متغیرها
الف ) رابطه مستقيم
اندازه عددي بدست آمده برای این ضریب بين 1- تا 1+ می باشد که به کمک آن مي توان درجه اي را که دو متغير بايکديگر در ضریب همبستگی چیست؟ ارتباط هستند را نشان داد. در صورتي که عدد همبستگي بين صفر تا 1 باشد نوع رابطه را مستقيم مي ناميم.
رابطه مستقيم به اين معني است که با افزايش يک متغير انتظار مي رود که اندازه متغير ديگر نيز افزايش يابد و برعکس با کاهش اندازه يک متغير اندازه متغير ديگر نيز ضریب همبستگی چیست؟ کاهش يابد. به عنوان مثال وقتي گفته مي شود بين مصرف ميوه با شادابي پوست رابطه مستقيمي وجود دارد يعني که اگر فردي مصرف ميوه اش بيشتر باشد انتظار مي رود که پوست شادابتري داشته باشد و يا اينکه افراد هر چقدر پوست شادابتري داشته باشند انتظار مي رود که مصرف ميوه آنها نيز بالاتر باشد و برعکس.
ب ) رابطه معکوس
در صورتي که عدد ضریب همبستگي بين صفر تا 1 – باشد رابطه را از نوع معکوس مي ناميم. رابطه معکوس به اين معني است که با افزايش يک متغير انتظار مي رد که اندازه متغير ديگر نيز کاهش يابد و برعکس با کاهش اندازه يک متغير اندازه متغير ديگر نيز افزايش يابد. به عنوان مثال وقتي گفته مي شود بين مصرف سيگار با طول عمر رابطه معکوس وجود دارد يعني که اگر فردي مصرف سيگارش بيشتر باشد انتظار مي رود که طول عمر کمتري داشته باشد و يا اينکه افراد هر چقدر طول عمر بيشتري داشته باشند انتظار مي رود که کمتر سيگار مصرف کرده باشند و برعکس.
علاوه بر اين درصورتي که مقدار عددي همبستگي برابر 1+ باشد همبستگي را مستقيم کامل و اگر برابر 1 – باشد آن را معکوس کامل و در صورتي که برابر صفر باشد مي گوييم بين دو متغير هيچگونه رابطه اي وجود ندارد.