ضریب آلفا از قابلیت اطمینان

ساخت وبلاگ

Coefficient cronbachs alhpa interpretation

ضریب آلفا ، که گاهی اوقات به آن آلفا کرونباخ گفته می شود ، یک شاخص آماری است که برای ارزیابی سازگاری داخلی یا قابلیت اطمینان یک ارزیابی استفاده می شود. یعنی ، با تجزیه و تحلیل آمار مورد ، چقدر می توانیم انتظار داشته باشیم که نمرات داشته باشیم. مقدار بالا نشان می دهد که آزمون از قابلیت اطمینان بالایی برخوردار است و مقدار کم نشانگر قابلیت اطمینان کم است.

آلفا کرونباخ

مرجع کلاسیک به آلفا کرونباخ (1954) است. او آن را اینگونه تعریف می کند:

coefficient alpha

جایی که K تعداد موارد است ، Sigma-I واریانس مورد I است و Sigma-X واریانس نمره کل است.

Kuder-Richardson 20

در حالی که کرونباخ تمایل به دریافت اعتبار دارد ، تا جایی که این شاخص اغلب "آلفا کرونباخ" خوانده می شود ، او واقعاً آن را اختراع نکرد. كودر و ریچاردسون (1927) معادله زیر را برای برآورد قابلیت اطمینان یك آزمایش با موارد دوگانگی (درست/اشتباه) پیشنهاد كردند.

kr 20 reliability

توجه داشته باشید که این همان معادله کرونباخ است ، به جز این که وی واریانس دوتایی PQ را با علامت کلی تر واریانس (سیگما) جایگزین کرد. این فقط بدان معنی است که می توانید از معادله کرونباخ در داده های پلی اتمی مانند مقیاس رتبه بندی لیکرت استفاده کنید. در مورد داده های دوگانگی مانند موارد انتخاب چندگانه ، آلفا و KR-20 کرونباخ دقیقاً یکسان هستند.

علاوه بر این ، سیریل هویت قابلیت اطمینان را در یک رویکرد معادل با استفاده از ANOVA در سال 1941 ، یک دهه قبل از مقاله کرونباخ تعریف کرد.

نحوه تفسیر

به طور کلی ، آلفا از 0. 0 (ژنراتور شماره تصادفی) تا 1. 0 (اندازه گیری کامل) خواهد بود. با این حال ، در موارد نادر ، می تواند به زیر 0. 0 برود ، مانند اینکه تست بسیار کوتاه است یا اگر داده های گمشده زیادی وجود داشته باشد (ماتریس پراکنده). این در واقع یکی از دلایلی است که در برخی موارد استفاده از آلفا نیست. اگر با تست های خطی در پرواز (LOFT) ، تست های تطبیقی رایانه ای (CAT) یا مجموعه ای از فرم های خطی همپوشانی برای معادله (تست لنگر غیر معادل یا طراحی شسته و رفته) سر و کار دارید ، احتمالاً خواهید داشتبخش بزرگی از کمبود در ماتریس داده و آلفا بسیار کم یا منفی خواهد بود. در چنین مواردی ، نظریه پاسخ مورد روش بسیار مؤثرتری برای ارزیابی آزمون ارائه می دهد.

"اندازه گیری کامل؟"خوب ، تصور کنید از یک خط کش برای اندازه گیری یک تکه کاغذ استفاده کنید. اگر به اندازه آمریکایی باشد ، آن تکه کاغذ همیشه 8. 5 اینچ عرض خواهد بود ، مهم نیست که چند بار آن را با خط کش اندازه گیری کنید. مقیاس حمام کمی قابلیت اطمینان است. ممکن است روی آن قدم بگذارید ، 190. 2 پوند را ببینید ، سپس دوباره و دوباره قدم بزنید و 190. 4 پوند را ببینید. این یک مثال خوب از چگونگی پذیرش عدم اطمینان در اندازه گیری است.

البته ، ما هرگز این سطح از دقت را در دنیای اندازه گیری روانشناختی نداریم. حتی یک آزمایش خوب نیز چیزی است که دانش آموز ممکن است امروز 92 ٪ و فردا 89 ٪ دریافت کند (با فرض اینکه ما می توانیم مغز آنها را از سؤالات دقیق پاک کنیم).

قابلیت اطمینان همچنین می تواند به عنوان نسبت واریانس نمره واقعی به واریانس نمره کل تعبیر شود. یعنی همه توزیع نمره آزمون دارای واریانس کلی هستند ، که به دلیل ایجاد علاقه از واریانس تشکیل شده است (یعنی دانش آموزان هوشمند خوب عمل می کنند و دانشجویان فقیر ضعیف عمل می کنند) ، بلکه برخی از واریانس خطا (خطای تصادفی ، بچه ها توجه نمی کنندیک سوال ، بعد دوم در آزمون ... می تواند موارد زیادی باشد.

ارزش خوب آلفا ضریب چیست؟

همانطور که روانشناسان دوست دارند بگویند ، "بستگی دارد."قانون شست که به طور کلی می شنوید این است که مقدار 0. 70 خوب است و زیر 0. 70 بد است ، اما این توصیه وحشتناک است. یک ارزش بالاتر در واقع نشانگر قابلیت اطمینان بالاتر است ، اما شما همیشه به قابلیت اطمینان بالایی احتیاج ندارید. البته آزمایشی برای تأیید جراحان ، سزاوار تمام موارد مورد نیاز برای اطمینان از آن است. هر چیزی زیر 0. 90 وحشتناک خواهد بود. با این حال ، نظرسنجی که از نمایندگی های خودرو انجام می دهید احتمالاً نتایج آماری را مورد تجزیه و تحلیل قرار می دهد ، و قابلیت اطمینان 0. 60 به پایان نمی رسد پایان جهان. این هنوز اطلاعات بسیار بهتری نسبت به عدم انجام نظرسنجی ارائه می دهد!

در اینجا یک تصویر کلی در مورد چگونگی ارزیابی سطح آلفا ضریب آورده شده است.

Coefficient cronbachs alhpa interpretation

خطای استاندارد کلاسیک اندازه گیری

ضریب آلفا نیز اغلب برای محاسبه خطای استاندارد کلاسیک اندازه گیری (SEM) استفاده می شود ، که یک روش مرتبط برای تفسیر کیفیت یک آزمون و دقت نمرات آن را ارائه می دهد. SEM را می توان به عنوان انحراف استاندارد از نمرات که انتظار دارید اگر شخصی بارها و بارها آزمایش را انجام دهد ، تفسیر شود ، در حالی که مغز آنها هر بار از حافظه پاک می شود. اگر آزمون قابل اعتماد باشد ، انتظار دارید که آنها هر بار تقریباً یک امتیاز کسب کنند ، به این معنی که SEM کوچک خواهد بود.

SEM = SD*SQRT (1-R)

توجه داشته باشید که SEM یک تابع مستقیم آلفا است ، به طوری که اگر آلفا 0. 99 باشد ، SEM کوچک خواهد بود و اگر آلفا 0. 1 باشد ، SEM بسیار بزرگ خواهد بود.

ضریب آلفا و یک بعدی بودن

همچنین می توان آن را به عنوان یک اندازه گیری از یک بعدی تفسیر کرد. اگر همه موارد در حال اندازه گیری همان سازه باشند ، نمرات روی آنها تراز می شوند و مقدار آلفا زیاد خواهد بود. اگر چندین سازه وجود داشته باشد ، آلفا کاهش می یابد ، حتی اگر موارد هنوز از کیفیت بالایی برخوردار باشند. به عنوان مثال ، اگر می خواهید داده های ارزیابی شخصیتی پنج بزرگ را با هر پنج دامنه به طور همزمان تجزیه و تحلیل کنید ، آلفا بسیار کم خواهد بود. با این حال اگر شما همان داده ها را گرفتید و آلفا را به طور جداگانه در هر دامنه محاسبه کردید ، احتمالاً بسیار زیاد خواهد بود.

نحوه محاسبه

از آنجا که محاسبه قابلیت اطمینان آلفا ضریب بسیار ساده است ، در صورت نیاز به محاسبه آن از ابتدا ، مانند استفاده از فرمول ها در مایکروسافت اکسل ، می توان به راحتی انجام داد. با این حال ، هر بستر ارزیابی مناسب و یا نرم افزار روان سنجی آن را برای شما تولید می کند. این یکی از مهمترین آمار روان سنجی است.

احتیاط در مورد استفاده بیش از حد

از آنجا که آلفا بسیار راحت است-در حال جوشاندن مفهوم پیچیده کیفیت تست و دقت به یک عدد آسان برای خواندن است-بیش از حد مورد استفاده و بیش از حد قرار می گیرد. در ادبیات مقالاتی وجود دارد که هشدارها را با جزئیات شرح می دهد. در اینجا یک مرجع کلاسیک است.

یک نکته مهم ، ساده سازی بیش از حد دقت با ضریب آلفا و خطای استاندارد کلاسیک اندازه گیری است ، هنگامی که به مفهوم خطای استاندارد مشروط اندازه گیری از نظریه پاسخ مورد توجه می شود. این به این واقعیت اشاره دارد که بیشتر آزمایشات سنتی موارد زیادی از دشواری میانی دارند که آلفا را به حداکثر می رساند. این دانش آموزان از توانایی میانی را کاملاً خوب اندازه گیری می کند. با این حال ، اگر موارد دشواری در آزمون وجود نداشته باشد ، هیچ کاری برای تمایز بین دانش آموزان برتر انجام نمی دهد. بنابراین ، این آزمون آلفای کلی بالایی خواهد داشت ، اما تقریباً برای دانشجویان برتر هیچ دقت ندارد. در یک مثال شدید ، همه آنها 100 ٪ نمره کسب می کنند.

همچنین ، هنگامی که آن را روی ماتریس های پراکنده محاسبه می کنید ، آلفا کاملاً از هم جدا می شود ، زیرا واریانس نمره کل از نظر مصنوعی کاهش می یابد.

خلاصه

در پایان ، ضریب آلفا یکی از مهمترین آمار روان سنجی و به دلایل خوبی است. در بسیاری از موارد بسیار مفید است و به اندازه کافی آسان است که بتوانید آن را با توسعه دهندگان محتوای آزمایش و سایر غیر روانشناسان در مورد آن بحث کنید. با این حال ، مواردی وجود دارد که شما باید نسبت به استفاده از آن محتاط باشید و برخی موارد که کاملاً از هم جدا می شود. در این شرایط ، نظریه پاسخ مورد بسیار توصیه می شود.

ناتان تامپسون ، دکترا ، مدیرعامل و بنیانگذار شرکت سیستم های ارزیابی (ASC) است. او یک روان سنجی ، توسعه دهنده نرم افزار ، نویسنده و محقق و بشارت دهنده برای هوش مصنوعی و اتوماسیون است. مأموریت وی این است که حرفه روان سنجی را با استفاده از نرم افزار برای خودکار سازی کار روان سنجی مانند بررسی مورد ، تجزیه و تحلیل شغلی و مطالعات Angoff بالا ببرد ، بنابراین می توانیم روی کارهای نوآورانه تر تمرکز کنیم. هدف اصلی وی بهبود ارزیابی در سراسر جهان است.< Pan> در نتیجه ، ضریب آلفا یکی از مهمترین آمار روان سنجی و به دلایل خوبی است. در بسیاری از موارد بسیار مفید است و به اندازه کافی آسان است که بتوانید آن را با توسعه دهندگان محتوای آزمایش و سایر غیر روانشناسان در مورد آن بحث کنید. با این حال ، مواردی وجود دارد که شما باید نسبت به استفاده از آن محتاط باشید و برخی موارد که کاملاً از هم جدا می شود. در این شرایط ، نظریه پاسخ مورد بسیار توصیه می شود.

فارکس وکسب درامد...
ما را در سایت فارکس وکسب درامد دنبال می کنید

برچسب : نویسنده : آرش اصل زاد بازدید : 47 تاريخ : جمعه 11 فروردين 1402 ساعت: 14:17