در این طرح، جامعه و جهان مشاهدات قابل قبول (که شامل دو رویه متقاطع است) متقاطع­اند. نمره مشاهده شده هر فرد در یک سوال که توسط یک ارزیاب داده شده است به عوامل زیر تجزیه می­ شود: یک اثر برای میانگین اصلی؛ سه اثر برای فرد، سوال و ارزیاب؛ سه اثر تعاملی دو طرفه (pr، pi، ri) و اثر باقی مانده (تعامل سه طرفه pir باضافه ی خطای تصادفی). واریانس نمره مشاهده شده، در سراسر جامعه­ افراد و سطوح در جهان مشاهدات قابل قبول به هفت مؤلفه واریانس مستقل مطابق زیر تجزیه می­ شود:

( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

نمودار این طرح به صورت زیر نمایش داده می­ شود:
pr
pir
ri
pi
نمودار ۲-۳: طرح ۳
برآورد مؤلفه­ های واریانس
همان­طور که فن و سان (۲۰۱۳) بیان کرده ­اند؛ در هر مطالعه تعداد متفاوتی از مؤلفه­ های واریانس به کار گرفته می­ شود که بستگی به طرح مطالعه و نوع تفسیر اندازه­ها دارد. از مؤلفه­ های واریانس برآورد شده در مطالعه G می­توان جهت برآورد واریانس نمره جهان، واریانس های خطا و ضرایب اعتبار مانند برای جهان تعمیم و طرح­های مطالعه D استفاده کرد. مؤلفه­ های واریانس را می توان با بهره گرفتن از ترکیب نظری میانگین مجذورات که میانگین مجذورات مورد انتظار[۷۹] (EMS) نامیده می شود برآورد کرد. یعنی با بهره گرفتن از روش تحلیل واریانس، میانگین مجذورات MS به­دست آمده برای هر مؤلفه، در معادلات EMS مربوط به آن مؤلفه قرار داده می شود و بدین ترتیب مؤلفه­ های واریانس به دست می آیند. البته با روش­های دیگری همچون بیشینه درست­نمایی نیز برآورد مؤلفه­ های واریانس امکان پذیر است. برای طرح ۱ که پیش از این توصیف شد- طرحی که در آن نمونه ­ای از فرد به سوال پاسخ می­دهد- در قالب جدول زیر فرمول­های مربوط به برآورد هر مؤلفه واریانس (ECV) ارائه می­ شود.
جدول ۲-۴: طرح یک رویه ای i P× مطالعهG – اثرات تصادفی

منبع واریانس MS EMS ECV
فرد ()      
سوال ()      
       

انواع تصمیم و واریانس­های خطا
در یک وضعیت اندازه ­گیری، نوع تفسیر نمره (هنجار در مقابل ملاک­مرجع) تعیین می کند که کدام تصمیم (نسبی یا مطلق) مناسب است و واریانس خطا به طور متفاوتی برای هر نوع از تصمیم تعریف می شود. یک تصمیم مطلق[۸۰] است اگر تصمیم درباره افراد مبنی بر نمراتشان در ارتباط با یک ملاک باشد. به بیانی دیگر، تصمیم مطلق بر روی سطح عملکرد افراد بدون توجه به رتبه­ی آنها متمرکز است و در ارتباط با ثبات جایگاه نسبی افراد و هم ثبات نمرات واقعی است. واریانس خطا برای تصمیم مطلق را با علامت نشان می­ دهند و آنرا واریانس خطای مطلق[۸۱] می نامند که شامل همه مؤلفه­ های واریانس مدل به جز هدف اندازه ­گیری است. این نوع واریانس بیانگر تفاوت میان نمره مشاهده شده و نمره جهان فرد است. یک تصمیم نسبی[۸۲] است اگر تصمیم درباره افراد مبتنی بر جایگاهشان در ارتباط با دیگران باشد. این نوع تصمیم بر روی تفسیر نمره هنجار­مرجع متمرکز است. یعنی نمرات اندازه ­گیری برای متمایز کردن آزمودنی­ها به کار می­روند. اعتبار اندازه ­گیری در این حالت مربوط به ثبات جایگاه نسبی افراد است نه در مورد ثبات نمرات واقعی. واریانس خطا برای تصمیم نسبی را با علامت نشان می دهند و آن را واریانس خطای نسبی[۸۳] می­نامند. این نوع واریانس شامل همه ی مؤلفه­ های واریانس تعاملی است که هدف اندازه ­گیری را در بر می­گیرد. واریانس خطای نسبی به صورت تفاوت میان نمره انحرافی مشاهده شده شخص[۸۴] و نمره انحرافی جهان[۸۵] او تعریف می­ شود. این نوع واریانس مشابه واریانس خطا در CTT است. ریشه دوم واریانس­های خطا (نسبی و مطلق)، برآوردی از خطای استاندارد اندازه ­گیری (نسبی و مطلق) است که می­توان از آن در جهت ساخت فواصل اطمینان حول نمره جهان فرد استفاده کرد.
در کل واریانس خطای نسبی کمتر از واریانس خطای مطلق است زیرا شامل مؤلفه­ های واریانس کمتری است. این نشان می­دهد که تفسیر­های نسبی در مورد نمرات افراد نسبت به تفسیرهای مطلق کمتر مستعد خطا هستند. در شکل زیر، تفاوت میان خطای مطلق و خطای نسبی طرح P×I نشان داده شده است. قسمت­ های هاشور خورده، سهم واریانس خطا تحت سطوح مختلف است.
خطای مطلق خطای نسبی
نمودار ۲-۴: سهم واریانس خطای نسبی و مطلق در طرح یک رویه­ای متقاطع
واریانس خطا برای این طرح در صورتی که تصمیم نسبی باشد :
همچنین، واریانس خطا برای تصمیم­های مطلق به صورت زیر تعریف می­ شود:

اگر رویه موجود در طرح، رویه سوال باشد؛ تعداد سوالات تعریف شده در مطالعه D است (برنان، a 2010؛ وب و شیولسون، ۲۰۰۵؛ فن و سان، ۲۰۱۳).
انواع ضرایب
هنگامی که در مورد مفهوم­سازی خطا (نسبی در مقابل مطلق) تصمیم گرفته شد، سطوح اندازه ­گیری مختلفی در سنجش اعتبار به کار می­رود. ضریب اعتبار و محاسبه آن بستگی به مفهوم­سازی خطای از پیش تعیین شده به عنوان مطلق یا نسبی دارد. به بیان دیگر، GT میان دو نوع ضریب اعتبار تمایز می­ گذارد:
اولین، ضریب تعمیم­پذیری (ضریب G) است و زمانی به کار می­رود که تصمیم­ها نسبی هستند. این ضریب، همه منابع خطایی که جایگاه نسبی افراد را تحت تأثیر قرار می­دهد (تعاملات هر رویه با هدف اندازه ­گیری) را در بر می­گیرد. ضریب G را با علائم یا نمایش می­ دهند و فرمول آن به صورت زیر می­باشد:
دومین، شاخص اتکاپذیری () است و برای تصمیم­های مطلق به کار می­رود. این شاخص، همه مؤلفه­ های واریانس به غیر از هدف اندازه ­گیری را در بر می­گیرد و به صورت زیر فرمول­بندی می­ شود:
تفاوت ضریب تعمیم پذیری و شاخص اتکاپذیری در این است که اولی شامل واریانس خطای نسبی و دومی شامل واریانس خطای مطلق است. بنابراین شاخص اتکاپذیری عموماً کمتر از ضریب تعمیم­پذیری است(همان منبع).

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...