۴- مدل منطقی چهار پارامتری
بعضی اوقات آزمودنی های توانمند به سوالات آزمون، حتی اگر ساده باشند، به درستی پاسخ نمی دهند این آزمودنی ها ممکن است بی دقت باشند یا اطلاعاتی ورای آنچه که نویسنده سوال در نظر داشته، رخ می دهد. برای رفع این مشکل بارتون و لرد(۱۹۸۱) [۴۰] مدل لوجستیک چهار پارامتری را ارائه کردند. که تفاوت آن با مدل منطقی سه پارامتری در وجود y است که مقدار آن اندکی کمتر از ۱ است بدین معنی که ICC می تواند یک مجانب[۴۱] فوقانی کمتر از یک داشته باشند. این مدل احتمالاً جذابیت نظری دارد زیرا بارتون ولرد نتوانستند هیچ بهره علمی از به کارگیری مدل بیایند. معادله برآورد احتمال پاسخ صحیح این مدل بدین صورت است (همبلتون ، ۱۹۹۱).

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

برآورد پارامترها با بهره گرفتن از روش بیشینه احتمال
در یک شرایط نمونه، N امتحان شونده که دارای صفت مکنونی (مثل توانایی) هستند مورد آزمون قرار می گیرند و ضرورتاً توزیع آنها در پیوستار آن صفت مکنون مبتنی بر هیچ مفروضه ای نیست (لرد و ناویک، ۱۹۶۸). هر یک از این امتحان شونده ها به n سوال تست پاسخ می دهد و پاسخ به صورت دو ارزشی نمره گذاری می شود:

که در آن i=1,2,…n معرف سوال و j=1,2, … N معرف امتحان شونده است. برای هر امتحان شونده یک بردار پاسخ به طول n وجود دارد که با  نشان داده می شود. طبق مفروضه استقلال موضعی، برای تمام امتحان شوندگانی که از نظر آن صفت در یک سطح مشابه قرار دارند. Uij به گونه آماری مستقل خواهد بود. برای هر امتحان شونده یک چنین برداری وجود دارد، بنابراین در مجموع N بردار این چنین خواهیم داشت. در نتیجه برای نشان دادن ماتریس N.n پاسخ های سوال از علامت U=//uij// استفاده می کنیم.
اگر  ، معرف توانایی N آزمودنی در صفت مکنون باشد احتمال U به وسیله تابع احتمالی زیر نشان داده می شود:

اگر چه این شکل از تابع احتمال در پیشینه های مطالعاتی فراوان مورد استفاده قرار گرفته، کاربرد آن از لحاظ محاسباتی خیلی مطلوب نیست زیرا عملیات مربوط به احتمال پاسخ درست به هر سوال برای هر فرد باید به طور جداگانه محاسبه شود. یک روش با صرفه تر این است که امتحان شوندگان را به k گروه بر اساس نمره های صفت  تقسیم بندی کنیم. از  امتحان شونده که در صفت مکنون مورد نظر  دارای جایگاه یکسانی هستند، اعداد  پاسخ درست و تعداد  -  پاسخ نادرست به سوال i در نظر گرفته می شود چنانچه  ماتریس n.k که پاسخهای درست مشاهده از تست را نشان دهد. احتمال رخداد ماتریس R به طریق زیر مشخص می شود:

و لگاریتم طبیعی ان عبارتست است:

C مقدار ثابتی است.
اکنون  تابع پارامتر h خم ویژه سوال (ICC) و   است. به این دلیل که پارامترهای h مربوط به هر یک از n سئوال و پارامترهای  مربوط به هر یک از N امتحان شونده نامعلوم است ، این پارامترها باید از روی اطلاعات مربوط به پاسخ های سوال به گونه همزمان برآورد شود. روشی که معمولاً برای برآورد این پارامترها به کار می رود توسط برن بام (۱۹۶۸) ارائه شده است. وی روش دو مرحله ای از سرگیری را برای برآورد پارامترها از طریق بیشینه احتمال مشترک ارائه نمود.
نظریه سوال پاسخ همانند یک ابزار اندازه گیری، به تبیین تمام خصوصیات آزمون، تحت عنوان ویژگی های سوالات آزمون می پردازد۰ این نظریه دارای کاربردهای عملی زیر است۰
۱-برآورد پارامترهای نا متغییر هرسوال آزمون؛ بانک سازی سوال
۲-برآورد ویژگی های هر آزمون برای هر گروه ویژه
۳-تعیین چگونگی کارآمدی یک نوع آزمون برای سطوح متفاوت توانایی
۴-مقایسه کارآمدی روش های مختلف نمره گذاری یک آزمون
۵-انتخاب سوال برای ساخت یک آزمون متداول مرسوم
۶-طرح مجدد یک آزمون متداول
۷-طرح و ارزیابی آزمون های درحد تسلط یا چیرگی
۸-طرح و ارزیابی روش های آزمون بدیع، همانند آزمون های چند سطحی، آزمون دو مرحله ای، آزمون های برازش یافته و آزمون های سطح انعطاف پذیر
۹-همتراز سازی وپیش همتراز سازی
۱۰-مطالعه تورش سوال (لرد، ۱۹۸۰)۰
موکن ولوئیز به توصیف یک طبقه جدیدی ازمدل سوال- پاسخ که فرم ریاضی ICC آن تعیین نشده بود،پرداختند. تنها مفروضه مربوط به سوالات این مدل این است که ICC دارای یک تابع تکنوای ازتوانایی است. لرد(۱۹۸۰)تنها محقق دیگری است که برای داده های این نوع مدل فرمولی تدوین نمود.موکن ولوئیز برای برآورد پارامترتوانایی وتوسعه آزمون به بررسی مدل های جدیدپرداختند(همبلتون ولیندن،۱۹۸۲).
بوک ومیسلوی، به توصیف برآورد پارامترها پرداختند وبرای بررسی فعالیت های گذشته خودEPA(برآوردکننده یک برآوردشده قبلی) راتوصیف نمودند(ثرندایک، ۱۹۸۲؛ ترجمه هومن، ۱۳۷۵).
دوکاربرد مهمIRT که مورداستفاده فراوان داردعبارتنداز: همترازسازی وسنجش انطباقی.
لردبراساس IRT که برای خطای استاندارد روش همترازسازی نمره حقیقی فرمولی رافراهم ساخت. اوسپس فرمول جدید خودرابرای مقایسه چندین روش همترازسازی به کار برد وکیفیت نمرت همتراز شده را با بکارگیری آزمون های لنگر(باطول های متغییر) بررسی نمود.دیوید ویس یک دیدگاه تاریخی ازسنجش انطباقی فراهم نمود وچندین مطالعه تحقیق را توصیف نمود. این مطالعات خطوط اساسی موفقیت درارتباط با به کارگیری سنجش انطباقی هنگامی که برای دو مسئله اندازه گیری وطبقه بندی به کارمی رود توصیف نمود(همبلتون ولیندن، ۱۹۸۲).
درمدل IRT (تئوری سؤال – پاسخ) توانایی یا سطح صفت مکنون فرد، با درنظرگرفتن پارامتر شیب، دشواری و حدس مشخص می شود وسهمی که هرسوال درتوانایی فرد دارد بسته به پارامترهای سوال متفاوت خواهدبود به طوری که اگر دو نفر تعداد پاسخ های مناسبی داشته باشند الزاماً برآورد توانایی آنها یکی نخواهد بود زیرا به سوال های خاصی که هرکدام پارامترهای خاص خود را دارند، پاسخ داده اند.
بنابراعتقاد بیکر(۱۹۸۷) باید به کارکردن بر روی مفاهیم IRT این انگیزه را درمعلم ها ایجاد کنیم که توجه خود را از مدل های کلاسیک تست به مدل های سوال- پاسخ معطوف گردانند. زیرا درنظریه سوال- پاسخ بین سوال های فرد وبین عملکرد اودر سوال نوعی ارتباط منطقی برقرار است. علاوه براین برای هرسطح از نمره حقیقی وسطحی توانایی هرآزمودنی یک خطای استاندارد دارد و ازآنجایی که پارامترهای برآورد شده برای سوالات تغییر ناپذیرند، می توان براساس همین از این پارامترها برای افرادی که حتی قبلاً به سوالات پاسخ نداده اند پیش بینی کرد(همبلتون، ۱۹۸۰).
همترازسازی تست
در بسیاری از موقعیت ها برای آزمون های روانشناختی و علوم تربیتی و هوشی و استخدامی و غیره فرمهای چندگانه ای از یک تست ، برای سنجش توانایی ، پیشرفت ، قدرت، یا هر چیز دیگری تهیه می شود. وقتی روی افراد چندین فرم از یک تست اجرا می شود در واقع می خواهیم توانایی یکسانی را اندازه گیری کنیم، و قادر به مقایسه نمرات حاصل از آزمون این اشخاص باشیم. با کاربرد تست های موازی می توان عمل مقایسه را بطور سر راست انجام داد ، چون بنا به تعریف تست های موازی محتوای مشابه و مشخصات آماری مشابهی (مثل میانگین، انحراف، استاندارد و اعتبار برابر ) را اندازه گیری می کنند. به عبارت دیگر، نمرات روی تست های موازی به طور کامل قابل مبادله هستند و با وجود فرم های موازی دیگر مشکل خاصی برای مقایسه نمرات اتفاق نمی افتد. هر چند در ساخت آزمون های موازی سعی بر یکسانی محتوا و ویژگی های آماری مشابه سوال است ولی در عمل وجود تفاوت در برخی از ویژگی های آماری ذکر شده اجتناب ناپذیر است به ویژه آن که مقداری تفاوت در درجه دشواری فرم ها ، در نتایج حاصل می تواند تأثیر به سزایی داشته باشد. در این صورت داده های حاصل از این فرم ها قابل مقایسه نیستند. بنابراین، قبل از مقایسه کردن نمرات اشخاص یا آزمودنی ها در فرم های چندگانه همان تست ، ضروری است تا یک موازنه موثری بین نمرات خام بدست آمده از فرم های چندگانه یک تست ایجاد کنیم. این مساله همتراز سازی است (رویتر و کمپ، ۲۰۰۳).
همتراز سازی یک روش یا فرایند آماری است ، برای تعدیل کردن نمرات روی فرم های آزمون به طوریکه نمرات روی فرم های مختلف، به صورت قابل تعویض مورد استفاده قرار گیرند. همتراسازی، اختلاف های درجه دشواری بین فرم هایی را تعدیل می کند که با هدف یکسان بودن از نظر محتوا و درجه دشواری ساخته شده اند (کولن و برنان، ۱۹۹۵).
معادل سازی آزمون ها، نمرات حاصل از فرم های مختلف را به نمرات یکی از فرم ها یا به نمرات یک فرم مرجع به گونه ای تبدیل می کند که گویی همه افراد به سوالات یک فرم پاسخ داده اند و نمرات همتراز شده تحت تأثیر درجات دشواری فرم ها نخواهند بود.
جهت درک بیشتر مفهوم همتراز سازی با یک مثال پیش می رویم، فرض می کنیم یک شرکت تولید خودرو جهت استخدام کارکنان خود نمره حاصل از یک آزمون را ملاک قرار داده است ولی آزمون را دو بار در سال و با فرم های مختلف برگزار نماید. هر یک از اشخاص می توانند در یکی از آزمون ها شرکت نمایند، دو نفر را در نظر بگیرید که در دو زمان مختلف در آزمون شرکت نموده اند و نفر شماره ۱ نمره بالاتری نسبت به نفر شماره ۲ بدست آورده است اختلاف نمرات حاصل را این گونه می توان تفسیر نمود که دواطلب شماره ۱ توانایی بیشتری نسبت به داوطلب شماره ۲ داشته است. در حالیکه اگر داوطلب شماره ۱ آزمون ساده تری را امتحان داده باشد از یک مزیت غیر منصفانه نسبت به داوطلب شماره ۲ سود برده است در این صورت اختلاف نمره دو داوطلب به خاطر تفاوت در دشواری فرم های آزمون بوده است تا تفاوت در سطوح توانایی افراد.
به همین صورت چنانچه یک فرد در دو آزمون که برای یک هدف خاص تهیه شده اند شرکت کند و نمره بدست امده در آزمون دوم بیشتر شود این افزایش نمره ممکن است به علت پیشرفت یا تست آشنایی و یا به علت ساده تر بودن سوالات آزمون مرتبه دوم حاصل شده باشد. برای رفع این مشکل از همتراسازی نمرات فرم ها استفاده می شود. نکته قابل ذکر این است که همترازسازی اولاً برای فرم های بکار می رود که با قصد یکسان بودن از نظر محتوا و ویژگی های آماری ساخته شده است، ثانیاً همتراز سازی اختلاف در درجه دشواری فرم ها را تبدیل می کند نه تفاوت در محتوا را.
ویژگی ها و پیش نیازهای همتراز سازی
همتراز سازی در معنای دقیق ، تنها موقعی میسر است که همه تست های مورد بحث به گونه ای یکسان، شاخص دقیق یک نوع خصیصه ثابت باشد. مقصود این است که فرم های مختلف تست باید دارای یک ضریب اعتبار یا ترجیحاً دارای یک خطای استاندارد اندازه گیری ثابت برای هر زوج از نمره های معادل بوده و همه آنها نیز با شاخصی از هر خصیصه معین دیگر همبستگی ثابتی داشته باشد. به گونه کلی شرایط مذکور فقط موقعی حاصل می شود که طول همه تست ها یکسان بوده و بین میانگین و انحراف استاندارد آنها نیز تفاوت محسوسی وجود نداشته باشد (ثراندیک، ۱۹۸۳، ترجمه هومن، ۱۳۷۵).
انگلف [۴۲](۱۹۷۱) چهار پیش نیاز را که قبل از اجرای هر شیوه همترازسازی کلاسیک باید تحقق یافته باشد بدین نحو بیان می دارد:
۱- فرم ها باید یک ویژگی واحد را اندازه گیری نمایند.
۲- تبدیلاتی که برای انتقال یک فرم به فرم دیگر بکار برده می شوند باید مستقل از داده هایی باشند که تبدیلات از آنها بدست آمده اند.
۳- نمرات دو فرم باید بعد از همتراز سازی قابل تبدیل به یکدیگر باشند.
۴- همتراز سازی باید متقارن[۴۳] باشد ، یعنی اینکه نباید مهم باشد کدام فرم بعنوان فرم اولی استفاده شده است.
توجه داشته باشید که اولین پیش نیاز از ما می خواهد که دو فرم ویژگی واحدی را اندازه گیری نمایند، اما این امر بدان معنا نیست که قابل اسناد به یک بعد باشد. یک بعد باشد. یک بعدی بودن یکی از پیش نیازهای روش های همتراز سازی IRT است. بنابراین می توان گفت روش های همتراز سازی IRT دارای محدودیت های سخت تری را بکار می بریم، شرط استقلال تبدیلات از داده هایی که تبدیلات از آنها مشتق شده اند ممکن است در عمل بخوبی تحقق نیابد. خصوصاً وقتی که گروه هایی که فرم های مختلف را امتحان داده اند نمونه های تصادفی از جامعه نباشند. در این حالت تبدیلات داده ها وابسته هستند. اما مفروض قابل تعویض بودن نمرات صرفاً زمانی مصداق پیدا می کند که فرم های آزمون دارای پایایی های مشابهی باشند.
در متون روش شناسی IRT ، لرد [۴۴](۱۹۸۰) با بسط پیش نیازهای انگف مفروضه های همتراز سازی به روش IRT[45] را سازماندهی می کند . این پیش نیازها عبارتند از:
۱- دو فرم باید ویژگی واحدی را اندازه گیری نمایند.
۲- برای هر گروه از آزمودنی ها که دارای توانایی مشابهی هستند ، توزیع فراوانی شرطی نمرات بر روی فرم دوم بعد از انتقال ، باید مشابه توزیع فراوانی شرطی نمرات بر روی فرم اولیه باشد. این شرط عموماً با نام شرط برابری [۴۶] شناخته می شود. در تفسیر این ویژگی می توان گفت که برای هر آزمودنی در هر سطح توانایی فرقی نمی کند که کدام فرم را امتحان می دهد.

    1. تبدیلات بدون توجه به گروهی که از آن مشتق شده است باید برای همه گروه ها یکسان باشد.
    1. تبدیلات باید معکوس شدنی باشد، یعنی تابعی که نمرات فرم اول را به نمرات فرم دوم انتقال می دهد باید با تابعی که نمرات فرم دوم را به فرم اول انتقال می دهد یکی باشد.

این ویژگی که با نام اصل برابری معروف ست ضرورت های زیر را ایجاب می کند؛

    1. آزمون هایی که ویژگی های مختلف را اندازه گیری می نمایند نمی توانند همتراز شوند.
  1. نمرات خام آزمون هایی که ضرایب پایایی مشابهی ندارند قابل همتراز نیستند.
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...