چکیده:
آزمونهای مرکب شامل چند خردهآزمون هستند که ممکن است به لحاظ محتوا و تعداد پرسشها متفاوت باشند. برای تفسیرپذیری بهتر و مقایسهپذیر کردن نمره خردهآزمونها، نمره خام بهدست آمده از خردهآزمونها به مقیاس مشترکی تبدیل میشود که به آن نمره مقیاس گفته میشود. یکی از روشهای مرسوم تبدیل نمرههای خام به نمرههای مقیاس، تبدیل مقیاس نرمال است. در این تبدیل از فراوانی تراکمی و رتبه درصدی هر نمره برای ساختن نمره مقیاس استفاده میشود. هدف این پژوهش، بررسی اثر بهکارگیری روش پیشهموارسازی فراوانی نمرهها و پسهموارسازی آنها بر میزان خطای استاندارد اندازهگیری شرطی نمرههای مقیاس است. برای بررسی این اثر از 10000 داده شبیهسازی شده و 10000 داده واقعی آزمون سراسری ایران در گروه آزمایشی ریاضی و فنی در سال 1395 بهره گرفته شد. همچنین از روشهای هموارسازی دو جملهای کرنل و هموارسازی اسپلاین به ترتیب برای هموار کردن فراوانی نسبی نمرهها و نمرههای مقیاس استفاده شد. برای مقایسه نمرههای مقیاس ساخته شده از خطای استاندارد اندازهگیری شرطی نمرهها بهره گرفته شد. نتایج پژوهش، نشاندهنده مقدار بالای ضریب پایایی برای همه روشها بود. ضمن اینکه تحلیل نمودار و میانگین خطای استاندارد اندازهگیری شرطی نشان داد که در آن دسته از روشهای تبدیل نمرههای خام به نمرههای مقیاس که از پیشهموارسازی فراوانی، استفاده شده است، میانگین خطای استاندارد اندازهگیری شرطی کمتر بوده و استفاده از پیشهموارسازی تا حد مطلوبی نوسان خطا برای سطوح مختلف نمرهها را کاهش داده است.
In order to the better interpreting and comparing scores in test batteries the raw scores in each test are converted to a common scale that called scale score. One of the prevalent methods to transform raw scores to scale scores is normalizing. In this research to investigate the role of frequency pre-smoothing and score post-smoothing in normalizing scaling method we used 10000 random simulated sample data and 10000 random real sample data from Iran university entrance exam applicants. The role of smoothing methods in normal scaling method has been analyzed by conditional standard error of measurement that called CSEM, frequency charts and statistical indexes like moments. The results showed that reliability coefficient for all scaling methods are high, but analyzing charts, moments and conditional standard error of measurement illustrated that normalized scale score obtained from the frequencies smoothing method are the more accurate and fewer errors, Furthermore using pre-smoothing lead to reduce score error undulation.
خلاصه ماشینی:
هدف اين پژوهش ، بررسي اثر به کارگيري روش پيش هموارسازي فراواني نمره ها و پس هموارسازي آنها بر ميزان خطاي استاندارد اندازه گيري شرطي نمره هاي مقياس است .
ضمن اينکه تحليل نمودار و ميانگين خطاي استاندارد اندازه گيري شرطي نشان داد که در آن دسته از روش هاي تبديل نمره هاي خام به نمره هاي مقياس که از پيش هموارسازي فراواني ، استفاده شده است ، ميانگين خطاي استاندارد اندازه گيري شرطي کمتر بوده و استفاده از پيش هموارسازي تا حد مطلوبي نوسان خطا براي سطوح مختلف نمره ها را کاهش داده است .
هدف از توليد داده هاي شبيه سازي در اين پژوهش : ١- بررسي اوليه ويژگيهاي آزمون مانند خطاي استاندارد اندازه گيري شرطي نمره هاي مقياس ، ضريب پايايي و همچنين رابطه آنها و روش هاي هموارسازي؛ ٢- تعيين مقدار بهينه پارامترهاي هموارسازي مانند h و ٣- مبنايي براي بررسي صحت محاسبات و تحليل داده هاي واقعي است .
با توجه به هدف اين پژوهش که بررسي تأثير هموارسازي بر خطاي استاندارد اندازه گيري شرطي نمره هاي ساخته شده به روش تبديل مقياس نرمال است به پرسش هاي پژوهش پاسخ داده شد.
Conditional Scale- Score Standard Errors of Measurement under Binomial and Compound Binomial Assumptions.
Conditional standard errors of measurement of scale scores.
Smoothing methods for estimating test score distributions.
Test Equating, Scaling and Linking, 3rd Ed. New York: Springer.
Estimators of Conditional Scale-Score Standard Errors of Measurement: A Simulation Study.
A Comparison of Three Methods for Computing Scale Score Conditional Standard Errors of Measurement.