چکیده:
دادههای گمشده پدیده رایج مطالعات تجربی و سنجشهای آموزشی و روانشناسی هستند که به هرگونه بدون پاسخ ماندن سوال اطلاق میشود. روشهای آماری بسیاری برای محاسبات مجموعه دادههای دارای پاسخ گمشده وجود دارد که تحت تاثیر مکانیسم گمشدگی، علل و میزان آنها هستند. هدف از نگارش این مقاله، بررسی وضعیت موجود دادههای گمشده در آزمون سراسری ورودی دانشگاههاست. با استفاده از روشهای آمار توصیفی و نرمافزارهای SPSS و R نشان داده شد میزان دادههای گمشده در سالهای مورد بررسی افزایش یافته است (در دامنهای بین 2. 2% تا 91. 6%) و شاخصهای آماری آزمون تحت تاثیر میزان دادههای گمشده قرار دارد. همچنین نشان داده شد همبستگی مثبت و بالایی بین تعداد پرسشهای بدون پاسخ در درسهای مختلف (r=0. 41, 0. 78)؛ و همبستگی منفی و بالایی بین تعداد پاسخهای درست و تعداد پاسخهای گمشده (r=-0. 56, -0. 85) وجود دارد. نتایج به دست آمده از این مقاله، نشان از ثبات رخداد دادههای گمشده در ابعاد مختلف شایستگی و غیرقابل اغماض بودن دادههای گمشده در تحلیلهای آماری دارد.
Missing data that refer to any non-answering to items is a common phenomenon of empirical studies, educational and psychological assessments. Different statistical methods for dealing with nonresponse data are affected by the mechanism of missing-ness, their causes and their extent. The purpose of this article is exploring and describing the missing data in the university entrance national exam. Data for General Persian Literature Test of mathematical, Empirical and humanity Science fields and professional tests including literature in humanity filed, biology in empirical field and mathematics in math field in 1383, 1391 and 1395 (Solar years) used for this purpose. Analysis was done by SPSS, R and ‘psych’ package in R. It is shown the amount of missing data has increased in the years under review (min 2.2% and max 91.6%). Under amusingness condition item difficulties are overestimated. It is also shown that there is a high positive correlation between the number of non-answered items in different test of the same year (rmin = 0.41 and rmax=0.78); and the high negative correlation between the number of correct responses and missing answers (rmin = -0.56 and rmax =-0.85). The results of show occurrence of missing data in various competence dimensions and non-ignorable of missing data in statistical analyzes. It is necessary to select and use appropriate method for missing data when analyzing data for university entrance national exam.
خلاصه ماشینی:
Graham, Taylor, Olchowski & Cumsille 8.
Thomas, Raghunathan, Schenker, Katzoff & Johnson 2.
Frey, Hartig & Rupp 3.
Fitzmaurice, Davidian, Verbeke & Molenberghs 4.
Mullis, Martin & Diaconu 10.
Rose, von Davier & Xu براي مديريت دادههاي گمشده اين است که با استفاده از طراحي مناسب مطالعه ، وسايل اندازه گيري و دستورالعمل ها، مانع رخ دادن آنها شويم (مک نايت ، مک نايت و فيگوردو ١، ٢٠٠٧)، ايجاد روش هاي جايگزين براي سؤالهاي بدون پاسخ ، به منظور به دست آوردن نتايج پايا در آزمودن روان شناسي و آموزشي حياتي است .
Pohl, Haberkorn, Hardt & Wiegand (رجوع شود به تصویر صفحه) نمودار (١) درصد پاسخ هاي صحيح و گمشده ادبيات عمومي در سال هاي مختلف هر رشته .
الف ١(رشته انساني )، الف ٢(رشته تجربي )، الف ٣(رشته رياضي و فيزيک )- ب١ (ادبيات تخصصي ، انساني )، ب٢ (زيست شناسي ، تجربي )، ب٣ (رياضيات ، رياضي وفيزيک ) (گمشده ـــ صحيح ـــ) با توجه به اينکه پاسخ هاي گمشده در آزمون هاي مقياس بزرگ آموزشي ازجمله آزمون ورودي دانشگاه ، از نوع پاسخ هاي حذف شده و پاسخ داده نشده به دليل محدوديت زماني است ؛ جدول (٣) درصد اين دو نوع پاسخ گمشده را در درس هاي انتخابي و سالهاي مختلف نشان ميدهد.
Schmidt, Wolfe & Kifer 3.
Modelling non-ignorable missing-data mechanisms with item response theory models.
Omitted and not-reached items in mathematics in the 1990 National Assessment of Educational Progress (CRE Technical Report 347).
Modeling nonignorable missing data with item response theory (IRT) (ETS Research Rep. no.