چکیده:
در بسیاری از نظامهای آماری، نوعی از آمارگیری موسوم به « آمارگیری مکرر » و یا « نمونهگیری در طول زمان » متداول است که به شکلی مستمر در دورههای زمانی تکرار میشود. چنین آمارگیریهایی، اغلب بهصورت یکی از روشهای « مقطعی مکرر »، « چرخشی » و « پانلی » اجرا میشود. آمارگیری پانلی روشی است که در آن به نمونهای ثابت در دورههای زمانی مختلف مراجعه میشود. در آمارگیریهای پانلی علاوه بر بیپاسخی قلم اطلاعاتی، نوع دیگری از بیپاسخی تحت عنوان « بیپاسخی دوره » نیز وجود دارد؛ بیپاسخی دوره هنگامی رخ میدهد که دادههای پانلی یک واحد نمونهای برای یک یا چند دوره، گمشده باشند و حداقل برای یک دوره به دست آمده باشند. زمانی که مشاهدات مکرر برای واحدهای نمونهای در طول زمان وجود دارد، براورد تغییر بین دورهها دارای اهمیت زیادی است. از این رو، نمیتوانیم تغییرپذیری براوردها را منحصرا توسط روشهای جانهی براساس اطلاعات مقطعی براورد کنیم، یا نمیخواهیم میزان تغییرپذیری براوردهای تغییر با جانهی توسط اطلاعات دربارهی یک واحد نمونهای کاهش پیدا کند. بنا بر این بهطور مشخص از روشهایی استفاده میشود که در آنها به دورههای بعد یک آمارگیری پانلی برای ترکیب کردن با اطلاعات جمعآوریشده در دورههای قبل نیاز دارد که از آن جمله میتوان روش جانهی « لیتل-سو » را بهعنوان یک روش مفید نام برد. در این مقاله انواع آمارگیری پانلی و بیپاسخی دوره درنظرگرفته میشود و سپس روشهای جانهی لیتل-سوی پایه و نزدیکترین همسایه معرفی میشوند. سرانجام با شبیهسازی یک آمارگیری پانلی سهدورهای، اثر بهکارگیری جانهی لیتل-سو در مقایسه با جانهی نزدیکترین همسایه بر روی کارایی و قدر مطلق اریبی آمارهی مورد نظر (با توجه به اثر اندازهی نمونه، همبستگی بین دادههای دورهها و نرخ بیپاسخی دوره) مورد ارزیابی قرار میگیرد. نتایج این مطالعهی شبیهسازی نشان میدهد که روش جانهی لیتل-سو در اغلب موارد عملکرد بهتری نسبت بهروش جانهی نزدیکترین همسایه دارد.
A type of survey called “repeated survey” or “sampling over time” which is repeated continuously during time periods is common in many statistical systems. Such surveys are often performed in one of the forms of repeated cross-sectional، rotation، or panel surveys. Panel survey is a method in which a “fixed sample” is contacted during different waves. In panel survey، there is another type of non-response in addition to item non-response called “wave non-response”. Wave non-response occurs when one or more waves of the panel data are missing for a unit for which information has been provided for at least one wave.When repeating observations on units over time، estimate of parameters change between waves are very important. Therefore، neither can we introduce the variability of the estimates of change by imputing solely based on cross-sectional information، nor would we like to decrease the variability of the change estimates by imputing using information of one sample unit. Clearly، the imputation techniques used in the subsequent waves of a panel survey are needed to incorporate the information collected in previous waves، among which “Little-Su imputation” can be named as a useful method. In this paper، types of panel surveys and “wave non-response” are studied، and “basic Little-Su” and “nearest neighbor” imputation methods are introduced. Finally، the effects of application of Little-Su imputation on efficiency and absolute bias of the statistic of interest are assessed by simulating a three-wave panel survey، and the method is compared to the nearest neighbor imputation (with respect to sample size effect، wave non-response rate، and correlations between waves). The results of this simulation study show that most of the times the “Little-Su” method gives more reliable estimates than the nearest neighbor imputation method.
خلاصه ماشینی:
سرانجام با شبیهسازی یک آمارگیری پانلی سه دورهای،اثر به کارگیری جانهی لیتل-سو در مقایسه با جانهی نزدیکترین همسایه بر روی کارایی و قدر مطلق اریبی آمارهی مورد نظر(با توجه به اثر اندازهی نمونه، همبستگی بین دادههای دورهها و نرخ بیپاسخی دوره)مورد ارزیابی قرار میگیرد.
,2,1 i و 3,2,1 t نشان دهندهی متغیر مورد نظر برای واحد نمونهای i ام در دورهی t ام باشد،آنگاه تحت فرض نرمال بودن متغیر مورد نظر در هر دوره و وجود همبستگی مثبت )P( میان دورهها از توزیع نرمال سهمتغیره برای تولید دادههای پانلی جامعه استفاده میشود؛ (به تصویر صفحه مراجعه شود) که در آن(به تصویر صفحه مراجعه شود)و(به تصویر صفحه مراجعه شود)به ترتیب بردار میانگین و ماتریس واریانس-کوواریانس مربوط به سه دورهی آمارگیری پانلی و P همبستگی میان پاسخهای به دست آمده در هر دو دوره است که ثابت فرض میشود.
(به تصویر صفحه مراجعه شود) 6-نتیجهگیری 1-بر اساس معیارهای مقایسه میتوان گفت؛روش لیتل-سوی پایه برای دادههای پانلی و براورد میانگین تغییر و کاهش اثرهای نامطلوب بیپاسخی دوره با گمشدگی تصادفی به جز موارد(0/1 rn ،100 n و 0/4 P( و (0/1 rn ،500 n و 0/4 P( نسبت به روش نزدیکترین همسایه عملکرد بهتری دارد.
در واقع اگر هدف، یافتن روش جانهی مناسب برای یک آمارگیری پانلی و در جهت تعدیل اثر بیپاسخی دوره با گمشدگی تصادفی بر اساس یافتههای موجود و معیارهای مقایسه باشد؛راهکار پیشنهادی،استفاده از روش جانهی لیتل-سوی پایه در مقایسه با روش نزدیکترین همسایه میباشد.