خلاصة:
پژوهش حاضر با استفاده از روشها و ابزارهای زبانشناسی پیکرهای، به سنجش میزان همپوشانی و انطباق واژههای ارائه شده در کتابهای آموزش زبان فارسی به غیرفارسیزبانان، با پُربسامدترین واژههای زبان فارسی، میپردازد. بدین منظور، براساس متنهای موجود در پایگاه دادههای زبان فارسی، یک پیکرهی زبانی متوازن طراحی شد و پُربسامدترین واژههای آن بهعنوان مبنای کار قرار گرفت. همچنین، سه عنوان از کتابهای پرکاربرد در مراکز آموزش زبان فارسی به غیرفارسیزبانان، انتخاب شدند. بر همین اساس، 5000 واژهی پُربسامد هر یک از کتابهای مذکور، به پنج گروهِ هزارواژهای دستهبندی شد و هر یک از این گروهها به مثابهی یکی از سطوح زبانآموزی تلقی گردید. درنهایت، گروههای پنجتاییِ فهرست واژگانی هر کدام از کتابها با گروههای متناظر با آنها در فهرست واژگانی پیکرهی زبانی مرجع/ مبنا مورد مقایسه قرار گرفت. نتایج و یافتههای پژوهش نشان داد که بهلحاظ سطوح زبانآموزی، میزان همپوشانی واژگانیِ هر یک از پنج گروه هزارواژهای برگرفته از کتابها با گروههای متناظر آنها در پیکرهی مبنا بسیار پایین است؛ حتی در گروه اول که انتظار میرود به دلیل حضور تعداد زیادی از واژههای نقشی در آن، همپوشانی واژگانی به سمت %100 میل کند، در بالاترین میزانِ همپوشانی (یعنی در کتاب رسولی/ جامعهالزهرا) این همپوشانی حدود %55 بود. در سایر سطوح واژهآموزی، مثلاً گروه پنجم، میزان همپوشانیِ واژگانی با پیکرهی مبنا، حتی به زیر %2 نیز تقلیل یافت. درنهایت، یافتههای پژوهش، ما را به این جمعبندی رهنمون ساخت که کتابهای آموزش زبان فارسی به غیرفارسیزبانان در بعضی از سطوح زبانآموزی حتی تا %2 نیز با پیکرهی مورد نظر این پژوهش همپوشانی ندارند. همچنین، یافتهها نشان داد، چنانچه موضوع سطوح زبانآموزی را نیز کنار بگذاریم و صرفاً به پوشش پُربسامدترین واژهها در کتابها بپردازیم، واژههای ارائه شده در کتابها کمتر از %50 از همپوشانی با پیکرهی مورد نظر این پژوهش برخوردار هستند.
Methods and tools of corpus linguistics were used to compute the rate of overlap between the high frequency words of textbooks and those of a Persian language corpus. Based on the texts of Persian Language Data Base, a balanced corpus was developed and its high frequency words were used as benchmarks against which textbooks’ high frequency words were compared. Three textbooks which are widely used in centers for teaching Persian to Non-Persians were selected. The 5000 most frequents words of each book were organized into five 1000 word lists. Each of the 1000 word lists was taken as representing a level of language learning. Each book’s five word lists were compared to their corresponding word lists drawn from the reference corpus. The findings indicated that in regards to language learning levels, the amount of lexical overlap between 1000-word lists of books and those of the reference corpus is very low. Even in the first 1000-word list which due to the presence of large number of function words was expected to yield 100% overlap, the highest degree of overlap (i.e. Rasuli’s book) was nearly 55%. In the other vocabulary learning levels, e.g. level 5, the rate of overlap between the textbooks and the reference corpus was less than 2%. It was concluded that in some of the language learning levels, there was less than 2 percent overlap between the high frequency words of textbooks and those of the reference corpus. When the subject of language learning levels was set aside and merely the rate of overlap between high frequency words of the textbooks and those of the reference corpus was calculated, less than 50% overlap was observed.
ملخص الجهاز:
نتايج و يافته هاي پژوهش نشان داد که به لحاظ سطوح زبان آموزي، ميزان هم پوشاني واژگاني هر يک از پنج گروه هزارواژه اي برگرفته از کتاب ها با گروه هاي متناظر آنها در پيکره ي مبنا بسيار پايين است ؛ حتي در گروه اول که انتظار ميرود به دليل حضور تعداد زيادي از واژه هاي نقشي در آن ، هم پوشاني واژگاني به سمت %١٠٠ ميل کند، در بالاترين ميزان هم پوشاني (يعني در کتاب رسولي/ جامعه الزهرا) اين هم پوشاني حدود %٥٥ بود.
همچنين ، يافته ها نشان داد، چنانچه موضوع سطوح زبان آموزي را نيز کنار بگذاريم و صرفا به پوشش پربسامدترين واژه ها در کتاب ها بپردازيم ، واژه هاي ارائه شده در کتاب ها کمتر از %٥٠ از هم پوشاني با پيکره ي مورد نظر اين پژوهش برخوردار هستند.
به عبارتي ديگر، ميتوان دريافت که اين واژه هاي منتخب تا چه اندازه با پيکره يا فهرست هاي واژگاني هم پوشاني دارند؟ به طور دقيق ، پژوهش حاضر تلاشي است درجهت پاسخ گويي به پرسش زير: واژه هاي ارائه شده در کتاب هاي آموزش زبان فارسي به غيرفارسيزبانان تا چه اندازه با پيکره ي واژگاني مورد نظر اين پژوهش انطباق و هم پوشاني دارند؟ ٢.
پژوهش حاضر با اين هدف انجام ميگيرد که مشخص شود محتواي آموزشي کتاب هاي موجود در حوزه ي آموزش زبان فارسي به غيرفارسيزبانان تا چه اندازه نيازهاي واژگاني زبان آموزان را پوشش ميدهد، با اين تفاوت که نيشن در پژوهش خود بر ٩٠٠٠ واژه ي پربسامد متمرکز ميشود و پژوهش حاضر بر ٥٠٠٠ واژه ي نخست ١ در زبان آموزي متمرکز است .