خلاصة:
تشخیص و تحلیل دادههای پرت یکی از گامهای ابتدایی مهم در تحلیل دادههاست. یک داده پرت در سریهای هواشناسی میتواند نشان دهندهی یک رخداد فرین باشد یا خطای ناشی از اندازه گیری، مشاهده و ثبت است. اگر دادههای پرتی که حاصل خطای انسانی یا نقص تجهیزات اندازهگیری هستند شناسایی نشده و حذف نگردند، به عنوان دادهی فرین ثبت خواهند شد و موجب اریبی در نتایج مطالعات اقلیمی میشوند. در این مقاله، دادههای پرت سریهای زمانی سرعت باد و فشار برای 14۳ ایستگاه هواشناسی کشور در دوره نرمال اقلیمی 1991- 2020 مورد تحلیل قرار گرفت. برای این منظور ابتدا دادههای پرت مکانی با استفاده از الگوریتم کلایماتول مشخص شد و در مرحله دوم با تحلیلهای زمانی و هواشناختی، خطاها شناسایی شدند. در مرحله اول برای پارامترهای فشار ایستگاه، فشار تبدیل شده ایستگاه به سطح دریا، فشار بخار، سرعت باد و سرعت باد ماکزیمم بهترتیب 40، 42، 93، 52 و 41 داده پرت شناسایی شد و در مرحله دوم بهترتیب 20، 10، 56، 20 و 27 تعداد از این دادهها خطا تشخیص داده شدند. این نتایج به تفکیک ایستگاه و تاریخ گزارش شدهاند، تا مورد استفاده محققان در سایر مطالعات، بویژه مطالعات تغییراقلیم، قرار بگیرند.
Detecting outliers is one of the most important steps in data analysis. In climate data, an outlier can be an extreme event or an error due to measurement, observation and recording. If outliers which are error are not identified and deleted, they will be recorded as extreme data and cause the bias in result of the climate change studies. In this paper, the outliers of wind speed and pressure data for meteorological stations in the normal climatic period 1991-2020 were analyzed. For this purpose, first the spatial outliers were determined using the CLIMATOL algorithm and second, errors were identified by temporal and meteorological analyzes. In the first step, for the parameters of station pressure, sea level pressure, vapor pressure, wind speed and maximum wind speed were identified as 40, 42, 93, 52 and 41 outliers, respectively. In the second step, 20, 10, 56, 20 and 27 of those data were recognized error, respectively. These results have been reported by station and date, to be used by researchers in other studies, especially climate change studies.
ملخص الجهاز:
در این مقاله، دادههای پرت سریهای زمانی سرعت باد و فشار برای 14۳ ایستگاه هواشناسی کشور در دوره نرمال اقلیمی 1991- 2020 مورد تحلیل قرار گرفت.
از آنجا که هدف اصلی ما از این مطالعه، تعیین دادههای پرت ناشی از خطا و بالا بردن کیفیت دادهها میباشد، ابتدا با استفاده از روش کلایماتول، دادههای پرت را تعیین کردیم و سپس برای اطمینان از اینکه دادههای پرت تشخیص داده شده خطا هستند، Adam Cheng Lu Liang Wavelet fuzzy classification Wu El Ni˜no Southern Oscilliation Ma Sliding Window Prediction 0.
Paulhus Kohler Daget Reduced Major Axis (به تصویر صفحه مراجعه شود)خوشه دو, خوشه یک (به تصویر صفحه مراجعه شود) خوشه چهار, خوشه سه (به تصویر صفحه مراجعه شود) خوشه پنج شکل 3: هیستوگرام آنومالی استانداردشده دادههای فشار سطح ایستگاه (QFE) به تفکیک در هر خوشه برای تشخیص حدود دادههای پرت شکل (6) فراوانی خطاها و دادههای پرت فشار ایستگاه را به تفکیک در هر خوشه نشان میدهد، همانطور که مشاهده میشود تعداد خطاها در خوشه یک و دو بیشتر از سایر مناطق است و بیشتر این خطاها مربوط به دو ایستگاه جم و درودزن میباشند.
شکل (6) فراوانی خطاها و دادههای پرت فشار (QFF) را به تفکیک در هر خوشه نشان میدهد، همانطور که مشاهده میشود تعداد دادههای پرت تشخیص داده شده و همینطور خطاها در خوشه یک بیشتر از سایر مناطق است و این امر با توجه به اینکه خوشه یک ایستگاههای بیشتری را شامل میشود قابل انتظار است.
(به تصویر صفحه مراجعه شود) شکل 4- هیستوگرام آنومالی دادههای فشار تبدیل شده ایستگاه به سطح متوسط دریا (QFF) به تفکیک در هر خوشه برای تشخیص حدود دادههای پرت 1.
Correction of Outliers in Temperature Time Series Based on Sliding Window Prediction in Meteorological Sensor Network, Information 2017, 8(2), 60, https://doi.