Abstract:
دیابت، به گروهی از اختلالات متابولیکی گفته میشود که نتیجه عدم کنترل قند خون است. تشخیص به موقع و در ادامه کنترل این بیماری به خوبی باعث کاهش اثرات ناشی از آن مثل رتینوپاتی دیابتی، گرفتگی قلبی و عروقی سکتههای مغزی و غیره میشود. محققان تا به امروز تلاشهای بسیاری در این زمینه کردهاند؛ اما اغلب این مدلها یا مبتنی بر روشهای یادگیری ماشین ساده و یا بر این فرض استوار هستند که دادههای دیابت در دسترس متوازن هستند. از اینرو، در این مقاله یک مدل تشخیص بیماری دیابت مبتنی بر شبکههای عصبی بازگشتی عمیق و الگوریتم بیش نمونهگیری SMOTE ارائه شده است. در این مدل چندین مرحله پیش پردازش شامل مقدار دهی به مقادیر از دست رفته، حذف دادههای پرت و سپس بیش نمونهگیری انجام شده است. از سه شبکه عصبی عمیق بازگشتی با سه واحد پنهان بازگشتی شامل LSTM, GRU و BiLSTM برای تشخیص استفاده شده است. نتایج مدل ارائه شده بر روی پایگاه داده Pima حاکی از آن است که میانگین صحت در 10 اجرای مختلف در LSTM و GRU و BiLSTM به ترتیب 91. 21%، 89. 61 و 90. 99% است. نتایج مدل بازگشتی ما نشان میدهد، شبکههای عصبی عمیق در مقایسه با روشهای یادگیری ماشین عملکرد بسیار موفقتری دارند.
Diabetes is a group of metabolic disorders that are the result of untreated high blood glucose greatly. Early diagnosis and continued control of this disease can reduce its effectsTherefore, providing a method for timely diagnosis of this disease is of great importance. Until now, researchers have made many efforts to provide machine learning methods to diagnose diabetes. But most of these models are either based on simple machine learning methods or based on the assumption that the available diabetes data are balanced. Both cases are factors of their complete failure. Therefore, considering the existing challenges as well as the importance of timely diagnosis of diabetes, in this research, a diabetes diagnosis model based on deep recurrent neural networks and SMOTE oversampling algorithm is presented. In this model, several pre-processing steps including quantification of missing values, removal of outlier data and then oversampling have been performed. Three deep recurrent neural networks with three recurrent hidden units including LSTM, GRU and BiLSTM have been used to diagnose diabetes. The results of the model presented on the Pima database received from the UCI repository indicate that the average accuracy in 10 different runs in LSTM, GRU and BiLSTM is 91.21%, 89.61% and 90.99%, respectively. The recurrent network with GRU unit has achieved the highest accuracy of 93.74% on average in 10 different executions. The results of the proposed model show that deep neural networks have a much more successful performance in diabetes diagnosis compared to traditional machine learning methods.
Machine summary:
ارائه يک مدل تشخيص ديابت مبتني بر شبکه هاي عصبي عميق بازگشتي و الگوريتم بيش نمونه گيري فرزانه آقامحموديان ١، ناصر نعمت بخش ٢، محسن اخوان طبيب 3 چکيده ديابت ، به گروهي از اختلالات متابوليکي گفته ميشود که نتيجه عدم کنترل قند خون است .
از اين رو، در اين پژوهش يک مدل تشخيص بيماري ديابت ، مبتني بر شبکه هاي عصبي بازگشتي عميق و الگوريتم بيش نمونه گيري SMOTE ارائه شده است .
از اين رو، ارائه يک روش تشخيص بيماري ديابت کارآمد مبتني بر هوش مصنوعي و شبکه هاي عصبي عميق بازگشتي است که در آن براي مشکل عدم توازن داده ها از الگوريتم بيش نمونه گيري SMOTE١١ يا نسخه هاي بهبود يافته آن مثل ADASYN١٢ استفاده ميشود، از جمله اهداف اين پژوهش است .
بخش هاي اصلي روش ارائه شده در اين پژوهش به صورت زير خلاصه ميشود: در اين مدل از سه واحد پنهان بازگشتي مختلف شامل BiLSTM١٣,LSTM١٤ و GRU١٥ در شبکه عصبي بازگشتي استفاده شده است تا عملکرد هر يک مقايسه شود.
در اين مدل سه الگوريتم بيش نمونه گيري مختلف شامل SMOTE،Borderline SMOTE و ADASYN جهت رفع مشکل داده هاي نامتوازن ديابت استفاده شده است و مقايسه بين عملکرد آن ها صورت گرفته است .
3. k-means clustering, principal component analysis (PCA) (به تصویر صفحه مراجعه شود) (به تصویر صفحه مراجعه شود) روش پژوهش مدل ارائه شده در اين مقاله يک روش طبقه بندي مبتني بر يادگيري عميق است که جهت تشخيص ديابت از سه شبکه عصبي عميق بازگشتي با سه واحد پنهان مختلف استفاده ميکند.