خلاصة:
اده کاوی، فرایند مرتب سازی و طبقه بندی داده های حجیم و آشکارسازی اطلاعات مرتبط باهم می باشد. امروزه داده کاوی به عنوان یکی از ابزارهای بسیار مهم مدیران جهت شناخت وضعیت دقیق تر سازمان و همچنین کمک در اتخاذ تصمیمات مناسب کاربرد دارد. با استفاده از این تکنیک، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد. داده کاوی را می توان نسل سوم تکنولوژیهایی نامید که با داده سروکار دارند. در نسل اول یا نسل سنتی، فقط انجام پرس و جو های ساده امکان پذیر بود، مثلا تعداد فروش یک کالای خاص چقدر است؟ میزان خرید یک مشتری خاص در ماه جاری چه مبلغی است؟ در نسل دوم یا همان پردازش لحظه ای برخط (OLAP) امکان پرس و جوی همزمان چند بعدی فراهم گردید. در این روش به عنوان مثال به سوالاتی مانند: «میزان فروش محصولات به تفکیک فروشنده، خریدار و مسیر خاص چقدر است؟ » بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود. اما در نسل سوم یا همان داده کاوی فقط مساله پرس و جو و دریافت گزارش ها از داده ها نیست، بلکه از حجم انبوه داده ها، الگوهایی کشف می شود که هیچ وقت امکان کشف این الگوها در OLAP یا روش سنتی وجود نداشت. انواع اطلاعات و الگوهایی که از طریق داده کاوی بدست می آیند و کاربرد دارند عبارتند از: وابستگی، تسلسل و توالی، طبقه بندی، خوشه بندی و پیش بینی. برای استخراج این الگوها اغلب از روشهای نوینی مانند شبکه عصبی و درختهای تصمیم استفاده می شود. در عمل برای امکان انجام داده کاوی و استفاده از تکنیکهای فوق الذکر، ابتدا باید نسبت به ایجاد یک انبار داده مناسب اقدام کرد. یک انبارداده در حقیقت پایگاه داده ای است که داده های جاری و همچنین سوابق قبلی تراکنشها را در خود ذخیره کرده و با منابع خارج سازمان نیز ارتباط برقرار می کند.
اهداف کلی این مقاله عبارتند از ارایه تعریف دقیقی از انبار داده، بررسی تکنیکها و کاربردهای داده کاوی و کاربرد آن در مدیریت، معرفی شبکه عصبی به عنوان یکی از روشهای اجرای داده کاوی و بیان مفهوم درخت تصمیم و ارتباط آن با داده کاوی.
ملخص الجهاز:
با استفاده از این تکنیک ، داده های موجود در سازمان با بکارگیری ابزارهای نرم افزاری، مورد بررسی و تحلیل دقیق قرار می گیرد تا الگوهای پنهان و پیچیده ای که در آنها وجود دارد کشف و استخراج گردد.
در این روش به عنوان مثال به سوالاتی مانند: "میزان فروش محصولات به تفکیک فروشنده ، خریدار و مسیر خاص چقدر است ؟ " بصورت لحظه ای و با استفاده از مکعب تصمیم و گزارش ماتریسی پاسخ داده می شود.
Cross Industry Standard Process for Data Mining شکل ١- مراحل مختلف داده کاوی بر اساس استاندارد سازمان استانداردسازی فرآیندهای داده کاوی بین صنعتی (رجوع شود به تصویر صفحه) شناخت کسب و کار بسیار مهم و حیاتی است چرا که اهداف سازمان در آن مشخص می گردد از اینرو مهمترین عامل موفقیت پروژه های داده کاوی به حساب می آید.
٤- شبکه های عصبی برای شناخت الگوهایی که در داده ها وجود دارند بسیار مفید هستند، خصوصا در مواقعی که نوع رابطه بین هدف (به عنوان مثال ریسک اعتباری) و متغیرهای ورودی (مثلا ویژگیهای جمعیتی) نامشخص و یا پیچیده باشد.
داده کاوی به معنای استخراج الگوهای رفتار مشتریان در قبال تعهدات اعتباری خود از درون حجم زیاد اطلاعات یکی از روش های بسیار مفید در این زمینه می باشد.
- این شاخص بر مبنای تکنیکهای آماری (تحلیل داده های تاریخی وام برای تعیین ویژگیهای درخواست کننده ) طراحی می شود.