چکیده:
بسیاری از روشهای خوشهبندی مستلزم تعیین تعداد خوشههای مورد جستجو میباشند. به مسئله تعیین تعداد خوشههای مناسب در خوشهبندی، مسئله اعتبار خوشهبندی میگویند. تخمین تعداد خوشههای بهینه از مهمترین موضوعات مدنظر متخصصان خوشهبندی در سالهای اخیر بوده و منجر به معرفی شاخصهای اعتبار زیادی شده است. پیشرفتهترین این شاخصها مبتنی بر تحلیل همزمان دو معیار میزان فشردگی(تراکم) درون خوشهها و میزان جدایی خوشهها از یکدیگر میباشد که عمدتاً درنتیجه عدم کارایی محاسباتی و پیچیدگی ریاضی ناکارآمد میشوند. بهمنظور رفع این کاستی، مقاله حاضر به پیشنهاد شاخص FCI که از مفهوم کاردینالیته در مجموعههای فازی بهره میبرد، پرداخته است. این شاخص علاوه بر در نظر گرفتن همزمان دو معیار تراکم و جدایی، از کارایی محاسباتی بالایی برخوردار بوده و بهدوراز تکلف ریاضی، با استفاده از کاردینالیته در خوشهبندی فازی به تعیین تعداد بهینه خوشهها میپردازد. در این مقاله علاوه بر مرور شاخصهای اعتبار خوشهبندی، به تشریح شاخص پیشنهادیFCI پرداخته شده و درنهایت، بهمنظور تبیین اثربخشی و کارایی شاخص، از مثال عددی استفاده شده است.
Clustering techniques need to define the number of clusters before they can be applied to the partitioning problem. Determining suitable number of clusters in partitioning problem is the purpose of clustering validity indices, which are nowadays significantly considerable for data miners and this resulted in various numbers of related indices. Separation and compactness information of fuzzy clusters are both considered in developing the advance indices of clusters validity, while this makes the above mentioned indices inefficient because of mathematical sophistication and the need for more computational effort. Therefore, this paper proposes FCI as a new index, which employs fuzzy cardinality concept in defining the number of clusters in fuzzy clustering. FCI also considers both compactness and separation of fuzzy clusters while significantly decreases computational efforts. In this paper, after reviewing the cluster validity indices and fuzzy clustering algorithms, FCI index will be explained and ultimately to evaluate its effectiveness will be implemented.
خلاصه ماشینی:
پژوهش هاي نوين در تصميم گيري دوره ٢، شماره ٣، پاييز ١٣٩٦ ارائه يک شاخص جديد اعتبار خوشه بندي بر مبناي کارديناليته فازي 1* محمود دهقان نيري استاديار، گروه مديريت صنعتي، دانشکده مديريت و اقتصاد، دانشگاه تربيت مدرس، تهران، ايران پذيرش: ١٣٩٥/١٠/٨ دريافت : ١٣٩٦/٢/٢ چکيده بسياري از روش هاي خوشـه بنـدي مسـتلزم تعيـين تعـداد خوشـه هـاي مـورد جسـتجو ميباشند.
در ادامــه ، ابتــدا الگــوريتم خوشه بندي فازي (FCM) و سپس عمده شاخص هاي اعتبـار خوشـه بنـدي موجـود در ادبيات موضوع، تحليل و درنهايت ، شاخص پيشنهادي اين پژوهش (FCI) تشريح شده و در قالب مثال عددي به کار گرفته ميشود.
فاقـد نظـارت 103 پژوهش هاي نوين در تصميم گيري __________________________________ دوره ٢، شماره ٣، پاييز ١٣٩٦ بودن نيز نشان از آن داد کـه دادههـا بـدون داشـتن هـيچ گونـه برچسـب راهنمـا و يـا نظارتي به درون خوشه ها تخصيص داده ميشوند که برخلاف روشهاي طبقه بندي ١١ اسـت [١٨].
نکته قابل توجه در مورد دو تابع معرفي شده در بـالا ايـن اسـت کـه زمـاني ک ه PC برابر ١ باشد PE برابر ٠ خواهد بود و در اين حالت ، خوشه بندي معـادل خوشـه بنـدي کلاسيک است .
________________________________ محمود دهقان نيري ٣- روش تحقيق چنانکه اشاره شد در اين تحقيق کـه از نـوع تحقيقـات توصـيفي اسـت ، پـ از مـرور شاخص هاي مطرح در اعتبار خوشه بندي، بـه ارائـه يـک شـاخص خوش بنـدي نـوين پرداخته شده است .
Data analysis with fuzzy clustering methods.
N. (1996), "Validating fuzzy partition obtained through c-shells clustering", Pattern Recognition, No. 17, pp.