خوشه بندی Affinity Propagation
خوشه بندی Affinity Propagation یک الگوریتم خوشه بندی قدرتمند و کاربردی است که بر اساس انتخاب نمایندهها (exemplars) برای گروهبندی دادهها عمل میکند. برخلاف بسیاری از الگوریتمهای خوشهبندی دیگر که نیاز به تعیین تعداد خوشهها پیش از شروع دارند، این الگوریتم به طور خودکار تعداد خوشهها را بر اساس دادهها و مقادیر اولیهای که به نام “پیشفرضها” (preferences) به دادهها اختصاص داده میشود، مشخص میکند.
مراحل عملکرد الگوریتم خوشه بندی Affinity Propagation
محاسبه ماتریس شباهت:
- اولین قدم در الگوریتم، محاسبه ماتریس شباهت بین نقاط داده است. این ماتریس معمولاً بر اساس فاصلههای منفی مربع شده یا معیاری مشابه تعریف میشود.
تنظیم پیشفرضها:
- پیشفرضها مقادیر اولیه هستند که به هر نقطه داده اختصاص داده میشود و نشاندهنده احتمال آن است که به عنوان نماینده خوشه انتخاب شود. این مقادیر معمولاً بر اساس میانه یا میانگین شباهتهای غیرقطری تعیین میشوند.
بهروزرسانی مسئولیتها و قابلیتها:
- مسئولیتها و قابلیتها دو ماتریس اصلی در الگوریتم هستند. مسئولیتها نشان میدهند که چقدر یک نقطه برای نماینده بودن دیگر نقاط مناسب است، در حالی که قابلیتها نشاندهنده این است که چقدر یک نقطه باید به عنوان نماینده برای دیگر نقاط مورد تایید باشد. این ماتریسها به صورت تکراری بهروزرسانی میشوند تا الگوریتم به همگرایی برسد.
تشخیص نمایندهها:
- پس از همگرایی الگوریتم، نقاطی که به عنوان نمایندهها انتخاب شدهاند مشخص میشوند. این نمایندهها در واقع مرکز خوشهها هستند و نقاط دیگر حول این نمایندهها گروهبندی میشوند.
مزایا و معایب
مزایا:
- عدم نیاز به تعیین تعداد خوشهها: بر خلاف الگوریتمهای دیگر مانند K-Means، Affinity Propagation تعداد خوشهها را به طور خودکار تعیین میکند.
- انعطافپذیری: قابلیت استفاده از انواع مختلف معیارهای شباهت.
معایب:
- پیچیدگی محاسباتی: ممکن است برای دادههای بزرگ بسیار زمانبر و پیچیده باشد.
- حساسیت به پیشفرضها: انتخاب پیشفرضهای مناسب میتواند تاثیر زیادی بر تعداد و کیفیت خوشهها داشته باشد.
کاربردها
خوشه بندی Affinity Propagation در زمینههای مختلفی از جمله پردازش تصویر، خوشهبندی متون، بیوانفورماتیک و شناسایی ناهنجاریها کاربرد دارد. این الگوریتم به دلیل عدم نیاز به تعیین تعداد خوشهها و توانایی پردازش دادههای بزرگ، یکی از گزینههای محبوب در تجزیه و تحلیل دادهها به شمار میآید.
با خدمات پلتفرم ژیر اشنایی داری؟

متریک دقت (Accuracy) در یادگیری ماشین
متریک دقت (Accuracy) در مدل های کلاسیفیکیشن یادگیری ماشین https://aparat.com/v/skn3np0https://aparat.com/v/skn3np0 متریک دقت (Accuracy) یکی از پرکاربردترین معیارها برای ارزیابی عملکرد …

مدل رگرسیون XGBoost: یک روش قدرتمند برای پیشبینی
https://aparat.com/v/mwgmxvphttps://aparat.com/v/mwgmxvp مدل رگرسیون XGBoost یکی از محبوبترین و قدرتمندترین الگوریتمهای یادگیری ماشین است که در مسائل مختلف پیشبینی و تحلیل …

رگرسیون جنگل تصادفی (Random Forest Regression)
https://aparat.com/v/aryt0zphttps://aparat.com/v/aryt0zp رگرسیون جنگل تصادفی (Random Forest Regression) یکی از الگوریتمهای محبوب و کارآمد یادگیری ماشین است که برای پیشبینی متغیرهای …