خوشه بندی
خوشهبندی (Clustering) یک فرآیند در علم دادهها و ماشین لرنینگ است که اشیاء یا دادهها را بر اساس ویژگیها یا ویژگیهای مشترک به گروههای (خوشهها) مشابه تقسیم میکند. هدف این است که اشیاء داخل هر خوشه شبیه به یکدیگر باشند و اشیاء در خوشههای مختلف متفاوت باشند. روشهای مختلف برای انجام خوشهبندی وجود دارد، از جمله:
روشهای مبتنی بر مرجع (Hierarchical Methods):
1- خوشهبندی تجمعی (Agglomerative Clustering): این روش از پایین به بالا عمل میکند و هر داده را به عنوان یک خوشه جدید شروع میکند و سپس خوشهها به تدریج ترکیب میشوند تا یک خوشه کلی ایجاد شود.
2- خوشهبندی تجزیه (Divisive Clustering): در این حالت، همه دادهها ابتدا به یک خوشه تجمع مییابند و سپس این خوشه به تدریج به زیرخوشههای کوچکتر تقسیم میشود.
3- روشهای مبتنی بر مرکز خوشه (Centroid-based Methods):
K-Means: این یکی از معروفترین روشهاست که تلاش میکند k مرکز خوشه را به گونهای انتخاب کند که مجموع فاصلههای مربوط به نقاط دادهها تا مراکز خوشه به حداقل برسد.
K-Medoids: شبیه به K-Means است، اما به جای استفاده از میانگین نقاط دادهها به عنوان مرکز، از یک نقطه واقعی داده به عنوان مرکز استفاده میکند.
4- روشهای مبتنی بر چگالی (Density-based Methods):
DBSCAN (Density-Based Spatial Clustering of Applications with Noise): این روش بر اساس چگالی نقاط انجام میشود و به وسیله تعیین نقاط هسته و نقاط مرزی به خوشهها پیوسته و خوشههای ناهمگن را تشکیل میدهد.
روشهای مبتنی بر تشابه (Similarity-based Methods):
5- روشهای اجتماعی (Affinity Propagation): این روش بر مبنای انتقال پیغام بین دادهها عمل میکند و میانگین شباهت بین نقاط را محاسبه میکند تا نقاط به عنوان مراکز خوشه انتخاب شوند.
هرکدام از این روشها ویژگیها و محدودیتهای خود را دارند و انتخاب مناسبترین روش بستگی به ساختار دادهها و هدف اجرای خوشهبندی دارد.