Bulanık kümeleme analizinde bulanık kümeleme algoritmalarının karşılaştırılması
Abstract
Kümeleme analizi, örneklerin özelliklerine dayanarak veri noktalarını gruplamak için kullanılan denetimsiz bir öğrenme tekniğidir. Son dönemlerde bu teknikler özellikle biyoinformatik, biyoistatistik, genetik gibi alanlarda kullanımı artmıştır. Kümeleme, keskin ve bulanık olarak iki modda gerçekleştirilebilir. Keskin kümeleme yöntemlerinde, her birim kesinlikle bir kümeye atanmalıdır. Bulanık kümeleme algoritmaları ise, her bir nesnenin tek bir kümeye atanma kısıtını ortadan kaldırarak, belirli üyelik dereceleriyle tüm kümelere ait olmasına olanak kılar. Bu tezin amacı; bulanık kümeleme sürecinin araştırmacılara detaylı olarak aktarılmasını sağlamaktır. Ayrıca biyoinformatik, genetik gibi alanlarda bulanık küme algoritmalarının kümeleme tekniklerine alternatif bir yöntem olarak kullanılabileceğini göstermektir. Bu bağlamda, ilk olarak bu teknikler için önemli parametre olan optimal küme sayısının bulunması için bir uygulama gerçekleştirilmiştir. Bu uygulamada yaygın kullanılan genetik veri setinde hem geçerlilik indeksleri hem de dirsek yöntemi kullanılarak kapsamlı karşılaştırmalar yapılmıştır. Daha sonra, gen ekspresyon modellerine bulanık ve klasik kümeleme algoritmaları uygulanmış ve algoritmaların performansları karşılaştırılmıştır. Son olarak, bulanık kümelemede bir dezavantaj olan aykırı değer sorununu üstesinden gelmek için geliştirilmiş bulanık kümeleme algoritmaları karşılaştırılmıştır. Uygulama sonuçları basit bir şekilde analiz edilmiştir.
Collections
- Tez Koleksiyonu [62]