k-nearest neighbors

k-en yakın komşuluk algoritması, uygulaması kolay gözetimli öğrenme (supervised learning) algoritmalarındandır. hem sınıflandırma hem de regresyon problemlerinin çözümünde kullanılıyor olmakla birlikte, endüstride çoğunlukla sınıflandırma problemlerinin çözümünde kullanılmaktadır.
eğittiğimiz bir modeli kullanarak hedef niteliğini bilmediğimiz ancak elimizde özellikleri olan bir nesnenin hangi sınıfa dahil olacağını k-en yakın komşuluk ile tahmin edebiliriz. link1'de iris veri seti kullanılarak yapılmış bir uygulama bulunmaktadır.
link2'deki videoda ise k-en yakın komşuluk algoritmasını da içeren örnek bir topluluk öğrenimi uygulaması bulunmaktadır.
topluluk öğrenimi (ensemble learning), bir veri kümesi üzerinde daha iyi tahminler yapmaya çalışmak için birden çok makine öğrenimi modeli kullanır. bir topluluk modeli, bir veri kümesi üzerinde farklı modelleri eğiterek ve her modelin ayrı ayrı tahminler yapmasını sağlayarak çalışır. bu modellerin tahminleri daha sonra nihai bir tahmin yapmak için topluluk modelinde birleştirilir.
her modelin güçlü ve zayıf yönleri vardır. topluluk modelleri, tek bir modelin zayıf yönlerini gizlemeye yardımcı olmak için bireysel modelleri birleştirerek faydalı olabilir.
videoda, topluluk modelinin çoğunluk oyu ile tahminde bulunduğu bir oylama sınıflandırıcısı (voting classifier) kullanılmıştır.
sınıflandırıcıya yerleştirmek için üç farklı model uygulanmıştır: k-en yakın komşular (k-nearest neighbors), rastgele orman (random forest) ve lojistik regresyon. bu yöntemler, örnek olarak seçilen diyabet veri setine uygulamak için python'daki scikit-learn kitaplığı kullanılmıştır.

ofsayttandogan

11.04.2022 06:41