• ks. waikato environment for knowledge analysis
    saglam learning algoritmalarinin bulundugu data mining tool'u.
    ayrica, yeni zelanda'da yasayan ucamayan, soyu tukenmekte olan bir cins kus.
  • 6000 attribute ve 5000 instance içeren data setim ile attribute selection yapacağım diye zavallı 2009 model core2duo işlemcili bilgisayarıma 24 saati aşkın süredir eziyet çektiren program. allahını seven üstüme cpu atsın.
  • yeni zellanda'da bulunan waikato university'de geliştirilmiş veri madenciliği paket programıdır. gnu general public license altında geliştirilmiştir, dolayısıyla ücretsizdir. java tabanlıdır. 4 farklı arayüzü vardır.
    simple cli; komut satırından işlem yapar.
    explorer; veri ön işleme, sınıflandırma, kümeleme, nitelik seçimi, 2 boyutlu grafik çizimi gibi işlemler yapar.
    experimenter; explorer arayüzünün yetersiz kaldığı durumlarda kullanılır.
    knowledge flow ise bağlantıları akışlarla gösteren arayüzdür.

    attribute relation file format (arff) olarak adlandırılan kendine has bir dosya formatı vardır. işlem yapılacak dosyalar bu formata dönüştürüldükten sonra kullanılabilir. sınıflandırma işlemi yaparken seçilen nitelik sayısına dikkat etmek gerekir 200 nitelikten fazla nitelik varsa sorun çıkarabilir. daha düşük sayıda niteliklerle bellek hataları alınıyorsa max heap size arttırılarak sorun çözülebilir.
  • an itibariyle tek türkçe kitap 'iş zekası ve veri madenciliği, weka ile' başlıklı kitaptır (yazarı (bkz: sadi evren seker) ) ve kendisinin weka ile ilgili yazılar açık olarak yazdığı yazılara aşağıdan erişilebilir:

    weka
    eğitim modelinin kaydedilmesi
    weka knowledge flow
  • java dilinde geliştirilmiş olan veri madenciliği* ve makina öğrenmesi* gereçleri arasında en yaygın kullanılanıdır. geliştirme yapmadan, sadece kullanıcı arayüzü ile makina öğrenmesi uygulamaları çalıştırmaya çalışanlar için zor olabilir. zira zaten bu alan halen daha araştırma aşamasındadır. herkes yeni bir şey deniyor, yeni yeni denen şeyler için bir kullanıcı arayüzünün mükemmel esneklikte cevap vermesi, pratikte mümkün değil. bu işi geliştirme ile yani kod yazarak yapan kişiler içinse son derece başarılı bir kütüphanedir. pek çok yöntemi kendisi gerçeklediği gibi, aynı zamanda başka gereçleri de wrapping yöntemiyle kod içinden çalıştırabilme imkanı sunar. tabi bu durumlarda biraz yavaş ve kullanışsız kalabiliyor, lakin olur o kadar. son yıllarda python'la geliştirilmiş veri madenciliği ve makina öğrenmesi paketlerinin popüler olmasından mütevellit, eski günlerine göre biraz daha sönük bir dönemden geçiyor. mamafih bu işe yeni başlayanlar için son derece faydalı bir gereçtir.
  • weka ile ilgili eğitim videolarını izliyorum geçenlerde, videolardan birinde ian witten video'nun başında "martini'mi bir bitireyim de öyle başlayalım" deyip hop diye gömüyor. sonrasında konuşurken bir süre ağız şapırdatma hali, kahkaha attım oturduğum yerde, video sonunda da martinisinin kalan zeytinlerini gömdü. :d
  • image classification yapmak için images folderını nasıl arff uzantısına kısa yoldan çevirebiliriz diyenler için şöyle bir şeyler buldum.

    https://www.datacamp.com/…rials/datasets-for-images
    https://www.youtube.com/watch?v=xbsjokuatcw

    *ilgili klasöre gidip cmd komutu çalıştırıp , yandaki komutu girin. dir /b/s/w *.bmp> "filename.txt"

    *bütün dosyaları tek komutla değiştirmek için ise https://www.youtube.com/watch?v=s98zdyykrsa
  • avustralya'daki waikato üniversitesi'nde gnu lisansı altında geliştirilmiş java tabanlı bir veri madenciliği(data mining) aracı.

    weka'yı dosya girdisi ile weka arayüzünde kullanabileceğiniz gibi, kendi java kodunuzun içinde de algoritmalarını çağırmanın keyfini çıkartabilirsiniz.

    weka ile yapay sinir ağları(neural networks) algoritmalarını, sınıflandırma(classification) ve gruplama(clustering) algoritmalarını, öngörü(regression) algoritmalarını ve ilişkilendirme(association) algoritmalarını içeriğini bilmeseniz bile kullanabilirsiniz. neredeyse bilinen bütün veri madenciliği algoritmalarını kapsıyor. üstelik oluşan çıktıların grafiksel sunumu da oldukça tatmin edici.
  • her actigimda "ulan soyle bir proje yok ki turk universitelerinde gelistirilmis ve dunyada kullaniliyor olsun" diyorum. scala falan geliyor sonra aklima. sonra soda iciyorum, geciyor.
  • data mining ve machine learning için kullanılacak en iyi toollardandır. temiz çalışır, pek arıza çıkarmaz. ancak büyük datasetlerle uğraştığınızda son derece yetersiz kalır. utanması arlanması kalmaz, herşeyi size yaptırmaya kalkar. madenci gibi dataları tek tek size işlettirir. java tabanlı kaynak kodları açıktır fakat, açıp biraz java yardırarak kendinize göre bir ayar çekebilirsiniz. o zaman mis gibi olur.
hesabın var mı? giriş yap