• artificial intelligence, fuzzy logic, machine learning, neural networks gibi her biri kendi başına bir derya olan bir sürü disipline kucak açmış, yeni yeni (90ların başından bu yana) popülerleşmeye başlayan analiz dalı.. en temel özelliklerinden biri araştırmacının analizi yönlendirmesinden ziyade verinin analizi ve analisti yönlendirmesidir.. en temel ifadesiyle büyük veri kümelerinde bulunan ve insan algısının çok uzun zaman ve klasik yöntemlerle çok fazla çaba gerektirerek farkedebileceği faydalı veri paternlerinin bu kümelerden ayıklanmasıdır.. parametrik ve doğrusallık gibi kalıpları/varsayımları bulundurmaması sayesinde klasik regresyon ve zaman serisi analizlerinin yerini alması muhtemel bir daldır bu.. zaman zaman ise iç içe geçmiş kombinatorik bir şartlı olasılıklar kurgusu gibi ortaya çıkmaktadır ki bu da verilerin ayıklanmasında önemli rol oynar.. yine de hali hazırda en büyük problemlerinden biri sonuçların belirli anlamlılık düzeylerinde test edilmesini sağlayacak yöntemlerin tam manasıyla yerleşmemesi ve etkin kullanılamamasıdır.. pratikte "voice recognition"dan, el yazısı tanımaya, belirli hastalıklara teşhis koymaktan, kimyasal süreçlere, pazarlama kararlarına destek görevi yapmaktan borsa hareketlerini yorumlamaya pek çok alanda kullanılan nezih bir olaydır bu..
  • veri madencisi insanlara surpriz yapmak da zor oluyor.. ornek:

    a*: eve gelirken havuc alsana biraz
    l*: aaa, lazanya mi yapacaksin?
    a: mavi ekran (evet, uhuhu)
  • shibumi'de basyardimci llewellyn'in icra ettigi sanat dali.

    "$i$ko'ya* veri programlamak, bir yigin teknisyen ve mekanik uzmaninin soluk almadan yaptigi bir isti. ama ondan bilgi almak ancak bir sanatcinin harciydi. egitilmis biri gerekliydi buna. tu$esi ve ilhami olan biri. sorunun kaynagi, $i$ko'daki bilgilerin cok fazla olmasiydi. eger istediginiz konuyu cok yüzeysel tararsaniz, aradiginizi bulamayabilirdiniz. cok derin taradiginizda ise, $i$ko size okuyamayacaginiz kadar cok yazi vermeye baslardi. eski idrar testlerinin raporlari, yavrukurtken kazanilmis ödüller, lise yilliginda kisinin hakkinda yazilmis yazilar, hangi marka tuvalet kagidini tercih ettigi, falan filan. basyardimcinin en büyük yetenegi, $i$ko'ya tam en gerekli sorulari sorabilmesi, ondan bilgiyi istedigi derinlikte koparabilmesiydi. komputeri konser veren bir piyanistin doyuruculuguyla kullanir, cok da severdi. bu konsolun basinda calismanin ona verdigi zevk, seksin baska erkeklere verdigi zevk gibi birseydi. yani kendisine göre baska erkeklerin seksten anlamasi gereken zevk gibi birsey."

    shibumi, trevanian, 1979, s.27-28
  • pratik uygulamasını sıklıka "bunu alan bunu da aldı" gibi tavsiye sistemlerinde görebilirsiniz...

    tabi bir de (bkz: people you may know)
  • garip bir bilim dali kendileri, misal bir otomobil firmasi en sportifinden, en beygir gucu yukseginden bir otomobil cikariyor piyasaya. haliyle "len bizim potansiyel musterilerimiz kimler ola ki acep" sorusunu soruyor. market zincirlerinden herhangi birinden cesitli analizleri yapmaya basliyor, elinde var binlerce musteri, milyarlarca veri. bunlarin hepsinin potansiyel musteri olmasi pek tabi ki olanaksiz ve sacma. basliyor elemeye; son bir yilda periyodik bir sekilde bebek bezi, bebek pudrasi, bebek losyonu vs..alan musterileri direk eliyor. neden? zira buyuk bir ihtimalle cocuklari olmus bir aile sportif bir arabanin derdine dusebilecek potansiyelde degil. adam bebegin bokunu temizlerken pek de boyle ozelliklere sahip bir araba dusunmez. bu sadece cok cok basit bir ornek tabi, onlarca analiz ve onlarca yontem var bu bilim dalinda kullanilan. turkiye' de ve dunyada yavas ama emin adimlarla ilerliyor. pek cok sektorde kullanilmasinin yanisira en kapsamli sekilde benim bildigim kadariyla telekomunikasyon sektorunde kullanilmakta kendisi.
  • coin madenciliği ile alakası astroloji ile astronominin alakasından fazla olmayan, "sözlüğün seviyesini daha ne kadar düşürebilecek insanları yazar yapabilirsiniz?" sorusunu sordurtan istatistik ve yazılım uzmanlığı.
  • (bkz: remarketing) veri madenciliği değildir. genel olarak basit bir (bkz: cookie) oyunudur.
  • bir suru eglenceli uygulamasi vardir, ve fakat nedense bu konuyla ilgili ne okuduysam daha ziyadesiyle su da yapilir bu da yapilir, hatta bu yontemle daha da iyi yapilir diyor da, neyin aslinda nasil yapildigini bi adam gibi anlatmiyor. kral ciplak diye bagirasi geliyor insanin
  • okulda ilgili bir projesi yapilmis olan fakat nedir ne moka yarar anlamadigim, sayilarla basa cikma mucadelesi. akilli insan oyle mining falan yapmaz, rakamlara baktiginda olayi cozer zaten.
    (bkz: kurt hoca senol gunes)
  • etik açıdan fazla kullanmanın sonuçları değiştirecek eylem,özellikle ekonometrik modellemelerde dikkatli olunması gerekir.
hesabın var mı? giriş yap