5 entry daha
  • fire phone resmen olu dogduktan sonra amazon bunca zamandir ugrastigi ve bunun icin bir dunya insani ise aldigi ses tanima teknolojisiyle ne yapicak acaba konusundaki merakimi dindiren alet.

    ses tanimada tutarlilik seviyesi nedir bilemiyoruz ama reklam videosunda calistigi gibi hatasiz calismiyorsa videoda gosterilen herhangi carpici bir ozellik bulamadim. playlist/genre uzerinden muzik calma, define <word>, spell <word>, bunlar hep closed set vocabulary intent classification modelleri ile yapilabilecek seyler.

    gosterilenler arasinda en enteresan (adam gibi yapmasi zor) kismi question answering, o da gelecekten degil gecmisten bir sahne gibi... zira wikipedia yahut freebase dump edip <entity,attribute> pairlerine cevap verebilmek google, apple (siri) yahut bing'in 3-4 yildir yapabildikleri birsey. "how tall is mt everest" yerine "what is the second longest river in africa" sorusuna cevap versin tamam, diyeyim bir teknoloji gelistirmisler... mt. everest entity'sinin height attribute'una ulasacak natural language sorulari bulmak kolay. africa entitysinin "second largest river" gibi bir attribute'u yok. afrikadaki nehirleri uzunluklarina gore siraya dizip ikinci siradakini getirmek gerekiyor. search engine'lerin icine gomulmus olmasalar da state-of-the-art question answering sistemleri bunu yapabiliyorlar.

    daha kolayindan "who is playing san francisco next?" sorusuna "which one, giants or 49ers?" gibi bi disambiguation cevabi verebiliyor mu yoksa birini marginal probability'e gore secip kafasina gore cevap mi veriyor ya da hepsini birden mi soyluyor merak ettim. bu noktada problem hangi sorunun cevabini bilemedigini bilememek. ve bu ornekte hepsini birden soylemek de guzel bir cozum (3 ya da 2 alternatifin varsa)... ya resolve edemedigin seylerin sayisi cok fazlaysa... how old is angelina jolie's kid... say babam say sabaha kadar...
37 entry daha
hesabın var mı? giriş yap