DeepMind araştırmacıları, sinir ağlarının nörosimbolik modellerden daha iyi performans gösterebileceğini iddia ediyor

DeepMind araştırmacıları, sinir ağlarının nörosimbolik modellerden daha iyi performans gösterebileceğini iddia ediyor
Algoritmaları sembolik akıl yürütme teknikleriyle birleştiren nörosembolik modeller, karşı olgusal olasılıkları tahmin etmek, açıklamak ve değerlendirmek için sinir ağlarından çok daha uygun görünmekte. Ancak DeepMind'deki araştırmacılar, sinir ağlarının doğru test koşulları altında nörosimbolik modellerden daha iyi performans gösterebileceğini iddia ediyorlar.

Araştırmacılar, tüm bileşenlerin öğrenildiği ve tüm ara temsillerin (sembolik değil) sinir ağının katmanları boyunca dağıtıldığı videolar hakkında mekansal-zamansal akıl yürütme için bir mimari tanımladılar. Ekip, karşı olgusal sorularda ve popüler bir veri kümesindeki tüm sorularda nörosimbolik modellerin daha başarılı performansın sergilediğini söylüyor.

DeepMind’ın araştırması, deneyimleri hakkında akıl yürütebilecek makinelerin geliştirilmesine yönelik çalışmalarda kullanılabilir olarak görülüyor. Araştırmacılar, daha önce yalnızca dağıtılmış temsillere dayalı modeller üzerinde yapılan bazı çalışmaların sonuçlarının aksine bu yeni çalışmanın, en azından mevcut nörosimbolik modellerden daha iyi performans gösterdiğini, üst düzey bilişsel işlevleri ölçen görsel temelli görevlerde gerçekten iyi performans gösterdiğini belirtiyor.

Makalede önerilen sinir ağı mimarisi, bilgiyi etkili bir şekilde entegre etmek için dikkat çekiyor. (Dikkat, algoritmanın bir seferde tek bir öğeye veya birkaç öğeye odaklandığı mekanizmadır.) Kendi kendine denetlenir, yani modelin daha fazla bilgi çıkarmak için temel dinamikleri kullanarak videolarda maskelenmiş nesneler çıkarması gerekir. Bu yeni mimari, videolardaki görsel öğelerin çözümlenmesinde kullanılıyor.

CLEVRER ile yapılan karşılaştırmalarda yeni modelin, (CLEVRER bir fizik motoru tarafından oluşturulan çarpışan nesnelerin (iki malzemeden üç şekil ve sekiz renk) 20.000'den fazla 5 saniyelik videosu için 300.000'den fazla soru ve yanıtı içerir ve bunlar mantıksal akıl yürütmenin dört unsuru olan betimleyici, açıklayıcı, öngörü ve karşı olguya odaklanır), ön eğitim veya etiketlenmiş veriler olmadan ve %40 daha az eğitim verisi ile aynı performansını yakalağı belirtiliyor. Dahası, en zor karşı olgusal sorularda % 59,8 oranında daha yüksek bir başarı elde etti

Araştırmanın yazarları, "Sonuçlarımız ... derin ağların, insan bilişinin ve muhakemesinin birçok özelliğini taklit ederken, aynı zamanda dağıtılmış temsillerin esnekliğinden ve ifade edilebilirliğinden yararlandığına dair bir kanıta katkıda bulunuyor" diyerek çalışmalarını özetlediler.

HABERE YORUM KAT

Bilim - Teknoloji