Metin Yerine Videodan Öğrenen Yapay Zekâ “V-JEPA”
V-JEPA’nın üretimsel bir model olmadığını belirten kaynaklar, bu modelin video maskeleme kullanılarak yapılan ön eğitimden sonra nesneler arasındaki son derece ayrıntılı etkileşimleri tespit etme ve anlama konusunda başarılı olduğunu vurguluyorlar. V-JEPA’nın gelecek modeller için örnek oluşturabileceği ve yapay zekâ alanında erişimin genişlemesine katkı sağlayabileceği belirtiliyor. LeCun’a göre, mevcut yapay zekâ ekosisteminde modellerin eğitimi büyük zaman ve hesaplama gücü gerektiriyor. Ancak, yeni modelin başarılı olması durumunda yapay zekâ ekosisteminde önemli sonuçlar elde edilebileceği düşünülüyor.
V-JEPA’nın gelecekte videoya ses eklenmesiyle modele yepyeni bir veri boyutu sağlanacak. Meta, V-JEPA modelini ticari olmayan lisansı Creative Commons altında yayınladı, böylece araştırmacılar bu modeli deneyebilecekler. Bu model, insanlar gibi öğrenme yeteneğine sahip gelişmiş bir makine zekâsı inşa etme hedefine doğru atılmış önemli bir adım olarak değerlendiriliyor. V-JEPA’nın insanların yaşamının ilk evrelerinde gözlem yoluyla elde ettiği bilgileri simüle ettiği ve bu bilgileri kullanarak çevresel dünya hakkında öngörülerde bulunduğu belirtiliyor. Ayrıca, V-JEPA’nın videodan temsilleri öğrenerek çeşitli aşağı akış görüntü ve video görevlerine uygulanabilir bir yaklaşım benimsediği ve bu sayede etiketsiz verilerle önceden eğitilmiş olduğu kaydediliyor.
Meta ve Yapay Zekâ V-JEPA
Meta’nın FAIR (temel yapay zekâ araştırması) grubunu yöneten Yann LeCun, V-JEPA’nın, yapay zekâ modellerinin aynı maskeleme tekniğini video görüntüleri üzerinde kullanmaları halinde daha hızlı öğrenebileceklerini öne sürüyor. LeCun, şirketin amacının, insanlar gibi öğrenebilen gelişmiş makine zekâsı oluşturmak olduğunu dile getiriyor.
V-JEPA’nın video görüntülerinden öğrenerek karmaşık görevlerde üstün performans sergileme yeteneği, gelecekteki yapay zekâ araştırmaları için umut verici bir alanı temsil ediyor. Bu modelin, görsel ve işitsel verileri bir araya getirerek daha geniş bir veri yelpazesinden öğrenme yeteneği geliştirilerek gelecek nesil yapay zekâ modellerine ilham kaynağı olması bekleniyor.