Meta’nın Video ile Öğrenen Yapay Zekâsı “V-JEPA”.

Geçtiğimiz günlerde Meta’nın yapay zekâ yarışına dahil olduğunu duyurmuştuk. Meta hızlı bir başlangıç yaptı ve yeni gelişmesi olan V-JEPA’yı açıkladı. V-JEPA’yı bizlere Yann LeCun tanıttı. Yann LeCun, Meta şirketinin baş yapay zekâ bilimcisi. Bu model, videoları izleyerek öğreniyor. Ayrıca nesneler arasındaki detaylı etkileşimleri tespit edip anlayarak karmaşık görevlerde üstün performans sergilemeyi amaçlıyor. V-JEPA’nın video görüntülerindeki boşlukları doldurarak eğitilmesiyle, yapay genel zekâ hedefine doğru bir adım atılması amaçlanıyor. Meta araştırmacıları, V-JEPA’nın nesneler arasındaki detaylı etkileşimleri tespit etme ve anlama konusunda mükemmel olduğunu belirtiyorlar. Bu model, mevcut yapay zekâ modellerinin yalnızca yazılı metinlerden öğrenmesinin ilerlemeyi önlüyor olabileceği düşüncesini destekliyor.

LeCun, mevcut yapay zekâ modellerinin sadece yazılı metinlerden öğrenmesinin ilerlemeyi yavaşlattığını söylüyor. Üstelik video gibi daha zengin veri kaynaklarının kullanılmasının önemli bir adım olacağını savunuyor. LeCun’a göre, hedeflerinden biri insanlar gibi öğrenebilen programları. Ayrıca uyum sağlayabilen ve karmaşık görevleri tamamlayabilen gelişmiş bir makine zekâsı inşa etmek.

Metin Yerine Videodan Öğrenen Yapay Zekâ “V-JEPA”

Kaynaklar, V-JEPA’nın üretimsel bir model olmadığını belirtiliyor. Ayrıca bu modelin video maskeleme kullanılarak yapılan ön eğitimden sonra daha iyi olacağı söyleniyor. Çünkü V-JEPA’nın nesneler arasındaki ayrıntılı etkileşimleri tespit etme ve anlama konusunda başarılı olduğunu vurguluyorlar. V-JEPA’nın gelecek modeller için örnek oluşturabileceği ve yapay zekâ alanında erişimin genişlemesine katkı sağlayabileceği belirtiliyor. LeCun’a göre, mevcut yapay zekâ ekosisteminde modellerin eğitimi büyük zaman ve hesaplama gücü gerektiriyor. Ancak, yeni modelin başarılı olması durumunda yapay zekâ ekosisteminde önemli sonuçlar elde edilebileceği düşünülüyor.

V-JEPA’nın gelecekte videoya ses eklenmesiyle modele yepyeni bir veri boyutu sağlanacak. Meta, V-JEPA modelini ticari olmayan lisansı Creative Commons altında yayınladı, böylece araştırmacılar bu modeli deneyebilecekler. Bu model, insanlar gibi öğrenme yeteneğine sahip gelişmiş bir makine zekâsı inşa etme hedefine doğru atılmış önemli bir adım olarak değerlendiriliyor. V-JEPA’nın insanların yaşamının ilk evrelerinde gözlem yoluyla elde ettiği bilgileri simüle ettiği ve bu bilgileri kullanarak çevresel dünya hakkında öngörülerde bulunduğu belirtiliyor. Ayrıca, V-JEPA’nın videodan temsilleri öğrenerek çeşitli aşağı akış görüntü ve video görevlerine uygulanabilir bir yaklaşım benimsediği ve bu sayede etiketsiz verilerle önceden eğitilmiş olduğu kaydediliyor.

Meta ve Yapay Zekâ V-JEPA

Meta’nın FAIR (temel yapay zekâ araştırması) grubunu yöneten Yann LeCun, V-JEPA’nın, yapay zekâ modellerinin aynı maskeleme tekniğini video görüntüleri üzerinde kullanmaları halinde daha hızlı öğrenebileceklerini öne sürüyor. LeCun, şirketin amacının, insanlar gibi öğrenebilen gelişmiş makine zekâsı oluşturmak olduğunu dile getiriyor.

V-JEPA’nın video görüntülerinden öğrenerek karmaşık görevlerde üstün performans sergileme yeteneği, gelecekteki yapay zekâ araştırmaları için umut verici bir alanı temsil ediyor. Bu modelin, görsel ve işitsel verileri bir araya getirerek daha geniş bir veri yelpazesinden öğrenme yeteneği geliştirilerek gelecek nesil yapay zekâ modellerine ilham kaynağı olması bekleniyor.