Son zamanlarda yapay zekâ alanında büyük bir rekabet yaşanıyor. Google VEO, EMO, Sora modeleri, metinden gerçekçi videolar oluşturma yeteneğiyle dikkat çekerken, şimdi de Çinli şirket Kuaishou, yeni bir rakip olan Kling’i tanıttı. Bu yeni yapay zekâ aracı, sosyal medyada büyük ilgi gördü ve birçok kişi tarafından Sora’dan daha iyi olduğu iddia edildi. İşte Kling hakkında bilmeniz gerekenler ve yapay zekâ dünyasında yarattığı etki.
Kling Nedir?
Kling, metinden video oluşturma alanında önemli bir yenilik olarak karşımıza çıkıyor. Kling, Çinli video platformu Kuaishou tarafından geliştirilen ve metinden videolar oluşturabilen bir yapay zekâ modeli. Bu model, sosyal medyada paylaşılan örneklerle kısa sürede büyük ilgi topladı. Kling’in temel özellikleri arasında 1080p çözünürlükte ve 30 FPS hızında videolar üretebilme kapasitesi bulunuyor. Model, 2 dakikaya kadar uzunlukta ultra gerçekçi videolar oluşturabiliyor. Bu tür yenilikler kullanıcıların daha yaratıcı ve dinamik içerikler üretmesine olanak tanıyor.
Kling ve Sora Arasındaki Farklar
OpenAI’ın Sora modeli, metinden videolar oluşturma konusunda öncülerden biri olarak dikkat çekmişti. Ancak Sora, 1 dakikaya kadar videolar oluşturabiliyordu. Kling ise bu süreyi 2 dakikaya çıkarmış durumda. Ayrıca, Kling’in videolarındaki fotogerçekçilik seviyesi sosyal medyada büyük beğeni topladı. Gerçek dünya fiziğini doğru bir şekilde simüle edebilen Kling, gelişmiş hareket ve mimik özelliklerine sahip. Bu, kullanıcıların daha dinamik ve inandırıcı videolar oluşturmasını sağlıyor.
Kling’in Teknik Detayları
Kling’in arkasındaki teknoloji oldukça etkileyici. Model, 3D zaman uzay algılama sistemi ile hareket sekanslarını doğru bir şekilde modelleyebiliyor. Ayrıca difüzyon trasformatörü mimarisinden güç alarak, gerçek dünyadaki fiziksel varlıkları başarılı bir şekilde simüle edebiliyor. Bu özellikler, Kling’in videolarının gerçek dünyaya çok yakın olmasını sağlıyor.- Komut Takibi ve Hareket: Kling, verilen komutları etkili bir şekilde takip edebilme yeteneğine sahip. Bu da videoların istenilen şekilde oluşturulmasını sağlıyor.
- 3D Yeniden Yapılandırma: Model, yüz ve vücut mimiklerini daha iyi yansıtabilmek için gelişmiş 3 boyutlu yeniden yapılandırma tekniklerini kullanıyor.
- Uzun Video Üretimi: Rakiplerine kıyasla daha uzun videolar üretebilme yeteneği, kullanıcıların daha kapsamlı hikayeler anlatabilmesini mümkün kılıyor.
