Nvidia’nın VideoLDM yapay zeka modelinin tanıtımı, yapay zeka teknolojilerinin metin ve görsel çıktılarından öte, artık video çıktılarında da kullanılabileceğini gösterdi. Cornell Üniversitesi araştırmacılarıyla birlikte geliştirilen VideoLDM modeli, metne dayalı olarak 2048 x 1280 piksele kadar çözünürlüğe, saniyede 24 kare hızına ve 4,7 saniyeye kadar videolar oluşturabiliyor. Nvidia, bu teknolojide 4,1 milyar parametre kullanıyor ve sekans boyunca bir dizi ana kare oluşturarak, ana kareler arasındaki kareleri enterple etmek için başka bir LDM kullanıyor. Şimdilik sadece GIF’ler oluşturmak için kullanılan yapay zeka modelinin, Nvidia’nın daha uzun metinden video klipler oluşturmak için geliştireceği daha gelişmiş teknolojilerle birlikte kullanılabileceği tahmin ediliyor. VideoLDM’nin detayları, 18-22 Haziran’da Vancouver’da düzenlenecek olan Machine Vision and Pattern Recognition Konferansı’nda sunulacak.
Son Yazılar
"Akıllı telefon güvenliği nasıl korunur?"
"YouTube Kullanıcıları İçin Video Önerileri Nasıl Sıfırlanır?"
WhatsApp'ta Artık Gizli Modda Çevrimiçi Olabilirsiniz!
Çok faktörlü kimlik doğrulama önemlidir.
"Apple Watch Mikrofon Problemi İçin 3 Yöntem"
WhatsApp Anket Özelliği: Yeni Nesil İletişimde Topluluğunuzun Fikirlerini Keşfetmenin Yolları