bilgisayarci
FD Üye
2010 yılında kurulan ve 2014 yılında Google bünyesine katılan yapay zekâ takımı DeepMind, bugün epey heyecanlandırıcı bir teknoloji tanıttı. Takım, DALL-E 2 ve MidJourney üzere yapay zekâ araçlarının tersine bu kere var olan bir şeyi daha da büyük çaplı bir şeye dönüştürebilen bir yapay zekâ geliştirdi.
DeepMind’ın ‘Transframer’ ismini verdiği yeni yapay zekâsı, yalnızca tek bir resmi baz alarak fotoğrafın içinde yaşamanızı sağlayacak 30 saniyelik videolar oluşturabiliyor. Elde edilen görüntü, GIF olarak kaydedilebiliyor. Gelin, yeni yapay zekânın yapabildiklerine yakından bakalım.
Fotoğraftaki alan ve etrafı, üç boyutlu olarak hayal ediliyor:
Transframer, yüklediğiniz bir fotoğrafı tahlil ediyor ve bu fotoğrafta yer alan nesneleri ve nesnelerin etrafını kestirim ediyor. Bu sürecin akabinde yapay zekâ, objelerin farklı açılardan nasıl görülebileceğini de düşünüyor. En sonunda ortaya çıkan manzara ise sahiden orada çekilen bir görüntü üzere oluyor.
Transframer, bir nesnenin farklı açılardan nasıl gözükebileceğini şu biçimde oluşturuyor:
Peki bu teknoloji ile neler yapılabilecek?
Transframer, tıpkı DALL-E 2 ve MidJourney gibi sonsuz seçeneklere kapı açıyor. Bu yapay zekâ sanat, bilimsel tahlil ve yapay zekânın daha ileri gelişimi için kullanılabileceği üzere birebir vakitte tahminen de DALL-E 2 ve MidJourney ile oluşturulan hayali alanları da 360 derecelik bir alana çevirebilir. Bu alanlar da gelecekte sanal gerçeklikte bulunabileceğimiz alanlar olarak hayatımızda yer edinebilir. Yapay zekâ ile yapılabilecekler, yalnızca hayal gücümüzle sonlu olacak.
Yapay zekâ şimdi herkesin kullanımına açılmamış olsa da DeepMind takımı, bu teknolojiyi mümkün kılan algoritmaları yayımladıkları araştırmada paylaştı. Yazılım meraklıları, bu algoritlamara ve algoritmaların açıklamalarına bu temasa tıklayarak ulaşabilirler.