teknolojiuzmani
FD Üye
OpenAI uzmanları, Minecraft'ı insan oyuncular kadar yüksek standartta oynayan bir hudut ağını eğitti. Sinir ağı, klavye ve fare girişlerinin de kaydedildiği, yüklenicilerin muhakkak oyun içi vazifeleri gerçekleştirdiği küçük bir görüntü veritabanıyla desteklenen 70.000 saatlik çeşitli oyun içi imgeler ile eğitildi.
İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiği gördü. Tıpkı vakitte, oyuncunun yükselmek için sıçrarken altına bir materyal bloğu yerleştirdiği bir hareket olan “sütun tırmanmayı” da kavradı.
Belki de en etkileyici olanı, yapay zeka, OpenAI'nin bir bilgisayar ortacısı için gibisi görülmemiş bir muvaffakiyet olarak tanımladığı, sırayla yürütülmesi gereken uzun bir dizi hareketi gerektiren elmas araçları üretebildi.
Minecraft projesi, şirketin Görüntü PreTraining (VPT) olarak isimlendirilen AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin işe yaradığını kanıtladığından ötürü büyük değer taşıyor.
Geçmişe bakıldığında, yapay zeka modellerini eğitmek için bir kaynak olarak ham görüntüyü kullanmanın en büyük zorluğu, olanların anlaşılması için gereğince kolay olmasıydı, lakin bu görüntü eğitimleri sonuçların nasılını öğretmiyor. Gerçekte, AI modeli istenen sonuçları emiyor, lakin bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamıyor.
Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, ihtimamla seçilmiş bir imaj havuzuyla halka açık web kaynaklarından alınan büyük bir görüntü data kümesini eşleştiriyor.
Ekip, temel modelde ince ayar yapmak gayesiyle makul misyonları öğretmek için tasarlanmış daha küçük data kümelerini ekler. Bu manada, OpenAI, ağaçların kesilmesi ve üretim istasyonları inşa edilmesi üzere erken oyun aksiyonlarını gerçekleştiren oyuncuların imajlarını kullandı. Bunun, modelin bu vazifeleri yerine getirebildiği güvenilirlikte "büyük bir gelişme" sağladığı söyleniyor.
Bir öteki teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi misyondaki her adımı başarmak için AI modelini "ödüllendirmeyi" içeriyor. Bu süreç, hudut ağının insan seviyesinde bir muvaffakiyet oranına sahip olarak bir elmas kazma üretebilmek için tüm gereçleri toplamasını sağladı.
OpenAI tarafından gönderilen bir blog yazısında “VPT, sadece lisandan daha fazla alanda direkt büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici mümkünlüğünü sunuyor. Sadece Minecraft'ta deneyler yapsak da, oyunun ucu çok açık ve lokal insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın başka benzeri alanlar, örneğin bilgisayar kullanımı için güzele işaret ettiğine inanıyoruz."