Yapay zeka tabanlı teknolojilerin gelişmesi makine öğrenimi ve derin öğrenmenin sayesinde gerçekleşiyor. Günümüzde kullandığımız en basit teknolojik cihazlarda bile yapay zeka kullanılabiliyor. Bu nedenle gelişmiş yapay zeka teknolojisini içeren cihazlar şu an bilim insanlarının ve mühendislerin geliştirmek istediği yegane şey. MIT-IBM Watson Lab ekibi ise tam da bu noktada gelişmiş yapay zekayı video tanıma teknolojisi alanında kullanmak istiyor.
Video tanıma teknolojisi yapay zeka ile mobil hale geliyor
Biraz önce de bahsettiğimiz gibi yapay zeka kullandığımız veya izlediğimiz birçok alanda karşımıza çıkıyor. MIT-IBM Watson Lab ekibi ise mobil cihazlarda bile hızlı ve doğru bir şekilde çalışan bir algoritma üzerinde çalışıyor. Bu çalışma hedeflendiği şekilde ilerlerse makine öğrenmesi sayesinde video tanıma teknolojisi mobil cihazlarda da çalıştırmak kolaylaşabilecek.
Yapay zeka makine öğrenimi sayesinde bilgisayarlarda yüzleri tanımlıyor ve trafikteki taramaları yapmak gibi birçok alanda kendisini gösterebiliyor. Ancak iş gerçek dünyadaki fotoğraflar ve videolara gelince yapay zekanın aklı karışabiliyor.
Bu nedenle çalışmalar yapan ekip, yeni geliştirdikleri yöntem sayesinde gerçek dünyadaki sorunları çözebileceklerini düşünüyor. Video tanımlama teknolojilerinin modellerine yeni bir boyut kazandıran ekip, eğitim sürecini hızlandıran ve mobil cihazlardaki performansı artıran yöntem ile karşımıza çıkıyor.
Söz konusu modelin çalışma prensibine bakıldığında, video tanıma modellerinin zamana bakışını değiştirdikleri görülüyor. Zaten ”the temporal shift module” olarak tasarlanan yöntem, mevcut yöntemlerden farklı olarak zamanın geçişini daha büyük kodlama satırlarından kurtarıyor. Bu kapsamda eğitilen algoritma mevcut yöntemlerden üç kat daha hızlı hale gelebiliyor.
Normalde video tanıma modellerinin mobil cihazlarda çalışması kolay bir işlem değildi. Bahsettiğimiz değişim modülü sayesinde video tanıma modelleri mobil cihazlarda da çalışabilecek. Çalışma ekibinde yer alan Song Han, amaçlarının yapay zekanın düşük güçte çalışan cihazlarda herkes için erişilebilir hale getirmek için daha az enerjiye ihtiyaç duyan ve sorunsuz çalışabilen bir model tasarlamak olduğunu söylüyor.
Facebook ve YouTube gibi platformlarda yayılan şiddet ya da taciz içerikli videoların tespitini kolaylaştıracak bu yöntem aynı zamanda hastanelerin verilerini bulutta değil yerel olarak hassas verilerin güvenliğini koruyabilir. Birçok alanda başarı sağlanabilecek bir yöntem olan söz konusu model bu ayın sonunda, uluslararası bir konferansta sunulacak.