
Metnin icadı bundan binlerce yıl öncesine dayanıyor. O günlerden bu yana her topluluk kendi lisanını, kendi alfabesini kullandı. Kimi lisanlar devir içerisinde büyüyüp gelişti, kimileri ise kayboldu gitti.
İngiliz arkeolog Arthur Evans, Akdeniz’de bulduğu taşlarda bir alfabenin kayıtlı olduğunu keşfetmişti. Daha sonra bu taşlarda aslında Linear A ve Linear B isimli iki farklı alfabe ve lisan olduğunu keşfeden araştırmacı, bu lisanları çözmeyi başaramadı. Linear B’nin sırrı, 1953 yılında amatör dilbilimci Michael Ventris tarafından çözüldü.
Ventris’in bulduğu tahlilin temelinde ise iki fikir yatıyordu. Bunlardan biri, metinde çok geçen sözcüklerin, taşların bulunduğu Girit Adası’ndaki konum ve kişilerin isimleri olduğu idi. Bahtına, bu yaklaşımı akıllıca çıktı. Gayri niyeti ise lisanın, erken periyot Yunan lisanlarından biri olduğu idi. Daha sonra metin süratle çözüldü.

Linear A ise çözülemeyen bir lisan olarak akıllarda kaldı. Günümüzde kullanılan makine çeviri teknikleri ve makine öğrenmesi teknolojisi, bu noktada bilim beşerlerine yeni bir umut oldu.
MIT’den Jiaming Luo ile Regina Barzilay ve Google’dan Yuan Cao, yeni bir makine öğrenmesi sistemi geliştirdi. Bu sistem, kayıp lisanlarda çeviri yapabiliyor. Üretilen yeni yazılım, Linear B lisanını otomatik olarak çevirdi. Bir kayıp lisanın otomatik olarak çevirisinin yapılması ise tarihte bir birinci oldu.
Olağanda makine öğrenmesi, emsal metinleri karşılaştırma temeline dayanır. Olgu tabanındaki lisanlarda bir arada bulunan sözcükleri, sözcük etkileşimlerini takip eder. Daha sonra da yalın matematiksel hesaplamalar yapar. Haliyle makine öğrenmesini çok az metin bulunan lisanlara uyarlamak mümkün değil üzere gözüküyordu.
Bundan birkaç yıl evvel ise bu inanış değişti. Alman bilim kişileri, makine öğrenmesini çok büyük olmayan done setleriyle de gerçekleştirmeyi başardı. Luo ve ekibi ise bu çalışmayı bir adım daha ileri taşıyarak meyyit lisanların çevirisini mümkün kıldı.

Çalışmalarda, lisanların yapısal olarak belirli çeşitlerde evrim geçirdikleri ve ona nazaran şekillendikleri malumatından yola çıkıldı. Böylelikle çerçevesi ve etkileşimleri net olarak zahir olan lisanların çevirisi mümkün oldu. Linear B ve İbranice’nin atası diyebileceğimiz Ugaritik lisanında makine çevirisi büyük muvaffakiyet sağladı.
Artık gözler, Linear A’nın nasıl çözümleneceğine dönmüş durumda. Luo ve ekibi makalelerinde hiç bahsetmese de lisan bilimciler için büyük merak konusu olan bu alfabenin tahlili için de makine öğrenmesinden destek alınması bekleniyor. Sonuçta makineler, bizden daha süratli denemeler yaparken yorulmak nedir bilmiyor.
Makale, arXiv üzerinde yayımlandı.