Yapay sinir ağları sayesinde daha gelişmiş çeviri dönemi!

0
4739
BANNERDJX2
BANNERDJX2

“Machine Translation” tekniği 2000’li yılların ortalarından beri uygulamalar ve web sitelerinde yaygın olarak zaten mevcut.

Bilgisayar bilimcileri, uzun yıllardır dilbilgisel kurallara ve bireysel dillerin yapılarına dayalı MT sistemleri kurmaya çalıştı.

MT tekniği uygulanmasından bu yana bizi asıl heyecanlandıran, devrim niteliğinde yeni bir fikir ortaya çıktı: Machine Learning (Makine Öğrenimi).

Uzman çevirmenler tarafından önceden çevrilmiş çok miktarda veri kullanan güçlü algoritmalar, sınırlı kaynaklar ve var olan bu çevirilerle birlikte kelimeleri nasıl çevireceğini öğrenecekti.

2016 yılının sonuna kadar kullanılabilen web siteleri veya uygulamalar gibi ürünler, belirli bir kelimenin mümkün olan en doğru çevirisini tahmin etmeye çalışmak için istatistiksel yöntemler kullanan algoritmalara dayanıyordu. Bu teknolojiye Statistical Machine Translation (İstatistiksel Makine Çevirisi) ya da kısaca SMT deniliyor.

artificial-intelligence-icon-png-14776

Bununla birlikte, SMT’nin sınırlamalarından birisi ise kelimeleri yalnızca tercüme edilen kelimeden önce ve sonra birkaç kelime bağlamında çeviriyor olması, bu da çevirinin genelinde bir karışıklık yaratıyor. Uzun çevirilerin aksine, kısa cümlelerin çevirisinde oldukça iyi çalıştığını söyleyebilirim.

2000’lerin sonlarında, derin öğrenme ya da derin sinir ağları adı verilen ve kısmen insan beyninin işleyişini taklit etmeye çalışan yeni bir makine öğrenimi teknolojisi, hem bulut teknolojisinin son derece büyük ölçekli hesaplama gücünün gelişiyle hesaplama tarafında hem de araştırma tarafındaki gelişmeler (yapay sinir ağlarının nasıl yaratıldığı, eğitildiği ve çalıştırıldığı) sayesinde  çok zor bilgisayar bilimi problemlerini çözme konusunda çalışmak için geçerli bir seçenek haline geldi.

Üst düzey bir Yapay Sinir Ağı çevirisi iki aşamalı olarak çalışmaktadır:

  • Eğer cümle 5 veya 20 kelime uzunluğundaysa, birinci aşama, tüm cümle içerisinde bu kelimenin (ve muhtemel çevirilerinin) bağlamına dayalı olarak tercüme edilmesi gereken kelimeleri modeller.
  • İkinci aşamada ise, Yapay Sinir Ağı tarafından oluşturulan bu kelime modeli, cümle bağlamında, diğer dile çevrilir.
756747838378378378
〈 Microsoft 〉

Yapay Sinir Ağı tabanlı bir MT’den üretilen cümleler, sanki bir insan tarafından bir makineye göre çevrilmiş gibi, genellikle SMT olanlardan daha iyidir ve aynı zamanda daha sağlıklıdır.

İki uygulamanın başlıca özellikleri

Google Translate:

  1. Tarayıcınıza veya telefonunuza bir metin yazabilir ve çevirisini görebilirsiniz.
  2. Parmağınızla dokunmatik ekranınızda bir kelimeyi veya cümleyi çizebilirsiniz.
  3. Telefonunuzun mikrofonuyla konuştuğunuzda gerçek zamanlı olarak söylediklerinizi çevirebilir.
  4. Bir metnin fotoğrafını çektiğinizde bunu çevirir.
  5. Telefonunuzun kamerasını bazı metinlere doğru doğrulttuğunuzda onu gerçek zamanlı olarak çeviriyor.
  6. Yukarıdaki özellikleri internet bağlantınız olmadan kullanabilirsiniz.

Microsoft Translator:

  1. Tarayıcınıza veya telefonunuza bir metin yazabilir ve çevirisini görebilirsiniz.
  2. Telefonunuzun mikrofonuyla konuştuğunuzda gerçek zamanlı olarak söylediklerinizi çevirebilir.
  3. Bir metnin fotoğrafını çektiğinizde bunu çevirir.
  4. Siz ve başka bir kişi telefonunuzun mikrofonuyla konuştuğunda gerçek zamanlı olarak çevrilir
  5. Yukarıdaki özellikleri internet bağlantınız olmadan kullanabilirsiniz.

Microsoft Translator

Microsoft Translator, yapay sinir ağları sayesinde tüm dil çeviri sistemini güçlendiriyor.

Microsoft’un mobil platformunda hali hazırdaki bu teknolojisini kullanan uygulamaları: Skype Translator ve Microsoft Translator. Kullanıcılar Windows 10’da adlıkları Skype çağrılarının tercüme edilmesinde de bu sistemi kullanabilecekler.

Ayrıca, bu teknolojiyi sevdikleri uygulamalara entegre etmek isteyen son kullanıcılar ve geliştiriciler için şirket, Microsoft Translator konuşma API’sini açık kaynak olarak sunuyor.

Arapça, Mandarince, İngilizce, Fransızca, Almanca, İtalyanca, Brezilyaca, Portekizce, Rusça ve İspanyolca. Microsoft Translator konuşma API’sinin desteklediği dokuz dile ek olarak, yapay sinir ağları Japonca metin çevirilerini de destekliyor. Bu 10 dil günlük olarak Microsoft Translator tarafından yapılan çevirilerin %80’inden fazlasını temsil ediyor.

Sinir ağı çevirilerini https://translator.microsoft.com/nual adresinden deneyin ve karşılaştırın.
Yapay sinir ağı çevirilerini https://translator.microsoft.com/nual adresinden deneyebilir ve karşılaştırabilirsiniz.

Microsoft, yapay sinir ağlarının bugün sağladığı kalite iyileştirmelerinin gelecekteki gelişmelere yönelik bir ilk adım olduğunu düşünüyor.

s-curve

Şirket zamanla diğer diller için de desteklerini arttıracaklarını vurguluyor.

Google Translate

Google bundan 10 yıl önce duyurduğu Google Translate uygulamasında algoritma olarak Deyim Tabanlı Makine Çevirisi’ni kullanıyor. O zamandan beri, makine zekasındaki hızlı gelişmeler “konuşma tanıma” ve “görüntü tanıma” gibi yeteneklerini ortaya çıkardı, ancak makine çevirisini iyileştirmek şu an için zorlu bir hedef olmaya devam ediyor.

Google bu yıl 26 Eylül’de, bugüne kadarki en büyük yenilikleri gerçekleştirmek için son teknoloji eğitim tekniklerini kullanan “Google Neural Machine Translation” (Google Sinirsel Makine Çevirisi-GNMT) sistemini duyurdu.

Birkaç yıl öncesinde ise bir girdi dizisi (tek bir dildeki bir cümle) ile çıktı dizisi (başka bir dildeki aynı cümle) arasındaki haritalama bilgilerini doğrudan öğrenmek için Recurrent Neural Networks (Tekrarlayan Yapay Sinir Ağları-RNN) kullanmaya başladılar.

Bu sistemin avantajı, bir önceki Deyim Tabanlı Çeviri sistemlerine göre daha az mühendislik tasarımına ihtiyaç duyması.

Belli bir kaynak cümle için insan değerlendiricilerinin çevirilerin kalitesini karşılaştırdığı yan yana değerlendirmelerden gelen veriler.
Belli bir kaynak cümle için insan değerlendiricilerinin çevirilerin kalitesini karşılaştırdığı yan yana değerlendirmelerden gelen veriler. Skor 0 ile 6 arasında değişmekte; 0 “tamamen saçma çeviri” ve 6 “mükemmel çeviri” anlamında değerlendiriliyor.

Google Translate şu an 103 dili birden destekliyor. Başlangıçta, metni çevirmek için istatistiksel modeller kullanan büyük ölçekli istatistiksel makine çevirisinin öncülüğünü yapan Google, günümüzde Translate’i daha da geliştirerek bir sonraki önemli adım olan Sinirsel Makine Çevirisi’ne geçiş yaptı.

Bu hafta yeni bir duyuru ile Sinirsel Makine Tercümesi 8 dilde işler durumda: İngilizce, Fransızca, Almanca, İspanyolca, Portekizce, Çince, Japonca, Korece ve Türkçe.

Bunlar, dünya nüfusunun yaklaşık üçte birinin ana dillerini temsil ediyor ve tüm Google Translate sorgularının %35’inden fazlasını kapsıyor!

8394683989398

Bu güncelleme ile Google Translate’in son 10 yılda çok daha fazla geliştiğini görüyoruz. Ancak bana göre bu sadece bir başlangıç. Google, bu yeni algoritma sistemini 103 dilin hepsine uygulamak için çalışmalarını sürdürüyor.

Bu haftanın bir diğer duyurusu ise Google’ın bulut hizmeti olan Google Cloud Platform, herkesin makine öğrenme teknolojisini kullanmasını kolaylaştıran Makine Öğrenimi API’lerini açık kaynak olarak sunuyor.

Google Cloud Platform, Sinirsel Makine Çevirisi’nin arkasındaki sistemi, Google Cloud Translation API’sı aracılığıyla tüm işletmeler için kullanılabilir hale getiriyor. Daha fazlasını şuradan öğrenebilirsiniz.

Günümüzde Sinirsel Makine Çevirisi’ne doğru atılan bu adım Google Translate için önemli bir kilometre taşı. Sizinde bu adımda bir katkınız olsun istiyorsanız, Google’ın Çeviri Topluluğu’nda dil çevirileri için katkıda bulunabilirsiniz.