Desainer alat terjemahan mesin masih mengandalkan kamus untuk memahami bahasa asing. Tapi sekarang ada cara baru, terutama dalam jumlah.
Para peneliti di Facebook mengatakan bahwa mengubah kata menjadi angka dan memanfaatkan persamaan matematika antar bahasa adalah cara yang menjanjikan.
Terjemahan otomatis yang kuat adalah prioritas utama bagi raksasa internet. Ini memungkinkan sebanyak mungkin orang di seluruh dunia untuk berkomunikasi tidak hanya tujuan altruistik, tetapi juga bisnis yang baik.
Facebook, Google dan Microsoft serta Yandex Rusia, Baidu China dan lainnya terus mencari cara untuk meningkatkan alat terjemahan mereka.
Facebook memiliki pakar intelijen buatan yang bekerja di salah satu laboratorium penelitiannya di Paris.
“Hingga 200 bahasa saat ini digunakan di Facebook,” kata Antoine Bordes, co-director Eropa untuk penelitian dasar AI untuk jejaring sosial, seperti dilansir laman Japan Today.
Terjemahan otomatis saat ini didasarkan pada memiliki database besar teks identik dalam kedua bahasa untuk bekerja. Tetapi untuk banyak bahasa tidak ada cukup teks paralel.
Itu sebabnya para peneliti mencari metode lain, seperti sistem yang dikembangkan oleh Facebook yang menciptakan representasi matematis untuk kata-kata.
Setiap kata menjadi “vektor” dalam ruang ratusan ukuran. Kata-kata yang terkait erat dengan bahasa yang diucapkan juga menemukan diri mereka sendiri dalam ruang vektor ini.
“Misalnya, jika anda menggunakan kata ‘kucing’ dan ‘anjing”, semantik, mereka menggambarkan hal yang sama, sehingga mereka akan sangat dekat satu sama lain secara fisik dalam ruang vektor, “kata Guillaume Lample, salah satu dari sistem adalah perancang.
“Jika anda mengambil kata-kata seperti Madrid, London, Paris, yang merupakan ibu kota Eropa, ide yang sama.”
Peta bahasa ini dapat dihubungkan satu sama lain menggunakan algoritma, pada awalnya. Tetapi akhirnya menjadi lebih halus, sampai semua frasa dapat dicocokkan tanpa terlalu banyak kesalahan.
“Untuk pasangan bahasa Inggris-Rumania, sistem terjemahan mesin Facebook saat ini sama atau mungkin sedikit lebih buruk daripada sistem vektor kata,” kata Lample.
“Tetapi untuk pasangan bahasa Inggris-Urdu yang jarang, di mana sistem Facebook tradisional tidak memiliki banyak teks dalam bahasa untuk referensi, sistem vektor kata lebih unggul,” katanya.
Tetapi dapatkah metode ini memungkinkan terjemahan, katakanlah, bahasa Basque ke dalam bahasa suku Amazon?
Secara teori, ya, kata Lample, tetapi dalam praktiknya diperlukan sejumlah besar teks tertulis untuk memetakan bahasa tersebut, sesuatu yang kurang dalam bahasa Amazon.
“Jika kamu hanya memiliki ribuan frasa, itu tidak akan berhasil. Kamu perlu beberapa ratus ribu,” katanya.
Para ahli di Pusat Sains Nasional Prancis CNRS mengatakan bahwa pendekatan Lample yang diambil untuk Facebook dapat menghasilkan hasil yang bermanfaat, bahkan jika itu tidak menghasilkan terjemahan yang sempurna.
Thierry Poibeau dari laboratorium CNRS Lattice, yang juga melakukan penelitian terjemahan mesin, menyebut istilah pendekatan vektor “Revolusi Konseptual”.
Francois Yvon, seorang peneliti di CNRS Computer Science Laboratory for Mechanics and Engineering, mengatakan menghubungkan bahasa lebih sulit ketika mereka jauh dari satu sama lain.
“Cara mempresentasikan konsep dalam bahasa Cina sama sekali berbeda dengan bahasa Prancis,” tambahnya.
Namun, bahkan terjemahan yang tidak sempurna pun bisa membantu, kata Yvon, dan dapat membuktikan cukup untuk melacak ucapan kebencian, prioritas utama untuk Facebook.
https://ift.tt/2IOgbxP
0 komentar:
Posting Komentar
Catatan: Hanya anggota dari blog ini yang dapat mengirim komentar.