<dfn draggable='tz1724i'><ol date-time='rbbv8xe'></ol></dfn>

        1. <i dropzone='tihv0i0'></i>
        2. <aside date-time='afzj4xtt'></aside>

            點點客

            科技造就移動電商先鋒

            股票代碼:430177

            首頁 > 幹貨邦 > 科技動态 > 谷歌神經翻譯有新進展 基于單模型無須訓練
            分享到QQ空間

            雷鋒網 ·  2016-11-17 16:50   33
            摘要:近日,來自谷歌的工程師門發表了一篇論文,上面提到如何隻用一個模型實現多語言之間的翻譯。這個模型被稱爲NMT模型。

            大家都知道,歐盟擁有24種官方語言,理想情況下,歐盟的翻譯官們應該能夠随時從一種語言直譯到另一種語言,但這種翻譯組合實在是太多了,高達576種,所以他們選擇英語當做中間語言來解決這一問題。


            同樣地,我們的谷歌工程師們也面臨着同樣的問題,但谷歌面臨的麻煩要更大一點,因爲他們需要翻譯的語言種類要比歐盟的官方語言多,達到100多種,(例如:英語翻法語是一種組合,而法語翻英語又是另一種組合),而這些翻譯組合會高達上萬種。



            如果爲每一種組合訓練一種神經翻譯模型的話,那麽就需要訓練上萬個。真的是好多啊!但是現在不要了,我們隻需要一個模型就可以解決這些問題。近日,來自谷歌的工程師門發表了一篇論文,上面提到如何隻用一個模型實現多語言之間的翻譯。這個模型被稱爲NMT模型。NMT模型的訓練不需要任何語言學知識,且具有模型簡單、翻譯質量高等優點。它基于原有的單一語言翻譯模型,但不需要對原有翻譯模型進行任何修改,便可實現多語言之間的翻譯。


            論文顯示這種新方法有三個優點:


            一、簡單,即減少需要訓練的模型數;


            二、改善翻譯質量。尤其是那些訓練語料不足的語言;


            三、具有‘zero shot’翻譯能力,即如果我們訓練一個模型可以将葡萄牙語翻譯成英語,然後在訓練一下讓其可以實現英語到西班牙語之間的翻譯,此時神奇的一幕出現了,我們雖然并沒有進行葡萄牙語到西班牙語之間的翻譯,但是此時模型仍然可以實現葡萄牙語到西班牙語之間的正确翻譯。


            谷歌宣稱這是世界首次研發出zero-shot翻譯。很明顯,zero-shot還具有明顯的速度優勢,它可以使解碼時間減半。 其另一個優勢就是可以實現句間轉換。如果一個句子中包含不止一種語言,它照樣可以翻譯。這樣如果一個大的數據集中如果包含多種語言,那麽它照樣可以實現翻譯。論文的最後,谷歌翻譯人員用BLEU方法對翻譯結果進行評判,發現結果改善不少。


            實際上,神經機器翻譯還有很長的路要走。谷歌貌似已經将NMT推廣到了其它語言翻譯上,例如英語到德語的翻譯。在我們對谷歌翻譯進行的随機測試中,我們發現其翻譯流暢度有所提升,但仍有一些漏翻或誤翻。


            論文簡介:《Googles Multilingual Neural Machine Translation System:Enabling Zero-Shot Translation》


            我們用一個簡單而優雅的多語言神經機器翻譯模型解決了多種語言之間的翻譯問題,這個模型與原有模型對比并沒有任何改變,隻是在輸入句子時引入了一個變量,以标明需要翻譯的目标語言是什麽。後面的編碼、解碼、注意力模型在所有語言中都一樣,詞表也共享,參數無需要增加。


            與我們起初的設計相比,實現了極大的簡化。在保持參數值不變的情況下,翻譯質量居然還有所提升。在WMT14測試中,我們的模型在英法翻譯中不比任何模型差,在英德翻譯中比任何模型好,在多語言測試中,我們的模型在14年法英、15年德英翻譯中效果最優。我們的模型不僅可以對12種語言對(例如英法、法英,這是兩個語言對)進行翻譯,而且其翻譯效果也比大多數單語言對的翻譯模型還要好。除此之外、對于沒有訓練過的語言對,我們的模型仍然可以學習,這就表明神經網絡是可以實現遷移學習與‘zero-shot’翻譯的,在文章最後我們将向大家介紹一些在混合翻譯中發生的一些趣事。


            免責聲明

            知識要點