歡迎光臨
我們一直在努力

一分鐘了解機器翻譯

機器翻譯,又叫自動翻譯,是指利用計算機將一種自然語言轉換為另一種自然語言的過程。

作為比人工智能這個詞誕生的還早的自然語言處理任務,機器翻譯經歷了漫長的發展過程,大致可以分為三個階段。

第一個階段是基於規則的翻譯方法。 與人類類似,這種方法會先分析句子中單詞的詞性,將每個詞翻譯成目標語言,再根據語法規則等進行調整,輸出結果。

可想而知,這種翻譯方法效果並不好,因為語言表達的方法非常靈活,有限的語法和規則無法覆蓋所有的語言現象。

第二個階段是基於統計的翻譯方法。 即根據詞或短語找到所有可能的結果,再在龐大的語料庫中進行搜索,統計每種結果出現的概率,將概率最高的結果進行輸出。

這種方法較規則方法效果有很大提升,不過對語料庫的依賴較大。

第三個階段是基於神經網絡的翻譯方法,通過學習大量成對的語料讓神經網絡自己學習語言的特徵,找到輸入和輸出的關係,端到端的輸出翻譯結果,取得了不錯的效果。

不過這些方法並不是非此即彼的。 比如在成對語料較少的語言之間,用統計方法效果比較好;或者乾脆沒多少語料,就要靠中間語言進行轉換;有些約定俗成的成語短語,用基於實例的翻譯方法能更好的解決 。

現在的機器翻譯系統,基本上會將幾種方法的優點進行融合,不過距離翻譯的標準——信、達、雅,還有很遠距離。

*文章為作者獨立觀點,不代表虎嗅網立場

本文由 KnowingAI知智 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文請於文首標明作者姓名,保持文章完整性(包括虎嗅注及其餘作者身份信息),並請附上出處(虎嗅網)及本頁鏈接。 原文鏈接:https://www.huxiu.com/article/262609.html

未按照規範轉載者,虎嗅保留追究相應責任的權利
未來面前,你我還都是孩子,還不去下載 虎嗅App 猛嗅創新!

未經允許不得轉載:頭條楓林網 » 一分鐘了解機器翻譯