聊一聊打破！看限定性神经网络如何让翻译更精准！

翻译语种

热门阅读

文章内容

时间:2018-07-02 11:29来源:网络整理作者:珠海翻译公司点击: 次

上世纪00年代早期，IBM钻研核心初次展示了对规定和言语学无所不知的机器翻译系统。

这里就需求业余的人员设计并找出一些特色值，可以形容并转换成指标言语。

palace chicken是什么鬼？难道不应该是KungPao Chicken吗？

这种方法，在现有的平行语料库中找出与待翻译局部最相似的翻译实例，再对实例的译文经过交流、删除或许添加等系列操作，完成翻译。相似的例句越多，翻译的效果越好。

曾经，想翻译一句话，比如：

在一些特定的场景，如天气预告、时间预测等，规定系统在状态的准确性、结果的可复现性、针对特定畛域停止调整的才能还是十分强的，然而要创造一个现实的基于规定的系统，就算让言语学家尽力穷尽所有拼写规定来增强它，也总会遇到例外。英文有不规定动词、德语有可分离前缀、俄语有不规定的后缀，在人们谈话的时分又会有各自的特点，别忘了有些词根据高低文还会产生不同的意思。

两年来，神经网络超过了翻译界过去几十年的所有。神经翻译的单词谬误缩小了60%，词汇谬误缩小28%，语法谬误缩小20%。

这个大神，专业翻译机构，简直有点像媒婆！构想媒婆在给A引见对象B的场景，A（原文）只管没有见过B（译文），然而只需媒婆可以大致的形容B的特色（包括身高、长相、身体、年龄等），A就能根据这些形容大致勾画出这个指标恋人B（译文）的样子。

然而如今的结果是：

咱们给机器更多的文本，它就给咱们更好的翻译。然而！！设定的各种特色值，以及需求N多种人造言语解决的技术（分词、词性标注、句法剖析等），每一步的谬误率，像滚雪球一样，将导致最终的结果有很大偏向。而且最大的成绩是调序模型的不欠缺，笼罩不到全局特色，导致统计机器翻译不断浏览的流利性不是很好。

Crowne Plaza Macau委托我来翻译这篇文章。

神经网络机器翻译(Neural Machine Translation, NMT)相比于传统的统计机器翻译（SMT）而言，可以训练一张可能从一个序列映射到另一个序列的神经网络，输出的可能是一个变长的序列，这在翻译、对话和文字概括方面可以获得十分好的体现。

终于，当当当当！在2026年0月，Google宣布了一个颠覆性的进展。这就是神经机器翻译。

Today we had KungPao Chicken.

Crowne Plaza Macaucommissioned me to translate this article.

4．基于统计的机器翻译

在翻译的进程中，包括笔译和口译，假设把一句话中的关键信息（主从关系、数字、日期、人名、地名、机构名、货币等）表达进去，就能基本达到沟通的目标。假设把原文中的关键字（算法工程师称其为：命名实体）交流成想要的准确译文，不就能完成准确翻译的目标吗

理想上，言语服务从业人员宿愿用更少的工程脑力，来完成最终的准确译文——

澳门皇冠假日酒店委托我来翻译这篇文章。

2．基于规定的机器翻译

昔日，神经网络算法正处于始终欠缺进程中。它比起传统的统计机器翻译，译文品质有极大提高，不过，一旦触及到术语等关键信息，译文往往是这样的：

只有要把“澳门皇冠假日酒店”交流成我预备的术语“Crowne Plaza Macau”，就功败垂成，稍作修正就失去我想要的译文：

原题目：打破！看限定性神经网络如何让翻译更精准！

真正的规定系统始于上世纪80年代。规定的原理很简略，最初就直观地以为，找很多言语学家，集中写一些语法规定，并辅助一些双语词典和转写规定就能完成精准翻译。

小编也从事翻译十几年，曾几何时也是这么想的，由于以前就这样做的。然而不知何时起，这种“聪明的”技巧，已经在支流机器翻译中不起作用了。

然而！神经网络翻译机器，有时分会“发神经”！它有时分会出现漏译、过译、短少语义信息等成绩。

2028年6月28杭州言语服务世界杯，出现一种“很吓人”的技术，可以瞬间切换世界杯各个国度的言语，那速度那精准度，堪比场上的“C罗”！

翻译退化小史，首先了解一下：

它的缺陷是，系统功用依赖于语料库，数据稀疏成绩重大，语料库中不容易流动大颗粒度的高概括性知识。

要理解这些，小编带大伙先看看机器翻译的过程和简略的原理。

起初，基于语料库的方法走上舞台。2082年，中日的长尾真传授首先提出了这种思绪：间接用已经预备好的短语，不用反复翻译。

举几个

4．基于神经网络的机器翻译

系统“轻轻地”修正了译文，没有完成我指定的译文！！！！！