谈一谈神经网络成了“香饽饽”,搜狗公布语音实时翻译
这项技术是基于大数据和深度学习,联合了搜狗自主研发的语音辨认、机器翻译两项重要技术,从无到有的研发进程仅历时4个月。“之所以语音团队会去做翻译,是由于随着技术的缓缓交叠和融合,咱们发现语音辨认和机器翻译都是一个序列到另一个序列学习进程,因此,语音的积攒也就可能转到翻译下来做。”搜狗语音交互技术担任人陈伟示意。
传统机器翻译所采用的支流模式叫“统计翻译”,从语料库大量的翻译实例中主动学习翻译知识,然后应用这些翻译知识主动翻译其余句子。这就需求把整个建模流程分成对齐模型、分层模型等多个模型,每个模型实现特定的很小的性能,最后串起来实现简单的机器翻译系统。在这个进程中,每个模型的谬误也会始终叠加。 在翻译畛域,神经网络俨然是个“香饽饽”。 文|百晓 今年0月,谷歌正式导入神经机器翻译系统(Neural Machine Translation),它能让翻译系统不再像以前一样逐字逐句的翻译,而是根据整篇文章的大意来对句子停止剖析。而短短三个月后,谷歌翻译再次更新,除了让神经机器翻译系统支持更多语系外,也让谷歌翻译结果愈加人造,更合乎人类惯用的语法。 不过,“翻译官们”临时也没必要担心本人的饭碗。虽然机器翻译取得了新一阶段的打破,但因为言语和环境的简单性,想要齐全依托人工智能和语义理解还有很长的路要走。 机器学习和训练首先需求大量样本,谷歌翻译过去20年积攒的海量翻译数据正好提供了这样一个学习的土壤。“深度学习的技术对各家来说没有太强的隐衷可言,真正的壁垒还是在数据上,你的数据决议了你最后的效果。”搜狗语音交互技术担任人陈伟示意,搜狗的语音输入日频次达到2.0亿次,珠海翻译公司,每日收集的用户语音语料从三个月前公布语音交互引擎知音时的22万小时,添加到26万小时。 22月22日,搜狗对外公布了语音实时翻译技术。当然,这并非搜狗言语实时翻译技术的初次亮相,在刚刚完结的第三届世界互联网大会上,搜狗CEO王小川就曾在现场演讲中演示该技术,每当王小川讲完一句话之后,其身后屏幕便实时实现了语音和文字转换,提前只要2秒。 对于机器翻译来说,终极的幻想就是输入一个语音,间接出对应的结果,中间一切的事件都交给模型去做,但传统机器翻译却未能无关键打破,这要从完成模式上讲起。 这次搜狗推出的实时语音翻译,在完成门路上不同于传统机器翻译,而是融合端到端神经机器翻译技术以及基于实例的翻译技术,利用的端到端神经网络翻译模型经过编码端获取源端句子的散布式示意,应用留意力模型聚焦源端,利用循环神经网络生成翻译结果,准确率可能降职40%-40%。 “搜狗的使命是让表达和获取信息更简略。未来,搜狗会经过人造交互和知识计算,促进更多人工智能产品的落地。”对于输入法的终极想象,王小川说,输入法的极致,是可以末尾寻觅信息,帮你思索。