谷歌将推出103种语言翻译模型,针对250亿个句子训练,共有500亿参数

原创 2019-10-15 话题分类:智能制造
摘要: 谷歌将推出支持103种语言翻译模型的神经机器,其中针对了250亿个句子进行了训练,光是参数量就有500亿,可见小种语言的翻译,在谷歌的研究下,将为群众们的使用,再次提高使用的阶梯和层次。

谷歌,喻有“人类文明开拓者”之称,足以看得出谷歌的地位和口碑,经历过华为的事件之后,大家也能看得出谷歌的影响力。对于谷歌来说,小种语言因为缺少平行数据,所以翻译的时候也缺乏着一定的优势。

图片1.png

不过有关谷歌的研究者指出,谷歌将推出支持103种语言翻译模型的神经机器,其中针对了250亿个句子进行了训练,光是参数量就有500亿,可见小种语言的翻译,在谷歌的研究下,将为群众们的使用,再次提高使用的阶梯和层次。

对于谷歌的这次新研发和挑战,可能很多网友会觉得研发的过程难度比较大。比如说多种语言的训练数据,因为NMT(神经机器翻译)的发展,MT(机器翻译)的系统也得到了很大的提升,但是想要打破全国各地的语言翻译,尤其是对于各国的小种语言来说,还是有着一定的障碍和难度。那么,如果缺少训练的数据,又或者是没有训练的数据又该怎么办呢?

这个时候,多种语言的NMT就是一种有效的解决方案,NMT使用的是一种语言,可以处理多种语言的模型,数据缺乏的语言训练,已经列入自动语言识别当中,文本转语言的系统。对此,谷歌研究者曾经对单个神经网络,可以学习语言的数量,同时还控制了每种语言的训练数量。

在相关的研究数据当中,到了21世纪末期的时候,全球至少了7000多种,目前使用的语言将不会存在,那么语言翻译系统能够拯救这些语言吗?对于,谷歌方面则是认为,从这类语言模型开始,就算是没有平行语料,也可以将机器的翻译,扩展到新的语言和领域当中。在通过语言机器的翻译上,很多能够或者是有希望解决方案,几乎都是跨领域完成的。多种语言的NMT,正在逐渐地成为多种任务的学习。

即使跨语言的翻译对数据的倾斜,是NMT任务进行和研究当中的一大难题和挑战,但是这种倾斜也成为了研究者,创造时一种发现理想的慧眼。在一种语言训练上所得到的信息,可以应用在其它语言的翻译中。对于谷歌的这一项创造和发明,很多网友也在翘首以盼当中,相信以谷歌的能力和创造天赋,也不会在此项目让大家失望。那么,对于谷歌将推出103种语言翻译模型的新想法,大家都有什么看法呢?欢迎评论区一起交流讨论。

本文为“知顿(http://www.qingfengm.com)”的原创稿件, 作者:啊野, 责编:青青, 欢迎转载,转载请注明原文出处。如有疑问,请您联系我们。

0
好文章,需要你的鼓励
知顿slogan
参与评论
请回复有价值的信息,无意义的评论将很快被删除,账号将被禁止发言。
最新评论