新鲜事

Google 的翻译 AI 连没学习过的语言配对也能翻译了

Google 的翻译 AI 除了直接学习过的语言之外,现在连没有学过的也能试着翻译了呢。Google 翻译服务支持的语言一共有 103 种,如果每一种组合都要能对翻的话,Google 必须要训练 AI 5,253 对的配对方式 — 考虑到每种语言都有上百万种的范例要学习,这显然是不现实的。Google 最近在转换到神经元网络翻译(Google Neural Machine Translation, GNMT)系统后,发现有学习过的语言组合翻译品质有变好,于是他们便想,能不能进一步应用到没有学过的语言呢?

举例来说,如果 GNMT 会了英翻日和英翻韩的双向翻译,那是否也能合理地进行日翻韩的双向翻译呢?答案是肯定的,而且翻得远比工程师们预期的还要好。但到底 GNMT 是怎么办到的,连研究专家们都不是很确定,只能从资料结构的 3D 视觉化表示去分析,发现 GNMT 把不同语言,但语意接近的句子都放在了一起。

这表示系统不光只是知道词与词之间的对应关系,甚至连整个句子都有做完整的分析。学者们怀疑这是否能解释成其实 GNMT 自己已经有了一套「语言」,而所有的翻译都是先翻成 GNMT 能理解的中介语言,再翻译成最终结果的。

在一个实验中,研究团队将 12 种语言整合成一套模型,只占用和过去一对语言相同的资料空间。虽然资料量大幅减少,但翻译品质「只有些许的下降」。这对 Google 迅速开展更多语言间的翻译,是个大好消息吧!只是不知道再这样发展个几年,是不是专职翻译工作的人就要等着失业了…(抖)。

来源:engadget中国

发表评论

电子邮件地址不会被公开。 必填项已用*标注