Follow us

翻译应用程序如何解决令人尴尬的错误

2018-10-12 14:01:25 语家上海翻译公司

机器翻译

翻译应用程序正在变得越来越好,但它们仍然不完美,尤其是少数民族语言。人工智能和深度神经网络可以帮助解决问题吗?

该公司表示,今年夏天在俄罗斯举行的世界杯期间,谷歌翻译的使用率大幅上升,因为粉丝试图与他们的主人和来自世界各地的粉丝进行对话。

“体育场”和“啤酒”这两个词的需求量特别高。

如今,传统的短语手册即将问世。英国文化协会最近的一项调查发现,16至34岁的人中有近三分之二现在依靠翻译应用来帮助导航当地的行话。

虽然这些应用程序无疑正在变得越来越好,但它们仍然不完全可靠 - 接受调查的人中有五分之一表示,由于手机上的错误翻译,他们在度假时会遇到误解。

对于非主流语言的发言者来说,这个问题特别严重。

例如,威尔士人注意到一些特别“糟糕”的翻译。例如,一个警告标志“爆炸进行中”被称为“Gweithwyr yn ffrwydro”或“工人爆炸”。

今年夏天,谷歌翻译用户发现18次打字“狗”产生了一个毛利语翻译读物:“世界末日时钟是十二点三分钟我们正在经历人物和世界上的戏剧性发展,这表明我们越来越接近结束时间和耶稣的回归。“

  • 妻子蛋糕和邪恶的水:自动翻译的危险

那么为什么在超级计算机和机器学习时代仍然会发生翻译故障呢?

媒体标题观看:Google的翻译耳机已经过测试

一个大问题是单词通常具有多个含义。正如他们所说的那样,这些同形异义词不仅会给度假者带来尴尬,也会给政府带来尴尬。

以英国政府7月出版的德国版英国脱欧白皮书为例,将“民主运动”一词翻译成“民主运动” - 其中“Übung”意味着体育锻炼而不是练习。

为了应对这样的错误,翻译应用程序不断改进应用机器学习的方式。他们利用以前翻译过的文本来提供答案,检查之前使用过单词的上下文,并选择最可能的含义。

今年早些时候,微软宣布它的翻译质量达到了“人类平价”一组中文新闻文章被机器翻译成英文,一组独立专家发现它们与两位专业翻译人员提供的翻译相同。

微软表示,这一突破的关键是使用深度神经网络,以及统计机器翻译。

简而言之,这涉及通过在每个方向上多次回溯结果,每次比较,对比和学习,以类似于人类的方式来完善第一个“粗略”翻译。

机器翻译图片版权所有MICROSOFT图片说明Xuedong Huang说机器翻译是关于学习语言规则的

翻译系统已经基于从过去学到的所有文档,对每种语言的语法句子有一个很好的概念。

“现代翻译系统不是编写手工制作的规则来翻译语言,而是将翻译视为学习现有人类翻译语言之间文本转换的问题,并利用应用统计学和机器学习的最新进展,”技术研究员黄学东解释道,语言和语言,在微软研究院。

达到人类平价听起来就像一个令人印象深刻的成就 但即便是微软承认翻译历史新闻文章与翻译现场人类对话并不相同,其中成语,口音和方言的细微差别提出了更大的挑战。

去年,谷歌推出了名为Pixel Buds的无线入耳式耳机,它可以实时翻译40种语言 - 尽管它能够准确地做到这一点仍有争议。该公司表示,总部位于纽约的初创公司Waverly Labs开发了自己的Pilot Translating Earpiece和智能手机应用程序,可近乎实时翻译15种语言。

机器翻译图片版权WAVERLY LABS图片说明Waverly Labs开发了近现场翻译耳机

但是当你试图在两种语言之间进行翻译时,如果没有这么广泛的翻译文档数据库可供学习 - 例如僧伽罗语到普什图语 - 挑战就更大了。

通过将僧伽罗语翻译成英语然后将结果翻译成普什图语,可以产生各种翻译,但这清楚地引入了上面已经提到的类型的错误。

在多个毛利犬的世界末日呈现的情况下,奇怪结果的一个原因是,对于罕见的语言,过度依赖两种语言中存在的文档:在这种情况下,圣经。

“如果你使用来自旧手稿的平行句来训练你的模型,并尝试翻译现在人们之间的谈话,那么模型将会非常混乱,因为今天的谈话的内容和风格将与你将要的非常不同在手稿中找到,“Facebook AI研究员Guillaume Lample说。

“此外,该模型很可能会产生它在手稿中找到的词段。这种问题很可能发生在资源较少的语言中,并行句子的数量非常小,而旧文档也是如此。将代表大量的整体并行数据。“


联系我们

电话:
021-31300031
24X7服务热线

邮件

欢迎随时发邮件给我们
admin@fanyibase.com,
and we’ll get back soon.

我们的地址

中国上海
中国(上海)自由贸易试验区,
达尔文路88号