英语到孟加拉语在线翻译:一些批判性的思考和案例


2019-07-29 08:48:09


孟加拉语翻译


好吧,首先让我自我介绍一下。我是孟加拉国人,我的母语是孟加拉语。印度也有人的母语是孟加拉语。实际上,多亏政治家,孟加拉历史上分为两部分,当殖民地英国人于1947年离开印度时,他们留下了一个分区的印度。一部分成为巴基斯坦,另一部分仍然是印度。在分区之前举行公民投票,根据结果,孟加拉西部,大部分人口为印度教徒,成为印度的一部分,穆斯林占多数的东部地区以新名称加入巴基斯坦; 东巴基斯坦。后来,在1971年,东巴基斯坦成为孟加拉国的新国家,随后是为期9个月的独立战争。

嗯,这不是历史博客。我提到的是有必要了解我将在后续章节中写下的内容。所以,读者,请原谅我开始博客的方式。我实际上是在这里告诉你关于翻译的事情。让我快点说到这一点。

一个无辜的问题引发了这个问题

我的五年级学生喜欢看电视上的一些特定节目,这些节目要么是印度版的探索频道,要么是亚洲电视台。这些计划最初是用英语制作的,但是被重新包装成孟加拉语,用于西孟加拉邦和孟加拉国市场。他经常说,“好吧,Pa,为什么这些人会以这种方式说孟加拉语?”有一天,当我回答说:“你的问题是什么?”,然后他说,“他们的孟加拉语听起来很奇怪。我们不会这样说。“

好吧,这不仅仅是我儿子的反应,但我社区中的很多人都是这样的。那么,问题是什么呢?翻译人员不足以掌握这种语言?并不是的。房间里的大象有些不同。我在这里讨论这个问题。但在这样做之前,我想再告诉你一些关于我自己的事情,为此,我乞求再次原谅。

我是一名受过培训的语言学家,因此,自我本科英语语言文学课程开始以来,翻译一直是我的伴侣。我不得不将文学作品翻译成课程的一部分。那些是翻译(从英语到孟加拉语或孟加拉语到英语)的日子,这些日子曾经是手工完成,也是从印刷文本手写的。我从未成为最优秀的译员之一,但我有机会向我的老师和编辑学习。虽然我在两者之间翻译了许多不同的学科,但是在四十年后退役后,我进入了在线翻译的世界。我现在看到翻译的“便宜”程度如何; 我看到为什么会这样,并且可能有多么谦虚,感谢基于软件的机器翻译的出现。

今天,我看到在线翻译文本与单击按钮一样简单。但是,自动化服务真的足以打破我们所有语言对之间的界限吗?不见得; ESP。当翻译是英语<>孟加拉语。让我解释一下原因。

检查问题的根源

是的,我知道人工智能最受欢迎和最成功的应用之一是机器翻译,以及在许多完全误译了所需内容的事件之后,它必须经历多次起伏。但是今天,机器翻译已经变得统计,我们看到统计机器翻译利用主要语言对中的大量可用翻译语料库,这些语料对可以访问来自官方政府和大使馆的大量文本,以及发布文本的联合国英语和其他语言。

由于这些来源包含高质量的文本,因此某些语言,特别是联合国系统使用的主要全球语言,由机器翻译系统提供支持。虽然仍有改进的余地,但一些语言对的机器翻译取得了重大进展,这些对的翻译人员利用各种CAT工具广泛使用这些资源。

但是其他语言呢,比如孟加拉语?例如,谷歌翻译声称它可以处理100多种语言,让我们看看它如何处理孟加拉语的英语。我们的模型测试用例(案例#1)将使用通过将语音转换为文本自动生成的这个双时隙句子:

  1. 我们想要打破最后一个大障碍,আমরাশেষশেষবড়াধাভাঙতেঙতেিলেন,
  2. 这是破桥的。সেতুরভাঙ্গাসহসহিল。

现在,让我们看看当我使用字幕软件人性地翻译这个双插槽句子时带来了什么。

  1. 我们想打破最后一个大障碍,আমরাশেষশেষবড়াধাটিঅতিক্রমমরতেতেিলাম,
  2. 这是破桥的。যেটিছিলল্রিজটিভেঙ্গেগো。

但是,根据我的判断,这句话可以更好地翻译成这样,这更接近我们孟加拉人通常所说的: আমরাব্রিজটিভাঙ্গারশেষশেষবড়াধাটিঅতিক্রমমরতেতেিলাম。

再举一个例子(案例#2),其中英文源文本取自已发表的文章并且人工完成翻译(未使用软件完成,并且避免使用句子中的英语顺序以使孟加拉语翻译更易于读者阅读)。英文文章是:

“大多数时候,JulioCésarImperatori在哈瓦那老城的小餐馆挤满了游客,他们蜂拥到古巴首都,因为奥巴马政府结束了半个世纪的敌意,并使与共产主义岛屿的关系正常化。”

和孟加拉语翻译力所能及做的是: “ওবামাপ্রশাসনযখনকিউবারসাথেঅর্ধ-শতবর্ষেরশত্রুতারসম্পর্কশেষকরারপদক্ষেপগ্রহনকরে ওকম্যুনিস্টদ্বীপটিরসাথেসম্পর্কস্বাভাবিককরারউদ্যোগনেয়তখনথেকেপর্যটকরাদলবেঁধেসেদেশটিররাজধানীরদিকেছুটতেথাকে ,ওপ্রায়সবদিনইজুলিওসিজারইম্পারেতরির পুরাতনতনাভানায়য়্থিতত্টরেস্তোরাঁটিপর্যটকেযটকেরাথাকে。“

有翻译已经完成保持英文顺序,孟加拉语翻译将是:“সবদিনইজুলিওসিজারইম্পারেতরিরপুরাতনহাভানায়অবস্থিত ছোট্টরেস্তোরাঁটিপর্যটকেভরাথাকেযারাদলবেঁধেকিউবাররাজধানীরদিকেছুটেআসছিলঠিকতখনথেকেযখনওবামাপ্রশাসনঅর্ধ -শতবর্ষেরশত্রুতারসম্পর্কশেষকরার পদক্ষেপষেপ্রহনহনরেেও্যুনিস্টট্বীপটিরসাথেথে্পর্কক্বাভাবিককরারউদ্যোগনেয়。“

如果这是机器(使用谷歌翻译)翻译,翻译应该是: “বেশিরভাগদিন,প্রাচীনহাভানাহুলিওসিজার山大ক্ষুদ্ররেস্টুরেন্টেপর্যটকযারাকিউবাররাজধানীভিড়করত পরওবামাপ্রশাসনশত্রুতাওকমিউনিস্টদ্বীপসঙ্গেসাধারণসম্পর্কেরএকটিঅর্ধশতাব্দীরশেষসরানোসঙ্গেবস্তাবন্দী হয়“。

在这些情况下,您已经获得了机器翻译的示例,并且判断是您的。但我的印象是翻译在语法和语义上都是错误的。关于另外两个翻译例子,我可以说的是,在这些例子中,没有绝对的正确或错误,但是当用该语言编写句子的“顺序”得到尊重时,目标语言的美学品质可能会更好。

订单不仅在语言中很重要,在数学中也很重要,你知道,这非常重要。举个例子,就这样说吧。这个数学是一个简单的问题6÷2(1 + 2)但是得到的答案取决于他/她如何计算它。我们知道我们在童年时期学到的操作顺序,BODMAS,我们应该通过括号,然后顺序除法乘法,然后加法减法来解决问题。如果我们避免问题的顺序,我们会得到6÷2(1 + 2)= 6÷2(3)= 6÷6 = 1(错误的结果)。但是如果我们按照正确的顺序(在解决括号内的任何内容后从左到右),我们将得到正确的结果6÷2(1 + 2)= 6÷2 *(1 + 2)= 6÷2 * 3 = 3 * 3 = 9。

但是,当软件只理解线条(首先是第一件事)并且还有字符限制时,如何维持“顺序”呢?因此,显然会出现文化冲突,而且大多数活跃的在线翻译人员通常遵守规则来保持业务,而不必担心他们所写句子的美学。

毕竟,翻译输出不是计算机代码。因此,如果这些输出在分配的时间和字符限制内完成,无论它们在语法上还是语义上都是错误的,那么这些输出都不会被拒绝。

无论如何,我在ProZ.com上招聘职位时有类似的经历。我已经看到公司如何发布机器翻译的源材料,这些材料也是从语音识别中自动捕获的(类似于上面提到的例子,但可能不仅限于那些),并要求翻译人员校对/编辑@ INR0.50psw 。(INR =印度卢比; 1INR = 0.015美元)。我还观察到,大多数英语<>孟加拉语语言工作来自印度翻译公司和/或通过他们贩运,并且他们中的大多数无法支付超过1INRpsw - 1.15INRpsw的翻译人员用于翻译英语内容到孟加拉语或孟加拉语到英语。不仅,他们还希望印度孟加拉人能够出价,因为他们只愿意支付INR,并且不愿意支付FC给孟加拉国的翻译人员(外国人),他们实际上是在家里翻译研究资料4BDTpsw(BDT =孟加拉国塔卡; 1BDT = 0.013美元)。他们也喜欢翻译人员在非常有限的时间内完成这些工作; 在3天内说12,000个单词。

结论

我在博客中写下所有这些东西时缺乏品味,但目的是让你知道,或许,所有东西都是精心编排的,可以在使用这个或那个软件的机器上完成这些工作,因此,大多数雇主都可能有一个预设的头脑,因为一切都将由机器完成,为什么他们应该让翻译有足够的时间和金钱?

好吧,我不想一再重复所有这些事情来测试你的耐心。我只是坐下来写这篇文章来回答我儿子的问题,为什么孟加拉语在电影院和/或电视连续剧中扮演的角色“听起来很奇怪”。那有什么出路吗?我害怕,不,没有; 因为默认情况下,“翻译人员”倾向于使用软件和机器,因为他们能够以某种方式快速赚钱,而翻译公司也能够通过支付更少的钱来赚钱。因此,消费者会继续吞下供应商提供给他们的东西,除非直到英语到孟加拉语的翻译变得统计,否则我们将继续作为“劣质”人工智能的消费者而不是演员。

在当今的商业环境中,人类翻译的范围正在缩小,因此,我上网的情况也出现了问题。现在我担心译员的工作将不会超过2030年。