机器翻译译后编辑调查研究


2019-07-23 09:22:19


翻译


博士生克拉拉·金诺维特最近进行的两项调查侧重于实践者对机器翻译后编辑的看法(PEMT)。在西班牙庞贝法布拉大学金诺特博士玛丽娜弗拉蒂诺的指导下,他正在接受后期编辑机器翻译的培训。金奥维特的大学主管是庞贝·法布拉大学的卡门·科洛米纳斯(Carme Colominas)和加泰罗尼亚奥博塔大学的安东尼·奥利弗(Antoni Oliver)。授予机构是Agaur。
 
第一项调查旨在从商业角度审视PEMT的状况。本次调查的66名受访者都有外包机器翻译后期编辑的经验,主要从事中小型物流服务提供商的工作。调查于2018年12月开始,2019年2月结束。
 
社会服务党的受访者大多在西班牙(17),其余的人在欧洲其他地方(42)和俄罗斯、土耳其或其他地方(7)。LSP受访者表示,最常见的后期编辑源语言是英语。西班牙语、英语、法语、德语、意大利语和荷兰语是最常见的目标语言。
 
 
第二项调查旨在从后编辑的角度审视PEMT的状况。142名受访者主要是自由职业者或独立翻译(84%)。调查于2019年1月开始,2019年4月结束。
 
后编辑受访者的首选地点是西班牙、意大利、英国、德国和法国。调查中的主要目标语言是英语、西班牙语、意大利语、德语、法语和荷兰语。到目前为止,英语是后编辑最常用的源语言,法语、德国语、西班牙语、意大利语和其他语言也有代表。
 
斯莱特审查了调查结果并分析了调查结果,比较了两组受访者答案的异同。
 
资源配置模型、卷、内容类型
编辑后工作有各种各样的资源模式:85%的人说他们在某种程度上依赖自由职业编辑,而少数人(15%)说他们不外包任何编辑后工作。半数以上(58%)的LSP受访者表示,他们在内部进行某种形式的后期编辑。
 
大多数LSP受访者(56%)表示,他们的最终客户决定是否使用后期编辑工作流程,而41%的受访者表示这一决定是内部做出的。在58名物流服务提供商受访者中,60%的人表示他们在使用物流服务工作流程时会通知客户。
 
在58名物流服务提供商受访者中,60%的人表示他们在使用物流服务工作流程时会通知客户。
在96名自由撰稿人中,大多数人(78%)表示,他们所做的大部分后期编辑工作是针对本地服务提供商的,而只有20%的人表示,他们所做的大部分后期编辑工作是针对直接客户的。四分之三(75%)的人说请求者负责决定使用PEMT是否合适,而18%的人说他们自己选择是否使用PEMT。
 
大多数自由职业者(78%)说,他们做的大部分后期编辑工作是为本地专业人员服务的,而只有20%的人说他们做的大部分后期编辑工作是为直接客户服务的。
73%的LSP受访者和62%的后期编辑表示,后期编辑占所有翻译工作的25%或更少。同样数量的LSP受访者(21%)和后期编辑(18%)表示,后期编辑占所有翻译工作的26%至50%。
 
100名后编辑说他们后编辑高可见度内容(供公众消费),67名后编辑说他们后编辑低可见度内容(供有限传播)。
 
输出质量和质量管理
大多数LSP受访者(73%)表示,按照人类专业标准进行后期编辑是PEMT最常用的形式,而21%的受访者表示,最常用的服务是轻量级或“足够好”的PEMT。
 
LSP调查对象和后期编辑观察到的输出质量水平之间存在差异:73%的LSP调查对象和仅有42%的后期编辑表示,后期编辑的任务包括“将中等(可接受)质量的原始输出提高到可出版质量”,而56%的后期编辑表示,他们被要求将低质量的输出提高到可出版或可接受的质量。
 
关于要求后编辑提供多少关于机器翻译输出质量的反馈也存在差异:70%的后编辑说他们没有被要求提供机器翻译输出质量的反馈,然而73%的LSP受访者说他们要求后编辑提供反馈。
 
70%的后编辑说他们不需要关于机器翻译输出质量的反馈,然而73%的LSP受访者说他们需要后编辑的反馈。
两组之间的另一个差异在于受访者表示提供的指导水平:46%的后编辑表示,他们没有为PEMT提供具体的指导方针,而大多数LSP受访者(45人中的87%)表示,他们为后编辑提供了详细的指导,无论是针对公司的标准化还是针对内容类型或语言的定制。
 
生产率和指标
生产率和指标
LSP和后编辑观察到的生产率水平相似,尽管后编辑通常报告基于每小时后编辑单词的生产率水平高于LSP受访者。
 
 
55%的后编辑说他们追踪他们在PEMT的生产力。在64名后期编辑中,大约一半使用电子表格来跟踪他们的工作效率,而大约10%使用专有工具。不到10%的人使用第三方项目管理软件。在44名物流服务提供商受访者中,一些人使用内部生产率跟踪工具(13),另一些人使用电子表格(10)。还有一些人使用项目管理软件(9),一些人根本不使用工具(7)。
 
两组都报告说,主要的支付模式是按源词。57%的后编辑和56个LSP受访者中的40个表示他们使用这种模式。不到10名接受LSP调查的人表示,他们是根据编辑报告的时间付费的,而25%的后编辑表示他们每小时收费。
 
工具和培训
后编辑被问及他们最常用的机器翻译系统是什么。面向后期编辑的流行机器翻译系统包括谷歌、DeepL、SDL(自适应机器翻译、语言云或ETS)、亚马逊翻译和SYSTRAN。
 
最常用于后期编辑和LSp的生产力工具是SDL Trados工作室。LSp和后期编辑的其他流行的生产力工具包括memoQ、Memsource、Wordfast、MateCat、Smartcat、Across、Transifex、Localize和GlobalSight,以及专有解决方案。除了上面提到的工具,后期编辑还使用了其他工具。
 
后编辑和LSp的顶级质量保证工具是Xbench,后面跟着“无”LSp的下一个首选选项是Verifika和质量保证蒸馏器,而后期编辑使用更广泛的质量保证工具。
 
地方服务提供商和后编辑对现有PEMT培训课程的质量意见不一:41名后编辑认为不够,45名表示足够,56名不知道。一些后期编辑(23%)有公司提供的培训课程,一些有外部提供的培训课程(12%),或者说他们在大学里也有培训课程(8%)。42%的生活水平调查受访者认为目前的PEMT培训课程不够,而35%的受访者表示不够。
 
53%的后编辑表示,他们从未参加过PEMT培训课程,而三分之二(67%)的当地雇员表示,他们尚未组织过关于PEMT的专门培训。