对于翻译工作,PDF = Pretty Darn Finicky


2019-07-28 18:05:25


pdf


有两种PDF,每种都有自己的困难。可编辑PDF意味着它(有点)可提取,因此可以立即编辑。这意味着您可以从PDF中复制文本并将其粘贴到Word文档中。这并不一定意味着您将成功地将实时PDF转换为Word文档(同样,我不能强调这些表和图像在转换过程中会造成严重破坏)。

然后扫描格式PDF。把这个品种想象成数码纸。有人拿了一张纸(希望好几张纸),他们想把它们放在电脑上。所以他们扫描了它,它变成了PDF。但是对于翻译来说,它仍然是一张纸 - 它恰好存在于你的电脑屏幕上。你会发现一张纸的所有特征缺陷:弯曲,污迹,难以辨认的笔迹和一些更有趣的东西,为你的乐趣投入。事实上,这些PDF可能比纸张更糟糕,因为很多时候它们至少从原始纸张中删除一次。我猜他们是复印件或传真。这可能使阿拉伯数字特别难以辨别。这是6号还是8号?(我是否提到过,当你眯着眼看这些数字并试图做出正确的决定时,它是凌晨1点而且你很想得到一些shuteye?)

一些解决方案

让我们从那些实时PDF开始。我担心你不能杀死他们,但我建议你麻醉他们,并在手术室快速使用手术刀。首先,您必须决定格式的好坏。如果它是一个简单,直接的文本,你可以转换它。有一些非常好的软件,如Solid PDF或ABBYY FineReader。如果输出是一个外观整洁的Word文档,每行末尾没有文本框或段落标记,那么您就可以免费回家了,并准备开始在您选择的CAT工具中进行翻译如果没有,一个简单但有点耗时的解决方案是复制所有文本或将其保存到文本文件,然后粘贴或在Word中打开它。然后你必须自己格式化文档。根据您与客户达成的协议,您可能不必完全重现格式。幸运的是,您的文本很干净,格式化工作只是时间问题。也许你想穿上你最喜欢的音乐来减轻苦差事。

如果你的PDF已经死了,你将不得不提取它 - 没有机会在这里复制和粘贴。无论其状况如何(我已经看到需要尸检的损坏和残缺的死亡PDF),请确保通过OCR(光学字符识别)程序运行它。我只能推荐ABBYY FineReader,因为它是我多年来系统使用的唯一软件。现在看一下输出。目标文件是否充斥着文本框,有趣的字符或大量的文本图像?如果您看到以上任何一项,请为您的生活而奔波! - 不,等等!您已经同意翻译此文档,因此您可以执行以下操作:

当然,如果你有一个干净的目标文档,你唯一需要做的就是检查它并检查拼写和单词本身是否正常。过了一会儿,你会感觉到ABBYY FineReader会给你带来什么样的错误:l而不是1,垃圾文本和nn for m,给你一些例子。如果您愿意,可以使用内置的拼写检查程序并更正以蓝色突出显示的文本。这里的关键是永远不要忘记源文本,并对接受OCR的文档进行彻底检查。

在你埋葬那个伤痕累累的受伤的死亡PDF之前,用垃圾填埋垃圾会使得手工格式化不可行,保存并将其保存在冰上以备将来使用。把它想象成你的弗兰肯斯坦项目。您可以轻松地在目标文档中使用它的一些部分 - 或者与主题一致的肢体和器官。寻找合适的名词和数字,毫无疑问在目标语言中是相似或相同的。换句话说,不要浪费任何东西。

这让我对那个死去的PDF被剔除无法识别的解决方案,你知道,这将使一个道路杀手看起来很好!我害怕伙计们,你只需要用手指轻轻一点就打开你的翻译。有一种快速设置Windows的方法,使源位于左侧,目标位于右侧(除非您想要向后执行)。只需按Windows键+左箭头,使PDF位于屏幕的左半部分,Windows键+右箭头,使word文档位于屏幕的右侧。当然,如果您不喜欢打字,您可以随时使用Dragon NaturallySpeaking来指示您的翻译如果您只想坚持键盘输入并选择不使用声音,打字助手就相当不错了。

如果有很多文本框,图章,印章,表格和图形或其任何混合,请考虑将每个页面以屏幕摘要的形式分成更小的块。例如,当我查看税表时,如果我立刻看到完整的页面,那么我的眼睛很难看,而且更令人生畏。但是,如果我将每个块或段落隔离开来并单独关注它,那就更愉快了,因此我的工作效率更高。

剪切PDF的方法有很多种:Evernote,SnagIt和Microsoft Windows自己的剪切工具。是的,我知道,如果你有一份很长的文件,这是一个额外的步骤,有点乏味,但我发现它是值得的。没有什么比缺少部分的翻译更糟糕了(嗯,实际上,翻译很差)。

如果您的预算和时间表允许,您可以随时外包格式化死文件或实时PDF文档所涉及的脏工作。FiverrUpwork上寻求DTP专家的服务以合理的价格和相当快的周转时间,您可以让其他人准备您的源文档,以便您可以在第二天早上或之后的早晨醒来并在您的邮箱中找到它。即使这样,也不要忘记给你一次,以防你的助手留下一些/未解决的东西。

除了那些说各种论坛拒绝接受PDF的翻译人员(这不是我的情况),还有其他人建议询问客户他/她是否有文件的Word副本。我自己也问了同样的问题,答案通常都是否定的。但值得一试,因为这将是理想的终极解决方案。如果无法做到这一点,您还应该询问客户端源文档的格式是否准确。有时他们只会说最小格式是可以接受的。其他时候,他们会向译者提出更多要求。只要确保你的收费足以让它值得你花时间。我自己在所有PDF翻译中添加了一定比例的常规费用。如果您愿意,您还可以添加一个给定的固定小时费率来处理这些怪物。

无论您选择做什么,无论您选择做什么,在开始翻译之前确定要应用的解决方案或解决方案是非常重要的。在我职业生涯的开始阶段,我过分依赖OCR程序,而在我的无知中,我会开始用有趣的线条和曲线来翻译不太完美的Word转换。然后客户会提到这个事实,我将不得不以我知道的最佳方式进行争抢和修复。相反,有时候当我可能从转换软件中受益时,我会输入翻译,节省了几个小时。PDF可能具有挑战性,有时会很痛苦,但如果没有它们,我们的选择将会受到限制。