如何从PDF中提取Word格式源文件?


2019-03-14 08:35:27

翻译公司

几乎每个客户都发现自己陷入了以适当的桌面出版(DTP)格式没有关键翻译源文件的尴尬局面。有时,所有可用的是从FrameMaker,InDesign或Word格式的“丢失”源文件派生的PDF文件。
 
无论原因如何,您和您的翻译公司都有多种工具和方法可用于从PDF创建可编辑的源文件。本博客将介绍我们的制作人员在执行多语言桌面出版时在GPI上发现的两种更有效的技术。
 
1.将PDF另存为MS Word文件。
此选项最适合长度为20-30页的PDF文件,这些文件是通过从InDesign,FrameMaker和MS Word等可编辑文件打印而创建的。Adobe Acrobat X Pro和Nitro PDF Professional是两个允许您执行此操作的软件程序。
 
* gpi_extracting字源文件博客 
 
生成的MS Word文件将保留文本格式(字体系列,大小和颜色)和图形。如果您的其他源文件是FrameMaker或InDesign,则可以轻松地将生成的MS Word文件导入这些应用程序。这将使您能够重新创建适合语言翻译的格式正确,可编辑的源文件。
 
2.使用独立PDF将PDF转换为MS Word转换工具。
您可以选择多种工具,包括ABBYY FineReader和deskUNPDF。此外,还有一些工具可以直接在线使用,如Zamzar,PDFonline和PDF to Word Converter。
 
有关完整列表,请查看30多种PDF转换工具,PDF Creator和PDF阅读器列表。
 
使用以下工具之一转换PDF文件时:
 
我们可以单独编辑每个页面
我们可以指出页面的哪个部分应该转换为图形或表格
在将转换保存为Word格式之前,我们甚至可以指示文本的格式
如果应用程序首先未检测到正确的格式,则这些选项非常有用。
 
 
指示PDF文本语言的选项
这些工具的另一个好处是我们可以在开始转换过程之前在PDF文件中指明文本的语言。
 
我们可以创建一个我们最常使用的语言列表,程序会记住它们,或者我们可以根据需要指定我们要转换的文件的语言。
 
结果会更好,特别是扫描和具有多个图形和复杂格式的大文件。
 
优化Word文件以进行翻译
无论使用何种方法,结果并不总是完美的。在将文件提交给翻译机构之前,您通常需要准备翻译文件。
 
某些段落可能会通过硬返回或软返回分割线条(如本段下方的屏幕截图所示。)某些图形上的文本可能会转换为可编辑文本。
 
 
找到适合您文件的最佳工具
为了以最少的工作量获得最佳结果,我们需要确保使用最适合我们需要转换的PDF文件类型的工具。通过分析PDF文件来确定其来源,布局和格式复杂性,从而开始此过程