专栏名称: 翻译技术沙龙
翻译技术沙龙是由语言服务行业的资深业者及专家发起组织的语言技术交流平台。沙龙于2010年11月28日正式启动,面向所有翻译技术相关从业者与爱好者。沙龙通过嘉宾演讲以及头脑风暴等形式,达到交流观点、资源共享以及传播翻译技术等目的。
目录
相关文章推荐
51好读  ›  专栏  ›  翻译技术沙龙

干货 | 如何使用 SDL Trados Studio 翻译 PDF 文件

翻译技术沙龙  · 公众号  ·  · 2017-07-26 17:03

正文


我喜欢翻译直观的 Word 文档,您是不是也是呢? 当收到 PDF 文件时,这意味着您要花费更多时间进行翻译,有时在完成后还要进一步修改。 以下是一些译员对在 SDL Trados Studio 中更轻松地处理 PDF 文件的建议。——作者: Emma Goldsmith

本文经公众号“Trados”(ID: sdl_trados)授权转载。

何为 PDF?

扫描文件和可编辑文件 之间的区别是什么?

PDF 是“便捷式文件格式”的首字母缩写,意即不论使用何种设备或程序在何处打开文件,文件都会准确显示相同的内容和排版。 这让文档创作人员受益匪浅,但对译员就不是那么一回事了。 PDF 文档分为可编辑版本或扫描版本。 可编辑版 PDF 具有文本层,可在 Studio 2011 以上版本中进行编辑。 扫描版 PDF 单纯是整页的图像,没有电子文本字符。 Studio 2015 以上版本可处理这两种 PDF,因为 Studio 内置的引擎可进行光学字符识别 (OCR) 来提取文本。 区分两种 PDF 十分容易。 在 PDF 阅读器中打开文件。 只有在可编辑版 PDF 中,您才能选择、复制和粘贴单词或句段。

语言限制和其它无法完成的任务

Studio 中用于 PDF 文件类型的 OCR 引擎由 Solid 文档技术提供支持。 OCR 技术基于词典,因此仅适用于特定语言,包括丹麦语、荷兰语、英语、芬兰语、法语、德语、意大利语、挪威语、波兰语、葡萄牙语、俄语、西班牙语、瑞典语和土耳其语。 您的源文本必须是上述语言之一。 此外,OCR 技术还需要清晰的图像才可实现优质转换。 歪斜、模糊、暗淡、字迹不清或手写的文本均属于无法完成的任务:

如果您碰到上述任何一种 PDF(均为现实生活中的例子),那么我建议您使用语音识别软件在 Word 中口述源文件,然后再在 Studio 中翻译此 Word 文件。

翻译前预览输出

假设您拿到了一份清晰的扫描版 PDF,如下所示:

接下来就是在 Studio 中试验。 在 Studio 2017 中,您只需将此 PDF 放入“欢迎”视图中。

在接下来的窗口中,点击“高级”。

在左侧选择文件类型>PDF>转换器,然后点击“浏览”预览文件。







请到「今天看啥」查看全文