本地化服务范围是动态发展的,典型的本地化服务包括软件本地化、游戏本地化、多媒体本地化、移动应用程序本地化、桌面排版、项目管理等。 在产品本地化过程中,翻译是本地化的核心任务之一,为了更好地完成翻译任务,从技术方面来说,通常需要进行本地化工程分析(Engineering analysis)、预处理(Pre-process),翻译任务完成后,要进行后处理(Post-process)。下面以软件本地化为例,以本地化翻译为焦点,论述本地化服务中本地化工程分析、预处理、翻译、后处理等本地化流程中翻译技术与工具的应用。
1 本地化工程分析的技术与工具 本地化工程分析是根据项目需求和范围,在为后续的本地化翻译工作做准备的同时,将工程技术工作分解成工作活动,并按工作活动评估工作量大小的一组工作。本地化工程分析的主要目的是:从技术上分析本地化的可行性,制定本地化技术策略,确定本地化包(包括本地化文件集、本地化指南、本地化工具、本地化参考材料等)。 本地化工程分析的技术主要包括提取本地化资源文件的技术、文本字符统计技术。软件本地化工程分析使用的工具与编程语言和编程环境有关。如果软件的国际化设计良好,本地化资源文件可以在软件开发过程中将资源文件与软件代码隔离和独立。如果软件的国际化设计不良,则需要单独编写从软件代码提取软件资源文件的工具。为了便于软件工程分析,合理地完成工程任务分解(WBS),制定本地化工程项目进度表,可以使用Microsoft Project 软件。统计字数的工具很多,例如SDL Trados、memoQ、Wordfast等CAT工具,都具有文件字数统计功能,而且可提供文件文本内容与翻译记忆库的匹配信息。
2 本地化预处理的技术与工具 本地化预处理的目的是向翻译人员提供方便翻译的文件包,预处理的文件对象是软件的用户界面资源文件、软件联机帮助、用户手册、市场材料等。预处理的工作内容主要包括:文件格式转换、文本提取、文本标注、译文文本的重复使用。 预处理的技术包括光学字符识别技术(OCR)、文本提取(Extract)、文本标注(Markup)技术和翻译记忆(Translation Memory)技术,每种技术都可以选择多种工具完成相应的工作,下面介绍本地化预处理中的技术和工具。 光学字符识别技术是通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。例如,为了翻译PDF文件,可以使用Abbyy FineReader、Solid Converter等工具,将PDF文件转换成DOC文件。 文本提取包括四个方面的技术:(1)从可以本地化的文件中使用软件将需要本地化的文本提取出来,如从视频或音频文件中将语音转化为文本,在各种语音识别工具当中,国内科大讯飞的语音识别工具较有影响力;(2)将图像中的文字提取出来,如使用且Text Catalo Tools抽取FLA文件中的文字。将Adobe Photoshop设计的PSD格式图像文件中的文字转换成TXT格式,需要开发或选择定制的工具;(3)将包含重复句段的句子从一批文件中提取出来,如使用SDL Trados Studio、memoQ等计算机辅助翻译工具;(4)将文件中的术语文本提取出来,如使用SDL MultiTerm Extract。 文本标注包括三个方面的技术:(1)采用软件将文件中不需要翻译的文本进行样式转换,如将不需要翻译的标签(Tag)变成隐藏格式,可以使用SDL Trados将HTML、XML等文件中的标签隐藏,也可以通过编写Word的宏对文件的标签进行转换,如将标签转换为twin4External样式。(2)将需要翻译文件的术语译文插入到文件中,可以使用"火云译客"的"术语标注"工具。(3)将翻译过程中需要特别处理的文本添加注释文字,如使用SDL Trados、Passolo、Alchemy Catalyst等工具,都具有添加注释的功能。 译文的重复使用(Leverage)是将以前已经翻译的内容导入需要翻译的文件中,保持译文的一致性、准确性,减少翻译工作量,降低成本,缩短翻译时间。翻译记忆技术是译文重复使用的最主要技术,通过翻译记忆软件将以前翻译过的译文从翻译记忆库中自动提取出来,插入到当前译文中。翻译记忆技术是计算机辅助翻译软件的核心技术之一,如SDL Trados、Alchemy Catalyst、memoQ、Wordfast、VisualTran、Transmate等,都是支持翻译记忆技术的计算机辅助翻译工具。 预处理阶段还可能用到的技术包括语料对齐技术,将以前翻译过的源文和译文分割成多个翻译单元,导出为翻译记忆库文件,供预处理使用。对齐工具可以是CAT软件内部嵌入的(如SDL Trados带有对齐工具WinAlign),也有独立运行的(如Transmate语料对齐工具)。
3 本地化翻译技术与工具 本地化翻译执行过程中使用的翻译技术包括可视化翻译技术、翻译记忆技术、机器翻译技术、术语管理翻译技术、质量保证技术。 可视化翻译技术使得译者可以在翻译软件的用户界面(UI)文本时,实时看到翻译的原文和译文在软件运行时的语境信息(位置、类型等),避免翻译的"黑盒困境"。当前软件本地化翻译工具都具有可视化翻译功能,如Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等。 机器翻译技术可以快速获得译文,为后续的译后编辑提供处理对象,提高翻译效率,满足客户对信息获取的即时要求。机器翻译工具可以分为独立式和嵌入式两种。独立式机器翻译是独立运行的系统;嵌入式机器翻译是通过开放应用程序接口(API),在计算机辅助翻译工具中调用机器翻译系统的译文,如SDL Trados、Kilgray MemoQ都集成了调用机器翻译API的功能。 术语管理技术使译者有效地完成术语的抽取、翻译、修改、存储、传输等工作。术语是本地化翻译需要重视的内容,在翻译过程中,译者在句段(Segment)级别借助术语管理工具动态,获得当前句段的术语及译文,并且可以方便插入当前译文中。在翻译过程中可以随时将新术语和译文添加到术语数据库中。本地化翻译的术语工具较多,分为独立式和集成式两种。独立式术语工具是单独安装和运行的术语管理工具,在翻译过程中可以与计算机辅助翻译工具配合使用,如SDL MultiTerm。集成式术语工具是将术语管理的功能与翻译记忆功能合二为一,成为计算机辅助翻译工具的功能之一,如Wordfast、Dejavu、memoQ都是把翻译记忆和术语管理功能集成在一个软件中。 质量保证技术提高了译文质量评测的客观性、一致性和效率,可以预防本地化的缺陷,改进本地化过程。使用质量保证工具可以在翻译过程中和翻译完成后自动化地获得译文中的错误和警告信息,包括漏译、翻译不一致、格式错误等。本地化翻译中的质量保证工具包括独立式和集成式两种。独立式质量保证工具包括ApSIC Xbench、D.O.G. ErrorSpy、Yamagata QA Distiller、Palex Verifika等。集成式质量保证工具将译文质量检查功能集成在计算机辅助翻译工具中,如Trados、Wordfast、Dejavu、memoQ都具有质量保证功能。
4 本地化后处理的技术与工具 本地化后处理的目的是将翻译人员完成的翻译文件进行处理,提供符合本地化要求的目标语言的文件,并且生成本地化产品的过程。后处理的文件对象是本地化的软件用户界面资源文件、软件联机帮助、用户手册、市场材料等。软件本地化后处理的工作内容主要包括:格式验证、控件调整、提取译文、文件格式转换、版本编译、软件测试、修正缺陷等。 本地化后的文字可能比源语言文字长度增加(字符扩展),通常一个英文单词翻译成1.7个汉字,所以,翻译后的软件用户界面文字可能因空间尺寸或位置问题,无法完整显示。格式验证是对本地化翻译后的文件进行格式检查和修改。常用的格式验证工具包括Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等,这些软件可自动验证本地化翻译过程中引入的各种错误,例如,热键重复、热键丢失、空间重叠、空间文本显示不完整、译文不一致。 |