| |
首页 >> 关于我们>> 翻译资讯 |
|
|
|
机器翻译群议:存在问题与前景展望 | 发布者:上海翻译公司 发布时间:2017-06-19 |
|
2017两会召开期间,记者就“一带一路”背景下翻译人才培养的问题,采访了全国政协委员、中国翻译协会常务副会长黄友义,谈及最近有了新进展的人工智能和机器翻译。黄友义委员对此表示,他一直在关注这方面的发展,但“人工智能翻译需要语言翻译能力和人工智能大数据的结合。大数据翻译的特点是数据越大,机器翻译得越快。然而,现在数据不够大,因此机器翻译的能量没有完全发挥出来,很多方面还得靠人去干。机器翻译翻个初稿,然后人工修改,这个现在比较普遍的。如果说让机器完全取代人,它翻译的东西百分之百能用,现在做不到,只局限在个别领域。而在人文类领域,以及我们国家的新观念、新理念、新表述,就没有数据库了,机器解决不了,还得靠人。”访谈见报后引发各界热议。2017年3月10日,围绕这一话题展开了一场论辩。 贾洪伟:黄友义委员这个提议对翻译教学和研究来说,真是太好了。更重要的是给出一个确切的、肯定性的信息:机器翻译虽然快捷,但不会威胁到译员的存亡。比如,今天凌晨出刊的Nature,上面刊载了四位中国科学家的科研成果,这个恐怕就是机器无法翻译的,因为涉及到新发现的科学现象以及破解的新问题,其中涉及不少新的词汇和术语。如同我今天翻译的内容,涉及到Seme一词,如果不懂符号学,肯定翻译成语义学上的“义子”,而不是“符子”或“符义子”。 闫怡恂:即使是机器,也是人类智慧的积累,离不开最初的创造力。 贾洪伟:是的,这一点应该是谈论人工与机器操作的基本共识。 覃江华:机器是人的延伸。 贾洪伟:其实,说机器是人的延伸,想必不是特别准确。从语义上看,延伸是基于一定知识体系或符号操作的推进,而机器翻译只是在现有符号对应储备基础上的反复对应性操作,到底机器能有多大的符号转换潜力要依赖于设计者和建设者的意愿和努力,给它多少东西,它就能做多少东西的活,但任何设计者和建设者的专业知识都是有局限的,更况且截至目前学界就连英汉两门语言的基本语言问题还没有研究清楚,汉语语法研究仍囿于英语语法框架范畴(即以S+V+O为主导,而不是更适合的topic + comment模式),导致计算机程序汉化因句法语义层面的难题而走入僵局,更何况是两门语言多领域的全面对应与转换问题。所以,我个人觉得机器翻译研发的道路仍然很漫长,可能至少还需要半个世纪。 覃江华:我是借鉴麦克卢汉“媒介是人的延伸”的说法。有了汽车和飞机,人的“腿”更长了,活动范围大大增加了。有了机器辅助翻译,人翻译的速度大大提升了。但是,汽车和飞机并不能也不会取代人的双腿。机器翻译也不会完全取代人工翻译。毕竟语言不仅是用来传递信息,还有传承文化,更新文化,塑造个人和民族精神的功能。 高巍:@覃江华 语言还可以揭示人性。 覃江华:@高巍 赞同。 贾洪伟:媒介是人的延伸这一说法与机器是人的延伸这一说法,在翻译问题上不尽一致。media乃信息载体,机器非信息载体,反倒是信息转换的工具,二者不可同日而语,此其一;有了代步工具,人的活动范围增加,但有了机器辅助,人的翻译速度仅在特定领域和场合有所提升,因为机器使用的范围具有一定的局限性,在外交场域译员就不让带辅助性工具,此其二;说机器未必能提升翻译速度,在于人为了执行任务,可以自行控制自己的生理机能(控制食物和水的摄入量,以便确保中途不外出),机器不可以,没电了就是没电了,人可以忍饥挨饿,甚至可以连咖啡都不喝(电视剧《翻译官》上有这样相关的场景),此其三;广义上的翻译不仅局限于书面的语际翻译,更有从书面到思维,从思维到传统媒介和新媒介,如将小说改编成剧本,从剧本转换为集合声、光、电、影、音,甚至带有独白和双语字幕的多维立体介质,恐怕后面的绝大部分工作,机器无法完成,也就只能用来打字了,此其四;机器翻译系统的应用范围仍很有限,否则山东重型机械也就不用从法国船运那么多技术文件,找那么多人苦苦翻译了。今天早晨在Nature发文的四位中国科学家,也不用动用那么多人力将汉语写成英文了(同样,从现在英文回译为汉语,机器也同样做不了,因为新发明的术语,机器没有储备,只要科技发展,只要社会发展,只要“两会”在,源源不断的新术语就会不断涌现),此其五。最后,如果说机器乃人的延伸这一命题成立,那么这人是什么人有待于确定。如果是译员,这就蕴含着机器储备了译员的符号知识和转换技能,如果储备不够,或涉及的范围不足,就会使机器的操作出现极大的误差,我想机器不会向lawyer一样辨别哪个是劳动法,哪个是合同法,哪个是婚姻法,然后将consideration对应之含义正确地输出,这种篇章文体识别功能要人类研究清楚了,写成指令机器才能具备相应的运算功能。可就翻译而言,且仅对书面语的语际翻译而言,有关此类运算程序的研究还没有到如此发达的程度,原因是中国语言学的研究还没有到达这么炉火纯青的高度,其中之原委在于中国语言学家大多不懂数理,无法像乔姆斯基、冯志伟、李锡胤等先生那样做数理与语言相结合的研究。譬如,几年前,我找到李锡胤1989年有关篇章语义学的文章(参见李锡胤.篇章中的预设问题[A].语言·词典·翻译论稿[C].黑龙江人民出版社,2007:23-27/外语学刊,1996),原本想继续做,读后发现做不了,要有数理语言学和逻辑语言学的基础才行。 覃江华:一、机器有其局限,一如人有其生理和心理极限一般。二、人工智能、机器翻译技术复杂,绝对不仅仅局限于语言转换。图像语音识别、翻译语料库、记忆库、术语库、深度神经网络即是明证。现在的机器会深度学习,连人的个人风格都可以模仿。三、机器翻译耐力绝对比人强。人不吃饭撑不过一个星期,机器可以常年累月运转。四、机器耗电是事实,但供养人的消耗更大,成本更高。五、机器翻译和机辅翻译技术可以实现远程、协作式工业化大生产,有别于传统单打独斗式,手工作坊式翻译。六、人类不是第一次面临机器革命了。翻译界也是如此。1947年同传技术引入联合国安理会的时候,在口译界内部引起的冲击并不比现在小,但现在同传技术应用不可谓不广泛。因此,对人工智能和机器翻译不比恐惧。 贾洪伟:如果哪一天中国政府和联合国的译员能用机器代替且以远程协作形式开展工作,我绝对会相信你所说的成本与现实之间的真实性问题。表面上看,机器成本比人工低,我不知道你有没有看到1954到1957年之间美国拨了多少钱用于机器翻译项目,1957年到1981年中国政府又花了多少年用于机器翻译项目,一代又一代人,一代又一代机器,这些成本积累起来恐怕不只是一艘航空母舰的问题。更况且,为了保密,为了安全,任何政府都必须配备译员,而且是不同国家语言,配备不同语言的译员。面对新事物出现恐慌的心理和行为反应属于正常的动物生理现象,与面对新事物与新发展所持的客观而理性的分析和思考不是一回事。只要人类存在,只要还有翻译的社会需求,单打独斗式、手工作坊式翻译现象就不会消失,毕竟创造性的艺术作品绝大多数情况下都是此类个体结晶,就是佛经译场从某一个角度看,都具有手工作坊式特征。 覃江华:人类进化了几十万年才到现在这个样子,我们还浑身缺陷,不够完美。机器翻译出现才多少年呢? 贾洪伟:关键问题不在于时间长短,而是二者的本质区别决定了二者所处的位置、生存状态和未来发展走向。如果机器翻译可以代替人胜任翻译工程,山东重工就不会从法国船运技术材料回国找人工翻译了,吉利收购沃尔沃也就不远弄回国内翻译再培养技术人员了。只要语言还是人类使用的符号,只要人类社会还在,只要机器还是人类发明的机械工具,在具有极大动态性的符号系统转换问题上,机器以静态数据库形式永远也达不到人类的理想状态。 覃江华:人不能仅靠双腿跟猎豹、猛虎赛跑,是因为人生理、心理有局限。机器是由人开发,局限自然也很多。但现在机器进化、完善的速度堪称突飞猛进。机器都会深度学习了,不分昼夜,速度惊人。 贾洪伟:只要你输入brave heart,机器给你的一定是勇敢的心,而不是美好的心灵;你输入“She lived and died a virgin.”这一犯罪现场的一句话,他给出的绝对不是警察口吻的话。没有人的翻译经验,机器不论输入多少语码,也无法输出专业的译文,这是确定的,原因很简单:机器的符号转换经验源自人类的符号转换经验,只要人类不将义项匹配的经验输入,机器的运算就会出现乱匹配现象。机器学习就能具备人类体味爱恨情仇的经验?就能将这一经验应用于翻译实践?傅雷20多岁翻译《约翰·克利斯朵夫》(Jean-Christophe)觉得不行,50多岁再译觉得这就是为他傅雷写的,这说明翻译需要人生阅历积累,机器再学习也无法完成人的这种感情与理性合一的积累,因为它只有理性,缺少只有人类才具备的感性,而感性(emotion)又是推动语言发展的一大动力,如宗教中的语言,貌似理性,实则是感性在操控,参见Puritan Rhetoric: The Issue of Emotion in Religion(Southern Illinois University Press,1972)。 覃江华:机器翻译必须基于人工翻译;反过来,有了机器辅助,人变得更快更强。这正是我说机器是人的延伸的理由。人会计算,但时间久了,数字大了,出错率就高。计算机呢?正好弥补人的不足。 贾洪伟:更快可能,更强就未必,反倒可能滋生很多半吊子翻译,会助长不懂专业人员什么都敢上手的底气。在语言问题上,人脑的运算如果出错绝对是语言能力问题,而不是运算量问题,因为语言运算与数理运算不同,且在正常情况下出错率极低,更不会出现劳损问题(与疲惫度无关),这在钱冠连教授《语言全息论》(商务印书馆2002)有所探讨。计算机不论具备多少优点,其位置至少在近百年不会出现大变化:辅助位置。且还受使用区域和国别限制,非洲很多国家网速不如鸽子快,亚洲也有很多国家也处于这种状况,如朝鲜人民共和国、塔吉克斯坦之类,这样的地方,机器翻译可能就是人类译员的梦魇或恶魔。此外,不知道诸位学友是否有过校对译文的经历,机器翻译再快,最终还有一个译文校对的问题。有过译文校对经历的人知道,校对译文很多时候让人觉得还不如自己去翻译快,跟编辑编改文章一样的感触。所以,你说的“快”应该是侧重在语码的初级对应阶段上,而不是出现就是专业层次极高的标准化作品,这个我觉得也应该是目前的基本事实和学界共识。 李伟荣:机器翻译最终会怎样,更依赖于算法和参数。如果机器尽可能逼近人的思维的话,人就可以从翻译中得以解脱了,巴比塔因此得以建成。我倒是持较为客观的态度。阿法狗是一种尝试和应用。从翻译中解脱出来,我们人类可以做更多有价值的事情。看来,大家还是对伦理不放心。 覃江华:@李伟荣 一语中的,需要关注伦理问题,尤其是人类纪(Anthropocene)时代的生态伦理问题。对于人工智能和机器翻译,我们乐见其成,但也要警惕其风险。有机械必有机事,有机事必有机心。机器有可能会导致人贪婪、浪费、懒惰、退化、依赖性增强。借助机器进行的粗制滥造,甚至剽窃式翻译就是一个很好的例子。但这不全是机器本身的错。人性有其弱点。 李伟荣:从翻译中解脱出来,我们人类可以做更多有价值的事情。 覃江华:做更多有创造性的事情。 贾洪伟:@李伟荣 算法问题就是逻辑运算问题,这个技术问题应该算是解决了,自1970年代,为了机器翻译需要,国内出版了基本逻辑运算方面的译著,我记得有两本汉译:《数理逻辑入门》(知识出版社,1984)、《现代逻辑》(社会科学文献出版社,1989),还有一本乌克兰汉译的《翻译算法》(黑龙江人民出版社,2003)。巴别塔现象表面上看是语言问题,实质上被扰乱的是心智,心智乱了才有言语符号上的变化。机器只具有理性思维,如果为机器补上感性思维能力,机器运算也就不会那么逻辑化了。当前的问题参数海量,算法技术上没问题,但语言类型研究跟不上,语用语义界面,句法语义界面,语用句法界面都不够。可阿法狗永远不会代替国家跟人对战,只能跟哈尔滨工业大学等工科院校的机器人对垒。我倒觉得语言问题很难解脱出来,世界上的事哪一件不与语言相关?此处的论证不也是语言问题么?机器翻译问题终究不是翻译问题,伦理问题在其后,首当其冲的是语言问题。就连我们现在的讨论之根源在极大程度上都是语言问题,且其核心也就是语言问题。如果从哲学上看,本质上是自然人与机器人的问题。最后,对机器翻译或翻译算法感兴趣的同侪,可参阅(乌克兰)G.米兰著.李锡胤译.翻译算法.黑龙江人民出版社2003年版。 在3月11日上午继续进行了一番讨论,也一并记录如下: 高巍:只有弄清楚大脑这个黑匣子里的所有东西之后,才会出现机译代替人译的希望。 贾洪伟:也就是说要给机器创造一个模拟人脑,模拟人脑不难,难在如最优秀译者一般的经验和阅历,不但如此,还有具有众多译者的类似经验与智慧于一身,这个是最难的课题。 赵秋荣:Holmes提到的翻译研究中,基于产品的翻译研究和基于功能的翻译研究都得到了长足发展,而基于过程的翻译研究一直发展都比较缓慢,而要全面了解翻译研究,探索译者的黑匣子,需要给予翻译过程研究更多的关注。 贾洪伟:是的,黑匣子乃译者玻璃本质之根,黑匣子能研究明白,很多问题会迎刃而解。荷兰格雷曾做过一篇这样的论文(Gorlée, Dinda L.2010. The Black Box of Translation: The Glassy Nature, Semiotica180-1/4,p.79-114.汉译:《翻译之黑匣:玻璃化本质论》,贾洪伟译,待刊)。 高巍:认知和经验知识都是基于大脑。 贾洪伟:其实,今天的工业化也没有完全取代个体经营,翻译更是如此。个体译者以兴趣为主导,机器以利益为主导的任务为操作指令,二者之间的操作动因不同。 赵秋荣:也就是说translog,eye-tracker等将发挥很重要的作用。翻译软件、心理学实验及跨学科的研究对翻译过程研究有很大启发。对于翻译过程研究,目前欧洲国家研究的较多,也走在了研究的前沿。如德国、丹麦、瑞士、西班牙等许多研究机构开始利用translog,eye-tracker,以及脑电等仪器研究译者翻译过程中大脑究竟发生了什么样的变化,译者如何处理疑难问题、以及PACTE对翻译能力的追踪研究等,对于揭开译者的黑匣子有很大帮助。 高巍:本人曾经在一家机床公司做翻译,成箱的文本材料要在规定时间内完成,有时会彻夜翻译,当时真想找到翻译机器代替自己。 李伟荣:这是实情。机器翻译的想法最初可能是源于实用。 贾洪伟:心理学实验和吸取他学科视角与方法的确有助于翻译过程的研究和阐释,但我觉得主要的还是大脑语言机制问题,人有左右手倾向,同样也有左右脑发达的现象,这在不同语对的转换过程中是否会不同?左右脑倾向的人在翻译过程中是否会表现不同?等等,这还是机械性研究的层面,在语言能力、技术能力同等情况下,恐怕是译者的知识宽广度和社会阅历占据绝大部分的比重,且文学翻译(即文学翻译术语艺术再创造层面,荷兰学者格雷于2010年将其称为元创作[metacreation])尤其如此。关于用翻译软件探究翻译过程这一想法,我倒觉得问题不少,首先是翻译软件乃译员翻译过程和经验之仿制品,之所以存在不足,就是没有充分学到家;其次是以存在明显瑕疵的技术文本做自然语码转换过程的探究手段,恐怕永远也穿不透人脑黑匣子这层玻璃质(glassy essence)。 高巍:口译也是如此。有时候,对方来时候,时间安排很紧,不得不连夜谈判,在过度疲劳时,发现自己的嘴巴在说话,大家在笑你……有口译翻译机多好! 赵秋荣:的确,需要考察的参数很多。目前是探索式,寻找相关性。对于机器翻译,尤其是翻译成为一种产业的大环境下,机助翻译、人助机译应该是大规模翻译产业的未来走向。而如何充分利用好计算机辅助翻译充分服务于翻译产业的快速发展,仍然需要我们进行更多的实验和探索。 贾洪伟:机器翻译适合做翻译工程,但适用的范围目前且极可能以后也会受到语域的限制,如Matin Joos的五种文体风格中,frozen style和formal style在机器翻译上会有大的发展,特别是frozen style(但若是法律条文,通用型机器翻译软件可能也难以应付),反倒是自由空间越大的风格越难以用机器解决。谈判机器是有可能的,但要以公司或行业为切入点研发专用机器。高盛等企业自己编撰了为自己所用的术语词典,有过外企经历的人都知道,每个公司有每个公司的文化和操作模式,一个行业就更是如此,两个国家虽然同一行业,术语问题却不仅仅是语言对应问题。港澳台和大陆两岸三地同样是汉语环境,行业术语都有所不同,更何况是两个国家两门语言之间呢?机器翻译中,人是辅助性的,译员工作中,机器是辅助性的角色。术语和概念,或用结构主义语义学说,义项的配置参数异常重要。 覃江华结语:人工智能和机器翻译是近年翻译界乃至整个社会关注的一大热点。数字信息技术的产生和发展,使人类由原子时代迈入比特时代,导致人们生产、生活方式发生根本性转变。数字信息技术同样深刻影响了翻译这项“宇宙进化以来最为复杂的人类活动”。当前,蓬勃发展的翻译行业正在经历一场类似“哥白尼式的革命”。互联网、云计算、大数据、人工智能等新一代信息技术改变了翻译的面貌和翻译者的身份、地位与权力,同时也给翻译教育和翻译研究带来前所未有的机遇和挑战。有论者指出,翻译实践、翻译教育和翻译研究正在经历一次“技术转向”。此言非虚也。数字信息技术业已成为翻译实践、翻译教学与翻译研究中不可或缺的部分。正是在这一宏观背景下,我们在“许渊冲翻译论坛”微信群展开了此次讨论。 因为知识结构、关注焦点和社交媒体论坛的局限性,我们在微信群的讨论显然不够充分,也不尽完善,有些观点还有待商榷,但在某种程度上,这正好反映了特定历史时期国内学者面对人工智能和机器翻译的心理状态。我们的所思所想,在某种程度上也代表了一部分外语和翻译学界人士当前对相关问题的认识和见解(包括猜疑和误解)。在《翻译论坛》执行主编周领顺教授的鼓励和支持下,我们不揣浅陋将相关讨论的原始记录如实呈现如上。我们这样做并非有任何功利性目的,仅仅只是为了求教于学界方家,希望有更多有识之士能够参与相关问题的讨论,发表其真知灼见,给我们启发和引导,帮我们廓清疑惑。真理不辩不明。借助新媒体平台探讨翻译学术问题,在中国貌似还是一个新生事物,也希望学界师友能对此持宽容、理解态度。与此同时,我们更希望能有更多同道之人参与其中,就感兴趣的话题发表评论,交流思想。虽然大家的意见和观点可能会有所不同,但通过深入的学术探讨,我们对相关问题的思考无疑会变得更加深入,看法也会变得更为全面。这不正是交流之意义、为学之真谛吗? 本文摘自《翻译论坛》2017年第2期
|
|
|
|
|
|
|
|
|