您现在的位置: 新晨范文网 >> 商务论文 >> 计算机英语论文 >> 正文

谈机器翻译和计算机辅助翻译

2019/12/01 阅读:

摘要:本文简要分析了翻译技术在现代生活不同领域的重要性,介绍了机器翻译和计算机辅助翻译的历史,探讨了计算机辅助翻译中使用的主要工具及新技术对专业翻译的影响,旨在使译者认识到机器翻译及计算机辅助翻译在翻译过程中不可忽视的作用,提高新技术的应用能力,不断提升翻译的高效性和竞争力。

关键词:翻译技术;机器翻译;计算机辅助翻译;翻译策略

一、翻译技术的需求

信息技术的进步与现代通信要求相结合,促进了翻译自动化。技术和翻译之间关系的历史可以追溯到冷战的开始,因为在20世纪50年代,美国和苏联在各个层面的竞争非常激烈,成千上万的文件被从俄语翻译成英语,反之亦然。然而,如此高的需求显示了翻译过程的低效,尤其是在专业知识领域,增加了人们对翻译机器的兴趣。尽管冷战现在已经结束,尽管全球化具有重要意义,全球化往往会打破文化、经济和语言障碍,但翻译并没有过时,因为各国都希望保持其独立和文化特征,特别是通过自己的语言表达的独立和文化特征。这一现象在欧洲联盟内可以清楚地看到,在那里翻译仍然是一项至关重要的活动。信息技术产生了一种屏幕文化,它倾向于取代打印文化,不再需要打印文档,直接通过计算机访问和传递信息。这些计算机文档可以立即获得,并且可以比印刷品更灵活地打开和处理,结果信息本身的状态发生了变化,根据需要变成临时的或永久的。在过去的二十年里,我们见证了信息技术的迅速发展,与此同时,随着全球市场的发展,工商业比以往任何时候都在国际范围内发挥作用,在产品和服务交换方面更加自由和灵活。翻译的性质和功能也不可避免地受到这些变化的影响。各国需要在许多领域进行合作,如生态(绿色和平)、经济(自由贸易协定)、人道主义(医生无国界)和教育(交流方案)等。尽管英语很重要,但人们普遍认为,人们有权使用自己的语言,然而语言的多样性不应成为相互理解的障碍。必须找到解决语言问题的办法,以便让信息自由流通,并促进双边和多边关系。因此,现代生活的不同方面导致了对更有效翻译方法的需求。

二、机器翻译简史

直到二十世纪,创建自动词典的想法才作为语言障碍问题的解决方案出现。20世纪30年代,法国学者亚美尼亚乔治•阿特斯鲁尼和俄罗斯学者彼得•斯米尔诺夫•特罗扬斯基独立地为同一目标而努力。后者是两者中更重要的一个,因为他提出了自动翻译系统需要三个阶段的观点:首先,了解源语言的编辑分析单词,并根据它们的句法功能将其转换成基本形式;然后机器将基本形式组织成目标语言的等价序列;最后,这个粗略的版本被熟悉目标语言的第二个编辑器修正。尽管特罗扬斯基的工作意义重大,但直到20世纪50年代末,它仍然普遍不为人知。计算机的发明很快使人们试图用它来翻译自然语言。1947年3月,瓦伦•韦弗给计算机专家诺伯特•维纳的一封信标志着这一进程的开始。两年后,1949年7月,韦弗公布了他关于计算机应用于翻译的想法,不久之后,美国的一些大学开始了机器翻译领域的研究。1954年,第一次可行性试验作为IBM和乔治敦大学的联合项目进行。尽管规模非常有限,但这次示威被认为是成功的,促成美国和世界其他地区其他项目的融资。机器翻译程序的第一个版本是基于详细的双语词典,这些词典为源语言中列出的每个单词提供了许多目标语言中的等价单词,以及一系列的词序规则。任务的复杂性使得开发人员有必要继续改进程序,因为需要更系统的语法焦点。项目基于语言学的进步,特别是转换生成语法模型的发展,这似乎为机器翻译提供了新的可能性。然而,最初的乐观情绪很快消失了。研究人员开始认为语义障碍是不可逾越的,并且不再认为机器翻译问题的解决方案近在咫尺。IBM和华盛顿大学生产了一种叫做马克2号的操作系统,但是结果令人失望。到1964年,美国政府对机器翻译程序的低效越来越担心,以至于成立了自动语言处理咨询委员会来评估它们。1966年,该委员会发表了一份高度批评性的报告,声称机器翻译速度慢、效率低,而且成本是人类翻译的两倍,结论是不值得在这一领域投资研究。尽管如此,报告强调需要鼓励开发有助于翻译过程的工具。尽管ALPAC报告因缺乏客观性和远见而受到批评,但它导致美国对机器翻译的研究冻结了十多年。然而,加拿大、法国和德国的研究仍在继续,几年后出现了两个机器翻译系统:欧洲联盟委员会使用的Systran和蒙特利尔大学创建的Taum-météo,用于将天气预报从法语翻译成英语。1980年代取得了重大进展。多语种社区的行政和商业需求刺激了对翻译的需求,导致法国、德国、加拿大和日本等国开发了新的机器翻译系统。研究在20世纪80年代也恢复了,因为大规模访问个人电脑和文字处理程序为较便宜的机器翻译系统创造了市场。20世纪90年代初,机器翻译取得了重大发展,从基于语法规则的翻译策略彻底转变为基于大量文本和例子的翻译策略(例如逆向计划)。语言不再被视为受固定规则支配的静态实体,而是一个根据使用和用户而变化的动态语料库,随着时间演变并适应社会和文化现实。直到今天,机器翻译仍在继续发展。大公司现在越来越多地使用它,这也增加了对公众的软件销售。这种情况导致了在线机器翻译服务的产生。以及多语言词典、百科全书和免费、直接访问的术语数据库的可用性。

三、机器翻译策略

(一)直接策略直接策略是第一个用于机器翻译系统的策略,涉及最少的语言学理论。这种方法基于预定义的源语言-目标语言二项式,其中源语言语法的每个单词直接链接到目标语言中具有单向相关性的相应单元,例如从英语到西班牙语,而不是相反。这种方法最著名的代表是乔治敦大学创建的系统,该系统于1964年首次在俄语到英语的翻译上进行测试。乔治敦大学的系统,像所有现有的系统一样,是基于一个直接的方法,有很强的词汇成分。形态分析机制高度发达,词典极其复杂,但句法分析和消歧过程有限,因此文本需要人工翻译的第二阶段。

(二)转移策略转移战略侧重于“代表水平”的概念,包括三个阶段。分析阶段用语言描述源文档,并使用源语言词典。转移阶段转换分析阶段的结果,并建立两种语言之间的语言和结构对等。它使用从源语言到目标语言的双语词典。生成阶段借助于目标语言词典基于源语言的语言数据生成目标语言的文档。

(三)中枢语言策略中枢语言策略是基于独立于任何特定语言创建文本表示的思想。这种表达作为一个中性的、通用的中心轴,不同于源语言和目标语言。理论上,这种方法将机器翻译过程简化为两个阶段:分析和生成。对源文本的分析产生了一个概念表示,其不同的组成部分由生成模块与目标语言中的对应部分相匹配。对这一策略的研究涉及到人工智能和知识的表示。基于中枢语言思想的系统旨不在直接翻译,而是从基本信息中重构源文本。目前,机器翻译领域对迁移和中枢语言策略的研究最多。

四、计算机辅助翻译

在实践中,计算机辅助翻译是一个复杂的过程,涉及适应译者需要的特定工具和技术,译者参与整个过程,而不仅仅是编辑阶段。计算机变成了一个工作站,译者可以在这里访问各种文本、工具和程序:例如,单语和双语词典、平行文本、各种源语言和目标语言的翻译文本以及术语数据库。每个翻译都可以创造一个个人的工作环境,并根据具体任务的需要进行转换。因此,计算机辅助翻译为译者提供了现场的灵活性和行动自由,同时还能立即获得最新信息,以便节省大量时间。以下是翻译工作中最重要的计算机辅助工具,从最基本的到最复杂的:

(一)电子词典、词汇表和术语数据库在电脑上查阅电子或数字词典起初看起来与使用纸质词典没有什么根本不同。然而,优势很快变得明显。在电脑上输入一个单词并得到答案所花的时间要比翻看纸质词典少得多;通过链接可以立即访问相关数据;并且通过处理多个文档,可以同时使用多个词典。电子词典有几种形式:可以安装在计算机上的软件;作为光盘,最重要的是通过互联网。例如,搜索引擎谷歌让我们可以使用多种语言的各种单语和双语词典,尽管有时有必要成为在线用户,比如牛津英语词典。在线词典从它们的语料库中为我们组织材料,因为它们不仅仅是孤立的单词集合。例如,我们可以要求与一个关键字相关的所有单词,或者来自特定语言的所有单词。也就是说,它们允许即时交叉访问信息。互联网上有各种各样的词典、词汇表和数据库,可以帮助了解具体的术语。

(二)索引计算机并不取代字典和词汇表等工具,而是为翻译提供了一种额外的文本处理方法。它们是文字处理程序,在一个已定义的语料库中产生一串字母的所有出现的列表,目的是建立不清楚的模式。这些字母可以构成单词的一部分,例如前缀或后缀,或者完整的单词,或者一组单词。一致性的具体功能包括给出关于词或命题数量的统计数据,对词进行分类等。就频率或字母顺序而言,最重要的可能是,确定单词出现的确切上下文。随着越来越多的文本被翻译,信息可以被积累和存储,产生一个随时可以以非顺序方式查阅的数据库。索引对于翻译具有固定词汇和表达的专业文本特别有价值,这些词汇和表达具有明确的含义。它们确保了术语的一致性,为译者提供了对文本的更多控制,而不考虑文本的长度和复杂性。然而,它们对文学翻译者来说并没有多大帮助,因为文学翻译者经常面临与语言的多义性和隐喻性使用有关的问题。尽管如此,一些文学翻译家还是使用协和语,因为它们在各种翻译中都有潜在的作用。

(三)在线双语文本双语语料库通常由源文本及其翻译组成,以前是由人类译者完成的。这种以电子方式存储的文档称为双文本。它通过为固定表达式提供现成的解决方案来方便以后的翻译,从而自动化了部分过程。翻译市场的增长导致公司和国际组织对以不同语言系统存储并可立即查阅的文本或语料库的兴趣增加。

(四)翻译记忆翻译记忆是在线双语文本最重要的应用之一,可以追溯到20世纪80年代初,当时的阿尔卑斯山(ALPS)的TSS系统处于领先地位。这在90年代初被翻译经理、翻译工作台、优化器、情欲乱码、特拉多斯和欧朗等项目所成功。在最简单的形式中,翻译记忆库是一个数据库,译者在其中存储翻译以备将来重复使用,无论是在同一文本中还是在其他文本中。该程序基本上记录双语对:一个源语言段(通常是一个句子)和一个目标语言段。如果后来出现了相同或相似的源语言段,翻译记忆程序将找到先前翻译的段,并自动将其推荐给新的翻译。译者可以自由地接受它而不做任何修改,或者编辑它以适应当前的上下文,或者完全拒绝它。大多数程序不仅能找到完全匹配的片段,还能找到部分匹配的片段。

五、结论

机器翻译和计算机辅助翻译能否将译者转变成纯粹的编辑,使他们不如计算机程序重要,这一直是一个热议的话题。对这种情况的担心导致了译者对新技术的某种程度上的拒绝,这不仅是因为可能失去工作和专业声望,也是因为担心生产质量下降。一些翻译者完全拒绝机器翻译,因为他们把机器翻译与这样一种观点联系起来,即基于对投资和利润的计算,翻译仅仅是一种更有市场价值的产品。他们把翻译定义为一门艺术,它有自己的审美标准,与利润和损失无关,而是与创造力和想象力有关。然而,这主要适用于特定类型的翻译。即使对于其他类型的文本,我们对机器翻译和计算机辅助翻译的角色和能力的分析表明,两者都不够高效和准确,不足以消除对人工翻译的需求。事实上,所谓的机器翻译也被更准确地描述为计算机辅助翻译。译者应该认识到并学会利用新技术的潜力,帮助他们更严格、更一致、更高效,而不感到受到威胁。有些人问新技术是否创造了一个新的职业。可以说,通过信息技术为译者提供的资源意味着译者与文本之间关系的改变,也就是说,一种新的翻译方式,但这并不意味着结果是一种新的职业。然而,显然有新能力的发展,这导致我们指出当前局势的一些基本方面。借助计算机进行翻译绝对不同于只在纸上工作和使用纸质产品,例如传统的词典,因为计算机工具为我们提供了一种与文本的关系,这种关系比纯粹的线性阅读要灵活得多。

【参考文献】

[1]张翠吉.计算机对人类语言的影响[J].淄博师专论丛,2019(1):28-32.

[2]方明之.自然语言处理技术发展与未来[J].科技传播,2019,11(6):143-144.

[3]刘波.计算机搜索引擎智能化技术探析[J].现代信息科技,2019,3(5):102-104.

作者:袁美琳 单位:大连海洋大学

谈机器翻译和计算机辅助翻译

2019/12/01 阅读:

推荐度:

免费复制文章