浅析译员考核中差错率统计方法范文

时间：2022-07-17 11:20:18

浅析译员考核中差错率统计方法

摘要：差错率作为考核译员译文质量的重要指标，其数据的单一性让结论片面，缺乏统计学的意义。因此，有必要综合利用数据统计和绘图工具RStudio和EXCEL2007，设计出在三种不同模式下对差错率进行统计和分析的方法，以实现数据的合理和可靠。

关键词：差错率RStudio和EXCEL2007统计和分析方法

1引言

不论是在高校内的培养阶段，还是在企业、机构内的深化培训阶段，考核译员或译者翻译能力最直接的方法就是评析译文质量。差错率指的是“一份文件的翻译或校对差错数占该文件总字数的比率”（王林燕、何晓智，2014：84）,是现行于翻译行业的主要译文评价标准。我国《翻译服务译文质量要求》提出:“根据翻译服务的特点，译文综合差错率不超过1.5‰。”运用这一统计方式，能够获得翻译失误方面的直观数据，既可以对单个译员的能力同行业标准进行比对，也可以用于优化翻译团队的管理。尽管这种量化考核结果的方法有着统计学的意义，但差错率作为单项数据只能提供宏观的译文衡量尺度，不但无法在微观层面对译文和译员进行分析，而且评价模式也过于单一。为探寻更为全面和科学的差错率统计与分析方法，本研究利用主流统计和绘图工具（RStudio和EXCEL2007），对自建实验数据进行操作，构建出总体、个体和对比的评价模式。

2差错率的统计与分析模式设计

单一方式观察差错率很难实现全面评估译员或翻译团队，导致产生片面的评价结果，进而影响教师或管理阶层的判断，故设定不同的差错率统计和分析模式就显得尤为重要。本研究综合参考“外语教学与研究出版差错率计算规范”和“诺贝笔（NoblePen）差错率计算方法”，设定一种翻译差错统计范式，主要包括：误译（2）、漏译（2）、错别字或拼写错误（1）、用词不准（1）、搭配不当（1）、观点错误（5）、逻辑不通（2）和语言欧化（2）八种。其中括号内的数字指每次出现该类错误所需计入的差错数。RStudio和EXCEL2007（下文简称R和EXCEL）是两款有着强大的运算、统计和绘图功能的工具，也是该研究所用的主要软件。其中，R免费对外开放，“是专门为统计和数据分析开发的技术语言，”还有着“弹性的、互动的环境来分析、可视及展示数据”（谭振江、朱冰，2017:76）,而EXCEL则是最常见的数据处理工具，操作相对简便、易接受，它们各有所长，因而要综合使用。经过研究，笔者设计出总体评估、个体评估和对比评估三种模式，以期形成一个从个体到团体的评价体系。

3不同模式下的操作及分析

R和EXCEL的优势之处无需赘言，本研究也不针对软件的基本操作进行说明，只讨论该研究所涉及的操作步骤。总体评估模式下，主要展现差错率数值的整体分布和曲线走势，从而分析单次考核中，班级或团队的整体水平；在个体评估模式下，更多地针对单独译员或差错类型进行分析；对比评估模式下，则注重对同类数据进行比较以得出结论。

3.1总体评估

若将差错率总体布局通过可视的图形表现出来，最好使用R的绘图功能。虽然EXCEL也能绘制出诸如直方图一类的图形，但R的优势在于功能更多样，能够满足操作者个性化的需求，比如在图形之上增加曲线。以15名译员（闫一、郭七、李十一，等）差错率的数据为例，可绘制直方图并加入密度曲线。实验数据中这些译员的差错率分布可用图展示，蓝线为密度曲线。假定差错率低于0.020为优秀，依图可见这些译员的差错率集中于小数值区域（0.010到0.015之间），曲线由低数值到高数值呈走低的态势，表明他们在本次考核中，整体表现良好，展现出较高的水平。该图一方面让教学或培训人员直观地获取考核结果的分布数据和走势，另一方面还能够辅助他们结合更多外部条件，如文本类型，分析其背后的原因。如果这些译员同处于一个翻译培训班级，通过绘制图形和计算相关数据，观察考核结果是否呈正态分布就有着重要的意义。R环境下将图示法和运算法结合起来，可以更为直观地、可靠地观察数据的正态分布性。具体操作步骤是：a.正态分布图示法；b.峰度和偏度检验，峰度检验值-1.055837，偏度检验值0.5488924；c.Shapiro-Wilk检验法，俗称W检验，W=0.91615，P-Value=0.1682。以上操作过程中，步骤a属于图示法，而步骤b和步骤c为运算法。在步骤a中，红色虚线为差错率的理想正态分布曲线，蓝色实线为密度曲线。此次考核的结果并未呈现出正态分布，但通过观察步骤b所得的峰度值和偏度值（-1.055837和0.05488924），发现数据接近正态分布。步骤C运用Shapiro-Wilk检验法，计算所得p-value值为0.1682，明显大于0.05，故差错率服从正态分布。再次观察步骤a中绘制的两条曲线，发现问题在于横坐标的间距较大，而数值差很小，因此影响了视觉判断。因此，翻译教学者应综合计算数值，再下定结论。另一方面，差错率服从正态分布，说明本次考核结果与译员的实际水平一致，可以为今后的考核提供借鉴意义。差错率的高低体现着译员在本次考核中所展现的翻译能力，教学人员或管理者会据此进行水平区分，以观察团队的整体翻译水平。按照一定标准对差错率进行等级划分，如本例划分为“R<0.020”“0.020≤R<0.025”“0.025≤R<0.030”和“R≥0.030”四个档次。再根据所划分的档次，利用EXCEL的“COUNTIF”和“COUNTIFS”函数，便可计算出相应的人数。最后运用其绘图功能，就可以得到直观的统计图形。根据统计数据和饼状图显示，差错率低于0.020的人数近半数，占据主导。如果将0.020设为优秀，则可以说明本次考核中，该团队表现优异。团队的管理者可据此观察这些译员的水平是否出现两极分化，以便及时进行调整。

3.2个体评估

个体评估的模式并非只关注某个译员的差错率，而是每次运算或绘图的目的在于研究某个译员或者某类差错类型。首先，选取某位译员的考核结果为数据，以译员“李十一”的成绩为例，利用R绘制柱形，将译员的翻译差错类型和数量更直观地呈现。柱形图有助于更为全面地分析某位译员，而不是单纯地依靠差错率的数值进行判断。本次考核中李十一的主要翻译差错集中于用词不准、搭配不当和逻辑不同，但没有出现漏译和观点错误。在翻译教学方面，教师可根据这一结论帮助其进行提高；在团队管理方面，可以由此判断译员是否能够胜任某些文本的翻译任务。同时，对某种差错类型进行相关系数的计算和显著性检验，可以明确那种差错与差错率有着显著的相关。经过研究，运用R计算等级相关系数来进行显著性检验，较之于积差相关系数矩阵的显著性检验，不用考虑分界点的问题，效率更高。下面以误译和观点错位为例，检验误译和差错率的等级相关，结果显示:误译等级相关系数0.2369242，观点错误等级相关系数0.6449018，误译与差错率的P值为0.3952，远高于0.01，说明二者不存在相关性；观点错误和差错率的P值则为0.009436，低于0.01，说明二者显著相关。等级相关系数虽操作更为繁杂，每条结论的得出都需要单独运算，但结果更为直接、简单。还可以用R将以上述等级相关的运算结果进行图形化，并以多图同框的形式呈现出来。通过散点图和曲线的结合，可以明显观察到观点错误与差错率有着显著的相关性，另外两类则不具备显著相关，同上述计算结果所得结论一致。由于差错类型的赋值存在差异，加之并非所有差错类型都与差错率相关，因而差错率的高低也不能直接体现译员的水平。通过计算“标准分”，可检验其是否与差错率的结果一致。标准分是一种用途广泛的统计量，指“以标准差为单位标定某一分数离开团体均数的距离”，最常用的是Z分数。利用EXCEL可以轻松完成这一运算，以译员的相关数据为例进行运算，可以得出相应结果。在一般情况下，检验考核结果能否确实反应译员间的差距，主要选取几位成绩相近的人进行分析。在前面分析中，K列的数据为所有译员的考核标准分，假设挑选本次考核差错率最低的张六进行分析，发现其Z分数确实也是最低的，而且略低于成绩相近的郑十二和欧阳十。由此说明，本次考核的差错率能够反映出译员间能力的差异。除了整体评估和个体评估的模式，对比评估模式也是必不可少的一环。

3.3对比评估

对比评估模式下主要完成的是变量间的差异性检验，既可以进行针对全体译员的总体对比评价，也可以对某两个单独的个体进行对比评价，还可以通过图示将对比的结果图形化。利用EXCEL数据分析工具或R语言的均值检验（t检验）皆可完成对比评估的相关操作和数据统计，但受限于R的检验方式，如样本所在的总体必须是正态分布的总体，所以EXCEL工具更为简便。

4结语

差错率作为一项经过简单运算后得出的数据，作为评价译员的依据既单一、片面，在很多时候也缺乏统计学的意义。本研究综合应用数据统计和绘图工具R和EXCEL，结合实验数据，创建出一套系统性的差错率统计和分析方法。在该系统内，操作者可根据译员的考核结果，在总体评估、个体评估和对比评估三种模式下根据自身需要整理数据，并根据统计结果全面地、详细地观察译员在考核中的表现，帮助自己调整教学计划或者团队管理决策。

参考文献

[1]谭振江,朱冰.基于R语言的学生成绩分析[J].智能计算机与应用,2017(7):76-82.

[2]王隆文.实用文献译文如何使用“1.5‰综合差错率”规定[J].中国翻译,2013(5):66-69.

作者：张翰旭单位：浙江师范大学外国语学院

上一篇：浅谈新经济统计测度体系及理论界定范文
下一篇：统计分析下的水质时空变化特征范文

浅析译员考核中差错率统计方法范文

扩展阅读