翻译机器评分的研究综述 下载本文

龙源期刊网 http://www.qikan.com.cn

翻译机器评分的研究综述

作者:刘芳华 秦璐 张光河 来源:《无线互联科技》2013年第03期

摘要:翻译是英语考试中十分重要的一个部分,传统的翻译考试目前都是由人工进行评阅的。鉴于其需消耗大量的人力物力,有些研究机构正在研发能够替代人工的机器自动翻译评分系统。本篇文章主要综合讨论了目前机器自动翻译评分所应用的主要算法,并在总结了现有的评价系统基础之上模拟设计了一个基于BLBU算法的翻译自动评价系统。 关键词:翻译考试;自动评价;翻译自动评分系统 1、翻译自动评价系统概述

随着计算机技术在语言测试领域内的不断发展,越来越多的研究机构开始探索主观题的自动评价。其中,翻译自动评价以被测译文在句子长度、用词选择和词组顺序与参考译文越匹配则翻译质量越好的核心思想为主导衍生出了越来越多的评价方法。具有代表性的测试方法主要有以下几种。

(1)基于测试点评价方法。首先在参考译文中圈定测试点,并将这些测试点的同义词组与该测试点一同放入特定的关键词词库区域内,这个区域即为给分点的集合。将此词组与被测译文进行匹配,在被测译文中会找到一个出现这组关键词几率较大的区域,那么这个区域应该就是该给分点所对应的答题区域。找到这个区域后,还应当考虑所找到的这个区域的可信度,如果被测译文中各个分块出现关键词的密度比较均匀,那么说明这个区域可信度较高。在被测译文中选取若干个不同的测试点所对应的关键词进行分离,通过将关键词与参考译文的给分点进行比较对被测译文进行自动评分。

(2)基于句子相似度评价方法。具有代表性的两种方法一是单向贴近度方法,另一是基于N元组模型方法(BLEU算法)。由我国学者汪培庄提出的单向贴近度方法,主要是为了解决被测译文与参考译文之间的关键词的接近程度,而把关键词看成字符串,将其拆分成单个的字符后构成一个有序的集合,称之为模糊集。贴近度就是描述两个模糊集合的贴近程度的一个重要数量指标。选择准确的关键词,利用带权的单向贴近度,适当的分配各关键词的权重,能够提高翻译评价的准确率。

BLEU(Bilingual Evaluation Understudy)算法—直被认为是提高了评分的客观性和可信度的一种高效率测试方法。它是由IBM于2001年提出,通过分析比较被测译文与参考译文中共同出现的N元词的个数,统计后将其除以标准译文的总词数目最终得到测评结果。

(3)完全匹配法。只有在被测译文与参考译文相同的部分才算正确,并将被测译文与参考译文中相异的句子比例作为衡量机器译文质量的标准。如SER(Sentence Error Rate)方法。