机器翻译技术探索新突破
我国最早研究开发汉英机器翻译系统之一的哈尔滨工业大学计算机科学与技术学院语言技术研究中心,机器智能与翻译研究室的自然语言处理和机器翻译研究与系统开发工作始于1985年。1994年课题组在国家863高技术研究发展计划的支持下,开展了汉英—英汉双向机器翻译研究,先后实现了BT863-Ⅰ和BT863-Ⅱ双向机译系统,通过鉴定并获奖。2000年以来,除了继续承担国家863计划课题和自然科学基金课题以外,还广泛加强了国内外的学术交流与合作,目前与美国、日本等地的同行保持着广泛的联系,积极开展学术交流和研究合作。
2000年6月哈工大—微软机器翻译技术联合实验室的建立,为研究室今后的进一步发展创造了机会。随着计算机学院机构改革的深入,2003年3月研究室与院其他相关研究室一起组成了语言技术研究中心。基于大规模双语Web资源的EBMT研究,哈尔滨工业大学计算机科学与技术学院与爱尔兰都柏林城市大学计算学院合作双方开展项目研究。
基于实例的机器翻译是近年来应用的较为成功的跨语言信息处理技术之一,因此成为有望解决2008北京奥运所面临的多语障碍的热点技术之一。但是,由于该技术严重依赖翻译实例的规模,所以其应用仍然局限在少数大公司和产品本地化等方面。为了解决这一问题,本项目着眼于因特网上的庞大语言资源,提出探索从中自动挖掘翻译语料库的方法,进而以基于Web的自动翻译知识获取为中心,研究实现一个高质量的EBMT系统以沟通英语和汉语。
鉴于奥运会将在中国举行,项目将首先应用于对体育新闻的翻译。这是项目的应用目标。而从学术研究角度来看,项目对于探索翻译知识获取及其在机器翻译中的应用方法具有重要意义。
机器翻译从处理流程和处理深度横纵两个角度来看,涉及到多种自然语言处理技术。源语言和目标语言之间的转换是机器翻译的核心问题,通过大规模双语语料库及其标注来获取翻译知识是提高机器译文质量的关键技术之一,他们完成了6万英汉句对的分词和词性标注和词汇级对齐,正在进行3万句汉英双语树库的加工。针对机器翻译流程中的核心问题,也正在深入研究句法结构的统计转换方法、译文消歧方法,以求在机器翻译技术上走向深入、探索新的突破。
除了研究翻译技术,还重视机器译文的评价,对机器翻译译文评价方法的研究,取得了一定的成果。通过评价,将有助于发现翻译系统的问题和关键影响因素,推动翻译技术的进步。
转载自:科技日报
发布时间:2005-06-28 点击:2082 <<< 回上页