近年来,基于神经网络的机器翻译成为了机器翻译领域的主流方法,但是在低资源翻译领域中仍存在平行语料不足和数据稀疏的挑战。针对维-汉平行语料不足和维吾尔语形态复杂所导致的数据稀疏问题,本文从维吾尔语的音节特点出发,将单词切分成音节,同时融入BME标记思想,提出一种基于带标记音节的神经网络机器翻译方法。与使用单词粒度和BPE粒度的两类神经网络机器翻译方法对比,本文方法在维-汉机器翻译任务中分别提升7.39与3.04个BLEU值,在汉-维机器翻译任务中分别提升5.82与3.09个BLEU值,可见在平行语料不足的条件下,该方法有效地提升维-汉机器翻译的质量。
专注高端 精准定位 用心服务 帮您实现价值翻译
——严格的质量保证体系、规范的操作流程和优质可靠的服务。所提供的翻译服务项目有:文档资料翻译、影音翻译、同声传译、交互传译、软件本地化、网站本地化、翻译软件、定制翻译系统等。