英文语义机器翻译中的模糊语义选取技术
皮谨煜
摘 要: 为了提高英语机器翻译的准确性和自适应跟随性,需要进行模糊语义选取。提出基于概念集上下文匹配的英文语义机器翻译中的模糊语义选取技术,采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量,对参量进行自适应伴随跟踪,计算概念语义相似度,设计翻译语义偏离反馈系数进行误差修正,实现模糊语义选取。试验测试结果表明,采用该方法进行模糊语义选取,对英语语义机器翻译的查准率较高,翻译准确性得到提高。
关键词: 机器翻译; 模糊语义选取; 本体映射; 自适应跟随性
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)22?0042?03
Abstract: As fuzzy semantic selection needs to be performed to improve the accuracy and adaptive following performance of English machine translation, a fuzzy semantic selection technology based on the context match of concept sets is proposed for English semantic machine translation. The fuzzy semantic ontology mapping method is adopted to select semantic features in English machine translation so that all the contextual semantic information parameters in English text inside the ontology are obtained. To realize fuzzy semantic selection, the adaptive tracking are performed for the parameters, the concept semantic similarity is computed, and the semantic deviation feedback coefficient is designed for error correction. The test results show that the method for fuzzy semantic selection in English semantic machine translation has high precision ratio and the translation accuracy can be improved.
Keywords: machine translation; fuzzy semantic selection; ontology mapping; adaptive following performance
0 引 言
随着信息处理技术的發展,大量的智能翻译软件不断出现,机器翻译逐渐取代人工翻译,而成为未来英语翻译的一个重要角色,机器翻译的准确性和自适应性成为未来翻译软件研究的重要课题。对机器翻译的优化问题是建立在语义选择和特征提取基础上,通过提取英语上下文的文本语义信息特征,结合智能分析和语义信息检索技术,实现语义信息的本体映射和自适应伴随跟踪,结合模式识别方法实现英语智能翻译,研究英文语义机器翻译中的模糊语义选取技术,在优化机器翻译软件设计,提高翻译准确性和人工智能性方面具有重要意义。传统方法主要有主题树特征匹配方法[1]、支持向量机算法、粒子群进化方法等[2],对英文翻译语义特征进行语言评价集模型构建和特征组合匹配,提高翻译的准确性,取得了一定的研究成果,但是传统方法存在上下文干扰抑制能力不强,容易出现耦合干扰等问题。对此,提出基于概念集上下文匹配的英文语义机器翻译中的模糊语义选取技术,实现模糊语义选取,通过仿真试验进行了性能测试,展示了本文方法在提高英文机器翻译的查准率方面的优越性能。
1 英文机器翻译的语义特征筛选
1.1 模糊语义本体映射
为了实现英文语义机器翻译中的模糊语义选取和翻译自适应跟随优化,首先构建模糊语义本体映射模型。采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,进行机器英语翻译的语义分析和模块提取,设定语义映射关系结构,在语义映射模块中进行二元语义判断和英文翻译的语法分析和纠正[3],得到英文机器翻译模糊语义本体映射过程。
根据模糊语义本体映射模型,构建英文机器翻译的综合评价决策函数为:
1.2 语义信息特征提取
采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量集合为:
在图1中的英语语义相似本体片段中,计算概念语义相似度。设[s1,a1,s2,a2,…,sn,an]是一组二元语义信息,在本体中,英语语义特征信息的知识存储的基本单元的权重向量为[ω=ω1,ω2,…,ωnT],[ωj∈0,1],则语义映射的二元加权算术平均算子φ1定义为:
2 模糊语义选取技术改进实现
在进行英文机器翻译的语义特征筛选和语义本体映射建模基础上,进行模糊语义选取优化设计,提高英文语义机器翻译准确性,提出基于概念集上下文匹配的模糊语义选取技术[5],对本体内部所有英语文本上下文语义信息参量进行自适应伴随跟踪,自适应伴随跟踪目标函数记为:
3 仿真试验与结果分析
为了测试本文方法在实现英文语义机器翻译中的模糊语义选取和英文机器翻译的优越性能,进行仿真实验分析。试验采用Matlab 7 仿真设计,测试数据来自于Textile Science英文机器翻译的文本库,使用OAEI语义特征数据集作为英文机器翻译的训练函数集,参考本体包含32个概念集,语义映射参考本体N=1 024,含有65个属性集。根据仿真环境和参量设定,以英语机器翻译的模糊语义选择查全率、查准率为测试指标,得到不同方法进行翻译测试结果如图2和图3所示。
分析图2和图3结果得知,采用本文方法进行英文语义机器翻译中的模糊语义选取,提高了翻译过程中的查全率和查准率,从而提高了翻译的准确性。
4 结 语
本文进行了英文机器翻译的优化语义选取设计,采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量,对参量进行自适应伴随跟踪,设计翻译语义偏离反馈系数进行误差修正,实现模糊语义选取。研究得知,采用该方法进行模糊语义选取,提高了英语语义机器翻译的查准率和查全率,机器翻译的准确性得到改善。
参考文献
[1] 辛宇,杨静,汤楚蘅,等.基于局部语义聚类的语义重叠社区发现算法[J].计算机研究与发展,2015,52(7):1510?1521.
[2] 冶忠林,杨燕,贾真,等.基于语义扩展的短问题分类[J].计算机应用,2015,35(3):792?796.
[3] 杨磊磊,陈松灿.最坏分离的联合分辨率判别分析[J].软件学报,2015,26(6):1386?1394.
[4] 章登义,吴文李,欧阳黜霏.基于语义度量的RDF图近似查询[J].电子学报,2015,43(7):1320?1328.
[5] 蒋本立,张小平.大数据网络的均衡调度平台设计与改进[J].现代电子技术,2016,39(6):62?65.
[6] BENGIO Y, COURVILLE A, VINCENT P. Representation learning: a review and new perspectives [J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(8): 1798?1828.
摘 要: 为了提高英语机器翻译的准确性和自适应跟随性,需要进行模糊语义选取。提出基于概念集上下文匹配的英文语义机器翻译中的模糊语义选取技术,采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量,对参量进行自适应伴随跟踪,计算概念语义相似度,设计翻译语义偏离反馈系数进行误差修正,实现模糊语义选取。试验测试结果表明,采用该方法进行模糊语义选取,对英语语义机器翻译的查准率较高,翻译准确性得到提高。
关键词: 机器翻译; 模糊语义选取; 本体映射; 自适应跟随性
中图分类号: TN911?34; TP391 文献标识码: A 文章编号: 1004?373X(2017)22?0042?03
Abstract: As fuzzy semantic selection needs to be performed to improve the accuracy and adaptive following performance of English machine translation, a fuzzy semantic selection technology based on the context match of concept sets is proposed for English semantic machine translation. The fuzzy semantic ontology mapping method is adopted to select semantic features in English machine translation so that all the contextual semantic information parameters in English text inside the ontology are obtained. To realize fuzzy semantic selection, the adaptive tracking are performed for the parameters, the concept semantic similarity is computed, and the semantic deviation feedback coefficient is designed for error correction. The test results show that the method for fuzzy semantic selection in English semantic machine translation has high precision ratio and the translation accuracy can be improved.
Keywords: machine translation; fuzzy semantic selection; ontology mapping; adaptive following performance
0 引 言
随着信息处理技术的發展,大量的智能翻译软件不断出现,机器翻译逐渐取代人工翻译,而成为未来英语翻译的一个重要角色,机器翻译的准确性和自适应性成为未来翻译软件研究的重要课题。对机器翻译的优化问题是建立在语义选择和特征提取基础上,通过提取英语上下文的文本语义信息特征,结合智能分析和语义信息检索技术,实现语义信息的本体映射和自适应伴随跟踪,结合模式识别方法实现英语智能翻译,研究英文语义机器翻译中的模糊语义选取技术,在优化机器翻译软件设计,提高翻译准确性和人工智能性方面具有重要意义。传统方法主要有主题树特征匹配方法[1]、支持向量机算法、粒子群进化方法等[2],对英文翻译语义特征进行语言评价集模型构建和特征组合匹配,提高翻译的准确性,取得了一定的研究成果,但是传统方法存在上下文干扰抑制能力不强,容易出现耦合干扰等问题。对此,提出基于概念集上下文匹配的英文语义机器翻译中的模糊语义选取技术,实现模糊语义选取,通过仿真试验进行了性能测试,展示了本文方法在提高英文机器翻译的查准率方面的优越性能。
1 英文机器翻译的语义特征筛选
1.1 模糊语义本体映射
为了实现英文语义机器翻译中的模糊语义选取和翻译自适应跟随优化,首先构建模糊语义本体映射模型。采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,进行机器英语翻译的语义分析和模块提取,设定语义映射关系结构,在语义映射模块中进行二元语义判断和英文翻译的语法分析和纠正[3],得到英文机器翻译模糊语义本体映射过程。
根据模糊语义本体映射模型,构建英文机器翻译的综合评价决策函数为:
1.2 语义信息特征提取
采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量集合为:
在图1中的英语语义相似本体片段中,计算概念语义相似度。设[s1,a1,s2,a2,…,sn,an]是一组二元语义信息,在本体中,英语语义特征信息的知识存储的基本单元的权重向量为[ω=ω1,ω2,…,ωnT],[ωj∈0,1],则语义映射的二元加权算术平均算子φ1定义为:
2 模糊语义选取技术改进实现
在进行英文机器翻译的语义特征筛选和语义本体映射建模基础上,进行模糊语义选取优化设计,提高英文语义机器翻译准确性,提出基于概念集上下文匹配的模糊语义选取技术[5],对本体内部所有英语文本上下文语义信息参量进行自适应伴随跟踪,自适应伴随跟踪目标函数记为:
3 仿真试验与结果分析
为了测试本文方法在实现英文语义机器翻译中的模糊语义选取和英文机器翻译的优越性能,进行仿真实验分析。试验采用Matlab 7 仿真设计,测试数据来自于Textile Science英文机器翻译的文本库,使用OAEI语义特征数据集作为英文机器翻译的训练函数集,参考本体包含32个概念集,语义映射参考本体N=1 024,含有65个属性集。根据仿真环境和参量设定,以英语机器翻译的模糊语义选择查全率、查准率为测试指标,得到不同方法进行翻译测试结果如图2和图3所示。
分析图2和图3结果得知,采用本文方法进行英文语义机器翻译中的模糊语义选取,提高了翻译过程中的查全率和查准率,从而提高了翻译的准确性。
4 结 语
本文进行了英文机器翻译的优化语义选取设计,采用模糊语义本体映射方法进行英文机器翻译的语义特征筛选,得到本体内部所有英语文本上下文的语义信息参量,对参量进行自适应伴随跟踪,设计翻译语义偏离反馈系数进行误差修正,实现模糊语义选取。研究得知,采用该方法进行模糊语义选取,提高了英语语义机器翻译的查准率和查全率,机器翻译的准确性得到改善。
参考文献
[1] 辛宇,杨静,汤楚蘅,等.基于局部语义聚类的语义重叠社区发现算法[J].计算机研究与发展,2015,52(7):1510?1521.
[2] 冶忠林,杨燕,贾真,等.基于语义扩展的短问题分类[J].计算机应用,2015,35(3):792?796.
[3] 杨磊磊,陈松灿.最坏分离的联合分辨率判别分析[J].软件学报,2015,26(6):1386?1394.
[4] 章登义,吴文李,欧阳黜霏.基于语义度量的RDF图近似查询[J].电子学报,2015,43(7):1320?1328.
[5] 蒋本立,张小平.大数据网络的均衡调度平台设计与改进[J].现代电子技术,2016,39(6):62?65.
[6] BENGIO Y, COURVILLE A, VINCENT P. Representation learning: a review and new perspectives [J]. IEEE transactions on pattern analysis and machine intelligence, 2013, 35(8): 1798?1828.