网站首页  词典首页

请输入您要查询的论文:

 

标题 一种基于语义扩展的跨语言自动检索方法的设计
范文 宁琳
〔摘 要〕跨语言检
索是一种重要的信息检索手段之一?为了提高跨语言检索效率,采用语义扩展的方法,通过
分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语
义扩展?知识库和结果聚类等设计进行了阐述,提出了语义理解切分法的分词方法,采用了
Single-Pass算法进行聚类,实验结果表明,该模型能有效提高跨语言检索的查全率和查准
率?
〔关键词〕跨语言信息检索;语义
扩展;分词
DOI:10.3969/j
.issn.1008-0821.2014.01.033
〔中图分类号〕G252.7 〔文献标识码〕B 〔文章编号
〕1008-0821(2014)01-0155-04
A Kind of Design of the Cross-La
nguage Information
Retrieval on the Basis of the Semantic Extension
Ning Lin
(Library,Chongqing Jiaotong University,Chongqing 400074,China)HT〗
〔Abstract〕”BZ〗The Cross-language retrieval is an important method of information retri
eval.In order to improve the cross-language retrieval efficiency,it adapts the m
ethod of semantic extension.By analyzing the design idea and workflow,it builds
a kind of cross-language automatic retrieval model based on semantic extension.F
ocusing on its semantic extension,knowledge base and expounding the result clust
ering design,the semantic understanding segmentation method of word segmentation
method is proposedand adapts the Single-Pass clustering algorithm.The experimen
tal results show that this model can effectively improve the cross-language retr
ieval recall and precision.
〔Key words〕CLIR(Cross-Lang
uage Information Retrieval);semantic extension;segmentation
随着网络技术的迅猛发展,信息检索已成为我们利用网络获取信息的必备工具?但是,
通常的信息检索技术只对自然语言作处理,而自然语言之间在语义和语言结构上差异很大,
这给人们进行检索时带来很大语言障碍?跨语言信息检索(CLIR)技术的出现,为网络信息
搜集提供了新的方式,用户只需输入一种语言的查询,就能检索出其他多种语言的文档,实
现信息获取的目的?目前,跨语言信息检索的实现策略很多,但普遍存在查全率和查准率较
低的情况,采用语义扩展的跨语言检索方式,通过对用户输入的原始搜索指令进行跨语言的
语义扩展,扩展出查询词的潜在语义相关词,并对扩展后的内容进行自动聚类分析处理,可
以实现多语言的同步搜索并提高跨语言检索的查全率和查准率,为解决网络上语言差异的问
题提出很好的思路?
1 跨语言信息检索及其主要方法跨语言信息检索是指用户以一种语言提问,检出另一种语言或多种语言描述的相关信息?在
跨语言检索中,不同语言之间的“翻译”是跨语言信息检索的核心问题,也是跨语言信息检
索的研究热点与难点?目前,有3种公认的主要翻译方法:机器翻译技术?基于词典的方法
?基于语料库的方法[1]?
1.1 机器翻译技术
机器翻译是将跨语言检索系统直接应用于检索过程中?主要有两种方法:一是将用户的查询
翻译为与文档相同的语种;另一种是将文档翻译为与查询相同的语种,然后再用单语种的信
息检索系统进行检索[6]?但是,由于机器翻译技术通常是基于整句翻译的,不能
进行语境信息和领域知识的处理,很难消除翻译歧义,在实际检索过程中会产生大量冗余文
档,结果不够精确?
1.2 基于词典的策略
其基本思路在于,利用一部双语词典,将用户提出的查询检索词交换为目标语言的检索词,
然后再在文档集中查询相关信息?这种方法缺点在于翻译时是以词为单位,而在各种语言中
普遍存在的一词多义现象,导致大大增加了翻译的复杂性?
1.3 基于语料库的策略
基于语料库的方法从大规模的语料入手,从中抽取所需的信息,自动构建与应用有关的翻译
技术?语料库分为两种:比较语料库和平行语料库?比较语料库内每种语言文献集内的文献
并非一一对应,而仅仅是讨论相同主题而已?平行语料库强调两种语言文献的一一对应,而
这种相互对译的双语语料库并不容易实现?
目前,跨语言信息检索最常用的是基于词典的策略和基于语料库的策略?在基于词典的跨语
言信息检索中,未知词的处理一直困扰着人们,对于不在词典中的词就无法翻译?语料库建
设难度较大,规模通常也较有限?因此利用查询扩展技术将两种方法进行整合是解决翻译问
题的一种有效方法,即利用语义词典对查询语句进行语义扩展,再将扩展词汇与语料库对比
分析,分析该语义段落中的潜在目标对象和查询请求的语义相关性,从而决定是否将其作为
结果返回,查询扩展可分别在查询翻译前或查询后进行,也可以同时在查询翻译前?后进行
,这种方法可以减少与词典翻译有关的错误,部分地解决词汇问题中“多词同义或近义”的
问题?
2.2.1 知识库模块
该模块主要是对输入的原始搜索指令进行分析,利用知识库和通用语义词典,对搜索指令进
行跨语言扩展,语义词典为知识库信息搜索提供了语义扩展的基本素材,由于语义词典与具
体应用无关,因此存在专用术语不全?领域语义模糊?新词汇和特殊的词汇没有收录等问题
,因此,有必要设计针对用户需求的专业知识库,该库收录的内容包括:专业信息搜集中常
用词的中英文同义词,地名?机构名?术语的全称?简称?缩写等中英文的表述,网络中新
出现的词汇的中英文表述,人名的中英文各种译法等?
2.2.2 搜索指令的跨语言语义扩展模块
该模块是实现跨语言扩展的核心部分,它主要包括数据预处理?特征提取?特征权重的计算
和查询扩展等部分?
(1)数据预处理
数据预处理是对搜索的原始数据进行提取?分解?合并,最后转化为适合进行数据挖掘的数
据格式?它包括两个解析过程:一是将包含标记符号的Web文档解析成只含有用信息的文本
文档,利用抓取工具把检索的结果抓取到数据库,然后利用HTML解析工具对Web文本进行分
析,进行去HTML标记的处理?二是对文本文档进行分词处理?分词就是将中文或其它语言的
词句按照一定序列切分成有意义的词[5],目前,分词的方法有很多,如机械匹配
法?特征词库法?约束矩阵法等,在这里,我主要提出了一种具有“理解”功能的切分法—
—语义理解切分法,其基本思想是:先建立一个词库,其中包含所有可能出现的词和它们的
各种语义信息,对给定的待分词的词句S,按照某种确定的原则切取S的子串,若该子串与词
库中的某词条相匹配,则从词库中取出该词的所有语义信息,然后调用语义分析程序进行语
义分析(包括形成理解结果和检索约束条件)?若分析正确,则该子串是词,记下理解结果
作为后继切分的基础,继续分割余下部分,直到余下部分为空?否则该子串不是词,转上重
新切取S的子串进行匹配?理解切分法的优点在于它的最终结果包括理解结果的内部表示,
为后继的处理提供很大的帮助?
对数据预处理后的信息提供两种聚类对象集,当用户想要快速地进行检索时,可以选择标题
和摘要作为对象集的处理结果,当用户想要得到更加准确的结果,可以选择原始网页作为对
象集?
(2)特征提取
在提取文本特征时,剔除对文本分类没有用处的虚词,而在实词中,主要提取类别特性的表
现力最强的名词和动词作为文本的特征词?
对于同义词,首先是对文本进行部分语义分析,利用语义词典获取词汇的语义信息,将语义
相同的词汇映射到同一概念,进行概念聚类,并将概念相同的词合并成同一词?用聚类得到
的词作为文档向量的特征项,能够比普通词汇更加准确地表达文档内容,减少特征之间的相
关性和同义现象,这样可以有效降低文档向量的维数,减少文档处理计算量,提高特征提取
的精度和效率?
(3)特征权重的计算
利用分词工具对中英文的文档进行分词处理并进行词性标注,标注主要用于特征提取?而特
征词在不同的标记符中对内容的反映程度不同,其权重的计算方法也不同,本文采用的是常
用的TFIDF(词频——逆文档频度)加权法?
通常来说,对区别文档最有意义的词应是在文档中出现频率高,而在整个文档集合的其他文
档中出现频率少的词,因此采用TF词频作为测度来体现同类文本的特点?另外,TFIDF法认
为一个单词出现的文本频数越小,它区别不同类别文本的能力就越大,因此采用逆文本频度
IDF,以TF和IDF的乘积作为特征空间的取值测度,并用它完成对权值TF的调整,从而实现突
出重要单词的目的?其过程如下:
(4)查询扩展
查询扩展技术是语义检索的一个重要方面?查询扩展把与原查询相关的词语或者语言查询语
义相关的概念添加到原查询,得到比原查询更长的新查询,然后检索文档,以提高信息检索
的查全率和查准率[4]?
①手工查询扩展:人工挑选与查询词相关的其它特征词,将其加入到原始查询中构成新的查
询?
②自动查询扩展:使用语法分析?统计等技术从文档集合中自动学习,获得词与词间的相关
信息[3]?
本模块采用自动查询扩展和手工查询扩展相结合的方法,即将经过语义词典扩展的词以选择
项的方式提供给用户,供用户进行选择,从而解决同义词扩展过多,词语相似度低的问题?
对于新出现的词汇?地名?机构名,通过定期更新知识库记录的方法加以解决?专业术语通
常采用与专业词典相结合的办法,首先在通用语义词典中查找词意,当其无法满足要求时,
再转向专业词典进行查找?
2.2.3 跨语言文本自动聚类模块分析
搜索引擎是以关键字匹配的检索方式,导致搜索引擎返回的结果中有许多是与用户的查询不
相关的文档,因此需要对返回的结果进行筛选?通过对检索结果的上下文进行分析,以文档
的相似度为基础,对结果进行聚类,能自动地对检索结果进行筛选,从而解决查询文档过多
的问题?本模块在对搜索引擎返回的结果进行聚类处理时,通过计算结果文档与设定模板的
相似度,根据相似度阈值,分批对结果进行聚类,大于阈值的文档则搜集进信息资料数据库
,小于阈值的文档则直接舍弃,当满足一定的条件时,停止聚类,完成筛选?
(1)文本聚类
按照数据的相似性和差异性,将数据划分为若干簇,同簇的尽量相似,不同簇的尽量相异,
这种对数据进行自动组织的方法称为聚类[2]?聚类通过比较数据的相似性和差异
性,能发现数据的内在特征及分布规律,从而获得对数据更深刻的理解和认识?
聚类分为两种:检索前聚类和检索后聚类?检索前聚类是在检索之前对全部文档进行聚类,
使相关的文档在同一类中,在检索过程中,每个文档类以一个向量来表示,查询向量先与各
个类向量逐一进行比较,最后得到相关度较高的类?检索后聚类是在检索之后对查询相关的
文档进行聚类?与检索前聚类相比,检索后聚类能够分析相关文档集合的特征,提高检索效
果?
(2)聚类的过程
该设计的聚类主要采用了Single-Pass启发式聚类算法,首先,按照一定的次序,将第
一篇文档作为聚类依据,将其余文档按次序依次对其进行相似性比较,如相似性达到系统设
定的要求,即将其归入该类,并重新计算其类心,作为其他文档的匹配依据,如未达到系统
要求的阈值,则直接将该文档作为新类的聚类依据,所有文档均依次按这一方式聚类?除此
之外,为了提高聚类的效率,减少对原始网页的处理时间,该聚类还对搜索引擎返回的结果
进行分批次聚类处理,每次聚类的过程相同,前一批次的聚类结果作为后一批次的聚类模板
?
具体过程:设每一批次处理的文档数量为N,在算法中,设计了一个计数器K,用于计算每一
批处理的文档中归入类中的数量,如果K=0,表示在这一批次中符合要求的文档数为0,则停
止聚类,算法中模板的向量用模板集中向量的平均值来表示,平均值的计算公式为:
mi=∑ni=1xi/n
xi为模板集中的随机向量,n为模板集中对象的个数?文档与模板间的相似度用余弦公式
来定义?
在聚类中阈值的设定很关键,阈值设定过大,导致查全率的降低,阈值设定过小,则导致查
准率的降低?
3 跨语言语义扩展检索结果分析TBZ〗
本文实验设计了10组中英文查询进行检索,利用百度?中搜?Google搜索引擎进行原始指令
搜索和扩展后的指令搜索,并对前100个检索结果采用查全率和查准率进行统计,将统计结
果进行平均,然后得到评估结果(表1):
表1 原始检索和语义扩展检索结果评估
实验结果表明,3个普通搜索引擎采用原始检索的查全率和查准率平均值分别为0.18和
0.34,而采用语义扩展检索的查全率和查准率平均值分别为0.35和0.53,通过语义扩展
对普通搜索引擎进行跨语言语义扩展的二次优化,可以有效地提高跨语言检索的查全率和查
准率,提高了网络信息搜集的效率?
4 结束语
解决网络语言差异的障碍,采用语义扩展的跨语言检索是一种较好的方法?该方法通过构建
跨语言语义扩展检索模型,对原始搜索指令进行跨语言的语义扩展,将传统搜索进行二次优
化,实现多语言的同步搜索,然后,利用Single-Pass聚类算法对返回的结果进行聚类分析
,实现搜索结果的自动取舍,为用户进行信息检索提供有力帮助?该设计下一步研究:一是
提取更准确的文本特征,整理出更完善的语义资源库?二是尝试对文本以外的多媒体资料进
行自动分析,扩大语义检索的范围?
参考文献
[1]杨丽.国外跨语言信息检索的技术研究综述[J].情报杂志,2008,
(7):38.
[2]邹良群.互联网公开情报跨语言搜集自动化处理研究[C].国际关系学院论文集,
2009.
[3]郭文.跨语言信息检索中的查询扩展[J].心智与计算,2009,(1):1-8.
[4]李莉,高庆狮.一种基于语义单元的查询扩展方法[J].计算机科学,2008,35(
2):201-204.
[5]Metzler D,Croft W B.Latent Concept Expansion Using Markov Random Fields[
C].Proceedings of the 30th annual international ACM SIGIR conference on Resea
rch and developm ent in information retrieval.New York:ACM Press,2007:311-314.
[6]Gey F C,Jiang H,Chen A.Manual Queries and Machine Translation in Cross
—Language Retrieval and Interactive Retrieval With Cheshire 2 atTREC—7[M].
InProc.ofthe 7thTextRetrievalE.valuation Conf,2005.
(本文责任编辑:孙国雷)
询?
②自动查询扩展:使用语法分析?统计等技术从文档集合中自动学习,获得词与词间的相关
信息[3]?
本模块采用自动查询扩展和手工查询扩展相结合的方法,即将经过语义词典扩展的词以选择
项的方式提供给用户,供用户进行选择,从而解决同义词扩展过多,词语相似度低的问题?
对于新出现的词汇?地名?机构名,通过定期更新知识库记录的方法加以解决?专业术语通
常采用与专业词典相结合的办法,首先在通用语义词典中查找词意,当其无法满足要求时,
再转向专业词典进行查找?
2.2.3 跨语言文本自动聚类模块分析
搜索引擎是以关键字匹配的检索方式,导致搜索引擎返回的结果中有许多是与用户的查询不
相关的文档,因此需要对返回的结果进行筛选?通过对检索结果的上下文进行分析,以文档
的相似度为基础,对结果进行聚类,能自动地对检索结果进行筛选,从而解决查询文档过多
的问题?本模块在对搜索引擎返回的结果进行聚类处理时,通过计算结果文档与设定模板的
相似度,根据相似度阈值,分批对结果进行聚类,大于阈值的文档则搜集进信息资料数据库
,小于阈值的文档则直接舍弃,当满足一定的条件时,停止聚类,完成筛选?
(1)文本聚类
按照数据的相似性和差异性,将数据划分为若干簇,同簇的尽量相似,不同簇的尽量相异,
这种对数据进行自动组织的方法称为聚类[2]?聚类通过比较数据的相似性和差异
性,能发现数据的内在特征及分布规律,从而获得对数据更深刻的理解和认识?
聚类分为两种:检索前聚类和检索后聚类?检索前聚类是在检索之前对全部文档进行聚类,
使相关的文档在同一类中,在检索过程中,每个文档类以一个向量来表示,查询向量先与各
个类向量逐一进行比较,最后得到相关度较高的类?检索后聚类是在检索之后对查询相关的
文档进行聚类?与检索前聚类相比,检索后聚类能够分析相关文档集合的特征,提高检索效
果?
(2)聚类的过程
该设计的聚类主要采用了Single-Pass启发式聚类算法,首先,按照一定的次序,将第
一篇文档作为聚类依据,将其余文档按次序依次对其进行相似性比较,如相似性达到系统设
定的要求,即将其归入该类,并重新计算其类心,作为其他文档的匹配依据,如未达到系统
要求的阈值,则直接将该文档作为新类的聚类依据,所有文档均依次按这一方式聚类?除此
之外,为了提高聚类的效率,减少对原始网页的处理时间,该聚类还对搜索引擎返回的结果
进行分批次聚类处理,每次聚类的过程相同,前一批次的聚类结果作为后一批次的聚类模板
?
具体过程:设每一批次处理的文档数量为N,在算法中,设计了一个计数器K,用于计算每一
批处理的文档中归入类中的数量,如果K=0,表示在这一批次中符合要求的文档数为0,则停
止聚类,算法中模板的向量用模板集中向量的平均值来表示,平均值的计算公式为:
mi=∑ni=1xi/n
xi为模板集中的随机向量,n为模板集中对象的个数?文档与模板间的相似度用余弦公式
来定义?
在聚类中阈值的设定很关键,阈值设定过大,导致查全率的降低,阈值设定过小,则导致查
准率的降低?
3 跨语言语义扩展检索结果分析TBZ〗
本文实验设计了10组中英文查询进行检索,利用百度?中搜?Google搜索引擎进行原始指令
搜索和扩展后的指令搜索,并对前100个检索结果采用查全率和查准率进行统计,将统计结
果进行平均,然后得到评估结果(表1):
表1 原始检索和语义扩展检索结果评估
实验结果表明,3个普通搜索引擎采用原始检索的查全率和查准率平均值分别为0.18和
0.34,而采用语义扩展检索的查全率和查准率平均值分别为0.35和0.53,通过语义扩展
对普通搜索引擎进行跨语言语义扩展的二次优化,可以有效地提高跨语言检索的查全率和查
准率,提高了网络信息搜集的效率?
4 结束语
解决网络语言差异的障碍,采用语义扩展的跨语言检索是一种较好的方法?该方法通过构建
跨语言语义扩展检索模型,对原始搜索指令进行跨语言的语义扩展,将传统搜索进行二次优
化,实现多语言的同步搜索,然后,利用Single-Pass聚类算法对返回的结果进行聚类分析
,实现搜索结果的自动取舍,为用户进行信息检索提供有力帮助?该设计下一步研究:一是
提取更准确的文本特征,整理出更完善的语义资源库?二是尝试对文本以外的多媒体资料进
行自动分析,扩大语义检索的范围?
参考文献
[1]杨丽.国外跨语言信息检索的技术研究综述[J].情报杂志,2008,
(7):38.
[2]邹良群.互联网公开情报跨语言搜集自动化处理研究[C].国际关系学院论文集,
2009.
[3]郭文.跨语言信息检索中的查询扩展[J].心智与计算,2009,(1):1-8.
[4]李莉,高庆狮.一种基于语义单元的查询扩展方法[J].计算机科学,2008,35(
2):201-204.
[5]Metzler D,Croft W B.Latent Concept Expansion Using Markov Random Fields[
C].Proceedings of the 30th annual international ACM SIGIR conference on Resea
rch and developm ent in information retrieval.New York:ACM Press,2007:311-314.
[6]Gey F C,Jiang H,Chen A.Manual Queries and Machine Translation in Cross
—Language Retrieval and Interactive Retrieval With Cheshire 2 atTREC—7[M].
InProc.ofthe 7thTextRetrievalE.valuation Conf,2005.
(本文责任编辑:孙国雷)
询?
②自动查询扩展:使用语法分析?统计等技术从文档集合中自动学习,获得词与词间的相关
信息[3]?
本模块采用自动查询扩展和手工查询扩展相结合的方法,即将经过语义词典扩展的词以选择
项的方式提供给用户,供用户进行选择,从而解决同义词扩展过多,词语相似度低的问题?
对于新出现的词汇?地名?机构名,通过定期更新知识库记录的方法加以解决?专业术语通
常采用与专业词典相结合的办法,首先在通用语义词典中查找词意,当其无法满足要求时,
再转向专业词典进行查找?
2.2.3 跨语言文本自动聚类模块分析
搜索引擎是以关键字匹配的检索方式,导致搜索引擎返回的结果中有许多是与用户的查询不
相关的文档,因此需要对返回的结果进行筛选?通过对检索结果的上下文进行分析,以文档
的相似度为基础,对结果进行聚类,能自动地对检索结果进行筛选,从而解决查询文档过多
的问题?本模块在对搜索引擎返回的结果进行聚类处理时,通过计算结果文档与设定模板的
相似度,根据相似度阈值,分批对结果进行聚类,大于阈值的文档则搜集进信息资料数据库
,小于阈值的文档则直接舍弃,当满足一定的条件时,停止聚类,完成筛选?
(1)文本聚类
按照数据的相似性和差异性,将数据划分为若干簇,同簇的尽量相似,不同簇的尽量相异,
这种对数据进行自动组织的方法称为聚类[2]?聚类通过比较数据的相似性和差异
性,能发现数据的内在特征及分布规律,从而获得对数据更深刻的理解和认识?
聚类分为两种:检索前聚类和检索后聚类?检索前聚类是在检索之前对全部文档进行聚类,
使相关的文档在同一类中,在检索过程中,每个文档类以一个向量来表示,查询向量先与各
个类向量逐一进行比较,最后得到相关度较高的类?检索后聚类是在检索之后对查询相关的
文档进行聚类?与检索前聚类相比,检索后聚类能够分析相关文档集合的特征,提高检索效
果?
(2)聚类的过程
该设计的聚类主要采用了Single-Pass启发式聚类算法,首先,按照一定的次序,将第
一篇文档作为聚类依据,将其余文档按次序依次对其进行相似性比较,如相似性达到系统设
定的要求,即将其归入该类,并重新计算其类心,作为其他文档的匹配依据,如未达到系统
要求的阈值,则直接将该文档作为新类的聚类依据,所有文档均依次按这一方式聚类?除此
之外,为了提高聚类的效率,减少对原始网页的处理时间,该聚类还对搜索引擎返回的结果
进行分批次聚类处理,每次聚类的过程相同,前一批次的聚类结果作为后一批次的聚类模板
?
具体过程:设每一批次处理的文档数量为N,在算法中,设计了一个计数器K,用于计算每一
批处理的文档中归入类中的数量,如果K=0,表示在这一批次中符合要求的文档数为0,则停
止聚类,算法中模板的向量用模板集中向量的平均值来表示,平均值的计算公式为:
mi=∑ni=1xi/n
xi为模板集中的随机向量,n为模板集中对象的个数?文档与模板间的相似度用余弦公式
来定义?
在聚类中阈值的设定很关键,阈值设定过大,导致查全率的降低,阈值设定过小,则导致查
准率的降低?
3 跨语言语义扩展检索结果分析TBZ〗
本文实验设计了10组中英文查询进行检索,利用百度?中搜?Google搜索引擎进行原始指令
搜索和扩展后的指令搜索,并对前100个检索结果采用查全率和查准率进行统计,将统计结
果进行平均,然后得到评估结果(表1):
表1 原始检索和语义扩展检索结果评估
实验结果表明,3个普通搜索引擎采用原始检索的查全率和查准率平均值分别为0.18和
0.34,而采用语义扩展检索的查全率和查准率平均值分别为0.35和0.53,通过语义扩展
对普通搜索引擎进行跨语言语义扩展的二次优化,可以有效地提高跨语言检索的查全率和查
准率,提高了网络信息搜集的效率?
4 结束语
解决网络语言差异的障碍,采用语义扩展的跨语言检索是一种较好的方法?该方法通过构建
跨语言语义扩展检索模型,对原始搜索指令进行跨语言的语义扩展,将传统搜索进行二次优
化,实现多语言的同步搜索,然后,利用Single-Pass聚类算法对返回的结果进行聚类分析
,实现搜索结果的自动取舍,为用户进行信息检索提供有力帮助?该设计下一步研究:一是
提取更准确的文本特征,整理出更完善的语义资源库?二是尝试对文本以外的多媒体资料进
行自动分析,扩大语义检索的范围?
参考文献
[1]杨丽.国外跨语言信息检索的技术研究综述[J].情报杂志,2008,
(7):38.
[2]邹良群.互联网公开情报跨语言搜集自动化处理研究[C].国际关系学院论文集,
2009.
[3]郭文.跨语言信息检索中的查询扩展[J].心智与计算,2009,(1):1-8.
[4]李莉,高庆狮.一种基于语义单元的查询扩展方法[J].计算机科学,2008,35(
2):201-204.
[5]Metzler D,Croft W B.Latent Concept Expansion Using Markov Random Fields[
C].Proceedings of the 30th annual international ACM SIGIR conference on Resea
rch and developm ent in information retrieval.New York:ACM Press,2007:311-314.
[6]Gey F C,Jiang H,Chen A.Manual Queries and Machine Translation in Cross
—Language Retrieval and Interactive Retrieval With Cheshire 2 atTREC—7[M].
InProc.ofthe 7thTextRetrievalE.valuation Conf,2005.
(本文责任编辑:孙国雷)
随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/11 20:50:07