基于Lucene的搜索排序算法研究与实现
刘琼茹
摘要:Imcene是Java实现全文搜索引擎的工具包,短小精悍,功能强大,近来被广泛使用。文章对其核心“索引一检索”进行了研究,搭建该平台并引入了中文分词,可完成对中文的搜索,以及实现“与”和“非”功能。在排序部分,分别用向量空间模型和BM25实现。在系统实现时,主要介绍了3种评测方法,对vsM和BM25模型排序算法进行了评测,并进行对比分析。
關键词:搜索引擎;Lucene;空间向量模型;BM25
刘琼茹
摘要:Imcene是Java实现全文搜索引擎的工具包,短小精悍,功能强大,近来被广泛使用。文章对其核心“索引一检索”进行了研究,搭建该平台并引入了中文分词,可完成对中文的搜索,以及实现“与”和“非”功能。在排序部分,分别用向量空间模型和BM25实现。在系统实现时,主要介绍了3种评测方法,对vsM和BM25模型排序算法进行了评测,并进行对比分析。
關键词:搜索引擎;Lucene;空间向量模型;BM25
崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了
唐敏敏 张静摘要:频率混叠是数字信号处理中特有的现象,发生频率混叠后,信号会分析出错误的结果。而采样过程中,由于频率不够高,采样出
晁宁+罗晓英+杨新龙<br />
摘 要: 分析直角坐标框架结构平台和极坐标框架平台结构星载天线在各自盲区状态区域附近的发散问题。通过建