高校网站建设的搜索引擎优化策略研究
杨建锋 刘 琳 宁玉文 刘瑞献
摘要:目前,高校网站的点击率较低,不便于宣传展示和资源共享。按照搜索引擎的工作原理,高校网站需要通过标记、服务器端设置、内容管理和日常维护四大策略,全面提升高校网站的点击率,让高校网站发挥应有的作用,为用户服务。
关键词:高校网站 搜索引擎 优化策略
中图分类号:TP393.07 文献标识码:A 文章编号:1673-8454(2009)21-0025-03
高校网站作为学校网上对外宣传的窗口和学校教育信息资源共享的平台发挥着重要作用。据CNNIC调查数据显示,截至2008年底,中国的网站数,即域名注册者在中国境内的网站数(包括在境内接入和境外接入)达到287.8万个,中国网页总数超过160亿个,高校网站是海量网站中的一员,但是,要让用户在数百亿网页中直接找到地址未知的资源,十分困难,用户必须依靠搜索引擎来获取所需信息和资源。然而许多高校网站不能较好地被搜索引擎索引,点击率很低,导致网站的访问量很小,没有达到网络宣传和资源共享目的。所以高校网站建设时,必须要考虑搜索引擎优化(SEO)策略,针对搜索引擎进行优化,提高高校网站的易发现性。
一、搜索引擎工作原理
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。[1]从用户的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框内输入关键字后,通过浏览器提交给搜索引擎,搜索引擎处理后就会返回给用户与提交内容相关的信息列表。搜索引擎主要完成三个方面的工作,如图1所示,分别是抓取网页、处理网页和提供检索服务,其中只有提供检索服务是用户可见的。
1.抓取网页。每个独立的搜索引擎都有自己的网页抓取程序(Spider)。Spider按主机IP段或用户提交的关键词,顺着网页中的超链接,主动连续地抓取网页。抓取时Spider会分析网页内的关键词或段落,从而获取网页的核心内容,存入搜索服务器,被抓取的网页被称之为网页快照。
2.处理网页。搜索引擎抓到网页后,还要做提取关键词、去除重复网页、分析超链接等大量的预处理工作,才能提供检索服务。其中,最重要的工作就是提取关键词,建立索引文件,并针对所提取的关键词对网页进行重要度分析,即PR(Page Rank)分析。不同的搜索引擎有不同的评价PR的方法,常见的评价指标有以下几种:(1)网站的内外部链接数,通常获得外部链接的数量越多,网页的可信度越高;(2)网页内容的原创性,新颖的内容一定会得到较高的PR;(3)网页构建时内容结构是否清晰,通常Html标记混乱的网页不会有好的PR,所以应该使用Web标准构建网页。[2] 其他影响PR的因素还有关键字密度、网页创建时间以及更新频率等,通常创建时间越长、更新越频繁的网页,PR值较高。
3.提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页信息,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息显示给用户,显示时按Page rank值由高到低的方式排列显示(竞价排名除外)。
二、高校网站建设的搜索引擎优化策略
搜索引擎优化,又称SEO(Search Engine Optimization),即针对搜索引擎来优化网站内容,遵循搜索引擎科学而全面的理论机制,对网站结构、网页文字语言和站点间的互动外交策略等进行合理规划部署来挖掘网站的最大潜力,使网站较容易被搜索引擎抓取并接收,搜索引擎在收到该网站的资料后进行比对及运算,然后将PR值较高的网站放在其他用户在搜索时优先看到的位置,从而促使搜索者可以得到正确且有帮助的信息。
根据搜索引擎的工作原理,笔者认为高校网站建设的搜索引擎优化应该从搜索引擎抓取网页和处理网页两个方面入手,在网站建设过程中,重点考虑的内容有:首先要基于Web标准来构建搜索引擎Spider可识别、可抓取的网页,这是搜索引擎优化最基本的要求;其次是确定所要优化的关键字,并根据搜索引擎的PR算法来优化关键字,这是网站搜索引起优化的重点;最后,对网站进行监控,掌握用户通常使用什么搜索引擎搜索,搜索热点关键字、推介网站分别是什么,并根据这些数据对网站做出调整,从而保证网站在各大搜索引擎中重要关键字拥有好的排名。
1.标记策略
世界知名的网站设计师Jeffrey Zeldman在他的著作《网站重构:应用Web标准进行设计(第2版)》中说,“事实上99.9%的网站都是过时的”。而目前国内高校网站的建设依旧采用复杂的代码、层层嵌套的表格、标签来布局,这些冗余代码占用了与良构网站相比二至三倍的带宽。这样的网站通常很难被搜索引擎Spider所识别和抓取,导致高校网站在搜索引擎中的排名情况不佳。
另外,网民的上网工具不同,据CNNIC《第22次中国互联网络发展状况统计报告》显示,中国2.53亿网民选择的上网设备正趋于多样化,有87.3%的网民使用台式机上网,其余约占3成的网民使用非台式机上网,其中有39.5%的网民使用手机上网,有1.4%的网民使用PDA上网。既使过时的高校网站能够被搜索引擎索引,并且拥有不错的排名,但是这些页面通常在不同的浏览器中差异明显甚至无法使用,尤其是使用手机以及PDA的访问者需要很长的加载响应时间才能打开页面,这样必然会丧失许多用户。因此必须通过标记策略来优化高校网站。
标记策略指的是基于Web标准进行网站开发,即使用正确语义的标签来构建网页内容,并尽可能使结构(Structure)、表现(Presentation)和行为(Behavior)三者分离。[3]Web标准提供信息的结构和层次,而搜索引擎需要用它来辨别页面是关于什么的,内容中最重要的是什么,因此遵循Web标准,可以改善网站的易发现性,并且使网站内容能够被更多的浏览器所浏览。
在高校网站搜索引擎优化中,我们必须首先确保高校网站能够被搜索引擎Spider解析代码,不会发现缺少关闭标签的错误或者语法错误;其次降低标记内容比,以帮助改善搜索排名,加快加载速度,这样搜索引擎就能快速索引整个网站;同时增加页面信息层次间的传达,使搜索引擎可以分辨出内容的重要程度;最后使用正确的标签,保证使用手机、PDA上网的用户也能够浏览网站。
2.服务器端策略
搜索引擎优化的最佳做法一般高度集中于客户端的改变,但服务器端也有很多办法,可以使网站更容易被搜索引擎索引并获得比较好的自然排名。高校网站在服务器端设置时必须注意以下几个方面:
域名管理。域名是放置关键字很重要的地方,可以帮助提高搜索引擎排名。域名的年限搜索结果排行也发挥着非常重要的作用,年轻的域名一般排名较低,所以高校网站建设中,一旦域名确定,特别是二级域名确定以后,尽量不要更改网站的域名。
建立搜索引擎友好的网址。设计不当的URL可能将搜索引擎Spider阻在半路,造成网站不完整的索引。[4]目前高校网站基本上都是动态网站,大量网址中通常带有GET变量字符串或会话ID,这样的网址通常不能够被搜索引擎Spider所正确识别。为了提高网站搜索引擎的索引率,可以在服务器端使用地址重写模块来重构网页地址,例如在服务器端是Apache的Web服务器上,可以使用mod_rewrite模块将网址改写成搜索引擎友好的网址。改写后的网址不仅对搜索引擎友好也对用户友好,描述性的网址不仅使网址可以预测,并且网址中还可以自然地放入关键字,从而进一步提高网站在搜索引擎中的排名。
优化高校索引的性能。对搜索引擎Spider来讲,页面的加载速度是个重要的问题,它要求尽可能快地爬过和索引网页。优化内容传递,将有助于确保Spider能高效地抓取网页,并创建更完整的列表。
另外,网站内容的响应速度还主要受服务器发送相应方式和文件大小的影响,我们可以通过缓存网页、用Gzip压缩文件和减少HTTP请求来提升响应速度。
3.内容策略
搜索引擎优化最核心的策略就是为用户提供有价值的内容。不管用户通过什么途径来到您的网站,只有当内容吸引人时,他们才会停留并回访网站。在确定好网站内容后,最重要的就是根据网站内容确定关键字,然后按照一定的策略在网页标题、网页摘要以及网页的内容中放入关键字实施关键字优化,使关键字密度符合搜索引擎算法,并在网页内容中对关键字进行标注、提供相关链接,从而使得关键字在搜索引擎的自然排名中获得较前的排名。
4.日常SEO维护策略
根据以上搜索引擎优化策略构建良构网站,仅仅只是网站搜索引擎优化的第一步,网站运行后我们还要利用一些网站流量监控工具对网站进行监控,从而帮助我们对网站进行搜索引擎优化的日常维护,下面以Google Analytics监控工具分析西北大学网站2008年的一些数据资料,用来说明日常SEO维护策略。
如图2、3、4所示,我们可以清楚地看到西北大学网站的访问量有43%是通过搜索引擎和推介网站获得,网站管理者可以清楚地知道访问者主要是通过什么搜索引擎以及搜索什么关键字访问网站的,从而可以进一步针对这些搜索引擎、关键字进行优化,从而使网站管理员可以及时地调整网站结构和内容,方便用户搜索。
三、高校网站搜索引擎优化的保障条件
1.优化学校综合门户
当人们开始关注某一个重大事件时,他们的第一反应可能是通过搜索引擎网站来搜索需要的信息资讯,然后从这些搜索结果中不断增加对事件的认知,并形成自己的判断。而对于高校而言,学校综合门户网站通常具有良好的排名,易被搜索引擎网站检索到,但是对于高校内部的院系网站、资源网站、辅助网站等二级网站,通常不易被检索。因此,高校网站必须建立以学校综合门户为入口,以信息资源为核心,以应用系统为支撑的网站体系,将学校的重要资源和应用系统集成于门户,方便用户发现,但还要避免信息的冗余,做到简洁但不失关键的要求。
2.需要团队协作
高校网站建设涉及学校的各个部门,通常由学校教育技术中心或网络中心等信息化机构主导建设,各职能部门协助参与。因此,搜索引擎优化不仅需要网站主导开发部门的技术优化策略,还需要各个部门与高校信息化机构密切合作,在内容管理和日常维护中积极参与,共同促进高校网站在搜索引擎中获得较好的排名。
3.优化需要时间
SEO是一个过程,不是一个结果,不可能一蹴而就。它需要搜索引擎访问网站,等待其他网站所有者响应链接请求,并且还需要网站的其他成员完成所需要的HTML编辑,这都需要花费一定的时间。
总之,高校网站在建设和日常管理时,必须要考虑自身搜索引擎优化问题,只有面向用户,建设良构的网站集群,才能让学校的网站真正发挥宣传的作用,实现资源共享的目标。
参考文献:
[1]孙颖,赵燕.智能搜索引擎及其实现技术问题初探[J].海南师范大学学报(自然科学版),2008,21(4):498-499.
[2]王毅,江小玲.基于PageRank算法的引擎搜索优化策略研究[J].科技资讯,2008(11):148-151.
[3](美)Jeffrey Zeldman.网站重构:应用Web标准进行设计(第2版)[M].北京:电子工业出版社,2008.
[4](美)Aarron Walter.Building Findable Websites:Web standards,SEO,and Beyond[M].北京:机械工业出版社,2008.
(编辑:于黎明)
摘要:目前,高校网站的点击率较低,不便于宣传展示和资源共享。按照搜索引擎的工作原理,高校网站需要通过标记、服务器端设置、内容管理和日常维护四大策略,全面提升高校网站的点击率,让高校网站发挥应有的作用,为用户服务。
关键词:高校网站 搜索引擎 优化策略
中图分类号:TP393.07 文献标识码:A 文章编号:1673-8454(2009)21-0025-03
高校网站作为学校网上对外宣传的窗口和学校教育信息资源共享的平台发挥着重要作用。据CNNIC调查数据显示,截至2008年底,中国的网站数,即域名注册者在中国境内的网站数(包括在境内接入和境外接入)达到287.8万个,中国网页总数超过160亿个,高校网站是海量网站中的一员,但是,要让用户在数百亿网页中直接找到地址未知的资源,十分困难,用户必须依靠搜索引擎来获取所需信息和资源。然而许多高校网站不能较好地被搜索引擎索引,点击率很低,导致网站的访问量很小,没有达到网络宣传和资源共享目的。所以高校网站建设时,必须要考虑搜索引擎优化(SEO)策略,针对搜索引擎进行优化,提高高校网站的易发现性。
一、搜索引擎工作原理
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统。[1]从用户的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框内输入关键字后,通过浏览器提交给搜索引擎,搜索引擎处理后就会返回给用户与提交内容相关的信息列表。搜索引擎主要完成三个方面的工作,如图1所示,分别是抓取网页、处理网页和提供检索服务,其中只有提供检索服务是用户可见的。
1.抓取网页。每个独立的搜索引擎都有自己的网页抓取程序(Spider)。Spider按主机IP段或用户提交的关键词,顺着网页中的超链接,主动连续地抓取网页。抓取时Spider会分析网页内的关键词或段落,从而获取网页的核心内容,存入搜索服务器,被抓取的网页被称之为网页快照。
2.处理网页。搜索引擎抓到网页后,还要做提取关键词、去除重复网页、分析超链接等大量的预处理工作,才能提供检索服务。其中,最重要的工作就是提取关键词,建立索引文件,并针对所提取的关键词对网页进行重要度分析,即PR(Page Rank)分析。不同的搜索引擎有不同的评价PR的方法,常见的评价指标有以下几种:(1)网站的内外部链接数,通常获得外部链接的数量越多,网页的可信度越高;(2)网页内容的原创性,新颖的内容一定会得到较高的PR;(3)网页构建时内容结构是否清晰,通常Html标记混乱的网页不会有好的PR,所以应该使用Web标准构建网页。[2] 其他影响PR的因素还有关键字密度、网页创建时间以及更新频率等,通常创建时间越长、更新越频繁的网页,PR值较高。
3.提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页信息,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息显示给用户,显示时按Page rank值由高到低的方式排列显示(竞价排名除外)。
二、高校网站建设的搜索引擎优化策略
搜索引擎优化,又称SEO(Search Engine Optimization),即针对搜索引擎来优化网站内容,遵循搜索引擎科学而全面的理论机制,对网站结构、网页文字语言和站点间的互动外交策略等进行合理规划部署来挖掘网站的最大潜力,使网站较容易被搜索引擎抓取并接收,搜索引擎在收到该网站的资料后进行比对及运算,然后将PR值较高的网站放在其他用户在搜索时优先看到的位置,从而促使搜索者可以得到正确且有帮助的信息。
根据搜索引擎的工作原理,笔者认为高校网站建设的搜索引擎优化应该从搜索引擎抓取网页和处理网页两个方面入手,在网站建设过程中,重点考虑的内容有:首先要基于Web标准来构建搜索引擎Spider可识别、可抓取的网页,这是搜索引擎优化最基本的要求;其次是确定所要优化的关键字,并根据搜索引擎的PR算法来优化关键字,这是网站搜索引起优化的重点;最后,对网站进行监控,掌握用户通常使用什么搜索引擎搜索,搜索热点关键字、推介网站分别是什么,并根据这些数据对网站做出调整,从而保证网站在各大搜索引擎中重要关键字拥有好的排名。
1.标记策略
世界知名的网站设计师Jeffrey Zeldman在他的著作《网站重构:应用Web标准进行设计(第2版)》中说,“事实上99.9%的网站都是过时的”。而目前国内高校网站的建设依旧采用复杂的代码、层层嵌套的表格、标签来布局,这些冗余代码占用了与良构网站相比二至三倍的带宽。这样的网站通常很难被搜索引擎Spider所识别和抓取,导致高校网站在搜索引擎中的排名情况不佳。
另外,网民的上网工具不同,据CNNIC《第22次中国互联网络发展状况统计报告》显示,中国2.53亿网民选择的上网设备正趋于多样化,有87.3%的网民使用台式机上网,其余约占3成的网民使用非台式机上网,其中有39.5%的网民使用手机上网,有1.4%的网民使用PDA上网。既使过时的高校网站能够被搜索引擎索引,并且拥有不错的排名,但是这些页面通常在不同的浏览器中差异明显甚至无法使用,尤其是使用手机以及PDA的访问者需要很长的加载响应时间才能打开页面,这样必然会丧失许多用户。因此必须通过标记策略来优化高校网站。
标记策略指的是基于Web标准进行网站开发,即使用正确语义的标签来构建网页内容,并尽可能使结构(Structure)、表现(Presentation)和行为(Behavior)三者分离。[3]Web标准提供信息的结构和层次,而搜索引擎需要用它来辨别页面是关于什么的,内容中最重要的是什么,因此遵循Web标准,可以改善网站的易发现性,并且使网站内容能够被更多的浏览器所浏览。
在高校网站搜索引擎优化中,我们必须首先确保高校网站能够被搜索引擎Spider解析代码,不会发现缺少关闭标签的错误或者语法错误;其次降低标记内容比,以帮助改善搜索排名,加快加载速度,这样搜索引擎就能快速索引整个网站;同时增加页面信息层次间的传达,使搜索引擎可以分辨出内容的重要程度;最后使用正确的标签,保证使用手机、PDA上网的用户也能够浏览网站。
2.服务器端策略
搜索引擎优化的最佳做法一般高度集中于客户端的改变,但服务器端也有很多办法,可以使网站更容易被搜索引擎索引并获得比较好的自然排名。高校网站在服务器端设置时必须注意以下几个方面:
域名管理。域名是放置关键字很重要的地方,可以帮助提高搜索引擎排名。域名的年限搜索结果排行也发挥着非常重要的作用,年轻的域名一般排名较低,所以高校网站建设中,一旦域名确定,特别是二级域名确定以后,尽量不要更改网站的域名。
建立搜索引擎友好的网址。设计不当的URL可能将搜索引擎Spider阻在半路,造成网站不完整的索引。[4]目前高校网站基本上都是动态网站,大量网址中通常带有GET变量字符串或会话ID,这样的网址通常不能够被搜索引擎Spider所正确识别。为了提高网站搜索引擎的索引率,可以在服务器端使用地址重写模块来重构网页地址,例如在服务器端是Apache的Web服务器上,可以使用mod_rewrite模块将网址改写成搜索引擎友好的网址。改写后的网址不仅对搜索引擎友好也对用户友好,描述性的网址不仅使网址可以预测,并且网址中还可以自然地放入关键字,从而进一步提高网站在搜索引擎中的排名。
优化高校索引的性能。对搜索引擎Spider来讲,页面的加载速度是个重要的问题,它要求尽可能快地爬过和索引网页。优化内容传递,将有助于确保Spider能高效地抓取网页,并创建更完整的列表。
另外,网站内容的响应速度还主要受服务器发送相应方式和文件大小的影响,我们可以通过缓存网页、用Gzip压缩文件和减少HTTP请求来提升响应速度。
3.内容策略
搜索引擎优化最核心的策略就是为用户提供有价值的内容。不管用户通过什么途径来到您的网站,只有当内容吸引人时,他们才会停留并回访网站。在确定好网站内容后,最重要的就是根据网站内容确定关键字,然后按照一定的策略在网页标题、网页摘要以及网页的内容中放入关键字实施关键字优化,使关键字密度符合搜索引擎算法,并在网页内容中对关键字进行标注、提供相关链接,从而使得关键字在搜索引擎的自然排名中获得较前的排名。
4.日常SEO维护策略
根据以上搜索引擎优化策略构建良构网站,仅仅只是网站搜索引擎优化的第一步,网站运行后我们还要利用一些网站流量监控工具对网站进行监控,从而帮助我们对网站进行搜索引擎优化的日常维护,下面以Google Analytics监控工具分析西北大学网站2008年的一些数据资料,用来说明日常SEO维护策略。
如图2、3、4所示,我们可以清楚地看到西北大学网站的访问量有43%是通过搜索引擎和推介网站获得,网站管理者可以清楚地知道访问者主要是通过什么搜索引擎以及搜索什么关键字访问网站的,从而可以进一步针对这些搜索引擎、关键字进行优化,从而使网站管理员可以及时地调整网站结构和内容,方便用户搜索。
三、高校网站搜索引擎优化的保障条件
1.优化学校综合门户
当人们开始关注某一个重大事件时,他们的第一反应可能是通过搜索引擎网站来搜索需要的信息资讯,然后从这些搜索结果中不断增加对事件的认知,并形成自己的判断。而对于高校而言,学校综合门户网站通常具有良好的排名,易被搜索引擎网站检索到,但是对于高校内部的院系网站、资源网站、辅助网站等二级网站,通常不易被检索。因此,高校网站必须建立以学校综合门户为入口,以信息资源为核心,以应用系统为支撑的网站体系,将学校的重要资源和应用系统集成于门户,方便用户发现,但还要避免信息的冗余,做到简洁但不失关键的要求。
2.需要团队协作
高校网站建设涉及学校的各个部门,通常由学校教育技术中心或网络中心等信息化机构主导建设,各职能部门协助参与。因此,搜索引擎优化不仅需要网站主导开发部门的技术优化策略,还需要各个部门与高校信息化机构密切合作,在内容管理和日常维护中积极参与,共同促进高校网站在搜索引擎中获得较好的排名。
3.优化需要时间
SEO是一个过程,不是一个结果,不可能一蹴而就。它需要搜索引擎访问网站,等待其他网站所有者响应链接请求,并且还需要网站的其他成员完成所需要的HTML编辑,这都需要花费一定的时间。
总之,高校网站在建设和日常管理时,必须要考虑自身搜索引擎优化问题,只有面向用户,建设良构的网站集群,才能让学校的网站真正发挥宣传的作用,实现资源共享的目标。
参考文献:
[1]孙颖,赵燕.智能搜索引擎及其实现技术问题初探[J].海南师范大学学报(自然科学版),2008,21(4):498-499.
[2]王毅,江小玲.基于PageRank算法的引擎搜索优化策略研究[J].科技资讯,2008(11):148-151.
[3](美)Jeffrey Zeldman.网站重构:应用Web标准进行设计(第2版)[M].北京:电子工业出版社,2008.
[4](美)Aarron Walter.Building Findable Websites:Web standards,SEO,and Beyond[M].北京:机械工业出版社,2008.
(编辑:于黎明)