Web数据挖掘在电子商务中的应用
郭鹏
摘要:Web页面结构复杂但所含信息极为丰富,将Web数据挖掘技术应用到电子商务平台中,能够挖掘大量的知识,提供决策参考。本文论述了Web数据挖掘的概念、特点和分类,并阐述了Web数据挖掘在电子商务的应用。
关键词:电子商务;数据挖掘;Web数据挖掘
Internet在世界范围内普及的同时,人们在互联网上各个方面的需求也越来越大,基于Web的商业交易成为电子商务迅猛发展的重要因素,海量的Web页面也蕴含了大量反映用户需求的知识,而Web数据挖掘也将大有用武之地。
1 Web数据挖掘
1.1 Web数据挖掘概述
数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、以前未知并具有潜在可用知识的过程。Web页面复杂,数据量巨大、无结构、动态的、样式繁多,大多数传统数据挖掘方法已不太适用,因此一种新的技术应运而生——Web数据挖掘。
1.2 Web数据挖掘特点
Web挖掘技术使用方便、信息量大、内容丰富、应用分布范围广,其最大的特点就是适用半结构化的Web文档。而传统的数据库中数据是完全结构化的数据。但相比单个数据库的数据挖掘,Web数据挖掘会面临很多具体问题。主要有:
(1)与传统的数据挖掘和数据仓库来比,Web数据量巨大,增长速度快,诸多企业和团体一并把自己大量的可访问的信息放在互联网上,这样很难构造一个数据库来复制、存储或集成Web上的所有数据。
(2)与传统文本文档相比,Web页面相对复杂。其主要原因在于Web页面呈现半结构化数据,数据不规则或不完整,数据结构隐含,模式变化快,模式信息量大。
(3)Web页面无时无刻不在变化、增长与更新,是动态性极强的信息源。它没有固定模式,仅用传统关键字检索方式来实现Web页面上那些几乎都是隐藏的、潜在的未知知识的发现是很难实现的。
(4)由于Web数据所包含的客户信息具有多样性特点,所以用户访问的内容和使用目的千奇百怪。
(5)尽管Web页面信息储量大,内容广,但利用率一直很低,“数据丰富而知识贫乏”的问题非常严重。
2 Web数据挖掘的分类
2.1 Web内容挖掘
Web内容挖掘指的是对Web文档内容或其描述的数据进行挖掘,一般以文本内容的挖掘居多。Web文档主要包括HTML、XML等结构性标记语言,是Internet环境中跨平台的、依赖内容的技术。Web内容挖掘常用的方法有Web OQL和Ahoy以及基于软件Agent的分类器方法。
2.2 Web使用挖掘
Web使用挖掘主要通过分析服务器端用户访问记录抽取用户的兴趣和习惯。Web服务器都保留了用户访问日志,记录了每位登录用户的访问和交互信息,分析这些信息可用于对用户行为进行预测,从而改进Web站点结构,以便提供个性化的产品信息和服务。
3 Web数据挖掘在电子商务中的应用
Web数据挖掘技术在电子商务中的应用将极大地提高电商企业的竞争能力,数以亿计的Web页面及其链接和服务器日志中蕴藏着有意义的用户访问模式和相关的潜在用户群知识,充分运作挖掘到的这些知识,从中提取商业决策支持的关键性数据,改进Web站点设计,能够更好地开展电子商务活动。
3.1 优化电子商务平台网站
通过挖掘用户的Web日志文件,一是找出用户访问最频繁的路径,设计网站的结构和网页的链接,有助于节约客户的访问时间;二是发现用户的期望位置,如果在期望位置的访问频率高于对实际位置的访问频率,可考虑为该用户提供个性化的导航链接。网站网页的导航设置直接影响网站的访问效率。按照大多数访问者的浏览模式对网站进行组织,不仅减轻了服务器的负担,而且还给用户留下好的访问体验。
3.2 挖掘潜在客户,提供个性化服务
通过分析和探究Web日志,可以发现购买某种商品的消费者的性别、年龄、学历、收入状况、爱好和职业等信息,充分地了解客户的需求,提供个性化的产品或服务。电子商务平台运营商将最大限度地利用客户资源,开展客户行为的分析与预测,寻找潜在的有价值的客户,开展个性化服务,提高客户的满意度和忠诚度。
3.3 交叉销售
交叉销售广泛应用于电子商务零售领域。电子商务运营商可以获取较详细的老客户信息,对于Web数据挖掘的准确性来说是有很大帮助的。通过客户的历史购买记录推测该客户将来下一个购买行为,实现交叉销售。
4 结论
本文通过对Web数据挖掘的概念、分类和特点进行了论述,并对Web数据挖掘在电子商务方面的应用进行了探讨,在电子商务中运用Web数据挖掘有发现潜在客户、提供理性化服务、改进站点设计、提高系统效率等优点。