标题 | 面向产业集群的数据挖掘推荐系统研究与设计 |
范文 | 薛中玉+李春梅+杨思维 基金项目:国家科技支撑计划课题“面向产业集群的协同创新服务平台研究与开发”(课题编号:2012BAH25F07)阶段成果之一。 作者简介:薛中玉(1981-),男,工程师,硕士,研究方向:数据挖掘、信息检索。·信息资源开发与利用· 〔摘要〕针对产业集群特点,面向数据检索要求,对数据挖掘推荐系统需求进行分析,研究数据挖掘推荐系统相关技术和算法,设计系统功能模块架构,研究分析处理流程,构建数据挖掘推荐系统,实现产业集群信息的智能化挖掘推荐服务。产业集群数据挖掘推荐系统具有用户需求信息挖掘推荐、相关服务信息挖掘、潜在协作伙伴挖掘推荐及科技成果动态感知等功能,能为用户推送更多有价值的信息,便于用户发现协作伙伴和潜在客户,促进产业集群和集群企业的协同创新发展。 〔关键词〕产业集群;协同创新服务平台;数据挖掘;推荐系统 DOI:10.3969/j.issn.1008-0821.2014.04.012 〔中图分类号〕TP31〔文献标识码〕A〔文章编号〕1008-0821(2014)04-0058-04 Research and Design of Data Mining Recommending System for the Industrial ClusterXue Zhongyu1Li Chunmei2Yang Siwei1 (1.Anhui Jingnuo Technology & Development Co.,Ltd,Bengbu 233010,China; 2.Beijing Zhongjikehai Technology & Development Co.,Ltd,Beijing 100048,China) 〔Abstract〕According to the characteristics of industry cluster and the platform of data retrieval,this paper analyzed data mining recommended system requirements,studied related recommendations technology and relative algorithm of data mining,designed system function module architecture,researched and analyzed process,constructed data mining recommending system,and realized intelligent information recommendation service of industry cluster.The system contains four main functional modules:user demand information mining and recommending,related service information mining,potential partnership mining and recommending and dynamic perception of scientific literature.This system can push more valuable information and find partners and potential customers easily for users,and promotes the innovation development of industrial clusters and enterprises. 〔Keywords〕industrial clusters;collaborative innovation service platform;data mining;recommended system 产业集群是将区域集中的特定产业、具有分工合作关系和不同规模等级的众多企业与其发展有关的各种机构组织等主体,紧密联系在一起的空间积聚体,是经济发展过程中形成的一种新形态。产业集群形成特点表现在:围绕特定产业;采购本地化;中小企业占多数;市场渗透力强;自发形成;学习效应强。在产业集群形成的过程中,为了不断提高集群自身和企业的竞争力,构建了众多的服务平台,这些平台为产业集群和企业提供信息、知识、技术成果等资源协作共享服务,加强了产业集群间协同,推进了我国产业集群信息化的快速发展。 但是,随着平台服务信息的累积,用户无法在海量数据中快速、准确地获取想要的信息。简单的信息积累和低效的数据检索缺乏生命力,不利于平台长远发展。应面向产业集群平台,建立专门的数据挖掘推荐系统,利用有效信息实现平台高效的知识管理,主动提供用户关心和有潜在价值的信息服务,加强用户间、用户与平台间的联动,从而形成良性发展趋势。 本文是“十二五”国家科技支撑计划课题“面向产业集群的协同创新服务平台研究与开发”的研究成果。针对产业集群特点和检索需求,基于数据挖掘技术,建立了面向产业集群的数据挖掘推荐系统,实现产业集群信息智能推荐功能。系统可根据用户的基本信息、需求信息、业务信息等研究用户的兴趣偏好,进行个性化挖掘,由系统发现用户的兴趣点,将用户感兴趣的信息、产品和服务等推荐给用户,为产业集群用户提供高效的平台服务,促进产业集群的发展。 1数据挖掘推荐系统需求分析 数据挖掘是从存储于数据库、数据仓库或者其他非结构化的信息仓库的大量数据中挖掘出有用知识的过程,是数据处理的高级阶段。面向产业集群的数据挖掘推荐系统根据产业集群平台不同类型用户关注点推送对其有潜在价值的信息,主要包括用户需求信息挖掘推荐、服务信息相关关系挖掘、潜在协作伙伴挖掘推荐及科技文献动态感知几方面需求。 11用户需求信息挖掘推荐 产业集群企业用户需求可为每个用户提供丰富的外部规模经济,又可形成集群内部或外部规模性、专业化的生产,对用户需求的正确把握具有重要作用。通过数据挖掘分析,基于用户发布的相关信息、用户的专业和研究方向,分析用户服务需求,挖掘平台服务库中相关信息,向用户推荐符合的需求信息。 12服务信息相关关系挖掘 产业集群与服务信息之间存在着相互促进的自增强关系,在新经济时代,产业布局不再像工业经济时代各行各业简单地聚集在一起,而是相互关联、高度专业化的产业有规律地聚集在一个区域,形成各具特色的产业集群。产业集群平台所提供的服务信息之间具有极强的关联特性,基于对每条服务信息内容的挖掘分析,寻找与之相关的服务信息,通过对服务信息的相关性分析总结,获取潜在的信息价值。 13潜在协作伙伴挖掘推荐 产业集群企业间的分工协作关系是决定集群效应和本质的主要特征,对潜在协作伙伴的发掘可带来巨大的市场效益。系统提供潜在协作伙伴推荐功能,自动将地域相近、业务相关、供应链上下游关系、通讯平台联系的用户或具有协作需求互补的用户彼此添加为潜在合作伙伴。14科技文献动态感知 产业集群不但有生产性的企业,还有大量为生产提供辅助性科技成果的服务机构,如大学、研发机构、咨询公司等紧密地联系在一起,形成利益共同体,互相促进,协同发展。整合各类科技成果服务机构信息,利用互联网信息整合技术,根据设定的主题对常用的科技成果网站进行自动监测,当网站数据库中出现与主题相关的新科技成果时,立即通知,及时了解相关主题科技成果变化情况。 2数据挖掘推荐系统模型及关键技术 21系统模型 面向产业集群的数据挖掘推荐系统基本模型如图1所示,包括3个重要组成要素:集群用户、推荐对象、推荐方法。集群用户可以向推荐系统主动提供个人偏好信息或推荐请求,系统也可主动采集用户偏好信息需求,将采集到的数据分析得到的推荐结果返回给用户。 图1面向产业集群的数据挖掘推荐系统基本模型 22系统关键技术 221基于内容的推荐技术 基于内容的推荐技术是信息过滤技术的延续和发展,它在内容信息上做出推荐,不需要依据用户评价意见,而是用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。系统建立用户偏好资料库并进行学习,了解用户兴趣方向。如通过用户发布的历史信息、最常浏览的信息、近期关注的信息等,找出用户可能感兴趣的内容,为用户推送相关信息。 222协同过滤的推荐技术 协同过滤技术采用最近邻技术,利用用户的历史喜好,计算用户之间的距离,然后利用目标用户的最近邻居用户,来预测目标用户对特定信息的喜好程度,根据这一喜好程度对目标用户进行推荐。与基于内容的推荐技术不同,协同过滤推荐技术关注的是用户之间的联系,具有相似兴趣的用户关注的信息也相类似。如产业集群内的两家汽车配件制造商,在使用平台过程中,一方的关注点也可能是另一方感兴趣的,通过协同过滤推荐技术可以起到事半功倍的效果。 以上两种推荐技术既有区别又有联系,前者利用信息资源与用户兴趣的相似性来过滤信息,后者利用用户之间兴趣的相似性来过滤信息,将二者结合起来,可以提高推荐系统的可靠性和实用性。 3数据挖掘推荐系统架构及功能 31系统架构 面向产业集群的数据挖掘推荐系统包括集群用户界面、集群用户信息库、数据挖掘分析、数据管理、内部资源库及外部数据的检索与获取等,系统架构如图2所示。 图2面向产业集群的数据挖掘推荐系统架构 32系统功能模块 321发布、获取信息 (1)发布信息 集群用户登录平台发布信息,信息可由信息名称、一级栏目、二级栏目、关键字、信息内容等组成,这样的结构有利于数据库管理与数据挖掘推荐。 (2)获取信息 用户在平台中浏览各类信息,每条信息提供相关信息,方便用户快速查看。用户浏览系统自动生成的推荐资源,包括相关信息推荐、相关集群用户推荐等。相关信息为符合用户需求的信息,用户可查看信息内容并留言;相关集群用户是与用户可能有合作价值的其他用户,用户可以采用留言或邮件沟通方式进一步了解合作意向;相关信息是系统根据用户专业领域在外部科技网站搜寻的相关科技动态、科技成果等信息。 322集群用户信息库 集群用户信息库是有关用户个性化特征的信息。如用户姓名、单位、单位地址、专业、研究方向和职业等;用户历次请求任务如分类、主题词、查询范围等;IP地址、标题、浏览时间、关键词频率等;请求时间、被请求信息URL等一系列特征信息。 323数据挖掘分析 数据挖掘分析包括用户需求分析和智能推荐。系统要为不同集群用户推荐不同对象,需要直接或间接得到用户的需求信,用户需求分析模块的流程是:通过用户主动描述,获取用户需求;嵌入智能代理Agent或BP神经网络,主动跟踪搜集用户平时感兴趣的信息,从中分析用户的偏好特点和背景知识,建立用户个性化需求模式;智能推荐是系统中信息流控制的中心,采用内容过滤技术,提取信息内容特征,过滤出与用户兴趣相关的信息,推荐给用户;采用协同过滤技术,建立用户分类和推荐机制,根据用户之间的相似性或相关性进行信息推荐。 324数据管理 数据管理模块完成对知识的数据分类、抽取和规则生成,是数据挖掘的起始端。主要功能是运用关联分析、序列模式分析、分类分析、聚类分析以及OLAP等知识发现算法,对信息源进行智能处理和管理。 325系统资源库 系统资源库包含信息资源库和查询记录信息库。信息资源是平台供所有集群用户公开使用的数据,是平台的内容主体。用户使用平台搜索功能,实现对平台数据库资源的检索,查询记录信息库主要存储系统查询信息,这些信息有可能成为用户需求的数据。 326外部信息的检索与获取 主要功能是获取与推荐集群用户所需信息,根据设定的主题,对相关网站进行自动监测,当网站数据库中出现与主题相关的新科技成果时,推荐给平台相关用户,及时获取相关领域科技信息。 33系统处理流程 数据挖掘推荐系统处理流程如图3~图6所示。 集群用户需求信息挖掘、相关服务信息挖掘、潜在协作伙伴挖掘3个功能模块主要针对内部数据库进行数据挖掘推荐,工作核心是分析集群用户在使用平台的过程中发布的需求、服务和协作等信息,从而发现平台用户之间以及用户信息之间的关联关系,完成相应的信息推送,为用户提供主动服务,避免用户在大量的数据中进行低效率查图3用户需求挖掘推荐流程图 图4相关服务信息挖掘流程图 图5潜在合作伙伴挖掘推荐流程图 找。科技文献动态感知模块架设了平台内部与外部数据源联系的桥梁,外部数据源根据平台需要而定,可根据设定的主题对常用的科技成果网站进行自动监测。当网站数据库中出现与主题相关的新科技成果时,立即通知,及时了解相关主题科技成果发展情况。图6科技文献动态感知流程图 4结束语 本文针对产业集群特点和平台数据检索要求,提出面向产业集群的数据挖掘推荐系统需求,研究面向产业集群的数据挖掘推荐系统相关技术和算法,设计系统功能模块架构,研究分析处理流程,构建数据挖掘推荐系统,实现产业集群信息的智能化挖掘推荐服务。产业集群挖掘推荐系统能为集群用户推送更多有价值的信息,便于用户发现协作伙伴和潜在客户,为平台使用者和管理者提供决策支持,加强提高用户协作的力度和效率,更大限度地发挥平台智能化信息服务作用,形成良性可持续化发展的趋势,促进产业集群和集群企业的协同创新发展,研究成果对其他服务平台和数据挖掘等相关研究可提供参考。参考文献 [1]孙仙阁.数据挖掘技术在图书情报领域的应用与影响[J].情报检索,2009,(8):85-87. [2]Thomas ARunkler.data Mining:Methoden und Algorithmen intelligenter Datenanalyse[M].Germany:Vieweg+Teubner Verlag,2009:1-3. [3]吴恒亮.Web挖掘在电子商务推荐系统中的应用研究[J].中国商贸,2010,(4):48. [4]许海玲.互联网推荐系统比较研究[J].软件学报,2009,20(2):350-362. [5]丁雪.基于数据挖掘的图书智能推荐系统研究[J].情报理论与实践,2010,33(5):107-110. [6]古丽拜天·卡米尔,贺恺,邓晓衡.个性化推荐系统中Web使用挖掘技术的研究[J].企业技术开发,2010,29(2):1-2. (本文责任编辑:孙国雷) |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。