网站首页  词典首页

请输入您要查询的论文:

 

标题 CRM网络中的空间异常数据挖掘方法研究
范文

    刘健

    

    

    

    摘要:CRM全称为客户关系管理,在教育教学中此理念也同样适用,异常空间数据挖掘技术可以在很大程度上提高CRM教育平台的管理质量,为此,该文通过对于教育平台学生信息管理和异常空间数据挖掘技术的研究,分析基于CRM理念教育平台异常空间数据挖掘技术的办法。对现有的教育教学平台建设也是一个补充。

    关键词:CRM教育平台;教育信息管理;空间异常数据挖掘

    中图分类号:TP311 文献标示码:A 文章编号:1009-3044(2017)29-0277-03

    1 概述

    当前网络环境下进行学习具有极大优越性,主要体现在其具有共享性、交互性、灵活性和开放性。但是当前网络学习平台管理和监控功能不健全,智能化程度低,如何保障教学平台信息安全,成为网络教育研究中急需解决的问题,在教育领域提高科技术的应用程度是保证教育发展的重要手段[1]。其中目前的空间异常数据挖掘技术已经成为一个当红的应用技术手段。

    CRM教育平台信息管理需要应用到空间异常数据挖掘技术,在CRM里主要管理的方面是学生信息生成反馈、学生需求、教师信息实时完善等[2]。本文简述了CRM教学平台的结构模式,并且分析空间异常数据挖掘在CRM教学领域里的应用程度和结构模式。

    2 CRM理念教育教学平台

    CRM是以信息技术为主管理平台,主要的目的是实现客户的满意度,其应用范围广泛,CRM理念在教育教学服务平台同样适用。按照CRM理念,首先,提高学生的认同感;其次为学生在这个平台上提供期望的东西,再次,实现在教学过程中信息的有效沟通;最后,通过快速有效的执行,通过对学生详细资料的深入分析,来提高学生的满意度,成为提高学校竞争力的一种手段。

    在CRM教学平台管理系统建立中,是依靠数据库储存技术得以实现的,其兼具学生信息数据分析、挖掘、教学管理等各个方面[2]。其大致组成关系图如图1所示。

    在主体分析模块的主要工作则是来分析当前教师管理、学生学习情况、信息反馈情况等。这些都是在教学平台运行过程中的主要过程,并且为CRM提供更加完善的信息,为其管理提供更加有力支持。系统通过不断完善提供更加准确和数据丰富的分析功能,并且将所得到的分解结果利用较为直观的表现方式传递给学生,常见则有报表、邮件等方式。平台的建立可以使老师与学生建立有效的关系。此外这种系统还可以进行一定程度上的预测功能,教师将考核学生的结果与学生自测结果所得到的数据进行综合分析考量,制定出更具有科学性和发展性的管理办法,显示出了系统的灵活性。

    而异常数据库管理部分则是将收集过来的异常数据和信息进行相关的处理和转化,并将处理后的异常数据登录到数据库当中通过下一步的调节和可能所需要的流程。利用异常数据库的存在可以保证收集来的数据完整性和一致性[3],并且通过分析使这些异常数据更加具备代表性。通过对以上内容的详细管理和处理办法,可以对CRM提供更加完善的数据保证和可进行分析的可能性。加强了CRM教学管理系统的整体需求和具体数据分析的要求。

    3 CRM空间异常数据挖掘结构

    3.1 系统结构

    数据库模型的设计则是加强数据库运行过程中对于来往数据的强有力处理和分类能力。保证数据可以在数据库当中得到有效的处理和转化,保证数据的完整性和还原性,使得所得到的数据更加具备代表性,为在教育教学平台的应用中可以做到正确的对异常数据的分析,提高教学质量和管理水平。具体上是通对数据库中的逻辑模型、物理模型、实际数据共同构造的,并且提高工作中设计、生成、处理、维护等方面的效率。异常数据挖掘是将一些不符合事实数据筛选出来并且寻找可以解决问题的模块支持办法。这里决定了异常数据挖掘所对应的对象不再仅仅是数据库这一个方面了,更加扩展到了文件系统等任何一个可以将异常数据整合发布的平台之上。通过对上述观点的分析,可以得出,当前的异常数据挖掘技术就是将异常信息从发现到提取并且处理分析的过程。在异常数据挖掘当中最常提到的则是数据仓库(Data Warehouse),这也是异常数据挖掘技术最为基础和支持挖掘工作的核心部分[4]。数据仓库的定义则为是一个面向了主题(subject-oriented)、集成(integrated)、時变(time-variant)、非易失(nonvolatile)的一个综合性数据集合领域。在数据仓库当中可以做到对异常信息提供理论支持以做出决策方案。

    在教育平台学生信息管理中利用的空间异常数据挖掘可以说是一个模型,具体的来说就是将异常数据挖掘和数据仓库进行自动化更新并且相结合,将收集来并且处理后的数据整合分析并且利用更加直观的报表或是文件说明的形式呈现出来[5],来表达挖掘出来的异常信息或是内容,再将这些数据提供给教师管理员使得CRM教学平台更加完善和科学性的发展。要考虑到CRM教学管理系统对数据库的独立性质要求,在数据同步采集以及传输过程中所需要用数据库方式传递和文件方式传递两种不同的数据传递方法。利用图2来进行在CRM平台结构中加入空间异常数据挖掘结构,形成一个完整的结构模型。将这些数据收集而来通过ETL工具进行数据的提取和整合,转化为一个综合了各个方面的数据体。在数据完成的基础上通过OLAM和OLAP服务器将这些数据分别形成一个数据报表,供教师管理人员进行查询和相关的分析工作。

    4 在CRM教学平台具体应用空间异常数据挖掘

    异常数据挖掘技术在CRM教学平台起到重要作用,它可以帮助教师对学生的个性特征和不同要求进行分类处理,帮助辅导员对于学生的不同一性进行设定和管理。

    4.1 CRM教学平台满足学生多样性需求

    CRM教学平台将学生身份进行验证、学习能力进行信息采集,通过平台生成信息将分级结果反馈给数据库,在此过程中,上传的错误数据,系统会进行自动筛选。同时,学生可根据自己实际学习情况将信息进行更新,在满足了学生的多样性需求的同时,也在不断更新学生的新需求[6]。

    5 适用于CRM的空间异常数据挖掘的方法研究

    通过对以上各内容的研究得出目前的空间异常数据挖掘只要是依靠空间异常数据仓库为基础在得意实现的一种技术手段[7-8]。其主要是在一个加大的空间中产生的异常数据进行生产管理,并且对得到的异常数据进行挖掘工作,提取出一些可以供教学平台处理异常的关键信息。最后使教师管理人员可以发现在这些异常数据当中所存在的關联性和未来的发展的趋势。并且伴随着其他现代化技术的不断发展应用,空间异常数据挖掘技术方法也发展出来许多种类,目前较为适用于CRM的空间异常数据挖掘方法是关联规则法[9]。

    5.1 关联规则法定义

    空间关联规则(Spatial Association Rules)是空间实体之间同时出现的内在规律,指空间实体间相邻、相连、共生和包含等空间关联规则[10],发现的异常数据采用的逻辑规则表达式为:

    用相关数值定义则为在一个空间内部设定一个对象集合,并且产生一个空间关联项,在这个关连项当中的A和B都是一个集合,以空间和非空间属性进行分别。A,B也分别为关联规则中的前后件。并且其中的关系为。而且都分别表示在这个关联项当中规则的支持程度以及可信程度。其中A与集合S的数目比(),表示为support;规则为关连项的支持度的计算方法是在集合S同时满足子集项A、B的同时其中的对象数目和集合S中的对象总体数目比(),表示为support()。而规则中的可信度在集合中的S时,满足子集A的同时也会满足子集B,并且表示为confidence(),也就是在集合S满足子集A的同时也满足子集B的概率。这条概率的表示现象为。

    5.2 空间异常数据检测算法

    首先,模拟出CRM平台异常数值,再利用包含已知观测值和异常值的全集进行统计分布函数参数进行估计,产生异常数值的方法包括均值转嫁、无补充随机替代、有补充的随机替代、时间信息转换、完全均值转换等。这些方法将异常数据与分布函数的参数估计作为两个独立的部分看待,最大期望算法将两者有效地结合起来,在处理异常数据集时对其最大集合函数应用迭代方法,在模拟异常数据样本。第一个就是在集合中找到所有支持度大于最小支持的子集项,将这些子集项定义为频集,并且在集合项目当中找到那些大于设定好的阙值项目集合。异常数据库中最小子集的代表公式为:

    当子集偏差为对数据是否异常的判断原则为检测中阙值偏差概率为:

    式中表示频集系数

    所有数据的子集、频集残差的最小值作为目标函数,其广义的目标函数为:

    其中为异常数据总个数,表示阶下异常阙值。

    第二种则是利用上面收集来的频集产生期望规则,在这些频集项当中产生可以形成关联形式的规则。这所产生的规则即为支持度和可信度都大于设定好的阙值和可信度阙值的关联规则。例如在一个频集Y当中,频集项为。

    由公式7可知,在检测时段数据库时,对此时段的异常数据进行判断,为异常数据集合项,为规则通过数据状态异常次数,此时段的检测指标为:

    通过这个公式可以看出其中的集合项当中做可能产生的规则数目只有k个,并且每一个规则的右部只有一个项目集合。当这些规则通过设定好的方式进行生成之后,通过计算筛选,只能得出那些可信度大于教师管理员设定可信值的项目规则会被留下。

    5.3 规则流程

    关联规则算法的使用流程一般性的都要通过二个基本的步骤,第一个是对相关的异常数据进行挖掘和预处理过程,根据教师与学生提出问题及不同的需求,对CRM平台数据库当中的异常数据进行相应的处理工作,并且将这些筛选和处理后的异常数据进行规格化的变化生成一个新的数据库。第二步则是对于新数据库中所有项集通过支持度的大小分类组合,形成一个大项集。在通常情况下,算法所面对的整体数据总量都是非常大的,因为要处理庞大的数据资源,进行资源算法的步骤将更为关键和主要。

    6 实验结果及分析

    为了测试本文提出的关联规则异常数据挖掘算法,实验中计算异常数据阙值项目集合与异常数据可信度关联规则阙值集合,公式6和公式8分别给出了两种异常数据挖掘算法,第2种数据集合筛选算法更加准确,因为这种算法提高了数据分类器性能和计算效率。另外,本文对于两种算法在CRM教育平台上的分布数据集及异常数据集在固定时间运行时间内筛选异常数据速度进行比较,实验结果可以看出,在规定时间内,关联规则设定下,对数据库中异常数据筛选可信度较大且运行速度较快。

    7 结论

    开放大学建设步伐正逐步加快,将理论CRM与教育系统相结合,对于教育的发展是一个突破,本文通过这方面的研究,应用空间异常数据挖掘技术,对学生与教师的需求进行分析,应用数据检测算法,得到了代表数据异常重要项目集合,最终对异常数据做出更加准确的判断,为教师管理员提供更加完善和准确的教育信息平台。

    参考文献:

    [1] 杨赣川. YangGanchuan. 基于数据挖掘的高校毕业生就业CRM系统的研究[J]. 微型电脑应用, 2015, 31(5):44-45.

    [2] 杨登. 对CRM中数据挖掘软件有效性的评价研究[J]. 现代电子技术, 2015, 38(23):114-117.

    [3] 曾志华, 李聪. 云计算环境下频繁出现异常数据挖掘方法研究[J]. 计算机仿真, 2016(3):339-342.

    [4] 徐永清. CRM在高职构建就业信息反馈体系中的应用研究[J]. 中国职业技术教育, 2015(14):56-59.

    [5] 刘旭, 许晓东, 谢可等. 教学状态数据库系统在高校本科教学工作合格评估中的应用[J]. 高等工程教育研究, 2014(4):84-88.

    [6] 戴琳琳, 谢尧. 高职院校企业级大数据案例教学平台的研究—以大数据流式计算实践教学平台为例[J]. 辽宁高职学报, 2014(11):30-32.

    [7] 穆丽文, 彭贤博, 黄岚. 异构复杂信息网络下的异常数据检测算法[J]. 计算机科学, 2015, 42(11):134-137.

    [8] 魏大千, 王波, 刘涤尘等. 高维随机矩阵描述下的量测大数据建模与异常数据检测方法[J]. 中国电机工程学报, 2015, 35(S1):59-66.

    [9] 杨登. 对CRM中数据挖掘软件有效性的评价研究[J]. 现代电子技术, 2015,38(23):114-117.

    [10] 曾志华, 李聪. 云计算环境下频繁出现异常数据挖掘方法研究[J]. 计算机仿真, 2016(3):339-342.

随便看

 

科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。

 

Copyright © 2004-2023 puapp.net All Rights Reserved
更新时间:2025/3/16 10:43:40