李梅 张志军
摘要:在ID3算法中,主要是计算出各个属性的信息增益,比较信息增益的大小,选择最大取值的属性作为分裂节点,从而生成决策树,但是在计算时,需要多次调运log函数,计算量特别大,对决策树的生成有一定的影响。本文主要利用幂级展开式对log函数进行改进,以此来提高计算速度。 关键词:信息熵;log函数;改进 中图分类号:TP3 文献标识码:A 文章编号:1009-3044(2018)29-0020-01 1 ID3算法理论简介 参考文献: [1]赵薇, 苏建民. 基于ID3算法决策树的研究与改进[J]. 科技信息, 2008(23):383-392. [2]袁琴琴. 基于决策树算法的改进与应用[D]. 长安大学, 2006. [3]苏锦. 基于决策树方法的学生成绩分析应用[J]. 信息通信, 2017,169(01):52-53. [4]刘红岩, 陈剑, 陈国青. 数据挖掘中的数据分类算法综述[J]. 清华大学学报(自然科学版), 2002,6(42):727-730. [5]段玉春, 朱晓艳, 孙玉强. 一种改进的ID3算法[J]. 南陽师范学院学报(社会科学版), 2006,(09):63-65. 【通联编辑:梁书】 |