决策树算法基本思想1)树以代表训练样本的单个结点开始
2)如果样本都在同一个类.则该结点成为树叶,并用该类标记
3)否则,算法选择最有分类能力的属性作为决策树的当前结点.4)根据当前决策结点属性取值的不同,将训练样本数据集tlI分为若干子集,每个取值形成一个分枝,有几个取值形成几个分枝
匀针对上一步得到的一个子集,重复进行先前步骤,递4'I形成每个划分样本上的决策树
一旦一个属性出现在一个结点上,就不必在该结点的任何后代考虑它
5)递归划分步骤仅当下列条件之一成立时停止:①给定结点的所有样本属于同一类
②没有剩余属性可以用来进一步划分样本.在这种情况下.使用多数表决,将给定的结点转换成树叶,并以样本中元组个数最多的类别作为类别标记,同时也可以存放该结点样本的类别分布,③如果某一分枝tc,没有满足该分支中已有分类的样本,则以样本的多数类创建一个树叶
以上内容由大学时代综合整理自互联网,实际情况请以官方资料为准。