决策树

决策树

ID3、C4.5、CART的区别

ID3

  • ID3是分类树
  • ID3使用信息增益选择分裂的属性
  • ID3不剪枝
  • ID3处理连续型随机变量是构造区间,数据变成离散化的方式。

C4.5

  • C4.5是分类树
  • C4.5使用信息增益作为分裂的标准
  • C4.5剪枝
  • C4.5处理连续型随机变量是构造区间,数据变成离散化的方式。

CART

  • CART可以是分类树,也可以是回归树。
  • CART分类使用GINI值作为分裂的标准。回归采用最小方差作为标准。
  • CART是一颗二叉树。
  • CART剪枝。