浅析决策树的定义

2024/5/30 来源:不详

安徽白癜风QQ交流群 http://www.guanxxg.com/news/roll/1568635.html

决策树是一种流行的工具,广泛应用于运筹学、数据挖掘和机器学习等领域。决策树的定义因领域的不同而不同。我们集中在机器学习领域中应用的决策树的形式。更具体地说,决策树可以用来解决监督机器学习子领域中的分类和回归问题。我们将详细介绍了分类问题的决策树。除非另有说明,其余部分,我们将决策树作为分类问题的一个参考。分类决策树是二叉树的一种特殊形式,用于分类。决策树中有两种类型的节点。1、叶节点:与二叉树中的相同,即没有子节点的节点。2、决策节点:非叶节点。每个叶节点都包含一个标签,该标签被分配给推理阶段属于这个叶节点的对象。对于树中的每个决策节点,它都包含一个分支规则,该分支规则可以用以下形式表示:if(condition==true){

objectgoestotheleftchildnode;

}else{

objectgoestotherightchildnode;

}

其中,条件是基于对象中某些属性的值的测试表达式。对于数值属性,条件采用小于或等于比较的形式,比如:object.attribute≤C.具体例子就是:object.height≤1.7.对于分类属性,条件表示为属于一组分类值,比如:object.attribute∈{C1,C2,C3……}.具体例子就是:object.color∈{red,green,yellow}.在每个决策节点上,根据预测器执行分支,然后将对象从上到下迭代地归属到树的节点上。

介绍一个实际的例子:我们将展示一个分类问题的决策树的例子。首先,让我们介绍一下名为Iris的数据集,它首次发表在论文“在分类学问题中的多重测量的使用”——Ronald.A.Fisher。鸢尾花数据集包括对个鸢尾花花样本的测量。每个样本都包含花瓣和萼片的长度和宽度的测量值,以及显示鸢尾花类别的“类别”属性,即setosa、versicolor和virginica。下面我们展示了鸢尾花数据集的一些样本。

利用鸢尾花数据集,我们要解决的分类问题是预测鸢尾花的类别,给定一个具有花瓣和萼片属性的样本,即对样本进行标记。因此,所期望的决策树模型可以定义为如下函数F

这个决策树接受一个包含四个实值的向量,并给出一个标签作为输出。下面是决策树的样子:

上图中,椭圆中的每个节点表示一个决策节点,方框中的每个节点表示一个叶节点。我们可以看到,树中的每个决策节点都包含一个条件,用于进一步分配通过该节点的样本。该条件的设计是为了最好地分割样本,使分配给同一子节点的所有样本比分配给相反子节点的样本更相似。我们将在下面的文章中更详细地讨论如何选择和计算条件的标准。

转载请注明:
http://www.3g-city.net/gjyzd/7165.html
  • 上一篇文章:

  • 下一篇文章:
  • 网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有2014-2024 冀ICP备19027023号-6
    今天是: