实战利用sklearn的MeanShi

2022/7/11 来源:不详

大家好,我是机器侠~

使用sklearn提供的MeanShift的API对鸢尾花数据集的数据进行预测,并尝试将预测的结果进行分析。

0.分析鸢尾花数据集

在Sklearn机器学习包中,集成了各种各样的数据集,包括前面的糖尿病数据集,这里引入的是鸢尾花卉(Iris)数据集,它是很常用的一个数据集。鸢尾花有三个亚属,分别是山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

该数据集一共包含4个特征变量,个类别变量。共有50个样本,iris是鸢尾植物,这里存储了其萼片和花瓣的长宽,共4个属性,鸢尾植物分三类。如表所示:

.导入库

fromsklearn.clusterimportMeanShiftfromsklearnimportdatasetsimportmatplotlib.pyplotasplt

2.加载数据

#加载数据集lris_df=datasets.load_iris()

3.选择维度

#挑选出前两个维度作为x轴和y轴,你也可以选择其他维度x_axis=lris_df.data[:,0]y_axis=lris_df.data[:,2]4.构建模型和训练模型

#构建模型和训练模型model=MeanShift()model.fit(lris_df.data)

5.预测

#预测数据predicted=model.fit_predict(lris_df.data)#查看预测结果(类别:0和)print(predicted)

6.可视化

#打印出来对数据的聚类散点图plt.scatter(x_axis,y_axis,c=predicted)

-EOF-

推荐阅读点击标题可跳转

、0种聚类算法,附Python代码演示

2、《机器学习》之MeanShift原理及代码

3、机器学习建模中的Bagging思想

4、实战:利用岭回归和Lasso回归对糖尿病数据集进行预测(附源码)

5、《机器学习》之岭回归和Lasso回归

觉得本文对你有帮助?请分享给更多人

点赞和在看就是最大的支持??

预览时标签不可点收录于合集#个上一篇下一篇
转载请注明:
http://www.3g-city.net/gjyyf/740.html
  • 上一篇文章:

  • 下一篇文章:
    • 没有热点文章
    • 没有推荐文章
    网站首页 版权信息 发布优势 合作伙伴 隐私保护 服务条款 网站地图 网站简介

    温馨提示:本站信息不能作为诊断和医疗依据
    版权所有2014-2024 冀ICP备19027023号-6
    今天是: