实战利用sklearn的MeanShi
2022/7/11 来源:不详大家好,我是机器侠~
使用sklearn提供的MeanShift的API对鸢尾花数据集的数据进行预测,并尝试将预测的结果进行分析。
0.分析鸢尾花数据集在Sklearn机器学习包中,集成了各种各样的数据集,包括前面的糖尿病数据集,这里引入的是鸢尾花卉(Iris)数据集,它是很常用的一个数据集。鸢尾花有三个亚属,分别是山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。
该数据集一共包含4个特征变量,个类别变量。共有50个样本,iris是鸢尾植物,这里存储了其萼片和花瓣的长宽,共4个属性,鸢尾植物分三类。如表所示:
.导入库fromsklearn.clusterimportMeanShiftfromsklearnimportdatasetsimportmatplotlib.pyplotasplt
2.加载数据
#加载数据集lris_df=datasets.load_iris()
3.选择维度
#挑选出前两个维度作为x轴和y轴,你也可以选择其他维度x_axis=lris_df.data[:,0]y_axis=lris_df.data[:,2]4.构建模型和训练模型
#构建模型和训练模型model=MeanShift()model.fit(lris_df.data)
5.预测
#预测数据predicted=model.fit_predict(lris_df.data)#查看预测结果(类别:0和)print(predicted)
6.可视化
#打印出来对数据的聚类散点图plt.scatter(x_axis,y_axis,c=predicted)
-EOF-
推荐阅读点击标题可跳转、0种聚类算法,附Python代码演示
2、《机器学习》之MeanShift原理及代码
3、机器学习建模中的Bagging思想
4、实战:利用岭回归和Lasso回归对糖尿病数据集进行预测(附源码)
5、《机器学习》之岭回归和Lasso回归
觉得本文对你有帮助?请分享给更多人
点赞和在看就是最大的支持??
预览时标签不可点收录于合集#个上一篇下一篇