实战利用sklearn的MeanShi

2022/7/11 来源：不详

大家好，我是机器侠~

使用sklearn提供的MeanShift的API对鸢尾花数据集的数据进行预测，并尝试将预测的结果进行分析。

0.分析鸢尾花数据集

在Sklearn机器学习包中，集成了各种各样的数据集，包括前面的糖尿病数据集，这里引入的是鸢尾花卉（Iris）数据集，它是很常用的一个数据集。鸢尾花有三个亚属，分别是山鸢尾（Iris-setosa）、变色鸢尾（Iris-versicolor）和维吉尼亚鸢尾（Iris-virginica）。

该数据集一共包含4个特征变量，个类别变量。共有50个样本，iris是鸢尾植物，这里存储了其萼片和花瓣的长宽，共4个属性，鸢尾植物分三类。如表所示：

.导入库

fromsklearn.clusterimportMeanShiftfromsklearnimportdatasetsimportmatplotlib.pyplotasplt

2.加载数据

#加载数据集lris_df=datasets.load_iris()

3.选择维度

#挑选出前两个维度作为x轴和y轴，你也可以选择其他维度x_axis=lris_df.data[:,0]y_axis=lris_df.data[:,2]4.构建模型和训练模型

#构建模型和训练模型model=MeanShift()model.fit(lris_df.data)

5.预测

#预测数据predicted=model.fit_predict(lris_df.data)#查看预测结果（类别：0和）print(predicted)

6.可视化

#打印出来对数据的聚类散点图plt.scatter(x_axis,y_axis,c=predicted)

-EOF-

推荐阅读点击标题可跳转

、0种聚类算法,附Python代码演示

2、《机器学习》之MeanShift原理及代码

3、机器学习建模中的Bagging思想

4、实战：利用岭回归和Lasso回归对糖尿病数据集进行预测（附源码）

5、《机器学习》之岭回归和Lasso回归

觉得本文对你有帮助？请分享给更多人

点赞和在看就是最大的支持??

预览时标签不可点收录于合集#个上一篇下一篇