机器学习入门案例鸢尾花数据集分类绘制P
2022/7/11 来源:不详案例使用鸢尾花数据集进行分类预测,并绘制评价分类性能的PR曲线图
认识分类任务和数据集
Iris(鸢尾花)数据集
案例演示中使用的是有监督的机器学习算法:SVM支持向量机
建立模型的流程如下:
训练接和测试集的拆分:
使用留出法(Hold-OutMethod)
按照一定的比例将数据分为训练集和测试集
分类问题:
分类性能评价和PR图
分类性能度量—准确率
分类性能度量—精确率和召回率
精确率是分类预测结果中的正例的比例,召回率是指被分类器真正判定为正例的比率。
分类性能度量—P‐R曲线
如何绘制PR曲线?
简单的来说,要形成PR曲线,我们需要不断的设定阈值,比如说当预测分数大于0.6(阈值)时,我们认为是P正例;不断的调整阈值,得到不同的precision和recall,可以绘制出PR曲线。
分类性能度量—ROC‐AUC计算
代码实现
获取代码:回复