Python机器学习最邻近规则分类(KNN)算法实例

2017年6月18日20:00:50 1 5,554

1、数据集介绍

本次测试我们就使用Python自带的iris数据集,在决策树的时候也用过,不过我没有仔细介绍。

这个iris数据集里面有150个实例,每个实例里面有4个特征值如下:

萼片长度(sepal length)萼片宽度(sepal width)、花盘长度(petal length)、花盘宽度(petal width)

类别(label)有如下三中:

Iris setosa、Iris versicolor、Iris virginica

2、流程介绍

1、将数据集分为两类,一部分为训练集,一部分为测试集,具体比重可以自己调节。

2、使用训练集来建立KNN算法模型。

3、使用测试集来评测模型的正确率。

4、调整K值,得到最优模型。

3、使用Python的sklearn实现预测

在Python中的sklearn中是集成了KNN算发的库的,我们负责调用就可以了。

运行结果如下:

Python机器学习最邻近规则分类(KNN)算法实例

可以出这个模型预测的还是比较准确的。

4、用Python代码实现KNN算法

之前说过这个KNN的算法是比较简单的,所以我们是可以自己用代码来实现的。下面的代码是我从教程中搬过来的,感觉我已经懒到家了。。。

算法中用到的数据是从网上下载的网址如下:

https://wenku.baidu.com/view/5926e2f4f61fb7360b4c65e6.html

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

目前评论:1   其中:访客  1   博主  0

    • python培训教程 0

      刚开始学习,感觉好神奇