畅想小说网

第三节 识别毒蘑菇(第1页)

天才一秒记住【畅想小说网】地址:http://www.cxtra.net

第三节识别毒蘑菇

banner"

>

Python的scikit-learn(简称sklearn)模块可以非常好地支持决策树分类,尽管它使用的是更加复杂的决策树算法,但依然是在上一节讲述的原理基础上的优化算法。

本节将使用scikit-learn的决策树分类来识别“蘑菇数据”

中的毒蘑菇。

首先介绍本案例使用的数据。

原始数据来源于加州大学欧文分校用于机器学习的数据库(UCI数据库),本书使用的是经过必要处理的数据,此数据可从教材资源平台下载。

接下来在命令行界面安装scikit-learn。

pipinstall-uscikit-learn

安装scikit-learn之前需要确保模块numpy和scipy已经安装,否则可以使用pipinstall安装。

pipinstall-unumpy

pipinstall-uscipy

进入Python之后,使用如下命令调用scikit-learn的决策树方法。

fromsklearnimporttree

模块scikit-learreeClassifier对象,它能够解决二分类问题(如蘑菇是否可食用),也可以解决多分类问题。

在使用中,对输入训练数据的维度要求如下。

输入X:样本数量×特征属性数量;

输入Y:样本类别标签,与X要一一对应。

下面先用一个简单的例子来熟悉使用方法。

对四个点X=[[0,0],[0,1],[1,0],[1,1]]使用决策树进行分类,四个点分别属于两个类别0和1,它们对应的类别标签是Y=[0,0,1,1]。

这可以通过如下简单代码实现。

In[1]:fromsklearnimporttree

X=[[0,0],[0,1],[1,0],[1,1]]

Y=[0,0,1,1]

clf=tree.DeTreeClassifier()

clf=clf.fit(X,Y)

clf命令用来构造决策树,通过clf.fit(X,Y)实现了决策树的构建,此时clf已经是能够进行分类的决策树了,可以用它来进行新数据的分类。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

慕少,你老婆又重生了陈医生,别怂!召唤圣剑我为王星河大帝造化图悠哉兽世:种种田,生生崽我有一剑我,截教大师兄,加入聊天群科普精灵:最强宝可梦教父授徒万倍返还,为师从不藏私我靠读书成圣人灵气复苏:从小奶虎进化成禁区兽皇!道途升迁:漂亮女上峰太古神王我绑架了时间线大道朝天射雕之江湖重生七零:娇妻慢慢哄,军王步步宠科技炼器师正道潜龙玄天武帝从我是特种兵开始打卡剑卒过河剑域神帝