代码之家 › 专栏 › 技术社区 › singrium

使用SciKit Learn获取预测元素的百分比

random-forest pickle scikit-learn python

singrium · 技术社区 · 6 年前

导入熊猫为pd 来自熊猫进口系列,数据帧从sklearn.ensegle导入RandomForestClassifier data.head()只是想让您了解一下我的csv文件的外观 X=数据[功能栏] x轴列,x轴测试,y轴列,y轴测试=轴列测试分割(x,y,测试尺寸=0.3) 分类器.装配(X轴传动系,Y轴传动系) 以open(‘myClassifier.pkl’,‘wb’)作为fid:


   




RandomForestClassifier(bootstrap=true,class_weight=none,criteria='gini',
最小杂质减少=0.0,最小杂质分离=无,
最小权重分数叶=0.0,n估计量=100,n作业=1,
热启动=假)

conf_matrix的输出:


[3073、5634、37、322、27],
【22、65、429、8245、208】,



导入熊猫为pd
进口泡菜


fid.close()关闭
打印(Y预测)

此代码的输出是一个包含预测元素名称的数组(即,['cube''cylinder''pyramid''cube'…])。









分类器参数:

RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',
            max_depth=None, max_features='auto', max_leaf_nodes=None,
            min_impurity_decrease=0.0, min_impurity_split=None,
            min_samples_leaf=1, min_samples_split=2,
            min_weight_fraction_leaf=0.0, n_estimators=100, n_jobs=1,
            oob_score=False, random_state=None, verbose=0,
            warm_start=False)




array([[6272, 2513,   26,  153,   54],
       [3073, 5634,   37,  322,   27],
       [   1,    5, 5057,  775, 3072],
       [  22,   65,  429, 8245,  208],
       [  58,   50, 1458,  509, 6935]])




0.7142888888888889




然后,我使用以下代码加载我保存的预培训模型,并用新数据对其进行测试:

import pandas as pd 
import sklearn
from pandas import Series, DataFrame
from sklearn.model_selection import train_test_split
import sklearn.metrics
import pickle


with open('saved_model/myclassifier.pkl', 'rb') as fid:
    classifier = pickle.load(fid)
fid.close()
data = pd.read_csv("testing_loaded_model/Ttest_model_30.csv")
Ypredict = classifier.predict(data) 
print(Ypredict)


['Cube' 'Cylinder' 'Pyramid' 'Cube'...]

但是,我想得到数组元素加上它们的百分比,在

提前感谢您耐心阅读整个描述。

1 回复 | 直到 6 年前

Quickbeam2k1 6 年前

希望我能正确理解你的问题:

predict_proba 功能。

predictions = classifier.predict_proba(data)

推荐文章

Tom Walker · 使用Python 3.5和Anaconda找不到模块cPickle

7 年前

muni · 将Kd树对象转储到硬盘以供重用

7 年前

Chaitanya · 在sklearn中对酸洗数据执行预测

7 年前

mifin · 如何从S3加载pickle文件以在AWS Lambda中使用?

7 年前

Gideon Kogan · 从matplotlib中Pickle图形:2

7 年前

Ausar · python类型中的标志用于什么

7 年前

Lang0n · 泡菜未保存(或加载?)对象列表变量在\uu init之外__

7 年前

Roko Mijic · 推荐的持久(pickle)定制sklearn管道的方法是什么?

7 年前

udothemath · 如何使用python pickle库(或任何有效的其他库)保存scikit学习多分类器模型[重复]

7 年前

Rene Knuvers · 在Python中使用YAML或JSON序列化RangeDict

7 年前