代码之家 › 专栏 › 技术社区 › Cashew

如何让SK-Learn分类器接受2D数组作为预测的输入?

google-cloud-ml scikit-learn machine-learning python

Cashew · 技术社区 · 6 年前

因此,我创建了一个混合数据类型的模型,并使用SK Learn文档中推荐的示例,使用列转换器构建classifier。

https://scikit-learn.org/stable/auto_examples/compose/plot_column_transformer_mixed_types.html#sphx-glr-auto-examples-compose-plot-column-transformer-mixed-types-py

由于输入来自csv,并被转换为Pandas数据帧,所以看起来X\u test、X\u train、y\u test、y\u train也都是数据帧。通过YU测试clf.预测()函数运行良好,我收到预测。

1 回复 | 直到 6 年前

ktang 6 年前

为了使您的分类器与Google云机器学习引擎(CMLE)兼容,您需要从管道中分离出预处理器和LogisticRegression分类器。您将需要在客户端执行预处理逻辑,独立分类器将托管在CMLE上。

...

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

preprocessor = ColumnTransformer(
    transformers=[
        ('num', numeric_transformer, numeric_features),
        ('cat', categorical_transformer, categorical_features)])
model = LogisticRegression(solver='lbfgs')

X_train_transformed = preprocessor.fit_transform(X_train)
model.fit(X_train_transformed, y_train)
print("model score: %.3f" % model.score(preprocessor.transform(X_test), y_test))

您可以导出模型(使用pickle或joblib)并将其部署到CMLE上。在构造对CMLE的json请求以进行预测时,首先需要使用以下命令将数据帧预处理为二维数组: preprocessor.transform(X_test) .

推荐文章

Bushra Jabeen · 计算列中的互信息

2 年前

rkraaijveld · sklearn的Coef。线性回归为无

2 年前

Sherwin R · 随机森林预测错误的输出形状

2 年前

Trinh Hieu · 我想在100%中随机训练60%,剩下的40%在混乱矩阵中测试

3 年前

Gijo george · 如何识别段落中每个句子的情绪

3 年前

Test · 安装Scikit Learn Big Sur M1

3 年前

kukelia · 在自定义转换器内创建新数据帧时,SKlearn管道无法工作

3 年前

Arnoldas Maslovskis · 当需要1d数组时,传递了列向量y。请将y的形状更改为(n_samples),例如使用ravel()

3 年前

Rich · 我可以简化零系数的Lasso Lars运行时吗?

3 年前

Medo · 是否可以将3D图像转换为一个矢量?

6 年前