代码之家  ›  专栏  ›  技术社区  ›  Mohamed Thasin ah

如何在h20中将枚举数据类型转换为numric

h2o
  •  3
  • Mohamed Thasin ah  · 技术社区  · 6 年前

    我已经把我的数据导入到H2O流中,我有一列是分类类型,我想把它转换成数值数据类型。

    如果我用熊猫做这个任务我会这样做的,

    df['category_column'] = df['category_column'].astype('category')
    df['category_column'] = df['category_column'].apply(lambda x: x.cat.codes)
    

    如何在水的流动中做到这一点,

    我试着跟着,

    1. 分析数据时,我将数据类型从枚举更改为数值,但数据显示 · 这样地。
    2. 我试过 convert to numeric 选择,但没能如愿。

    我不知道我走的方向是否正确。 请帮我解决这个问题。

    按建议更新问题:

    为什么glm强迫我使用数字列?

    误差评估单元

    我的数据集如下:

    enter image description here

    当我使用glm构建模型时, I 是我的回复栏我得到以下错误

    调用post/3/modelbuilders/glm时出错,选项为{“model_id”:“glm-e2ed0066-636c-4c71-bf8…

    错误消息:glm模型的参数非法:glm-e2ed0066-636c-4c71-bf8c-04525eb05002。细节:字段错误:响应:回归需要数字响应,得到明确的。有关更多信息,请访问: http://jira.h2o.ai/browse/TN-2

    2 回复  |  直到 6 年前
        1
  •  2
  •   Darren Cook    6 年前

    要在分类数据上运行GLM,将该家族设为“多项式”(或“二项式”,当只有两个类时)。

    enter image description here

        2
  •  3
  •   Lauren    6 年前

    如果使用的是H2O的PythonAPI,则可以使用 .asfactor() 例如 df['my_colummn'] = df['my_colummn'].asfactor()

    导入数据集后,您将在每个列名旁边看到一个数据类型下拉菜单,您可以通过选择 enum 从下拉菜单中。您还可以在查看数据时解析数据集之后执行此操作;每行中都有一个超链接,您可以单击该超链接将数据类型从数值转换为枚举。

    请参阅文档以了解更多细节: http://docs.h2o.ai/h2o/latest-stable/h2o-docs/flow.html#parsing-data