![]() |
1
0
统计/机器学习中处理分类特征的主要方法是通过一种称为 one-hot encoding . 以以下数据为例:
假设你想根据给定病例的动物类型(观察/行/受试者等)预测结果(无论是什么)。这样做的方法是编码
在那里,基数的动物列
k
已编码到
k
新列指示给定值的特定类别/属性的存在或不存在
从那里,你可以使用任何你想根据(现在不同编码的)动物列预测结果的模型。但一定要将一只动物(一组)作为对照组从模型中剔除。在这种情况下,可以拟合逻辑回归模型
|
![]() |
abu · 更新到3.18后,估计h2o中的xgboost时出错 6 年前 |
![]() |
Martin Thoma · 如何为tox安装xgboost? 7 年前 |
![]() |
Greg · 在EC2上安装XGBoost 7 年前 |
![]() |
user3115933 · 何时将分类变量转换为数字变量进行机器学习? 7 年前 |
![]() |
Jarad · 确定为什么特征在决策树模型中很重要 7 年前 |
![]() |
Doug Fir · 数据帧中的XGB稀疏矩阵 7 年前 |
![]() |
andrew · 扩展xgboost。XGB分类器 7 年前 |