当我在Scikit Learn中创建一个MultiLabelBinarizer时,标签可以从 mlb.classes_
mlb.classes_
解决方案1:当我创建dataframe时,我在每个mlb.classes值前面加上原始列名。例如, pd.DataFrame(mlb.transform(df[cname]), columns=[cname + '_' + s for s in mlb.classes_]) . 它在我正在使用的数据帧中起到了作用,但我很担心,因为原来的mlb.classes值保持不变。
pd.DataFrame(mlb.transform(df[cname]), columns=[cname + '_' + s for s in mlb.classes_])
解决方案2:我将多个LabelBinarizers组合起来。这在我看来很糟糕,因为它们通常不包含相同的值,而且它们的值可能是相同的,特别是对于更一般或泛型的值。