代码之家  ›  专栏  ›  技术社区  ›  Coolio2654

熊猫:如何从两个数据帧的并集中获取虚拟变量列?

  •  0
  • Coolio2654  · 技术社区  · 6 年前

    这就是我的意思。

    Frame 1 | categorical_1 | categorical_2 |||  Frame 2 | categorical_1 | categorical_2
    row 1   | blue          | flakes        |||  row 1   | blue          | flakes
    row 2   | red           | cheerios      |||  row 2   | red           | flakes
    row 3   | blue          | cheerios      |||  row 3   | green         | flakes
    

    正如您在上面的基本插图中所看到的,绿色仅出现在第二个数据帧中,而cheerios仅出现在第一个数据帧中。

    pd.get_dummies 他们中的任何一个。

    1 回复  |  直到 6 年前
        1
  •  0
  •   adafdwwf    6 年前

    pd.get_dummies 只能在一个数据帧中创建假人。

    您的数据帧中是否有索引或其他ID?

    categorical_2 警察局,去拿傻瓜 最后根据不同的索引或ID将其与原始数据帧进行匹配。