代码之家  ›  专栏  ›  技术社区  ›  Nazim Kerimbekov Gusev Slava

用关键词进行机器学习

  •  -2
  • Nazim Kerimbekov Gusev Slava  · 技术社区  · 6 年前

    所以我对机器学习还比较陌生,对关键词有一些问题。现在,我正在尝试使用我以前收集的一些电影数据来建立一个机器学习模型(这些数据由4个属性组成,其中一个属性是描述电影的关键字)。尽管如此,有些电影比其他电影有更多的关键字,例如(例如:蜘蛛侠的关键字将是超级英雄、蜘蛛、战斗等等),每部电影有50到400个关键字,因此我想问你,我是应该将每个关键字作为一个单独的属性,还是应该将它们全部添加到关键字,并用逗号分隔它们。

    为了更好地说明我的观点,这里有两个例子:

    将电影关键字包含为sperate attributes

    将电影关键字包含为一个属性

    非常感谢您的帮助精心收集(数据由4个属性组成,一个描述电影的关键词)。尽管如此,有些电影比其他电影有更多的关键字,例如(例如:蜘蛛侠的关键字将是超级英雄、蜘蛛、战斗等等),每部电影有50到400个关键字,因此我想问你,我是应该将每个关键字作为一个单独的属性,还是应该将它们全部添加到关键字并用逗号分隔。

    为了更好地说明我的观点,这里有两个例子:

    包括电影关键字作为sperate属性 Table with movie Keyword as seperate attribute

    包括电影关键字作为一个属性

    Table with movie Keyword as one attribute

    非常感谢你的帮助

    2 回复  |  直到 6 年前
        1
  •  1
  •   SND Vic_Tor    6 年前

    •            |   Keyword1     Keyword2
       ------------------------------------
       Movie A   |  Superhero     Fight
       Movie B   |  Fight         Superhero
      

              |   Superhero     Fight     StackOverflow    ...
    ------------------------------------------------------------
    Movie A   |      1            1            0           ...
    Movie B   |      1            1            1           ...
    

        2
  •  0
  •   Pulkit Verma    6 年前