代码之家  ›  专栏  ›  技术社区  ›  Harsha Hulageri

Apache Mahout的数据集

  •  4
  • Harsha Hulageri  · 技术社区  · 14 年前

    我正在寻找可用于实现ApacheMahout推荐系统用例的数据集。我只知道 MovieLens Data Sets GroupLens Research 组。

    有人知道其他可以用于推荐系统实现的数据集吗?我对基于项目的数据集特别感兴趣,尽管其他数据集最受欢迎。

    3 回复  |  直到 10 年前
        1
  •  4
  •   ssc    14 年前

    我是马约的塞巴斯蒂安。

    捷克约会网站提供的数据集可能会让您感兴趣: http://www.occamslab.com/petricek/data/

    btw术语基于项是指一种特殊的协作过滤方法,而不是数据集本身,这通常是大多数协作过滤方法所使用的用户项评级三元组的常见形式。

    我们很乐意从用户邮件列表中的user@mahout.apache.org了解您的实验结果和体验(如果您想分享它们的话)。

        2
  •  3
  •   Harsha Hulageri    14 年前

    在搜索数据集时,我发现很少有网站列出可用于数据挖掘的公共可用数据集。其中一些也可以用来打麻将。

    Bixo Labs

    UCI Datasets

    KDnuggets

        3
  •  0
  •   user2120239    10 年前

    您可以查看IPinYouRTB投标数据集 Quora: http://qr.ae/OrqgM http://contest.ipinyou.com/data-release.html