代码之家  ›  专栏  ›  技术社区  ›  Llama.new

PRAW:将Comment和Submission对象序列化为JSON

  •  1
  • Llama.new  · 技术社区  · 10 年前

    我目前正在开发一个reddit爬虫,使用praw进行数据挖掘。我想抓取subreddit中的评论和提交,然后将它们保存在数据库或文件中,最好以json格式保存,以备以后使用。 我很难在python中将注释和提交对象序列化为JSON对象。是否有现有的方法或方法来做到这一点? 注意:我对python也很陌生。

    提前感谢您的帮助!

    1 回复  |  直到 10 年前
        1
  •  2
  •   numeral    7 年前

    更新---------

    看来这已经不可能了,安托万

    https://github.com/praw-dev/praw/issues/701

    我不确定是否有方法序列化您需要的内容,但您可以使用以下方式保存提交ID:

    some_id = sub.id
    

    然后用

    r.get_submission(submission_id=some_id)
    

    编辑-----------------------------------------

    所以做了一些研究发现: https://github.com/praw-dev/praw/issues/271

    因此本质上,您可以通过以下方式打开存储json:

    r.config.store_json_result = True
    

    然后,您可以使用注释或提交的json_dict成员访问json数据。