代码之家  ›  专栏  ›  技术社区  ›  HW-Scientist

如何从Google Analytics获取R中的大型数据集?

  •  3
  • HW-Scientist  · 技术社区  · 6 年前

    当我使用google analytics的googleAnalyticsR获取一个小数据集(比如2000个观测值)时,一切都很好。

        df <- google_analytics(id=ga_id,
                               start="2017-12-01",
                               end="2017-12-31",
                               metrics="ga:users",
                               dimensions="ga:dimension1, ga:longitude, ga:latitude",
                               max=10000)  
    

    但当我需要获取一个包含20000个观察值的更大数据集时,相同的代码失败并返回错误:

    将数据批处理到[2]个调用中。
    请求profileId:()
    f中的错误(内容,…):维度或度量值无效:

    我如何解决这个问题?非常感谢。

    2 回复  |  直到 6 年前
        1
  •  2
  •   MarkeD    6 年前

    您需要将max设置为-1,然后它将获取所有结果。您不需要设置批次或页面大小等,它会为您这样做。

    以下是 website :

    # 1000 rows only
    thousand <- google_analytics(ga_id, 
                                 date_range = c("2017-01-01", "2017-03-01"), 
                                 metrics = "sessions", 
                                 dimensions = "date")
    
    # 2000 rows
    twothousand <- google_analytics(ga_id, 
                                 date_range = c("2017-01-01", "2017-03-01"), 
                                 metrics = "sessions", 
                                 dimensions = "date",
                                 max = 2000)  
    
    # All rows
    alldata <- google_analytics(ga_id, 
                                 date_range = c("2017-01-01", "2017-03-01"), 
                                 metrics = "sessions", 
                                 dimensions = "date",
                                 max = -1)  
    
        2
  •  1
  •   SKD    6 年前

    有一项规定可以成批运行代码。我使用“rga”库,批量下载大量数据,生成的数据框架通常包含所有观察结果。这里有一个小小的修改。如果不行,请告诉我。

    df <- ga$getData(id, batch =TRUE,
                               start="2017-01-01",
                               end="2017-12-31",
                               metrics="ga:users",
                               dimensions="ga:dimension1, ga:longitude,ga:latitude",
                               max=10000)  
    

    它来自git version 图书馆的。非常抱歉,我之前没有提到这一点。我经常使用这个,我忘了它不是CRAN版本的一部分。