代码之家  ›  专栏  ›  技术社区  ›  Zack Peterson

谷歌分析准确吗?

  •  7
  • Zack Peterson  · 技术社区  · 15 年前

    我的记录显示,在7月2日至11月15日期间,我的网站有一个特定的页面被访问了609次。

    在此期间,Google Analytics只报告238个页面浏览量。

    我无法解释这种差异。

    为了让Google Analytics跟踪页面视图事件,客户端浏览器必须启用javascript,并且能够访问Google的服务器。我怀疑60%的访问者或者禁用了javascript,或者通过防火墙连接到谷歌的跟踪服务器。

    你有什么解释吗?

    更多信息

    我的应用程序只是将一条记录放入数据库中,因为它服务于一个页面。

    它不做任何事情来区分机器人浏览器和人类。

    10 回复  |  直到 13 年前
        1
  •  11
  •   Justin Grant    15 年前

    这种差异几乎可以肯定是爬虫造成的。爬虫流量是用户流量的10倍,这并非闻所未闻。

    这就是说,有一个非常简单的方法来验证正在发生的事情:添加一个ASPX页面,它向您站点的每个页面发送一个不可缓存的1x1像素清晰的GIF图像(又称“web bug”),并在您站点的每个页面(如页眉或页脚)中包含一个引用该图像的img标记。然后分析日志中该图像的点击量,查看图像调用上的查询字符串参数(例如“referer=”),这样您就知道了页面视图的实际URL。

    因为爬虫和其他机器人不会拉图片(好吧,谷歌图片会拉,但图片大小不能在img标签中达到1x1像素!),您将获得更准确的页面视图计数。在幕后,大多数分析软件(包括Google Analytics)都使用类似的方法——除了使用javascript构建图像URL并动态地发出图像请求之外。但是如果你使用 Fiddler 要查看在使用谷歌分析的网站上发出的HTTP请求,您将看到www.google-analytics.com返回的1px gif。

    这些数字不会精确排列(例如,通过后退按钮快速取消导航的用户可能下载了一幅图像,但没有下载另一幅图像),但您应该看到大致相当的结果。如果你不这样做,那么很可能你没有在所有页面上正确设置谷歌分析。

    下面是一个演示该技术的代码示例。

    在头中(注意随机数以防止缓存):

    <img src="PageviewImage.aspx?rand=<%=new System.Random().NextDouble( )%>&referer=<%=Request.UrlReferrer==null ? "" : Server.HtmlEncode(Request.UrlReferrer.ToString()) %>"
      width="0" height="0" hspace="0" vspace="0" border="0" alt="pageview check">
    

    图像生成器pageviewimage.aspx:

    private void Page_Load(object sender, System.EventArgs e) 
    { 
        Response.ContentType="image/gif";
        string filepath = Server.MapPath ("~/images/clear.gif");
        Response.WriteFile(filepath);
    }
    

    btw,如果需要图像文件本身,请执行另存为 here .

    当然,这并不能代替谷歌这样的“真实”分析系统,但是如果你只是想交叉检查,上面的方法应该可以正常工作。

        2
  •  4
  •   Greg    15 年前

    其余的页面视图可能来自爬虫-谷歌机器人或其他?

        3
  •  2
  •   Bill the Lizard    15 年前

    你在看吗 独特的 分析和中的页面视图 全部的 日志中的页面视图?

        4
  •  1
  •   Someone New    15 年前

    可能是爬虫。我们的网站每隔几个小时就会被机器人攻击一次。

        5
  •  1
  •   Tom Studee    15 年前

    你肯定网站在所有浏览器中都正常工作吗?我曾经看到过在Firefox中无法正确呈现但在IE中工作良好的页面抛出的分析,反之亦然。

        6
  •  1
  •   mmspeed    15 年前

    也许你网页的追踪器会记录每次点击,即使它来自同一个IP地址(同一个冲浪者会两次点击网页)。

        7
  •  1
  •   powtac    15 年前

    事实并非如此,许多访问者已经转向了javascript或者安装了自定义的Google Firefox扩展。

        8
  •  1
  •   Mateo Ferreira    14 年前

    考虑到最后一条评论的时间戳,我想我会在这里留下一个更新;谷歌分析公司最近宣布,他们会让用户选择退出谷歌分析公司,这意味着如果你不想让网站所有者跟踪你的行为,你可以在谷歌分析公司衡量的网站上变得不可见。这可能会进一步抵消您的数据点。在一个SEP线程中,我建议运行两个Web分析工具(许多可以自由选择)来衡量彼此。

        9
  •  1
  •   Rafa    14 年前

    贾斯汀的回答很好。我只想添加这个作为评论,但我缺少PowerPoints:p

    在比较分析系统时,也要记住一件事,那就是总是有一些预期的差异:

    在过去8年左右的时间里,人们已经很好地建立了用javascript标记页面以收集访问数据的方法。考虑到Google Analytics、Nielsen SiteCensus或Yahoo Web Analytics的最佳实践部署,高层指标仍然具有可比性。也就是说, 可以预期在彼此的10-20%之间 .[ link ]