1
8
使用术语“维度”和“度量”表明谷歌使用的是OLAP数据库而不是关系数据库。。。。SQL用于关系数据库:OLAP使用MDX或专有查询语言(如果是Oracle)。 http://en.wikipedia.org/wiki/OLAP
|
2
3
它可能是内部开发使用他们自己的技术,如大表和地图减少。Mapping和aggregating是Map Reduce类型算法的强项,因此数据看起来像是跨多个维度聚合在一起是有意义的。 如果你想了解更多,我建议你在维基百科上发表以下文章: |
3
3
我的猜测是,如果你问这样一个问题,你可能已经看了很多现成的报告,比如简单的页面浏览量。如果这就是你所做的一切,那么你就完全失去了网络分析的意义和力量。一般来说,Web分析(不仅仅是GA)关注数据随时间的变化趋势。而数据本身是通过遵循某些规则和行为来获取的,这些规则和行为包括预定义的和用户定义的。 报表的许多数据都不能很容易地从直接数据库查询中获取,因为这些数据是基于诸如“随时间变化的xyz”和聚合数据之类的抽象数据。例如,维度和度量的“范围”概念,其中变量和/或值将报告有关单页视图/事件的数据,或在访问(会话)过程中,甚至在用户定义的时间段内(如“将此设置为最后一个月”或“使其持续到某个事件发生为止”,“就像弹出一个特定的变量或变量类型)。 因为大多数报告都涉及到更高层次的数据检索概念,所以数据库被抽象出来,并且一个“框架”被放在适当的位置(报表界面)来帮助您构建显示趋势数据的报告。即使您是一名数据库专家,也要花费太多的时间和精力来尝试手动提取数据,以处理除页面视图之类的最基本数据之外的几乎所有内容。而这样的基础数据不太可行。 以活动跟踪为例。这一切都是从一个var=value开始的。当用户单击一个链接并转到url中具有该var=值的页面时,跟踪代码将获取该值并开始不仅对有关该页面的数据(url、时间、浏览器类型、列表等)进行属性化,而且还对从自定义编码中收集的所有其他数据进行属性化。另外,你还可以应用其他设置,比如附加每次点击的成本或某种加权度量,将成功归因于目标或事件,等等……基于其他规则(第一次点击与最后一次点击归因等等)。要发挥作用的东西和被考虑的东西的清单一直在继续。继续,尝试自己制作那些数据库查询字符串。现在,清洗,冲洗和重复,因为这只是一个活动代码。我的客户有数千个活动代码,每天都有更多的代码被添加。哦,除此之外,根据您希望实际报表如何显示数据来调整或生成全新的查询。交叉引用和xyz分解。根据这些数据来观察漏斗和场景。这只是竞选活动的一部分。 因此,长话短说,把报表接口看作是数据库的框架,可以通过预定义的查询进行调整,使人们的报告工作大大简化,尤其是因为大多数人 不是 数据库专家。 |
4
2
我想答案就在于这样一个事实:在API可用之前,你唯一可以分析数据的方法就是通过Google Analytics接口。在那里他们广泛使用“尺寸”和“公制”。因为非技术人员经常访问它,所以他们永远不会引入复杂的SQL构造;只是有下拉列表更容易。 我不完全确定googleanalytics数据的存储方式是SQL友好的(即表中的列和行)。我听说他们已经开发了自己的内部存储数据的方法。 |
5
1
我们问了自己类似的问题。看起来许多web分析api更多的是事后才想到的,通常是对应产品的UI特性的直接映射。与 Infunl (免责声明:我是联合创始人)我们正在构建具有灵活查询语言的web分析API,该语言在语法上类似于SQL,但对聚合和map-reduce执行框架进行了高度优化。此外,它还提供了许多专门为web分析设计的内置功能,如转换漏斗步骤、队列分析、支持拆分测试以及灵活的内容分组和分段。 |
wnvko · 通过节点http发布到Google Analytics 6 年前 |