![]() |
1
10
正如在线评论所说,这是一个简单的“基线趋势算法”, 这基本上意味着在比较两个不同页面的趋势之前,必须确定 基线。在许多情况下,使用平均值,如果 根据时间轴绘制页面视图。这种方法在监测中得到了广泛的应用 检测水质、空气污染物等是否有显著变化。 在op的情况下,页面视图的斜率由totalpageviews的日志加权。 这个sorta使用totalpageviews作为斜率的基线校正。正如西蒙所说,这是一种平衡 两个页面之间的总页面视图非常不同。 对于exmaple,a的总页面浏览量为500/1000000,b的总页面浏览量为1000/1000。 一个日志基本上意味着1000000只比1000重要两倍(而不是1000倍)。 如果你只考虑坡度,A不如B受欢迎。 但就权重而言,现在衡量A的受欢迎程度和B是一样的。我认为这是很直观的: 虽然A的页面浏览量只有500次,但那是因为它已经饱和了,你还是要给它足够的信任。 至于错误,我相信是来自(相对的) standard error ,其系数为1/sqrt(n),其中 n是数据点的数目。在代码中,错误等于(1/sqrt(n))*(1/sqrt(mean))。 它大致可以转化为:数据点越多,趋势就越准确。我看不见 这是一个精确的数学公式,只是一个野蛮的趋势分析算法,不管怎么说 在这种情况下,价值更为重要。 总之,我相信这只是一个经验公式。在一些生物统计学教科书中可以找到更高级的主题(非常类似于监测流感爆发等)。 |
![]() |
2
1
代码实现了统计(在本例中是“基线趋势”),您应该了解这一点,一切都会变得更清楚。维基有一个很好的 instroduction . 该算法考虑到新页面在定义上比现有页面更不受欢迎(例如,因为它们是从相对较少的其他地方链接的),并建议随着时间的推移,这些新页面将越来越受欢迎。
|
![]() |
3
1
按点击量调整度量的原因不是惩罚流行页面,而是确保您可以将大小变化与单个度量进行比较。如果您只使用y2-y1,您将只能在大容量页面上看到单击更改。这正试图表达的是“重大”变化。如果你吸引了100次点击,那么1000次点击的变化是非常显著的。1000点击改变如果你吸引100000是较少的。这个公式所要做的是使这两个都可见。 在excel中以不同的比例尝试一下,你会对它的操作有一个很好的了解。 希望能有所帮助。 |
![]() |
4
1
另一种看法是: 假设你的页面和我的页面是在同一天创建的,你的页面的总浏览量约为1000万,而我的页面的总浏览量约为100万。那么假设某个点的斜率对我来说是100万,对你来说是50万。如果你只使用slope,那么我赢了,但是你的页面在那一点上已经有了更多的浏览量,urs有500万,而我的页面有100万,所以我的页面上有100万仍然是200万,那一天urs是550万。所以这个缩放的概念可能是试图调整结果显示UR页面作为趋势设定器也是好的,并且它的斜率比较小,但是它已经比较流行了,但是缩放只是一个日志因素,所以对我来说似乎没有太大的问题。 |
![]() |
danial · 如何在多个字符串的每个位置找到最频繁的字符 2 年前 |
![]() |
Manny · 如何比较Perl中的字符串? 2 年前 |
![]() |
Diret · 获取范围内每个数字的子倍数的算法 2 年前 |
![]() |
Saif · 排序时python如何决定何时调用比较器? 2 年前 |