1
1
首先,“通用google分析/piwik类型日志”实际上比服务器端日志处理更强大-你可以设置/获取各种cookie,你可以从客户端提取很多只有Javascript才能使用的信息,等等,等等,甚至在Javascript中获得一个简单的访客id cookie也比在服务器端容易得多——你需要设置一些web服务器模块来推送会话cookie,它将不同于WAA标准的30分钟等等。 通常,在设计要记录的变量/字段时,您会想一想您希望使用它得到什么样的报表/聚合。例如:
与流行的“什么都记录,以后再整理”的观点相反,日志不是一个被动的过程,而是一个主动的过程。你很可能最终想要向用户推送一些cookie,这些cookie会标记他们:
所有这些都需要服务器(和/或Javascript集合片段)和访问者浏览器之间的交互,而不仅仅是被动日志。 |
2
0
记录每个请求(查询字符串等)。记录所有HTTP变量 “HTTP-ACCEPT”、“HTTP-ACCEPT-CHARSET”、“HTTP-ACCEPT-ENCODING”、“HTTP-ACCEPT-LANGUAGE” “HTTP_连接”、“HTTP_主机”、“HTTP_REFERER”、“HTTP_USER_代理” (可能是每次请求)。 从第一天开始你就对这些信息感兴趣,所以不要担心 派生的 从原始日志中。以后你想做什么就做什么。 如果资源是一个约束(它们不应该在开头),您可以像在HTTP用户代理上进行hash等优化。 |
3
0
高流量站点的PHP程序员应该研究Scribe。Scribe最初是由Facebook开发的,现在是开源的,它是在你的应用程序中记录事件以便日后分析的好方法。有关scribe和其他提示的更多信息,请参阅 logging for analysis purposes . |
4
-1
你可能已经知道,记录太多而不是太少。 如果您记录了所有请求的请求行和头,那么在以后的某个时候您应该有很多信息可以挖掘。这会给你上面列出的大部分东西(或者可以从中扣除)。 |
keramat · Twython,限制推特140个字符 7 年前 |
Chris T. · 可视化现有R应用程序/包的协作网络结构 7 年前 |
MOMEL · 使用java的视频服务器 9 年前 |
Lieutenant Dan · 如何在谷歌共享按钮中包含小图像 9 年前 |
Matt Altepeter · 社交媒体共享切断Hashtag 10 年前 |
JCKnoell · 链接不可点击。锚不起作用 11 年前 |
user1842853 · 奇异值分解-社会网络分析 11 年前 |