代码之家  ›  专栏  ›  技术社区  ›  Stephen Fuhry Bobby

社交网络和使用记录

  •  0
  • Stephen Fuhry Bobby  · 技术社区  · 14 年前

    从第1天开始,社交网络类型的网站应该记录哪些数据,以便将来进行有用的统计分析?另外,你还学到了哪些关于网站日志的技巧?根据站点的规模,出于站点性能的原因,经常登录到平面文件并定期将数据加载到数据库中是否值得?

    我在考虑服务器端的日志记录,而不仅仅是普通的google analytics/piwik类型的日志记录。为了快速找到答案,我想到了几个简单的方法:

    • ip地址
    • 用户标识信息(如果已登录)(用户标识)
    • HTTP_推荐人
    • 是ajax调用(bool)
    • 会话id(会话是否也应单独永久记录?)
    • 会议开始以来的第N次意见
    • 指示用户所处页面的某种信息(正在使用的控制器?Url路径?)
    • 时间戳
    4 回复  |  直到 14 年前
        1
  •  1
  •   GreyCat    14 年前

    首先,“通用google分析/piwik类型日志”实际上比服务器端日志处理更强大-你可以设置/获取各种cookie,你可以从客户端提取很多只有Javascript才能使用的信息,等等,等等,甚至在Javascript中获得一个简单的访客id cookie也比在服务器端容易得多——你需要设置一些web服务器模块来推送会话cookie,它将不同于WAA标准的30分钟等等。

    通常,在设计要记录的变量/字段时,您会想一想您希望使用它得到什么样的报表/聚合。例如:

    • 谁是最活跃的用户?
    • 社交网络中访问最多的站点/页面/页面类型是什么?
    • 您希望用户实现的各种目标之间的漏斗过渡是什么?
    • 它们来自何处(如果你付钱让它们来,比如使用广告,那么它们尤其有用)以及它们之后如何实现目标?
    • 谁提供了最有用的服务(最长的停留时间,看你的大部分广告,还有别的什么?)你网站的用户?
    • ...

    与流行的“什么都记录,以后再整理”的观点相反,日志不是一个被动的过程,而是一个主动的过程。你很可能最终想要向用户推送一些cookie,这些cookie会标记他们:

    • 会话ID
    • 访客ID
    • 原始来源/推荐人(即外部推荐人、搜索引擎/查询、广告等)
    • 访问次数、频率、会话持续时间
    • 目标的状态/成就
    • 等。。。

    所有这些都需要服务器(和/或Javascript集合片段)和访问者浏览器之间的交互,而不仅仅是被动日志。

        2
  •  0
  •   JP19JP19    14 年前

    记录每个请求(查询字符串等)。记录所有HTTP变量

    “HTTP-ACCEPT”、“HTTP-ACCEPT-CHARSET”、“HTTP-ACCEPT-ENCODING”、“HTTP-ACCEPT-LANGUAGE” “HTTP_连接”、“HTTP_主机”、“HTTP_REFERER”、“HTTP_USER_代理”

    (可能是每次请求)。

    从第一天开始你就对这些信息感兴趣,所以不要担心 派生的 从原始日志中。以后你想做什么就做什么。

    如果资源是一个约束(它们不应该在开头),您可以像在HTTP用户代理上进行hash等优化。

        3
  •  0
  •   Glenn    13 年前

    高流量站点的PHP程序员应该研究Scribe。Scribe最初是由Facebook开发的,现在是开源的,它是在你的应用程序中记录事件以便日后分析的好方法。有关scribe和其他提示的更多信息,请参阅 logging for analysis purposes .

        4
  •  -1
  •   troelskn    14 年前

    你可能已经知道,记录太多而不是太少。

    如果您记录了所有请求的请求行和头,那么在以后的某个时候您应该有很多信息可以挖掘。这会给你上面列出的大部分东西(或者可以从中扣除)。