繁体   English   中英

社交网络和使用情况记录

[英]Social Networking and Usage Logging

从第1天起,应该在社交网络类型的网站上记录哪种数据,以便将来可以进行有用的统计分析? 另外,您还从站点日志中学到了哪些其他技巧? 根据站点的规模,是否值得经常登录到平面文件,并出于站点性能的原因而定期进行作业以将该数据加载到db中?

我在这里考虑服务器端日志记录-不仅是通用的Google Analytics(分析)/ piwik类型的日志记录。 为了快速解答,我想到了一些简单的方法:

  • IP地址
  • 用户标识信息(如果已登录)(用户标识)
  • HTTP_REFERRER
  • 是ajax电话(布尔)
  • 会话ID(会话也应该单独永久记录吗?)
  • 自会议开始以来的第N个意见
  • 某种信息以指示用户所在的页面(正在使用控制器?URL路径?)
  • 时间戳记

好吧,对于初学者来说,“通用Google Analytics(分析)/ piwik类型日志记录”实际上通常比服务器端日志处理功能更强大-您可以设置/获取各种cookie,可以从客户端提取大量信息(仅Javascript等可用),等等。 。即使在Javascript中获取简单的visitor_id Cookie也要比在服务器端容易得多-您必须设置一些Web服务器模块来推送会话Cookie,这与WAA标准的30分钟等等不同,依此类推。

通常,在设计要记录的变量/字段时,您需要考虑要使用哪些报表/聚合。 例如:

  • 谁是最活跃的用户?
  • 社交网络中网站/页面/页面类型的哪些部分访问量最大?
  • 您希望用户实现的各种目标之间的渠道转换是什么?
  • 它们来自何处(如果您为它们的使用付费,即使用广告,尤其有用),然后它们如何实现目标?
  • 谁为您的网站提供了最有用的用户(逗留时间最长,查看了您大部分的广告?)?
  • ...

与流行观点“记录所有内容,以后再整理”相反,记录不是一个被动的过程,而是一个主动的过程。 您最有可能最终想要向用户添加一些cookie,以标记他们的身份:

  • 会话ID
  • 访客编号
  • 原始来源/引荐来源网址(例如,外部引荐来源网址,搜索引擎/查询,广告等)
  • 访问次数,访问频率,会议时间
  • 现状/目标的实现
  • 等等...

所有这些内容都需要服务器(和/或Javascript收集代码段)与访问者的浏览器之间进行交互,而不仅仅是被动日志记录。

记录每个请求(查询字符串等)。 记录所有HTTP变量

'HTTP_ACCEPT','HTTP_ACCEPT_CHARSET','HTTP_ACCEPT_ENCODING','HTTP_ACCEPT_LANGUAGE','HTTP_CONNECTION','HTTP_HOST','HTTP_REFERER','HTTP_USER_AGENT'

(也许与每个请求有关)。

正如你从第一天感兴趣的话,也不用担心,可以从原木中得到的信息。 您以后可以进行所需的任何处理。

如果资源是一个约束(它们不应该放在开头),则可以像HTTP_USER_AGENT等上的哈希一样进行优化。

高流量站点的PHP编码人员应调查Scribe。 Scribe最初由Facebook开发,现已开源,是在应用程序中记录事件以供日后分析的好方法。 有关抄写员和其他技巧的更多信息,请参阅有关日志记录的文章以进行分析

您可能已经知道,日志太多而不是太少。

如果您记录了请求行和所有请求的标题,那么以后您将获得很多信息。 例如。 这将为您提供上面列出的大部分内容(或者可以从中扣除)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM