[英]Social Networking and Usage Logging
从第1天起,应该在社交网络类型的网站上记录哪种数据,以便将来可以进行有用的统计分析? 另外,您还从站点日志中学到了哪些其他技巧? 根据站点的规模,是否值得经常登录到平面文件,并出于站点性能的原因而定期进行作业以将该数据加载到db中?
我在这里考虑服务器端日志记录-不仅是通用的Google Analytics(分析)/ piwik类型的日志记录。 为了快速解答,我想到了一些简单的方法:
好吧,对于初学者来说,“通用Google Analytics(分析)/ piwik类型日志记录”实际上通常比服务器端日志处理功能更强大-您可以设置/获取各种cookie,可以从客户端提取大量信息(仅Javascript等可用),等等。 。即使在Javascript中获取简单的visitor_id Cookie也要比在服务器端容易得多-您必须设置一些Web服务器模块来推送会话Cookie,这与WAA标准的30分钟等等不同,依此类推。
通常,在设计要记录的变量/字段时,您需要考虑要使用哪些报表/聚合。 例如:
与流行观点“记录所有内容,以后再整理”相反,记录不是一个被动的过程,而是一个主动的过程。 您最有可能最终想要向用户添加一些cookie,以标记他们的身份:
所有这些内容都需要服务器(和/或Javascript收集代码段)与访问者的浏览器之间进行交互,而不仅仅是被动日志记录。
记录每个请求(查询字符串等)。 记录所有HTTP变量
'HTTP_ACCEPT','HTTP_ACCEPT_CHARSET','HTTP_ACCEPT_ENCODING','HTTP_ACCEPT_LANGUAGE','HTTP_CONNECTION','HTTP_HOST','HTTP_REFERER','HTTP_USER_AGENT'
(也许与每个请求有关)。
正如你从第一天感兴趣的话,也不用担心,可以从原木中得到的信息。 您以后可以进行所需的任何处理。
如果资源是一个约束(它们不应该放在开头),则可以像HTTP_USER_AGENT等上的哈希一样进行优化。
您可能已经知道,日志太多而不是太少。
如果您记录了请求行和所有请求的标题,那么以后您将获得很多信息。 例如。 这将为您提供上面列出的大部分内容(或者可以从中扣除)。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.