Google Analytics(谷歌分析) 架构与原理

目录 后端架构

Google Analytics(Google分析)是Google的一款免费的网站分析服务,Google Analytics最早是由一些工程师设计的,后来被Google收购,现在被广受好评。对于Google Analytics的用户目前在国内的用户已经数以万计,本站 www.javabloger.com也使用Google Analytics工具对网站的访问趋势进行分析。Google Analytics功能非常强大,只要在网站的页面上加入一段代码,就可以提供的丰富详尽的图表式报告。

Google Analytics的采集功能是采用AJAX技术来实现,还可以对google共享你的分析数据,并且还可以设置系统提醒功能。
整体架构如图所示:

google-analytics-architecture

使用Google Analytics我们知道首先需要在你的网站中加入根据代码,下面我们来看看嵌入在网站中跟踪代码如何工作的
谷歌分析跟踪代码(Google Analytics Tracking Code GATC) 检索的网页数据如下:
1 浏览器请求的网页包含跟踪代码。
2 GATC创建并初始化一个对象的属性与网络相关的跟踪ID在代码中。
3 GATC执行你自定义任何跟踪方法。
4 跟踪代码初始化和管理以下信息:
*跟踪检索查看是否包括广告系列。
*收集从HTTP请求的信息到Google GATC中介 的各种用户信息。
5 将访问者HTTP请求包含GATC跟踪信息收集到参数名单。
如图所示:

gatcProcessing

以上详细过程还可以参考Google的官方资料http://www.google.com/support/googleanalytics/bin/answer.py?hl=cn&answer=55540

Google分析工具的官方帮助中心:http://www.google.com/support/googleanalytics/

H.E的口水:
1.不同的用户来源需要进行时间差计算,是不是就是因为这个所以在Google分析工具里面只给使用太平洋的时间。
2.老调重弹,Google对于大数据量存储和大规模并发访问的策略做的的确是很棒。再次引发了我对Google架构的探索,在此插入一个技术类型的小广告(图片),如图所示google 的搜索引擎部分的架构图:

3.从Google 分析工具的报告版面上来看,GATC的数据收集的非常详细,能做到比较全面而不占用资源,对用户透明,不容易。

当你使用Google Analytics分析时需要你创建 Google Analytics的用户“网站配置文件” ,创建“网站配置文件”的目的是为了方便网站多个管理员从各种对网站不同的关注角度对网站的访问进行分析,每个用户之间的分析数据也是私密性的,尽管它可能需要几分钟额外设立一个新的帐户配置文件,它通常是值得的,因为它可以帮助访问安全性和数据完整性,确保能给你更准确和有用的信息。如图所示:

Google架构

当你在网站内创建完成“网站配置文件” ,接下来我们再来看看 访问用户、网站管理员、GA(Google Analytics) 大致是怎么样的工作过程。
1.访问者访问网站
2.触发到 GATC 代码,根据GATC采集用户信息,放入Google Analytics 日志
3.通过你创建的过滤器对需要进行过滤的数据进行筛选。
4.将采用和过滤后的信息放入Google Analytics 的数据库中
5.管理者通过Google Analytics 的界面查看分析数据
整体工作流程如图所示:

根据你的不同过滤条件可以对网站的访问者统计的数据进行过滤,如图所示:

具体使用 Google Analysis 的过滤器方法可以去问Google自己,也可以点击这里查阅 http://www.google.cn/search?hl=zh-CN&newwindow=1&q=Google+Analytics+%E8%BF%87%E6%BB%A4&aq=f&aqi=&aql=&oq=

暂无评论

发表评论

电子邮件地址不会被公开。 必填项已用*标注