Google Analytics(谷歌分析) 架构与原理

目录 后端架构

Google Analytics(Google分析)是Google的一款免费的网站分析服务,Google Analytics最早是由一些工程师设计的,后来被Google收购,现在被广受好评。对于Google Analytics的用户目前在国内的用户已经数以万计,本站 www.javabloger.com也使用Google Analytics工具对网站的访问趋势进行分析。Google Analytics功能非常强大,只要在网站的页面上加入一段代码,就可以提供的丰富详尽的图表式报告。

Google Analytics的采集功能是采用AJAX技术来实现,还可以对google共享你的分析数据,并且还可以设置系统提醒功能。
整体架构如图所示:

google-analytics-architecture

使用Google Analytics我们知道首先需要在你的网站中加入根据代码,下面我们来看看嵌入在网站中跟踪代码如何工作的
谷歌分析跟踪代码(Google Analytics Tracking Code GATC) 检索的网页数据如下:
1 浏览器请求的网页包含跟踪代码。
2 GATC创建并初始化一个对象的属性与网络相关的跟踪ID在代码中。
3 GATC执行你自定义任何跟踪方法。
4 跟踪代码初始化和管理以下信息:
*跟踪检索查看是否包括广告系列。
*收集从HTTP请求的信息到Google GATC中介 的各种用户信息。
5 将访问者HTTP请求包含GATC跟踪信息收集到参数名单。
如图所示:

gatcProcessing

以上详细过程还可以参考Google的官方资料http://www.google.com/support/googleanalytics/bin/answer.py?hl=cn&answer=55540

Google分析工具的官方帮助中心:http://www.google.com/support/googleanalytics/

H.E的口水:
1.不同的用户来源需要进行时间差计算,是不是就是因为这个所以在Google分析工具里面只给使用太平洋的时间。
2.老调重弹,Google对于大数据量存储和大规模并发访问的策略做的的确是很棒。再次引发了我对Google架构的探索,在此插入一个技术类型的小广告(图片),如图所示google 的搜索引擎部分的架构图:

3.从Google 分析工具的报告版面上来看,GATC的数据收集的非常详细,能做到比较全面而不占用资源,对用户透明,不容易。

继续阅读 “Google Analytics(谷歌分析) 架构与原理”