查看: 806|回复: 0

[建站] 网站分析:掉进数据黑洞的新访比和平均数

[复制链接]
发表于 2011-7-26 11:32 | 显示全部楼层 |阅读模式


今天打开ga极慢,浇花倒水冲咖啡诸多动作下来,最后端坐在桌前时,报告还在加载中。等待时顺便瞄了一眼控制面板上大大的几个数值,看到%New Visits这个数值时,怔了一下,再一定睛细看,56%!什么时候网站新访问次数百分比达到这个程度了?

我之所以很惊讶,是因为这是一个99%依靠竞价的网站。对于一个竞价为主的网站,这个比值玄乎的厉害,单看这个数据就等于告诉老板说,你竞价花的钱,将近有一半都打了水漂了。为什么呢?一来广告投放没有明显减少,二来UV没有明显增加。反而来的将近有一半是回访客,你说要命不要命?

根据Brain的经验,一般做推广营销的网站,新访问次数百分比绝不能低于20%-30%,因为搜索引擎前三位是如此显眼,很容易成为回访客的便捷入口,不管你是不是为之付费!花钱买来回访客,老板听了肯定会大摇其头,竞价同事听了肯定也会抓狂不已。下一步肯定需要竞价策略的调整。

能这么报告吗? 且慢!

直觉告诉我,也许是这个数据本身出了问题。这可是一个平均值数据!所以在相信这个数据之前,最好验证一下这个数据的可信度。打开“访问者”报告,查看“新访者与回访者”比值。仍然是惯常见到的比值,80%,这就奇了怪了,从56%到80%,新访问次数百分比和网站平均数的差别怎么会有这么大呢,莫非ga也沾染了统计局的毛病?

显然这是一个异常情况,或者这就是一个我们未知的情况,发扬下福尔摩斯的精神,我们来一探究竟吧。新访比和平均数究竟差别为什么这么大?

1.是否和日期范围有关

首先需要确定日期范围。看看两个指标所选择的日期范围是不是一致。尤其是网站平均数默认的时间范围。目前坊间有两种说法,一种是默认为一月前,一种是默认为当前时间段。我觉得“当前时间段”这种说法比较靠谱。

2.是否有过滤器的干扰

如果之前设置了过滤器,排除了某一部分的流量,那么和整站比起来,过滤前的数据和过滤后的数据是不一样的。这点往往容易忽略。

3.是否选择了高级细分群体

高级细分群体影响百分比的原理和过滤器的一样,不过这个更容易发现一点。毕竟就在日期范围上方。

4.是否用了页脚的内联过滤器

这个不常用,不过搜索特定来源,也有可能产生数据差异。姑且算一个原因。

5.是否采用自定义报告

自定义报告的指标,经过过滤后,会和普通报告有细微的差异。新版的ga自定义报告直接加入了过滤器,不排除这个因素。

根据以上5点初步查看的结果如下:



令人大跌眼镜的是,即便我调出了完全纯净的,纯净的比山泉水还纯净的源数据,新访问次数百分比和网站平均值所显示的差别仍然很大。我开始怀疑自己是不是对这个数据理解有误,寻思着仔细琢磨一下新访客百分比的定义才好。

官方定义实在是简单的不能再简单:“以前从未访问过您网站的用户所占的访问次数百分比。”窃以为这样的定义,一直盯着看绝对会看傻。好在理解数据指标方面,蓝鲸的ga常用指标及解读给我们提供了一个很好的阅读范本,此处引用一下。

解读数据的几种方法:

1 、数据的含义和产生原因

2、和历史数据对比

3 、把数据带入到趋势中

4 、这是一个汇总数据吗?

5 、这是一个平均数据吗?

从1到5,让我们逐项来看:

一。新访比数据的含义和产生原因:

指标的定义

新访问次数百分比:以前从未访问过您网站的用户所占的访问次数百分比。

指标的真实含义

顾名思义这一项是新的visit占全部visit的百分比例。新的visit应该是从ip,cookies等n多数据共同验证的。

指标的计算方法

%New Visits = New Visits / Visits

可能对指标产生影响的因素

“新”的定义:是GA cookie第一次新建到user的brower的次数。也就是说,是记录在cookie里的utma中,时间是2年;定义中的细节是visits,而不是visitor。

二 、新访比和历史数据对比

依照定义,如果数据波动不大,那么同一时间段的网站平均数应该是和新访问次数百分比是一样的。

在日期中比较本月和上月的数据时,本周与上周趋势时差别其实并不大,总体在80%左右。

三 、查看新访比的趋势

在图表左上方的图表模式中,选择指标为“新访问次数百分比”并与网站平均数进行比较。可以看到基本是一条平滑的直线,和网站平均数相重合。没有高点和低点。这显然与我们之前看到的数据不符。

四、新访比——这是一个平均数据吗?是一个汇总数据吗?

新访比是一个汇总数据。分析汇总数据的前提条件是网站上所有的访问者都是完全相同的。但这明显是不可能的。同样的,新访比是平均数据,不同的流量来源访客有不同的新访问次数百分比。

解决了新访比的指标的困惑,我们再来看看网站平均数。

网站平均数的定义是什么呢?

我没有找到确切的新访问次数百分比的网站平均数定义。nigel告诉我,这个应该是上面选定的日期和这个时间段的平均值。类似于avgTimeOnPage,avgTimeOnSite之类,我感觉他的理解应该是对的。

网站平均数旁绿色(或红色)百分比的意义是什么?

网站平均数旁绿色百分比可以看成当前时段的值和平均值对比,计算出的值。

当日期区间改变为年,月,周,日时,括号中百分比也随之变化。向好的方向标记为绿色,向不好的方向标记为红色。比如访客上升的越快,绿色的比值就越多,但如果跳出率上升,则表示访客对网站兴趣不大,是一个不大好的方向,会显示为红色。

****趋势百分比的具体计算方法不详,如果你知道拜托留言告诉我。***

一路对数据的解读下来,其实我们已经从历史数据,趋势等好几个地方看出了疑点,那就是,网站平均数这个值是不可信的,有可能掉进了“数据黑洞”。

让我确定这个“数据黑洞”的存在是一个不经意的发现:

在同一个网站的6个副本配置文件都出错的情况下,独独有一个副本是显示和数据趋势相符的,基本“正常”的数据,这个副本在设置方面和其他副本没有任何差别,唯一的差别就是,它启用的是太平洋时间GMT-7时区的,而其他的是北京时间GMT+8时区。

时区上的差别如果能导致平均数总体这样大的差异,那真是黑色幽默了。所以,我终于可以确认是新访比的数据掉进“数据黑洞”了。长出一口气~错误数据害死人啊。

文章来源:yuli.in
温馨提示:
1、本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

客服QQ/微信
3555999888 周一至周日:09:00 - 22:00
十五年老品牌,学习网上创业赚钱,首先跃程网,值得信赖!
跃程网 版权所有!

本站内容均转载于互联网,并不代表跃程网立场!
拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论!

QQ|小黑屋|广告服务|加入vip|APP下载|手机版| 跃程网

GMT+8, 2024-11-19 10:20 , Processed in 0.447585 second(s), 34 queries .

快速回复 返回顶部 返回列表