使用Google Analytics辨别虚假流量(下)
本文是《使用Google Analytics辨别虚假流量》的第二部分,继续分析网站中的虚假流量。在第一篇文章中我们介绍了7种辨别虚假流量的方法。分别从24小时访问量分布,访客地理位置分布,网络属性等多个维度对流量进行分析,通过对比和细分等方法辨别虚假流量。在本篇文章中,我们将对辨别虚假流量的方法进行扩充,通过对比虚假流量与真实流量间的差异,从访客行为的角度介绍4种辨别虚假流量的方法。
虚假流量与真实流量的特征
在分析虚假流量之前,先简单介绍下虚假流量和真实流量的特征,了解这两种流量的特征可以帮助我们快速的发现网站中虚假流量的影子,并且进一步将其分离。下面来看下这两种流量之间的特征和区别。
虚假流量的特征:
目的性:虚假流量的产生一定和某个特定的目的有关。
规律性:特定的目的导致虚假流量一定有特殊的规律。
真实流量特征:
自然性:真实的流量在各个维度中表现一定是自然的。
多样性:网民的喜好各不相同,行为一定也是多样的。
了解了两种流量各自的特征后,我们就可以开始对网站流量进行分析了,以自然和多样性的访问行为作为原则,找出那些有”规律”的虚假流量。
1、单页面刷新分析
单页面刷新是指为了降低跳出率,流量在进入网站的Landingpage页面上刷新的行为。这类流量单从跳出率指标上来看表现很好,但却没有完成转化和购买。此时我们还很难判断这部分流量是否是作弊流量。需要通过访问路径或点击热区图进行深度分析。然而在面对多个Landingpage的情况时即使是路径或热区图分析也都变成了一个非常大的工程。因为我们可能要逐一查看流量在上百个Landingpage中的访问情况。 对于这个问题现在我们有个很好的方法来解决,就是使用自定义指标Pageviews/Unique Pageviews。
Pageviews表示页面浏览量,而Unique Pageviews则表示每个页面获得的唯一页面浏览量,相当于每个页面获得的访问次数。在一次访问中,用户多次浏览一个页面只会造成Pageviews的增加,而Unique Pageviews是不会增加的。因此,我们将不同的页面作为维度,使用Pageviews和Unique Pageviews两个指标相除就可以看到一次访问中访问者浏览同一个页面的次数。通常来讲,访问者在一次访问中是不会多次浏览一个相同的页面的。所以,如果如果Pageviews/Unique Pageviews的值很高,那么这部分流量就值得注意了。当然,这并不是一个绝对的标准。为了确保万无一失,最好的方法是将这部分流量的Pageviews/Unique Pageviews值与这些页面在整站中的值进行对比。
2、访客忠诚度分析
访客忠诚度是对一段时间内访客回访频率进行的分析。通常来讲,当一定数量的访问者来到你的网站后,总会有一部分访问者会再次访问的。即使这部分访问者非常少。哪怕只有一两个。这就好像在一个页面中,即使有些链接放在非常隐蔽的位置,也总还是会有人点击的,即使比例非常的少。记得一个真实的教训,我们为客户分析一个wap网站时,发现页面中的一个链接点击量是0。当时想当然的认为这个链接因为提供在线电影,流量和费用都很高,所以没人点击也是正常的。但实际情况却和我们想象的完全不一样。
因此,在分析一个渠道的流量时,适当的拉大时间维度来分析访客回访也是辨别虚假流量的一种方法。真实的访客中会有再次回访的行为产生,而虚假流量在合作结束后是不会进行这些收尾工作的。所以那些在合作期结束后齐刷刷没有回访的流量多半是异常的。
3、访客重合度分析
访客重合度是指一段时间里排重后的访问者与排重前访问者的比率。举个例子来说明一下,假设我每天找10个人点击你的广告,连续点击10天。这时,Google Analytics中每天都会记录到有10个绝对唯一身份访问者。十天加在一起就是100个。但当我们把时间维度拉大到10天再来看时,就只有10个绝对唯一身份访问者。这是因为Google Analytics对访客进行了排重处理,所以10天的数据中每个访问者都是唯一的。按照这个逻辑我们可以计算出不同渠道中访问者的重合度。具体计算公式是:1-排重访客/未排重访客*100%。对于上面例子中的情况,访客重合度等于1-10/100*100%=90%
(点击查看大图)
对于不同的流量渠道,我们也可以使用访客重合度指标来辨别虚假流量。当某个渠道的流量在短时间内有较高的访客重合度时,我们就需要进一步检查这个渠道的流量质量了。
4、页面访问长尾分析
页面访问长尾分析是指访问者的页面浏览广泛程度。按照真实流量的特征,每个访问者的特点,兴趣和习惯都是唯一的。他们会按照各自的目标通过各种方法浏览网站内容。访问者的这些自然和多样的特点可以通过网站中的热门内容和退出页面看出来。这些都是虚假流量无法模拟的。
(点击查看大图)
热门内容是在整个访问过程中最受欢迎的页面。上图是网站中热门内容的浏览量趋势图。因为每个访问者的目的都不相同,所以除了最受欢迎的页面之外,还会有很多页面也会被浏览,并且大部分页面获得的浏览量都很少,只有1-2次。这些就是页面访问的长尾,他们充分的表现了真实访客浏览网站的自然性和多样性。同样,对于退出页面也必然会存在这样的长尾,因为访问者会在不同的页面结束访问。
本篇文章的内容到这里就结束了,以上就使用Google Analytics辨别虚假流量的4种方法。你有什么问题或更好的方法吗?欢迎给我留言讨论。