现在,我取笑自己试图预测未来,所以在写之前,我推荐阅读《Forrester预测2019:商业见解报告》。

57% 的全球数据和分析决策者仍处于洞察力驱动业务的早期阶段。 只有8% 的人表现出先进的洞察力驱动能力。

也就是说,尽管最近几年机器学习和人工智能大肆宣传,但是即使是最大的公司也难以从规模上的数据中获取价值,并推动影响深远的业务结果。

仔细思考这个观点,我想补充一下为什么很多公司处于如此低的分析状态。 以下是我的三大理由:

缺乏人才

例如,拥有能够驾驭"数据知情"文化(而不是盲目地以数据为导向)的聪明人才,以达到更高的分析成熟度。

缺乏预算

我经常惊讶地发现,即使一个公司已经投资了一个分析团队,相对于任务的规模来说,这个团队是多么的小。 通常,关键人物并不专注于分析,而是用适度的预算(如果有的话)让第三方提供专业帮助。

对数据缺乏信任

我认为这是阻碍领导层投资于上述领域的最大障碍。 也就是说,积累的数据只是"表面上看起来糟糕"。

你会在一个看起来很糟糕的东西上投入吗?

对于WEB数据分析,最后一点——对数据缺乏信任——是决策者面临的最大障碍。 因此,我的问题是一个反问句——当然,没有人愿意冒险分析质量差的数据! 这是一个普遍存在的问题。 我最近对 Google Analytics 实施的企业研究中,我发现了一种令人沮丧的数据质量状态,而企业甚至没有意识到这一点。 例如:

问题1:所有跟踪区的数据质量差

当根据一个网站的整体数据质量指数(从0到100的加权得分,其中100是可能的最佳数据质量)对其进行排名时,平均值仅为35.7。 此外,只有12% 的网站的分数在50分以上——有时候,我坚持在分析数据之前超过这个分数。

问题2 :收集个人资料

令人难以置信的是,五分之一的网站有 PII 问题,即谷歌分析中收集的个人数据。 通常这是一个错误——名字和电子邮件地址在网址和ga页面标题。 但是,in 也可以被刻意地捕获为事件操作 / 标签、自定义维度、从属关系代码或其他变量。

问题3:即使是最基本的也可能出错

有一半的网站在部署谷歌分析跟踪代码方面有问题。 也就是说,跟踪访问量和页面视图数据的基本代码。 由于 GATC 部署中的漏洞,访问计数可以完全重复或丢失,同时产生不可靠的归属结果。

问题4:访客细分不良

Segmentation 能够对数据进行任何形式的深入分析的关键要求。 然而,到目前为止,访问者细分是谷歌分析中理解和实现最少的功能,只有7% 的网站细分正确。 默认情况下,GA 有一些很好的默认分割工具。 然而,这些都是在会话(session)层面上的——他们没有告诉你关于你的用户的信息,例如是否是真实用户。

当涉及到网络分析数据时,人们对基础数据缺乏信任,以至于管理层避免了使其发生的严重风险 / 投资。 这就是为什么我认为 Forrester 报告中只有8% 的企业展示了高级洞察力驱动的竞争力。

数据噪音掩盖信息

数据噪音掩盖信息
数据噪音掩盖信息

我用"难闻的气味"这个比喻来总结一下,高级管理层在匿名信息来源时对数据质量感到不安。 也就是说,绝大多数网络分析数据并非来自客户,而是来自匿名的潜在客户。 有趣的是,高级管理人员意识到数字并不合理,与其他来源相矛盾,或者根本无法解释。 然而,对于一个组织中的任何人来说,要弄清楚这个问题到底是什么是很困难的。 在任何时候都有如此多的在线访问者,以至于数据噪音掩盖了信号。

解决方案:压力测试你的谷歌分析数据

这么多的数据点,这么多的数据点,以及网络世界给企业带来的时间压力,组织机构需要一个简单的方法来测试他们的数据质量。

然而,手工审查的问题在于它耗费时间。 例如,对于一个企业网站,我可以花20-30个小时准备! 而且它不是可以让给实习生 / 办公室初级职员的东西。 审查一个 GA 设置是一个法医过程,需要专业知识和经验。 手工审计的另一个问题是它的脆弱性——即使是专家也会犯错,尤其是当你在大海捞针的时候。 当涉及到网站分析数据时,指针看起来就像干草堆,而干草堆正在不断地增长和移动(原文此句:比喻(手工找)数据如大海般难找)。

数据(分析)如大海般难找
数据(分析)如大海般难找

因此,需要一个自动化的审计方法。

所以一开始只是一个让我的工作更容易的项目,现在已经成为一个功能齐全的企业云工具。 在评估和验证你的谷歌分析数据方面,验证数据做了所有的重大工作。 它使用混合技术来避免人工可能会出的错——结合网站爬虫发现需要跟踪的内容,并对所收集的数据进行“法医(和一些人工智能)鉴定”。 它还实时监控治理问题,例如 GDPR 遵守情况。

我对2019年的数据分析预测

这篇文章的目的是提供一个背景故事,关于我对2019年网络分析的预测... ... 过去的12个月是数据治理的一个转折点,也就是 GDPR。 现在对数据收集者的更大重视和责任将不可避免地导致公司对其数据质量进行审查。 因此,我希望下面的问题能够升级到网站分析的理论层面:“这些数据可以被验证吗?”  如果没有,去验证它的质量。

本文翻译自 Brian Clifton:Analytics Predictions 2019

原文地址:https://brianclifton.com/blog/2018/12/14/analytics-predictions-2019/

仅用于交流学习。