Adobe Analytics和Webtrekk都是在线数据分析领域的巨擘,一个是美国市场第一,一个欧洲市场第一,都能提供世界一流的数字分析解决方案。我很有幸能有机会深入了解并应用这两种解决方案,同时也深感数字分析领域永远不缺概念,缺的是应用场景和价值提炼。本文将对这两种解决方案做深入剖析和对比。 一、整体解决方案能力 整体解决方案是指两种方案能完整的、与其他工具或解决方案融合提供更广泛支持的能力。两种方案都侧重于在线数据支持,除此之外还有离线数据需求。数字分析解决方案只是企业运营支持中的一部分,除此之外,如果能提供企业日常运营辅助会更有利于业务应用。整体解决方案能力包括两部分:一是整合其他数据(含内、外部数据跟踪)的能力,二是整合其他运营系统的能力 (一) Adobe Analytics Adobe Analytics是Adobe Marketing Cloud的一部分,除此之外还有Adobe Campaign、Adobe Experience Manager、Adobe Media Optimizer、Adobe Social和Adobe Target.如图: Adobe marketing cloud Adobe提供的Analytics是Adobe Marketing Cloud中的数据分析解决方案,其他都是结合广告、社会化媒体以及测试优化和推荐套件应用。从这一点来看,Adobe的整合能力非常强大,尤其是其Target是与Analytics配合最为紧密的产品,其功能A/B和多变量的单页面、和多流程测试,用户区分和定位,结合用户归档的站内推荐功能。整个Adobe Marketing Cloud涵盖了数据的产生、分析和应用三个环境,整合能力强大。 同时,Marketing Cloud支持通过多种方式进行数据整合: Adobe Insight提供了多渠道、线上和线下整合产品,并且可以通过本地化安装和应用提高企业私有云的应用能力; Adobe Genesis是第三方应用集成工具,可以进行数据集成和再营销,其中预集成了75个认证合作伙伴; Adobe Analytics本身带有Data Source和Classification Importer的数据导入,并可以通过Data Feed、DataWarehouse导出结构化点击流数据。 虽然Adobe Marketing Cloud的产品组合非常强大,但从其关键性功能以及从企业应用实际来看仍然存在一些问题: 费用问题。分析产品和服务套件做细粒度的拆分组合,对产品来讲可以进行单独开发和投入,对客户来讲却意味着每个套件都需要额外付费,而且某些套件的费用非常高。比如Recommendations的费用会比Analytics套件的价格贵一倍。 Target套件中的推荐产品(Recommendations)的算法虽然很优秀,同时后端控制界面非常很优秀,但在中国却"水土不服",这表现在: Recommendations是基于群组的推荐,而非"千人千面"; Recommendations的算法是固定封装的,我们无法优化,只能调整后台的部分参数(数据挖掘中的算法优化和参数优化都非常关键); Recommendations只能使用点击流数据,无法把企业用户和商品数据上传并应用到算法中; Recommendations推荐的数据无法无Analytics共享使用,需要额外部署,增加了技术开发的工作量。 开发服务支持不到位。没有任何一种解决方案适合全球以及所有的客户,要进行数据整合意味着需要根据不同的客户进行定制需求的开发,但Adobe Marketing Cloud的团队在的开发需求跟不上。 (二) Webtrekk Webtrekk的产品线分为Q3、Quick Insights、Live Analytics、SafeTag以及最新收购并在整合的A/B测试和优化工具Divollution(Webtrekk Q3自带A/B测试和优化功能)。对比Adobe提供的分析套件,Webtrekk同样可以实现针对广告、新媒体跟踪、不同设备以及A/B测试功能,只不过这些功能都整合在Webtrekk Q3中。Webtrekk产品间的数据整合做的相对完善,一个账号便可以无缝切换这几个产品,并且产品间的数据可以共享。 Webtrekk同样可以进行外部数据的整合,主要通过自动端口和多数据整合方式: 1. 自动端口配置。Webtrekk中有一种配置方式叫做端口,端口是一个已经开发完成的数据整合模块,该模块通过后台参数配置便可以将外部数据整合到Webtrekk中。已经完成的端口包含SEO、社会化媒体、邮件系统、电视媒体(Webtrekk的一个特色)等数据模块,除通用模块(如SEO)外,部分支持的媒体包括:: Criteo:法国最大的网络再营销广告公司。 Google AdWords:全球首屈一指的SEM工具,广告行业的同学都了解。 Facebook:世界上最大的社交网络服务网站。 eCircle:欧洲领先的邮件营销系统。 nugg.ad:欧洲最大的定向广告平台。 Optivo:国际领先的电子邮件营销服务提供商。 Audiweb:欧洲著名的市场调研工具。 以下是Google AdWords端口配置截图,只需简单配置相应参数即可: webtrekk-google-adwords 2. 多种数据整合方式。这些方式包括Excel直接导入、SOAP、JSON和RAW DATA整合。这些方式跟Adobe提供的数据整合方式基本一致,但其中的RAW DATA更为出色,Webtrekk已经把原始半结构化的数据结构化形成Raw Data,并整合到数据仓库。数据仓库的结构和完整数据开放给客户,企业如果有整合公司全部数据的需求,只需要将按照Raw Data的结构复制一份数据仓库结构,然后定时同步即可实现。 但Webtrekk在数据整合上也有自己的问题: 国内工具集成度不够。这个问题跟Adobe Analytics一样,比如国内最大的SEM系统百度凤巢,两个系统都没有提供现成的集成模块,如果要进行数据整合需要单独开发。 Webtrekk提供的基于数据营销或驱动的产品较少。作为定位于数字解决方案的提供商,Webtrekk侧重于提供数据整合分析和数据价值洞察,针对站内、外的营销功能支持力度不够。比如站内的个性化推荐功能是跟数据分析结合非常紧密的数据应用项目,同时也是非常实用的功能。在这点上Webtrekk在之前只有测试和优化功能,最近Webtrekk收购了DIVOLUTION,该工具可以同时实现Test和Targeting的功能,即同时实现测试和优化推荐功能,也许可以完善一些这方面的功能。 从实际提供整体解决方案的能力来看,两种方案各有优势:Adobe Analytics的特色是依托强大的Adobe Marketing Cloud进行数据集成和上下游的广泛应用,在线应用是其强项;Webtrekk的产品适用性更强且整合的可实现性更高,更容易形成以整合数据为基础的数字解决方案。 二、功能导向还是用户(业务应用)导向 通常我们在讨论某种工具时会更多的侧重于系统提供了哪些功能、报表、维度、指标,更多的局限于功能模块和系统本身,这其实是一种"工程师"的思维,这忽视一个重要的应用问题——用户会如何看待,如何使用并把这些功能发挥到极致?因此,当我们换个角度来思考数据价值如何才能最大化时,好的功能配合好的用户体验才是一个开始。 分析产品的应用对象,通常包括企业中不同角色的人群,比如有的角色侧重于,有的角色侧重于执行;而这些人同时又有不同的分析需求,只看结果、简单判断和深入分析都是具体需求场景。面对这种复杂的需求矩阵,这两种解决方案如何满足不同公司、不同群体的分析需求,又如何让不同角色都能快速、准确、深入的找到问题、分析问题并解决问题? (一) 以用户角色为出发点产品定位 Adobe Analytics Adobe Analytics提供了非常多的产品——SiteCatalyst、Discover、Insight等,这些产品都是根据数据功能和整合的特点进行的划分: SiteCatalyst侧重于分析需求中等的场景,各个报表通常支持一层下钻; Discover侧重于深度分析的功能,无限制的下钻以及各种维度和指标的任意组合可以实现每一个分析需求; Insight是本地版的分析套件,功能比SiteCatalyst更强大,另外支持本地的数据整合。 Adobe Analytics提供的产品覆盖了大多数应用场景,面向中度分析需求的SiteCatalyst和深度分析需求的Discover以及面向本地的Insight。但我们发现整个产品体系中缺少针对低端或无分析需求的产品,并且针对实时数据的功能略显鸡肋。 针对低端或无分析需求的产品 l 这部分人是谁?这部分人通常是公司的中高层。 l 他们有什么特点?他们只关注结果,不关注或者无法关注过程(很少有几个总监以上的人会用这样的工具),因此他们通常只看结果数据,或者通过趋势、对比简单定位数据的好坏优劣。至于"为什么"的工作,通常都是下面的数据分析师来做。 l Adobe Analytics的问题是什么?Adobe Analytics对他们来讲过于复杂,以至于我们给大领导开通权限之后他们很少去用,不得已每天还是要通过邮件发送给他们或手动汇总结果进行汇报。 针对实时数据的功能 中国的很多的公司,尤其是电子商务网站都有搞促销的传统,尤其是重大节日各种促销接踵而至,而每个商家都想在大促中尽可能多的获取用户关注,表现在业务结果上就是有更多人来网站,有更多人下单。"实时数据"需求的重要性便凸现出来,无论是业务调整还是信息发布都会更有针对性,淘宝"双十一"的滚动屏幕就是实时数据的应用典型。 这里我把Adobe Analytics提供的实时数据定义为功能,原因是Adobe的实时性数据包括两部分: 1. 实时报表。Adobe在2013年更新时新增了一个实时报表,通过这个报表可以实时查看数据。这个功能在实际应用中价值不大,原因如下: 1)每次只能看一个指标。这个报表需要经过配置,且每次报表中只能显示1个指标。如果要看更多的指标需要返回配置界面重新配置。如下是配置的一个实时报表: adobe analytics实时报表 2)能同时查看的维度太少。实时报表中只能同时支持三个维度,如上图,第一个是一级产品分类、第二个是新老访客、第三个是地域分布。要查看更多的维度,也只能通过返回进行重新配置。 3)数据查看时间限制。实时报表的数据时间只提供了过去15分钟、30分钟、一小时和两小时数据时间区间,这个时间区间的价值除了能给IT提供一下并发量,其他的并没有太多参考价值。通常我们更多的会关注,10点卖了多少,当天累计多少?这个是Adobe Analytics无法提供的价值认知。 2. 各个报表中的实时功能。Adobe Analytics在细分类报表中都提供了"Include Current Data"功能,这是一个非常好的功能,但问题在于:分析类的需求通常不需要实时到分钟级别的数据,而如果作为实时性的分析需求却需要去各个报表点击查看;另外,汇总类的数据不支持实时数据选项。因此,这个功能的初衷很好但没有考虑应用场景。 Webtrekk Webtrekk的分析产品体系只有Q3、Quick Insights和Live Analytics,三个产品的定位如下: Q3的产品定位是具有深度分析需求的用户,其中包括各种路径、每个报表四级下钻、任意数据维度和指标交叉、关联分析和日常报表等。 Quick Insights是面向中、低端分析需求的与用户,其中具备Q3所有的报表,但分析维度只能下钻一级,且报表组织经过优化,通过菜单树的形式直接查看数据。 Live Analytics是面向实时性需求的用户。相比较Adobe Analytics,Webtrekk的实时产品有以下几个特点: 完整的实时数据产品。Live Analytics将实时数据进行数据提取和封装,日常运营所需各种维度如渠道、用户、页面、媒体、事件、目标、电子商务,各种指标如流量、订单等都可在该产品中找到。 无需任何配置。Live Analytics中的报表可以直接点击查看,无需任何配置。 提供了当天数据时间选项。在Live Analytics中提供了三个数据时间选项:过去30分钟、过去2小时和当天。当天的功能是需求和使用频率最高的区间。 提供了对比功能。在Live Analytics中默认提供了时间对比功能,对比时间是上个周的相同时间区间内,如下是当天累积订单数与上周相同时间内的对比: webtrekk实时报表 当然Live Analytics也有一定的问题: 指标的可选择性较差。虽然指标支持的比较多,但是每个报表中的指标都是固定的,我们不能像Q3一样任意选择指标,更不能使用自定义指标;另外,指标也没有Q3丰富,只支持基本指标如UV、Visit、PV、订单、收入等,这些指标都是日常运营关注的结果类指标。 ? 缺少预警功能。实时数据分析的一个重要落地点是实时预警,当出现不符合预测数据的异常情况时,如果能配合预警功能及时提示用户预警事件、预警值等,会更方便数据驱动业务 (二) 以用户应用为导向的功能设计 Adobe Analytics的产品设计的定位更多的侧重于中高端使用者,因此针对中低端的用户功能设计中略显不足。Webtrekk的产品设计用户应用性更强、更人性化。下面将二者的差异对比如下: 1.分析引导功能 如何开始一个新的分析?不同的用户由于使用能力和需求不同,往往需要不通引导。在这点上,Adobe Analytics没有进行区分,只有主菜单引导,无论是SiteCatalyst、Discover还是Insight,都是面向中高端能力和分析需求的用户,对低端用户的照顾不足。而Webtrekk将这个过程分为三种:分析向导、主菜单引导、表格生成器引导。 分析向导针对低端使用能力或分析需求的用户,直接通过常见问题(也支持自定义问题)点选查看; 主菜单引导这对具有中高端使用能力或分析需求的用户,直接可以在菜单中点选; 表格生成器针对高端使用能力或深入分析需求的用户,直接在表格中通过任意维度(最多5个维度)和指标(无限制)的组合进行数据挖掘和分析,不仅如此,Webtrekk还支持图表、对比数据的创建。 另外,Webtrekk正在改版产品,最新推出的URM, MAC系统将是新的以用户为驱动的秘密武器。 2.自定义登录Dashboard 自定义Dashboard功能两个解决方案都支持,其中支持的元素包括KPI仪表盘、平衡计分卡、各种图表和数据等,自定义的Dashboard都可以指定为登录后的落地页。 3.自定义书签和报告 Adobe Analytics和Webtrekk都支持自定义书签以及自定义报告功能,同时还能不同用户间共享;另外Adobe Analytics的自定义书签和报告还支持不同用户间的转移,如果涉及到核心用户权限关闭但其中有很多报表和功能需要移动,这个功能将非常实用。 三、严谨和科学的数据精神 (一) 数据挖掘算法 数据挖掘和网站分析是数据分析的两个不同领域,数据挖掘侧重于通过模型从海量数据中发现和挖掘未知知识,网站分析通常通过细分、趋势和转化进行价值提取。在之前我们的应用中,我们一直想将两种数据分析方法结合,并探索网站数据挖掘的相关方法;现在,这两种解决方案已经开始将数据挖掘的算法植入系统,并在分析系统中提供了数据挖掘洞察。 Adobe Analytics Adobe Analytics的数据挖掘应用体现在Anomaly Detection(异常检测)报表,该报表的作用是通过对选定的数据集、时间进行数据运算,找到数据波动的最大值和最小值,当数据实际值超过该范围时形成预警。 Anomaly Detection本质上使用的是时间序列算法,核心是: Holt Winters Multiplicative (Triple Exponential Smoothing)——霍尔特温特斯乘法(三重指数平滑法) Holt Winters Additive (Triple Exponential Smoothing)——霍尔特温特斯加法(三重指数平滑法) Holts Trend Corrected (Double Exponential Smoothing)——Holts趋势校正(双指数平滑法) 这三种算法实际上共同组成了温特斯季节指数平滑模型,其基本思想是把具体线性趋势、季节变动和随机变动的时间序列进行分解研究,并与指数平滑法相结合,分别对长期趋势(Ut)、趋势的增量(bt)和季节变动(Ft)做出估计,与指数平滑法结合起来的预测方法,可以同时处理趋势和季节性变化,并能将随机波动的影响适当地过滤掉,然后建立预测模型,因此,特别适用于包含趋势和季节变化的时间序列的预测问题。 但这个应用目前存在两个问题: Anomaly Detection只能提供截止到昨天的数据检测报告。异常监测的本质不是告诉用户昨天发生了什么,而是当前发生了哪些异常,具体如何异常; 异常检测的作用仅仅局限于SiteCatalyst查看,如果能提供类似于邮件触发、短信或其他类型的触发提示,效果必然提升很多; 关于该功能的详细介绍,请查看《统计学在点击流数据中的应用范例——Adobe Analytics异常检测》。 Webtrekk Webtrekk的数据挖掘算法的核心应用是关联分析,该模型可以应用到页面、站内外搜索词、产品、广告渠道。跟Adobe Analytics的异常检测的现成报表不同,Webtrekk的关联模型报表需要进行简单配置才能查看。通常我们在用数据挖掘工具做数据挖掘时会选择数据源、数据预处理、算法本身需要配置最低支持度、最低置信度和最大前项数等,同样在Webtrekk的关联分析配置中也需要进行配置: 关联分析的算法支持交叉销售算法和向上销售算法两种; 数据集都是采用Raw Data,时间最大只能选择一天; 分析规则上支持不同级别的页面、渠道、产品、广告、站内外搜索词的关联,即可以生成页面关联报表、站内外搜索词报表、广告渠道报表、产品报表; 支持高级配置功能。支持最小频繁度;选择向上销售时会需要确认向上销售的数据集时间;还支持网站分析里面的细分功能,比如我就需要看某个页面的关联效果,只需要过滤该页面即可。 webtrekk关联分析 webtrekk-渠道关联分析 Webtrekk的关联模型应用的范围非常广,它可以提供以下的数据价值洞察: ? 用户搜索了站内A关键词之后通常会优化搜索哪个关键词? ? 用户在看了A页面之后,通常还会看哪个页面? ? 用户买了A产品之后,还会一起买哪个产品?下次又会买哪个产品? ? 用户从A渠道进入网站之后,通常还会从哪个渠道再次进入? 实际上在所有的数据挖掘类算法中,规则提取类是最受业务应用关注的算法,原因是提取后的规则可以直接指导他们如何进行业务实践,因此实用性最强(所谓的规则提取类算法包括关联、回归、决策树等以直接目标为分析导向,提取能实现目标规则的算法,如购买A的用户下一次通常会购买B)。 尽管Webtrekk的这个算法很好,但问题在于数据集时间太短。通常情况下,我们会选择合适的样本量,数据太大意味着数据浪费,数据太小不能说明问题。一天的数据量有点小,很可能会有一些偶然性因素出现在结果中,如果能扩大到1周甚至是1个月的数据效果会更好。当然,更大的数据量意味着更多的数据处理需求和更长的时间,这个需要进行取舍。 (二) 更科学的数据洞察开始 有经验的数据分析师,在拿到数据的第一时间并不是开始进行数据分析和挖掘工作,而是先要看数据。 什么是看数据? 看数据就是对目前的整体样本进行数据评估以确认该数据需要如何进行下一步预处理(完整的数据分析流程包括需求处理、数据处理、专项分析、部署优化和项目总结,具体请见《如何建立落地型数据分析(挖掘)流程?》)。 如何看数据? 看数据就是要看数据的整体分布、数据趋势、数据极值、平均值、标准差和方差等,以此来判断该数据是否稳定并且判断是否存在异常值。对比Adobe Analytics和Webtrekk,Adobe Analytics仅在报表底部提供了数据汇总功能,相比之下,Webtrekk做的可圈可点: webtrekk-科学报表 提供了更多的整体数据查看选项。包括平均值、最大值、最小值、汇总、页面内数据汇总等,通过这些指标,可以一眼看到所选择的报表中数据的分布情况,结合顶部的数据趋势等图形可以有效判断数据分布。 提供了针对每天数据的提示功能。包括高亮或柱形图,日常我们在Excel中做数据汇总时,这种表示方法是基本的标注数据关注度的方法,如果把这个表格做成Dashboard直接发送给老板,老板会更容易在一堆数据中发现重点标注的数据;另外我们在自己做数据时也会非常容易发现数据的异常值。 四、总结 洋洋洒洒写了这么多,也许还是有的同学会问,到底这两个工具哪个好?面对这样的问题,我会这样回答: Adobe Analytics的特点是功能多,覆盖面广,尤其配合Discover使用会异常强大,它将单体分析的能力做到极致。(我常说,如果没有用过Discover,就连Adobe Analytics一半的功能都没用出来)但可惜的是这种强大的功能受账号数量、个人能力、尤其是网络的限制极高,另外其套件价格高,且对中国市场的重视程度不够。这个工具适合这样的企业:首先费用充足;其次公司有一批会用的牛人同时具备一定开发经验和能力,或者是技术支持要非常到位,否则即使买了也用不出Adobe Analytics的功能;如果购买了其他的Adobe产品会更好的配套使用。 Webtrekk的特点是功能实用,尤其是严谨的数据算法和产品能力极大的提升了数据应用的价值,Webtrekk将数据的科学性加入网站分析领域,并且能很广泛的应用到业务实际,尤其是其细分到分钟粒度、任意切割数据的能力让人叹为观止。中国区的市场慢慢已经打开,并且未来会增加对中国的重视和开发支持。这个工具适合这样的企业:首先费用上有限制;其次公司同样需要有一批会用的牛人和相应的技术支持,但开发可以交给Webtrekk来做;如果企业想把点击流数据导出到本地形成企业数据仓库EDW和商业智能甚至大数据的各项应用,Webtrekk是不二之选。 根据上面的介绍,相信大家一定有自己的见解了,没有最好的工具,只有最适合的工具。另外,我们在做数据时更多的需要关注数据的投入和产出,关注通过数据带来的业务提升。