大数据中的第三方数据(3):带兴趣标签和画像的大数据

前面我们聊了“运营商大数据”和“企业及员工大数据”。今天我们聊一聊,大数据行业最早的第三方数据:带兴趣标签和画像的大数据

我们回忆一下大数据刚开始的时候,一些大数据公司动不动就号称自己拥有数亿、甚至数十亿人的“带有兴趣标签和画像的大数据”。和以前类似,我们从两个维度来分析,首先这些数据从哪里来,质量如何?其次,这些大数据有什么用?能用于建模提升营销的效率吗?

这些画像大数据,从获取方式不同可以划分为三种大的类型:1)BATJ等大平台的大数据;2)程序化广告投放平台的大数据;3)通过嵌入代码或者SDK方式获取的大数据。我们逐个进行分析。之前的讨论,我们一再强调,随着数据安全法规的推进,各大数据服务商都不会支持基于个人粒度的数据交易行为。所以现在对该类大数据的总的服务方式分类两种,一是群体画像,二是上一讲提过的基于ABM的定向客户营销。

BATJ等大平台的数据服务,基本都在其围墙花园内,通过严格的技术和协议约束,在各自的生态下进行数据营销服务。因为大平台覆盖的用户规模以及用户行为动态实时变化的特性,使得该部分大数据在特定的领域内能发挥相应的作用。简单的说,相比于其他类型的大数据,一是相对准确,二是规模足够大。而这两点是基于数据建模提升效率的基础。目前,各大平台的大数据服务类型和应用并不相同。总结来看,有以下几种应用。

1)企业提供一个群体列表,比如电话号码或者设备号,大数据服务提供该群体画像。画像的类别各平台各有侧重,比如BAIDU会侧重搜索行为、路径数据,而ALI会侧重电商行为,对于性别、年龄等属性也是通过某种算法预测而得,并不完全准确。

2)通过关键词或行业标签,获取到人群包,对该人群包进行广告营销。

3)企业提交已经是自己客户的列表,平台能够通过LOOK LIKE算法建立潜在客户模型,放大潜在客户规模,再对这些人群包进行定向营销。


从我们观察到的结果来看,建模后再定向营销,确实能提升效率,这部分人群的转化要高于传统的广告投放。但是相对于广告,建模后的人群包数量很难放大,也就是规模有限。在数量和质量之间难以找到合适的平衡点。

程序化广告投放平台的大数据,来源于广告竞价时交易中心或者媒体提供给广告平台的信息。一般会包括用户的ID(IP或者设备号或其他唯一标识),终端信息(手机类型),当前广告位所在页面的信息(内容类别,标题,也可以通过爬虫获取内容关键词信息)等等。如果广告平台竞价量很大,比如每天有百亿规模,那么通过积累,也能拥有覆盖大部分网民的浏览行为,然后对这些行为进行标签化和画像,就形成了标签和画像的大数据。一般来说,这些大数据的应用依然是程序化广告平台上的人群选择和广告优化。同样,一般都会提供上述从群体画像、人群选择、LOOKLIKE这三类大数据应用服务。要特别说明的一点是,程序化广告平台一般会对接多家大平台的广告资源,所以存在拼接和打破各大平台围墙花园数据的可能。当然,因为是通过广告接口获取数据,数据的内容并没有各大平台的行为详细,也就是说粒度不够细。

第三种获取数据的方式是大数据公司提供了某种互联网服务,这些服务以嵌入代码或者SDK的方式被其他开发者的网站或者APP使用,该类服务会通过代码或者SDK,获取这些网站或APP用户的访问行为信息,再对这些信息标签化,以形成画像。这些服务,可能是一键登陆、可能是支付、也可能是个性推荐、或者游戏统计、点击流分析、或者第三方广告检测、等等功能。开发者利用这些服务的SDK,就不需要自己开发相应的程序,而直接获得这些应用功能,代价是将自己网站或APP的数据上传给大数据服务提供商。从数据来源来看,这类大数据一般在某个垂直领域,比如游戏领域的用户大数据,安装SDK的应用量直接决定了大数据的广度。从逻辑上看,不可能所有应用都会用某个SDK,所以这类大数据一般覆盖度有限。其次,标签的质量也值得商榷,因为一是应用本身会限制代码获取的信息范围,二是随着操作系统安全规范的加强,对于越界访问也有更多的限制。标签的粒度、时间新鲜度、准确性都无法有效保障。该类数据一般也提供上述三种大数据服务,在特定领域的客户洞察和针对性营销有一定的价值。

带标签和画像的大数据最初的主要作用是补充兴趣标签。对于补充兴趣标签,我们在前面的用户需求里看到,确实存在这样的需求。通常是企业只有电话号码或者设备号信息,需要补充其他标签信息。一般来说,除了BATJ这些大平台拥有几乎全覆盖的人群数据标签,一般的第三方大数据公司提供的补充兴趣标签,覆盖度都有限。这里的问题是,BATJ肯定不会提供补充标签的服务。随着数据安全法规的推行,针对单个用户(电话号码/设备号)补充其他信息的做法也存在问题。所以,现在基本上不会有提供数据交易级别的补充标签服务存在。目前的应用主要集中在群体画像、人群选择和LOOKLIKE人群放大再进行定向营销服务上。

大数据对于提升企业洞察,持续优化提升营销效率,有相应的价值。我们对这些大数据的建议是,要通过自己CDP等精细化运营体系的建设,将第三方大数据逐步变为企业自身的数据资产,不断提升企业基于数据运营和营销的能力。