CDP已死?AI正重写企业营销的数据架构

目前,CDP的主流数据架构已经不适应时代的发展了,所以,必然面临着大量的整体重构。这可能又会刺激广告主在数字营销基建上的支出,并且为整个市场的服务商带来新的机会。
我为什么要做这样的判断?很简单,因为技术总是往前发展的,更何况AI将要越来越深刻地嵌入数字营销。
先看看即将被颠覆的传统CDP的数据架构什么样
一个最抽象化的示意图如下图所示:

这个结构十分清晰,也是今天CDP的标准构型了。
在这个架构下,理想状态下,消费者触点上的数字采集都是由CDP的埋点工具或者数据采集工具统一完成的,被采集的数据随之被存储在CDP的数据库中。
因为是CDP的统一埋点工具,因此,数据被采集时,其格式和结构都是按照CDP的标准来的,数据的组织和应用相对更容易实现。

不过,既然比较理想化,当然就是说实际应用时不太可能跟上面的完全一致。在企业部署CDP的时候,跟理想状况不一样的地方,也是在数据采集层。
大部分企业,它自己的网站、App或者其他各种各样的触点,都已经有了其他工具采集数据,或者因为种种原因(部门分工原因、安全原因,甚至政治原因),不允许用CDP的统一数据采集工具或统一埋点。这种情况下,CDP就需要有一个“数据整合层”,把那些能够提供数据的触点里面的数据,整合在一起,然后再存储在CDP的数据库中。

这种架构,是当今CDP的主流做法,但这个做法,在当今的时代,它的设计前提已经不成立了。

传统CDP的数据架构为什么要被淘汰了
传统CDP,是为适应这个时代的如下情况设计的:
-
数据分散
-
系统割裂
-
实时性的要求相对较低(因为确实在技术上实现起来很困难)
-
AI还没有那么牛逼,尤其是Transformer大模型还在市面上不存在
它能适应环境,但是公允地说,它也确实存在一些问题。尤其是AI来了以后,问题就更明显了。
AI的能力是什么,不仅仅是处理数据的效率提升,更是“处理方式”的改变。过去是基于规则与预定义结构的计算,AI则转向基于学习与推理的建模。这使得系统能够直接在高维、非结构化的数据中进行理解与决策,而不再依赖人工预先定义的标签体系。
所以,相对于过去,AI这种能力不是成百倍成千倍的提升,而是天上地下的差别。比如,大熊国和小熊国打架,据说每天会收到大量来自各种渠道的信息,甚至包括老百姓拍的照片、摄像头的视频,这些信息会铺天盖地般的源源不断地进入指挥部,人去看去处理根本没办法搞定,但AI在很短的时间内就能够给出很具体的结论和建议。这些结论和建议会被提供给执行单位——地面单位、火炮、无人机或者导弹。
随着技术的发展,CDP要么也需要具备类似的能力,要么直接被AI取代。未来的CDP这个事物如果还能存在,那它要做的事情跟上面打架中要做的事情没有本质上的区别,都是快速(甚至实时地)获取海量信息与数据(尤其是非结构化的),然后迅速给出结论(结论就是细分人群),并且将人群提供给执行单位——广告、短信、邮件、社交媒体等。
但传统的CDP架构方式做这个并不太在行,主要在数据的架构和处理上,有天然的缺陷:
-
数据是分散在各处的,大部分时候需要批量且离线地发给CDP的数据整合层。这个过程往往以天计,甚至以周计。这种模式在数据规模较小、实时性要求不高的场景下是可行的,但在需要持续决策的场景下,会产生显著延迟,使数据难以及时参与模型推理与用户触达。因此,它的能力够不上今天的AI。
-
AI系统对数据的依赖,不再局限于结构化的“用户事件”,而是扩展到长序列行为、上下文环境甚至非结构化信息。这些数据不仅体量更大,而且对连续性与时序关系有更高要求。而传统CDP的数据能力,难以支持这种高维、长序列的建模需求。
-
在AI系统中,用户与内容更多通过embedding作为载体,其中的行为与兴趣通过连续向量空间中的结构关系来进行表达。这使得系统可以在不依赖显式标签的情况下,完成相似性计算与决策推理。但CDP自己数据库中的数据结构仍然是以“ID+标签”为主,并不是为AI的这种能力准备的。真的把AI引入进来,也会让AI处在吕布骑狗的尴尬状态下。
你会问,写这么多,太技术,看不懂。你就一句话告诉我为什么传统CDP会不行了。
这么说吧,以前是“先分好人群再做营销”,但现在AI来了,可以提供更高级的“边看数据边做决策”的能力,而传统CDP跟不上这个节奏了。今天,我们已经变成“由数据流和AI实时推理驱动”的系统,CDP这种“营销神经中枢”当然更不可能例外,它反而应该是最早实现这种能力的!

新的CDP数据架构是什么样
为了具有真正的营销神经中枢的能力,传统CDP需要进行三个方面的重构。
第一,数据库必须升级为数据仓库。也就是说,CDP必须是配原生数据仓库的。
为什么要用数据仓库,因为新CDP要处理的问题——全量行为分析、特征计算与模型驱动决策——已经超出了传统业务数据库的能力边界。只有数据仓库才能做到。典型的数据仓库如snowflake。
但你会接着问,数据仓库不是很慢吗?你刚刚才说要实现“由数据流和AI实时推理驱动”的系统,数据仓库又没有办法实时。
对,所以我们需要有第二个东西。
第二,实时数据流能力。
用户的每一次点击、浏览、停留、互动、离开,这些行为都会通过实时数据流,传输给数据处理层,一部分进入数据仓库用于后续分析,一部分直接参与实时计算与决策,由CDP的AI引擎立即处理。
通常会结合流式处理能力来实现,比如Kafka、Flink这一类体系。
另外,为了能够确保实时的数据流能力,数据采集也必然发生变化。过去的那种在各个触点上各采各的,然后在数据整合层进行整合的方式,不能再被采用。所有触点,都建议尽可能统一数据采集方式,否则实时与一致性会被破坏。也就是,最好利用我们前面说的,那种理想状态下的数据采集架构。
第三,AI驱动的处理能力和决策能力。
过去CDP做决策,本质上是规则驱动的。先定义标签,再定义人群,再配置触达规则。整个过程是离散的、静态的,是“先分好人群,再做营销”。
而现在,决策方式发生了根本变化。系统不再去依赖人工定义的标签去判断,而是通过模型来理解用户。它会同时看三件事:这个用户过去做过什么,这个用户此刻在做什么,以及与他相似的人通常会如何行动。在此基础上,系统给出的结果,不是一个“人群”,而是针对每一个个体进行的判断:下一步应该做什么。并且,这个判断会持续发生,而不是一次性搞定了就结束了。
那么,基于这三个方面的重构,新的CDP的架构应该是什么样呢?

在这个架构中,关键的逻辑上的变化集中在三点。
-
数据不再集中进入单一系统,而是分成两条路径:一条进入数据仓库,用于沉淀全量历史数据与特征计算;另一条通过实时数据流直接进入决策层,使数据在产生的当下就能参与判断。这种双路径结构,使系统同时具备“全局认知”和“即时响应”的能力。
-
身份解析、画像与特征计算不再是简单的数据拼接与标签生成,而是逐步引入基于行为序列和向量表示的建模方式,使用户刻画从静态描述转向动态表达。
-
决策层从规则编排升级为模型驱动的持续推理机制,不再依赖固定流程,而是在数据不断更新的过程中反复计算与调整输出结果。
这些变化共同指向一个核心:各个环节不再是独立处理后再传递,而是围绕数据流动形成闭环,使计算与决策嵌入在整个数据生命周期之中。
这个架构的工程实现,跟过去的CDP也不同了,主要在四点上:
-
数据不再通过批量ETL统一入库,而是以事件流为核心进行接入,实时数据流和数据仓库需要同时存在并协同工作,这意味着企业需要具备流式处理能力,而不是只依赖离线数据处理。
-
数据建模方式发生变化:不再只是围绕宽表、标签表展开,而是需要支持明细事件、时序数据以及特征计算,这对数据结构设计和计算方式都提出了更高要求。
-
系统之间的关系从“数据搬运”变成“数据共享”,越来越多的能力直接建立在数据仓库之上,而不是在CDP内部复制一份数据再处理,这也是为什么会出现原生数仓,也就是warehouse-native的形态。
-
决策能力开始依赖在线推理与模型服务,这就要求系统具备低延迟的数据读取、特征服务以及模型部署能力,而不只是离线算好结果再下发。
总体看,新的CDP从“批处理系统”升级为“流式+实时+模型驱动”的系统,这是质变。

企业一定要自己掌控的,以及可以外包的
在这套新架构下,企业首先要分清一件事:哪些能力必须掌握在自己手中,哪些可以借助第三方完成。判断标准是,凡是涉及数据主权和核心决策的部分,一定要自己掌握;而偏基础设施和执行工具的部分,可以考虑第三方。
一定需要自己掌握的:
-
数据底座,也就是数据仓库或lakehouse。这一层承载的是企业全部数据的真实来源,是后续分析、建模和决策的基础,一旦放在外部平台,就会失去对数据的长期控制能力。
-
数据模型与特征体系,包括事件定义、用户行为结构以及特征计算方式,这些直接决定了企业如何“理解用户”。再往上是身份体系,也就是用户ID的统一与关联逻辑,这一层一旦出错,所有数据都会被污染。
-
决策能力,尤其是AI驱动的策略逻辑,例如推荐、触达时机、最优下一步动作,这本质上就是企业的“增长大脑”,是企业自己营销运营能力的体现,坦率讲这部分并不适合外包,但有意思的是,大部分的企业都喜欢把这块外包出去。
可以考虑使用第三方的:
-
工具层和执行层。例如数据采集工具(SDK、埋点体系)、流式处理基础设施(Kafka、Kinesis等)、CDP工具层(如受众构建、Journey界面)
-
各类触达渠道(广告、短信、邮件等)的对接。这些能力标准化程度高,自研成本高且差异不大。
-
AI基础能力层,如通用模型或推理服务,也可以借助云厂商或第三方,但需要避免将业务策略一并交出去。

厂商们升级CDP的时间到了。甚至有没有CDP这个名称都不重要了。因为,AI驱动的用户运营,以及相关能力的构建,是一个必将发生的事情。
时代的浪涌,又一次,涌来了。
-宋星大课堂-
课程详情扫描二维码,备注“宋星大课堂”咨询

-加入知识星球-
扫码加入,收获数据做营销运营的干货精华

-加入读者群-
添加我的个人微信,备注“读者群”,并自我介绍



评论