有价值的市场情报和合规,在现有框架下不能同时存在

Between the Data and the Law · 第08期 · 产业观察

需要说明的是：这篇文章是我基于公开资料和个人研究整理的观察，不构成法律建议，也不代表任何机构的立场。文中涉及平台商业逻辑的部分，来自行业实践的观察，欢迎有不同判断的从业者来讨论。

前两期讨论的是「怎么做是违规的」——违反用户协议的法律后果，以及绕过风控之后法律性质的根本转变。

这一期要说一个更根本的问题：如果违规的路走不通，合规的路是否存在？

结论先说：在现有框架下，有价值的市场情报和合规数据获取，是两件不能同时成立的事。这不是技术问题，不是法律漏洞，而是一个被平台主动设计和维护的结构性困境。合规路径的缺失是这个结构的必然结果，不是偶然。

一、数据性质的根本转变

理解这个困境，要从一个更早的时代说起。

尼尔森的商业模式，建立在一个简单的前提上：没有任何单一零售商能看到全市场。沃尔玛知道自己店里卖了多少，不知道Costco卖了多少。在这种天然的信息分散状态下，零售商愿意把自己的销售数据交给尼尔森，换取行业全景数据。数据交换对所有参与方都有价值，因为没有人单独掌握全局视角。

尼尔森卖的是描述性数据——市场发生了什么，颗粒度是品类、门店、周度报告。但更重要的是尼尔森模式背后的角色结构：数据的采集者和市场的参与者是清晰隔离的两方。卖场提供销售数据，但卖场无法左右行业全局数据的呈现方式；尼尔森汇总分析数据，但尼尔森没有能力也没有动机直接影响某个品牌在某家卖场的销售结果。正因为这种隔离，尼尔森的数据是中立的，它对所有人说的是同一个市场的同一个版本。

电商平台打破的不只是这个颗粒度，而是这个角色结构。平台同时是数据的采集者、市场规则的制定者、以及通过广告和流量服务直接参与商业结果的利益方。三个角色集于一身，数据的中立性就从根本上消失了。

平台掌握的是每一个用户的每一次点击、页面停留时长、加购行为、比价路径、最终是否购买、购买后是否退货以及退货原因——实时的、个体级别的、跨品类的完整行为链。这个颗粒度在线下根本不存在。尼尔森知道某个品类上周在华东地区卖了多少件，平台知道某个具体用户昨晚为什么在两个SKU之间犹豫了四分钟最后选了竞品。

但更关键的不是颗粒度，而是这类数据赋予平台的能力：平台不只知道市场发生了什么，它知道接下来会发生什么，而且它能通过调整推荐算法、搜索排序、首页曝光，主动塑造接下来会发生什么。

尼尔森卖的是市场的镜子。平台掌握的是市场的方向盘。

把方向盘交出去，等于放弃对市场最核心的控制权。这才是平台不开放真正有价值的数据的根本原因——不是技术限制，不是法律顾虑，是它不愿意。

需要说明的是，这篇文章描述的平台数据状况，主要指中国的电商市场。中国以外的大多数电商平台，商家能获取的数据仅限于自己店铺的销售数据和广告投放结果，类目趋势、竞品表现等行业数据几乎完全不可见——连选择性开放都谈不上。中国的情况反而因为有部分指数化数据的选择性开放，让这套结构设计的逻辑变得更加清晰可见：开放什么、不开放什么、向谁开放，背后的逻辑是一致的。

二、信息不对称是设计，不是副产品

平台并非对所有数据完全封闭。部分超大型商家可以获取平台提供的指数化市场数据，作为经营参考。但这个开放是经过设计的：获取数据的门槛与在平台上的体量和投入直接挂钩，数据以指数形式呈现而非原始数据，且无法与其他平台的数据进行对比和融合分析。品牌商对单个平台内部的运营有了有限的参考坐标，但对跨平台的全市场判断依然是盲的。真正有价值的市场情报——竞品在全渠道的真实表现、消费者在不同平台之间的流转规律——依然不可得。

这个开放边界不是随机划定的。维持品牌商的信息劣势，同时服务于平台的三个核心利益。

第一，制造持续投入的压力。品牌商不知道竞品的真实销售情况，无法独立判断自己的广告投入是否有效，无法确认促销力度是否在类目里有竞争力。在这种不确定性下，停下来的风险比继续投入的风险更大——因为你不知道停下来之后会发生什么，但你知道继续投入至少维持了曝光。平台用信息不对称制造了一种永续焦虑，品牌商在这种焦虑里主动维持高广告投入和促销力度，同时为了保住流量优势，在货品上给到平台更有价格竞争力的SKU。

第二，让流量成为真正的调控工具。平台的流量分配不是中立的算法输出。流量可以奖励配合的商家，可以调节不同品牌的销售节奏，可以在广告销售的淡季人为制造流量紧张来刺激投放需求。品牌商看到的销售波动，有多少是市场的真实反应，有多少是平台主动调控的结果，在信息不对称的状态下根本无法区分。这种不可区分性，让流量调控变得几乎没有成本。

第三，防止商家形成集体行动能力。如果品牌商之间能够充分共享信息，就有可能形成集体议价能力——价格联盟、不投放联盟、联合谈判。平台维持信息不对称，让每个商家只看到自己的数据，看不到全局，商家就永远是孤立的个体，无法形成有组织的反制力量。商家之间确实会交流，但交流的是碎片化的个体经验，不是系统性的市场数据。

这三个机制叠加在一起，信息不对称就不只是平台数据策略的结果，而是它商业模式的组成部分——被主动维护，而不是被动保留。

监管层面目前没有形成足够的反向压力。欧盟DMA对守门人平台有数据开放义务，要求平台向商家开放与其业务相关的数据，但执行还在早期，争议持续。中国和新加坡目前没有对等的强制数据开放机制。在监管真正介入之前，这个结构没有自我修正的动力。

三、两条出路，都没有触动结构本身

面对这个困境，市场自然产生了两种应对方式。两种都没有解决根本问题。

合规隔离：转移风险，不是解决问题

品牌商不是不知道数据来源有问题。他们的解决方案是：不直接知道。

具体操作是：品牌商委托数据服务商获取市场情报，合同里明确要求「数据来源合规」，但不追问具体怎么做到的。一旦出问题，数据服务商承担法律责任，品牌商以「不知情」为由切割关系。这是行业通行惯例，有法务团队的品牌商普遍会这样设计合同结构。

这个安排在商业上运作良好，在法律上存在值得追问的地方。「不知情」的抗辩能走多远，取决于品牌商对数据来源的注意义务边界在哪里。如果一家品牌商长期使用同一家数据服务商，持续获得明显超出官方API范围的市场数据，「不知情」是否还能成立，在不同法律框架下的答案并不一致。

但更根本的问题是：合规隔离解决的是法律责任的归属问题，不是数据获取的合规性问题。它让风险在链条里向下沉，集中到规模最小、最缺乏法务资源的那一端，但没有改变整个链条的性质。第07期讲的风险下沉机制，品牌商是这个机制的设计者，不是旁观者。

生成式AI：换了依赖对象，没有改变结构

一个新的变量正在出现。生成式AI平台正在成为新的导购入口——用户从「打开平台搜索」变成「问AI推荐什么买」。这给平台带来了一个新的压力：如果AI的推荐结果和平台数据脱节，平台就失去了这个流量入口的控制权。

这个压力让平台有了向AI开放数据的动机，但开放是选择性的。阿里、字节、腾讯自己有大模型，数据和模型在同一个生态内闭环，不存在开放的问题。DeepSeek、Kimi这类独立大模型需要平台数据才能做好导购类功能，但谈判筹码在平台手里，开放的条件、范围和价格由平台决定。

对品牌商来说，这个重构的结果是：数据流转的路径变了，但结构没有变。第三方数据服务商被绕过，品牌商的信息获取从依赖数据服务商变成依赖AI平台，但AI平台获取的数据依然来自平台的选择性开放。信息不对称的根没有动。

四、这是一个自我强化的结构

把前三节的逻辑收拢。

合规路径在现有框架下给不了有价值的市场情报，不是因为技术不够，而是因为平台掌握的是市场控制权，不是市场记录，开放等于自我削弱。这个状态被平台主动维护，因为信息不对称同时服务于它的广告收入、流量变现和商家管控。品牌商的两种应对——合规隔离和寄希望于AI重构——都没有触动结构本身，只是在结构内部寻找出路。

在这个逻辑下，行业里流行的「熬死竞争对手」判断值得重新审视。这个逻辑成立的前提是：活下来之后市场还在。但平台有能力通过数据封锁和生态闭环，让整个第三方市场情报行业失去存在的空间——不是通过法律手段取缔，而是通过让数据直接在平台和AI生态之间流转，彻底绕过第三方。熬死了竞争对手，不等于赢得了市场，因为那时市场本身可能已经以另一种形态存在了。

这个方向如果成真，行业出清之后剩下的是什么？谁是真正的受益者？平台垄断进一步强化之后，现有的法律框架有没有能力介入？

这是下一期要讨论的问题。

【免责声明】本文作者与任何机构无商业合作关系。文中涉及平台商业逻辑的分析基于行业观察和公开资料，不构成法律建议。