实验五:浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作


实验五:浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作

实验五:浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作

从 800 万级行为记录到可发布的数据大屏

本篇推文整理实验五的三段核心任务:浏览器市场与用户画像的数据加工、市场分析大屏静态布局、以及蓝图编辑器的数据接入。它适合用于课程复盘、项目展示和实验成果发布。

一、实验要解决什么问题?

数据大屏不是图表拼盘,而是业务问题的可视化回答。本实验围绕浏览器市场行为和用户画像展开,目标是看清用户规模、使用粘性、活跃趋势、时段偏好、使用频率、竞争关系和用户群体特征。

·市场格局:哪个浏览器用户更多,哪个浏览器使用时间更长。

·行为趋势:用户活跃度是否变化,活跃时段集中在哪里。

·使用习惯:用户是轻度、中度还是重度使用,是否同时使用多个浏览器。

·场景差异:工作日和周末的使用时长是否存在明显差别。

·用户画像:不同浏览器用户在性别、年龄、学历、职业、收入和地域上有什么分布特征。

二、整体链路:从明细表到大屏

实验先以“用户-日-浏览器-小时”明细表为基础,继续加工大屏可直接使用的聚合表;随后在助睿Max中完成静态视觉布局;最后通过蓝图编辑器把数据库查询结果绑定到图表组件。

阶段

关键产物

作用

数据加工

多张浏览器统计表和用户画像表

把原始行为转为可复用指标

静态布局

市场分析数据大屏

确定阅读顺序、图表类型和视觉样式

数据接入

SQL请求与图表绑定

让大屏从静态页面变成实时数据展示

三、数据加工重点

第一步是复用并调整已有清洗转换流,输出 daily_browser_detail。这里最容易出错的是排序和分组:排序字段应与分组字段保持一致,否则同一用户、日期、浏览器和小时可能被拆成多条统计记录。

第二步是完成浏览器名称映射,把进程名转换为 IE、360极速、Google、搜狗、QQ浏览器等业务名称,同时排除明显不是浏览器的进程。

第三步是加工目标表。周活跃表按浏览器和周区间统计去重用户数;使用频率表按累计小时划分轻度、中度、重度;使用数量表统计用户同时使用几种浏览器;工作日与周末对比表则按日期类型汇总平均时长、总时长和用户数。

目标表

回答的问题

可视化用途

browser_overview

整体表现如何

顶部指标卡

browser_coverage

谁的用户多、时长高

柱状图、饼图

browser_weekly_active

活跃是否变化

周趋势折线图

browser_hourly

一天中何时活跃

24小时分布图

browser_frequency_stats

轻/中/重度占比

堆叠柱状图

browser_multi_usage

用户是否多浏览器使用

饼图

browser_weekday_weekend

工作日与周末差异

分组柱状图

user_profile_stats

核心用户是谁

用户画像分析

四、用户画像:让行为数据有解释力

行为日志可以告诉我们用户做了什么,但很难直接说明用户是谁。因此实验引入 demographic.csv,通过用户ID与行为明细关联,再按性别、年龄、学历、职业、收入、居住地类型和省份统计用户分布。

年龄段的处理也很典型:先依据数据年份计算年龄,再划分为 <18、18-25、26-35、>35。这样画像指标既能服务浏览器分析,也能为后续产品定位、运营投放和用户分层提供依据。

五、大屏静态布局:先搭好叙事骨架

静态布局阶段重点在于图表选型和阅读路径。大屏采用“顶部核心指标、左侧市场格局、中部时间行为、右侧习惯与竞争关系”的结构,读者可以先看总体,再看细分原因。

区域

图表

数据来源

数据概览

数据翻牌器

browser_overview

用户规模

柱状图

browser_coverage

使用规模

饼图

browser_coverage

使用粘性

柱状图

browser_coverage

时段偏好

区域图/折线图

browser_hourly

周活跃趋势

折线图

browser_weekly_active

使用习惯

堆叠柱状图

browser_frequency_stats

竞争关系

饼图

browser_multi_usage

视觉设计上,六个浏览器应保持固定颜色,避免读者在不同图表之间反复重新识别。实验给出的参考色包括 #2177FC、#3DC3DF、#FF948B、#8A79FE、#82F9A5、#97DFFF。

六、蓝图数据接入:让图表真正动起来

完成静态布局后,需要把组件导出到蓝图编辑器。蓝图中的典型流程是:页面初始化触发 SQL 请求,查询成功后进入数据处理节点,再把处理后的结果送入图表的导入数据接口。

市场格局的三个图表可以复用一次查询结果,再分发为用户数、总使用时长、人均使用时长三类数据。指标区则适合用 metric_name 和 metric_value 的键值结构,分别绑定到四个数据翻牌器。

接入周活跃趋势时,要特别关注字段语义:横轴应对应周区间,纵轴对应活跃用户数,系列字段对应浏览器名称。只要表、字段和组件接口一致,图表就能稳定刷新。

七、实验复盘

这次实验把数据分析项目的完整链路跑通了:先提出业务问题,再设计指标表,接着搭建大屏布局,最后完成数据绑定。它提醒我们,好的数据大屏不是把所有图表堆在一起,而是让每个图表都知道自己在回答什么。

当明细数据、聚合指标、可视化组件和蓝图逻辑彼此对应时,大屏就不只是展示页面,而是一套可以被解释、复用和维护的数据产品。

参考链接

实验5-1:浏览器市场与用户画像分析-数据加工(2):https://community.uniplore.com/t/topic/118

实验5-2:浏览器市场分析-大屏静态布局制作:https://community.uniplore.com/t/topic/119

实验5-3:浏览器市场分析-大屏数据接入:https://community.uniplore.com/t/topic/120