实验五:浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作
实验五:浏览器市场与用户画像分析-数据加工(2)+市场分析数据大屏制作
从 800 万级行为记录到可发布的数据大屏
本篇推文整理实验五的三段核心任务:浏览器市场与用户画像的数据加工、市场分析大屏静态布局、以及蓝图编辑器的数据接入。它适合用于课程复盘、项目展示和实验成果发布。
一、实验要解决什么问题?
数据大屏不是图表拼盘,而是业务问题的可视化回答。本实验围绕浏览器市场行为和用户画像展开,目标是看清用户规模、使用粘性、活跃趋势、时段偏好、使用频率、竞争关系和用户群体特征。
·市场格局:哪个浏览器用户更多,哪个浏览器使用时间更长。
·行为趋势:用户活跃度是否变化,活跃时段集中在哪里。
·使用习惯:用户是轻度、中度还是重度使用,是否同时使用多个浏览器。
·场景差异:工作日和周末的使用时长是否存在明显差别。
·用户画像:不同浏览器用户在性别、年龄、学历、职业、收入和地域上有什么分布特征。
二、整体链路:从明细表到大屏
实验先以“用户-日-浏览器-小时”明细表为基础,继续加工大屏可直接使用的聚合表;随后在助睿Max中完成静态视觉布局;最后通过蓝图编辑器把数据库查询结果绑定到图表组件。
|
阶段 |
关键产物 |
作用 |
|
数据加工 |
多张浏览器统计表和用户画像表 |
把原始行为转为可复用指标 |
|
静态布局 |
市场分析数据大屏 |
确定阅读顺序、图表类型和视觉样式 |
|
数据接入 |
SQL请求与图表绑定 |
让大屏从静态页面变成实时数据展示 |
三、数据加工重点
第一步是复用并调整已有清洗转换流,输出 daily_browser_detail。这里最容易出错的是排序和分组:排序字段应与分组字段保持一致,否则同一用户、日期、浏览器和小时可能被拆成多条统计记录。
第二步是完成浏览器名称映射,把进程名转换为 IE、360极速、Google、搜狗、QQ浏览器等业务名称,同时排除明显不是浏览器的进程。
第三步是加工目标表。周活跃表按浏览器和周区间统计去重用户数;使用频率表按累计小时划分轻度、中度、重度;使用数量表统计用户同时使用几种浏览器;工作日与周末对比表则按日期类型汇总平均时长、总时长和用户数。
|
目标表 |
回答的问题 |
可视化用途 |
|
browser_overview |
整体表现如何 |
顶部指标卡 |
|
browser_coverage |
谁的用户多、时长高 |
柱状图、饼图 |
|
browser_weekly_active |
活跃是否变化 |
周趋势折线图 |
|
browser_hourly |
一天中何时活跃 |
24小时分布图 |
|
browser_frequency_stats |
轻/中/重度占比 |
堆叠柱状图 |
|
browser_multi_usage |
用户是否多浏览器使用 |
饼图 |
|
browser_weekday_weekend |
工作日与周末差异 |
分组柱状图 |
|
user_profile_stats |
核心用户是谁 |
用户画像分析 |
四、用户画像:让行为数据有解释力
行为日志可以告诉我们用户做了什么,但很难直接说明用户是谁。因此实验引入 demographic.csv,通过用户ID与行为明细关联,再按性别、年龄、学历、职业、收入、居住地类型和省份统计用户分布。
年龄段的处理也很典型:先依据数据年份计算年龄,再划分为 <18、18-25、26-35、>35。这样画像指标既能服务浏览器分析,也能为后续产品定位、运营投放和用户分层提供依据。
五、大屏静态布局:先搭好叙事骨架
静态布局阶段重点在于图表选型和阅读路径。大屏采用“顶部核心指标、左侧市场格局、中部时间行为、右侧习惯与竞争关系”的结构,读者可以先看总体,再看细分原因。
|
区域 |
图表 |
数据来源 |
|
数据概览 |
数据翻牌器 |
browser_overview |
|
用户规模 |
柱状图 |
browser_coverage |
|
使用规模 |
饼图 |
browser_coverage |
|
使用粘性 |
柱状图 |
browser_coverage |
|
时段偏好 |
区域图/折线图 |
browser_hourly |
|
周活跃趋势 |
折线图 |
browser_weekly_active |
|
使用习惯 |
堆叠柱状图 |
browser_frequency_stats |
|
竞争关系 |
饼图 |
browser_multi_usage |
视觉设计上,六个浏览器应保持固定颜色,避免读者在不同图表之间反复重新识别。实验给出的参考色包括 #2177FC、#3DC3DF、#FF948B、#8A79FE、#82F9A5、#97DFFF。
六、蓝图数据接入:让图表真正动起来
完成静态布局后,需要把组件导出到蓝图编辑器。蓝图中的典型流程是:页面初始化触发 SQL 请求,查询成功后进入数据处理节点,再把处理后的结果送入图表的导入数据接口。
市场格局的三个图表可以复用一次查询结果,再分发为用户数、总使用时长、人均使用时长三类数据。指标区则适合用 metric_name 和 metric_value 的键值结构,分别绑定到四个数据翻牌器。
接入周活跃趋势时,要特别关注字段语义:横轴应对应周区间,纵轴对应活跃用户数,系列字段对应浏览器名称。只要表、字段和组件接口一致,图表就能稳定刷新。
七、实验复盘
这次实验把数据分析项目的完整链路跑通了:先提出业务问题,再设计指标表,接着搭建大屏布局,最后完成数据绑定。它提醒我们,好的数据大屏不是把所有图表堆在一起,而是让每个图表都知道自己在回答什么。
当明细数据、聚合指标、可视化组件和蓝图逻辑彼此对应时,大屏就不只是展示页面,而是一套可以被解释、复用和维护的数据产品。
参考链接
实验5-1:浏览器市场与用户画像分析-数据加工(2):https://community.uniplore.com/t/topic/118
实验5-2:浏览器市场分析-大屏静态布局制作:https://community.uniplore.com/t/topic/119
实验5-3:浏览器市场分析-大屏数据接入:https://community.uniplore.com/t/topic/120