Python能做出BI软件的联动图表效果?这可能是目前唯一的选择
liuian 2025-05-14 14:50 30 浏览
此系列文章收录在公众号中:数据大宇宙 > 数据可视化 > py
转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的)
江湖流传一句话:"字不如表,表不如图",在 Python 中数据可视化有许多选择,但是大多数的库在语法简洁与灵活度不能平衡,本系列将探讨数据探索时如何使用合适的数据可视化库完成工作。
本系列或多或少涉及一些 pandas 的骚操作(网上很难看到相关的资料),其并非可视化的重点,不会多做讲解。
一切技巧与应用,尽在 pandas 专栏中:
前言
不管是在数据探索还是报告阶段,数据可视化都是一个非常有用的工具。今天我们来看看如何使用四象限图(波士顿矩阵图),为店铺销售员分门别类。本系列我将尽可能使用不同的工具制作。
计划中的工具:
- Python 的 seaborn
- Python 的 altair (能做出动态图,这是目前能比较方便做出图表之间联动的库)
- Python 的 plotly (能做出动态图,这是一个非常容易学习的库,前提是找到正确的思路)
- Power BI
- Tabluea
- Excel
今天的主角是 altair ,为了展示 altair 的特点,本文先从制作单店的四象限图开始,最后制作联动的多店四象限图。
分析思路可以直接参考上一篇文章:
使用Python的seaborn 包做出波士顿矩阵图,改善店铺销售水平
为什么需要介绍多个 Python 的可视化库?因为它们各有特点,而且我不喜欢太复杂的东西,总是在找一个最简单的可视化库。这也是我为可视化专栏做的准备工作
导入包代码如下:
用你的分析能力,提供改善建议
这次案例数据比上一节 seaborn 的多了一个维度,订单数据包含多个店的数据:
- 每一行记录表示,某订单的信息(单价多少,数量多少,是哪个店的哪位销售员负责)
- 日期列不重要,因为我们只分析一天的数据
每位销售员接待客人的记录:
- 每个店的每位销售员接待的人数
现在你要根据这些数据,得到这些问题的答案:
- 换掉其中某几位员工(意味着裁员),应该裁掉谁?
- 从中选出某一位员工,对其它员工进行培训和销售技能分享。应该选谁分享,哪些人需要被培训?
分析指标
沿用上一节的2个重要指标:
- 客单价:能反映每个顾客的质量,这其实与大环境因素(店铺位置,商品组合等)有关,也能反映销售能力。
- 成交率:这就能直观反映销售员的能力
假设大环境元素相对固定的情况下,我们就可以使用以上指标分析销售员的水平
使用 pandas 能非常容易关联2个数据表,并且简单求出每个订单的总价:
通过汇总,得到最终指标维度数据:
- 这与上一节 seaborn 篇没有多大区别
接下来将使用 altair 制作四象限图,顺带了解一下他有趣的图像语法。
一开始你会觉得使用 altair 需要比较多的代码,但实际上他非常灵活,只需要一点小技巧就能用任何我们喜欢的方式调用。
静态图
四象限图实际是散点图 + 线图(水平或垂直线),下面是上一节使用 seaborn 做的图。
而 altair 没有严格按图表类型进行区分,而是让你选择数据点的形状。
作图需要3个步骤:
- 确定数据源
- 把数据源中的字段与坐标系关联
- 选择数据的形状
现在按上述的步骤,选择一个店,做出散点图:
- 行2:步骤1,确定数据源,使用 alt.Chart(数据源) ,能直接支持 pandas 的 DataFrame 。注意 Chart 是实例化,首字母要大写
- 行3:步骤2,通过 encode 方法,设定坐标轴的字段。alt.X('客单价') 使得数据源中的 客单价 字段绑定在 x 轴上。同理绑定 y轴。同样,alt.X 与 Y 都是大写
- 行4:步骤3,mark_point ,表示图表中的数据使用"点"这种形状显示
现在能得到一个散点图:
- 实际形状点默认是空心圆圈,我们能通过简单改变最后的 mark_xxx 方法,即可修改每个数据点的形状
现在还需要线图:
- 行2:数据源不用改
- 行3:由于数据源是每个销售员的数据,而现在需要的是客单价的平均,因此在绑定 x 轴的时候,直接指定对客单价做平均操作
- 行4:mark_rule 表示画一条线
现在只是画出客单价的平均线,同理得到成交率的平均线:
- 行3:注意成交率是在 y 轴,因此使用 alt.Y
现在我们得到3个图表,只需要简单把它们叠加起来就可以:
- 行19:只要简单把各个图表相加即可叠加
这么多的代码,这包有啥好用!?
细看上面的代码,我们发现3个图表很多定义部分是一模一样的。
这是理所当然的,因为这个图表制作流程就是基于很多共性的东西。
进一步简化即可:
- 行1:数据源一致,直接定义数据源即可
- 行3-6:使用定义的数据源做散点图
- 行8:2个平均线图基于同样的数据源,同样的数据形状。直接定义一个 线图 表示
- 行10-11:使用定义的线图,分别映射不同的指标即可
这样的作图形式非常灵活直观,比如,为图表的每个点加上标签:
- 行13:数据标签,其实与散点图的唯一区别就是图形是文字,而非使用 "点形状"。因此,直接使用定义的 散点图 作为基础,通过 mark_text 修改数据形状。通过 encode,把字段 销售员 绑定到 图表的 text 属性上。
- 其中通过 dy 参数,让显示的文本向上偏移10个像素
- 注意,此时标签图的 encode 中的 x 轴 与 y 轴实际与 散点图一致(point)
- 行15:把标签图叠加即可
到这里,我们只是在做静态图,其实 altair 真正厉害之处是动态图表,并且能做出图表之间的联动。
整体店铺销售水平可视化
为了方便后续的代码编写,把一些通用过程定义到函数中:
- 这个完全可以作为不同项目的通用函数
现在用所有店铺的销售员指标,制作四象限图:
代码没啥好说的,如果此时我们打上标签,必然导致图表内容密密麻麻。
现在加个提示标签,当鼠标移到数据点上,显示该数据点的信息:
- 行5:在 encode 中,设置 tooltip 参数,即可绑定需要显示的字段名字
如下是动图:
encode 方法中能让你把数据绑定在图表很多属性上,比如大小,颜色等等。
现在虽然通过提示标签能让用户选择性查看某个点的信息,但是在分析的时候,我们更多地希望以店铺为单位进行观察。
接下来,我们使用 altair 制作出 BI 软件常见的图表联动效果
不同维度的图表联动
现在希望同时展示两个图表,一个是之前制作的多店四象限图,另一个是不同店铺的销售额柱状图。
通过点击店铺销售额的柱状图,旁边的四象限图高亮显示该店的销售员数据点。效果如下:
接下来,我会把一些过程通过自定义函数包装。
与大多数 BI 软件可视化的逻辑一样,我们需要使用同一份数据源制作不同的图表。
因此,我们需要使用 altair 的数据转换功能对数据做汇总:
- 行2-6:transform_aggregate ,聚合操作,相当于分组统计,其中参数 groupby 定义了按 销售员 与 店名 做分组
- 行7-10:transform_calculate ,简单的计算操作。注意在引用字段时需要使用 "datum.字段名"。这里可以使用之前分组统计结果的字段
使用这个数据源做四象限图即可:
- 由于数据源不再使用 pandas 的 DataFrame ,无法从中识别出数据类型,我们需要在绑定的时候,在字段后使用"冒号+类型"标记。
- 比如"客单价:Q" ,Q 表示数据是连续型数据
- '店名:N' ,N 常用于类别型数据
然后,使用"订单数据源(order_src)" 制作店铺销售额柱状图:
把2个图表并列放置,只需要使用 逻辑或运算符"|" 即可:
整体代码如下:
现在图表已经有了,但是缺少交互联动。在以上的代码上加上一些联动的定义,就可以做到。
首先,定义"鼠标点击行为":
- 行5:alt.selection_single ,定义单选行为。
- 其中参数 fields 指定选中的为字段"店名",这使得点击时让数据源只保留选中的店名的记录
- 参数 on 表示单击行为
- 行20:柱状图需要这个单选行为,通过 add_selection 方法,绑定这个行为即可
现在其实柱状图已经可以接受点击行为。但是实际点击时,是看不到任何的效果。
这是因为我们没有告诉他,筛选后的变化反映在哪个地方。
因此,需要把行为绑定到颜色上,再次修改代码:
- 行7:alt.condition ,定义一个条件,第一参数传入 定义的行为
- 第二个参数,被点击的柱子,该柱子颜色使用正常绑定店名时的颜色
- 第三个参数,其余没有被点击的柱子,使用灰色
由于散点图与柱状图中的 encode 方法参数 color 均使用定义的条件 color ,所以当点击行为触发时,这些图表都能一同变化。
不过此时你会发现散点图的提示标签不再起作用,这是 vega lite 上的小 bug ,只需要在散点图上添加一个单选行为即可:
是不是觉得代码有点多了?我们仍然可以进一步封装。
甚至可以弄成一个 excel 的模板,只需要配置好各种设置,简单一句代码就能做出复杂的图表。这留在以后再介绍吧。
总结
altair 是一个非常有趣的可视化包,它基于 vega lite (这是一个大数据可视化工具) ,而 vega lite 底层是基于 d3.js(这是目前前端可视化的标杆)。
只要学会一定的套路,能非常简单灵活使用它做出各种复杂的图表
相关推荐
- MySQL慢查询优化:从explain到索引,DBA手把手教你提升10倍性能
-
数据库性能是应用系统的生命线,而慢查询就像隐藏在系统中的定时炸弹。某电商平台曾因一条未优化的SQL导致订单系统响应时间从200ms飙升至8秒,最终引发用户投诉和订单流失。今天我们就来系统学习MySQL...
- 一文读懂SQL五大操作类别(DDL/DML/DQL/DCL/TCL)的基础语法
-
在SQL中,DDL、DML、DQL、DCL、TCL是按操作类型划分的五大核心语言类别,缩写及简介如下:DDL(DataDefinitionLanguage,数据定义语言):用于定义和管理数据库结构...
- 闲来无事,学学Mysql增、删,改,查
-
Mysql增、删,改,查1“增”——添加数据1.1为表中所有字段添加数据1.1.1INSERT语句中指定所有字段名语法:INSERTINTO表名(字段名1,字段名2,…)VALUES(值1...
- 数据库:MySQL 高性能优化规范建议
-
数据库命令规范所有数据库对象名称必须使用小写字母并用下划线分割所有数据库对象名称禁止使用MySQL保留关键字(如果表名中包含关键字查询时,需要将其用单引号括起来)数据库对象的命名要能做到见名识意,...
- 下载工具合集_下载工具手机版
-
迅雷,在国内的下载地位还是很难撼动的,所需要用到的地方还挺多。缺点就是不开会员,软件会限速。EagleGet,全能下载管理器,支持HTTP(S)FTPMMSRTSP协议,也可以使用浏览器扩展检测...
- mediamtx v1.15.2 更新详解:功能优化与问题修复
-
mediamtxv1.15.2已于2025年10月14日发布,本次更新在功能、性能优化以及问题修复方面带来了多项改进,同时也更新了部分依赖库并提升了安全性。以下为本次更新的详细内容:...
- 声学成像仪:泄露监测 “雷达” 方案开启精准防控
-
声学成像仪背景将声像图与阵列上配装的摄像实所拍的视频图像以透明的方式叠合在一起,就形成了可直观分析被测物产生状态。这种利用声学、电子学和信息处理等技术,变换成人眼可见的图像的技术可以帮助人们直观地认识...
- 最稳存储方案:两种方法将摄像头接入威联通Qu405,录像不再丢失
-
今年我家至少被4位邻居敲门,就是为了查监控!!!原因是小区内部监控很早就停止维护了,半夜老有小黄毛掰车门偷东西,还有闲的没事划车的,车主损失不小,我家很早就配备监控了,人来亮灯有一定威慑力,不过监控设...
- 离岗检测算法_离岗检查内容
-
一、研发背景如今社会许多岗位是严禁随意脱离岗位的,如塔台、保安室、监狱狱警监控室等等,因为此类行为可能会引起重大事故,而此类岗位监督管理又有一定困难,因此促生了智能视频识别系统的出现。二、产品概述及工...
- 消防安全通道占用检测报警系统_消防安全通道占用检测报警系统的作用
-
一、产品概述科缔欧消防安全通道占用检测报警系统,是创新行业智能监督管理方式、完善监管部门动态监控及预警预报体系的信息化手段,是实现平台远程监控由“人为监控”向“智能监控”转变的必要手段。产品致力于设...
- 外出住酒店、民宿如何使用手机检测隐藏的监控摄像头
-
最近,一个家庭在他们的民宿收到了一个大惊喜:客厅里有一个伪装成烟雾探测器的隐藏摄像头,监视着他们的一举一动。隐藏摄像头的存在如果您住在酒店或民宿,隐藏摄像头不应再是您的担忧。对于民宿,房东应报告所有可...
- 基于Tilera众核平台的流媒体流量发生系统的设计
-
曾帅,高宗彬,赵国锋(重庆邮电大学通信与信息工程学院,重庆400065)摘要:设计了一种基于Tilera众核平台高强度的流媒体流量发生系统架构,其主要包括:系统界面管理模块、服务承载模块和流媒体...
- 使用ffmpeg将rtsp流转流实现h5端播放
-
1.主要实现rtsp转tcp协议视频流播放ffmpeg下载安装(公认业界视频处理大佬)a、官网地址:www.ffmpeg.org/b、gitHub:github.com/FFmpeg/FFmp…c、推...
- 将摄像头视频流从Rtsp协议转为websocket协议
-
写在前面很多通过摄像头拿到的视频流格式都是Rtsp协议的,比如:海康威视摄像头。在现代的浏览器中,已经不支持直接播放Rtsp视频流,而且,海康威视提供的本身的webSdk3.3.0视频插件有很多...
- 华芸科技推出安全监控中心2.1 Beta测试版
-
全球独家支持hdmi在线实时监看摄像机画面,具单一、循环或同时监看四频道视频影像,可透过华芸专用红外线遥控器、airemote或是键盘鼠标进行操作,提供摄像机频道增购服务,满足用户弹性扩增频道需...
- 一周热门
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)
- c++ 字符串查找 (35)
- mysql刷新权限 (34)
