百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python能做出BI软件的联动图表效果?这可能是目前唯一的选择

liuian 2025-05-14 14:50 39 浏览



此系列文章收录在公众号中:数据大宇宙 > 数据可视化 > py

转发本文并私信我"python",即可获得Python资料以及各种心得(持续更新的)

江湖流传一句话:"字不如表,表不如图",在 Python 中数据可视化有许多选择,但是大多数的库在语法简洁与灵活度不能平衡,本系列将探讨数据探索时如何使用合适的数据可视化库完成工作。

本系列或多或少涉及一些 pandas 的骚操作(网上很难看到相关的资料),其并非可视化的重点,不会多做讲解。

一切技巧与应用,尽在 pandas 专栏中:



前言

不管是在数据探索还是报告阶段,数据可视化都是一个非常有用的工具。今天我们来看看如何使用四象限图(波士顿矩阵图),为店铺销售员分门别类。本系列我将尽可能使用不同的工具制作。

计划中的工具:

  • Python 的 seaborn
  • Python 的 altair (能做出动态图,这是目前能比较方便做出图表之间联动的库)
  • Python 的 plotly (能做出动态图,这是一个非常容易学习的库,前提是找到正确的思路)
  • Power BI
  • Tabluea
  • Excel

今天的主角是 altair ,为了展示 altair 的特点,本文先从制作单店的四象限图开始,最后制作联动的多店四象限图。

分析思路可以直接参考上一篇文章:

使用Python的seaborn 包做出波士顿矩阵图,改善店铺销售水平


为什么需要介绍多个 Python 的可视化库?因为它们各有特点,而且我不喜欢太复杂的东西,总是在找一个最简单的可视化库。这也是我为可视化专栏做的准备工作

导入包代码如下:


用你的分析能力,提供改善建议

这次案例数据比上一节 seaborn 的多了一个维度,订单数据包含多个店的数据:

  • 每一行记录表示,某订单的信息(单价多少,数量多少,是哪个店的哪位销售员负责)
  • 日期列不重要,因为我们只分析一天的数据

每位销售员接待客人的记录:

  • 每个店的每位销售员接待的人数

现在你要根据这些数据,得到这些问题的答案:

  1. 换掉其中某几位员工(意味着裁员),应该裁掉谁?
  2. 从中选出某一位员工,对其它员工进行培训和销售技能分享。应该选谁分享,哪些人需要被培训?

分析指标

沿用上一节的2个重要指标:

  • 客单价:能反映每个顾客的质量,这其实与大环境因素(店铺位置,商品组合等)有关,也能反映销售能力。
  • 成交率:这就能直观反映销售员的能力

假设大环境元素相对固定的情况下,我们就可以使用以上指标分析销售员的水平

使用 pandas 能非常容易关联2个数据表,并且简单求出每个订单的总价:

通过汇总,得到最终指标维度数据:

  • 这与上一节 seaborn 篇没有多大区别

接下来将使用 altair 制作四象限图,顺带了解一下他有趣的图像语法。

一开始你会觉得使用 altair 需要比较多的代码,但实际上他非常灵活,只需要一点小技巧就能用任何我们喜欢的方式调用。


静态图

四象限图实际是散点图 + 线图(水平或垂直线),下面是上一节使用 seaborn 做的图。

而 altair 没有严格按图表类型进行区分,而是让你选择数据点的形状。

作图需要3个步骤:

  1. 确定数据源
  2. 把数据源中的字段与坐标系关联
  3. 选择数据的形状

现在按上述的步骤,选择一个店,做出散点图:

  • 行2:步骤1,确定数据源,使用 alt.Chart(数据源) ,能直接支持 pandas 的 DataFrame 。注意 Chart 是实例化,首字母要大写
  • 行3:步骤2,通过 encode 方法,设定坐标轴的字段。alt.X('客单价') 使得数据源中的 客单价 字段绑定在 x 轴上。同理绑定 y轴。同样,alt.X 与 Y 都是大写
  • 行4:步骤3,mark_point ,表示图表中的数据使用"点"这种形状显示

现在能得到一个散点图:

  • 实际形状点默认是空心圆圈,我们能通过简单改变最后的 mark_xxx 方法,即可修改每个数据点的形状

现在还需要线图:

  • 行2:数据源不用改
  • 行3:由于数据源是每个销售员的数据,而现在需要的是客单价的平均,因此在绑定 x 轴的时候,直接指定对客单价做平均操作
  • 行4:mark_rule 表示画一条线

现在只是画出客单价的平均线,同理得到成交率的平均线:

  • 行3:注意成交率是在 y 轴,因此使用 alt.Y

现在我们得到3个图表,只需要简单把它们叠加起来就可以:

  • 行19:只要简单把各个图表相加即可叠加

这么多的代码,这包有啥好用!?

细看上面的代码,我们发现3个图表很多定义部分是一模一样的。

这是理所当然的,因为这个图表制作流程就是基于很多共性的东西。

进一步简化即可:

  • 行1:数据源一致,直接定义数据源即可
  • 行3-6:使用定义的数据源做散点图
  • 行8:2个平均线图基于同样的数据源,同样的数据形状。直接定义一个 线图 表示
  • 行10-11:使用定义的线图,分别映射不同的指标即可

这样的作图形式非常灵活直观,比如,为图表的每个点加上标签:

  • 行13:数据标签,其实与散点图的唯一区别就是图形是文字,而非使用 "点形状"。因此,直接使用定义的 散点图 作为基础,通过 mark_text 修改数据形状。通过 encode,把字段 销售员 绑定到 图表的 text 属性上。
  • 其中通过 dy 参数,让显示的文本向上偏移10个像素
  • 注意,此时标签图的 encode 中的 x 轴 与 y 轴实际与 散点图一致(point)
  • 行15:把标签图叠加即可

到这里,我们只是在做静态图,其实 altair 真正厉害之处是动态图表,并且能做出图表之间的联动。




整体店铺销售水平可视化

为了方便后续的代码编写,把一些通用过程定义到函数中:

  • 这个完全可以作为不同项目的通用函数

现在用所有店铺的销售员指标,制作四象限图:

代码没啥好说的,如果此时我们打上标签,必然导致图表内容密密麻麻。

现在加个提示标签,当鼠标移到数据点上,显示该数据点的信息:

  • 行5:在 encode 中,设置 tooltip 参数,即可绑定需要显示的字段名字

如下是动图:

encode 方法中能让你把数据绑定在图表很多属性上,比如大小,颜色等等。

现在虽然通过提示标签能让用户选择性查看某个点的信息,但是在分析的时候,我们更多地希望以店铺为单位进行观察。

接下来,我们使用 altair 制作出 BI 软件常见的图表联动效果




不同维度的图表联动

现在希望同时展示两个图表,一个是之前制作的多店四象限图,另一个是不同店铺的销售额柱状图。

通过点击店铺销售额的柱状图,旁边的四象限图高亮显示该店的销售员数据点。效果如下:

接下来,我会把一些过程通过自定义函数包装。

与大多数 BI 软件可视化的逻辑一样,我们需要使用同一份数据源制作不同的图表。

因此,我们需要使用 altair 的数据转换功能对数据做汇总:

  • 行2-6:transform_aggregate ,聚合操作,相当于分组统计,其中参数 groupby 定义了按 销售员 与 店名 做分组
  • 行7-10:transform_calculate ,简单的计算操作。注意在引用字段时需要使用 "datum.字段名"。这里可以使用之前分组统计结果的字段

使用这个数据源做四象限图即可:

  • 由于数据源不再使用 pandas 的 DataFrame ,无法从中识别出数据类型,我们需要在绑定的时候,在字段后使用"冒号+类型"标记。
  • 比如"客单价:Q" ,Q 表示数据是连续型数据
  • '店名:N' ,N 常用于类别型数据

然后,使用"订单数据源(order_src)" 制作店铺销售额柱状图:

把2个图表并列放置,只需要使用 逻辑或运算符"|" 即可:

整体代码如下:

现在图表已经有了,但是缺少交互联动。在以上的代码上加上一些联动的定义,就可以做到。

首先,定义"鼠标点击行为":

  • 行5:alt.selection_single ,定义单选行为。
  • 其中参数 fields 指定选中的为字段"店名",这使得点击时让数据源只保留选中的店名的记录
  • 参数 on 表示单击行为
  • 行20:柱状图需要这个单选行为,通过 add_selection 方法,绑定这个行为即可

现在其实柱状图已经可以接受点击行为。但是实际点击时,是看不到任何的效果。

这是因为我们没有告诉他,筛选后的变化反映在哪个地方。

因此,需要把行为绑定到颜色上,再次修改代码:

  • 行7:alt.condition ,定义一个条件,第一参数传入 定义的行为
  • 第二个参数,被点击的柱子,该柱子颜色使用正常绑定店名时的颜色
  • 第三个参数,其余没有被点击的柱子,使用灰色

由于散点图与柱状图中的 encode 方法参数 color 均使用定义的条件 color ,所以当点击行为触发时,这些图表都能一同变化。

不过此时你会发现散点图的提示标签不再起作用,这是 vega lite 上的小 bug ,只需要在散点图上添加一个单选行为即可:

是不是觉得代码有点多了?我们仍然可以进一步封装。

甚至可以弄成一个 excel 的模板,只需要配置好各种设置,简单一句代码就能做出复杂的图表。这留在以后再介绍吧。


总结

altair 是一个非常有趣的可视化包,它基于 vega lite (这是一个大数据可视化工具) ,而 vega lite 底层是基于 d3.js(这是目前前端可视化的标杆)。

只要学会一定的套路,能非常简单灵活使用它做出各种复杂的图表

相关推荐

驱动网卡(怎么从新驱动网卡)
驱动网卡(怎么从新驱动网卡)

网卡一般是指为电脑主机提供有线无线网络功能的适配器。而网卡驱动指的就是电脑连接识别这些网卡型号的桥梁。网卡只有打上了网卡驱动才能正常使用。并不是说所有的网卡一插到电脑上面就能进行数据传输了,他都需要里面芯片组的驱动文件才能支持他进行数据传输...

2026-01-30 00:37 liuian

win10更新助手装系统(微软win10更新助手)

1、点击首页“系统升级”的按钮,给出弹框,告诉用户需要上传IMEI码才能使用升级服务。同时给出同意和取消按钮。华为手机助手2、点击同意,则进入到“系统升级”功能华为手机助手华为手机助手3、在检测界面,...

windows11专业版密钥最新(windows11专业版激活码永久)

 Windows11专业版的正版密钥,我们是对windows的激活所必备的工具。该密钥我们可以通过微软商城或者通过计算机的硬件供应商去购买获得。获得了windows11专业版的正版密钥后,我...

手机删过的软件恢复(手机删除过的软件怎么恢复)
手机删过的软件恢复(手机删除过的软件怎么恢复)

操作步骤:1、首先,我们需要先打开手机。然后在许多图标中找到带有[文件管理]文本的图标,然后单击“文件管理”进入页面。2、进入页面后,我们将在顶部看到一行文本:手机,最新信息,文档,视频,图片,音乐,收藏,最后是我们正在寻找的[更多],单击...

2026-01-29 23:55 liuian

一键ghost手动备份系统步骤(一键ghost 备份)

  步骤1、首先把装有一键GHOST装系统的U盘插在电脑上,然后打开电脑马上按F2或DEL键入BIOS界面,然后就选择BOOT打USDHDD模式选择好,然后按F10键保存,电脑就会马上重启。  步骤...

怎么创建局域网(怎么创建局域网打游戏)

  1、购买路由器一台。进入路由器把dhcp功能打开  2、购买一台交换机。从路由器lan端口拉出一条网线查到交换机的任意一个端口上。  3、两台以上电脑。从交换机任意端口拉出网线插到电脑上(电脑设置...

精灵驱动器官方下载(精灵驱动手机版下载)

是的。驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。1、全新驱动精灵2012引擎,大幅提升硬件和驱动辨识能力...

一键还原系统步骤(一键还原系统有哪些)

1、首先需要下载安装一下Windows一键还原程序,在安装程序窗口中,点击“下一步”,弹出“用户许可协议”窗口,选择“我同意该许可协议的条款”,并点击“下一步”。  2、在弹出的“准备安装”窗口中,可...

电脑加速器哪个好(电脑加速器哪款好)

我认为pp加速器最好用,飞速土豆太懒,急速酷六根本不工作。pp加速器什么网页都加速,太任劳任怨了!以上是个人观点,具体性能请自己试。ps:我家电脑性能很好。迅游加速盒子是可以加速电脑的。因为有过之...

任何u盘都可以做启动盘吗(u盘必须做成启动盘才能装系统吗)

是的,需要注意,U盘的大小要在4G以上,最好是8G以上,因为启动盘里面需要装系统,内存小的话,不能用来安装系统。内存卡或者U盘或者移动硬盘都可以用来做启动盘安装系统。普通的U盘就可以,不过最好U盘...

u盘怎么恢复文件(u盘文件恢复的方法)

开360安全卫士,点击上面的“功能大全”。点击文件恢复然后点击“数据”下的“文件恢复”功能。选择驱动接着选择需要恢复的驱动,选择接入的U盘。点击开始扫描选好就点击中间的“开始扫描”,开始扫描U盘数据。...

系统虚拟内存太低怎么办(系统虚拟内存占用过高什么原因)

1.检查系统虚拟内存使用情况,如果发现有大量的空闲内存,可以尝试释放一些不必要的进程,以释放内存空间。2.如果系统虚拟内存使用率较高,可以尝试增加系统虚拟内存的大小,以便更多的应用程序可以使用更多...

剪贴板权限设置方法(剪贴板访问权限)
剪贴板权限设置方法(剪贴板访问权限)

1、首先打开iphone手机,触碰并按住单词或图像直到显示选择选项。2、其次,然后选取“拷贝”或“剪贴板”。3、勾选需要的“权限”,最后选择开启,即可完成苹果剪贴板权限设置。仅参考1.打开苹果手机设置按钮,点击【通用】。2.点击【键盘】,再...

2026-01-29 21:37 liuian

平板系统重装大师(平板重装win系统)

如果你的平板开不了机,但可以连接上电脑,那就能好办,楼主下载安装个平板刷机王到你的个人电脑上,然后连接你的平板,平板刷机王会自动识别你的平板,平板刷机王上有你平板的我刷机包,楼主点击下载一个,下载完成...

联想官网售后服务网点(联想官网售后服务热线)

联想3c服务中心是联想旗下的官方售后,是基于互联网O2O模式开发的全新服务平台。可以为终端用户提供多品牌手机、电脑以及其他3C类产品的维修、保养和保险服务。根据客户需求层次,联想服务针对个人及家庭客户...