百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Python制作桑基图(我承认我低估了这个教程)

liuian 2025-05-05 17:00 11 浏览

一个有趣的灵魂W


首先,什么是桑基图

桑基图(Sankey),主要还是音译的结果。


这是一幅别人文章里的图,大致的意思就是左边和右边之间的联系,最大的作用就是看着舒服,至于看的清不清楚我是真不知道。

然后,网上常见教程

网上最常用的是一个国人开发的库(pyecharts),开发者原话:

Bash
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,
得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。
当数据分析遇上数据可视化时,pyecharts 诞生了。

我承认我低估了它。主要遇见的问题后述。以下是网上常见的安装方式(附带了一些问题的解决方法)

2、准备工作

由于当时尝试时,单一方式一直保存不了,所以干脆两种方式全部安装。结果能够正常保存了。

两种方法一起准备,就是下载selenium与phantomjs。

2.1、安装snapshot-selenium & seleniumpip install seleniumpip install snapshot-selenium

2.2、安装snapshot-phantomjs & phantomjspip installsnapshot-phantomjs

Bash
下载地址:http://phantomjs.org/download.html

添加路径:

找到phantomjs文件下的bin文件夹,将其路径设为系统path路径(添加系统路径,好处就不说了,就很爽就是啦):



3、报错3.1、下载chromedriver下载完成后运行时报错

:'chromedriver_X64.exe' executable needs to be in PATH
查询相关资料后发现需要下载chromedriver,chromedriver下载地址。
需要下载对应chrome版本的chromedriver,ChromeDriver与Chrome版本

对应参照表

。或者直接在下载页面中查看notes.txt查看对应的版本。

查看对应版本

3.2、配置环境变量

将chromedriver.exe拷贝至谷歌浏览器目录(如 C:\Program Files\Google\Chrome\Application)

以及python根目录(C:\Python3.7)。

将谷歌浏览器环境变量添加到path

(C:\Users\HD003\AppData\Local\Google\Chrome\Application)。

至此,就可以解决 ‘chromedriver’ executable needs to be in PATH问题了。

你以为这就结束了吗?并没有!!!

问题来了,我的chrome浏览器的版本是:版本 83.0.4103.97(正式版本) (64 位)


上面有个chromedriver.exe的下载(一个淘宝的镜像,淘宝是万能的么?):


它并没有我这个chrome的版本,所以它会持续报错(我保证我下载的是83.0.4103.XX版本的)!

我想可能是32位和64位的问题吧(存疑)。。。

你以为到这里就结束了吗?我换了一个做桑基图的库(pysankey)

安装方式是通过pip安装:

pip install pysankey

这个库用的matplotlib画图,应该比较好上手。好了,安装好后,


试一试他们的测试代码吧:


import pandas as pd
from pysankey import sankey

pd.options.display.max_rows = 8
df = pd.read_csv(
    'pysankey/fruits.txt', sep=' ', names=['true', 'predicted']
)
colorDict = {
    'apple':'#f71b1b',
    'blueberry':'#1b7ef7',
    'banana':'#f3f71b',
    'lime':'#12e23f',
    'orange':'#f78c1b'
}
sankey(
    df['true'], df['predicted'], aspect=20, colorDict=colorDict,
    fontsize=12, figureName="fruit123"
)

emmmm图不是很好看,看样子代码有优化空间啊。。。好了,拜拜。


测试数据我放在网盘了,需要的关注公众号:一个有趣的灵魂W


回复关键词:sankey

回复关键词:sankey

回复关键词:sankey


最后,图长这样:



微信号:一个有趣的灵魂W

关注我们,了解更多

相关推荐

【常识】如何优化Windows 7

优化Windows7可以让这个经典系统运行更流畅,特别是在老旧硬件上。以下是经过整理的实用优化方案,分为基础优化和进阶优化两部分:一、基础优化(适合所有用户)1.关闭不必要的视觉效果右键计算机...

系统优化!Windows 11/10 必做的十个优化配置

以下是为Windows10/11用户整理的10个必做优化配置,涵盖性能提升、隐私保护和系统精简等方面,操作安全且无需第三方工具:1.禁用不必要的开机启动项操作路径:`Ctrl+S...

最好用音频剪辑的软件,使用方法?

QVE音频剪辑是一款简单实用的软件,功能丰富,可编辑全格式音频。支持音频转换、合并、淡入淡出、变速、音量调节等,无时长限制,用户可自由剪辑。剪辑后文件音质无损,支持多格式转换,便于存储与跨设备播放,满...

Vue2 开发总踩坑?这 8 个实战技巧让代码秒变丝滑

前端开发的小伙伴们,在和Vue2打交道的日子里,是不是总被各种奇奇怪怪的问题搞得头大?数据不响应、组件传值混乱、页面加载慢……别慌!今天带来8个超实用的Vue2实战技巧,每一个都能直击痛...

Motion for Vue:为Vue量身定制的强大动画库

在前端开发中,动画效果是提升用户体验的重要手段。Vue生态系统中虽然有许多动画库,但真正能做到高性能、易用且功能丰富的并不多。今天,我们要介绍的是MotionforVue(motion-v),...

CSS view():JavaScript 滚动动画的终结

前言CSSview()方法可能会标志着JavaScript在制作滚动动画方面的衰落。如何用5行CSS代码取代50多行繁琐的JavaScript,彻底改变网页动画每次和UI/U...

「大数据」 hive入门

前言最近会介入数据中台项目,所以会推出一系列的跟大数据相关的组件博客与文档。Hive这个大数据组件自从Hadoop诞生之日起,便作为Hadoop生态体系(HDFS、MR/YARN、HIVE、HBASE...

青铜时代的终结:对奖牌架构的反思

作者|AdamBellemare译者|王强策划|Tina要点运维和分析用例无法可靠地访问相关、完整和可信赖的数据。需要一种新的数据处理方法。虽然多跳架构已经存在了几十年,并且可以对...

解析IBM SQL-on-Hadoop的优化思路

对于BigSQL的优化,您需要注意以下六个方面:1.平衡的物理设计在进行集群的物理设计需要考虑数据节点的配置要一致,避免某个数据节点性能短板而影响整体性能。而对于管理节点,它虽然不保存业务数据,但作...

交易型数据湖 - Apache Iceberg、Apache Hudi和Delta Lake的比较

图片由作者提供简介构建数据湖最重要的决定之一是选择数据的存储格式,因为它可以大大影响系统的性能、可用性和兼容性。通过仔细考虑数据存储的格式,我们可以增强数据湖的功能和性能。有几种不同的选择,每一种都有...

深入解析全新 AWS S3 Tables:重塑数据湖仓架构

在AWSre:Invent2024大会中,AWS发布了AmazonS3Tables:一项专为可扩展存储和管理结构化数据而设计的解决方案,基于ApacheIceberg开放表格...

Apache DataFusion查询引擎简介

简介DataFusion是一个查询引擎,其本身不具备存储数据的能力。正因为不依赖底层存储的格式,使其成为了一个灵活可扩展的查询引擎。它原生支持了查询CSV,Parquet,Avro,Json等存储格式...

大数据Hadoop之——Flink Table API 和 SQL(单机Kafka)

一、TableAPI和FlinkSQL是什么TableAPI和SQL集成在同一套API中。这套API的核心概念是Table,用作查询的输入和输出,这套API都是批处理和...

比较前 3 名Schema管理工具

关注留言点赞,带你了解最流行的软件开发知识与最新科技行业趋势。在本文中,读者将了解三种顶级schema管理工具,如AWSGlue、ConfluentSchemaRegistry和Memph...

大数据技术之Flume

第1章概述1.1Flume定义Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。1.2Flume的优点1.可以和...