15种Seaborn可视化图表详解 可视化图表的作用
liuian 2024-12-15 15:25 30 浏览
可视化是以图形形式表示数据或信息的过程,在本文中,将介绍Seaborn的最常用15个可视化图表。
Seaborn是一个非常好用的数据可视化库,它基于Matplotlib,并且提供了一个高级接口,使用非常见简单,生成图表也非常的漂亮。
安装
安装非常简单:
pip install seaborn
在使用时只要导入就可以了。
import seaborn as sns
将数据集下载到本地,下载地址:https://gitcode.com/mwaskom/seaborn-data/overview?utm_source=csdn_github_accelerator&isLogin=1,无法导入数据是因为,电脑无法访问该网址,此时可将数据下载到本地,使用本地导入。
解压到seaborn_data文件夹中
Seaborn提供了一些内置的数据集,这里我们使用Seaborn的Iris数据集。
data = sns.load_dataset('iris', data_home='./seaborn-data/')
data[10:15]
sepal_length sepal_width petal_length petal_width species
10 5.4 3.7 1.5 0.2 setosa
11 4.8 3.4 1.6 0.2 setosa
12 4.8 3.0 1.4 0.1 setosa
13 4.3 3.0 1.1 0.1 setosa
14 5.8 4.0 1.2 0.2 setosa
我们看看数据量
data['species'].value_counts()
setosa 50
versicolor 50
virginica 50
Name: species, dtype: int64
1、条形图
条形图用于表示分类变量,它只显示平均值(或其他估计值)。我们为x轴选择一个分类列,为y轴(花瓣长度)选择一个数值列,我们看到它创建了一个为每个分类列取平均值的图。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.barplot(x='species', y='petal_length', hue='species', data=data)
plt.show()
2、散点图
散点图是由几个数据点组成的图。x轴表示花瓣长度,y轴表示数据集的萼片长度。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.scatterplot(x='petal_length', y='sepal_length', hue='species', style='species', s=90, data=data)
plt.show()
3、直方图
直方图通常用于可视化单个变量的分布,但它们也可用于比较两个或更多变量的分布。除了直方图之外,KDE参数还可以用来显示核密度估计(KDE)。这里,我们使用萼片长度。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.histplot(x='sepal_length', kde=True, data=data)
plt.show()
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.histplot(x='sepal_length', kde=True, hue='species', data=data)
plt.show()
4、线形图
线形图可以用来可视化各种不同的关系。它们易于创建和分析,在线形图中每个数据点由直线连接。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.lineplot(x='petal_length', y='petal_width', data=data)
plt.show()
5、小提琴图
小提琴图可以表示数据的密度,数据的密度越大的区域越胖。“小提琴”形状表示数据的核密度估计,每个点的形状宽度表示该点的数据密度。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.violinplot(x='species',y='petal_length',data=data,hue='species')
plt.show()
6、箱线图
箱形图由一个箱形图和两个须状图组成。它表示四分位数范围(IQR),即第一和第三四分位数之间的范围。中位数由框内的直线表示。须状图从盒边缘延伸到最小值和最大值的1.5倍IQR。异常值是落在此范围之外的任何数据点,并会单独显示出来。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.boxplot(x='species', y='sepal_length', data=data, hue='species')
plt.show()
7、热图
热图是数据的二维可视化表示,它使用颜色来显示变量的值。热图经常用于显示数据集中的各种因素如何相互关联,比如相关系数。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
heat_corr = data.corr()
sns.heatmap(heat_corr, annot=True)
plt.show()
8、点图
点图是一种统计图表,用于显示一组数据及其变异性的平均值或集中趋势。点图通常用于探索性数据分析,可以快速可视化数据集的分布或比较多个数据集。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.pointplot(x='species', y='petal_length', data=data, markers='^', color='g')
plt.show()
9、密度图
密度图通过估计连续随机变量的概率函数来表示数据集的分布,也称为核密度估计(KDE)图。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.kdeplot(x='petal_length', data=data, hue='species', multiple='stack')
plt.show()
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.kdeplot(x='petal_length', y='sepal_length', data=data, hue='species')
plt.show()
10、计数图
计数图是一种分类图,它显示了分类变量的每个类别中观测值的计数。它本质上是一个柱状图,其中每个柱的高度代表特定类别的观测值的数量。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.countplot(x='species', data=data)
plt.show()
11、分簇散点图
分簇散点图与条形图相似,但是它会修改一些点以防止重叠,这有助于更好地表示值的分布。在该图中,每个数据点表示为一个点,并且这些点的排列使得它们在分类轴上不会相互重叠。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.swarmplot(x='sepal_width', y='species', data=data, hue='species', dodge=True, orient='h', size=8)
plt.show()
12、配对图
配对图可视化了数据集中几个变量之间的成对关系。它创建了一个坐标轴网格,这样所有数值数据点将在彼此之间创建一个图,在x轴上具有单列,y轴上具有单行。对角线图是单变量分布图,它绘制了每列数据的边际分布。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.set(rc={"figure.figsize": (6, 3)})
sns.pairplot(data=data, hue='species')
plt.show()
13、Facet Grid
Seaborn中的FacetGrid函数将数据集和一个或多个分类变量作为输入,并创建一个图表网格,每种类别变量的组合都有一个图表。网格中的每个图都可以定制为不同类型的图,例如散点图、直方图或箱形图。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
g = sns.FacetGrid(data, col="species", height=4, hue='species')
g.map(sns.histplot, "petal_length")
plt.show()
14、联合分布图
联合分布图将两个不同的图组合在一个表示中,可以展示两个变量之间的关系(二元关系)。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.jointplot(x="sepal_length", y="sepal_width", data=data,
palette='Set2', hue='species')
plt.show()
15、分类图
cat图(分类图的缩写)是Seaborn中的定制的一种图,它可以可视化数据集中一个或多个分类变量与连续变量之间的关系。它可用于显示分布、比较组或显示不同变量之间的关系。
import seaborn as sns
import matplotlib.pyplot as plt
data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.catplot(data=data, x="petal_length", y="species", kind="violin", color=".9", inner=None)
sns.swarmplot(data=data, x="petal_length", y="species", size=3)
plt.show()
总结
Seaborn对于任何使用Python处理数据的人来说都是一个非常好用的工具,它易于使用,并且提供更美观的图形使其成为探索和交流数据最佳选择。它与其他Python数据分析库(如Pandas)的集成使其成为数据探索和可视化的强大工具。
相关推荐
- 软件测试/测试开发丨Pytest 自动化测试框架(五)
-
公众号搜索:TestingStudio霍格沃兹测试开发的干货都很硬核测试报告在项目中是至关重要的角色,一个好的测试报告:可以体现测试人员的工作量;开发人员可以从测试报告中了解缺陷的情况;测试经理可以...
- python爬虫实战之Headers信息校验-Cookie
-
一、什么是cookie上期我们了解了User-Agent,这期我们来看下如何利用Cookie进行用户模拟登录从而进行网站数据的爬取。首先让我们来了解下什么是Cookie:Cookie指某些网站为了辨别...
- 软件测试 | 结合Allure生成测试报告
-
简介测试报告在项目至关重要,测试人员可以在测试报告中体现自己的工作量,开发人员可以从测试报告中了解缺陷的情况,测试经理可以从测试报告中看到测试人员的执行情况及测试用例的覆盖率,项目负责人可以通过测...
- 使用FUSE挖掘文件上传漏洞(文件上传漏洞工具)
-
关于FUSEFUSE是一款功能强大的渗透测试安全工具,可以帮助广大研究人员在最短的时间内迅速寻找出目标软件系统中存在的文件上传漏洞。FUSE本质上是一个渗透测试系统,主要功能就是识别无限制可执行文件上...
- 第42天,我终于意识到,爬虫这条路,真的好艰难
-
昨天说到学爬虫的最初四行代码,第四行中的print(res.text),我没太懂。为啥最后的输出的结果,不是显示百度网页全部的源代码呢?这个世界上永远不缺好心人。评论区的大神告诉我:因为只包含静态h...
- 详解Pytest单元测试框架,轻松搞定自动化测试实战
-
pytest是目前企业里面使用最多、最流行的Python的单元测试框架,那我们今天就使用这个框架来完成一个网易163邮箱登录的自动化实战案例。下面我们先把我们案例需要的工具进行相关的介绍:01pyt...
- 干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
-
/1前言/有爬虫经验的各位小伙伴都知道,正常我们需要登录才能获取信息的网站,是比较难爬的。原因就是在于,现在各大网站为了反爬,与爬虫机制斗智斗勇,一般的都加入了图片验证码、滑动验证码之类的干扰,让...
- Python 爬虫-如何抓取需要登录的网页
-
本文是Python爬虫系列第四篇,前三篇快速入口:Python爬虫-开启数据世界的钥匙Python爬虫-HTTP协议和网页基础Python爬虫-使用requests和B...
- 使用Selenium实现微博爬虫:预登录、展开全文、翻页
-
前言想实现爬微博的自由吗?这里可以实现了!本文可以解决微博预登录、识别“展开全文”并爬取完整数据、翻页设置等问题。一、区分动态爬虫和静态爬虫1、静态网页静态网页是纯粹的HTML,没有后台数据库,不含程...
- 从零开始学Python——使用Selenium抓取动态网页数据
-
1.selenium抓取动态网页数据基础介绍1.1什么是AJAX AJAX(AsynchronouseJavaScriptAndXML:异步JavaScript和XML)通过在后台与服务器进...
- PHP自动测试框架Top 10(php单元测试工具)
-
对于很多PHP开发新手来说,测试自己编写的代码是一个非常棘手的问题。如果出现问题,他们将不知道下一步该怎么做。花费很长的时间调试PHP代码是一个非常不明智的选择,最好的方法就是在编写应用程序代码之前就...
- 10款最佳PHP自动化测试框架(php 自动化测试)
-
为什么测试如此重要?PHP开发新手往往不会测试自己编写的代码,我们中的大多数通过不断测试我们刚刚所编写浏览器窗口的新特性和功能来进行检测,但是当事情出现错误的时候我们往往不知道应该做些什么。为我们的代...
- 自动化运维:Selenium 测试(seleniumbase搭建自动化测试平台)
-
本文将以Buddy中的Selenium测试流水线示例,来看看自动化测试就是如此简单易用!Selenium是一套用于浏览器测试自动化的工具。使用Buddy专有服务,您可以直接在Buddy中运行Selen...
- Selenium自动化测试(selenium自动化测试工具)
-
Selenium是一系列基于web的自动化测试工具。它提供了一系列测试函数,用于支持Web自动化测试。这些函数非常灵活,它们能够通过多种方式定位界面元素,并可以将预期结果与系统实际表现进行比较。作为一...
- 技术分享 | Web自动化之Selenium安装
-
本文节选自霍格沃兹测试开发学社内部教材Web应用程序的验收测试常常涉及一些手工任务,例如打开一个浏览器,并执行一个测试用例中所描述的操作。但是手工执行的任务容易出现人为的错误,也比较费时间。因此,将...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
系统C盘清理:微信PC端文件清理,扩大C盘可用空间步骤
-
10款高性能NAS丨双十一必看,轻松搞定虚拟机、Docker、软路由
-
python使用fitz模块提取pdf中的图片
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- vscode切换git分支 (35)
- python bytes转16进制 (35)
- grep前后几行 (34)
- hashmap转list (35)