百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

15种Seaborn可视化图表详解 可视化图表的作用

liuian 2024-12-15 15:25 42 浏览

可视化是以图形形式表示数据或信息的过程,在本文中,将介绍Seaborn的最常用15个可视化图表。

Seaborn是一个非常好用的数据可视化库,它基于Matplotlib,并且提供了一个高级接口,使用非常见简单,生成图表也非常的漂亮。

安装

安装非常简单:

 pip install seaborn

在使用时只要导入就可以了。

 import seaborn as sns

将数据集下载到本地,下载地址:https://gitcode.com/mwaskom/seaborn-data/overview?utm_source=csdn_github_accelerator&isLogin=1,无法导入数据是因为,电脑无法访问该网址,此时可将数据下载到本地,使用本地导入。

解压到seaborn_data文件夹中

Seaborn提供了一些内置的数据集,这里我们使用Seaborn的Iris数据集。

 data = sns.load_dataset('iris', data_home='./seaborn-data/')
 data[10:15]
    sepal_length  sepal_width  petal_length  petal_width species
10           5.4          3.7           1.5          0.2  setosa
11           4.8          3.4           1.6          0.2  setosa
12           4.8          3.0           1.4          0.1  setosa
13           4.3          3.0           1.1          0.1  setosa
14           5.8          4.0           1.2          0.2  setosa

我们看看数据量

 data['species'].value_counts()
setosa        50
versicolor    50
virginica     50
Name: species, dtype: int64

1、条形图

条形图用于表示分类变量,它只显示平均值(或其他估计值)。我们为x轴选择一个分类列,为y轴(花瓣长度)选择一个数值列,我们看到它创建了一个为每个分类列取平均值的图。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.barplot(x='species', y='petal_length', hue='species', data=data)
plt.show()

2、散点图

散点图是由几个数据点组成的图。x轴表示花瓣长度,y轴表示数据集的萼片长度。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.scatterplot(x='petal_length', y='sepal_length', hue='species', style='species', s=90, data=data)
plt.show()

3、直方图

直方图通常用于可视化单个变量的分布,但它们也可用于比较两个或更多变量的分布。除了直方图之外,KDE参数还可以用来显示核密度估计(KDE)。这里,我们使用萼片长度。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.histplot(x='sepal_length', kde=True, data=data)
plt.show()
import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.histplot(x='sepal_length', kde=True, hue='species', data=data)
plt.show()

4、线形图

线形图可以用来可视化各种不同的关系。它们易于创建和分析,在线形图中每个数据点由直线连接。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.lineplot(x='petal_length', y='petal_width', data=data)
plt.show()

5、小提琴图

小提琴图可以表示数据的密度,数据的密度越大的区域越胖。“小提琴”形状表示数据的核密度估计,每个点的形状宽度表示该点的数据密度。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.violinplot(x='species',y='petal_length',data=data,hue='species')
plt.show()

6、箱线图

箱形图由一个箱形图和两个须状图组成。它表示四分位数范围(IQR),即第一和第三四分位数之间的范围。中位数由框内的直线表示。须状图从盒边缘延伸到最小值和最大值的1.5倍IQR。异常值是落在此范围之外的任何数据点,并会单独显示出来。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.boxplot(x='species', y='sepal_length', data=data, hue='species')
plt.show()

7、热图

热图是数据的二维可视化表示,它使用颜色来显示变量的值。热图经常用于显示数据集中的各种因素如何相互关联,比如相关系数。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
heat_corr = data.corr()
sns.heatmap(heat_corr, annot=True)
plt.show()

8、点图

点图是一种统计图表,用于显示一组数据及其变异性的平均值或集中趋势。点图通常用于探索性数据分析,可以快速可视化数据集的分布或比较多个数据集。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.pointplot(x='species', y='petal_length', data=data, markers='^', color='g')
plt.show()

9、密度图

密度图通过估计连续随机变量的概率函数来表示数据集的分布,也称为核密度估计(KDE)图。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.kdeplot(x='petal_length', data=data, hue='species', multiple='stack')
plt.show()
import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.kdeplot(x='petal_length', y='sepal_length', data=data, hue='species')
plt.show()

10、计数图

计数图是一种分类图,它显示了分类变量的每个类别中观测值的计数。它本质上是一个柱状图,其中每个柱的高度代表特定类别的观测值的数量。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.countplot(x='species', data=data)
plt.show()

11、分簇散点图

分簇散点图与条形图相似,但是它会修改一些点以防止重叠,这有助于更好地表示值的分布。在该图中,每个数据点表示为一个点,并且这些点的排列使得它们在分类轴上不会相互重叠。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.swarmplot(x='sepal_width', y='species', data=data, hue='species', dodge=True, orient='h', size=8)
plt.show()

12、配对图

配对图可视化了数据集中几个变量之间的成对关系。它创建了一个坐标轴网格,这样所有数值数据点将在彼此之间创建一个图,在x轴上具有单列,y轴上具有单行。对角线图是单变量分布图,它绘制了每列数据的边际分布。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.set(rc={"figure.figsize": (6, 3)})
sns.pairplot(data=data, hue='species')
plt.show()

13、Facet Grid

Seaborn中的FacetGrid函数将数据集和一个或多个分类变量作为输入,并创建一个图表网格,每种类别变量的组合都有一个图表。网格中的每个图都可以定制为不同类型的图,例如散点图、直方图或箱形图。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
g = sns.FacetGrid(data, col="species", height=4, hue='species')
g.map(sns.histplot, "petal_length")
plt.show()

14、联合分布图

联合分布图将两个不同的图组合在一个表示中,可以展示两个变量之间的关系(二元关系)。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.jointplot(x="sepal_length", y="sepal_width", data=data,
              palette='Set2', hue='species')
plt.show()

15、分类图

cat图(分类图的缩写)是Seaborn中的定制的一种图,它可以可视化数据集中一个或多个分类变量与连续变量之间的关系。它可用于显示分布、比较组或显示不同变量之间的关系。

import seaborn as sns
import matplotlib.pyplot as plt

data = sns.load_dataset('iris', data_home='./seaborn-data/')
sns.catplot(data=data, x="petal_length", y="species", kind="violin", color=".9", inner=None)
sns.swarmplot(data=data, x="petal_length", y="species", size=3)
plt.show()

总结

Seaborn对于任何使用Python处理数据的人来说都是一个非常好用的工具,它易于使用,并且提供更美观的图形使其成为探索和交流数据最佳选择。它与其他Python数据分析库(如Pandas)的集成使其成为数据探索和可视化的强大工具。

相关推荐

教你把多个视频合并成一个视频的方法

一.情况介绍当你有一个m3u8文件和一个目录,目录中有连续的视频片段,这些片段可以连成一段完整的视频。m3u8文件打开后像这样:m3u8文件,可以理解为播放列表,里面是播放视频片段的顺序。视频片段像这...

零代码编程:用kimichat合并一个文件夹下的多个文件

一个文件夹里面有很多个srt字幕文件,如何借助kimichat来自动批量合并呢?在kimichat对话框中输入提示词:你是一个Python编程专家,完成如下的编程任务:这个文件夹:D:\downloa...

Java APT_java APT 生成代码

JavaAPT(AnnotationProcessingTool)是一种在Java编译阶段处理注解的工具。APT会在编译阶段扫描源代码中的注解,并根据这些注解生成代码、资源文件或其他输出,...

Unit Runtime:一键运行 AI 生成的代码,或许将成为你的复制 + 粘贴神器

在我们构建了UnitMesh架构之后,以及对应的demo之后,便着手于实现UnitMesh架构。于是,我们就继续开始UnitRuntime,以用于直接运行AI生成的代码。PS:...

挣脱臃肿的枷锁:为什么说Vert.x是Java开发者手中的一柄利剑?

如果你是一名Java开发者,那么你的职业生涯几乎无法避开Spring。它如同一位德高望重的老国王,统治着企业级应用开发的大片疆土。SpringBoot的约定大于配置、SpringCloud的微服务...

五年后,谷歌还在全力以赴发展 Kotlin

作者|FredericLardinois译者|Sambodhi策划|Tina自2017年谷歌I/O全球开发者大会上,谷歌首次宣布将Kotlin(JetBrains开发的Ja...

kotlin和java开发哪个好,优缺点对比

Kotlin和Java都是常见的编程语言,它们有各自的优缺点。Kotlin的优点:简洁:Kotlin程序相对于Java程序更简洁,可以减少代码量。安全:Kotlin在类型系统和空值安全...

移动端架构模式全景解析:从MVC到MVVM,如何选择最佳设计方案?

掌握不同架构模式的精髓,是构建可维护、可测试且高效移动应用的关键。在移动应用开发中,选择合适的软件架构模式对项目的可维护性、可测试性和团队协作效率至关重要。随着应用复杂度的增加,一个良好的架构能够帮助...

颜值非常高的XShell替代工具Termora,不一样的使用体验!

Termora是一款面向开发者和运维人员的跨平台SSH终端与文件管理工具,支持Windows、macOS及Linux系统,通过一体化界面简化远程服务器管理流程。其核心定位是解决多平台环境下远程连接、文...

预处理的底层原理和预处理编译运行异常的解决方案

若文章对您有帮助,欢迎关注程序员小迷。助您在编程路上越走越好![Mac-10.7.1LionIntel-based]Q:预处理到底干了什么事情?A:预处理,顾名思义,预先做的处理。源代码中...

为“架构”再建个模:如何用代码描述软件架构?

在架构治理平台ArchGuard中,为了实现对架构的治理,我们需要代码+模型描述所要处理的内容和数据。所以,在ArchGuard中,我们有了代码的模型、依赖的模型、变更的模型等,剩下的两个...

深度解析:Google Gemma 3n —— 移动优先的轻量多模态大模型

2025年6月,Google正式发布了Gemma3n,这是一款能够在2GB内存环境下运行的轻量级多模态大模型。它延续了Gemma家族的开源基因,同时在架构设计上大幅优化,目标是让...

比分网开发技术栈与功能详解_比分网有哪些

一、核心功能模块一个基本的比分网通常包含以下模块:首页/总览实时比分看板:滚动展示所有正在进行的比赛,包含比分、比赛时间、红黄牌等关键信息。热门赛事/焦点战:突出显示重要的、关注度高的比赛。赛事导航...

设计模式之-生成器_一键生成设计

一、【概念定义】——“分步构建复杂对象,隐藏创建细节”生成器模式(BuilderPattern):一种“分步构建型”创建型设计模式,它将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建...

构建第一个 Kotlin Android 应用_kotlin简介

第一步:安装AndroidStudio(推荐IDE)AndroidStudio是官方推荐的Android开发集成开发环境(IDE),内置对Kotlin的完整支持。1.下载And...