百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

数据筛选之 select_dtypes()

liuian 2025-03-11 18:02 14 浏览

数据筛选之 select_dtypes()

data.select_dtypes(include=['int64', 'float64']) 是 Pandas 中用于筛选特定数据类型列的方法。它会返回一个只包含指定数据类型的列的新 DataFrame。以下是对该方法的详细说明和示例:


功能

  • select_dtypes():用于根据数据类型筛选 DataFrame 的列。
  • include 参数:指定要包含的数据类型(可以是单个类型或类型列表)。
  • exclude 参数:指定要排除的数据类型(可以是单个类型或类型列表)。

示例

假设我们有一个包含多种数据类型的 DataFrame

import pandas as pd

data = pd.DataFrame({
    'A': [1, 2, 3],               # int64
    'B': [1.1, 2.2, 3.3],         # float64
    'C': ['foo', 'bar', 'baz'],   # object (字符串)
    'D': [True, False, True]      # bool
})

print(data)
# 输出:
#    A    B    C      D
# 0  1  1.1  foo   True
# 1  2  2.2  bar  False
# 2  3  3.3  baz   True

筛选数值列(int64 和 float64)

numeric_data = data.select_dtypes(include=['int64', 'float64'])
print(numeric_data)
# 输出:
#    A    B
# 0  1  1.1
# 1  2  2.2
# 2  3  3.3

筛选非数值列(排除 int64 和 float64)

non_numeric_data = data.select_dtypes(exclude=['int64', 'float64'])
print(non_numeric_data)
# 输出:
#      C      D
# 0  foo   True
# 1  bar  False
# 2  baz   True

参数说明

  • include :指定要包含的数据类型。可以是以下形式:
  • 单个类型(如 include='int64')。
  • 类型列表(如 include=['int64', 'float64'])。
  • 类型类别(如 include=['number'],表示所有数值类型)。
  • exclude:指定要排除的数据类型。用法与 include 相同。

常用数据类型

  • 数值类型:
  • int64:64 位整数。
  • float64:64 位浮点数。
  • number:所有数值类型(包括 intfloat)。
  • 其他类型:
  • object:字符串或混合类型。
  • bool:布尔值。
  • datetime64:日期时间。
  • category:分类类型。

高级用法

筛选所有数值类型

numeric_data = data.select_dtypes(include='number')
print(numeric_data)
# 输出:
#    A    B
# 0  1  1.1
# 1  2  2.2
# 2  3  3.3

筛选非数值类型

non_numeric_data = data.select_dtypes(exclude='number')
print(non_numeric_data)
# 输出:
#      C      D
# 0  foo   True
# 1  bar  False
# 2  baz   True

总结

data.select_dtypes(include=['int64', 'float64']) 是一个非常实用的方法,可以快速筛选出 DataFrame 中指定数据类型的列。它特别适用于数据预处理和特征工程中,当你需要分离数值型数据和非数值型数据时。

相关推荐

使用Assembly打包和部署Spring Boot工程

SpringBoot项目的2种部署方式目前来说,SpringBoot项目有如下2种常见的部署方式一种是使用docker容器去部署。将SpringBoot的应用构建成一个docke...

java高级用法之:调用本地方法的利器JNA

简介JAVA是可以调用本地方法的,官方提供的调用方式叫做JNI,全称叫做javanativeinterface。要想使用JNI,我们需要在JAVA代码中定义native方法,然后通过javah命令...

Linux中如何通过Shell脚本来控制Spring Boot的Jar包启停服务?

SpringBoot项目在为开发者带来方便的同时,也带来了一个新的问题就是Jar包如何启动?在一般情况下我们都是采用了最为经典的java-jar命令来进行启动。然后通过ps命令找到对应的应用线程通...

牛逼!自己手写一个热加载(人民币手写符号一个横还是两个横)

热加载:在不停止程序运行的情况下,对类(对象)的动态替换JavaClassLoader简述Java中的类从被加载到内存中到卸载出内存为止,一共经历了七个阶段:加载、验证、准备、解析、初始化、使用、...

java 错误: 找不到或无法加载主类?看看怎么解决吧!

问题扫述:项目名称调整,由原来的com.mp.qms.report.biz调整为com.mp.busicen.mec.qms.report.biz后。项目在IDEA直接运行,但打包部署到服务器...

如何将 Spring Boot 工程打包成独立的可执行 JAR 包

导语:通过将SpringBoot项目打包成独立的可执行JAR包,可以方便地在任何支持Java环境的机器上运行项目。本文将详细介绍如何通过Maven构建插件将SpringBoot...

class 增量发包改造为 jar 包方式发布

大纲class增量发包介绍项目目录结构介绍jar包方式发布落地方案class增量发包介绍当前项目的迭代修复都是通过class增量包来发版本的将改动的代码class增量打包,如下图cla...

Jar启动和IDE里启动Sprintboot的区别

想聊明白这个问题,需要补充一些前提条件,比如Fatjar、类加载机制等1、Fatjar我们在开发业务程序的时候,经常需要引用第三方的jar包,最终程序开发完成之后,通过打包程序,会把自己的代码和三...

Java 20年,以后将往哪儿走?(java还能流行多久)

在今年的Java20周年的庆祝大会中,JavaOne2015的中心议题是“Java的20年”。甲骨文公司Java平台软件开发部的副总裁GeorgesSaab的主题演讲就将关注点放在了java...

Spring Boot Jar 包秒变 Docker 镜像实现多环境部署

你是否在互联网大厂后端开发工作中,遇到过这样的困扰?当完成一个SpringBoot项目开发,准备将Jar包部署到不同环境时,却发现各个环境依赖不同、配置复杂,部署过程繁琐又容易出错,不仅耗费...

从0开始,让你的Spring Boot项目跑在Linux服务器

1搭建Linux服务器1.1购买阿里云服务器或安装虚拟机这里建议是CentOS7.X或CentOS8.X,当然其他的Linux如deepin、Ubuntu也可以,只是软件环境的安装包和安装方式...

【技术】Maven 上传第三方jar包到私服

通过nexus后台上传私服以NexusRepositoryManagerOSS2.14.5-02为例。登录nexus后台。定义Maven坐标Maven坐标有两种方式:1.自定义参数;2....

JVM参数、main方法的args参数使用

一、前言我们知道JVM参数分为自定义参数、JVM系统参数,Javamain方法的参数。今天就谈谈怎么使用吧。二、查看jvm参数定义自定义参数我们打开cmd窗口,输入java,就能看到自定义参数的格式...

Maven项目如何发布jar包到Nexus私服

Maven项目发布jar包到Nexus私服在编码过程中,有些通用的代码模块,有时候我们不想通过复制粘贴来粗暴地复用。因为这样不仅体现不了变化,也不利于统一管理。这里我们使用mavendeploy的方...

干货丨Hadoop安装步骤!详解各目录内容及作用

Hadoop是Apache基金会面向全球开源的产品之一,任何用户都可以从ApacheHadoop官网下载使用。今天,播妞将以编写时较为稳定的Hadoop2.7.4版本为例,详细讲解Hadoop的安...