百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

tidyverse使用推荐

liuian 2025-05-25 14:04 83 浏览

大家在获得了百迈客的分析报告后,需要筛选自己关注的相关结果。tidyverse包能够快速的帮助大家进行筛选。

tidyverse包中包含多种R包,如:ggplot、dplyr、readr、tidyr等。这些包使得日常的数据处理和绘图更加方便。

下面将介绍一些生信处理中实用的操作。

1、tidyverse包的安装

tips:可以设置一些镜像源,提高包的安装速度和成功率

options("repos" = c(CRAN="http://mirrors.cloud.tencent.com/CRAN/"))

options(BioC_mirror="http://mirrors.cloud.tencent.com/bioconductor")

install.packages("tidyverse")

2、快速筛选上下调基因

当获得了百迈客的差异分析结果,但是结果不理想时,需要自己调整差异筛选条件,

dplyr包能够方便操作。

dplyr包中常用的几个函数:

select:筛选相关的列

filter:筛选符合条件的行

mutate:在原有的数据上加一列

summarise:进行统计

group_by:对数据进行分组

rowwise:按行进行操作

利用filter可以在差异分析结果中快速筛选出显著差异的上下调基因。

读入数据:

> head(data)

# A tibble: 4 x 4

gene FDR P.Value logFC

<chr> <dbl> <dbl> <dbl>

1 gene1 0.02 0.006 0.3

2 gene2 0.003 0.005 0.7

3 gene3 0.002 0.0005 -0.48

4 gene4 0.301 0.13 -0.81

筛选上下调基因:

##筛选上调

gene_up <- data %>% filter(FDR<0.05 & logFC>0)

> gene_up

# A tibble: 2 x 4

gene FDR P.Value logFC

<chr> <dbl> <dbl> <dbl>

1 gene1 0.02 0.006 0.3

2 gene2 0.003 0.005 0.7


##筛选下调

gene_down <- data %>% filter(FDR<0.05 & logFC<0)

> gene_down

# A tibble: 1 x 4

gene FDR P.Value logFC

<chr> <dbl> <dbl> <dbl>

1 gene3 0.002 0.0005 -0.48

tips:%>%是管道符,作用和linux中的 | 一样。Rstudio中实用ctrl+shift+m能够快速输入。


筛选上下调基因并加上对应标签,使用mutate和case_when函数:

> data %>% mutate(class=case_when(

+ FDR<0.05&logFC>0~"up",

+ FDR<0.05&logFC<0~"down"

+ ))

# A tibble: 4 x 5

gene FDR P.Value logFC class

<chr> <dbl> <dbl> <dbl> <chr>

1 gene1 0.02 0.006 0.3 up

2 gene2 0.003 0.005 0.7 up

3 gene3 0.002 0.0005 -0.48 down

4 gene4 0.301 0.13 -0.81 NA

03

同名基因取均值或最大值

当拿到百迈客的基因表达谱之后,有时需要对同名基因进行处理。使用dplyr包中的group_by函数和acorss可以快速进行。

###数据

> gene_exp

# A tibble: 6 x 5

gene A B C D

<chr> <dbl> <dbl> <dbl> <dbl>

1 gene 1 1 2 3 4

2 gene 1 4 3 2 1

3 gene 2 2 3 4 5

4 gene 2 0 4 3 2

5 gene 2 3 2 4 2

6 gene 3 3 4 2 1

以均值作为表达值

> gene_exp %>% group_by(gene) %>% summarise(across(where(is.numeric),mean))

`summarise()` ungrouping output (override with `.groups` argument)

# A tibble: 3 x 5

gene A B C D

<chr> <dbl> <dbl> <dbl> <dbl>

1 gene 1 2.5 2.5 2.5 2.5

2 gene 2 1.67 3 3.67 3

3 gene 3 3 4 2 1


以最大值作为表达值

> gene_exp %>% group_by(gene) %>% summarise(across(A:D,max))

`summarise()` ungrouping output (override with `.groups` argument)

# A tibble: 3 x 5

gene A B C D

<chr> <dbl> <dbl> <dbl> <dbl>

1 gene 1 4 3 3 4

2 gene 2 3 4 4 5

3 gene 3 3 4 2 1


这边使用了across的两种方式筛选需要处理的列:

1. 使用数据类型,对所有满足要求的列进行处理,如:where(is.numeric),就是对所有的数字类型的列进行处理

2. 使用列名进行选择,对选择的列进行处理,如:A:D,就是对A到D列进行处理

04

按行对数据进行处理

计算每行的均值

> gene_exp %>% rowwise(gene) %>% mutate(avg=mean(c_across(is.numeric)))

# A tibble: 6 x 6

# Rowwise: gene

gene A B C D avg

<chr> <dbl> <dbl> <dbl> <dbl> <dbl>

1 gene 1 1 2 3 4 2.5

2 gene 1 4 3 2 1 2.5

3 gene 2 2 3 4 5 3.5

4 gene 2 0 4 3 2 2.25

5 gene 2 3 2 4 2 2.75

6 gene 3 3 4 2 1 2.5

利用rowwsie,可以将数据按行进行处理,默认是按列进行处理


5、提取通路中涉及的基因

百迈客的通路富集结果中包含许多信息,有时想快速了解相关通路涉及基因时。利用tidyr包中的函数能够方便清理数据,使得数据更加规整。其中separate_rows函数能够将某列中数据按字符分割成多行,利用这个函数能够快速提取富集到通路的相关基因。

> data

# A tibble: 1 x 2

GO Gene_ID

<chr> <chr>

1 Go1 Gene 1;Gene 2;Gene 3

> data %>% separate_rows(Gene_ID,sep=";")

# A tibble: 3 x 2

GO Gene_ID

<chr> <chr>

1 Go1 Gene 1

2 Go1 Gene 2

3 Go1 Gene 3


好了,今天tidyverse包的简单使用就介绍到这。如果你觉得上面的操作不能满足你的分析需要,你可以访问我们的百迈客云平台,上面有诸多工具,总有一款适合你
https://international.biocloud.net/zh/software/tools/list。

参考书籍:

1. Hadley Wickham: R for Data Science.

相关推荐

驱动网卡(怎么从新驱动网卡)
驱动网卡(怎么从新驱动网卡)

网卡一般是指为电脑主机提供有线无线网络功能的适配器。而网卡驱动指的就是电脑连接识别这些网卡型号的桥梁。网卡只有打上了网卡驱动才能正常使用。并不是说所有的网卡一插到电脑上面就能进行数据传输了,他都需要里面芯片组的驱动文件才能支持他进行数据传输...

2026-01-30 00:37 liuian

win10更新助手装系统(微软win10更新助手)

1、点击首页“系统升级”的按钮,给出弹框,告诉用户需要上传IMEI码才能使用升级服务。同时给出同意和取消按钮。华为手机助手2、点击同意,则进入到“系统升级”功能华为手机助手华为手机助手3、在检测界面,...

windows11专业版密钥最新(windows11专业版激活码永久)

 Windows11专业版的正版密钥,我们是对windows的激活所必备的工具。该密钥我们可以通过微软商城或者通过计算机的硬件供应商去购买获得。获得了windows11专业版的正版密钥后,我...

手机删过的软件恢复(手机删除过的软件怎么恢复)
手机删过的软件恢复(手机删除过的软件怎么恢复)

操作步骤:1、首先,我们需要先打开手机。然后在许多图标中找到带有[文件管理]文本的图标,然后单击“文件管理”进入页面。2、进入页面后,我们将在顶部看到一行文本:手机,最新信息,文档,视频,图片,音乐,收藏,最后是我们正在寻找的[更多],单击...

2026-01-29 23:55 liuian

一键ghost手动备份系统步骤(一键ghost 备份)

  步骤1、首先把装有一键GHOST装系统的U盘插在电脑上,然后打开电脑马上按F2或DEL键入BIOS界面,然后就选择BOOT打USDHDD模式选择好,然后按F10键保存,电脑就会马上重启。  步骤...

怎么创建局域网(怎么创建局域网打游戏)

  1、购买路由器一台。进入路由器把dhcp功能打开  2、购买一台交换机。从路由器lan端口拉出一条网线查到交换机的任意一个端口上。  3、两台以上电脑。从交换机任意端口拉出网线插到电脑上(电脑设置...

精灵驱动器官方下载(精灵驱动手机版下载)

是的。驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。1、全新驱动精灵2012引擎,大幅提升硬件和驱动辨识能力...

一键还原系统步骤(一键还原系统有哪些)

1、首先需要下载安装一下Windows一键还原程序,在安装程序窗口中,点击“下一步”,弹出“用户许可协议”窗口,选择“我同意该许可协议的条款”,并点击“下一步”。  2、在弹出的“准备安装”窗口中,可...

电脑加速器哪个好(电脑加速器哪款好)

我认为pp加速器最好用,飞速土豆太懒,急速酷六根本不工作。pp加速器什么网页都加速,太任劳任怨了!以上是个人观点,具体性能请自己试。ps:我家电脑性能很好。迅游加速盒子是可以加速电脑的。因为有过之...

任何u盘都可以做启动盘吗(u盘必须做成启动盘才能装系统吗)

是的,需要注意,U盘的大小要在4G以上,最好是8G以上,因为启动盘里面需要装系统,内存小的话,不能用来安装系统。内存卡或者U盘或者移动硬盘都可以用来做启动盘安装系统。普通的U盘就可以,不过最好U盘...

u盘怎么恢复文件(u盘文件恢复的方法)

开360安全卫士,点击上面的“功能大全”。点击文件恢复然后点击“数据”下的“文件恢复”功能。选择驱动接着选择需要恢复的驱动,选择接入的U盘。点击开始扫描选好就点击中间的“开始扫描”,开始扫描U盘数据。...

系统虚拟内存太低怎么办(系统虚拟内存占用过高什么原因)

1.检查系统虚拟内存使用情况,如果发现有大量的空闲内存,可以尝试释放一些不必要的进程,以释放内存空间。2.如果系统虚拟内存使用率较高,可以尝试增加系统虚拟内存的大小,以便更多的应用程序可以使用更多...

剪贴板权限设置方法(剪贴板访问权限)
剪贴板权限设置方法(剪贴板访问权限)

1、首先打开iphone手机,触碰并按住单词或图像直到显示选择选项。2、其次,然后选取“拷贝”或“剪贴板”。3、勾选需要的“权限”,最后选择开启,即可完成苹果剪贴板权限设置。仅参考1.打开苹果手机设置按钮,点击【通用】。2.点击【键盘】,再...

2026-01-29 21:37 liuian

平板系统重装大师(平板重装win系统)

如果你的平板开不了机,但可以连接上电脑,那就能好办,楼主下载安装个平板刷机王到你的个人电脑上,然后连接你的平板,平板刷机王会自动识别你的平板,平板刷机王上有你平板的我刷机包,楼主点击下载一个,下载完成...

联想官网售后服务网点(联想官网售后服务热线)

联想3c服务中心是联想旗下的官方售后,是基于互联网O2O模式开发的全新服务平台。可以为终端用户提供多品牌手机、电脑以及其他3C类产品的维修、保养和保险服务。根据客户需求层次,联想服务针对个人及家庭客户...