百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

基因型数据绘制PCA图和聚类分析图

liuian 2025-05-25 14:04 56 浏览

用PCA做为GWAS的协变量,相当于将品种结构考虑进去。它类似将不同品种作为协变量,或者将群体结构矩阵Q作为协变量。


下面看一下利用基因型SNP数据进行PCA计算,以及可视化的分析。



很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。


绘制后的图如下:


2-D PCA图:

图片解释,将每个品种用不同的颜色表示,同时绘制置信区间圆圈,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。


3-D PCA图:

图片解释,将每个品种用不同的颜色表示,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异,Z坐标是PC3,解释1.02%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。


基因型数据:


共有3个品种A,B,C,共有412个个体。其中:

  • A品种有200个体

  • B品种有100个体

  • C品种有112个体

$ wc -l re2.ped412 re2.ped

SNP个数为:41013

$ wc -l re2.map41013 re2.map


计算思路:


1,对数据进行清洗,将其转化为0,1,2的形式

2,计算G矩阵

3,计算PCA的特征向量和特征值

4,根据特征值计算解释百分比

5,根据特征向量和品种标签,进行PCA的绘制


绘制代码如下:


首先,使用plink命令,将基因型数据转化为012的raw格式:

plink --file re2 --recodeA

结果生成plink.raw文件。


然后使用R语言,计算PCA,并绘制PCA图。

读取数据m012 = fread("plink.raw")
# 保留FID,IID和基因型数据g012 = m012[,-c(3:6)]dim(g012)fid = g012$FIDiid = g012$IIDlibrary(sommer)
# 整理格式,计算G矩阵setDF(g012)rownames(g012) = g012$IIDg012$IID = g012$FID = Gmat = A.mat(g012-1)
# 计算特征值和特征向量re = eigen(Gmat)
# 计算解释百分比por = re$values/sum(re$values)
# 整理格式pca_re1 = re$vectors[,1:3]pca_re2 = data.frame(pca_re1,Ind = iid)pca_re2$Gen = fid
# 把PCA1,PC2,PC2的j解释百分比,命名为相应的轴xlab = paste0("PC1(",round(por[1]*100,2),"%)")ylab = paste0("PC2(",round(por[2]*100,2),"%)")zlab = paste0("PC3(",round(por[3]*100,2),"%)")
# 绘制2-D PCA图ggplot(pca_re2, aes(x=X1, y=X2,color=Gen)) + geom_point(size=2) + # stat_ellipse(level = 0.95, size = 1) + stat_ellipse(aes(fill=Gen), type ="norm", geom ="polygon",alpha=0.2,color=NA)+ geom_hline(yintercept = 0) + # 添加x坐标 geom_vline(xintercept = 0) + # 添加y坐标 labs(x = xlab,y = ylab,color="")+ guides(fill=F)+ theme_bw() # 主题
# 绘制3-D PCA图library(scatterplot3d)pca_re2 = pca_re2 %>% mutate(colour = case_when( Gen == "A" ~ "red", Gen == "B" ~ "green", Gen == "C" ~ "blue",))
scatterplot3d(pca_re2[,1:3],color=pca_re2$colour, pch = 16,angle=30, box=T,type="p", xlab = xlab, ylab = ylab, zlab = zlab,main = "3D PCA Plot", lty.hide=2,lty.grid = 2)
legend("topright",c("A","B","C"),fill=c('red','green',"blue"))


聚类分析思路:


1,计算个体的亲缘关系矩阵G矩阵

2,因为数据太多,随机选择100个,用于聚类


n = sample(1:384,100)Gmat1 = Gmat[n,n]library(ggtree)library(amap)clu <- hclusterpar(Gmat1)


默认的作图,太挤。

ggtree(clu)+geom_tiplab2(offset=0.3)

画圈图:
ggtree(clu,layout = "circular")+geom_tiplab2(offset=0.1)

可以看到,A,B,C三个品种,可以分开,分得很开。

如果进行GWAS分析,PCA加进去就很有必要!

相关推荐

外接键盘按键错乱怎么恢复(外接键盘键位失灵)

1、首先,依次点击开始菜单-->搜索“设备管理器”,然后单击右侧的“打开”选项。2、其次,完成上述步骤后,系统将打开“设备管理器”窗口。3、接着,完成上述步骤后,展开键盘,右键单击,选择“更新驱...

最好的在线影视免费(哪个网站能看到免费的电视剧)

在线网站看电影不卡顿1.欧西电影它是一个很好用的追剧网站,里面都是一些高清免费的电影,但是只能在线观看,不能够去下载,不过它还支持手机观看哦,非常的方便,只要网络好就没问题了。2.思古影视这是一个可以...

解除安全模式dnf(解除安全模式怎么解除)
  • 解除安全模式dnf(解除安全模式怎么解除)
  • 解除安全模式dnf(解除安全模式怎么解除)
  • 解除安全模式dnf(解除安全模式怎么解除)
  • 解除安全模式dnf(解除安全模式怎么解除)
路由器更换密码(mw300r路由器初始密码)

打开浏览器,在地址栏输入192.168.1.1(一般路由器地址是这个或者查看路由器背面的登录信息)进路由-输入用户名,密码,(默认一般是admin)。2、点击:系统工具--登陆口令--修改---保存...

如何设置无线路由器的wifi密码

1、首先连接、开启路由器,使它可以正常工作;其次把网线的两头分别与路由器的外网接口、电脑的内网接口相接;最后开启浏览器,进入路由器的设置主页,在密码管理选项中,输入相应的账户名称、密码,点击保存就设置...

如何给电脑软件加密(如何给电脑软件加密码锁)

电脑可以通过以下几种方式给应用程序加锁:1. 使用操作系统自带的功能:在Windows操作系统中,可以使用“家长控制”功能对特定应用程序进行限制,包括设置密码、限制使用时间等。在Mac...

window10中文语言包下载(win10 语言包下载)

1、进入的这个程序“steam”游戏库中打开巫师3的中文设置。单击右键,找到属性,再打开的属性弹窗中,找到语言,再语言列表中就可以选择我们想要的语言,可以看到没有简体中文。2、最后进入游戏中选择选项,...

win10任务管理器灰色打不开(windows10任务管理器打不开怎么办)

是的,任务管理器可能会出现灰色的情况。这是因为在某些电脑中,系统管理员有权限限制普通用户使用任务管理器。此外,有一些病毒或恶意软件也会禁止用户打开任务管理器,以防其被检测和结束。如果用户想要打开任务管...

请重试(请重试无法验证你的设备)

通常出现这个情况的原因是文档是被保护的。取消文档加密步骤:点击0ffice按钮-准备-加密文档删除密码-确定取消工作表保护如果Excel2007工作表已保护起来,“保护工作表”按钮将自动变化为“取消工...

免费注册个人邮箱账号(免费注册邮箱号码)
  • 免费注册个人邮箱账号(免费注册邮箱号码)
  • 免费注册个人邮箱账号(免费注册邮箱号码)
  • 免费注册个人邮箱账号(免费注册邮箱号码)
  • 免费注册个人邮箱账号(免费注册邮箱号码)
下载机系统(下载机有什么用)

1、点亮手机屏幕,找到【系统工具】文件夹,点击打开。2、进入系统工具界面,找到【文件管理】选项,点击打开。3、在文件管理界面,选择【手机版】选项,点击打开。4、在此界面,向下方滑动找到【downloa...

备份整个硬盘为镜像(备份分区到镜像)

1、尝试过,TimeMachine可以备份到移动硬盘的其中一个分区。2、如果希望移动硬盘既可用于TimeMachine备份,也可用于Windows系统,我是这样做的:首先为移动硬盘分区(至少2个分...

佳能打印机驱动安装视频教程

电脑搜索“佳能驱动”。02进入首页点击“服务于支持”。03然后选择“下载与支持”点击进入。04然后选择你使用的打印机种类图片。05然后在选择产品页面逐一选择产品的种类、系列、型号、下载的文件类型。06...

班级优化大师官网登录(班级优化大师官网登录网址)

班级优化大师可以在另一个手机上重新下载安装该应用,并使用之前绑定的账户进行登录操作,即可同步之前的班级信息和配置。如果之前未绑定账户,则需要通过“找回密码”或“注册新账户”的方式来登录应用,并重新配置...

什么是chatgpt(什么是ai技术)

ChatGPT是由美国人工智能实验室OpenAI开发的一个对话AI模型,于2022年11月正式推出。它能够通过学习和理解人类的语言来进行对话互动,并协助人类完成一系列任务。chatGPT实际上是美国o...