09-29 12:42 阅读 115

GEO探针的下载方法

此文为本菜鸟初学笔记记录，多数来自大神们的方法，大神实在多，奈何我太菜，而且还记不住啊！

方法一：由于GPL平台探针通常很大，所以下载对网络速度的要求挺高的，网络好的可以用这个的，毕竟我的半天都只有几十兆，还存在没下载完全的风险，所以并没有等到下载完整的探针数据。

library(Biobase)

#下载GPL570 file, 并加载到当前环境中。

gpl <- getGEO('GPL570', destdir=".")

colnames(Table(gpl))

head(Table(gpl)[,c(1,11,12)]) ##确定需要的列

probe2symbol<-Table(gpl)[,c(1,11)]

expreset<- merge(exp, probe2symbol, by.x = "ID_REF", by.y = "ID")

# 根据exp中的ID_REF这列,和probe2symbol的ID这一列来合并

方法二：

#安装Jimmy总结的网站中对应的R包（http://www.bio-info-trainee.com/1399.html），下面为下载GPL570的探针

BiocManager::install("hgu133plus2.db")

library(hgu133plus2.db)

ls('package:hgu133plus2.db')#查看hgu133plus2.db有多少个对象

#找到我们需要的hgu133plus2SYMBOL

ids <- toTable(hgu133plus2SYMBOL)#totable获得对应关系

#探针对应到基因

expreset<- merge(ids, exp3, by.x = "probe_id", by.y = "probe")

head(expreset)

library(dplyr)

expreset1<-expreset %>% distinct(symbol, .keep_all = T)#按照列删除重复项

write.csv(expreset1,"gse46234.csv")

推荐资源