GEO探针的下载方法
此文为本菜鸟初学笔记记录,多数来自大神们的方法,大神实在多,奈何我太菜,而且还记不住啊! 方法一:由于GPL平台探针通常很大,所以下载对网络速度的要求挺高的,网络好的可以用这个的,毕竟我的半天都只有几十兆,还存在没下载完全的风险,所以并没有等到下载完整的探针数据。 library(Biobase) #下载GPL570 file, 并加载到当前环境中。 gpl <- getGEO('GPL570', destdir=".") colnames(Table(gpl)) head(Table(gpl)[,c(1,11,12)]) ##确定需要的列 probe2symbol<-Table(gpl)[,c(1,11)] expreset<- merge(exp, probe2symbol, by.x = "ID_REF", by.y = "ID") # 根据exp中的ID_REF这列,和probe2symbol的ID这一列来合并 方法二: #安装Jimmy总结的网站中对应的R包(http://www.bio-info-trainee.com/1399.html),下面为下载GPL570的探针 BiocManager::install("hgu133plus2.db") library(hgu133plus2.db) ls('package:hgu133plus2.db')#查看hgu133plus2.db有多少个对象 #找到我们需要的hgu133plus2SYMBOL ids <- toTable(hgu133plus2SYMBOL)#totable获得对应关系 #探针对应到基因 expreset<- merge(ids, exp3, by.x = "probe_id", by.y = "probe") head(expreset) library(dplyr) expreset1<-expreset %>% distinct(symbol, .keep_all = T)#按照列删除重复项 write.csv(expreset1,"gse46234.csv")