阅读 115

GEO探针的下载方法

此文为本菜鸟初学笔记记录,多数来自大神们的方法,大神实在多,奈何我太菜,而且还记不住啊!

方法一:由于GPL平台探针通常很大,所以下载对网络速度的要求挺高的,网络好的可以用这个的,毕竟我的半天都只有几十兆,还存在没下载完全的风险,所以并没有等到下载完整的探针数据。

library(Biobase)

#下载GPL570 file, 并加载到当前环境中。

gpl <- getGEO('GPL570', destdir=".")

colnames(Table(gpl))

head(Table(gpl)[,c(1,11,12)]) ##确定需要的列

probe2symbol<-Table(gpl)[,c(1,11)]

expreset<- merge(exp, probe2symbol, by.x = "ID_REF", by.y = "ID")

# 根据exp中的ID_REF这列,和probe2symbol的ID这一列来合并

方法二:

#安装Jimmy总结的网站中对应的R包(http://www.bio-info-trainee.com/1399.html),下面为下载GPL570的探针

BiocManager::install("hgu133plus2.db")

library(hgu133plus2.db)

ls('package:hgu133plus2.db')#查看hgu133plus2.db有多少个对象

#找到我们需要的hgu133plus2SYMBOL

ids <- toTable(hgu133plus2SYMBOL)#totable获得对应关系

#探针对应到基因

expreset<- merge(ids, exp3, by.x = "probe_id", by.y = "probe")

head(expreset)

library(dplyr)

expreset1<-expreset %>% distinct(symbol, .keep_all = T)#按照列删除重复项

write.csv(expreset1,"gse46234.csv")



文章分类
后端
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐