【迁移】使用limma包进行差异基因分析
Last updated on March 19, 2024 pm
虽然现在已经是高通量测序的时代,大家基本都是从counts矩阵出发,使用DESeq2进行差异表达分析,但是GEO和ArrayExpress上的仍有海量且持续更新的芯片数据,有时候也不可避免遇到一些FPKM格式乃至已经进行了z-score转换的数据,对于这些数据的分析,我们可以认为其在适当变换下(log2FPKM),满足正态分布,那么仍可以使用limma直接进行分析。下面博主以E-MEXP-1422为例,写一份分析代码的demo。
1 | require(limma) |
蛋白质组学TCPA数据集
获取数据
- 进入TCPA的下载页面选择感兴趣的L4数据
- unzip TCGA-PRAD-L4.zip
清洗数据
1 | tcpa <- read.csv('tmp/TCGA-PRAD-L4.csv') |
TCGAbiolinks下载蛋白质组数据
之前通过tcpa下载过蛋白数据],而TCGAbiolinks也有下载蛋白质组学数据的示例,后者看上去更全面一点。
下载数据
1 | library(TCGAbiolinks) |
清洗数据
1 | pMiss <- function(x){round(sum(is.na(x))/length(x),3)} |
计算差异蛋白
1 | r1 <- f_DE_limma(rppa, rowInfo, Ct1, Tt1, trend=F) |
【迁移】使用limma包进行差异基因分析
https://hexo.limour.top/shi-yong-limma-bao-jin-hang-cha-yi-ji-yin-fen-xi