title: 通过conda安装纯净环境的TCGAbiolinks tags: [] id: '1653' categories:
conda create -n tcga -c conda-forge r-base=4.1.2 -y
conda activate tcga
conda install -c conda-forge r-rvest=1.0.2 -y
conda install -c conda-forge r-xml=3.99_0.8 -y
conda install -c conda-forge r-rcpparmadillo=0.10.8.1.0 -y
conda install -c conda-forge r-bh=1.78.0_0 -y
conda install -c conda-forge r-biocmanager=1.30.16 -y
conda install -c bioconda bioconductor-summarizedexperiment=1.24.0 -y
conda install -c bioconda bioconductor-tcgabiolinks=2.22.1 -y
conda install -c bioconda bioconductor-deseq2=1.34.0 -y
conda install -c bioconda bioconductor-rhdf5=2.38.0 -y
conda install -c bioconda bioconductor-limma=3.50.1 -y
conda install -c bioconda bioconductor-apeglm=1.16.0 -y
conda install -c bioconda r-sleuth=0.30.0 -y
conda install -c bioconda r-wasabi=1.0.1 -y
conda install -c conda-forge r-irkernel=1.3 -y
conda install -c conda-forge r-ashr=2.2_54 -y
conda install -c conda-forge r-robustrankaggreg=1.1 -y
conda install -c conda-forge r-devtools=2.4.3 -y
IRkernel::installspec(name='tcga', displayname='r-tcga')
deseq2 数据要求:低生物学重复 & raw counts;假定负二项分布;适合高通量测序数据
sleuth 数据要求:Kallisto输出的结果
limma 数据要求:logCPM;假定正态分布;适合芯片数据
fpkm数据差异基因分析 :理论上是不能进行分析的,无计可施时可以参考
高生物学重复请直接使用 wilcox.test 以避免大量假阳性
多数据集结果整合:RobustRankAggreg
fpkm转tpm示例(基于 SummarizedExperiment 数据框架)
fpkmToTpm <- function(fpkm){
exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
}
f_fpkmToTpm <- function(l_e){
apply(l_e,2,fpkmToTpm)
}
assay(sce, "TPM") <- f_fpkmToTpm(assay(sce, "HTSeq - FPKM"))