使用limma包进行差异基因分析 虽然现在已经是高通量测序的时代,大家基本都是从counts矩阵出发,使用DESeq2进行差异表达分析,但是GEO和ArrayExpress上的仍有海量且持续更新的芯片数据,有时候也不可避免遇到一些FPKM格式乃至已经进行了z-score转换的数据,对于这些数据的分析,我们可以认为其在适当变换下(log2FPKM),满足正态分布,那么仍可以使用limma直接进行分析。下面博主以E-MEXP-1422 2022-07-30 uncategorized
oligo:GEO/ArrayExpress芯片数据处理 conda配置环境 conda clean -y -all conda create -n geo -c conda-forge r-base=4.1.3 conda activate geo conda install -c conda-forge r-tidyverse=1.3.1 -y conda install -c conda-forge r-irkernel -y 2022-07-29 uncategorized
菜鸟博主对神经网络的简单理解(一) 博主最近在看临床预测模型,里面涉及到一些神经网络的相关知识,这里记录一下博主的简单理解。 基本概念 X:一个nx维的输入张量,可以是nx=0的标量,nx=1的向量,nx=2的矩阵,或更高维的张量 Y:一个ny维的输出张量,可以是nx=0的标量,nx=1的向量,nx=2的矩阵,或更高维的张量 f:一个特定结构的神经网络,如简单的BP神经网络 2022-07-28 uncategorized
Counts矩阵的标准化方法:TMM和VST、RLOG TMM:The Trimmed Mean of M value by edgeR VST:The variance stabilizing transformation by DESeq2 RLOG:The regularized-logarithm transformation by DESeq2 Counts矩阵来源于STAR匹配得到的结果:df <- read.csv('G 2022-07-27 uncategorized
使用IQR方法进行重复值的选择 使用 rownames(df) <- rowNn 时经常会遇到rowNn中有重复值的情况,此时需要使用合适的策略来选择需要保留的那一列。下面这个函数默认保留IQR值(四分位距)最大的那一列。通过传入不同的select_func参数值,也可以改用其他的保留选择策略。如 mean 来保留算数平均值最大的一列,也可以传入自己定义的函数。 来源:Comprehensive Evaluation of 2022-07-27 uncategorized
WGCNA:官方教程学习之共识分析 数据清洗123library(WGCNA) #加载WGCNA包enableWGCNAThreads() #开启多线程options(stringsAsFactors = FALSE) #避免某些错误匹配 1234567#Read in the female liver data setfemData = read.csv("LiverFemale3600.csv");# 2022-07-24 uncategorized
WGCNA:官方教程学习之网络分析 官网下载zipped data sets和Male data,unzip解压,基本概念见此。 数据输入与清洗123456789library(WGCNA) #加载WGCNA包enableWGCNAThreads() #开启多线程femData = read.csv("LiverFemale3600.csv") #载入基因表达量数据femData datExpr0 = as. 2022-07-24 uncategorized
WGCNA:概念初探 组织/细胞的功能执行具有模块化的特点。权重基因共表达网络分析(Weighted gene co-expression network analysis,WGCNA)使用Pearson相关系数或bicor双权重中位相关系数来衡基因之间的共表达关系,将表达模式相似的基因聚类成模块。同一模块的基因可能参与同一生物学过程或通路,被称为功能模块。WGCNA通过分析功能模块与特定性状或表型之间的关联 2022-07-23 uncategorized
clusterProfiler:GSEA基本绘图演示 GSEA分析123456789101112131415161718192021222324252627282930313233343536require(clusterProfiler)require(enrichplot)rres <- readRDS('DEGs_X1.OE.DMSO_X2.OE.DMSO_vs._X1.control.DMSO_X2.control.DMSO_ 2022-07-22 uncategorized
从差异基因到RRA聚合 通过比对,我们得到了counts矩阵,接下来可以进行DEGs分析。此时如果我们有多组之间的对比,则可以使用RRA算法来聚合我们的结果。RRA的安装过程见此。 第一步,多组差异基因分析1234567891011121314151617181920212223242526272829303132333435library(DESeq2)count_all <- read.csv("~/ 2022-07-22 uncategorized