【迁移】导出SingleR需要的数据 loom文件使用记录 随着单细胞数据量的增长,计算要求成指数增长,当数据量大于10万个细胞的时候,seurat包分析就显得非常有压力了,因为在实时内存中储存数据就变得非常困难,HDF5数据格式提供了高效的磁盘存储,而不是在内存中存储数据,这就将分析扩展到大规模数据集,甚至可以达到大于100万细胞的级别 ,Linnarson实验室开发了一种基于hdf5的数据结构,loom,可以方便地存储单细胞基因组 2022-10-04 #SingleR
【迁移】给VMware虚拟机加硬盘 买了一台零刻 SER5 Pro 32G作为虚拟机的宿主机,用了一个月感觉还行,准备加装一个铠侠TC10 1T SATA3固态。小心排线接口上有个黑色的东东,先用镊子挑起来再拔。然后虚拟机设置里添加磁盘。 挂载磁盘并设置开机自动mount sudo su fdisk -l #i查看可挂载磁盘 mkfs.ext4 /dev/sdb #格式化为ext4 # apt install util-linux 2022-10-02 #VMware
【迁移】基于NMF分解的降维聚类 安装补充包 conda activate seurat conda install -c conda-forge r-nmf -y conda install -c conda-forge r-fastica -y 获取非负表达矩阵 使用《使用metacell进行分群聚类》中的数据 1234567891011121314151617sce <- readRDS('SRX8890 2022-10-02 #nmf
【迁移】使用metacell进行分群聚类 预处理 12345678910111213141516171819202122232425262728293031f_QC_plot <- function(sce){ options(repr.plot.width = 12, repr.plot.height = 6) print(Seurat::VlnPlot(sce, features = c("nFe 2022-10-01 #metacell
【迁移】使用FindTransferAnchors对样本进行预注释 处理参考样本 12345678910111213ref_sce <- readRDS('~/upload/zl_liu/data/pca.rds')ref_sce <- subset(ref_sce, group == 'CRPC')table(ref_sce@meta.data$cell_type_fig3)g2m_genes <- Se 2022-09-29 #FindTransferAnchors
【迁移】使用SCTransform标准化 安装包 conda create -n seurat -c conda-forge r-seurat=4.1.1 -y conda activate seurat conda install -c conda-forge r-tidyverse -y conda install -c conda-forge r-irkernel -y Rscript -e “IRkernel::installs 2022-09-29 #SCTransform
【迁移】使用Bootstrap法计算自举置信区间 计算药物LD50用Bliss法最严谨,而改良寇氏法计算的结果误差也不大,因此做了一次改良寇氏法计算LD50的实验。最后需要计算一下结果的可信区间,于是来试试万能的Bootstrap法 安装包(这个例子用不上) conda activate MICE conda install -c conda-forge r-boot=1.3_28 -y 构造样本 组别 剂量 mg/kg 动物数 死亡数 2022-09-27 #Bootstrap
【迁移】cellranger定量:One Library, Multiple Flowcells 重命名R1、R2 原始数据质控 重命名前 ├── SRR12391722 │ ├── SRR12391722_1.fastq.gz │ └── SRR12391722_2.fastq.gz ├── SRR12391723 │ ├── SRR12391723_1.fastq.gz │ └── SRR12391723_2.fastq.gz ├── SRR12391724 │ ├── SRR1239 2022-09-25 #cellranger #scVelo
【迁移】从ENI数据库下载fastq文件 从 ENI 数据库下载 进入ENA Browser,搜索对应的GSE号,进入study项目,选择TSV格式的Download report。 从TSV表格中提取下载链接,一行一个写入url.txt,前面加上ftp://,接着使用wget -c -i url.txt下载 批量重命名脚本: 1234ls *.fastq.gz | cut -d '_' -f 1 | while r 2022-09-25 #fastq #ENI #NCBI-GEO #SRA
【迁移】使用 JTK_CYCLE 算法分析生物节律 JTK是一种非参数检测程序,能从芯片数据中检测循环转录本。除了计算每个转录本最佳的相位(LAG)、振幅(AMP)和周期(PER)外,JTK还计算了置换检验P值(ADJ.P)和Benjamini-Hochberg q值 (BH.Q)。与常规的周期检测算法相比,JTK具有更好的检验效能、更高的计算效率和更强的鲁棒性。R语言的metacycle包实现了ARSER、JTK_CYCLE、Lomb-Scarg 2022-09-19 #JTK_CYCLE #节律