专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生信宝典  ·  2025 年2月 | ... ·  2 天前  
BioArt  ·  Cell | SMC蛋白调控DNA的挤压和方向转换 ·  2 天前  
生信菜鸟团  ·  精准医学 | Nat.Med | ... ·  3 天前  
生信菜鸟团  ·  数据库合集 | 更新至 67 个 ·  3 天前  
51好读  ›  专栏  ›  生信菜鸟团

Seurat Weekly NO.09 ||向量化调参

生信菜鸟团  · 公众号  · 生物  · 2021-02-04 22:34

正文

天子呼来不上船,
自称臣是菜鸟团。

在这里,与国际同行一起学习单细胞数据分析。

在数据分析过程中,往往需要看不同的参数下的数据表现,也往往需要循环某个列表(基因集或者分组),这时候向量化测试效率就比较高了。

向量(vector)是R编程里最底层也是最核心的结构,并且从广泛意义上的数据类型而言,R中的矩阵和数组甚至是列表都是向量。提升代码效率的有效途径便是向量化(vectorize),即将运算符或者函数作用在向量的每一个元素上的一种理念。

多个聚类的 resolution 参数:

library(Seurat)
library(SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')
library(pbmc3k.SeuratData,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')   
library(clustree,lib.loc = 'F:\\EE\\software\\R\\R-4.0.2\\library')    
.libPaths()
library(tidyverse)
library(cowplot)
pbmc3k.final clustree(pbmc3k.final)

分群可视化,其实是 map 函数的应用。

Idents(pbmc3k.final) "seurat_annotations"
p=list()
pfunction(x){DimPlot(pbmc3k.final, cells.highlight = CellsByIdentities(object = pbmc3k.final, idents = x))})
plot_grid(plotlist = p)

下面来看另一个例子:调节UMAP结构。那么我们就看看可视化有什么参数可以调节:

  • 3D
  • 调RunUMAP的参数
  • 换可视化方法

今天我们来看看n.neighbors和epochs,negative.sample.rate 这几个函数的影响:

map(c(2,seq(from=5,by=50,length=10)) , function(x) { pbmc3k.final %>%  RunUMAP(n.neighbors = x,n.epochs=200,dims = 1:20) %>% DimPlot()}) %>% cowplot::plot_grid(plotlist = .)

c(2,seq(from=5,by=50,length=10) )
 [1]   2   5  55 105 155 205 255 305 355 405 455
map(c(2,seq(from=5,by=50,length=10)) , function(x) { pbmc3k.final %>%  RunUMAP(n.neighbors = 50,n.epochs=x,dims = 1:20) %>% DimPlot()}) %>% cowplot::plot_grid(plotlist = .)

map(c(2,seq(from=1,by=5,length=10)) , function(x) { pbmc3k.final %>%  RunUMAP(n.neighbors = 50,n.epochs=500,negative.sample.rate = x,dims = 1:20) %>% DimPlot()}) %>% cowplot::plot_grid(plotlist = .)

好了,节目的最后,放一张大佬的小道消息:

Seurat Weekly 专栏总结(送圣诞礼物)
Seurat Weekly NO.0 || 开刊词
Seurat Weekly NO.1 || 到底分多少个群是合适的?!
Seurat Weekly NO.2 || 我该如何取子集?
Seurat Weekly NO.3 || 定制可视化
Seurat Weekly NO.4 ||  高效数据管理
Seurat Weekly NO.05 || 大数据集处理之Pseudocell
Seurat Weekly NO.06 || Scanpy2Seurat
Seurat Weekly NO.07 || V4 新特性
Seurat Weekly NO.08 || Seurat 交互系统

文末友情推荐

•《 20单细胞21生信学习班起航,先送福利

•《 96核心384G内存的超级服务器(共享)使用权一年







请到「今天看啥」查看全文