IRLBA : 实现高效的稀疏矩阵奇异值分解(SVD),特别适用于高维单细胞RNA-seq数据。支持快速计算PCA,适合处理大规模数据集。
FactoMinR:PCA分析。
cNMF:非负矩阵分解(NMF)方法,用于基因表达数据分解,提取基因表达程序。支持多次迭代以优化基因表达模式的识别。
acNMF 是一种改进的非负矩阵分解 (NMF) 方法,通过引入约束条件来分解基因表达矩阵,特别适合处理多组学或多样本数据。处理跨样本的一致性问题。用于单细胞数据的特征提取、模式识别以及信号分解。识别跨样本共享和特异性基因表达模式。
iNMF:是一种专门用于多组学数据整合的NMF方法。它结合跨样本一致性和局部结构捕获,适合整合单细胞RNA-seq和ATAC-seq数据。多模态单细胞数据的整合。提取跨组学的共享特征并捕获数据特异性模式。构建单细胞组学间的一致性表达模式,例如RNA和蛋白质表达的联动分析。
cnmf:细胞亚型识别。
NMF:亚型分析的运用。
DirichletReg:实现Dirichlet回归模型,用于分析组成数据(如比例数据或分布数据)。允许建模每个组成部分之间的依赖关系,并通过协变量解释这些关系。提供广义线性模型 (GLM) 的扩展,适用于具有多部分组成的高维数据。
speckle:使用propeller方法,该方法支持复杂的实验设计,能够对协变量(如年龄和性别)进行建模。
scITD:通过张量分解方法分析单细胞数据中的高维特征。识别跨患者共享的显著因子,并将这些因子与协变量(如年龄、性别等)进行关联分析。提供解释性张量分解,使生物学特征与统计结果的解读更直观。
jaccardtest : 计算成分矩阵列之间的Jaccard相似性指数和显著性P值。
igraph:构建无向网络图并执行社区检测,揭示数据分割之间的重复基因表达模式。
elbow : 通过计算凹曲线的拐点,确定排名(k)和Jaccard长度的最佳参数。
SignatureAnalyzer:是一种基于贝叶斯NMF的工具,用于解析多维组学数据中的基因表达特征签名,特别在癌症数据的基因表达模式研究中应用广泛。在bulk RNA-seq和单细胞数据中发现新的潜在调控模块。