作者推荐了生新技能树数据挖掘课程、生信入门与数据挖掘线上直播课,并参考了《R语言数据可视化与统计基础》书籍。
作者提出了画图的四个步骤:用什么图展示数据、搜画图代码、整理示例数据、套代码调细节,并详细解释了每个步骤的内容和意义。
作者表示每年都跟课学习数据挖掘,每次学习的感悟都不一样,感到常学常新。并推荐了系统入门课程,同时强调学习过程中整理笔记的重要性。
写在开头
hhh每年都有个阶段会要想重新跟课学习数据挖掘,从快毕业🎓开始就在学,学到今年!那就再学一下吧!
学习资料💾:
-
-
这期学习到Day5绘图了,加上今年在
#单细胞常见图表合集
里面开始复现单细胞文献中好看的图表,也越来越理解小洁老师所说的——你的图=画图代码+你的数据+你解决问题的能力
正巧在
从热图看细胞亚群聚类全景
推文整理的过程中,也深切的体会到了画图思维的重要性。所以这期
一起来了解一下画图的正确思维吧!
画图的正确思维
1. 用什么图展示数据
首先我们在做分析的时候,肯定会有些流程和结果图,
比如单细胞分析:会有降维聚类分群的结果图、marker基因展示图等
但是如果想要让我们的数据展示的更加美观,那我们就需要留心平常在看文献或者公众号推文时候看到的好看的图,可以收集整理起来
比如近期在
#单细胞常见图表合集
里面,就是
基于《Single-Cell Atlas of Lineage States, Tumor Microenvironment, and Subtype-Specific Expression Programs in Gastric Cancer》文献里面的Figure1的系列图表进行了可视化!
2. 搜画图代码
小洁老师在推文
怎么拿到那些复杂又漂亮的图的代码丫
推文里面分享了,如何找到好看图代码的方法:
课上也总结了找画图代码的几个原则:
-
-
-
也是小谢后续在整理分享常见图表可视化中需要注意的几个点!
3. 整理示例数据
按照示例数据整理我们的数据,比如在
从热图看细胞亚群聚类全景
中提到的整体复现思路:
从Seurat对象提取感兴趣的基因的表达数据,然后按细胞类型计算平均表达,接着计算各个细胞类型之间的相关性,最后用热图可视化相关性矩阵。
虽然这个是根据AI以及以前整理可视化的代码得到的思路,但是对于别的图也适用!
我们
需要按照别人提供的示例数据或者图例的注解,将我们的数据整理为相应的格式,按照示例数据组织我们的数据,并整理相应的对应关系!
4. 套代码调细节