目前,从现有数据库挖掘数据进行分析是一个热门领域,生信数据挖掘是直接从现有的数据库挖掘数据进行分析,不用做实验就可以得到一篇生信文章所需要的数据,这个听起来就很有诱惑力。
GEO
作为生信数据挖掘最常用的公共数据库之一,储存了海量的芯片和二代测序数据。更重要的是,GEO是一个综合性的数据库,包含各种疾病的数据,这对于
非肿瘤疾病
的科研人员来说是非常宝贵的资源。因此,它就像一座宝藏,等待我们去发掘它的价值,让它发出光芒。
R语言
是一件非常实用并且功能强大的科研分析工具,在平时的科研工作中,即使只达到初级水平,它也可以帮助我们处理excel图表数据,做统计分析,还可以快速做出精美的图片,而这需要的可能仅仅是几行代码。与一些软件相比,R语言更加灵活,不需要套用死板的格式。在GEO数据挖掘中,R语言永远是那把最坚韧的利剑。
小张聊科研
“
GEO数据挖掘与案例实操班
”
自开班以来,收到了很多好评,很多学员反映这个课带领他们进入了生信分析的大门,并且也已经有学员上过我们的培训班之后发了文章,我们深感欣慰。
2019年,是新的开始,我们吸纳了学员的一些建议,在原有课程基础上进行进一步的优化,推出“
GEO数据挖掘与案例实操班
”。本课程立足文章实例,通过GEO实例数据,快速掌握数据分析技巧;梳理发文套路,以实际
SCI论文为案例
,教你用“别人的”数据,发“自己的”文章;入门R语言,掌握一门重要的科研工具。
我们的理念是,
摒弃填鸭式教学方式,授课内容不求多,但求精,减轻学员压力,为学员提供反复练习的机会,两天时间把一件事情做好,让每个学员都能收获满满。
课程特点
资深讲师,丰富的项目经验和授课经验;
理论+上机操作,数据挖掘轻松carry;
一次学习终生受用,享受课堂面对面教授;
课上实时与老师交流,有问题当场解决;
内容丰富,数据挖掘与科研绘图合理搭配的精美套餐;
实例操作,让你快速掌握数据挖掘套路。
老师讲课深入浅出,思路清晰易懂,
零基础
可参加,带您进入生信分析大门;
另外,为了增加学习的互动性和趣味性,增强学员的参与度,并加深对课程内容的理解,现场学员自己从GEO中检索一篇课题相关的GEO数据,所有学员均以此数据进行实战分析,可小组讨论。随后老师会以此数据从下载到得到差异基因的全过程演示一遍。
听完课后我们能达到什么样的程度
1、学会R语言的基本语法
2、学会如何在GEO上检索与我们课题相关的数据
3、如何从GEO上下载我们所需要的数据
4、如何用R语言分析这些数据并作出完成一篇文章所需要的图
5、理清GEO数据挖掘文章的思路,掌握发文套路
课程内容主线
第一天上午:
学习R语言基本语法
第一天下午:
从GEO下载原始数据并处理
第二天上午:
处理后数据纵向扩展
第二天下午:
利用处理后数据绘图、介绍文章套路和实战演练
主讲人
小张聊科研团队的资深学术讲师,近十年从事生物信息学和医学相关研究,致力于医学大数据挖掘和软件开发。参与发表十余篇高分SCI文章,并参与“十二五”、“十三五”、863、973重大项目等多项国家级项目的数据分析工作。
适合人群
广大临床/科研工作者,研究生,零基础也可以参加
授课信息
课程表:
第一天
|
8:00-9:00
|
报道,领取资料
|
9:00-12:00
|
数据挖掘介绍及R语言基础
|
数据挖掘与生物信息简介
|
R
语言与数据挖掘
(R语言基本语法、函数、循环、包
及实例练习
)
|
12:00-13:00
|
午休
|
13:00-17:00
|
GEO
实例练习(From Raw data to Clean data)
|
GEO
简介与在线分析练习
(芯片基础原理,GEO的组成框架,GEO2R差异基因筛选,聚类热图)
|
GEO
数据下载实例练习
(实际数据下载,FTP批量下载)
|
Affymetrix
芯片数据分析,差异表达分析
|
随机挑选学员提供的一组数据进行实战分析(小组讨论 + 老师演示)
|
17:00-17:30
|
学员提问及讨论
|
第二天
|
9:00-12:00
|
表达谱数据挖掘实战(From Clean data to Results)
|
Agilent, Illumina
芯片平台原始数据处理,差异表达分析
|
数据分析纵向剖析
(层次聚类,主成分分析,功能富集分析,分子网络构建)
|
12:00-13:00
|
午休
|
13:00-17:00
|
SCI
实用绘图技巧(From Results to Artwork)
|
R
语言与统计绘图
(R语言绘图系统介绍,点线图、柱形图、箱线图等常规图形制作,气泡图、火山图制作)
|
数据挖掘套路解读
(从文献实例出发,剖析生物信息数据挖掘套路,带你轻松发文)
|
实战演练
(分小组竞赛练习,重现一篇SCI文章的数据分析结果)
|