浙大生信博士团队倾力打造的一个科研人员学习交流的公众微信平台。我们致力于科研社区服务,分享最前沿的科技进展,提供生信分析方法,解读经典分析案例,公众数据库的挖掘和临床数据统计分析。在此我们欢迎各位的加入!戳 这里的生信草堂公众号原文,请多关注哦~
It’s the choice that you have to wake up every day and say, “There’s no reason today can’t be the best day of my life.”
你可以选择每天早上醒来时对自己说,“今天没有理由不是我人生中最棒的一天。”
大神自行绕过。。。哈哈
书到用时方恨少,这句话最近真真是深有体会。
知识浩瀚无边,而我却是那初学下水的笨鸭子,在原地扑棱扑棱,努力挣扎着,但因初学,茫然,不知所措,又因我是个追根问底的性子,学个东西不清不楚,异常痛苦。
真真是一入生信深似海,从此明白是路人,大抵这也是初学者的痛处,了解越多你需要学习的也是越来越多,而面对那么多需求却不知从何入手最是心忧。
当然,这其中也不乏有开心,即使只学到了一点小技能,即使只有小小进步。小编不是矫情,也明白一口吃不成胖子,只是想记录学习过程的感受,借此发泄郁闷之情
继续前行,令,待我“大成之日”今时之感受又何尝不是一种美好的回忆!只愿不忘初心,脚踏实地,仰望天空。
说一个插曲,也自我反省一下,学习之初,我选的方向是RNA-Seq,虽还处于一知半解状态,工作需要要入门TCGA,满口答应后却迟迟未开始学习,工作之余还是捡起自己初定的RNA-Seq,但不是我不想学,倒是自己“念旧”又倔强的性子,做事情不喜欢半途而废,兴致盎然之时真真是不想碰那未知的TCGA。
多亏了小师兄的开导。。。最终还是开始了TCGA的学习,基于当年我可以吃一学期三明治早餐导致我此生看到面包胃里就难受,多学一面,一可以相辅相成,二来解解只学一样的枯燥感,毕竟我不大是个沉稳的性子。
絮絮叨叨,下面讲讲我对TCGA的初相识,误以为TCGA=ATGC的碱基互补配对。。。没错,我就是无知到这个地步了。虽说闹个大乌龙,学了总要有所了解的,也只敢说是了解,毕竟还不懂不会用。
目前癌症至少有200种,甚至还有更多的亚型。它们都是由DNA中的错误引起的,这些错误导致细胞不受控制地生长。
识别每一种癌症的全部DNA即它的基因组并了解这些变化是如何相互作用来驱动疾病为改善癌症预防、早期发现和治疗奠定基础。
TCGA(The Cancer Genome Atlas)即癌症基因组图谱是国家癌症研究所(NCI:National Cancer Institute)和国家人类基因组研究所(NHGRI:National Human Genome Research Institute)之间的合作,它已经为33种癌症的关键基因组变化绘制了全面的多维图谱。
TCGA数据集,2.5 pb的数据描述了肿瘤组织和超过1.1万名患者的正常组织,这是公开可用的,并且得到了研究界的广泛使用。这些数据为独立研究人员和TCGA研究网络出版物提供了1000多份关于癌症的研究。
TCGA创建了一个基因组数据分析管道,可以有效地收集、选择和分析人类组织的基因组变化。
这个国家网络研究和技术团队的成功是未来项目的典范,并体现了团队在科学领域的巨大力量。
虽然TCGA将于2017年接近尾声,但国家癌症研究所(CCG)的新NCI基因组计划将继续在TCGA的成功基础上继续使用相同的合作模式进行大规模的基因组分析,并使基因组数据公开可用。
TCGA数据库是由TCGA研究网络生成的,大概包括以下7个部分:
1. Biospecimen Core Resource (BCR-生物样本核心资源):组织样本被仔细地编目、处理、检查和储存,并附有关于病人的重要医疗信息。
2. Genome Characterization Centers (GCCs-基因组鉴定中心):基因组鉴定中心使用几种技术来分析关于癌症的基因组改变,包括基因表达水平以及基因组的结构重组等。
3. Genome Sequencing Centers (GSCs-基因组测序中心):高通量基因组测序中心确定了与特定癌症相关的DNA序列的变化
4. Proteome Characterization Centers (PCCs-蛋白质组学鉴定中心):该中心是NCI的临床蛋白质肿瘤分析组织的一个组成部分,分析了TCGA样本的全部蛋白质组的内容。
5. Data Coordinating Center (DCC-数据协调中心) and Cancer Genomics Hub (CGHub-癌症基因组学中心):TCGA生成的信息在DCC集中管理,并进入TCGA数据门户和癌症基因组学中心。这些数据现在由NCI的基因组数据共享存储和发布。
6. Genome Data Analysis Centers (GDACs-基因组数据分析中心):GDACs集成了来自数千个样本的阵列和测序技术的海量数据。这些中心为整个研究社区提供了新的信息工具,以方便更广泛地使用TCGA数据。
7. Analysis Working Groups (AWGs-分析工作小组):AGW是一个跨学科的、国际性的科学家小组,他们对每个TCGA肿瘤类型进行全球性的、综合的分析。每一个AWG研究一个特定的肿瘤类型,使用所有的TCGA平台,并在同行评审的期刊上发表对他们的研究结果的分析,以造福于癌症研究和临床社区。
下面是根据特定的标准选择进行研究的癌症名单。
TCGA项目已经收集了这些癌症样本的必要质量和数量,以便将它们转移到TCGA项目管道中。
对这些癌症进行排序和描述的计划将取决于项目管道的能力。
什么都别问。。当然您可以教。。
愁。。水太深,道行太浅。。。求指点啊!