专栏名称: 生信菜鸟团
生信菜鸟团荣誉归来,让所有想分析生物信息学数据的小伙伴找到归属,你值得拥有!
目录
相关文章推荐
生信人  ·  抓紧上车,焦亡巨噬细胞 ·  2 天前  
BioArt  ·  ​Science | ... ·  2 天前  
BioArt  ·  Science | ... ·  2 天前  
51好读  ›  专栏  ›  生信菜鸟团

GEO数据库实操、三大芯片

生信菜鸟团  · 公众号  · 生物  · 2024-09-12 18:10

正文

学习笔记总结于『生信技能树』马拉松课程

GEO数据挖掘系列,第7篇学习笔记:GEO数据库实操、三大芯片介绍

一、GEO数据库实操

1.点击Series

图1

2.点击图5红框内容,使网页中只显示芯片的结果,而不显示高通量测序等等其他技术的结果;红框右边一列是物种,也可用来筛选

other 是不同于芯片、高通量测序等等的其他类型,可能是最新技术

图2

3.此时再搜关键词

图3

4.点击任意一个芯片GSE,拉到网页最下面

图4

5.如果在GEO数据库中直接搜索到的结果较少,可在网站 pubmed 中搜索,记得加上一些关键词

图5

别人用过的数据,我们同样可以拿来使用,也不用担心数据的年代过于久远

二、基因表达量芯片的数据形式

表达量芯片是一种常用的基因表达测量技术,它可以同时测量成千上万个基因的表达水平。本文对三大芯片公司(Affymetrix、Agilent和Illumina)常用的表达量芯片数据形式展开介绍

1.Affymetrix芯片数据形式

CEL文件:Affymetrix芯片的原始数据通常以CEL(Cell Intensity)文件的形式存储。CEL文件包含了每个探针的强度值,表示基因的表达水平

CDF文件:CDF(Chip Description File)文件是Affymetrix芯片的注释文件,它提供了探针序列、基因注释和探针的物理位置等信息







请到「今天看啥」查看全文