简单的芯片结果分析,不得不会啊!
我叫林平之,是莫愁师姐的师弟。最近我拿到了神师兄珍藏的一个芯片的数据,好激动。但不清楚要怎么来分析,一大堆表达变化的基因,到底都发生了什么变化?通路还有基因的功能。有担心以前公司分析的不太对,拿去找师姐让她来教我,现在来给大家展示一下。
实验万事屋作品
芯片的数据要进行初步分析,需要分成几个部分来分析:
实验万事屋作品
1)首先要按照自己需要的目标进行分类,筛选出其中的表型差异,再在表型差异中寻找差异基因。
实验万事屋作品
举个简单的栗子,我想要研究肿瘤迁移和原位癌之间的变化,我所做的芯片研究的材料是癌与癌旁,样本中有的组织来源于远端转移,有的是原位癌。将这些样本区分开后,进行比较。找出远端转移表达变化差异大的,且原位癌与癌旁中表达变化不明显的,这些基因就是有可能与肿瘤转移密切相关的基因了。
实验万事屋作品
然而,这些基因具体都定位在什么位置,或者说这些基因到底在什么功能,会不会形成功能簇,也就是说都集中在某个功能上,比如细胞增殖,细胞周期变化或者转录调节功能等等。是否会在某个细胞结构定位上也有富集呢?那我们就需要进行GO分析了。
实验万事屋作品
2)GO(Gene Ontology)分析,就是根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超几何分布关系,GO 分析会对每个有差异基因存在的GO返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。Gene Ontology分析其实分成三个部分:分子功能(molecular function)、生物过程(biological process)和细胞组成(cellular component)。蛋白质或者Gene ID可以通过自己基因的注释,来对应到各自的GO号,而GO号可对应到各个分组,即不同的分子功能及细胞定位。
实验万事屋作品
最简单的GO分析就是在AmiGo 2上进行的,我们可以通过这个网站,得到一些简单的GO分析的数据。
实验万事屋作品
实验万事屋作品
找出芯片中,各个基因的GeneID,输入进搜索框内。注意,必须是Entrez Gene 的 ID才可以哦!如果你只是输入基因名的话,就基本白忙活了。
实验万事屋作品
实验万事屋作品
按照不同的需求进行分析,也就是分子功能(molecular function)、生物过程(biological process)和细胞组成(cellular component)。
实验万事屋作品
实验万事屋作品
结果中可以粗略的看到,这些不同的基因,在那些基因功能或者细胞定位上有不同程度的富集,根据这些信息,对下一步的验证试验做出提示。
实验万事屋作品
实验万事屋作品
但光靠基因功能簇的分析,有时候给人的提示还是不够,我们还需要更进一步地将簇细分成网,也就是将富集的基因功能所在的各条信号通路找出来,找到了有明显变化的信号通路,就能更进一步对原有的科学问题,给出提示。
实验万事屋作品
3)形成这样的网络结构最关键的就是Pathway分析,这个分析,主要看的是,这些表达差异的基因究竟是在哪些已知的通路上有富集。我们通常会使用的是KEGG的PathwaySearcher,用法其实大同小异。同样,在选择Pathway后,也是输入Gene ID,选择Pathway开始分析。
实验万事屋作品
实验万事屋作品
当然,也未必所有的基因都在已知的Pathway上。
实验万事屋作品
实验万事屋作品
有结果的通路,就可以一目了然了。
实验万事屋作品
实验万事屋作品
点击进去,即可显示出通路图,红框的基因即是列表中的基因。
实验万事屋作品
实验万事屋作品
做完这两个简单分析,可以对你芯片的结果有一个简单的提示了。
实验万事屋作品
…华丽丽的分割线…
李莫愁博士:这些分析虽然简单了点,但还是可以对你有一个提示的,比如那些信号通路上基因的变化有了富集,那些富集的基因都定位在什么细胞结构上,有些什么样的功能,参与了什么样的生物过程等等。这些都会对于你研究的表型提供一些研究的方向和思路。但还是提醒一下你,其实芯片公司已经给大家都做过简单的GO分析和Pathway分析了,虽然可能不一定很完美,但总要比自己手动来分析要强很多。大家可以慢慢自己再摸索一下,其实,这些分析,对于那些想要从公共数据库中挖掘数据的孩纸来说还是很有用的。以后我们再深入讨论这种问题吧,想要了解这两个分析的网站分别是啥的话,就回复“芯片”就行了,自己找还真不是很好找。
如果你喜欢我们,欢迎把文章转发到朋友圈!未经允许,其他公众号不得转载哦!