如何看懂和绘制火山图
火山图(Volcano Plot)是大家在文章里面经常看到的图,特别是在展示差异表达的基因时,常常出现在芯片、测序等组学检测技术的结果中,与热图等等常一起出现:
下面我们就说明下如何看懂和绘制火山图。
标准的火山图常用于展示显著差异表达的基因,这里有两个关键词:显著是指P差异表达一般我们按照Fold Change(倍数变化)>=2.0作为标准。
当我们拿到基因表达的P值和倍数后,为了用火山图展示结果,一般需要把倍数进行Log2的转化,比如某基因在实验组表达水平是对照组的4倍,log2(4)=2,同样的如果是1/4,也就是0.25,转换后的结果就是-2。
同样的道理,对P值进行-log10的转化,-log10(0.05)约等于1.30103,由于P值越小表示越显著,所以我们进行-log10(P value)转化后,转化值越大表示差异约显著,比如-log10(0.001)=3 > -log10(0.01)=2 > -log10(0.05)=1.30。
下面是一个比较标准的火山图:
在上面这个图中,横轴是log2(FC),纵轴是-log10(P value),每个点代表一个基因,平行于Y轴的两条线分别是X=1和X=-1,在X=-1左侧的点是下调2倍以上的基因,在X=1右侧的点是上调2倍以上的基因。同时,平行于X轴有一条虚线Y=1.30,即-log10(0.05),在虚线以上的点表示显著性
这样,我们就把虚线Y=1.30以上,X=1右侧和X=-1左侧的基因标记为表达显著差异的基因,一般我们把大于2倍(X=1右侧)的点标记为红色,把小于-2(X=-1左侧)的点标记为绿色,一些我们特别关注的基因需要把基因名标记出来。
下面我们看一下火山图的绘制。
使用工具:Graphpad Prism,数据:Volcano Plot.xls(链接: pan.baidu/s/1i5zLfHN 密码: 4fb1)
这里我们用的是Graphpad 6.0版本,把Excel中的数据复制进来:
然后进行绘图,选择散点图:
这是草图:
接下来我们开始设置:
1. 双击Y轴,在打开界面Format Axes//frame and Origin中,把Set origin设置为Lower left:
结果:
2. 下面我们添加X=-1,X=1和Y=1.30103的虚线。
还是在刚才的界面中,X axis中:
Left Y axis中:
双击虚线,设置格式:
设置后的新图:
3. 设置点的大小和颜色:
双击任意点,在打开的对话框中选择点的大小:
分别右键单击某个点:
这里我们可以设置这个点的颜色、形状、大小,这个点的基因名通过Show Row Title来设置,通过这样的方法可以把显著表达高于两倍的设置为红色,把显著低于2倍的设置为绿色,也可以把我们感兴趣的基因另外标记为上三角和下三角:
4. 调整格式,导出图片:
关注后获取《科研修炼手册》1、2、3、4、5,基金篇精华合集