使用Excel合并两个GEO表做差异分析

在使用GEO数据库做差异分析时,有的GSE数据集没有对照组,这种情况就需要找该GSE使用的GPL芯片的其他数据集,看看其他GSE里面有没有对照组。

假设我们已经找好了两个GSE,提取出了我们感兴趣的GSM,但是合并数据时会发现虽然这两个(或多个)GSE是基于同一个GPL的,但是它们测出来的基因序列却不完全相同。此时就需要我们合并两个GSE表,并且找到它们相同的序列进行比对。

如果这两个表在数据库里,就比较好办,就是个内连接问题,一个SQL语句 inner join on就解决问题了。

那么在excel怎么做呢?

假设目前有两个GSE,分别在excel里的两个sheet,全选一个GSE的数据,点击插入->表格,点击确定,并给表格起个名字,另外一个GSE也同理。

然后点击数据->自表格/区域(确保这时候鼠标点击一个sheet里的一个单元格),会出现一个新的框,点击关闭并上载。

同样另一个GSE(即另一个sheet)也进行类似的操作。这时候右边就会出现这两个sheet(表)已经上传了。

接着点击其中的一个表(作为主表),点击合并。

然后选择主键和外键,选择内连接(完全匹配)

然后就生成了新的表了。这样的表可以接着进行编程进行差异分析了。

参考:

[1] https://www.youtube.com/watch?v=T7kQUKxuA3s

喜欢(0)

评论抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址