数据库

首页 » 常识 » 预防 » 高分生信文章不是梦,学会这5个数据库,你
TUhjnbcbe - 2021/4/26 16:14:00
北京好看白癜风医院 https://baike.baidu.com/item/%E5%8C%97%E4%BA%AC%E4%B8%AD%E7%A7%91%E7%99%BD%E7%99%9C%E9%A3%8E%E5%8C%BB%E9%99%A2/9728824

众所周知,医生做科研很难,发SCI更难。基础研究,临床研究与生信研究都属于医生做科研的技能分支。

大部分医生做科研的主线是搞基础研究,通过做实验来产出数据,但是基础研究做的过程很费时间,数据产出的过程需要各种实验技巧,门槛相对较高。

临床研究的难点一方面来源于高质量的临床样本很难收集,另一方面在于对统计学知识的高要求。

近年来随着高通量测序技术的高速发展,生信研究异*突起,医生可以不再需要科研经费即可快速发文章灌水了,利用别人的数据进行二次挖掘,下载数据分析一遍,出一些花花绿绿的图就可以写文章了,这谁能不爱?

掌握一些生信基础知识,学有余力的小伙伴们再熟练掌握一些R语言的内容就可以实现弯道超车,是不是疯狂心动?

生信研究有套路吗?有!酸菜老师精心归纳了生信文章的四大组成板块:表达差异,功能聚类,交互网络与临床意义,总结为四字真言,即“挑圈联靠”。

简单来说,把公开的高通量数据拿来做二次分析,得到差异表达的分子列表,对其进行功能聚类分析后选出交际花类型的分子,抓住他们就能最有效率的控制整个网络,最后与临床资料相结合,转化成具有临床意义的科研成果。

上面这些步骤即对应了“挑圈联靠”四步走战略。当然这些过程中少不了一些生信技术手段来对数据进行分析,对于医生而言,会熟练掌握R语言就可以摸到天花板了,再往上的Perl,Python倒是大可不必,那又有人问,要是不会编程,计算机不好怎么办?

别慌,今天这就教你如何避开R语言,利用零代码的生信数据库及软件shinyGEO,GSEA,STRING,Cytoscape,GEPIA2,带你“挑、圈、联、靠”一波带走一篇生信文章!

一、“挑”----表达差异之shinyGEO使用教程

大名鼎鼎的GEO数据库想必大家都有所耳闻,GEO是著名的基因表达综合数据库,并自带GEO2R可以进行差异表达基因的分析,但是单个基因的评估却没有那么简单。对于没有生物信息学专业知识的人来说,特定GEO数据集的生存分析也无法实现。那这个时候shinyGEO就提供了一种解决办法。shinyGEO的特点总结如下:(1)允许用户直接从GEO下载基因表达数据集,提供单基因差异表达和生存分析,并进行可视化作图;(2)支持可视化图形定制、样本选择、数据导出和R代码生成。表达差异分析可视化作图图形定制数据导出R代码生成生存分析总的来说,shinyGEO是一个GEO数据库的在线可视化工具,点击操作即可完成对GEO数据基因表达差异分析以及生存曲线绘制。

二、“圈”----功能聚类之GSEA软件使用教程

说到功能聚类,大家都能想到GO或者KEGG来对分子的功能和通路进行富集。但是GO和KEGG进行分析的差异基因是通过人为定义的阈值得到的,而这种人为决定的阈值会遗漏掉某些表达差异不显著但有重要生物学意义的基因。此外,如果上调基因和下调基因分开富集到了同一条通路,那这条通路到底是被激活还是抑制呢?传统的富集分析只能定位到功能,而GSEA则可以通过预定义的基因集在排序好的基因列表中的分布回答某通路被抑制还是激活。因此GSEA可以看作是GO和KEGG的补充和进阶,它检测的是基因集而不是单个基因的表达变化,得到更为理想的结果。GSEA与传统GO、KEGG分析的区别:(1)输入文件:GSEA是表达矩阵,传统的富集分析是基因名列表;(2)排序:GSEA分析前需要根据表达量对基因进行排序,传统的GO、KEGG富集分析不需要;(3)差异分析:GSEA不需要进行差异分析;(4)目的:传统的富集分析主要
1
查看完整版本: 高分生信文章不是梦,学会这5个数据库,你