是不是发现Starbase貌似一直登录不上?
是不是还在为非编码RNA的课题设计而发愁呢?
今天师兄给大家带来一篇非编码RNA生信工具大全以及课题设计文章,以前我们也分别介绍过不少非编码RNA数据库,像miRNA的,也有lncRNA、circRNA的。数据挖掘的工具也在不断发展,今天咱们系统地把miRNA、lncRNA、circRNA的所有最新、实用数据库介绍一下,以及如何实现课题思路的设计,是不是很心动了呢?
(1)非编码RNA
非编码RNA的分类挺多,但miRNA、lncRNA、circRNA研究的最为深入,当然lncRNA还有亚类,比如lincRNA等,而circRNA也有ciRNA(circularintronicRNAs)的亚类。
(2)miRNA的数据分析工具
miRBase:众所周知的microRNA基因注释数据库。目前miRBase只提供了microRNA的靶标的预测软件的链接。
EVpedia:原核生物、非哺乳类真核生物和哺乳动物囊泡成分(蛋白质、mRNA、miRNA、脂质)的高通量分析数据
deepBase:功能注释了miRNAs,siRNAs,piRNAs,lncRNAs以及circRNAs。
miRGator:引导对miRNA进行功能阐释的工具。功能分析和表达谱结合靶基因预测,可以对miRNA的生物学功能进行推测。
miRWalkis是一个综合性数据库,提供来自人类、小鼠和大鼠的miRNA的预测信息和经过验证的位于其靶基因上的结位点。
ChIPBase:用于注释ChIP-Seq数据的miRNA和lncRNAs的转录因子结合途径以及其转录调控的关系
其他miRNA数据库如下所示
(3)LncRNA数据分析工具
NONCODE:拥有6个物种的,个lncRNA的信息。
lncRNAWiki整合了GENCODE,NONCODE,LNCipedia的有效数据,总共收录了,个lncRNA的信息,其中包含经过验证了的个和疾病有关的lncRNA的详细信息。
C-It-Loci:允许查询三个物种(人、小鼠、斑马鱼)组织特异性的lncRNA信息。
TF2LncRNA:从ChIP-Seq数据中鉴定一列lncRNA基因的共同转录因子。
lncRNABase:提供miRNA调控长非编码RNA(lncRNA)、假基因(pseudogene)和环状RNA(circRNA)的互作信息和ceRNA调控网络。构建了最全面的包含了14癌症类型(个样本)Pan-Cancer(泛癌)表达图谱和互作网络。
LNCipedia:对人类的长链非编码RNA的序列和结构全面的注释。
oncoNcRNA:研究各类非编码RNA(lncRNA,miRNA,piRNA,tRNA和snoRNA等)在肿瘤中的表达模式和作用。这平台包含了64种癌症类型(肿瘤样本和种癌症细胞系)的各类非编码RNA的表达和拷贝数变化数据。
其他miRNA数据库如下所示
(4)CircRNA数据分析工具
除了前面的starbase、deepbase外,还有以下实用的circRNA数据库
(5)如何利用这些工具进行课题设计呢?
上面介绍了这么多数据库,是不是都看晕了,其实不在于量多,找几个趁手的工具才是王道。
下面这张图从差异基因筛选→基因转录预测→蛋白结合能力预测→突变和预测→潜在调控功能预测→疾病关系为主线,推荐了一整套非编码RNA课题设计的路线图。有没有很惊喜?
参考文献:
1.A