在人类基因组中,大约包含2万个编码蛋白质的基因,其中有一类比较特别的基因称为转录因子。转录因子的一个重要功能就是调节和控制基因的转录,也就是把储存在DNA里面的遗传信息根据需要释放出来变成RNA。
通过一系列生物学过程,这些释放出来的RNA最终形成具有生物学活性的蛋白质,从而参与细胞内的一系列生命活动过程。
目前已知人类基因组包含超过种转录因子,这些转录因子编码的蛋白在行使调控角色和功能的时候,会识别并结合到DNA上的调控区域。
通常情况下,一个调控区域会同时包含多个不同转录因子的结合位点,这些转录因子会以某种合作方式结合上去。同时,这些转录因子的结合位点,并不是随机地出现在基因组的调控区域,而是以某种规则出现。
至于它的分布规则是什么?转录因子之间如何协作?近年来,这已成为基因转录调控的一个研究热门。
在基因组上,对于不同的调控区域来说,它们能结合的转录因子数量和种类也不相同。即使是同一个调控区域,在不同细胞组织里面、或同一细胞组织在不同状态下,结合的转录因子数量和种类可能也会不一样。
了解这些转录因子结合位点的分布规律、以及转录因子之间的合作规则,可以帮我们探索细胞内基因转录调控的具体机制,也能帮助探索细胞组织是如何维持分化、发育以及细胞功能。
研究该问题的另一个重要意义在于,可以探究疾病的发生机制。目前已有研究发现,在人类的复杂疾病中,超过80%的遗传变异发生在基因组的调控区域。
当某个调控区域上发生遗传变异时,可能就会改变转录因子的结合位点,从而影响该调控区域的功能,进而导致下游基因的表达异常。
多角度分析种转录因子结合位点的分布规律
为了探索转录因子之间的合作规则,中科院博士、目前在美国国立卫生研究院(NationalInstitutesofHealth,NIH)担任博士后研究员的赵永兵,对近种人和小鼠的细胞组织进行多组学大数据分析。
从多个角度来分析了种转录因子结合位点的分布规律,借此增加了人们对于转录因子在调控区域的分布规律、以及转录因子之间的合作机制的了解。
图
赵永兵(来源:赵永兵)
首先,赵永兵发现不同家族的转录因子在调控区域结合的位置不一样,有些倾向于结合在中间,有些倾向于在边缘,还有一些没有明显的倾向性。
其次,他发现不同转录因子所结合的调控区域,具有不同的转录因子密度。举例来讲,一些转录因子倾向于结合在多数转录因子都能结合的区域,它们可能有很多的潜在“伙伴”。而一些转录因子倾向于结合在只有少数转录因子才能结合的区域,因而它们的“伙伴”会比较少。
最后,对于任意两个转录因子共同结合/共定位在同一个调控区域的频率,赵永兵也进行了分析,并为每个细胞组织分别构建出转录因子共定位热图。
分析结果显示,超过90%的转录因子对(TFpairs),很少共定位于同一个调控区域。对共定位热图进行聚类后,赵永兵发现频繁结合在一起的转录因子会在热图上形成“簇”,比如FOS-Jun家族的转录因子。
他还专门开发一个网络数据库(