生物通:基因组暗物质虽然逐渐摆脱了“垃圾DNA”的名号,但依然是说不清,道不明,要阐明这些元件的作用,您的研究组采用了什么分析思路?所得到的结果是否与您预期的相符?
高博士:传统的研究认为,编码人类蛋白质的基因只有2~3万个,且只占全基因组的占2%左右。而超过95%的人类基因组并不编码蛋白质基因,而是构成了生命“暗物质”——非编码RNA。近年来,越来越多的具有生物学功能的非编码RNA被鉴定出来。然而,相对于数目庞大的非编码RNA(包括大量的长链非编码RNA,通常>200nt)来讲,这只是冰山一角。
本项目的目的就是通过高通量遗传动物模型的建立,来系统阐述了长链非编码RNA(lncRNA)在生物进化中的作用,为揭示“暗物质lncRNA”是否具有重要生物学功能提供遗传学证据。
与蛋白质编码基因不同,lncRNAs表达丰度较低,通常会与蛋白质形成高级结构发挥作用,探讨lncRNAs功能可用 gain/loss of function 策略,过表达或沉默lncRNAs后观察表型。但目前广泛应用于lncRNAs研究的RNAi knock down技术只能部分沉默基因,所以用RNAi 敲低lncRNAs,其表型可能会非常微弱以致无法观察表型。另外,相较于蛋白编码基因,lncRNAs的保守性较差,导致lncRNAs无法像蛋白编码基因一样来根据序列推测其保守的功能结构域,再针对该结构域进行knock down,这在很大程度上降低了lncRNAs knock down的效果……【详细全文】
人类细胞核中发现新“暗物质”
探查癌症基因组ncRNA“暗物质”
生物通:果蝇基因敲除从基因打靶,到ZFN、TALEN,再到CRISPR/Cas9技术,发生了不少变化,您为何选择了CRISPR/Cas9?在实验分析过程中是否也遇到了一些难题,您是如何解决的呢?
高博士:果蝇基因敲除的传统方法——基因打靶,包括ends-in与ends-out均基于φC31 整合酶系统介导的位点特异性交换,依赖于生物体内自身的DNA修复系统,将基因组上目的基因的靶位点序列置换为供体质粒上的序列。然而,传统基因打靶技术流程复杂,周期长,需耗费大量人力与时间,不适合大规模筛选使用。
锌指核酸酶(ZFN)与转录激活因子样效应物核酸酶(TALEN)用于基因打靶的局限在于,针对每一个候选基因,均需构建和筛选针对该基因的特异性结合蛋白,从而限制了该方法运用于大规模基因敲除。因此,在模式动物水平,以基因敲除…… 【详细全文】
生物通:研究分析了上百个lncRNAs,其中是否有哪些lncRNAs对精子功能,生育生殖产生重要影响,导致果蝇完全不育的?
高博士:我们系统性的对105个lncRNAs果蝇突变株进行了表型鉴定。通过定量育性测试、睾丸组织活体压片观察、鬼笔环肽染色以及组蛋白-鱼精蛋白标记实验,我们发现33个lncRNAs(1/3)在精子发生过程的减数分裂后期发挥功能。其中,lncRNAs CR44456敲除导致雄性果蝇完全不育,对果蝇的生殖发育产生了重要影响。【详细全文】
Nature重要论文:阐析生物学“暗物质”
Nature:用微生物“暗物质”治病
生物通:部分测试的lncRNAs敲除果蝇均可通过易位转基因得以完全或部分修复,表明这些lncRNAs主要以反式(trans)发挥作用,这是指什么?
高博士:已有研究表明,lncRNAs的作用方式可分为in cis与in trans两种。in cis的作用方式是指lncRNAs对同位点或邻近位点的基因起着调控作用,该种lncRNAs的表达通常与邻近蛋白编码基因的表达趋同。in trans的作用方式是指lncRNAs可对基因表达进行远距离调控,比如许多lncRNAs可作为染色质重塑复合体的向导或脚手架,在转录水平调控基因表达。
为验证参与果蝇精子发生的lncRNAs是否可以通过trans作用而行驶功能,我们随机选取了6个lncRNAs进行转基因补偿实验。具体操作为,首先克隆出用于补偿的lncRNAs启动子以及cDNA,通过多克隆位点装入带有attB元件的表达载体。随后将纯化后质粒注射与lncRNAs所在染色体不同的另一条染色体上带有attP元件与phiC31重组酶的果蝇株当中,由此通过phiC31重组酶介导attP-attB交换反应,可以将lncRNAs转基因补偿到与lncRNAs敲除位置不同的染色体上……【详细全文】
生物通:长链非编码RNAs最早出现在生物基因组中至少可以追溯到9000万年前,这是大多数有胎盘类哺乳动物的共同祖先出现的时候,这一点与您的研究中,精子lncRNAs的演化进程是否一致?这表明了什么?
高博士:长链非编码RNAs的起源是一个比较复杂的问题。随着高通量测序技术的发展,越来越多的非编码RNAs(包括长链非编码RNA,通常>200nt)在各种真核生物中被鉴定出来,其中包括很多表达丰度很低的非编码RNAs。随着生物的进化,非编码RNA在基因组中的比例也不断增加,如人类基因组中95%以上为非编码RNA。关于其功能分析方面,现在鉴定的为数不多的非编码RNA主要是参与基因表达的调控。然而,非编码RNA不是真核生物的“专利”,在各种原核生物包括细菌和真菌中都存在各种各样的非编码RNA,它们通过碱基配对识别靶标mRNA, 在转录后调节基因的表达, 是细菌代谢、毒力和适应环境压力的重要调节因子。因而关于其起源与胎盘类哺乳动物出现没有关系。
中心法则中遗传信息传递的每一个过程都受到严格的调控。DNA分子可以转录成不同形式的RNA分子。不稳定的mRNA分子可以与翻译机器结合而翻译成功能性的蛋白质,而这些DNA分子称为蛋白质编码基因。同样,有些DNA分子也可以转录成特定的能折叠成稳定茎环结构的RNA分子,而这些分子不易与蛋白质翻译机器结合,因而不能翻译成蛋白质,这类称为非编码基因。而正因为这些非编码RNA不能被翻译成蛋白且又具备稳定茎环结构,因而部分分子又构成了基因表达调控中行使重要功能的一类分子。
本研究中,我们探索了所有lncRNAs的序列保守性,并将lncRNAs的保守性与蛋白编码基因对比。与其他研究一致,我们发现古老的lncRNAs保守性高于年轻的lncRNAs。总体来看,与蛋白编码基因相比,lncRNAs的进化明显更快。另外,睾丸组织偏好性的DNA编码序列保守性低于整体的DNA编码序列,该结果与之前研究相符。有趣的是,本研究中果蝇敲除株具有表型的lncRNAs其序列保守性高于果蝇敲除株无表型的lncRNAs,表明具有重要功能的lncRNAs进化更慢。以上进化分析的结果表明,在果蝇精子发生中有功能的lncRNAs进化慢于无功能的lncRNAs,而蛋白编码基因的进化又慢于lncRNAs的整体进化,暗示lncRNAs在进化中可能处于向有功能因子转变的中间体的地位。【详细全文】
Science采用改进CRISPR技术 发现近500个新的lncRNAs
著名遗传学家Nature发表lncRNA重要发现
Nature:神秘lncRNA让免疫无过无不及
生物通:下一步您的研究组将进行哪些方面的研究,不知是否方便透露?
高博士:下一步,我们将结合生化、遗传及细胞学手段研究若干重要功能lncRNAs的靶基因以及它们的作用机制。对于若干目前已筛选出的具有严重表型(包括雄性不育)的lncRNAs,我们将通过ChIRP-seq、RNA-seq和改良的RNA pull-down等技术相结合,在全基因组范围内找到lncRNAs的靶DNA序列、靶标RNA和互作蛋白。然后通过生化手段如RNA免疫沉淀RIP,可在体内验证lncRNAs与其靶蛋白的相互作用。通过遗传学手段建立lncRNAs靶基因的突变株,分析lncRNAs与靶基因的遗传关系。通过细胞学手段,RNA原位杂交FISH可定位lncRNAs,免疫荧光可定位lncRNAs的靶蛋白,在野生型与lncRNAs敲除株、功能补偿株及转基因补偿株中分析lncRNAs与其靶基因的共定位关系。同样可通过phiC31介导的attP/attB补偿实验探索lncRNAs基因内各元件以及功能性结构域的功能。也通过染色质构象捕获hiC技术,可观察lncRNAs突变后,是否会对靶标位点处的染色质高级结构产生影响等。通过多种现代分子生物学技术手段的整合,从多角度挖掘若干具有重要表型的lncRNAs参与睾丸组织精子发生的调控机制。
生物通:现如今,基因组暗物质吸引了全球越来越多的实验室和科学家,作为这一领域的前沿科学家,您认为未来要破解这个谜题,最需要哪些方面的研究突破?
高博士:依我拙见,如果要破解lncRNAs的谜题,首先需要突破针对lncRNAs研究方法。如果能有新的鉴定与lncRNAs相互作用蛋白的生物化学方法,可以高效专一的鉴定出与lncRNAs特异性作用的蛋白质,将会给lncRNAs的研究带来惊喜。另外,由于lncRNAs的一级序列的保守性很低,如果能有生物信息学方法的突破,从高级结构上找到不同物种之间lncRNAs的功能同源物,将会给lncRNAs的研究带来曙光。 |