Nature封面文章:三代测序组合技术引领基因组测序新风潮
【字体: 大 中 小 】 时间:2017年02月17日 来源:生物通
编辑推荐:
最新研究将PacBio三代测序、Bionano光学图谱、Hi-C技术等技术结合在一起,获得了高质量染色体级别的藜麦参考基因组序列,这不仅为藜麦研究提供了更加完备的参考数据,而且也为基因组测序领域带来了风潮。随着研究的深入,科学家们对基因组测序的要求越来越高,三代测序技术应运而生,并且通过将 Pacbio + BioNano + Hi-C + Illumina多级层组合在一起,科学家能从头合成组装出染色体水平的基因组,这将成为未来基因组测序的新标杆。
生物通报道:来自沙特阿卜杜拉国王科技大学的研究人员与多国研究人员合作,在Nature杂志封面上发表了“The genome of Chenopodium quinoa”,即藜麦基因组序列,藜麦(Quinoa)是一种高营养谷物,被誉为“超级食物”。这项最新研究公布了藜麦的异源四倍体基因组,还测序了其它二倍体和四倍体藜属(Chenopodium)物种的基因组,从而揭示了藜麦的遗传多样性和亚基因组的演化过程。这将有助于促进藜麦的遗传改良和育种策略,提高全球粮食安全。
但这其实并不是藜麦基因组的第一张测序图谱,去年日本科学家采用短读长的二代测序技术结合低深度的PacBio测序数据,但最后只得到了草图(draft),并非完整的参考基因组,文章仅发在了DNA Research(IF:5.267)杂志上。时隔半年,为何此次对藜麦的测序可以发到Nature(IF:38.138)封面上呢?
原因在于最新研究将PacBio三代测序、Bionano光学图谱、Hi-C技术等技术结合在一起,获得了高质量染色体级别的藜麦参考基因组序列,这不仅为藜麦研究提供了更加完备的参考数据,找到了令这种食物产生苦味的基因,而且也为基因组测序领域带来了风潮。过去十多年间基因组测序令生物学研究的许多领域焕然一新,但随着研究的深入,科学家们对基因组测序的要求越来越高,三代测序技术应运而生,并且通过将 Pacbio + BioNano + Hi-C + Illumina多级层组合在一起,科学家能从头合成组装出染色体水平的基因组,这将成为未来基因组测序的新标杆。
Pacbio三代测序技术
以最新完成藜麦基因组为例,文章采用RNA-Seq和PacBio的Iso-Seq分别分析了转录组选择性剪切情况:
图中上部显示的是PacBio Iso-Seq转录组测序结果,中间部分显示的是Illumina RNA-Seq测序结果。上两部分的灰色线条表示内含子区域。底部显示的是AUR62017258基因所在的染色体位置。明显可以看出,PacBio的长读长技术无需拼接用于全长转录本测序,可以在一个reads中完全覆盖从5′非翻译区,所有外显子和3′非翻译区。而短读长技术则需要进行组装。
研究采用的单分子实时测序技术来自PacBio PacBio三代测序袭来:2017年4月1日前订购Sequel三代测序服务,即享多重优惠!点击咨询,先到先得>> > |
藜麦的进化历史:
藜麦是由祖源的A和B两个二倍体品种杂交而来。之前的单基因测序研究鉴定到种质库中,北美和欧亚两个二倍体分别为A亚基因组和B亚基因组的候选来源,后来在北美某处发生了杂交。为了进一步了解藜麦的基因组结构和进化,作者对A基因组二倍体C. pallidicaule和B基因组二倍体C. suecicum进行了测序、组装和注释。藜麦中同源基因对的很大比例在每个同义位点表现出相似的同义替代率,表明全基因组的复制事件。作者估计重组大约发生在3.3-6.3百万年前。进化树分析表明北美C. berlandieri是物种综合的基本成员。藜麦被认为是在一次单独事件中从C. hircinum驯化而来。而作者的测序数据表明藜麦可能分别在高原和沿海环境被独立驯化。作者从这些登记样本和参考藜麦基因组中找到了总共7,809,381个SNP,包括2,668,694个藜麦特异的SNP。这将有助于评估其遗传多样性,以及鉴定有有价值的性状相关的基因组区域。
亚基因组特点分析:
通过把来自C. pallidicaule 和C. suecicum 的测序结果mapping到藜麦的scaffold组装结果上,进行BLASTN把每个二倍体与藜麦的scaffold比对,发现分别有156个和410个藜麦scaffold比对到A基因组和B基因组上(总共202.6Mb和646.3Mb)。5,807个同源基因对在染色体上的定位揭示其与A,B亚基因组的高度共线性。
皂苷合成的潜在机制:
a. 藜麦种子的外皮中的皂苷质谱分析成像
b. 在种子发育期间通过总酸量测定检测皂苷的积累
c. 群体中,甜味后代与苦味后代相比的等位基因频率的比例差异
d. 皂苷生物合成途径,注明了途径中催化每一步反应的酶和编码每个酶的基因ID
e. 苦味和甜味品种中的TSARL1基因模式
藜麦种子中含有皂苷(saponins)。尽管这对于植物生长有益(比如阻止食草性动物),但是为了人类能够食用,必须去除掉,因为其具有溶血性和苦味。但要去除皂苷,费用太高,耗水量大,也会降低种子的营养价值。作者发现皂苷集中于开花期后20-24天的果皮中,最终占到种子总质量的4%(w/w)。
天然存在的甜味藜麦含有很低的皂苷水平,尽管潜在的调控基因尚不清楚。为了找到这些基因,作者进行了两个杂交分离群体的连锁图谱和BSA的分析:Kurmi (甜味) × 0654 (苦味),和Atlas (甜味) × Carina Red (苦味)。与其他群体中得到的结果相同,这些群体中的分离比表明种子中皂苷的存在是由一个单独的基因控制的。皂苷的有无与种皮厚度差异相关。苦味的品种比甜味品种有更厚的种皮。
BioNano光学图谱技术
这项研究还利用了BioNano 的Irys单分子光学基因图谱系统,这一系统曾入选生物通2015年的年度创新产品。
目前许多测序技术需要打断并扩增DNA。这往往牺牲了长距离的信息,导致研究人员错过了许多结构变异,包括重排、倒位和拷贝数变异。为了实现更高质量的基因组分析并获得全面的变异视图,人们需要一张完整的基因组图谱。为此,BioNano开发出Irys系统。Irys单分子光学基因图谱系统是以普林斯顿大学开发的一种革命性的纳米通道技术为核心,对基因组DNA进行超长单分子高分辨率成像,从而有助于在基因组生物学层面获得一个更全面更完整的信息,包括结构变异。
这个系统利用纳米材料工程的进步来实现这一点,而不是借助PCR和克隆等常规方法。它在纳米通道芯片IrysChip上线性化并均匀拉伸极长的DNA片段,从而保留了基因组的真正结构。之后通过超长单分子高分辨率荧光成像,绘制出基因组图谱。
将BioNano光学图谱技术与PacBio的三代测序技术结合在一起,这篇文章并不是第一次,去年发表在《Nature Methods》杂志上的论文中,来自美国西奈山伊坎研究所等机构的研究人员对DNA样品直接进行人类全基因组测序,而无需将DNA克隆到细菌中。这项研究使用的是世界上了解最透彻的人类基因组NA12878,但尽管如此,研究人员还是发现了一些之前从未捕获到的结构事件,还有一些跨越了参考基因组上的缺口。他们还发现,人类参考基因组低估了短串联重复序列的扩增。二倍体人类基因组的首次全面分析
基因有限公司作为BioNano公司中国区代理商,可以向他们索取最新技术手册>> |
Hi-C技术
Hi-C辅助基因组组装技术是指在已有二代或三代或光学图谱辅助组装的Draft genome序列和已知染色体数目的前提下,利用Hi-C测序数据将Draftgenome序列进行染色体群组的划分,并确定各序列在染色体上的顺序和方向,使基因组组装组装水平提升到染色体水平的技术。
高等生物的细胞核负责储存基因组DNA,这些DNA环绕着由四种组蛋白组成的八聚体,形成碟状的核小体结构。基因组DNA以这样的形式包装成为染色质,使DNA受到良好的保护。 所有控制基因转录的调控蛋白,都要结合在DNA上起作用。而染色质的3D结构会随着细胞生活周期而变化,调节调控因子所能接触到的基因,这对于基因的功能和疾病的发生具有重要意义,但目前基因组测序技术似乎都回避了这个问题。
2009年,麻省大学的Job Dekker和Broad研究院的Eric Lander开发出了Hi-C技术,用以捕获全基因组范围的相互作用。Hi-C是一种3C衍生技术,基于交联DNA与生物素linker的邻近连接,能够拉下(pull down)片段,接着进行高通量测序。
2013年加州大学圣地亚哥分校的任兵(Bing Ren)教授采用这种方法,完成了人成纤维细胞综合染色质相互作用基因组图谱。但这只是一方面,Hi-C逐渐被用于绘制高分辨率的基因组图谱,揭示大量染色质接触。如2015年Baylor医学院的研究人员利用高分辨率染色体构象捕获技术Hi-C,将细胞核里的DNA-DNA邻位连接与大规模平行测序相结合,能无偏好地鉴定全基因组的染色质互作。
补充内容:
Hi-C技术源于染色体构象捕获 (Chromosome conformation capture, 3C)技术,利用高通量测序技术,结合生物信息分析方法,研究全基因组范围内整个染色质DNA在空间位置上的关系,获得高分辨率的染色质三维结构信息。Hi-C技术不仅可以研究染色体片段之间的相互作用,建立基因组折叠模型,还可以与RNA-Seq、ChIP-Seq等数据进行联合分析,从基因调控网络和表观遗传网络来阐述生物体性状形成的相关机制。
此外,Hi-C可以应用于基因组组装,提升基因组组装水平。Hi-C用于基因组组装最初是在2013年,首先应用于人、小鼠、果蝇;2015年,Hi-C辅助基因组组装首次用于植物(拟南芥)基因组组装。在藜麦基因组文章中,作者采取PacBio 、BioNano 、Hi-C 等多种技术,加入Hi-C技术使基因组组装完好,scaffold N50达到3.84Mb,获取到了染色体水平的基因组,提升了文章水平。
安诺基因作为国内首家提供Hi-C全面测序服务的公司,可以提供动物Hi-C、植物Hi-C、单细胞Hi-C、捕获Hi-C、Hi-C辅助基因组组装等技术服务。索取最新技术手册>>
(生物通:张迪)
知名企业招聘