PLOS ONE:基于基因序列的变革性生物命名系统
【字体: 大 中 小 】 时间:2014年02月28日 来源:生物通
编辑推荐:
在2014年2月21日的《PLOS ONE》杂志上,弗吉尼亚理工大学的研究人员开发出一种新的生物分类方法,对传统的林奈生物命名规则,进行了补充。这种新的命名系统,可以根据生物体的基因组序列,不依赖现有的生物分类法和命名法,对任何一种基因测序的生物体自动地分类和命名。
目前,美国弗吉尼亚理工大学的研究人员开发出一种新的分类方法,可根据生物的基因组序列对其命名,这一研究成果发表在2014年2月21日的《PLOS ONE》杂志上。本文的资深作者Boris Vinatzer,超越了当前的生物学命名系统,提出一种基于每种生物遗传序列的命名系统。这能为任何一种生物(可以是细菌、真菌、植物或动物)创建一个更坚固、精确和信息量更大的名称。
Vinatzer是弗吉尼亚理工大学农业和生命科学学院植物病理、生理和杂草科学系的副教授,他提出的这种新的分类模型,不仅使我们鉴定生物体的方法具体化,还能提高和增加卡尔林奈发明的命名规则的深度。全世界的科学家们已经使用林奈创建的分类系统超过200年。
Vinatzer指出:“近年来,基因组测序技术发展非常快,可使我们以很低的成本区分开任何一种细菌、植物或动物。林奈命名系统的局限性在于,缺乏一种方法精确命名已完成测序的生物体。”
Vinatzer并不建议改变当前的生物分类学命名规则。相反,新的命名系统是为了补充物种内的生物体分类信息,以更快地鉴定新物种,因为这个过程仅仅取决于生物体的遗传密码。
基于基因组的这种命名系统,对公共卫生官员特别有用,他们生活在一个对生物威胁时刻保持警惕的时代。在这篇论文中,Vinatzer使用出现在911恐怖袭击后的炭疽菌菌株,作为当前分类学系统局限性的一个例子。
武器化的炭疽菌常常使官员感到沮丧,执法机关花了几个月的时间,将初始病原菌的起源确定为Ames菌株。有1200多株炭疽菌——或芽孢杆菌(Bacillus anthracis)存在。每种菌的名字都由研究人员任意选择,这些名字并不能说明遗传相似性。
利用Vinatzer开发的命名规则,每个炭疽菌株的名称,将包含与其他菌株相似性的信息。利用Vinatzer的基因组序列,将用于生物恐怖袭击的Ames菌株称为lvlw0x,而这个菌株的祖先(被储存在美国陆军传染病医疗研究所中),应该被称为lvlwlx。
Vinatzer的命名规则,也可让研究人员根据新病原体与已知病原体的相似性,在数日之内命名新的病原体——而不是几个月或几年。
这项研究所提出的命名过程,首先进行采样和生物体DNA测序。然后,根据与以前所有已完成测序生物体之间的相似性,利用序列来产生这个生物体所独有的代码。
Illumina最新GAIIx 测序仪详细技术资料索取>> >>
Vinatzer的方法有很多超越林奈系统的优势。首先,代码名字可能是永久性的,而不像现有生物分类系统中,名字经常改变。其次,代码也能被重新分配,而无需漫长的过程,这是对比分析一个生物体与另外一个生物体的物理特征所必需的。最后,该序列可以被指派到病毒、细菌、真菌、植物和动物中,将为地球上所有生命提供一个标准化的命名系统。
Vinatzer引用了一种植物病原体——青枯雷尔氏菌(Ralstonia solanacearum)——作为植物病原菌世界中名称千变万化的例子。在最终命名为雷尔氏菌之前,这种病原体经过了三次名称变化,最开始被称为枯草芽孢菌(Bacillus solanacearum),然后变成青枯假单胞菌(Pseudomonas solanacearum),然后是茄青枯病菌(Burkholderia solanacearum)。
以前,Vinatzer曾经使用过基因组测序,并获得了巨大成功。在2009年,他及其同事能够将一种破坏全球猕猴桃农作物的病原菌,追溯到中国。
弗吉尼亚理工大学正在提交一项描述这种命名规则的专利。Vinatzer和工程学院计算机科学系的同事Lenwood Heath教授创立了Genomic Life Inc.,将许可本发明的进一步发展。
Heath监督了生物信息学管线到实施系统的发展。他对与Vinatzer的合作很感兴趣,因为这有可能让科学家们与生物学系统之间进行精确的交流。他说:“我在计算机上工作,所以有机会通过有限的DNA序列来调整生物体世界的秩序,从而传授我的知识。数学世界和生物世界之间的关系,比我们想象的更加密切。”(生物通:王英)
生物通推荐原文摘要:
A System to Automatically Classify and Name Any Individual Genome-Sequenced Organism Independently of Current Biological Classification and Nomenclature
Abstract: A broadly accepted and stable biological classification system is a prerequisite for biological sciences. It provides the means to describe and communicate about life without ambiguity. Current biological classification and nomenclature use the species as the basic unit and require lengthy and laborious species descriptions before newly discovered organisms can be assigned to a species and be named. The current system is thus inadequate to classify and name the immense genetic diversity within species that is now being revealed by genome sequencing on a daily basis. To address this lack of a general intra-species classification and naming system adequate for today’s speed of discovery of new diversity, we propose a classification and naming system that is exclusively based on genome similarity and that is suitable for automatic assignment of codes to any genome-sequenced organism without requiring any phenotypic or phylogenetic analysis. We provide examples demonstrating that genome similarity-based codes largely align with current taxonomic groups at many different levels in bacteria, animals, humans, plants, and viruses. Importantly, the proposed approach is only slightly affected by the order of code assignment and can thus provide codes that reflect similarity between organisms and that do not need to be revised upon discovery of new diversity. We envision genome similarity-based codes to complement current biological nomenclature and to provide a universal means to communicate unambiguously about any genome-sequenced organism in fields as diverse as biodiversity research, infectious disease control, human and microbial forensics, animal breed and plant cultivar certification, and human ancestry research.