加速疾病和癌症治疗靶点检测的软件
【字体: 大 中 小 】 时间:2014年12月04日 来源:生物通
编辑推荐:
最近,洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)发布了强大的、屡获殊荣的生物信息学软件Sequedex的更新版本,现在该软件能够识别来自病毒和生命树所有部分的DNA。
生物通报道:最近,洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)发布了强大的、屡获殊荣的生物信息学软件Sequedex的更新版本,现在该软件能够识别来自病毒和生命树所有部分的DNA,从而可解决各种各样的问题,例如鉴定病原体引起的疾病、为癌症治疗选择治疗靶点、在卫生保健专业人员、研究人员等相对容易达到的范围内优化藻场产量。
Los Alamos国家实验室理论生物学和生物物理学小组科学家Ben Mcmahon称:“作为我们测试的一部分,我们使用Sequedex识别非洲一位合作者临床血样中的病毒序列。经过一个下午,该软件已经发现了一种致命的狂犬病毒,如果使用传统方法这将需要几周的时间。现在,Sequedex软件可以在每百万水平上识别测序样本中病毒和真菌的序列。”
Sequedex的新版本V 1,可识别短DNA序列中的模式,然后将这些序列与系统发生——样本在生命进化树上的定位——和片段功能联系起来。从进化的角度而言,“生命之树”代表现代物种与其共同祖先之间的遗传差异。基于DNA模式的识别,该软件可创建结果的数据库。
Sequedex分类片段的速度比传统方法快250,000倍。利用Sequedex,一台笔记本电脑可以比现有产生DNA序列的的DNA测序仪更快地分析DNA序列。Los Alamos研究人员设计了一种软件来进行生物信息学分析,而无需生物信息学者来进行计算和解释结果。
Sequedex可以Web浏览器搜索的相同方式, 在DNA序列集合中分析系统发生和功能。例如,在Google中,输入搜索关键词plumber、Smith和Chicago,你可能搜索到芝加哥一名叫Smith的水电工;同样,Sequedex使用以前已分类基因组产生的检索词名单,将系统发生和功能与DNA序列联系起来。Sequedex所产生的检索词被进化而选择,在这种意义上,它们必须存在于多个基因组中。每个检索词也与生命之树的一个分支、以及一组或多个生物功能有关。
例如,在每个氨基酸每个字母的一个代码中,蛋白质模式“CVELAHEIRS”存在于人类和小鼠中,所以Sequedex将其与系统分类的脊索动物联系起来,人类和小鼠都属于此类。在人类中,CVELAHEIRS存在于被归类为“Regulator of G-protein Signaling" (or RGS for short)”的蛋白质中,所以Sequedex也与具有RGS功能的检索词有关。当Sequedex在一段DNA序列(通过遗传密码翻译成蛋白质序列)中发现CVEHLAHEIRS时,它能够识别可能来自于脊索动物RGS的序列。
在一段DNA中随机偶然发现CVELAHEIRS的可能性很小,所以,即使当搜索词来自于Sequedex并不了解的一个生物体(例如耗牛、杀人鲸和裸鼹鼠,目前都不在Sequedex数据库里,但是它们基因组中都有CVELAHEIRS)时,该软件仍然有很大的可能性做出正确的谱系和功能鉴定。
Sequedex有望用于识别临床样本中的传染病;表征人体内被其他生物共享的空间,以及这些所谓的微生物组如何与疾病或健康相关;为了化疗选择或预后,分析肿瘤遗传学。Sequedex V1的其他特征包括,自我更新能力和绘制结果图。然而,该软件现在仅仅是作为一种研究工具,它不能用于诊断疾病或其他情况。
(生物通:王英)
延伸阅读:基因组学软件Samtools的重要升级将支持全球数据共享
Sequedex V1 is available under a free six-month demonstration license. It may be downloaded from: sequedex.lanl.gov
知名企业招聘