-- 作者:admin
-- 发布时间:9/23/2004 2:05:00 AM
-- 大会摘要(4)
大会摘要(4) 发信人: happymood (土豆块儿), 信区: Bioinformatics 标 题: 大会摘要(4) 发信站: 北大未名站 (2001年04月15日22:19:32 星期天), 站内信件 发信人: tider (行者), 信区: LifeScience 标 题: 生物信息软件集成和开发 发信站: BBS 水木清华站 (Fri Apr 13 01:32:06 2001) 合 生物信息软件集成和开发 (2001-04-12 15:15:07) ---------------------------------------------------------------------------- ---- 新生命网站 随着生物信息学在生命科学和生物技术研究开发中发挥出日益重要的作用, 生物信息学常用软件已经成了生物学工作者必备工具。许多国际著名生物信息中心通过 计算机网络提供数据库检索和数据库搜索等服务。1997年以来,在国内有关部门和欧洲 分子生物学网络组织的支持和帮助下,以教育科研华北地区主节点为支撑,北京大学生 物信息中心逐步建立了一套比较完备的生物信息服务系统,为国内及周边地区的用户提 供生物信息学资源和综合服务,并在此基础上进行生物信息软件工具的集成和开发。 他们建立的生物信息资源服务系统基于UNIX平台,包括数据库检索系统SRS、数据库下载 服务FTP、以及数据库搜索系统BLAST。这三个系统相互联系,是分子生物学数据库应用 的主要组成部分。为保证国内用户及时使用最新的数据资源,首先必须解决数据同步更 新的问题。对于最常用并且数据量最大的核酸序列数据库EMBL和蛋白质三级结构数据库 PDB,做到每日更新;蛋白质序列数据库SWISSPROT和TREMBL每周更新。所有更新后的数 据随时公布在FTP服务器上,同时对新数据建立SRS索引,然后通过EMBL-FASTA-BLAST一 系列格式转换,保证用户能通过BLAST搜索到最新的数据。 尽管目前已经有了许多基于PC机WINDOWS的序列分析软件,但PC机的计算和存储能力无法 和基于UNIX系统的大型服务器相比,特别是随着数据库容量的快速增长,大规模的序列 比对和数据库搜索必须通过高性能服务器才能实现。为此,他们分别在基于SMP的SUN35 00服务器(4个处理器、4GB内存、350GB磁盘空间)和国产曙光2000高性能服务器(4个节点 、8个处理器、5GB内存,400GB磁盘阵列)上对分子生物信息软件的开发和集成进行了尝 试并获得了初步结果。 他们已开发的基于WWW界面的生物信息软件包括:序列数据格式转换程序、DNA互补序列 转换程序、DNA序列碱基组成分析程序、蛋白质氨基酸组成分析程序、DNA序列GC含量分 析程序、DNA到蛋白质翻译程序和DNA序列开放阅读架查找程序等。这些程序用Perl编写 ,通过CGI接口与用户交互,并提供图形结果,便于用户分析使用。并进行了BLAST和FA STA等程序的集成和WWW接口的开发。BLAST是用于DNA和蛋白质序列相似性搜索的重要工 具。许多国际著名生物信息中心都提供BLAST服务。他们用Perl编写用户接口和结果优化 程序。结果优化包括两个方面,一是提供独特的图形结果,用不同颜色标记匹配区域在 检测序列和目标序列上的位置和所占比例,使用户对搜索到的序列与检测序列的相似程 度以及相似区域在各自序列中的位置等信息一目了然;二是通过目标序列编号与SRS系统 相应数据库链接,用户可以同时得到检测序列和目标序列的详细注释信息。目前,提供 BLAST搜索的数据库包括EMBL核酸数据库和SWISSPROT、PIR、OWL以及TREMBL蛋白数据库 。该服务器已为国内用户提供了大量数据库搜索服务。同时,他们基于国产曙光高性能 计算机,实现了BLAST的并行计算,大大提高了这一数据库搜索工具的运算效率和处理能 力,同时也为生物信息学软件的并行化和国产高性能服务器的推广作了有意的尝试。( 摘自全国首届生物信息学大会) -- -- ※ 来源:·北大未名站 bbs.pku.edu.cn·[FROM: 166.111.185.231]
|