如何搭建一个网页版的BLAST服务器

如何搭建一个网页版的BLAST服务器

胖丫今天跟我说:“师兄,再来给我调调网络呗?公共BLAST服务器太慢了,半天刷新不出来!”我说:“我们这是百兆宽带到桌面,刷新慢不是网络的问题,是你离人家的服务器太远了!L”胖丫一脸委屈的说:“要不我去人家有服务器的实验室申请个博士读读?”。“……”

不知道大家平时用公共BLAST服务器时有没有遇到刷新慢的问题?或者想比对一些公共数据库中没有的个性化数据?今天,我们这里写一个简单教程,来教大家搭建一个网页版(图形界面)BLAST服务器,用来解决上述问题(当然,也可以解决胖丫读博士的问题)。在搭建BLAST服务器之前,你应该先准备一个Ubuntu(Linux)系统。至于Ubuntu系统的安装,网上有很多教程,大家可以自行搜索,比如。当然,你也可以将Ubuntu系统安装到自己电脑的虚拟机里。如果只是用来做BLAST服务器的话,对电脑硬件的要求着实不高,平时实验室用的台式机就好。

系统安装好之后,我们就可以开始安装BLAST服务器了,这类软件有wwwblast、viroBLAST和Sequenceserver (http://www.sequenceserver.com)。前面我们我们已经介绍过viroBLAST的安装及使用(本地网页版blast),今天介绍Sequenceserver。Sequenceserver相当于NCBI-BLAST(ncbi-blast+)的前端图形交互界面,是用Ruby语言写的,因此在安装之前应该先安装Ruby、Ruby编译环境(ruby-dev)以及Rbuy的软件包管理系统(rubygems-integration)。大家可以在bash里面输入下面的命令(命令输入完毕后要按回车执行 #开头的行是命令说明):

#安装依赖软件包

sudo apt install ncbi-blast+ ruby ruby-dev rubygems-integration

#安装sequenceserver软件

sudo gem install sequenceserver

这样软件就安装好了!接下来我们需要准备序列文件,也就是你要检索的数据库。一般来说,我们可以从公共的数据库比如EnsemblPlants()、NCBI、EBI等,下载fasta格式(压缩后为fa.gz格式)的文件,这里我们以水稻的第10号染色体为例,简单演示一下数据库的准备:

#利用wget命令从EnsemblPlants网站下载水稻10号染色体序列

wget -c ftp://ftp.ensemblgenomes.org/pub/plants/release-32/fasta/oryza_sativa/dna/Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz

#解压缩,就是将fa.gz文件加压为fa文件

gunzip Oryza_sativa.IRGSP-1.0.dna.chromosome.10.fa.gz

#利用sequenceserver格式化数据库, “./”代表序列文件存储在当前目录,要注意命令中的空格

sequenceserver -d ./ -m

输入 sequenceserver-d./-m命令后,屏幕会出现类似下面的信息(汉字是操作说明)

数据库准备完毕之后就可以运行Sequenceserver了,命令也非常简单:

sequenceserver -d ./  #运行sequenceserver,比格式化数据库少了一个 –m 参数

最后一步就是用网页浏览器,比如chrome、firefox等打开网页版服务器了:

在浏览器地址栏里输入 127.0.0.1:4567 #本机访问本机可以用这个地址,如果局域网内的其它机器访问的话需要先查出服务器的IP地址,命令为 ifconfig,然后将127.0.0.1替换为相应的IP地址。下图中eth0的IP地址为 192.168.0.104,在浏览器中输入 192.168.0.104:4567 即可(lo为回环网卡,请忽略:))。

接下来就和普通的NCBI-blast类似了。

有关blast话题的我们说过不少,还请参见以前的一些推送。有问题可以留言或进群讨论。

SRA数据的下载以及在线blast--或许与你了解的不一样

在NCBI上blast野生二粒小麦基因组序列

get blast新技能

加速蛋白比对

节节麦基因组数据使用和下载

欢迎关注“小麦研究联盟”,了解小麦新进展

想要加入教师群的老师或博后,请扫描下方二维码,加我们的小萌萌为好友,审核通过之后,再拉进群。