利用UCSC对序列进行定位

如果你有一段序列,想知道在基因组的位置,或者想进行基因定位,一般都是用NCBI的在线Blast,但Blast不仅速度慢,而且结果较多,很难找到想要的东西。如果你的序列是脊柱动物的,那么用UCSC的Blat会非常方便。

首先打开其页面http://genome.ucsc.edu/cgi-bin/hgBlat?command=start,在第一个下拉框中选择对应的物种,目前UCSC包含大部已测序的脊柱动物,线虫,微生物的注释信息,然后在第二个下拉框中选择对应的注释版本,如对于Human,NCBI37对应hg19,如果你想比较你的序列定位信息,要特别留意这个版本号。其它的不需要改,在下面文本框中填入你的序列后,点击下面的”submit”就可以了,序列长度要大于30bp,序列有空格,分行符,数字,大小写不统一,是不是Fast格式都没关系,系统会忽略掉的。

在接下来的结果页面,第一结果往往就是最好的结果,看一下 IDENTITY 那列是不是100%,SPAN列是不是你序列的长度,如果第二结果或者第三个结果和第一个结果一样都是100%,SPAN长度也和你的序列长度一样,那说明你的序列不具有特异性,存在于多个位置。如果IDENTITY没有100%,但有98%以上,且SPAN长度和你序列差不多,那么你的序列和标准序列有高同源性,基因位置也基本一样。点击ACTIONS列下的detail链接就可以看到序列的详细信息。browser链接图形显示序列在整个基因组的位置,点击那些条条就可看到相关信息。在图形下面那些众多的下拉框中,你想显示哪个就将hide改成dense或者pack然后点上面的refresh,就可在上面的图形中找到对应的东东了。图形界面的“<”和“>”可以放大和缩小基因组范围。

发表评论

电子邮件地址不会被公开。