检索基因的注释信息,在我们平常的学习和工作中经常会遇到,现总结归纳一下,好备不时之需。
以human “UST”基因为例。
1、打开NCBI主页,在数据库下拉框中选择”Gene”数据库,然后在边上的文本框中输入”UST”,点击”Search”,如图。
2、由上可进入如下界面,此界面是对检索基因的一个简短描述。首先你要确定基因名称是否是你所搜的基因名称,如果结果的名称不是你搜索的名称,在基因名称别名(Other Aliases)那一行中看有没有你找的基因名称,如果还是没有,重新搜索一下这个基因其它的比较常用的名称。接着需要确认的是结果第一行右边中括号中物种名称是不是你想找的物种,如果只需要你所要物种的结果,可以点击右边栏中相应的物种结果。
3、点击上面每个结果的第一个链接就可进入基因的详细注释信息。首先是一个对基因来源的注释,如下图。
4、接着是基因所在基因组的一个图形化描述(如下图),可以很直观的看到其基因组信息,如6q25.1就是说明在第六条染色体25.1的位置,NC_000006.11是基因的accession号,各种accession命名可参考NCBI中RefSeq各种accession说明,(149068271..149398126)是此基因在其染色体上碱基范围。在右边的Epigenomics链接可以看到这个基因的功能注释信息,如组织表达关系,Cp岛等,MapViewer就像google地图一样,可以看到相邻基因及基因簇及整个染色体的情况,在其界面底下的Map 5: RefSeq Transcripts On Sequence下的Download链接可以得到所在基因簇的基因注释信息。
5、接着下面是基因图形化显示(如下图)。基因组序列一般可以选择NC_开头的和AC_开头的,个人觉得默认的NC_更常用。右上方有三个链接分别可以以三种不同格式显示基因序列,如果对基因只想进行一个宏观的了解,就选择Graphics格式,如果只想得到基因序列就选择FASTA格式,如果想要得到基因的详细注释信息就要选择GeneBank格式,关于GeneBank格式注释说明,可以参考GeneBank序列注释说明。
6、如果想知道其mRNA及编码蛋白信息,可以看下面的NCBI Reference Sequence(RefSeq)信息,下面会列出所有注释过的RefSeq信息,例如想知道mRNA NM_005715.2的注释信息,直接点击就可以看到了。对于通过基因查找mRNA信息这未尚不是一种很好的办法。
还有一些信息就不一一在这里描述了,如果需要,可以进行深入的研究。
看了 很多篇 写得太好了 也很详细 正好给迷茫中的我点亮了希望!