POLCA安装与使用

POLCA是约翰霍普金斯大学MaSuRCA (Maryland Super Read Cabog Assembler)项目中组装基因组序列polishing 工具,是 MaSuRCA 的子程序,所以安装 MaSuRCA 可以顺便把POLCA安装了。

  1. MaSuRCA 对perl版本要求比较高,我原来的perl 5.26版本的不行,安装 MaSuRCA时显示 <stdio.h> 库不正确,就在本地安装了一个最新的perl版本5.34, 下载perl-5.34.1.tar.gz 解压后运行 ‘./Configure -des -Dprefix=$HOME/local/perl5.34’(在本用户local目录下安装 ),然后编译, ‘make instll’,perl就安装好了,最后将新安装的perl加入到环境变量中去 (修改 .bashrc文件).
  2. 下载并安装MaSuRCA
wget https://github.com/alekseyzimin/masurca/releases/download/v4.0.9/MaSuRCA-4.0.9.tar.gz
tar xzvf MaSuRCA-4.0.9.tar.gz
cd ./MaSuRCA-4.0.9
sh install.sh
ln -s ~/soft/MaSuRCA-4.0.9/bin/polca.sh ~/bin/polca.sh

3. 运行polca

polca.sh -a draft.fasta -r 'short_reads_1.fq.gz short_reads_2.fq.gz' -t 15 -m 20G &

draft.fasta为需要polishing的基因组,-r后接的二代测序的fastq格式的测序文件,-t后面设置的使用的线程数目,-m后为所使用的最大内存。