PICRUSt1の後継、PICRUSt2を最近使用し始めた。
微生物叢(16Sの場合、細菌叢)内に存在するgene familiesやパスウェイを16S amplicon sequencing dataから予測するツールである。
GG13_5に対してpickされたOTUだけでなくAmplicon Sequence Variantsも入力として用いることが出来る(1もGG13_5に対してClosed Reference OTU pickingすれば動く)。Piphillin(Piphillin: Improved Prediction of Metagenomic Content by Direct Inference from Human Microbiomes)もASVを入力として使用できる。
Canadian Bioinformatics Workshops (CBW) 2018で行われたチュートリアル(CBW 2018 PICRUSt2 Tutorial · LangilleLab/microbiome_helper Wiki · GitHub)がGitHubに上がっているので、こちらを参考にする。有り難や。インストールから、Pathwayの予測まで全て下記に詳細に示されています。
place_seqs.py -s ASVs.fna -o tutorial.tre --threads 1 --intermediate place_seqs_working hsp.py -i 16S -n -t tutorial.tre -o 16S_predicted -m mp -n --seed 100 hsp.py -i KO -t tutorial.tre -o KO_predicted -p 1-m mp --seed 100 metagenome_pipeline.py -i ASV_abun.tsv -f KO_predicted.tsv -m 16S_predicted.tsv -p 1
注意点として、dependenciesで、gappaとepa-ngをインストールする必要があるのだけど、GitHub内最新バージョンを使用するとモデルパラメータを指定するようにエラーが出て動かないので、cloneしたpicrust2のフォルダ内にあるepa-ngとgappaをmakeしましょう。(チュートリアルにしっかり書いてあるのに無視してました。。)
また16SのHSPを行う際に、-nを指定し忘れると下流でNSTIが算出されない事態になるので、-nは指定しましょう。