Interest in microbiology

microbiologyに興味のあるMDです。面白そうな論文を紹介していくつもりです。

がん細菌叢にはご注意を?

"Cancer microbiome"の研究について警鐘を鳴らすプレプリントが 7/30 に報告されている。

www.biorxiv.org

主には、2020年に Nature に掲載されたがん細菌叢の論文(Microbiome analyses of blood and tissues suggest cancer diagnostic approach | Nature)で細菌由来とされているシークエンスは殆がヒト由来であることと、microbiome signature と機械学習を使ってがん種の分類を行う実験はノーマライゼーションの不備(leakが起きている)で信頼できないというお話だった。

 

確かにがん細菌叢、と聞くとクエスチョンが浮かんでいたが、今後はこういう方面の論文は眉唾で見てしまいそうである。実際、プレプリント内でも Nature 論文のデータセットを使った論文をリストして invalid であるという議論が為されている。

 

しかし本日時点で同論文は 464 回引用されている (Google scholar では 587 回!)。

上記のプレプリントはどこかジャーナルに出すのだろうか。Kraken とか、Bracken を開発しているグループですよね。

0801

追記 (2023/08/02)

Poore氏自身による rebuttal analysis が GitHub で公開されている。

github.com

それに対する author らの返答

こういったコミュニケーションがここまで迅速に為されるのも、すごい時代である。



ggpicrust2 なるパッケージが公開されている

微生物叢のfunctional profilingを行うツールの中ではおそらく最もよく使われているであろうPICRUSt2のOutputをいい感じにプロットするRライブラリがarxivで公開されている。色々なパッケージが開発されていて面白い。

arxiv.org

 

(2023/10/11)

Publishされている。

https://academic.oup.com/bioinformatics/article/39/8/btad470/7234609

BioCyc 27.0がリリースされている

BioCyc(というより、MetaCyc)の27.0がリリースされているようだった。早速ダウンロードして確認してみる。

 

引用

前回のリリース以降、MetaCycには新たに24の代謝経路が追加され、2つの既存の経路が改訂され、合計26の新しい・改訂された経路が含まれるようになりました。

MetaCycには、すべての生命ドメインから3085の代謝経路が含まれています。MetaCycには、ミニレビューの要約で合計10,392ページに相当する情報が含まれています。

Extreme valueがあるときのヒートマップ描画

r - how can I avoid extreme when I am trying to plot heatmap of a data - Stack Overflow

 

あまり考えたことが無かったが、データをいじらずに表示するには、確かにこうするしかないか。

 

eggnog-mapperでデータベース関連のエラー

Error: malformed database schema (prots) - near "WITHOUT": syntax error

github.com

sqlite3 まわりのエラーらしい。私は3.7.17でエラーが出たが、上記Issueでは3.30.1を利用している。3.8.2以降であれば問題ないという記載もあるが、それ以前のバージョンでもうまくいくためよく分からない。私は3.36.0にダウングレードして、@TakashiKoyamaさんの

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/path/to/sqlite3/lib

追記でうまくいった。

MMseqs2のeggNOGダウンロードでエラー

Finding maximum sequence length and set size.
Error: msa2profile died

github.com

mambaでインストールしていたが、バージョンによってeggNOGがインストールできない。Sourceからインストールすることで解決した。

github.com