Interest in microbiology

microbiologyに興味のあるMDです。面白そうな論文を紹介していくつもりです。

GWASとLog変換

www.biostars.org

 

Q: GWASを行う前にフェノタイプの分布が正規分布であることを確認する必要があります。もしフェノタイプがLog変換をしたときのみ正規分布であるとしたらどちらのフェノタイプデータを使う必要があるのでしょうか。
 
A: 正解はあなたの持っている(連続値の)フェノタイプデータを見たときにしか言えません。もちろん何の正当性もなくLog変換を全てのデータに行うわけではありません。体重や身長などなどはLog変換で正規分布にすることができればLog変換を行ってもよいですが、1つ1つチェックしなくてはいけません。もちろん良い統計家はLog変換した場合としない場合のどちらもテストしてみて、結果が合致することを祈りますが。心配しなくてはいけないのが、強く歪んだ分布を持つフェノタイプです。例えば体重を例にとると、99%のコホートが75kg未満で、他の1%が150kgより大きい場合は、上位1%を除外して行われるべきです。フェノタイプをグループに分割することもできますが、これは残余交絡を残し、本来であれば扱うことのできた重要な情報を除外してしまう可能性もあります。