アカウント名:
パスワード:
今回のfMRIの場合や遺伝子発現解析(マイクロアレイ)あるいはゲノムワイド遺伝子相関解析(GWAS)の場合のように、多数のパラメータ(測定する、遺伝子数、脳領域数)と比べて少数のサンプルあるいは繰り返しデータしかしかない場合、多重検定の補正が必要になる場合がある。
多重検定に関する問題 それは本当に多重検定なの? [akita-pu.ac.jp]
どうもさる雑誌のひとりのレビューワーがかならず「マイクロアレイによる比較は全てコンテンツ数ぶんの多重比較なので、P値に補正をか>けなければいけない」という考えをお持ちで、学会の大勢がそちらに流れているということらしい。
これのウラがまだとれていないのだけど、もしこれが本当ならとんでもない間違いだと思うので糾そうと考えている。
もし、たとえばBonferroni adjustment をマイクロアレイに適用するなら、p値をコンテンツ数で割らなければならない。もちろんそんな切り方をすれば、有意になる遺伝子はほとんどなくなる。
この問題にウラがとれたら、適切なジャーナルにコメントを送ろうかと考えてい>ます。
この文章の著者の論旨は私には間違っているように思えるのだけど、どうなんでしょうか?
多重検定についていろいろ聞いてみました。 [togetter.com]
ぬばた @nubata2013-01-09 22:21:21@motthy 実はこの問題は随分まえから遺伝子の変動解析は多重検定だという多数はと、それは間違いだという少数派の戦いになっています。http://t.co/ctT1Fq7t
http://t.co/ctT1Fq7t [t.co]は#3044235 [srad.jp]のリンク先と同じ。ということで、このリンク先の趣旨が少数派で、私の考えが多数派ということになるみたい。しかし、こういうことは多数決で決まるものでもないし。そもそも、今現在はこの業界ではどのようになっているのだろうか?
つまり、こういうことでしょうか
fMRIのサンプリング数が少ないのに研究者は論文で結果を出さなければならない
論文書いて統計上わかんないよねって結論は許されない有意な結果で帰結しなければならない
例えば、DNAマイクロアレイの実験では、DNAマイクロアレイ [wikipedia.org]
この分析器具を用いれば、数万から数十万の遺伝子発現を一度に調べることが可能である。
ところで、一回の実験にかかるコストはこれをみると数万円 [chem-agilent.com]のようです。
ということで、膨大な数の遺伝子の発現情報は簡単に得られますが、コスト・時間・手間・材料の調達その他から考えて、数万~数百万のサンプル分のデータを取ることは実質不可能です。その結果として、パラメータの数、すなわち、遺伝子の数は膨大で、それに比べてサンプル数が少なくなってしまうのです。
今回のfMRIの場合も同様で、基本単位のボクセル(ピクセルの立体版)の数が脳MRIデータの統計解析 [jst.go.jp]
例えば1ボクセルあたりのサイズを1.5 mm立方としたとき,121(横)x 145 x(縦)x 121(スライス)= 2,122,945ボクセルとなる
私は全くの素人なので、一回のスキャンにどれだけ時間がかかるか分かりませんが、ボクセル数と同じ200万回やるとすると、一回一秒だとしても、のべ500時間以上かかります。実際には安静にしているときと、何かを見せたりする時など比較するので、もっとかかるでしょう。FMRIの機械は数が少ないので、結局はサンプル数はもっとずっと少なくしか取れない、ということになります。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
犯人はmoriwaka -- Anonymous Coward
多数のパラメータと少数のサンプル / 多重検定 / 第一種過誤 (スコア:1)
今回のfMRIの場合や遺伝子発現解析(マイクロアレイ)あるいはゲノムワイド遺伝子相関解
析(GWAS)の場合のように、多数のパラメータ(測定する、遺伝子数、脳領域数)と比べて少
数のサンプルあるいは繰り返しデータしかしかない場合、多重検定の補正が必要になる場
合がある。
多重検定に関する問題 それは本当に多重検定なの? [akita-pu.ac.jp]
どうもさる雑誌のひとりのレビューワーがかならず
「マイクロアレイによる比較は全てコンテンツ数ぶんの多重比較なので、P値に補正をか>けなければいけない」
という考えをお持ちで、学会の大勢がそちらに流れているということらしい。
これのウラがまだとれていないのだけど、もしこれが本当なら
とんでもない間違いだと思うので糾そうと考えている。
もし、たとえばBonferroni adjustment をマイクロアレイに適用するなら、
p値をコンテンツ数で割らなければならない。
もちろんそんな切り方をすれば、有意になる遺伝子はほとんどなくなる。
この問題にウラがとれたら、適切なジャーナルにコメントを送ろうかと考えてい>ます。
この文章の著者の論旨は私には間違っているように思えるのだけど、どうなんでしょうか?
Re:多数のパラメータと少数のサンプル / 多重検定 / 第一種過誤 (スコア:1)
多重検定についていろいろ聞いてみました。 [togetter.com]
ぬばた @nubata
2013-01-09 22:21:21
@motthy 実はこの問題は随分まえから遺伝子の変動解析は多重検定だという多数はと、それは間違いだという少数派の戦いになっています。http://t.co/ctT1Fq7t
http://t.co/ctT1Fq7t [t.co]は#3044235 [srad.jp]のリンク先と同じ。ということで、このリンク先の趣旨が少数派で、私の考えが多数派ということになるみたい。しかし、こういうことは多数決で決まるものでもないし。そもそも、今現在はこの業界ではどのようになっているのだろうか?
Re: (スコア:0)
つまり、こういうことでしょうか
fMRIのサンプリング数が少ないのに
研究者は論文で結果を出さなければならない
論文書いて統計上わかんないよねって結論は許されない
有意な結果で帰結しなければならない
Re:多数のパラメータと少数のサンプル / 多重検定 / 第一種過誤 (スコア:1)
例えば、DNAマイクロアレイの実験では、
DNAマイクロアレイ [wikipedia.org]
この分析器具を用いれば、数万から数十万の遺伝子発現を一度に調べることが可能である。
ところで、一回の実験にかかるコストはこれをみると数万円 [chem-agilent.com]のようです。
ということで、膨大な数の遺伝子の発現情報は簡単に得られますが、コスト・時間・手間・材料の調達その他から考えて、数万~数百万のサンプル分のデータを取ることは実質不可能です。その結果として、パラメータの数、すなわち、遺伝子の数は膨大で、それに比べてサンプル数が少なくなってしまうのです。
今回のfMRIの場合も同様で、基本単位のボクセル(ピクセルの立体版)の数が
脳MRIデータの統計解析 [jst.go.jp]
例えば1ボクセルあたりのサイズを1.5 mm立方としたとき,121(横)x 145 x(縦)x 121(スライス)= 2,122,945ボクセルとなる
私は全くの素人なので、一回のスキャンにどれだけ時間がかかるか分かりませんが、ボクセル数と同じ200万回やるとすると、一回一秒だとしても、のべ500時間以上かかります。実際には安静にしているときと、何かを見せたりする時など比較するので、もっとかかるでしょう。FMRIの機械は数が少ないので、結局はサンプル数はもっとずっと少なくしか取れない、ということになります。