SPMでの「1対多」の解析

臨床では、1人の症例で健常者と比較して容積低下部位を求めたいことがあります。
SPMでどのようにするかというと、シンプルです。

  • DesignはTwo sample t-testを用います
  • Group 1に1例のみ選びます
  • Group 2に健常者の複数の画像を指定します
  • IndependenceはYesを選びます
  • (ここがキモ)VarianceはEqualを選びます。もし、Unequalにするとエラーとなります。1例では分散を計算することができないからです。

そうすると、Design matrixを作るための設定画面は下図のようになるはずです。

SingleCase

これを普通にEstimateして、Contrast managerで症例の容積が低下している領域を求めたかったら、[-1 1]とすれば大丈夫です。

Twitterで疑問を投げかけてくださった@silverjet_jpさん、ありがとうございました。

16 thoughts on “SPMでの「1対多」の解析

  1. 瀬尾和秀です。

    根本先生
    ご教授してくださり、ありがとうございます。
    まず、total grey matter volumeで正規性を確認してみようと思います。

    SnPM13に関してなのですが、Basic ModelsをS2 Groups Two sample T Test; 1 scan per subjectを選択した後の設定項目なのですが、Number of Permutations、variance smoothing、Memory usage といったspmのTwo sample T Testにはない項目がありまして、どのようなものでどのように設定すれば良いでしょうか。また、そのほかの項目はspmでの設定(自分は先生の著書の設定と先生が1対多で教えてくださっている設定で行っています。)と同様で大丈夫でしょうか。
    Compute、InferenceともにEstimate、Resultsと設定に違う項目があり、その設定についてもご教授していただけないでしょうか。

    お忙しいところ大変恐縮ですが、宜しくお願い致します。

    • 瀬尾先生
      このコメントがspam判定されていました。あとで、返信します。

    • 瀬尾先生

      SnPMに関してですが、各項目にヘルプがついていますので、そちらを確認されたらどうでしょうか。
      Number of Permutations ですが、ヘルプにThe recommended number of permutations is 10,000. と明記されています。
      Variance smoothing については、”Try stting FWHM equal to the original smoothing applied to the data” とあります。
      Memoryについても書いてありますので、どうぞそちらをご確認ください。

      • 根本先生

        瀬尾和秀です。ご教授していただきまして、誠にありがとうございます。先生がご教授してくださったところを参照してみようと思います。脳画像解析始めてまだ、日が浅く、ソフトウェア、数理統計、その他もろもろに不慣れなところがありますが、脳画像解析はとても楽しいものでやりがいもあるので、これからも頑張っていきたいと思います。いつも、先生がHP,著作で教えてくださるので、とても助かっています。これからも先生から色々と学ばせていただけたら、幸いです。これからもどうかよろしくお願いいたします。

  2. 根本先生
    瀬尾和秀です。度々の質問失礼致します。現在、患者群1例対正常群28例(患者年齢±1性別一致)をVBMで萎縮を評価していまして、統計デザインをTwo sample t-testにしてを行っているのですが、正常群の数があまり多くなく母集団の分布を反映しきれていないと考えた場合にはノンパラメトリック検定に変更してSnPM13等を用いて検定を行なった方が良いのでしょうか。統計初学者で不理解な点が多く申し訳有りません。また、SnPM13のVBMでの使用の経験がありましたら、教えていただけないでしょうか。不躾なお願いで恐縮ですが、何卒よろしくおねがいいたします。

    • 瀬尾先生

      ご質問に対してですが、
      まず、先生のお持ちのサンプルを使って、どこか適当な領域のボクセル値を抜き出してその正規性を確認されたらいいかと思います。
      特定でなくても、total grey matter volumeでもいいかもしれません。get_totalsのようなスクリプトを使えばすぐにできます。

      それで、正規性が確認できないのであれば、Non-parametricが望ましいですから、SnPMのような方法になるでしょうか。

      SnPMでどのようなことが知りたいのでしょうか?
      もう少しSpecificに教えていただけたらと思います。

      最初、インストールする際に、SnPM13のディレクトリ名を snpm に変えていただくことが肝要です。
      あとは

      SPM SnPM
      Basic Models Specifyからモデルを選択
      Estimate Compute
      Results Inference

      の関係とみていただければいいかと思います。

  3. お忙しいはずですのに丁寧で迅速なご回答をいただきありがとうございます! 驚きました。計算過程について理解できて助かります。

    ただ勉強不足で文献を読み逃したかもしれませんが、一例が所属する群の分散と多数の健常者が所属する群の分散とが等しいという判断の決め手が、よく分かりません。

    先生の配布してくださったLin4neuroも愛用させていただいております。NPMマニュアルを読みBrunner Munzel検定を知り、この検定が少数に使用される誤りを指摘する論文を読みました。Student T検定は、皆使っているので、何か特殊な解決策があるのかもしれません。

    症例が多数集まり分散が明らかになり解析された脳部位が分かれば、正しさを推定できると私は初め愚考しましたが、一例の臨床症例を評価したいので困ってしまいます。

    正規分布ならT検定よりZ scoreの方が正確な表現だと、私は信じましたが、T検定を利用される理論もわかり幸いです。

    健常群のdicomと1症例のdicomが手元にあれば、一例対多数のZ score画像とT検定の画像とを比較できるのですが、症例報告を考えていたのでjpeg画像しか手元になく、残念です。

    臨床の症例報告で指導者も多忙でデータ提供を依頼できず、私の力不足で放射線科部長からデータ提供されるほどの信頼を勝ち得ていない限界を感じております。

    質問させていただき、混乱から抜け出せて感謝しております。Z score画像を掲載している雑誌を狙うという、次の目標もできました。

    先生の思考過程はクリアで、いつもながらわかりやすいご説明です。貴重なお時間をありがとうございました。

    • >> 一例が所属する群の分散と多数の健常者が所属する群の分散とが等しいという判断の決め手が、よく分かりません。

      これについてですが、一例が所属する群の分散はまったく推測不可能なわけです。
      このため、「健常者の所属する群の分散と等しいだろう」と等分散を仮定していると考えてもらえたらと思います。

      書き込まれている内容を拝見する限り、Z-score画像でよしとする雑誌を狙われるのが最善かと思われます。
      めげずに励まれてください。

      • 長文で失礼いたしました。

        特殊な統計があるのかなど理論が分からずファンタジーに取り憑かれて悩んでいましたが、目が覚めました。

        解析していると不等分散の方が珍しいかもしれません。解析できるデータがありませんが、一例対多数解析の限界を抱えつつ、T検定という選択肢があるのかもしれず勉強になりました。

        安心して質問して、ご回答下さり育てていただける環境を貴重だと思い、感謝しております。頑張ります。

  4. お忙しいなか、深い理解力で助けてくださり感謝いたします。なるほど表現への配慮がもっと必要だったかもしれず、反省しています。

    まずZ testとZ scoreの誤解について、ご指摘の通りだと思います。文章を練りなおします。

    次に一対多数にT検定を使うSPM計算式の理解には、もう少し時間がかかりそうです。私の理解力が低く、残念です。

    さらにZ score画像の症例報告をZ scoreを用いないレビュアにご理解いただく説明能力を身につけるため、過去の文献を探し学びます。

    出来るならZ score画像やT検定は、詳細な部位まで検討できて興味深いので、手法のメリットや限界を説明できるよう学びたいものです。

    研究と違う症例報告では、jpeg画像の他、データ提供を放射線部へ依頼し難いですが、助けていただきつつ理解を進めることができて幸いでした。

    今後もご活躍を祈念しています。

    • SPMのt検定は、一般のt検定と特に変わりません。
      ただ、1対多数の場合、1例が、分散は特にありませんので、分散が等しいと仮定します。
      分散が等しいという仮定は、Studentのt検定と同一ですので、
      1対多数の検定は、Studentのt検定を行っていると同じということになります。

      具体的には、
      1例をX、コントロール群をY1, Y2, … Ynとします。
      このとき標本サイズは1例は当然1、コントロール群はnとなります。

      最初に、コントロール群の平均Ymeanおよび普遍分散Uyを求めます。
      そして、両群をあわせた分散の推定値ですが、今、症例が1しかないので、Uyで代用します。

      で、このとき、t統計量は、

      t = | X – Ymean | / √Uy(1+1/n)

      で計算されます。

      分母の1+1/nは、nが多いほど、1に近づくわけですので、nが十分大きかったら、

      t = | X – Ymean | / √Uy

      と表示できます。症例データから、コントロール群の平均値をひき、そして、コントロール群の分散の平方根で割ったものがt値になるということですね。

      WikipediaでT検定のところを見ていただき、等分散の場合のところで、mを1にしていただくと、より、上記の説明の理解が深まるのではないかと思います。
      http://ja.wikipedia.org/wiki/T%E6%A4%9C%E5%AE%9A

  5. 匿名で失礼いたします。初めて質問させていただきます。初心者すぎる質問で恥ずかしい限りです。

    書籍を購入いたしました。5年前からブログを通じてお世話になっており、いつも励まされる思いがして感謝しております。

    本題です。T検定を一対多数に使うのは、ひょっとすると普通の統計ではないかもしれませんがSPMに特殊な統計技法があるのでしょうか?

    最近、eZIS画像の症例報告を北欧の雑誌に投稿して落ちまして、Z score画像を一例対多数に使うなら平均画像を添付するよう、また統計の誤りだからT検定を使うよう、レビュアから助言をいただき、戸惑っておりました。

    日本ではZ score画像がよく使われておりますし、T検定よりZ scoreで提示したほうが正しいのではないかと個人的には思っていました。

    一例対多数の正しい統計処理を調べきれず、Z scoreがよいのか、T検定がよいのか、どちらも統計学的に若干問題があるように愚考いたしますが、どのように解釈すれば良いのでしょう。

    たしかに北欧の雑誌や学会では、一例対多数にSPMのT検定を利用されていて、北欧の慣習ではT検定なのかもしれません。

    ソフトには入力できますが、正しい統計なのか、私の理解力不足です。

    ご多忙ではないかと思います。お手隙の際、ご教示いただけますと幸いです。まとまらない文章で長文となり、失礼いたしました。

    • ご質問ありがとうございます。また、書籍も購入していただきありがとうございます。

      eZISとSPMの違いについての理解が必要となります。

      eZISは統計学的な検定を行っていません。
      Z-scoreは、以下によって求められます。

      Z-score = ( Subj – ノーマルデータベース平均 ) / ( ノーマルデータベース標準偏差 )

      これで、わかるのは、ノーマルデータベースの平均と標準偏差を用いれば、Z-scoreが求まるということです。

      これは「Z検定ではないか」と思われるところもあるかもしれません。

      しかし、Z検定であるためには、母集団の平均および標準偏差が既知であるということが必要です。
      しかし、母集団の平均を知ることは困難です。(もし、先生が60代の方々の研究をされているとしたら、母集団は、日本人の60代の人全員となります)

      母集団の平均を知ることができない場合、代わりにT検定を行います。

      先生が論文にどのように記載したかによると思うのですが、もし、単にZ-scoreと書かれた場合、
      Reviewerは、それをZ検定と理解した可能性があります。そうすると、母集団がわからないわけだから、この検定は誤りであり、
      T検定を使うようにという話になるわけです。

      ということで、もし、きちんと検定をして、その結果を報告されたいのでしたら、このブログにありますように、SPMで1対多のT検定を行い、その結果を報告されるのがいいと思います。

      今、ざっと書いただけなので、説明が不十分なところがあるかもしれません。
      わからないところは、さらにお聞きいただければと思います。

      実際、ここのところを理解している人は少ないと思いますので、
      このコメントのやりとりは、多くの人のためになると思います。
      よろしくお願いします。

  6. いつもご指導いただき、ありがとうございます。
    1対多の解析をいくつか私もやってみましたが、面白い結果が得られました。
    VSRADも基本的には同じ原理と理解してよいのでしょうか?
    VBMで1対多の解析をやる場合は、比較対象として同じ性で近い年齢の健常者を集めて、比較するとよさそうですが、多重比較補正のところは複数対複数の場合と同じように考えてよいでしょうか?SPMを用いた1対多の解析の臨床での応用例などあれば知りたいです。
    まとまりない文章ですみません。

    • 猪狩先生

      SPMでの1対多の解析とVSRADの違いですが、

      SPM:一般線形モデルを利用してt検定を行っている
      VSRAD:t検定は行っていない

      というのが一番の違いです。

      VSRADはZ値を計算します。

      このためには、ノーマルデータベースの各ボクセルの平均値と標準偏差が必要となります。逆に言えば、これさえあれば大丈夫です。

      具体的には、症例データも、ノーマルデータベースも、比例スケーリングを行った後、

      Z-socre = (症例データ ー ノーマルデータベース平均値)/(ノーマルデータベース標準偏差)

      の計算からZ-scoreを求めます。

      これは非常に簡便ですが、共変量を扱うことができません。

      一方、SPMでの方法は、一般線形モデルを利用していますので、詳細は割愛しますが、共変量を取り扱うことができます。

      そのような観点でとらえたらいかがでしょうか?

      • 根本先生

        VSRADとの違いについて分かりやすく解説していただき、ありがとうございました。
        それぞれのメリット、デメリットについてまとめていただき、Z-socreについても理解が深まりました。周囲の先生にもさっそく伝えようと思います。

コメントを残す