共変量⊂Covariateではあるが、共変量=Covariateではない

SPMを使っていると、Covariateという単語がよく出てきます。
Covariateを日本語に訳すと、「共変量」となりますが、SPMでのCovariateはもうちょっと広い気がしていました。
Matthew BrettのIntroduction to SPM statisticsを翻訳したものに対し、他の先生方からご指摘をいただき、改めて検討してみました。

Wikipedia英語版では、covariateについて以下のように説明されています。

In statistics, a covariate is a variable that is possibly predictive of the outcome under study. A covariate may be of direct interest or it may be a confounding or interacting variable.

ここで、covariateは結果を予測する変数であり、直接関心のある変数のこともあれば、そうでないこともあると書かれています。日本語の「共変量」の意味するところは、後者のことだけを指しますので、英語のcovariateの方が広義ということになります。

Wikipediaに戻ります。

The alternative terms explanatory variable , independent variable , or predictor, are used in a regression analysis . In econometrics , the term “control variable” is usually used instead of “covariate”.

上記で述べたように、covariateは説明変数、独立変数、予測因子とも表現されると書かれています。

さらに、以下のようにも述べられています。

In a more specific usage, a covariate is a secondary variable that can affect the relationship between the dependent variable and other independent variables of primary interest.

ここで、「より狭義の意味では、covariateは従属変数と最も関心のある独立変数との関係に影響を与える二次的な変数である」となっています。これがまさに日本語に訳されるところの「共変量」ということになります。

つまり、covariateには、広義のcovariateと狭義のcovariateがあり、狭義のcovariateは日本語で言うところの共変量を指し、広義のcovariateは、回帰分析における説明変数のような変数も入ってくるわけです。

ということで、タイトルになるわけですが、SPMにおいては、共変量⊂Covariateではあるが、共変量=Covariateではないということに注意が必要です。
説明をするときには気をつける必要がありますね。

Print Friendly, PDF & Email

7 thoughts on “共変量⊂Covariateではあるが、共変量=Covariateではない

  1. 突然すみません。spmを使用して研究しているものです。質問なのですが、covariateをたとえば、3つ入れたいとき、関係をみたいcovariateと関係しているcovariateは、回帰式にいれてはいけないのでしょうか。

    • ご質問ありがとうございます。
      一般線形モデルにおいては、各々の変数が独立であることが前提になっているようです。
      もし、共変量同士が強く相関してしまっている場合、各々の共変量に対する係数を正しく評価することができなくなってしまいます。
      その点から、共変量同士に強い相関がないかどうかを検討することは大事になってきます。

      ご質問の答えになっていますでしょうか?

      • まさにお聞きしたかったことそのものでした。
        もやもやがすっきりしました!ありがとうございます。
        ただ、covariate of interestと相関しているcovariate of no interestも同時にcovariateに入れた時、自分の仮説にあった場所がばっちり有意にでてくれるのですが、相関しているものをcovariateから省いてしまうとまったく違うところが光ってしまうのです。。。
        くどいのですが、covariateを自分のよい仮説に合うように入れるのは、やはりいけないことでしょうか。。。というのも、論文をみると、methodに、お互いに独立であったとわざわざ書かれているものは少ないように思ったのですが…

        • この問題に関しては、「多重共線性multicollinearity」という言葉がキーワードになります。
          SPM correlated regressorsあたりで検索していただくといろいろ出てきます。

          ひとつのいい説明は下記のスライドでしょうか。

          http://www.fil.ion.ucl.ac.uk/~mgray/Presentations/Correlated%20Regressors%20&%20Multicollinearity.ppt

          ただ、先生のやり方が全くダメというわけではありません。
          SPMが、できるだけmulticollinearityの問題を減らすことができるように内部で調整しているからです。
          (と私は理解しています)

          下記に少し説明があります。

          http://www.sbirc.ed.ac.uk/cyril/SPM-course/Talks/2013/1-GLM-CP.pdf

          もし、完全に相関しているr=1ならば、not estimableとなってしまいますが、
          そこまで強い相関でなければ、多重共線性の問題を回避できるようにSPMが適切なβを設定できるように計算してくれます。

          実際、先生のモデルの場合、年齢をcovariate of no interestとして扱った方が、

          「年齢では説明がつかない、covariate of interestと相関する領域を求めた」と言えるわけですよね。

          なので、私の考えでは、入れることは間違いではないし、むしろ入れたほうがいいと思います。

          ただ、先生の表現の、
          「covariateを自分のよい仮説に合うように入れるのは、やはりいけないことでしょうか。。。」
          に関しては、文字だけのコミュニケーションですので、先生の真意が伝わりにくいですが、
          違和感を覚えます。恣意的に共変量を選んでいると誤解されかねないからです。

          共変量を恣意的に選ぶのではなく、
          統計モデルを考えていくうえで、
          「これは影響する可能性がある」と考えられるものを、covariate of no interestとして
          入れたという姿勢がよいと思います。

          以上、よろしくお願いします。

          • すっきりしました!
            まさにお聞きしたかったそのものでした!
            ありがとうございます!
            これからも先生の本を読んで頑張ります!

  2. covariateの説明すごくわかりやすかったです。ありがとうございます。

    • econ_m様
      コメントどうもありがとうございます。多少はお役に立てたようでうれしいです。
      今後ともよろしくお願い致します。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください