単に年齢の項だけでなく、これら「2乗」や「マイナス2乗」の項を加える理由は何なのでしょうか。また、どういうときにこれらの項を加えると説明力が増すと考えられるのでしょうか。それらの論文を読んでも、読者には理由がわかるものと考えているのか、とくに理由が書いてありません。この理由をわかりやすく教えていただけませんでしょうか。
http://keijisaito.info/econ/jp/excel_ols/idea.htm
簡単に言えば、より当てはまりの良い直線を描くために二乗するのです。
上のリンクの「1.1 差分の二乗和を最小化」に例があるように、
「回帰分析とも言われる最小二乗法は、二乗することで
全ての差分をプラスにしてから総和を最小化する」することによって、
当てはまりの良い直線を描くことができます。
年齢と所得または貯蓄の関係が非線形(年齢が上がるほど所得/貯蓄が急増する)であるため、年齢を二乗化することで線形にしているのではないかと思います。つまり、家計収入/支出(消費)に関わる議論の中で、線形化したいがために、年齢を二乗化しているのではないでしょうか。
「郵政研究所ディスカッション・ペーパー・シリーズ No1998-09」の中で、このことについて触れられています。
ただ、これはバブル期以前の話で、年齢別サラリーマンの平均年収などを見てみると、いまや、年齢と所得は線形の関係にあるように見えます。
ありがとうございました。計量分析には不慣れなので納得できました。
NO.2 の方がいうように、ある時期・ある地方の経済状況を観察していたところ、
「年齢が上がるほど所得/貯蓄が急増する」という事実があったとします。
これを説明するには「所得=定数x年齢」ではダメで、はてどうやったらよいか。
「所得=定数x年齢x年齢の平方根」(つまり1.5乗)、「所得=定数x年齢の2乗」などを試して見て、NO.1の方がいうように、「より当てはまりの良い直線を描くために」は二乗するのがよいのが分かったのでしょう。
ですから、観測事実をもっともよく説明する=グラフにおいて「当てはまりを良くする」こととして二乗をもってきたので、学者はあとから、「なぜ二乗なのか」の理論を考えるわけです。
参考になります。ありがとうございました。
>「所得=定数x年齢x年齢の平方根」
いちばん頭を悩ませるところがこういう場合で、年齢と、年齢の平方根とか2乗とかの項を両方入れて、
両方とも有意だった場合はどう解釈すればいいのでしょうね。
それに、普通に考えてみれば多重共線性がありそうなものなのに…などと思います。
ご回答ありがとうございました。ただ、
「当てはまりを良くするため」というのは分かった上で質問しています。
失礼ながら、おそらくご紹介のリンクの内容をご理解なさっていないようですね。
最小二乗法というのは、2乗項を入れる理由を説明しないと思います。
ついでに言えば、直線回帰でない場合も2乗項は入れますから。