ということが気になったので調べてみました。
あるサイトでS2K中古車情報をもとに,データセットを作成しました(n=32)。
価格を従属変数にして,年式,走行距離を説明変数にて,以下のような重回帰式を想定しました。
価格 = β1×年式 + β2×走行距離 + 定数
年式は,表記されている年式から18年8月現在までの経過月数で計算しました。
簡単に結果を示しますと,
R:0.880
R2乗:0.775
F値:51.647
p値:0.000
(n=32)
RとかR2乗は1.0に近ければ近いほどモデルの当てはまりがいいということです。
結果はかなり高い数値ですね。当たり前か・・
さて,上記モデルは,
価格(円) = -12562.078×年式 + -12.083×走行距離 + 3499610.2
となりました。この式に,年式と走行距離を代入すればS2Kの価格が出てきます。
もちろん,マイナスの値ですから,年式が古ければ古いほど,また走行距離が多ければ多いほど,価格には負に影響を及ぼすということですよね。
しかし,これでは,年式と走行距離どっちが価格への影響が大きいのかわかりにくいです。
各係数を標準化してみると・・・
年式:-0.574(p値:.000)
走行距離:-0.413(p値:.001)
であることがわかりました。
従って,年式の方が価格に大きく影響することがわかります。
以上の解析から導かれる結論は・・・
エスの場合「走行距離も,年式も価格にマイナスに影響を(統計的に有意に)及ぼすが,年式の方がその影響は大きい」。
ということです。私としてはへーそうか・・・と言った感じです。
ただしデータに偏りがあるのは避けられません。
ほんとはランダムチョイスしなきゃダメですよね。
あと,色の違いなどで価格は影響されるのかということも調べてみたいですね。
あるサイトでS2K中古車情報をもとに,データセットを作成しました(n=32)。
価格を従属変数にして,年式,走行距離を説明変数にて,以下のような重回帰式を想定しました。
価格 = β1×年式 + β2×走行距離 + 定数
年式は,表記されている年式から18年8月現在までの経過月数で計算しました。
簡単に結果を示しますと,
R:0.880
R2乗:0.775
F値:51.647
p値:0.000
(n=32)
RとかR2乗は1.0に近ければ近いほどモデルの当てはまりがいいということです。
結果はかなり高い数値ですね。当たり前か・・
さて,上記モデルは,
価格(円) = -12562.078×年式 + -12.083×走行距離 + 3499610.2
となりました。この式に,年式と走行距離を代入すればS2Kの価格が出てきます。
もちろん,マイナスの値ですから,年式が古ければ古いほど,また走行距離が多ければ多いほど,価格には負に影響を及ぼすということですよね。
しかし,これでは,年式と走行距離どっちが価格への影響が大きいのかわかりにくいです。
各係数を標準化してみると・・・
年式:-0.574(p値:.000)
走行距離:-0.413(p値:.001)
であることがわかりました。
従って,年式の方が価格に大きく影響することがわかります。
以上の解析から導かれる結論は・・・
エスの場合「走行距離も,年式も価格にマイナスに影響を(統計的に有意に)及ぼすが,年式の方がその影響は大きい」。
ということです。私としてはへーそうか・・・と言った感じです。
ただしデータに偏りがあるのは避けられません。
ほんとはランダムチョイスしなきゃダメですよね。
あと,色の違いなどで価格は影響されるのかということも調べてみたいですね。
#
by red-s2k-taka
| 2006-08-15 22:56
| Add-up