一、填充題
2.
有兩組數值資料\(X\)與\(Y\),其相關係數為\(r\),平均數各為\(\mu_x,\mu_y\),且\(Y\)對\(X\)的迴歸線為\(y=ax+b\),則下列哪些選項正確?
(1)若資料\(X\)和\(Y\)已經標準化,則\(b=0\)
(2)當\(\mu_y=0\),則迴歸線過原點
(3)迴歸線必過\((\mu_x,\mu_y)\)
(4)若資料\(X\)和\(Y\)已經標準化,則\(a=r\)
(5)若\(\sigma_x,\sigma_y\)各為數值資料\(X\)與\(Y\)的標準差,則\(a\sigma_x=r\sigma_y\)
[解答]
填充第 2 題的第 5 個選項: \(y\) 對 \(x\) 的迴歸直線斜率 \(\displaystyle a=r\cdot\frac{\sigma_y}{\sigma_x}\Rightarrow a\sigma_x=r\sigma_y\)
先備知識:
1. 若數據 \((x_1,y_1), (x_2, y_2), \cdots, (x_n, y_n)\) 之中 \(X'\) 與 \(Y'\) 皆已標準化,且 \(X'\) 與 \(Y'\) 的相關係數為 \(r\),
則 \(Y'\) 對 \(X'\) 的迴歸直線方程式為 \(y'=r\cdot x'\)
證明請見:
https://math.pro/db/viewthread.php?tid=1132&page=2#pid5582
2. 若數據 \((x_1,y_1), (x_2, y_2), \cdots, (x_n, y_n)\) 之中已知 \(X\) 與 \(Y\) 的相關係數為 \(r\),
且 \(X\) 的平均數為 \(\mu_x\) 、標準差為 \(\sigma_x\),\(Y\) 的平均數為 \(\mu_y\) 、標準差為 \(\sigma_y\),
則 \(Y\) 對 \(X\) 的迴歸直線方程式為 \(\displaystyle \frac{y-\mu_y}{\sigma_y}=r\cdot \frac{x-\mu_x}{\sigma_x}\)