上海師范大學考研交流群(點擊進群)686077717
上海應用技術大學考研交流群(點擊進群) 733853983
應用統(tǒng)計專業(yè)可以培養(yǎng)良好的統(tǒng)計學背景,注重理論結(jié)合實際,今天上海高頓考研網(wǎng)為大家整理了應用統(tǒng)計碩士考研的相關知識點:方差分析,希望給考研的同學一些幫助。
應用統(tǒng)計碩士考研知識點
方差分析
1.通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究一個或多個分類型自變量對一個數(shù)值型因變量的影響
單因素方差分析:涉及一個分類的自變量
雙因素方差分析:涉及兩個分類的自變量
2.(1)僅從散點圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異
這種差異也可能是由于抽樣的隨機性所造成的
需要有更準確的方法來檢驗這種差異是否顯著,也就是進行方差分析
所以叫方差分析,因為雖然我們感興趣的是均值,但在判斷均值之間是否有差異時則需要借助于方差
這個名字也表示:它是通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進行方差分析時,需要考察數(shù)據(jù)誤差的來源
(2)隨機誤差
因素的同一水平(總體)下,樣本各觀察值之間的差異
比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的
這種差異可以看成是隨機因素的影響,稱為隨機誤差
系統(tǒng)誤差
因素的不同水平(不同總體)下,各觀察值之間的差異
比如,不同行業(yè)之間的被投訴次數(shù)之間的差異
這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差
(3)數(shù)據(jù)的誤差用平方和(sum of squares)表示
組內(nèi)平方和(within groups)
因素的同一水平(同一個總體)下樣本數(shù)據(jù)的平方和
比如,零售業(yè)被投訴次數(shù)的誤差平方和
組內(nèi)平方和只包含隨機誤差
組間平方和(between groups)
因素的不同水平(不同總體)下各樣本之間的平方和
比如,四個行業(yè)被投訴次數(shù)之間的誤差平方和
組間平方和既包括隨機誤差,也包括系統(tǒng)誤差
3.方差分析的基本假定
正態(tài)性:每個總體都應服從正態(tài)分布
對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本
比如,每個行業(yè)被投訴的次數(shù)需服從正態(tài)分布
方差齊性:各個總體的方差須相同
各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的
比如,四個行業(yè)被投訴次數(shù)的方差都相等
獨立性:觀察值是獨立的(該假定不滿足對結(jié)果影響較大)
4.問題的一般提法:(1)設因素有k個水平,每個水平的均值分別用m1,m2,¼,mk表示
(2)要檢驗k個水平(總體)的均值是否相等,需要提出如下假設:
H0:m1=m2=…=mk
H1:m1,m2,¼,mk不全相等
5.SST:全部觀察值xij與總平均值的離差平方和,反映全部觀察值的離散狀況
SSA:各組平均值xi與總平均值xij的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機誤差,也包括系統(tǒng)誤差
SSE:每個水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映的是隨機誤差的大小
總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和(SSA)之間的關系:
SST=SSA+SSE
如果原假設成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會太大如果組間均方顯著地大于組內(nèi)均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差
判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內(nèi)方差之間差異的大小
6.均方
各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差
計算方法是用誤差平方和除以相應的自由度
三個平方和對應的自由度分別是
SST的自由度為n-1,其中n為全部觀察值的個數(shù)
SSA的自由度為k-1,其中k為因素水平(總體)的個數(shù)
SSE的自由度為n-k
7.構(gòu)造檢驗統(tǒng)計量
將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F
當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布
將統(tǒng)計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出對原假設H0的決策
²根據(jù)給定的顯著性水平a,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應的臨界值Fa
²若F>Fa,則拒絕原假設H0,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響
²若F
8.關系強度
變量間關系的強度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來反映
自變量平方和占總平方和的比例記為R2,即
3、其平方根R就可以用來測量兩個變量之間的關系強度
今天給大家介紹的相關知識點,你掌握住了嗎?后續(xù)會為大家持續(xù)更新考研相關內(nèi)容,各位考生可以收藏練習。