應(yīng)用統(tǒng)計(jì)專(zhuān)業(yè)可以培養(yǎng)良好的統(tǒng)計(jì)學(xué)背景,注重理論結(jié)合實(shí)際,今天上海高頓考研網(wǎng)為大家整理了應(yīng)用統(tǒng)計(jì)碩士考研的相關(guān)知識(shí)點(diǎn):主分子和因分子分析,希望給考研的同學(xué)一些幫助。
應(yīng)用統(tǒng)計(jì)碩士考研知識(shí)點(diǎn)
主成分和因子分析
1.(1)概念:在研究實(shí)際問(wèn)題時(shí),往往需要收集多個(gè)變量。但這樣會(huì)使多個(gè)變量間存在較強(qiáng)的相關(guān)關(guān)系,即這些變量間存在較多的信息重復(fù),直接利用它們進(jìn)行分析,不但模型復(fù)雜,還會(huì)因?yàn)樽兞块g存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來(lái)較多的舊變量,同時(shí)要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類(lèi)問(wèn)題的有效方法。它們能夠提取信息,使變量簡(jiǎn)化降維,從而使問(wèn)題更加簡(jiǎn)單直觀
(2)主成分分析:研究如何通過(guò)少數(shù)幾個(gè)主成分(principal component)來(lái)解釋多個(gè)變量間的內(nèi)部結(jié)構(gòu)。即從原始變量中導(dǎo)出少數(shù)幾個(gè)主分量,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)
主成分分析的目的:數(shù)據(jù)的壓縮數(shù)據(jù)的解釋。常被用來(lái)尋找判斷事物或現(xiàn)象的綜合指標(biāo),并對(duì)綜合指標(biāo)所包含的信息進(jìn)行適當(dāng)?shù)慕忉尅?主成分所代表的原始變量的信息用其方差來(lái)表示,一般要求所選主成分的方差總和占全部方差的80%以上就可以了。如果原來(lái)的變量之間的相關(guān)程度高,降維的效果就會(huì)好一些,所選的主成分就會(huì)少一些。特征根反映了主成分對(duì)原始變量的影響程度,表示引入該主成分后可以解釋原始變量的信息。特征根又叫方差,某個(gè)特征根占總特征根的比例稱(chēng)為主成分方差貢獻(xiàn)率。一般情況下,當(dāng)特征根小于1時(shí),就不再選作主成分了,因?yàn)樵撝鞒煞值慕忉屃Χ冗€不如直接用原始變量解的釋力度大。)
(3)因子分析:與主成分分析類(lèi)似,它們都是要找出少數(shù)幾個(gè)新的變量來(lái)代替原始變量。
不同之處:主成分分析中的主成分個(gè)數(shù)與原始變量個(gè)數(shù)是一樣的,即有幾個(gè)變量就有幾個(gè)主成分,只不過(guò)最后我們確定了少數(shù)幾個(gè)主成分而已。而因子分析則需要事先確定要找?guī)讉€(gè)成分,也稱(chēng)為因子(factor),然后將原始變量綜合為少數(shù)的幾個(gè)因子,以再現(xiàn)原始變量與因子之間的關(guān)系,一般來(lái)說(shuō),因子的個(gè)數(shù)會(huì)遠(yuǎn)遠(yuǎn)少于原始變量的個(gè)數(shù)。
因子分析可以看作是主成分分析的推廣和擴(kuò)展,但它對(duì)問(wèn)題的研究更深入、更細(xì)致一些。實(shí)際上,主成分分析可以看作是因子分析的一個(gè)特例
簡(jiǎn)言之,因子分析是通過(guò)對(duì)變量之間關(guān)系的研究,找出能綜合原始變量的少數(shù)幾個(gè)因子,使得少數(shù)因子能夠反映原始變量的絕大部分信息,然后根據(jù)相關(guān)性的大小將原始變量分組,使得組內(nèi)的變量之間相關(guān)性較高,而不同組的變量之間相關(guān)性較低。因此,因子分析屬于多元統(tǒng)計(jì)中處理降維的一種統(tǒng)計(jì)方法,其目的就是要減少變量的個(gè)數(shù),用少數(shù)因子代表多個(gè)原始變量
(4)因子數(shù)量的確定
用公因子方差貢獻(xiàn)率提?。号c主成分分析類(lèi)似,一般累計(jì)方差貢獻(xiàn)率達(dá)到80%以上的前幾個(gè)因子可以作為最后的公因子
用特征根提?。阂话阋笠蜃訉?duì)應(yīng)的特征根要大于1,因?yàn)樘卣鞲∮?說(shuō)明該共因子的解釋力度太弱,還不如使用原始變量的解釋力度大
實(shí)際應(yīng)用中,因子的提取要結(jié)合具體問(wèn)題而定,在某種程度上,取決于研究者自身的知識(shí)和經(jīng)驗(yàn)
(5)主成分分析和因子分析都是多元分析中處理降維的兩種統(tǒng)計(jì)方法。只有當(dāng)原始數(shù)據(jù)中的變量之間具有較強(qiáng)的相關(guān)關(guān)系時(shí),降維的效果才會(huì)明顯,否則不適合進(jìn)行主成分分析和因子分析
主成分和因子的選擇標(biāo)準(zhǔn)應(yīng)結(jié)合具體問(wèn)題而定。在某種程度上取決于研究者的知識(shí)和經(jīng)驗(yàn),而不是方法本身
即使得到了滿意的主成分或因子,在運(yùn)用它們對(duì)實(shí)際問(wèn)題進(jìn)行評(píng)價(jià)、排序等分析時(shí),仍然要保持謹(jǐn)慎,因?yàn)橹鞒煞趾鸵蜃赢吘故歉叨瘸橄蟮牧?,無(wú)論如何,它們的含義都不如原始變量清晰
因子分析可以看作是主成分分析的推廣和擴(kuò)展,而主成分分析則可以看作是因子分析的一個(gè)特例。目前因子分析在實(shí)際中被廣泛應(yīng)用,而主成分分析通常只作為大型統(tǒng)計(jì)分析的中間步驟,幾乎不再單獨(dú)使用。
今天給大家介紹了應(yīng)用統(tǒng)計(jì)碩士考研備考資料主分子和因分子分析的相關(guān)知識(shí)點(diǎn),你掌握住了嗎?后續(xù)會(huì)為大家持續(xù)更新考研相關(guān)內(nèi)容,各位考生可以收藏練習(xí)。