一本一道AV无码中文字幕,久久久国产一区二区三区四区小说,国产a√精品区二区三区四区,国产精品人人妻人色五月

移動端

士鋒生物基因表達數(shù)據(jù)分析主成分分析 PCA

2014年02月18日 08:08上海士鋒生物科技有限公司點擊量:1527

主成分分析 ( Principal Component Analysis , PCA ) 是一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜的問題。計算主成分的目的是將高維數(shù)據(jù)投影到較低維空間。給定 n 個變量的 m 個觀察值,形成一個 n ′ m 的數(shù)據(jù)矩陣, n 通常比較大。對于一個由多個變量描述的復(fù)雜事物,人們難以認識,那么是否可以抓住事物主要方面進行重點分析呢?如果事物的主要方面剛好體現(xiàn)在幾個主要變量上,我們只需要將這幾個變量分離出來,進行詳細分析。但是,在一般情況下,并不能直接找出這樣的關(guān)鍵變量。這時我們可以用原有變量的線性組合來表示事物的主要方面, PCA 就是這樣一種分析方法。PCA 的目標(biāo)是尋找 r ( r

基因表達數(shù)據(jù)分析主成分分析 PCA

在進行基因表達數(shù)據(jù)分析時,一個重要問題是確定每個實驗數(shù)據(jù)是否是獨立的,如果每次實驗數(shù)據(jù)之間不是獨立的,則會影響基因表達數(shù)據(jù)分析結(jié)果的準(zhǔn)確性。對于利用基因芯片所檢測到的基因表達數(shù)據(jù),如果用 PCA 方法進行分析,可以將各個基因作為變量,也可以將實驗條件作為變量。當(dāng)將基因作為變量時,通過分析確定一組“主要基因元素”,它們能夠很好地說明基因的特征,解釋實驗現(xiàn)象;當(dāng)將實驗條件作為變量時,通過分析確定一組“主要實驗因素”,它們能夠很好地刻畫實驗條件的特征,解釋基因的行為。下面著重考慮以實驗條件作為變量的 PCA 分析方法。假設(shè)將數(shù)據(jù)的維數(shù)從 R N 降到 R 3 ,具體的 PCA 分析步驟如下:

(1) *步計算矩陣 X 的樣本的協(xié)方差矩陣 S :

基因表達數(shù)據(jù)分析主成分分析 PCA

, i = 1,2,…,N 。本征值按大到小排序:

基因表達數(shù)據(jù)分析主成分分析 PCA

。現(xiàn)在數(shù)據(jù)可以在三維空間中展示為云狀的點集。

對于 PCA ,確定新變量的個數(shù) r 是一個兩難的問題。我們的目標(biāo)是減小 r ,如果 r 小,則數(shù)據(jù)的維數(shù)低,便于分析,同時也降低了噪聲,但可能丟失一些有用的信息。究竟如何確定 r 呢?這需要進一步分析每個主元素對信息的貢獻。

基因表達數(shù)據(jù)分析主成分分析 PCA

(8-45)

前 r 個主成分的累計貢獻率為:

基因表達數(shù)據(jù)分析主成分分析 PCA

 

基因表達數(shù)據(jù)分析主成分分析 PCA

版權(quán)與免責(zé)聲明: 凡本網(wǎng)注明“來源:智慧城市網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-智慧城市網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:智慧城市網(wǎng)cchxqp518.com”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明自其它來源(非智慧城市網(wǎng)cchxqp518.com)的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點或和對其真實性負責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負版權(quán)等法律責(zé)任。

編輯精選

更多

本站精選

更多

專題推薦

更多

名企推薦

更多

浙公網(wǎng)安備 33010602000006號