一、NMDS分析的基本概念
NMDS全稱為非度量多維尺度分析(Non-Metric Multidimensional Scaling),它是一種無需前提假設的多元統計方法,能夠將高維度的數據(尤其是距離矩陣)轉化為低維度的點陣圖,同時能夠保持點之間的距離關係。NMDS分析常被用於生態學、植物學、心理學以及社會科學等領域。
NMDS分析的輸入數據必須是一個關於點的距離矩陣(Euclidean, Bray-Curtis, Jaccard等)。它的輸出結果通常是個二維或三維點陣圖(如下圖),各點代表不同樣本或變數,數據點之間的距離關係反映了它們在高維空間中的相似性。
二、NMDS分析的輸入數據格式
在進行NMDS分析前,我們需要先準備好距離矩陣。距離矩陣是一個n * n的矩陣,n代表樣本或變數的數量,每個元素代表兩個樣本或變數之間的距離。
距離矩陣的表現形式有多種,例如一個CSV文件,或是一個R語言中的dist對象。下面是一個簡短的示例代碼,演示如何從一個CSV文件中讀取距離矩陣:
dist_matrix <- read.csv("path/to/file.csv", row.names = 1)
注意,這裡使用了row.names參數來將第一列指定為行名。
三、NMDS分析的過程
一般來說,進行NMDS分析的過程可以分為以下幾步:
1、距離矩陣處理
NMDS分析通常需要對距離矩陣進行一些數學處理,以去除非必要的誤差、數據嘈雜以及偏見等問題。其中最常見的方法是雙重中心處理和PCoA處理。在R語言中,進行這些處理的函數分別是:
# 雙重中心處理 dist_matrix <- as.matrix(dist_matrix) d_center <- distfun(dist_matrix)^2 dc <- d_center - rowMeans(d_center) - colMeans(d_center) + mean(d_center) # PCoA處理 pcoa <- cmdscale(d_center, k = nrow(d_center) - 1)
2、選擇合適的距離方法和轉換方法
在進行NMDS分析時,我們需要選擇合適的距離方法和轉換方法。常用的距離方法包括Euclidean、Bray-Curtis和Jaccard等。轉換方法包括線性歐氏距離(PCA)、Sammon映射、Guttman方案和MonoMDS等。在R語言中,進行這些操作的函數分別是:
# 距離方法 d_bc <- vegdist(df, method = "bray") # Bray-Curtis距離 d_jac <- vegdist(df, method = "jaccard") # Jaccard距離 d_eucl <- dist(df, method = "euclidean") # Euclidean距離 # 轉換方法 mono_mds <- isoMDS(d_bc) # MonoMDS轉換 gut <- isoMDS(d_bc, type = "guttman") # Guttman方案轉換 sammon <- sammon(d_bc) # Sammon映射轉換
3、選擇合適的構圖方法和係數
選擇合適的構圖方法和係數是進行NMDS分析的重要步驟。常用的構圖方法包括梯度構圖(Gradient Plot)和分組構圖(Cluster Plot)等。在R語言中,可以藉助ggplot2和vegan包來構建這些圖形。
舉例而言,下面這段代碼演示了如何使用梯度構圖:
# 讀取距離矩陣 dist_matrix <- read.csv("path/to/file.csv", row.names = 1) # 雙重中心處理 dist_matrix <- as.matrix(dist_matrix) d_center <- distfun(dist_matrix)^2 dc <- d_center - rowMeans(d_center) - colMeans(d_center) + mean(d_center) # NMDS分析 nmds <- monoMDS(dist_matrix, k = 2) # 構建梯度圖 plot_gradient(nmds, metadata)
4、評估NMDS的可靠性
NMDS在不同的數據集上可能會表現出不同的結果。為了評估NMDS的可靠性,我們需要對樣本或變數的順序進行隨機置換,重複運行NMDS分析,並對結果進行評估。
在R語言中,實現這個過程的函數是metaMDS,它能夠逐漸逼近最終結果,直至收斂。
results <- metaMDS(dist_matrix)
四、NMDS分析的結果
NMDS分析的結果通常是一個二維或三維的點陣圖。這些點陣圖可以幫助我們理解樣本或變數之間的相似性,從而得出進一步的結論。
例如,下面這張圖展示了100家公司的品牌名稱,可以通過顏色、形狀、標註和布局等手段較好地將它們區分開來:
從圖中可以很明顯地看出這些公司之間的相似性和差異性。進一步的研究結果也表明,這些品牌的相似性和差異性與它們的品牌宣傳、品牌形象和品牌地位等因素密切相關。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/306588.html