R語言sapply函數詳解

sapply函數是一種高效的函數式編程方式，在R語言中廣泛應用於對向量或列表進行操作並返回結果的場景中。該函數的語法結構如下所示：

sapply(X, FUN, ..., simplify = TRUE, USE.NAMES = TRUE)

其中，X表示需要進行處理的向量或列表；FUN表示需要對每個元素進行操作的函數名稱，該函數將被自動調用；…表示需要傳遞給FUN的其他參數，可以有多個；simplify表示是否需要對結果進行簡化，其默認值為TRUE；USE.NAMES表示是否需要使用X參數的名稱。

sapply函數主要應用在下列場景中：

可以使用sapply函數對向量進行操作，例如計算向量中每個元素的平方：

x <- c(1, 2, 3, 4, 5)
sapply(x, function(x){x^2})

該代碼將輸出如下結果：

 [1]  1  4  9 16 25

可以使用sapply函數對列表進行操作，例如對列表中的每個元素求和：

lst <- list(a = c(1, 2), b = c(3, 4), c = c(5, 6))
sapply(lst, sum)

該代碼將輸出如下結果：

 a  b  c 
 3  7 11

可以使用sapply函數對數據框進行操作，例如對數據框中的每一列求和：

df <- data.frame(a = c(1, 2, 3), b = c(4, 5, 6), c = c(7, 8, 9))
sapply(df, sum)

該代碼將輸出如下結果：

  a   b   c 
  6  15  24

在使用sapply函數時需要注意以下事項：

simplify參數的默認值為TRUE，如果設置為FALSE，在返回的結果中會得到一個包含各個處理結果的列表。然而，大型結果可能會耗盡計算機的內存。因此，在使用sapply函數時需要權衡簡化結果和內存開銷之間的平衡。

sapply函數的返回值是一個矩陣或一個向量，如果其中有元素的類型不同，則整個返回結果自動轉換為最適合的類型。

sapply函數的返回結果可能是一個矩陣，其列數和行數依賴於處理的結果。對於大型結果而言，矩陣的使用可能會佔用大量的內存。要避免這種情況，可以使用lapply函數，該函數的返回結果是一個列表，不是矩陣。

x <- c(1, 2, 3, 4, 5)
sapply(x, function(x){x^2})

輸出結果：

 [1]  1  4  9 16 25

lst <- list(a = c(1, 2), b = c(3, 4), c = c(5, 6))
sapply(lst, sum)

輸出結果：

 a  b  c 
 3  7 11

df <- data.frame(a = c(1, 2, 3), b = c(4, 5, 6), c = c(7, 8, 9))
sapply(df, sum)

輸出結果：

  a   b   c 
  6  15  24

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/154828.html