一、table函數簡介
在R語言中,table()是一種常用的用於統計數據出現次數的函數。該函數通常用於繪製頻數表和列聯表。table()函數可以接受多個向量作為輸入,並返回這些向量的頻數表。
下面是一個簡單的例子,展示如何使用table()函數:
# 定義一個向量 v <- c("apple","orange","banana","apple","orange","apple") # 使用table函數返回每個元素出現的次數 table(v)
輸出結果如下:
v apple banana orange 3 1 2
上述結果表示,在向量v中,”apple”出現了3次,”banana”出現了1次,”orange”出現了2次。
二、頻數表的製作
頻數表是展示數據中每個元素出現次數的一種表格形式。在統計學中,頻數是指每個數據項出現的次數。在R語言中,可以使用table()函數創建頻數表。
下面是一個簡單的例子,展示如何使用table()函數創建頻數表:
# 定義一個向量 v <- c("apple","orange","banana","apple","orange","apple") # 使用table函數創建頻數表 freqTable <- table(v)
輸出結果如下:
v apple banana orange 3 1 2
對於大數據集,使用table()函數可以很輕鬆地統計每個元素出現的次數。例如,我們可以使用table()函數統計R內置數據集iris中Sepal.Length這一列每個元素的出現次數:
freqTable <- table(iris$Sepal.Length) freqTable
輸出結果如下:
freqTable 4 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 1 1 1 1 3 1 4 2 5 4.9 5 5.1 5.2 5.3 5.4 5.5 5.6 5.7 4 9 8 4 1 2 7 6 2 5.8 5.9 6 6.1 6.2 6.3 6.4 6.5 6.6 6 3 8 4 2 1 5 3 2 6.7 6.8 6.9 7 7.1 7.2 7.3 7.4 7.6 2 1 1 4 1 3 1 2 1 7.7 7.9 4 1
上述結果表示,Sepal.Length列中,4出現了1次,4.1出現了1次,4.2出現了1次,以此類推。
三、列聯表的製作
列聯表是指在統計學中用於比較分組變量之間關係的一種表格形式。對於兩個分組變量,可以用列聯表計算每個分組變量中的每個水平(或組合水平)之間的頻數和比率。
在R語言中,table()函數可以用於製作簡單的列聯表。下面是一個例子:
# 定義兩個向量 x <- c("male", "male", "female", "female", "male", "female", "male", "female") y <- c("yes", "no", "no", "yes", "yes", "yes", "no", "no") # 使用table函數創建兩個變量的列聯表 crossTable <- table(x, y) crossTable
輸出結果如下:
y x no yes female 2 2 male 2 2
上述結果表示,第一列為x變量的分類水平,第一行為y變量的分類水平。從左到右,上到下按照順序為no和yes,每個單元格中的數字表示對應組合的頻數。
我們可以使用addmargins()函數來為列聯表添加邊緣合計行和列:
crossTable <- addmargins(crossTable) crossTable
輸出結果如下:
y x no yes Sum female 2 2 4 male 2 2 4 Sum 4 4 8
上述結果表示,對於每個水平,列聯表都計算了在該水平下的每個水平的頻數和。”Sum”列和行表示每行和每列的合計。
四、總結
在R語言中,table()函數是一種用於統計數據中每個元素出現次數並製作頻數表和列聯表的非常有用的函數。我們可以使用該函數來處理大量數據,並且可以根據需要進行可視化處理。對於對數據分析很有幫助。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/285897.html