一、什麼是geom_histogram
geom_histogram是ggplot2中histogram的直觀表示方式。在histogram中,數據被分成多個bin(箱),每個bin包含一定範圍內的數據,並且將數據分配給bin以顯示頻率或密度分布。在geom_histogram中,每個觀測值被編組到正確的bin中,並且將bin的高度表示為每個bin內的觀測值計數。
二、如何使用geom_histogram
使用geom_histogram,需要設置x軸的變數。它還提供了一些可選參數,以微調圖表的外觀。以下是一些可選參數的示例:
ggplot(data, aes(x=var)) + geom_histogram(color="black", fill="white", binwidth=5)
在此示例中,我們設置x軸變數為var。color參數設置邊框的顏色,fill參數設置直方圖的填充顏色。binwidth設置了每個bin的寬度為5。
三、如何微調geom_histogram
1、調整直方圖中bin的數量
默認情況下,ggplot2選擇bin數量以在您的數據範圍內獲得最佳視覺效果。但是,您也可以自己選擇bin數量。以下是一些可選參數的示例:
ggplot(data, aes(x=var)) + geom_histogram(color="black", fill="white", bins=30)
在此示例中,我們設置x軸變數為var。color參數設置邊框的顏色,fill參數設置直方圖的填充顏色。bins參數設置了bin的數量為30。
2、調整直方圖中bin的寬度和位置
除了bin數量之外,您還可以調整它們的寬度和位置。以下是一些可選參數的示例:
ggplot(data, aes(x=var)) + geom_histogram(color="black", fill="white", binwidth=5, position="identity")
在此示例中,我們設置x軸變數為var。color參數設置邊框的顏色,fill參數設置直方圖的填充顏色。binwidth參數設置bin的寬度為5。position參數設置為”identity”,這意味著bin將原封不動地堆疊在一起。
3、添加密度曲線
您還可以在geom_histogram中添加密度曲線。以下是一些可選參數的示例:
ggplot(data, aes(x=var)) + geom_histogram(color="black", fill="white", binwidth=5, alpha=.5)+ geom_density(aes(y=..density..), fill="#FF6666")
在此示例中,我們先畫出了一個顏色為白色的黑色邊框的直方圖,並將bin寬度設置為5。然後我們添加了一個密度曲線,並將顏色設置為紅色。嘗試使用alpha參數將直方圖的填充透明度向下調整。
4、設置X軸或Y軸的刻度和標籤
在有些情況下,您可能需要更改直方圖的軸標籤和刻度。以下是一個可選參數的示例:
ggplot(data, aes(x=var)) + geom_histogram(color="black", fill="white", bins=30)+ scale_x_continuous(name="Sample Size", breaks=seq(min(data$var), max(data$var), by=20))+ scale_y_continuous(name="Frequency Density")
在此示例中,我們使用scale_x_continuous函數更改x軸標籤和刻度。我們設置了名為”Sample Size”的標籤,並使用breaks參數添加每隔20個單元格的刻度。我們使用scale_y_continuous函數更改y軸的標籤,設置為”Frequency Density”。
原創文章,作者:RXJM,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/145396.html