使用Seaborn創建美觀的統計圖表

Seaborn是一個基於Matplotlib的Python數據可視化庫。與Matplotlib相比,Seaborn更加註重數據可視化的風格和美觀度,可以輕鬆創建出專業水平的統計圖表。本文將介紹Seaborn的常見數據可視化技巧,如何利用Seaborn創建美觀的統計圖表。

一、基礎圖表

Seaborn支持的基礎圖表包括散點圖、折線圖、柱狀圖,通過這些基礎圖表,可以展示數據的分布情況以及趨勢。

首先,通過以下代碼導入Seaborn,並設置樣式為白色網格風格:

import seaborn as sns
sns.set_style("whitegrid")

1.散點圖

散點圖在展示兩個變數之間的關係時非常有用。通過使用Seaborn中的scatterplot函數,可以輕鬆地繪製散點圖。以下代碼展示了通過Seaborn繪製散點圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
tips = sns.load_dataset("tips")

sns.scatterplot(x="total_bill", y="tip", data=tips)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含餐廳賬單金額和小費數據的tips表格,並使用sns.scatterplot函數繪製了total_bill和tip兩個變數之間的散點圖。

2.折線圖

折線圖通常用於展示時間序列數據中的趨勢變化,通過Seaborn中的lineplot函數,可以快速繪製折線圖。以下代碼展示了通過Seaborn繪製折線圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
flights = sns.load_dataset("flights")

sns.lineplot(x="year", y="passengers", data=flights)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含航班乘客人數的flights表格,並使用sns.lineplot函數繪製了年份和乘客人數之間的折線圖。

3.柱狀圖

柱狀圖通常用於展示類別變數之間的差別,Seaborn中的barplot函數可以幫助我們快速繪製柱狀圖。以下代碼展示了通過Seaborn繪製柱狀圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
titanic = sns.load_dataset("titanic")

sns.barplot(x="class", y="survived", data=titanic)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含泰坦尼克號相關信息的titanic表格,並使用sns.barplot函數繪製了不同艙位的生還率之間的柱狀圖。

二、分布圖表

Seaborn支持的分布圖表包括直方圖、核密度圖、箱線圖、小提琴圖等,通過這些圖表可以更好地展示數據的分布情況,揭示數據的內在規律。

1.直方圖

直方圖通常用於展示連續變數的頻率分布情況,通過Seaborn中的distplot函數可以繪製直方圖。以下代碼展示了通過Seaborn繪製直方圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.distplot(iris["petal_length"], kde=False)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.distplot函數繪製了花瓣長度的直方圖。

2.核密度圖

核密度圖也用於展示連續變數的頻率分布情況,通過Seaborn中的kdeplot函數可以繪製核密度圖。以下代碼展示了通過Seaborn繪製核密度圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.kdeplot(data=iris["petal_length"], shade=True)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.kdeplot函數繪製了花瓣長度的核密度圖。

3.箱線圖

箱線圖通常用於展示數值型數據的分布情況,通過Seaborn中的boxplot函數可以繪製箱線圖。以下代碼展示了通過Seaborn繪製箱線圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.boxplot(x="species", y="petal_length", data=iris)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.boxplot函數繪製了不同鳶尾花品種的花瓣長度的箱線圖。

4.小提琴圖

小提琴圖也用於展示數值型數據的分布情況,通過Seaborn中的violinplot函數可以繪製小提琴圖。以下代碼展示了通過Seaborn繪製小提琴圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.violinplot(x="species", y="petal_length", data=iris)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.violinplot函數繪製了不同鳶尾花品種的花瓣長度的小提琴圖。

三、分類圖表

Seaborn支持的分類圖表包括條形圖、點圖、分類散點圖、分類盒圖等,通過這些圖表可以更好地揭示不同類別之間的差異和關係。

1.條形圖

條形圖通常用於展示類別變數之間的差別,通過Seaborn中的barplot函數可以繪製條形圖。以下代碼展示了通過Seaborn繪製條形圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
titanic = sns.load_dataset("titanic")

sns.barplot(x="class", y="survived", data=titanic, hue="sex")

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含泰坦尼克號相關信息的titanic表格,並使用sns.barplot函數繪製了不同艙位和性別下的生還率之間的條形圖。

2.點圖

點圖通常用於展示數值型數據的分類差異,通過Seaborn中的pointplot函數可以繪製點圖。以下代碼展示了通過Seaborn繪製點圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
titanic = sns.load_dataset("titanic")

sns.pointplot(x="class", y="survived", data=titanic, hue="sex")

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含泰坦尼克號相關信息的titanic表格,並使用sns.pointplot函數繪製了不同艙位和性別下的生還率之間的點圖。

3.分類散點圖

分類散點圖也用於展示數值型數據的分類差異,通過Seaborn中的stripplot函數可以繪製分類散點圖。以下代碼展示了通過Seaborn繪製分類散點圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.stripplot(x="species", y="petal_length", data=iris)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.stripplot函數繪製了不同鳶尾花品種的花瓣長度的分類散點圖。

4.分類盒圖

分類盒圖也用於展示數值型數據的分類差異,通過Seaborn中的boxplot函數可以繪製分類盒圖。以下代碼展示了通過Seaborn繪製分類盒圖的使用方法:

import seaborn as sns
import matplotlib.pyplot as plt
iris = sns.load_dataset("iris")

sns.boxplot(x="species", y="petal_length", data=iris)

plt.show()

上述代碼中,我們使用sns.load_dataset函數從Seaborn自帶的數據集中載入了一個包含鳶尾花相關信息的iris表格,並使用sns.boxplot函數繪製了不同鳶尾花品種的花瓣長度的分類盒圖。

四、結語

本文介紹了Seaborn的常見數據可視化技巧,包括基礎圖表、分布圖表和分類圖表。通過這些圖表,可以更好地展示數據的分布情況、差異和趨勢,揭示數據的內在規律。Seaborn是一個非常實用的數據可視化工具,希望讀者能夠掌握其中的技巧,用它來更好地分析和展示數據。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/200777.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-06 11:27
下一篇 2024-12-06 11:28

相關推薦

發表回復

登錄後才能評論