在本文中,我們將討論如何使用 Seaborn 庫創建 countplot ,以及如何使用不同的參數從數據集的特徵中推斷結果。
海底圖書館
seaborn library 在數據分析師中被廣泛使用,它包含的一系列圖提供了我們數據的最佳表示。
可以使用以下方法將 Seaborn 庫導入到我們的工作環境中
import seaborn as sns
現在讓我們討論為什麼我們使用 countplot,以及它的參數有什麼意義。
計數圖
countplot 用於表示分類變數中觀察結果的出現(計數)。
它使用條形圖的概念進行視覺描繪。
參數-
創建 countplot 時指定了以下參數,讓我們簡單了解一下它們-
- x 和 y- 該參數指定了我們參考表示的數據,然後觀察高亮顯示的模式。
- 顏色- 這個參數指定了可以給我們的劇情一個好的外觀的顏色。
- 調色板- 取調色板的值。它主要用於顯示色調變數。
- 色相- 此參數指定列名。
- 數據- 該參數指定了我們想要用於表示的數據幀。例如,數據可以是一個數組。
- 閃避- 這個參數是可選的,它接受一個布爾值作為輸入。
- 飽和度- 該參數接受浮點值。當我們指定這一點時,可以觀察到顏色強度的變化。
- 色相 _ 順序- 參數色相 _ 順序以字元串為輸入。
- kwargs- 參數 kwargs 指定鍵和值映射。
- ax- 參數 ax 是可選參數,用於獲取創建地塊的軸。
- orient- 參數 orient 是可選的,告訴我們需要的圖的方向,水平的還是垂直的。
現在讓我們看看有哪些不同的方式來表示我們的屬性。
在第一個示例中,我們將為單個變數創建 countplot。我們採用數據集「提示」來實現同樣的功能。
1.單個變數的值計數
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',data=df)
plt.show()
輸出:
在下一個示例中,我們將使用色調參數並創建 countplot。
下面的程序說明了同樣的情況-
2.用色調參數表示兩個分類變數
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex',hue='smoker',data=df)
plt.show()
輸出:
在下一個例子中,我們將考慮 y 軸並創建一個水平 countplot。
下面的程序說明了同樣的情況-
3.創建水平圖
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(y='sex',hue='smoker',data=df)
plt.show()
輸出:
現在讓我們來看看調色板如何增強數據的呈現。
在下一個例子中,我們將使用參數「調色板」。
下面的程序說明了同樣的情況-
4.使用調色板
輸入-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'tips'
df=pd.read_csv("/content/tips.csv")
#plotting the graph
sns.countplot(x='sex', data=df, palette='Set1')
plt.show()
輸出:
在下一個例子中,我們將使用參數 color,讓我們看看它是如何工作的?
下面的程序說明了同樣的情況-
5.使用參數「顏色」
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',hue='Sex', data=df, color='green')
plt.show()
輸出:
現在我們將使用參數「飽和度」,看看它如何影響我們的數據表示。
下面的程序說明了同樣的情況-
6.使用參數「飽和度」
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
#plotting the graph
sns.countplot(x='Pclass',data=df, color='green', saturation=0.1)
plt.show()
輸出:
最後在最後一個例子中,我們將使用參數線寬和邊緣顏色。
- 使用 matplotlib.axes.Axes.bar()
示例-
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
#loading the dataset 'train'
df=pd.read_csv("/content/train.csv")
sns.countplot(x='Sex', data=df, color="green", facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette("BrBG",2))
plt.show()
輸出:
原創文章,作者:簡單一點,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/130390.html