一、基本概念
plt scatter是matplotlib中一種基礎的繪圖函數,它可以將給定的數據集中的每個數據點繪製為2D圖形中的一個點,通常使用不同的顏色、大小、形狀來區分不同的數據集。由於其簡便的操作和表現力,它廣泛應用於數據可視化展示、分類、回歸等領域。
二、基本用法
plt scatter的最基本用法是傳入x和y坐標的數據集。以下是一個簡單的例子:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.scatter(x, y) plt.show()
運行這段代碼,我們便可以得到一個簡單的圖形。此時所有的點都是同樣的形狀,顏色和大小,這需要通過參數來進行設置。
三、參數設置
1. 設置點的顏色
在plt scatter中,可以通過color參數來設置點的顏色,這裡的顏色可以由常規的顏色名稱(如「red」)或RGB值來表示。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.scatter(x, y, color = 'red') plt.show()
這段代碼便可將所有的點都繪製成紅色。除了color參數,還有c參數可以使用,作用與color相同。這裡要注意,使用c參數時只能傳入單色一維數組。
2. 設置點的大小
通過s參數可以設置scatter中點的大小,這個大小可以通過單個值表示所有點的大小,或者傳入一個大小與坐標相對應的二維數組來表示每個點的不同大小。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] size = [10, 20, 30, 40, 50] plt.scatter(x, y, s = size) plt.show()
這段代碼中,我們定義了每個點的大小,從小到大為10到50。運行代碼後,可以看到點的大小已經被設置成了不同的大小。
3. 設置點的形狀
通過marker參數可以設置plt scatter中點的形狀,這個形狀可以由普通形狀(如「.」,「o」)或matplotlib路徑對象(如「P」)來表示。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] marker = 'o' plt.scatter(x, y, marker = marker) plt.show()
這段代碼中,我們將每個點的形狀設置成了圓形「o」。這裡需要注意,marker參數不支持圖像數據的輸入作為點的形狀。
4. 其他參數
除了上述常見的參數之外,plt scatter還有其他很多參數,比如:
- edgecolors:邊緣顏色
- linewidths:邊框線寬
- alpha:透明度
這些參數可以更好地表現我們數據的特徵。
四、示例代碼
下面是一個使用plt scatter來繪製鳶尾花數據集的例子,我們根據鳶尾花不同的特徵將花分為3組,用不同的顏色、大小和形狀進行區分:
import matplotlib.pyplot as plt from sklearn.datasets import load_iris iris = load_iris() X = iris.data y = iris.target plt.scatter(X[:, 0], X[:, 1], c=y, s=100*X[:, 3], cmap='viridis', alpha=0.5, edgecolors='none') plt.colorbar() plt.title('Iris Data') plt.xlabel('sepal length (cm)') plt.ylabel('sepal width (cm)') plt.show()
運行以上代碼,我們將得到下面的圖形:
總結
plt scatter是一個快速、方便、直觀的繪圖工具,可以幫助我們更好地理解數據集的分佈、趨勢以及異常值。在使用plt scatter時,我們需要注意參數的設置,根據數據集的特點來選擇不同的顏色、大小、形狀來展示數據,以便更好地解釋和理解數據。
原創文章,作者:FQHNL,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/368572.html