一、基本概念
plt scatter是matplotlib中一种基础的绘图函数,它可以将给定的数据集中的每个数据点绘制为2D图形中的一个点,通常使用不同的颜色、大小、形状来区分不同的数据集。由于其简便的操作和表现力,它广泛应用于数据可视化展示、分类、回归等领域。
二、基本用法
plt scatter的最基本用法是传入x和y坐标的数据集。以下是一个简单的例子:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.scatter(x, y) plt.show()
运行这段代码,我们便可以得到一个简单的图形。此时所有的点都是同样的形状,颜色和大小,这需要通过参数来进行设置。
三、参数设置
1. 设置点的颜色
在plt scatter中,可以通过color参数来设置点的颜色,这里的颜色可以由常规的颜色名称(如“red”)或RGB值来表示。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] plt.scatter(x, y, color = 'red') plt.show()
这段代码便可将所有的点都绘制成红色。除了color参数,还有c参数可以使用,作用与color相同。这里要注意,使用c参数时只能传入单色一维数组。
2. 设置点的大小
通过s参数可以设置scatter中点的大小,这个大小可以通过单个值表示所有点的大小,或者传入一个大小与坐标相对应的二维数组来表示每个点的不同大小。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] size = [10, 20, 30, 40, 50] plt.scatter(x, y, s = size) plt.show()
这段代码中,我们定义了每个点的大小,从小到大为10到50。运行代码后,可以看到点的大小已经被设置成了不同的大小。
3. 设置点的形状
通过marker参数可以设置plt scatter中点的形状,这个形状可以由普通形状(如“.”,“o”)或matplotlib路径对象(如“P”)来表示。例如:
import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [5, 4, 3, 2, 1] marker = 'o' plt.scatter(x, y, marker = marker) plt.show()
这段代码中,我们将每个点的形状设置成了圆形“o”。这里需要注意,marker参数不支持图像数据的输入作为点的形状。
4. 其他参数
除了上述常见的参数之外,plt scatter还有其他很多参数,比如:
- edgecolors:边缘颜色
- linewidths:边框线宽
- alpha:透明度
这些参数可以更好地表现我们数据的特征。
四、示例代码
下面是一个使用plt scatter来绘制鸢尾花数据集的例子,我们根据鸢尾花不同的特征将花分为3组,用不同的颜色、大小和形状进行区分:
import matplotlib.pyplot as plt from sklearn.datasets import load_iris iris = load_iris() X = iris.data y = iris.target plt.scatter(X[:, 0], X[:, 1], c=y, s=100*X[:, 3], cmap='viridis', alpha=0.5, edgecolors='none') plt.colorbar() plt.title('Iris Data') plt.xlabel('sepal length (cm)') plt.ylabel('sepal width (cm)') plt.show()
运行以上代码,我们将得到下面的图形:
总结
plt scatter是一个快速、方便、直观的绘图工具,可以帮助我们更好地理解数据集的分布、趋势以及异常值。在使用plt scatter时,我们需要注意参数的设置,根据数据集的特点来选择不同的颜色、大小、形状来展示数据,以便更好地解释和理解数据。
原创文章,作者:FQHNL,如若转载,请注明出处:https://www.506064.com/n/368572.html