學習pandas中的series函數用法

一、介紹

pandas是一種基於Python的數據分析工具，提供了快速、靈活、可靠的數據處理和整理能力，特別適合處理結構化和混雜數據。而Series是pandas中最基本的數據類型，它類似於一維數組。

在數據分析過程中，經常需要對數據進行預處理、清洗、統計等操作，pandas中的Series函數提供了非常方便的方法。了解Series的函數用法，可以讓我們更加高效地完成相關任務。

在pandas中，我們可以使用Series()函數來創建一個Series對象，它可以接收以下參數：

下面是一個創建Series對象的例子：

import pandas as pd

# 用列表創建Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)

運行結果如下：

0    1
1    3
2    5
3    7
4    9
dtype: int64

我們可以看到，這裡創建了一個1、3、5、7、9組成的Series對象，它的索引從0開始。通過指定index參數，我們可以自定義索引，例如：

# 指定索引創建Series
s = pd.Series([1, 3, 5, 7, 9], index=['a', 'b', 'c', 'd', 'e'])
print(s)

運行結果如下：

a    1
b    3
c    5
d    7
e    9
dtype: int64

我們可以發現，這裡的索引被改為了a、b、c、d、e。

我們可以使用索引來訪問Series對象中的數據，例如：

# 訪問Series中的數據
print(s['b'])

運行結果是3：

也可以使用整數索引來訪問Series中的數據，例如：

# 訪問Series中的數據
print(s[1])

運行結果同樣是3：

在Series中，我們可以對數據進行各種運算操作。

例如，我們可以使用apply()函數對Series中的每個元素應用指定的函數：

# 運用apply()函數
s = pd.Series([1, 2, 3, 4])
print(s.apply(lambda x: x ** 2))

運行結果如下：

0     1
1     4
2     9
3    16
dtype: int64

我們還可以對兩個Series對象進行運算操作。例如，我們可以將兩個Series對象相加：

s1 = pd.Series([1, 2, 3, 4])
s2 = pd.Series([5, 6, 7, 8])
print(s1 + s2)

運行結果如下：

0     6
1     8
2    10
3    12
dtype: int64

在處理數據的過程中，我們經常需要進行數據清洗操作，例如刪除重複的數據、空值等。Series提供了一些函數來支持這些操作。

例如，我們可以使用drop_duplicates()函數來刪除重複的元素：

s = pd.Series([1, 2, 3, 3, 4, 4, 5])
s = s.drop_duplicates()
print(s)

運行結果如下：

0    1
1    2
2    3
4    4
6    5
dtype: int64

我們還可以使用dropna()函數來刪除含有空值的元素：

s = pd.Series([1, 2, None, 4])
s = s.dropna()
print(s)

運行結果如下：

0    1.0
1    2.0
3    4.0
dtype: float64

pandas中的Series函數提供了一些基本的數據處理和清洗能力，能夠幫助我們更加高效地完成數據分析任務。在實際使用中，我們可以根據需求選擇不同的函數來完成相應的操作。

原創文章，作者：AJLB，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/139755.html