利用Python處理數據列表的技巧

在數據分析的過程中, 能夠熟練使用Python處理數據列表是必不可少的基本技能。列表是Python中最常用的容器類型之一，列表數據類型用於存儲任意數量的有序項目，這些項目可以是數字、字元串、布爾值等等。在本文中，我們將會介紹一些Python處理數據列表的常用技巧。

一、選取列表之中的元素

選取列表中的元素是對列表進行操作的基礎，Python中有兩種方式選擇元素:

1. 通過下標選擇元素

  aList = ['a', 'b', 'c', 'd', 'e']
  print(aList[2])      # c

2. 利用切片選擇元素

  aList = ['a', 'b', 'c', 'd', 'e']
  print(aList[0:2])    # ['a', 'b']

注意: 切片語法包含起始位置，但不包含結束位置，如果省略開始位置，它默認從 0 開始；如果省略結束位置，它默認直到序列末尾。

二、插入、刪除和修改元素

對於列表中的元素，還可以通過插入、刪除和修改來更新它們。下面的例子展示了如何進行這些操作：

1. 插入元素:

  aList = ['a', 'b', 'c', 'd', 'e']
  aList.insert(2, 'x')  
  print(aList)        # ['a', 'b', 'x', 'c', 'd', 'e']

注意：使用 insert() 方法時，需要指定要插入的位置，以及需要插入的元素。

2. 刪除元素:

  aList = ['a', 'b', 'c', 'd', 'e']
  aList.pop(2)         
  print(aList)        # ['a', 'b', 'd', 'e']

注意：使用 pop() 方法時，需要指定要刪除的元素位置，它會刪除該位置上的元素並返回它的值，如果省略位置參數，它就會刪除列表中的最後一個元素。

3. 修改元素:

  aList = ['a', 'b', 'c', 'd', 'e']
  aList[2] = 'x'      
  print(aList)            # ['a', 'b', 'x', 'd', 'e']

三、列表推導式

列表推導式是一種簡單的創建列表的方法，提供了簡潔、高效、可讀性強的特點。它簡單的語法為:

  myList = [expression for item in iterable if condition]

其中：

1. expression 是列表的元素計算方法。

2. item 是可迭代對象中的每個元素。

3. iterable 是一個可迭代對象，如：列表、元組、字元串等。

4. condition 是篩選條件，可以省略。

下面是一個例子，它使用列表推導式創建了一個包含平方數的列表：

  squares = [x**2 for x in range(10)]
  print(squares)

結果為：[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

同時，在列表推導式之中，我們也可以加入條件篩選。下面的例子創建了一個包含偶數平方數的列表：

  evensquares = [x ** 2 for x in range(10) if x % 2 == 0]
  print(evensquares)

結果為: [0, 4, 16, 36, 64]

四、列表排序

列表排序是常用的數據處理操作之一，Python為我們提供了很多實現方法, 例如：sorted()函數、sort()方法等。

1. sorted() 函數, 返回一個排序後的新列表.

  originList = [5, 2, 7, 3]
  newList = sorted(originList)
  print(newList)      # [2, 3, 5, 7]

2. sort() 方法, 直接對原列表進行排序.

  originList = [5, 2, 7, 3]
  originList.sort()
  print(originList)   # [2, 3, 5, 7]

注意：sort()方法和sorted()函數之間的區別：sorted() 函數返回一個新的列表，而 sort() 方法是在原址排序。

五、列表去重

在數據分析的過程中，可能會遇到多個元素相同的情況，這時候需要對列表進行去重。Python提供了一種簡單的去重方法，使用集合（set）類型，它的元素唯一而且無序。代碼如下：

  originList = ['a', 'b', 'c', 'd', 'c']
  newList = list(set(originList))
  print(newList)      # ['c', 'a', 'd', 'b']

需要注意的是，使用 set() 可能會改變元素的順序，如果需要按照原來的順序輸出，可以使用循環遍歷原列表，逐個添加到新列表中。如下所示：

  originList = ['a', 'b', 'c', 'd', 'c']
  newList = []
  for item in originList:
      if item not in newList:
          newList.append(item)
  print(newList)      # ['a', 'b', 'c', 'd']

六、列表計數和統計

Python提供了一些方法用於計算列表中元素出現的次數。下面是兩個常用的方法：

1. count()方法，計算指定元素在列表中出現的次數。

  originList = ['a', 'b', 'c', 'd', 'c']
  count = originList.count('c')
  print(count)        # 2

2. collections 庫中的 Counter 類，可以用於計算整個列表中每個元素出現的次數。，使用方法如下：

  from collections import Counter
  myList = ['a', 'b', 'c', 'd', 'c']
  myCounter = Counter(myList)
  print(myCounter)    # Counter({'c': 2, 'a': 1, 'b': 1, 'd': 1})

Counter()返回一個字典，其中關鍵字為列表中的元素，值為元素在列表中出現的次數。

七、列表的複製

在Python中，利用「=」賦值操作符給列表變數賦值時，只是將它的引用（指向內存中的存儲地址）傳遞給新列表變數，並沒有真正的複製列表。

如果需要真正複製一份列表，有以下三種方法：

1. 切片方法，直接對原列表進行切片。如下：

  a = [1, 2, 3, 4, 5]
  b = a[:]

2. 使用列表方法的 copy(), 利用copy()函數複製列表。如下：

  a = [1, 2, 3, 4, 5]
  b = a.copy()

3. 使用內置的 copy 模塊，進行列表複製。如下：

  import copy
  a = [1, 2, 3, 4, 5]
  b = copy.copy(a)

結論

本文介紹了Python處理數據列表的常用技巧，包括選取列表中的元素、插入、刪除和修改元素、列表推導式、列表排序、列表去重、列表計數和統計、列表的複製等等。利用這些方法，在數據分析的過程中能夠大大提高處理效率和準確性。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/160664.html