1、背景信息
Pandas是一個用於數據分析的Python庫,它提供了一個數據結構DataFrame,可以輕鬆處理和操作數據。
2、正文
2.1 選取數據
在使用Pandas DataFrame進行遍歷之前,首先需要選取需要處理和操作的數據。Pandas DataFrame可以從多種數據源中創建,例如CSV文件、Excel文件、數據庫等。下面是一個從CSV文件中創建Pandas DataFrame的示例:
import pandas as pd # 從CSV文件中創建DataFrame df = pd.read_csv('data.csv')
選取數據可以使用Pandas DataFrame中的loc和iloc方法。
loc方法根據標籤選取數據,例如:
# 選取第一行數據 df.loc[1] # 選取第一行和第二行數據 df.loc[1:2] # 選取特定行和列的數據 df.loc[[1,3], ['col1', 'col2']]
iloc方法根據行號選取數據,例如:
# 選取第一行數據 df.iloc[0] # 選取第一行和第二行數據 df.iloc[0:2] # 選取特定行和列的數據 df.iloc[[0,2], [0,1]]
2.2 遍曆數據
在選取數據之後,可以使用for循環和iterrows()方法遍歷Pandas DataFrame中的所有行。
使用for循環遍歷:
# 遍歷DataFrame中的所有行 for index, row in df.iterrows(): print(row['col1'], row['col2'], row['col3'])
使用iterrows()方法遍歷:
# 遍歷DataFrame中的所有行 for index, row in df.iterrows(): print(row['col1'], row['col2'], row['col3'])
在Pandas DataFrame中遍歷行通常比較慢,在處理大型數據集時需要考慮性能問題。可以使用apply()方法對DataFrame中的所有行進行操作。例如,下面的代碼計算了Pandas DataFrame每行的總和。
# 創建一個計算總和的函數 def sum_row(row): return row['col1'] + row['col2'] + row['col3'] # 對DataFrame中的所有行進行操作 df['total'] = df.apply(sum_row, axis=1) # 顯示DataFrame print(df)
2.3 遍歷列
遍歷Pandas DataFrame中的列可以使用for循環或iteritems()方法。使用for循環遍歷:
# 遍歷DataFrame中的所有列 for col_name in df: print(col_name)
使用iteritems()方法遍歷:
# 遍歷DataFrame中的所有列 for col_name, col_data in df.iteritems(): print(col_name, col_data)
2.4 遍歷行和列
當需要遍歷Pandas DataFrame中的行和列時,可以使用iterrows()方法和iteritems()方法的組合進行遍歷。
# 遍歷DataFrame中的所有行和列 for index, row in df.iterrows(): for col_name, col_data in row.iteritems(): print(col_name, col_data)
3、小標題
1、選取數據。
2、遍曆數據。
3、遍歷列。
4、遍歷行和列。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/245620.html