Python Pandas教程：使用dataframe.to_csv導出數據到CSV文件

CSV文件（Comma-Separated Values）是一種常見的電子表格文件格式，其中數據用逗號（或其他分隔符）分隔，每行代表一條記錄，每列代表一個欄位。CSV文件可以被各種應用程序識別和處理，是非常常用的數據交換格式。

Python中使用pandas庫可以方便地處理CSV文件，並將數據從CSV文件中讀取到dataframe中，或者從dataframe中導出數據到CSV文件中。

Pandas提供了read_csv()函數，可以方便地從CSV文件中讀取數據到dataframe中。為了演示如何讀取CSV文件中的數據，我們首先需要準備一份CSV數據文件。以一個簡單的示例為例，在CSV數據文件中，我們有如下數據：

name,age,gender
Alice,25,Female
Bob,30,Male
Charlie,35,Male

讀取CSV文件代碼示例：

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

結果輸出：

      name  age  gender
0    Alice   25  Female
1      Bob   30    Male
2  Charlie   35    Male

通過read_csv()函數，我們將數據讀取到了dataframe中，並列印出來。

使用pandas的dataframe.to_csv()函數，可以將數據從dataframe導出到CSV文件中。我們可以指定導出的文件名、分隔符、是否輸出列名等參數。以前面讀取的dataframe為例，將數據導出到CSV文件中：

df.to_csv('output.csv', index=False)

index=False表示不輸出行索引，默認為True。

導出CSV文件後，我們可以打開文件查看導出的數據是否正確。

dataframe.to_csv()函數還提供了一些高級選項，可以更加靈活地控制導出的CSV文件。

可以使用sep參數指定導出的CSV文件中的分隔符。默認為逗號，可以改為其他字元。例如使用製表符作為分割符：

df.to_csv('output.tsv', sep='\t', index=False)

導出的CSV文件中，有可能存在缺失值。可以使用na_rep參數控制導出的文件中缺失值的表示方式。例如用「N/A」表示缺失值：

df.to_csv('output.csv', na_rep='N/A', index=False)

還可以使用行列切片的方式，選擇要導出的行列。例如只導出前兩行和前兩列的數據：

df.iloc[:2, :2].to_csv('output.csv', index=False)

通過reindex()函數可以修改dataframe的列順序，然後使用to_csv()函數導出數據到CSV文件中。例如將列的順序改為[『gender』, 『age』, 『name』]：

df.reindex(columns=['gender', 'age', 'name']).to_csv('output.csv', index=False)

在Python中使用pandas庫可以方便地讀取和導出CSV文件中的數據。通過read_csv()函數我們可以將CSV文件中的數據讀取到dataframe中，然後使用dataframe.to_csv()函數將數據導出到CSV文件中。還可以使用一些高級選項，更加靈活地控制導出的CSV文件。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/193369.html