一、read_table函數功能介紹
read_table是pandas中用於讀取表格型數據的函數,可以讀取各種格式的數據文件,包括csv、tsv、excel、txt等等,讀取後的數據格式為DataFrame,是pandas中最常用的數據類型之一。read_table函數的詳細使用方法會在後面的小標題中介紹。
二、read_table函數常用參數
read_table(filepath_or_buffer,sep='\t',delimiter=None,header='infer',names=None,
index_col=None,usecols=None,squeeze=False,prefix=None,
mangle_dupe_cols=True, dtype=None, engine=None,converters=None,
true_values=None, false_values=None,skipinitialspace=False,skiprows=None,
nrows=None,na_values=None,keep_default_na=True,na_filter=True,
verbose=False,skip_blank_lines=True,parse_dates=False,infer_datetime_format=False,
keep_date_col=False, date_parser=None,dayfirst=False,iterator=False,chunksize=None,
compression='infer',thousands=None, decimal=b'.',comment=None,encoding=None,
dialect=None,error_bad_lines=True,warn_bad_lines=True,skipfooter=0,
doublequote=True,escapechar=None,quotechar='"',quoting=0,lineterminator=None,
delim_whitespace=False,low_memory=True,memory_map=False,float_precision=None)
常用參數說明:
- filepath_or_buffer: 文件路徑或可讀取的文件對象。
- sep: 欄位分隔符,默認為’\t’。
- delimiter: 指定欄位分隔符,若不指定則sep生效。
- header: 指定表頭所在行號,默認值為’inf’, 即不含表頭。
- names: 指定列名列表。
- index_col: 指定某列作為行索引。
- usecols: 指定需要讀取的列。
- dtype: 指定列數據類型。
- na_values: 指定缺失值表示字元。
- skiprows: 指定需要跳過的行。
- nrows: 指定讀取行數。
- encoding: 指定讀取文件的編碼格式。
三、read_table函數使用實例
1. 讀取csv文件
讀取csv文件,以’,’為分隔符,默認讀取所有列。
import pandas as pd
df = pd.read_table('data.csv',sep=',')
df.head()
2. 讀取含表頭的tsv文件
讀取含表頭的tsv文件,以’\t’為分隔符,自定義列名。
import pandas as pd
df = pd.read_table('data.tsv',sep='\t',header=0,names=['Col1','Col2','Col3'])
df.head()
3. 讀取txt文件
讀取純文本文件,選取第2、4、6行,以空格為分隔符。
import pandas as pd
df = pd.read_table('data.txt',sep=' ',usecols=[1,3,5],skiprows=[0,1,3])
df.head()
4. 讀取excel文件
讀取excel文件,選取第一個sheet的A列和B列。
import pandas as pd
df = pd.read_table('data.xlsx',usecols=['A','B'])
df.head()
5. 讀取網頁數據
從URL讀取網頁數據,讀取第0列和第1列,用Tab分隔,缺失值替換為空格。
import pandas as pd
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
df = pd.read_table(url,sep='\t', usecols=[0,1],na_values=' ')
df.head()
四、總結
本文介紹了Pandas庫中read_table函數的使用指南,包括函數介紹、常用參數和實例演示。通過本文的學習,可以更加深入地理解read_table函數的應用,從而更好地處理表格數據。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/275766.html
微信掃一掃
支付寶掃一掃