一、read_table函數功能介紹
read_table是pandas中用於讀取表格型數據的函數,可以讀取各種格式的數據文件,包括csv、tsv、excel、txt等等,讀取後的數據格式為DataFrame,是pandas中最常用的數據類型之一。read_table函數的詳細使用方法會在後面的小標題中介紹。
二、read_table函數常用參數
read_table(filepath_or_buffer,sep='\t',delimiter=None,header='infer',names=None, index_col=None,usecols=None,squeeze=False,prefix=None, mangle_dupe_cols=True, dtype=None, engine=None,converters=None, true_values=None, false_values=None,skipinitialspace=False,skiprows=None, nrows=None,na_values=None,keep_default_na=True,na_filter=True, verbose=False,skip_blank_lines=True,parse_dates=False,infer_datetime_format=False, keep_date_col=False, date_parser=None,dayfirst=False,iterator=False,chunksize=None, compression='infer',thousands=None, decimal=b'.',comment=None,encoding=None, dialect=None,error_bad_lines=True,warn_bad_lines=True,skipfooter=0, doublequote=True,escapechar=None,quotechar='"',quoting=0,lineterminator=None, delim_whitespace=False,low_memory=True,memory_map=False,float_precision=None)
常用參數說明:
- filepath_or_buffer: 文件路徑或可讀取的文件對象。
- sep: 欄位分隔符,默認為’\t’。
- delimiter: 指定欄位分隔符,若不指定則sep生效。
- header: 指定表頭所在行號,默認值為’inf’, 即不含表頭。
- names: 指定列名列表。
- index_col: 指定某列作為行索引。
- usecols: 指定需要讀取的列。
- dtype: 指定列數據類型。
- na_values: 指定缺失值表示字元。
- skiprows: 指定需要跳過的行。
- nrows: 指定讀取行數。
- encoding: 指定讀取文件的編碼格式。
三、read_table函數使用實例
1. 讀取csv文件
讀取csv文件,以’,’為分隔符,默認讀取所有列。
import pandas as pd df = pd.read_table('data.csv',sep=',') df.head()
2. 讀取含表頭的tsv文件
讀取含表頭的tsv文件,以’\t’為分隔符,自定義列名。
import pandas as pd df = pd.read_table('data.tsv',sep='\t',header=0,names=['Col1','Col2','Col3']) df.head()
3. 讀取txt文件
讀取純文本文件,選取第2、4、6行,以空格為分隔符。
import pandas as pd df = pd.read_table('data.txt',sep=' ',usecols=[1,3,5],skiprows=[0,1,3]) df.head()
4. 讀取excel文件
讀取excel文件,選取第一個sheet的A列和B列。
import pandas as pd df = pd.read_table('data.xlsx',usecols=['A','B']) df.head()
5. 讀取網頁數據
從URL讀取網頁數據,讀取第0列和第1列,用Tab分隔,缺失值替換為空格。
import pandas as pd url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data' df = pd.read_table(url,sep='\t', usecols=[0,1],na_values=' ') df.head()
四、總結
本文介紹了Pandas庫中read_table函數的使用指南,包括函數介紹、常用參數和實例演示。通過本文的學習,可以更加深入地理解read_table函數的應用,從而更好地處理表格數據。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/275766.html