Pandas read_table函數使用指南

一、read_table函數功能介紹

read_table是pandas中用於讀取表格型數據的函數,可以讀取各種格式的數據文件,包括csv、tsv、excel、txt等等,讀取後的數據格式為DataFrame,是pandas中最常用的數據類型之一。read_table函數的詳細使用方法會在後面的小標題中介紹。

二、read_table函數常用參數

    read_table(filepath_or_buffer,sep='\t',delimiter=None,header='infer',names=None,
               index_col=None,usecols=None,squeeze=False,prefix=None,
               mangle_dupe_cols=True, dtype=None, engine=None,converters=None,
               true_values=None, false_values=None,skipinitialspace=False,skiprows=None,
               nrows=None,na_values=None,keep_default_na=True,na_filter=True,
               verbose=False,skip_blank_lines=True,parse_dates=False,infer_datetime_format=False,
               keep_date_col=False, date_parser=None,dayfirst=False,iterator=False,chunksize=None,
               compression='infer',thousands=None, decimal=b'.',comment=None,encoding=None,
               dialect=None,error_bad_lines=True,warn_bad_lines=True,skipfooter=0,
               doublequote=True,escapechar=None,quotechar='"',quoting=0,lineterminator=None,
               delim_whitespace=False,low_memory=True,memory_map=False,float_precision=None)

常用參數說明:

  • filepath_or_buffer: 文件路徑或可讀取的文件對象。
  • sep: 字段分隔符,默認為’\t’。
  • delimiter: 指定字段分隔符,若不指定則sep生效。
  • header: 指定表頭所在行號,默認值為’inf’, 即不含表頭。
  • names: 指定列名列表。
  • index_col: 指定某列作為行索引。
  • usecols: 指定需要讀取的列。
  • dtype: 指定列數據類型。
  • na_values: 指定缺失值表示字符。
  • skiprows: 指定需要跳過的行。
  • nrows: 指定讀取行數。
  • encoding: 指定讀取文件的編碼格式。

三、read_table函數使用實例

1. 讀取csv文件

讀取csv文件,以’,’為分隔符,默認讀取所有列。

    import pandas as pd
    df = pd.read_table('data.csv',sep=',')
    df.head()

2. 讀取含表頭的tsv文件

讀取含表頭的tsv文件,以’\t’為分隔符,自定義列名。

    import pandas as pd
    df = pd.read_table('data.tsv',sep='\t',header=0,names=['Col1','Col2','Col3'])
    df.head()

3. 讀取txt文件

讀取純文本文件,選取第2、4、6行,以空格為分隔符。

    import pandas as pd
    df = pd.read_table('data.txt',sep=' ',usecols=[1,3,5],skiprows=[0,1,3])
    df.head()

4. 讀取excel文件

讀取excel文件,選取第一個sheet的A列和B列。

    import pandas as pd
    df = pd.read_table('data.xlsx',usecols=['A','B'])
    df.head()

5. 讀取網頁數據

從URL讀取網頁數據,讀取第0列和第1列,用Tab分隔,缺失值替換為空格。

    import pandas as pd
    url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data'
    df = pd.read_table(url,sep='\t', usecols=[0,1],na_values=' ')
    df.head()

四、總結

本文介紹了Pandas庫中read_table函數的使用指南,包括函數介紹、常用參數和實例演示。通過本文的學習,可以更加深入地理解read_table函數的應用,從而更好地處理表格數據。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/275766.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-17 16:06
下一篇 2024-12-17 16:06

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python中capitalize函數的使用

    在Python的字符串操作中,capitalize函數常常被用到,這個函數可以使字符串中的第一個單詞首字母大寫,其餘字母小寫。在本文中,我們將從以下幾個方面對capitalize函…

    編程 2025-04-29
  • Python中set函數的作用

    Python中set函數是一個有用的數據類型,可以被用於許多編程場景中。在這篇文章中,我們將學習Python中set函數的多個方面,從而深入了解這個函數在Python中的用途。 一…

    編程 2025-04-29
  • 三角函數用英語怎麼說

    三角函數,即三角比函數,是指在一個銳角三角形中某一角的對邊、鄰邊之比。在數學中,三角函數包括正弦、餘弦、正切等,它們在數學、物理、工程和計算機等領域都得到了廣泛的應用。 一、正弦函…

    編程 2025-04-29
  • 單片機打印函數

    單片機打印是指通過串口或並口將一些數據打印到終端設備上。在單片機應用中,打印非常重要。正確的打印數據可以讓我們知道單片機運行的狀態,方便我們進行調試;錯誤的打印數據可以幫助我們快速…

    編程 2025-04-29
  • wzftp的介紹與使用指南

    如果你需要進行FTP相關的文件傳輸操作,那麼wzftp是一個非常優秀的選擇。本文將從詳細介紹wzftp的特點和功能入手,幫助你更好地使用wzftp進行文件傳輸。 一、簡介 wzft…

    編程 2025-04-29
  • Python3定義函數參數類型

    Python是一門動態類型語言,不需要在定義變量時顯示的指定變量類型,但是Python3中提供了函數參數類型的聲明功能,在函數定義時明確定義參數類型。在函數的形參後面加上冒號(:)…

    編程 2025-04-29
  • Python定義函數判斷奇偶數

    本文將從多個方面詳細闡述Python定義函數判斷奇偶數的方法,並提供完整的代碼示例。 一、初步了解Python函數 在介紹Python如何定義函數判斷奇偶數之前,我們先來了解一下P…

    編程 2025-04-29
  • Python實現計算階乘的函數

    本文將介紹如何使用Python定義函數fact(n),計算n的階乘。 一、什麼是階乘 階乘指從1乘到指定數之間所有整數的乘積。如:5! = 5 * 4 * 3 * 2 * 1 = …

    編程 2025-04-29
  • 分段函數Python

    本文將從以下幾個方面詳細闡述Python中的分段函數,包括函數基本定義、調用示例、圖像繪製、函數優化和應用實例。 一、函數基本定義 分段函數又稱為條件函數,指一條直線段或曲線段,由…

    編程 2025-04-29

發表回復

登錄後才能評論