如何使用DataFrame.head()快速展示數據

一、什麼是DataFrame.head()?

DataFrame是Pandas庫中最有名的一個數據類型,它相當於是一個二維的、帶標籤的數據結構,在處理數據的時候非常方便。DataFrame.head()是Pandas庫中一個用來展示數據的函數,它可以快速地返回DataFrame中前幾行數據。

import pandas as pd

# 創建一個DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky', 'Vin', 'Lisa', 'Kate', 'Emma', 'Annie', 'Maggie'], 
        'Age':[28, 34, 29, 42, 25, 23, 35, 31, 27, 39], 
        'Sex':['M', 'M', 'M', 'M', 'F', 'F', 'F', 'F', 'F', 'F']} 
df = pd.DataFrame(data)

# 使用.head()展示前3行數據
print(df.head(3))

以上代碼中,我們創建了一個包含Name、Age、Sex三個列的DataFrame,然後使用.head()展示了前三行數據。

二、DataFrame.head()函數的參數及應用場景

DataFrame.head()函數可以接受一個整數參數n作為輸入,表示返回前n行的數據。如果不傳入任何參數,則默認返回前5行的數據。

import pandas as pd

# 創建一個DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky', 'Vin', 'Lisa', 'Kate', 'Emma', 'Annie', 'Maggie'], 
        'Age':[28, 34, 29, 42, 25, 23, 35, 31, 27, 39], 
        'Sex':['M', 'M', 'M', 'M', 'F', 'F', 'F', 'F', 'F', 'F']} 
df = pd.DataFrame(data)

# 使用.head()展示前7行數據
print(df.head(7))

以上代碼中,我們使用.head()展示了前7行的數據。

應用場景:在處理大數據集的時候,我們通常只需要查看前幾行的數據就可以得到一個大概的了解,DataFrame.head()正好滿足這個需求。同時,在數據集較大的情況下,展示整個數據集可能會導致機器卡頓且耗費大量時間,使用.head()可以快速地展示數據,提高效率。

三、展示數據中的某幾列

除了展示前幾行數據之外,DataFrame.head()還可以結合DataFrame的列索引來展示我們想要的某幾列數據。

import pandas as pd

# 創建一個DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky', 'Vin', 'Lisa', 'Kate', 'Emma', 'Annie', 'Maggie'], 
        'Age':[28, 34, 29, 42, 25, 23, 35, 31, 27, 39], 
        'Sex':['M', 'M', 'M', 'M', 'F', 'F', 'F', 'F', 'F', 'F']} 
df = pd.DataFrame(data)

# 使用.head()展示前3行Name和Age兩列數據
print(df[['Name','Age']].head(3))

以上代碼中,我們使用.head()展示了前3行DataFame中Name和Age兩列的數據。

四、DataFrame.head()與數據清洗

在進行數據清洗的時候,我們通常需要查看數據中是否存在臟數據或者缺失數據。使用DataFrame.head()可以幫助我們快速地查看數據中的情況。

import pandas as pd

# 創建一個裝有數據清洗前的數據集的DataFrame
data = {'Name':['Tom', 'Jack', 'Steve', 'Ricky', 'Vin', 'Lisa', 'Kate', 'Emma', 'Annie', 'Maggie'], 
        'Age':[28, 34, 29, 42, 25, 23, 35, 31, 27, 39], 
        'Salary':[10000, 15000, 20000, 30000, 17000, 18000, 25000, '', 28000, 15000]} 
df = pd.DataFrame(data)

# 使用.head()展示前5行數據
print(df.head())

# 刪除數據清洗中發現的某些數據
df = df.dropna()  # 刪除空值
df['Salary'] = pd.to_numeric(df['Salary'], errors='coerce')  # 將Salary列轉換成數值型數據
df = df.dropna()  # 再次刪除空值
print(df.head())  # 再次使用.head()展示前5行數據

以上代碼中,我們創建了一個具有臟數據和缺失值的DataFrame,然後使用DataFrame.head()展示前5行數據。接著,我們對數據進行清洗,包括刪除缺失值並將數據類型轉換為數值型,最後再使用.head()展示前5行數據。

五、總結

我們可以看到,DataFrame.head()函數在數據的快速展示和數據清洗中都有非常重要的作用。通過本文的介紹,我們可以更加深入地了解到該函數的用法和應用場景。

原創文章,作者:CWON,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/148272.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
CWON的頭像CWON
上一篇 2024-11-03 15:14
下一篇 2024-11-03 15:15

相關推薦

  • Python讀取CSV數據畫散點圖

    本文將從以下方面詳細闡述Python讀取CSV文件並畫出散點圖的方法: 一、CSV文件介紹 CSV(Comma-Separated Values)即逗號分隔值,是一種存儲表格數據的…

    編程 2025-04-29
  • Ojlat:一款快速開發Web應用程序的框架

    Ojlat是一款用於快速開發Web應用程序的框架。它的主要特點是高效、易用、可擴展且功能齊全。通過Ojlat,開發人員可以輕鬆地構建出高質量的Web應用程序。本文將從多個方面對Oj…

    編程 2025-04-29
  • 如何使用Python獲取某一行

    您可能經常會遇到需要處理文本文件數據的情況,在這種情況下,我們需要從文本文件中獲取特定一行的數據並對其進行處理。Python提供了許多方法來讀取和處理文本文件中的數據,而在本文中,…

    編程 2025-04-29
  • Python中讀入csv文件數據的方法用法介紹

    csv是一種常見的數據格式,通常用於存儲小型數據集。Python作為一種廣泛流行的編程語言,內置了許多操作csv文件的庫。本文將從多個方面詳細介紹Python讀入csv文件的方法。…

    編程 2025-04-29
  • 如何用Python統計列表中各數據的方差和標準差

    本文將從多個方面闡述如何使用Python統計列表中各數據的方差和標準差, 並給出詳細的代碼示例。 一、什麼是方差和標準差 方差是衡量數據變異程度的統計指標,它是每個數據值和該數據值…

    編程 2025-04-29
  • Python多線程讀取數據

    本文將詳細介紹多線程讀取數據在Python中的實現方法以及相關知識點。 一、線程和多線程 線程是操作系統調度的最小單位。單線程程序只有一個線程,按照程序從上到下的順序逐行執行。而多…

    編程 2025-04-29
  • 如何使用jumpserver調用遠程桌面

    本文將介紹如何使用jumpserver實現遠程桌面功能 一、安裝jumpserver 首先我們需要安裝並配置jumpserver。 $ wget -O /etc/yum.repos…

    編程 2025-04-29
  • Python兩張表數據匹配

    本篇文章將詳細闡述如何使用Python將兩張表格中的數據匹配。以下是具體的解決方法。 一、數據匹配的概念 在生活和工作中,我們常常需要對多組數據進行比對和匹配。在數據量較小的情況下…

    編程 2025-04-29
  • Python爬取公交數據

    本文將從以下幾個方面詳細闡述python爬取公交數據的方法: 一、準備工作 1、安裝相關庫 import requests from bs4 import BeautifulSou…

    編程 2025-04-29
  • Python數據標準差標準化

    本文將為大家詳細講述Python中的數據標準差標準化,以及涉及到的相關知識。 一、什麼是數據標準差標準化 數據標準差標準化是數據處理中的一種方法,通過對數據進行標準差標準化可以將不…

    編程 2025-04-29

發表回復

登錄後才能評論