Dataframe初始化詳解

一、Dataframe是什麼

Dataframe是一個二維標籤數組,它含有不同類型的列,其中每一列可以是一個不同的值類型,如浮點、整數或字元串等。Dataframe常被用作數據科學和機器學習中的主要數據結構。

Dataframe中的數據可以通過多種方式初始化,本文將對這些初始化方式進行詳細說明和演示。

二、使用列表初始化Dataframe

利用列表初始化Dataframe是一種最基礎的方式。可以通過傳入由列表構成的字典來初始化Dataframe,字典的key表示列名,value則為相應的列表。

import pandas as pd

dict_data = {'name': ['David', 'Tina', 'Lucy', 'Jone', 'Tom'],
             'age': [18, 19, 20, 21, 25],
             'gender': ['M', 'F', 'F', 'F', 'M']}
df = pd.DataFrame(dict_data)

print(df.head())

結果將會輸出:

    name  age gender
0  David   18      M
1   Tina   19      F
2   Lucy   20      F
3   Jone   21      F
4    Tom   25      M

三、使用NumPy數組初始化Dataframe

另一種初始化Dataframe的方法是利用NumPy數組,其中每列會用數組的列來構建Dataframe,例如:

import numpy as np
import pandas as pd

arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12], [13, 14, 15]])
df = pd.DataFrame(arr, columns=['A', 'B', 'C'])

print(df.head())

結果將會輸出:

    A   B   C
0   1   2   3
1   4   5   6
2   7   8   9
3  10  11  12
4  13  14  15

四、讀取CSV數據文件初始化Dataframe

使用pandas讀取CSV文件來初始化Dataframe是最常用的方法之一。以下示例用pandas從CSV文件中讀取並初始化一個Dataframe:

import pandas as pd

df = pd.read_csv('data.csv')

print(df.head())

結果將會輸出讀取的CSV文件的前5行數據。

五、使用字典數組初始化Dataframe

最後一種方法是使用字典構成的數組。每個字典包含Dataframe中的一行數據,字典的key表示列名,value則為相應的值。

import pandas as pd

data = [{'name': 'David', 'age': 18, 'gender': 'M'},
        {'name': 'Tina', 'age': 19, 'gender': 'F'},
        {'name': 'Lucy', 'age': 20, 'gender': 'F'},
        {'name': 'John', 'age': 21, 'gender': 'F'},
        {'name': 'Tom', 'age': 22, 'gender': 'M'}]

df = pd.DataFrame(data)

print(df.head())

結果將會輸出:

    name  age gender
0  David   18      M
1   Tina   19      F
2   Lucy   20      F
3   John   21      F
4    Tom   22      M

六、總結

Dataframe是進行數據科學和機器學習的必要數據結構之一。本文介紹了Dataframe的基礎知識以及它的多種初始化方法。上面展示的示例代碼中,演示了使用列表、NumPy數組、CSV文件和字典數組初始化Dataframe的方法。在實際運用過程中,應按照實際情況掌握每種方法,並且熟練掌握常用的Dataframe函數進行數據處理。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/187694.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-11-28 06:24
下一篇 2024-11-28 06:25

相關推薦

  • Go中struct的初始化

    本文將從多個方面詳細闡述Go中struct的初始化方式,包括使用字面量初始化、使用new函數初始化以及使用構造函數等。通過本文的介紹,讀者能夠更深入的了解Go中struct的初始化…

    編程 2025-04-28
  • Python DataFrame轉List用法介紹

    Python中常用的數據結構之一為DataFrame,但有時需要針對特定需求將DataFrame轉為List。本文從多個方面針對Python DataFrame轉List詳細介紹。…

    編程 2025-04-27
  • 神經網路代碼詳解

    神經網路作為一種人工智慧技術,被廣泛應用於語音識別、圖像識別、自然語言處理等領域。而神經網路的模型編寫,離不開代碼。本文將從多個方面詳細闡述神經網路模型編寫的代碼技術。 一、神經網…

    編程 2025-04-25
  • Linux sync詳解

    一、sync概述 sync是Linux中一個非常重要的命令,它可以將文件系統緩存中的內容,強制寫入磁碟中。在執行sync之前,所有的文件系統更新將不會立即寫入磁碟,而是先緩存在內存…

    編程 2025-04-25
  • git config user.name的詳解

    一、為什麼要使用git config user.name? git是一個非常流行的分散式版本控制系統,很多程序員都會用到它。在使用git commit提交代碼時,需要記錄commi…

    編程 2025-04-25
  • Python輸入輸出詳解

    一、文件讀寫 Python中文件的讀寫操作是必不可少的基本技能之一。讀寫文件分別使用open()函數中的’r’和’w’參數,讀取文件…

    編程 2025-04-25
  • nginx與apache應用開發詳解

    一、概述 nginx和apache都是常見的web伺服器。nginx是一個高性能的反向代理web伺服器,將負載均衡和緩存集成在了一起,可以動靜分離。apache是一個可擴展的web…

    編程 2025-04-25
  • Python安裝OS庫詳解

    一、OS簡介 OS庫是Python標準庫的一部分,它提供了跨平台的操作系統功能,使得Python可以進行文件操作、進程管理、環境變數讀取等系統級操作。 OS庫中包含了大量的文件和目…

    編程 2025-04-25
  • Linux修改文件名命令詳解

    在Linux系統中,修改文件名是一個很常見的操作。Linux提供了多種方式來修改文件名,這篇文章將介紹Linux修改文件名的詳細操作。 一、mv命令 mv命令是Linux下的常用命…

    編程 2025-04-25
  • MPU6050工作原理詳解

    一、什麼是MPU6050 MPU6050是一種六軸慣性感測器,能夠同時測量加速度和角速度。它由三個感測器組成:一個三軸加速度計和一個三軸陀螺儀。這個組合提供了非常精細的姿態解算,其…

    編程 2025-04-25

發表回復

登錄後才能評論