1、引言
數據處理中,往往會用到pandas庫中的dataframe類型,但是如果需要將dataframe轉換成array類型,則需要使用numpy庫進行實現。本文就將帶領大家深入了解如何將dataframe轉換成array,方便讀者在進行數據處理時能夠更加得心應手。
2、轉換方法
2.1 將dataframe所有列名作為array的第一行
使用array()函數進行轉換,會將dataframe中每一行數據作為array的一行,此時array的列名會顯示成一個類似字段名的字串,而字段名與數據被’\r’字符隔開的。下面是實現代碼:
import numpy as np
import pandas as pd
df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})
array = np.array(df)
print(array)
輸出結果:
[['Tom' 23] ['Jack' 23] ['Mark' 23]]
我們可以看到,array的第一行顯示的是dataframe的列名。
2.2 將dataframe去掉列名,只留數據
在有些情況下,我們並不需要array顯示dataframe的列名,只需要dataframe中的數據,那麼我們可以使用values進行數據提取。下面是實現代碼:
import numpy as np
import pandas as pd
df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})
array = np.array(df.values)
print(array)
輸出結果:
[['Tom' 23] ['Jack' 23] ['Mark' 23]]
我們可以看到,array的第一行沒有了dataframe的列名,只留下了數據。此時,我們可以對數據進行一些計算和處理。
2.3 將dataframe中的某一列轉換成array
在有些情況下,我們需要將dataframe中的某一列轉換成array進行處理,那麼我們可以先提取這一列的數據,再使用array進行轉換。下面是實現代碼:
import numpy as np
import pandas as pd
df = pd.DataFrame({'name':['Tom','Jack','Mark'], 'age':[23,23,23]})
array = np.array(df['age'])
print(array)
輸出結果:
[23 23 23]
我們可以看到,array中只有dataframe中的某一列數據,這樣方便我們進行一些針對性的處理。
3、結論
本文通過三種實現方式,詳細介紹了如何將dataframe轉換成array,並且給出了對應的實現代碼。在數據處理中,如果需要進行一些高級的數據分析和處理,那麼使用array會顯得更加得心應手。希望讀者能夠根據自己的需求,靈活運用本文提供的實現方法。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/154103.html