一、dataframe刪除空值行
刪除空值行是數據清洗中必不可少的一部分。在pandas中,可以使用dropna()函數來刪除空值的行。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) df.dropna(inplace=True) # inplace參數設為True,可以直接修改原數據 print(df)
上述代碼中,我們首先創建一個包含空值的DataFrame,接著使用dropna()函數刪除空值行,最後輸出處理後的數據。
二、pandas刪除空值的列
與刪除空值行相對應的是刪除空值列。在pandas中,可以使用dropna()函數的axis參數指定刪除空值的列。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) df.dropna(axis=1, inplace=True) print(df)
上述代碼中,我們同樣先創建一個包含空值的DataFrame。接著使用dropna()函數並指定axis參數為1,表示刪除列,最後輸出處理後的數據。
三、pandas刪除空白行
除了空值行外,pandas還可以刪除空白行。空白行可能包含有不可見的空白字元。在pandas中,可以使用dropna()函數的how參數設為’all’來刪除所有空白行。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [' ', 2, np.nan, 4], 'B': [' ', np.nan, ' ', 8], 'C': [9, 10, 11, 12]}) df.replace(' ', np.nan, inplace=True) # 將空白字元替換為NaN df.dropna(how='all', inplace=True) # 刪除所有空白行 print(df)
上述代碼中,我們首先在DataFrame中添加了一些包含空白字元的行。接著使用replace()函數將空白字元替換成NaN,然後使用dropna()函數並指定how參數為’all’來刪除所有空白行,最後輸出處理後的數據。
四、pandas去除空值行
除了刪除空值行外,還有一種操作是去除空值行。去除空值行可以保留原數據,同時也可以減少數據量和提高數據質量。在pandas中,可以使用dropna()函數的thresh參數來指定每行至少含有多少個非空值才保留,從而達到去除空值行的目的。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) df.dropna(thresh=2, inplace=True) # 至少含有兩個非空值才保留 print(df)
上述代碼中,我們使用dropna()函數的thresh參數設為2,表示每行至少含有兩個非空值才保留,最後輸出處理後的數據。
五、pandas刪除空值的行
除了dropna()函數外,pandas中還有一種常用的方法是使用boolean indexing。boolean indexing通常用於根據某些條件過濾數據。在pandas中,可以使用isnull()函數和any()函數來實現。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) df = df[~df.isnull().any(axis=1)] # 刪除含有空值的行 print(df)
上述代碼中,我們首先使用isnull()函數判斷數據是否為空值,接著使用any()函數和axis參數設為1,表示只要行中有空值,就視為True。最後使用~運算符將True轉為False,得到最終的boolean indexing,即刪除含有空值的行。
六、pandas刪除空列
除了刪除空值行和空白行外,pandas還可以刪除空列。在pandas中,可以使用dropna()函數的axis參數設為1來刪除空列。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, np.nan]}) df.dropna(axis=1, how='all', inplace=True) # 刪除所有空列 print(df)
上述代碼中,我們使用dropna()函數的how參數設為’all’來刪除所有空列,最後輸出處理後的數據。
七、刪除空值所在行pandas
與除了空白行和空列外的刪除操作相對應的是只刪除含有空值的行。在pandas中,可以使用dropna()函數的subset參數來指定哪些列需要判斷是否含有空值。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, np.nan]}) df.dropna(subset=['A', 'B'], how='any', inplace=True) # 刪除A和B列中含有空值的行 print(df)
上述代碼中,我們使用dropna()函數的subset參數指定對’A’和’B’列進行操作,同時使用how參數設為’any’表示只要含有空值就進行刪除。
八、pandas刪除指定行
除了刪除空值行外,pandas中還可以刪除指定的行。在pandas中,可以使用drop()函數來實現。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8], 'C': [9, 10, 11, 12]}) df.drop([1, 3], axis=0, inplace=True) # 刪除第1和第3行 print(df)
上述代碼中,我們使用drop()函數的第一個參數指定要刪除的行的索引,第二個參數指定刪除行的維度,即axis參數設為0表示按行刪除,最後使用inplace參數直接修改原數據。
九、pandas刪除含有空值的行
除了刪除特定的行外,pandas中還可以刪除含有空值的行。在pandas中,可以使用boolean indexing。
import pandas as pd import numpy as np df = pd.DataFrame({'A': [1, 2, np.nan, 4], 'B': [5, np.nan, 7, 8], 'C': [9, 10, 11, 12]}) df = df[df.notnull().all(axis=1)] # 刪除含有空值的行 print(df)
上述代碼中,我們使用notnull()函數判斷數據是否為空值,接著使用all()函數和axis參數設為1,表示整行都非空值才為True。最後使用boolean indexing刪除含有空值的行。
結語
本文分別介紹了pandas刪除空值行的幾種方法,包括刪除空值行、刪除空值列、刪除空白行、去除空值行、刪除空列、刪除指定行、刪除含有空值的行等。同時也對每種方法進行了詳細的講解和代碼示例。希望本文能夠幫助大家更好地進行數據清洗和處理。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/184375.html