一、概述
Excel歸一化指的是將Excel中的數據進行處理,使其符合一定的數值範圍,便於比較與分析。歸一化在數據處理中起到了重要的作用。本文將介紹Excel歸一化的方法以及其應用場景。
二、最大最小值歸一化
最大最小值歸一化是Excel歸一化中一種最常見的方法,也是最簡單的一種方法。其過程是將數據中最大值與最小值計算出來,並將數據進行縮放,使其在0到1之間。具體的歸一化公式如下:
y = (x - min(x)) / (max(x) - min(x))
其中,y表示歸一化後的值,x表示原始數據,min(x)表示數據中的最小值,max(x)表示數據中的最大值。
該方法適用於特徵值相差較大的場景,如一個數據中,某個特徵值為100,而其他特徵值都在0-1之間,此時就需要使用最大最小值歸一化將其縮放到0-1之間。
三、Z-score歸一化
Z-score歸一化又稱為標準差標準化,其過程是將數據進行縮放,使其均值為0,標準差為1。具體的歸一化公式如下:
y = (x - mean(x)) / std(x)
其中,y表示歸一化後的值,x表示原始數據,mean(x)表示數據中的均值,std(x)表示數據中的標準差。
該方法適用於特徵值分布較為集中的場景,如一組數據中,每個特徵值都在0-1之間,但是它們的均值和標準差不同。
四、小數定標歸一化
小數定標歸一化是一種將數據移動到小數點後面的方法,使其最高位為1。具體的歸一化公式如下:
x /= 10**j,其中j為滿足:|x|<1時,|x × 10**j|≥1
該方法適用於特徵值差距較大的場景,如一組數據中,某些特徵值為很小的小數,而其他特徵值則非常大。
五、代碼示例
最大最小值歸一化代碼示例:
# 導入pandas庫
import pandas as pd
# 讀取Excel數據
df = pd.read_excel('data.xlsx')
# 最大最小值歸一化
df_norm = (df - df.min()) / (df.max() - df.min())
# 輸出歸一化後的數據
print(df_norm)
Z-score歸一化代碼示例:
# 導入pandas庫
import pandas as pd
# 讀取Excel數據
df = pd.read_excel('data.xlsx')
# Z-score歸一化
df_norm = (df - df.mean()) / df.std()
# 輸出歸一化後的數據
print(df_norm)
小數定標歸一化代碼示例:
# 導入pandas庫
import pandas as pd
import math
# 讀取Excel數據
df = pd.read_excel('data.xlsx')
# 小數定標歸一化
j = int(math.ceil(math.log10(df.abs().max().max())))
df_norm = df / (10 ** j)
# 輸出歸一化後的數據
print(df_norm)
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/244886.html