R語言機器學習詳解

一、環境準備

在進行R語言機器學習前，必須先配置好開發環境。

首先，需要安裝R語言編程環境及相關依賴。可以在官網（https://www.r-project.org/）下載最新版本的R語言，並按照官方文檔安裝。安裝完畢後，可以在終端或RStudio中啟動R語言解釋器。


# 安裝R語言
sudo apt-get update
sudo apt-get install r-base

# 啟動R語言解釋器
R

其次，為了便於開發，推薦使用RStudio集成開發環境。同樣可以在官網（https://rstudio.com/）下載最新版的RStudio，然後安裝。

最後，需要安裝一些R語言機器學習庫，便於後續的開發。這裡推薦使用tidyverse、ggplot2等常用庫，可以通過R命令直接安裝：


# 安裝tidyverse、ggplot2等庫
install.packages("tidyverse")
install.packages("ggplot2")

二、數據處理

機器學習的第一步是數據處理。在R語言中，可以通過tidyverse等庫來完成數據的清洗、整理、轉換等操作。

下面是一個示例代碼，用於處理鳶尾花數據集：


# 載入數據集
iris_data <- iris

# 數據清洗
iris_data %>% 
  filter(Sepal.Length > 5) %>% 
  select(-Species) %>% 
  mutate(Sepal.Ratio = Sepal.Width/Sepal.Length) %>%
  head()

這段代碼首先載入鳶尾花數據集，然後對數據進行清洗、篩選、選擇、變換等操作。最後輸出前幾行處理後的數據。

三、特徵工程

特徵工程是機器學習的重要步驟之一，其目的是為了將原始數據轉化為更加適合機器學習模型的特徵。

R語言中可以使用諸如caret、tidymodels等庫來完成特徵工程。這裡以手寫數字識別為例，對數據進行預處理、特徵提取和特徵選擇，如下所示：


# 載入數據集
data(mnist)

# 預處理數據
mnist_prep <- prep_mnist(mnist)

# 特徵提取
mnist_feat <- mnist_prep %>% 
  feat_extract()

# 特徵選擇
mnist_sel <- mnist_feat %>% 
  select_features()

這段代碼首先載入手寫數字數據集，然後預處理數據，提取特徵，最後進行特徵選擇。其中，prep_mnist()函數是用於預處理未經過處理的數據集，並將其轉換為tidyverse格式的函數；feat_extract()函數對數據進行特徵提取；select_features()函數用於進行特徵選擇。

四、模型訓練

在進行特徵工程後，就可以開始訓練機器學習模型了。R語言中常用的機器學習庫包括caret、mlr、tidymodels等。

下面是一個簡單的代碼樣例，用於訓練決策樹模型：


# 載入數據集
data(iris)

# 拆分數據集
set.seed(123)
split_data <- initial_split(iris, prop = 0.7, strata = Species)
train_data <- training(split_data)
test_data <- testing(split_data)

# 訓練模型
dec_tree <- train(Species ~ ., 
                  data = train_data, 
                  method = "rpart", 
                  trControl = trainControl(method = "cv"))

# 預測結果
dec_tree_pred <- predict(dec_tree, test_data)

這段代碼首先載入鳶尾花數據集，然後將其拆分為訓練集和測試集。接着使用train()函數進行模型訓練，訓練決策樹模型。最後使用測試集進行預測。

五、模型評估

完成模型訓練後，需要評估模型的性能。在R語言中，可以使用諸如caret、mlr、tidymodels等庫來完成模型的評估。

下面是一個簡單的代碼樣例，用於評估決策樹模型的精度：


# 計算精度
dec_tree_acc <- confusionMatrix(dec_tree_pred, test_data$Species)$overall[[1]]

# 輸出結果
dec_tree_acc

這段代碼首先使用confusionMatrix()函數計算決策樹模型的精度，然後輸出結果。

原創文章，作者：URGU，如若轉載，請註明出處：https://www.506064.com/zh-hk/n/142968.html