梯度下降演算法

梯度下降演算法是許多機器學習演算法中用來最小化代價函數的優化演算法。梯度下降演算法用於更新學習模型的參數。

以下是不同類型的梯度下降:

  • 批量梯度下降:批量梯度下降是一種梯度演算法,用於處理梯度下降每次迭代的所有訓練數據集。假設訓練數據集的數量很大,批量梯度下降會比較昂貴。因此,如果訓練數據集的數量很大,則不建議用戶使用批量梯度下降。相反,他們可以對大型訓練數據集使用小批量梯度下降。
  • 小批量梯度下降:小批量梯度下降是用於比其他兩種梯度下降工作更快的梯度下降類型。假設用戶有「 p 」(其中「 p 」是批量梯度下降)數據集,其中每次迭代將處理 p < m (其中「 m 」是小批量梯度下降)。因此,即使「 p 」訓練數據集的數量很大,小批量梯度下降也會在一次嘗試中分批處理「 p 」訓練數據集。因此,它可以用較少的迭代次數處理大型訓練數據集。
  • 隨機梯度下降:隨機梯度下降是梯度下降的類型,每次迭代可以處理一個訓練數據集。因此,參數將在每次迭代後更新,在每次迭代中只處理了一個數據集。這種梯度下降比批量梯度下降更快。但是,如果訓練數據集的數量很大,那麼它一次將只處理一個數據集。因此,迭代次數會很大。

使用的變數:

設『k』為訓練數據集的個數。

讓『j』為數據集中的要素數量。

如果 p == k ,小批量梯度下降的行為將類似於批量梯度下降。(其中『p』為批量梯度下降)

用於批量梯度下降的演算法:

設 h θ (a) 為線性回歸的假設。那麼成本函數將由下式給出:

讓σ代表從 t = 1 到 k 的所有訓練數據集的總和。

Gtrain(θ) = (1/2k) Σ (hθ(a(t)) - b(t))2

Repeat {
θg = θg - (learning rate/k) * Σ (hθ(a(t)) - b(t))ag(t)
   For every g = 0 …j
}

其中 a g (t) 代表 t th 訓練數據集的 g th 特徵,假設如果「 k 非常大(例如,700 萬個訓練數據集),那麼批量梯度下降將花費數小時甚至數天來完成該過程。因此,對於大的訓練數據集,不建議用戶使用批量梯度下降,因為這會減慢機器的學習過程。

用於小批量梯度下降的演算法

假設「 p 」是一批中數據集的數量,其中 p < k.

讓p = 10**k = 100**;

然而,用戶可以調整批量大小。這通常寫成 2 的冪。

重複{對於 t = 1,11,21,…..,91 設σ為 d .θ<sub>g</sub>=θ<sub>g</sub>-(學習率/大小(p))*σ(h<sub>θ</sub>(a<sup>(d)</sup>)-b<sup>(d)</sup>)a<sub>g</sub><sup>(d)</sup>
每 g = 0 …j 
 } 

用於隨機梯度下降的演算法;

  • 這種梯度下降將隨機打亂數據集,為每種數據訓練參數。
  • 隨機梯度下降每次迭代只需要一個數據集。
Hence,
Let (a(t), b(t)) be the training dataset
Cost(θ, (a(t), b(t))) = (1/2) Σ (hθ(a(t)) - b(t))2

Gtrain(θ) = (1/k) Σ Cost (θ, (a(t), b(t)))

Repeat {
  For t = 1 to k{
      Θg = θg - (learning rate) * Σ (hθ(a(t)) - b(t))ag(t)
        For every g = 0 …j

        }
}

結論

在本教程中,我們已經討論了不同類型的梯度下降演算法及其變體。


原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/235523.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 11:51
下一篇 2024-12-12 11:55

相關推薦

  • 蝴蝶優化演算法Python版

    蝴蝶優化演算法是一種基於仿生學的優化演算法,模仿自然界中的蝴蝶進行搜索。它可以應用於多個領域的優化問題,包括數學優化、工程問題、機器學習等。本文將從多個方面對蝴蝶優化演算法Python版…

    編程 2025-04-29
  • Python實現爬樓梯演算法

    本文介紹使用Python實現爬樓梯演算法,該演算法用於計算一個人爬n級樓梯有多少種不同的方法。 有一樓梯,小明可以一次走一步、兩步或三步。請問小明爬上第 n 級樓梯有多少種不同的爬樓梯…

    編程 2025-04-29
  • AES加密解密演算法的C語言實現

    AES(Advanced Encryption Standard)是一種對稱加密演算法,可用於對數據進行加密和解密。在本篇文章中,我們將介紹C語言中如何實現AES演算法,並對實現過程進…

    編程 2025-04-29
  • Harris角點檢測演算法原理與實現

    本文將從多個方面對Harris角點檢測演算法進行詳細的闡述,包括演算法原理、實現步驟、代碼實現等。 一、Harris角點檢測演算法原理 Harris角點檢測演算法是一種經典的計算機視覺演算法…

    編程 2025-04-29
  • 數據結構與演算法基礎青島大學PPT解析

    本文將從多個方面對數據結構與演算法基礎青島大學PPT進行詳細的闡述,包括數據類型、集合類型、排序演算法、字元串匹配和動態規劃等內容。通過對這些內容的解析,讀者可以更好地了解數據結構與算…

    編程 2025-04-29
  • 瘦臉演算法 Python 原理與實現

    本文將從多個方面詳細闡述瘦臉演算法 Python 實現的原理和方法,包括該演算法的意義、流程、代碼實現、優化等內容。 一、演算法意義 隨著科技的發展,瘦臉演算法已經成為了人們修圖中不可缺少…

    編程 2025-04-29
  • 神經網路BP演算法原理

    本文將從多個方面對神經網路BP演算法原理進行詳細闡述,並給出完整的代碼示例。 一、BP演算法簡介 BP演算法是一種常用的神經網路訓練演算法,其全稱為反向傳播演算法。BP演算法的基本思想是通過正…

    編程 2025-04-29
  • 粒子群演算法Python的介紹和實現

    本文將介紹粒子群演算法的原理和Python實現方法,將從以下幾個方面進行詳細闡述。 一、粒子群演算法的原理 粒子群演算法(Particle Swarm Optimization, PSO…

    編程 2025-04-29
  • Python回歸演算法算例

    本文將從以下幾個方面對Python回歸演算法算例進行詳細闡述。 一、回歸演算法簡介 回歸演算法是數據分析中的一種重要方法,主要用於預測未來或進行趨勢分析,通過對歷史數據的學習和分析,建立…

    編程 2025-04-28
  • 象棋演算法思路探析

    本文將從多方面探討象棋演算法,包括搜索演算法、啟發式演算法、博弈樹演算法、神經網路演算法等。 一、搜索演算法 搜索演算法是一種常見的求解問題的方法。在象棋中,搜索演算法可以用來尋找最佳棋步。經典的…

    編程 2025-04-28

發表回復

登錄後才能評論