next數組詳解

一、next數組的定義

next數組是KMP算法中的一個重要概念，用於優化字符串匹配的過程。它是一個數組，長度與模式串的長度相等。next數組的每個值表示模式串中，在當前位置之前（不包括當前位置）的子串中，相同前綴和後綴的最大長度。

void getNext(const char* p, int pLen, int* next) {
    next[0] = -1;
    int k = -1;
    for (int i = 1; i = 0 && p[k + 1] != p[i]) {
            k = next[k];
        }
        if (p[k + 1] == p[i]) {
            k++;
        }
        next[i] = k;
    }
}

上述代碼是next數組的求解算法，其中p是模式串，pLen是模式串的長度，next是next數組。運行時間為O(pLen)。初始時，next[0]為-1，表示模式串的第一個字符沒有前綴和後綴。

二、next數組的作用

next數組是KMP算法中的核心，它的作用是優化字符串匹配的過程。在匹配時，當模式串和文本串的某個字符不匹配時，KMP算法利用next數組的信息，儘可能多地跳過文本串中已經匹配的部分，從而提高匹配效率。具體來說，當模式串和文本串的某個字符不匹配時，根據next數組的值，可以跳過模式串中已經匹配的前綴和文本串中未匹配的字符。

三、next數組的應用

next數組的應用遠不止於字符串匹配，在實際開發中還可以用於其他領域，比如網絡傳輸、圖像識別等。

1. 網絡傳輸

在網絡傳輸中，數據包的傳輸有可能會出現丟包、重傳等問題，導致傳輸效率降低。為了解決這個問題，可以採用流量控制技術，其中next數組就是其中一種重要的技術手段。在流量控制中，發送端將發送的數據分為若干個包，每個包都會附帶一個next值，表示下一個包的序號。接收端在接收到一個包後，會根據next數組的值來判斷下一個包是否已經接收到了，從而提高數據傳輸的效率。

2. 圖像識別

在圖像識別中，常常需要對圖像進行像素匹配，以找出與目標圖像相同的部分。為了加快匹配的速度，可以利用next數組的信息，將匹配過程變為O(n)的複雜度。具體來說，可以將圖像中每個像素的RGB值拼成一個字符串，然後對目標圖像的字符串建立next數組，依次與圖像中的每個字符串進行匹配。

四、next數組的優化

next數組的求解算法有多種，其中比較常見的有兩種：簡單求解法和優化求解法。簡單求解法的時間複雜度為O(pLen^2)，而優化求解法的時間複雜度為O(pLen)。

1. 簡單求解法

void getNext(const char* p, int pLen, int* next) {
    for (int i = 0; i < pLen; i++) {
        next[i] = 0;
        for (int j = 0; j <= i; j++) {
            if (strncmp(p, p + j, i - j + 1) == 0) {
                next[i] = std::max(next[i], i - j + 1);
            }
        }
    }
}

簡單求解法的思路比較直觀，在每個位置上暴力地比較所有可能的前綴和後綴，找出相同前綴和後綴的最大長度。由於需要比較兩個子串，因此時間複雜度為O(pLen^2)。

2. 優化求解法

void getNext(const char* p, int pLen, int* next) {
    next[0] = -1;
    int k = -1;
    for (int i = 1; i = 0 && p[k + 1] != p[i]) {
            k = next[k];
        }
        if (p[k + 1] == p[i]) {
            k++;
        }
        next[i] = k;
    }
}

優化求解法的主要思路是利用next數組的連續性，從而在求解每個位置的next值時不需要重新比較前綴和後綴。具體來說，算法維護一個指針k，表示模式串中已經匹配的前綴和後綴的最大長度。在算法的運行過程中，每當遇到一個不匹配的字符，就通過k指針來跳過已經匹配的部分，找到下一個可能匹配的位置。

五、next數組的使用示例

#include <iostream>
#include <cstring>

void getNext(const char* p, int pLen, int* next) {
    next[0] = -1;
    int k = -1;
    for (int i = 1; i < pLen; i++) {
        while (k >= 0 && p[k + 1] != p[i]) {
            k = next[k];
        }
        if (p[k + 1] == p[i]) {
            k++;
        }
        next[i] = k;
    }
}

bool kmp(const char* s, int sLen, const char* p, int pLen) {
    int next[pLen];
    getNext(p, pLen, next);
    int k = -1;
    for (int i = 0; i < sLen; i++) {
        while (k >= 0 && p[k + 1] != s[i]) {
            k = next[k];
        }
        if (p[k + 1] == s[i]) {
            k++;
        }
        if (k == pLen - 1) {
            return true;
        }
    }
    return false;
}

int main() {
    const char* s = "abababacb";
    const char* p = "abc";
    bool result = kmp(s, std::strlen(s), p, std::strlen(p));
    std::cout << std::boolalpha << result << std::endl;
    return 0;
}

上述代碼是KMP算法在字符串匹配中的應用示例。在本例中，我們定義了一個kmp函數，用於判斷文本串s中是否包含模式串p。該函數內部調用了getNext函數，用於求解模式串p的next數組。再從文本串s的第一個字符開始依次掃描，當掃描到字符不匹配時，根據next數組的值進行跳躍。

原創文章，作者：RTQVP，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/333113.html