mysql資料庫崩潰恢復過程,mysql資料庫崩潰恢復過程怎麼辦

本文目錄一覽：

1、怎樣修復已經損壞的SQL資料庫？
2、mysql data數據怎麼恢復
3、MySQL 常用備份工具流程解析
4、MySQL資料庫崩潰怎麼辦
5、系統崩潰後，關於MYSQL恢復資料庫的問題！求救啊！

怎樣修復已經損壞的SQL資料庫？

1.停止SQL Server的服務,備份SQL Server安裝目錄下的\data子目錄

下故障資料庫的兩個文件,一個數據文件hbposv6_branch_data.mdf,

一個hbposv6_branch_log.ldf(也有可能非此命名),同時查看磁碟

空間是否有足夠的空間；

2.啟動SQL Server服務(如已停止),創建一個新的資料庫，命名為

原來資料庫的名字。

3.停止SQL Server

4.把老資料庫的MDF文件(hbposv6_branch_data.mdf)替換

新資料庫的相應的MDF文件，

並把LDF文件(hbposv6_branch_log.ldg)刪除。

5.重新啟動SQL Server服務，然後運行如下命令：

Use Master

sp_configure ‘allow updates’, 1

reconfigure with override

begin tran

update sysdatabases set status = 32768 where name = ‘hbposv6_branch’

–Verify one row is updated before committing

commit tran

6.停止SQL然後重新啟動SQL Server服務，然後運行如下命令

(更換日誌文件路徑地址)：

use master

DBCC TRACEON(3604)

DBCC REBUILD_LOG

(‘hbposv6_branch’,

‘c:\Program Files\Microsoft SQL Server\MSSQL\Data\hbposv6_branch_log.ldf’)

–在這裡，請輸入你的資料庫的路徑

7.停止SQL然後重新啟動SQL Server服務，然後運行：

use master

update sysdatabases set status = 8 where name = ‘hbposv6_branch’

sp_configure ‘allow updates’, 0

reconfigure with override

8.運行dbcc checkdb(db_name) 檢查資料庫的完整性

9.修複數庫

–請在查詢分析器中執行下列語句.執行前斷開其它

所有資料庫連接，最好是斷開網線

–如果不是該資料庫名，請將資料庫

–hbposv6_branch

–改為要修復的資料庫

USE master

–單用戶模式

EXEC sp_dboption ‘hbposv6_branch’, ‘single user’, ‘TRUE’

–資料庫檢查

DBCC CHECKDB (‘hbposv6_branch’)

–如果返回結果出現了紅色的提示文字，說明資料庫中存在錯誤，需要修復

–資料庫修復

DBCC CHECKDB (‘hbposv6_branch’,’repair_rebuild’)

–再次資料庫檢查，如果返回結果中沒有了紅色的提示文字，

說明修復成功；

DBCC CHECKDB (‘hbposv6_branch’)

–否則意味著還需要更高級別的修復；嘗試將上面修復語句的

‘repair_rebuild’換為’repair_allow_data_loss’再試，

之後再次檢查資料庫。

–如果還有錯誤未修復，請把這些信息以文字的方式發給我們

–退出前請一定要執行以下語句返回到多用戶模式

EXEC sp_dboption ‘hbposv6_branch’, ‘single user’,’FALSE’

註：都要把 dbname 替換成真實的資料庫名字。

mysql data數據怎麼恢復

簡單情況下：進入原來mysql安裝路徑下的data文件夾下，找到相應的庫和ibdata1，進行copy，就可回復原來的數據。

複雜情況下：

從另一台機上把MySQL資料庫的mysql文件夾拷貝到本地機上，目的是恢複本地機對數據的訪問和操作。經過如下幾種情況的操作。

1. 在本地重裝MySQL（安裝目錄D:\Program Files\MySQL\MySQL Server 5.0），直接把mysql文件夾拷貝至D:\Program Files\MySQL\MySQL Server 5.0\。結果，失敗：資料庫連接錯誤。

2. 卸載後重裝MySQL，將D:\Program Files\MySQL\MySQL Server 5.0\下的數據備份，只把mysql\data文件夾全部內容拷貝到D:\Program Files\MySQL\MySQL Server 5.0\data下。結果，失敗：資料庫連接錯誤。將備份的數據還完覆蓋。結果，失敗，還是連接不上資料庫。

3. 卸載後重裝MySQL，將mysql\data文件夾里的cf1,last文件夾（這兩個是原來MySQL里的資料庫）拷貝進D:\Program Files\MySQL\MySQL Server 5.0\data。連接成功，在Navicat for MySQL里看到資料庫cf1和last，但是不能訪問，因為數據全為零。明白了原來data里以資料庫命名的文件存儲的是資料庫的表結構，不是元數據。下一步，把data文件夾里的ibdata1文件（3.4G大，明顯存儲了元數據）拷貝到D:\Program Files\MySQL\MySQL Server 5.0\data里，代替原來的ibdata1文件。重啟電腦，打開Navicat for MySQL，連接成功，數據可以訪問操作。

至此，操作終於成功。其實當初在那台機上把數據導出來，而不是現在直接把文件夾mysql複製過來會更容易恢復。但那台機已經重裝了系統，也就是說MySQL失效了。

MySQL 常用備份工具流程解析

下面我們就看一下常見的備份工具，以及目前最流行的 Percona XtraBackup 的備份流程。

MySQL 常見的備份工具主要分為三種：

這裡先說一下 binlog 備份，它只是把 binlog 又複製了一份，並且需要在邏輯備份或者物理備份的基礎上才能進行數據恢復，無法單獨進行數據恢復。

mysqldump 備份出的文件就是 sql 文件，其核心就是對每個表執行 select ，然後轉化成相應的 insert 語句。mysqldump 的備份流程大致如下：

從上面可以看出在 mysqldump 備份期間，備份到某個資料庫時，該資料庫下的表都會處於只讀狀態，無法對錶進行任何變更，直到該庫下的表備份完畢，這對於線上環境一般是無法接受的。若是指定了–master-data或者 –dump-slave 則會在備份開始時加全局讀鎖（FLUSH TABLES WITH READ LOCK），直到備份結束。當然我們可以選一個從庫進行備份，這樣就不會影響線上業務。另外使用 mysqldump 備份還有一個最大的好處，因為備份出來的是 sql 語句，所以它支持跨平台和跨版本的數據遷移或者恢復，這是物理備份無法做到的。

但是也正是因為 mysqldump 備份出來的是 sql 語句，在使用時要更加註意，否則可能會釀成大禍。例如，使用 mysqldump 常見的問題有：

所以使用 mysqldump 時一定要了解各個選項的作用，以及確認備份出來的 sql 文件里會有什麼操作，會對現有數據造成什麼影響。

Mydumper 原理與 Mysqldump 原理類似，最大的區別是引入了多線程備份，每個備份線程備份一部分表，當然並發粒度可以到行級，達到多線程備份的目的。這裡不再單獨介紹。

Percona XtraBackup 是 Percona 公司開發的一個用於 MySQL 資料庫物理熱備的備份工具，是基於 InnoDB 的崩潰恢復功能來實現的。它的基本工作原理如下：

Percona XtraBackup 在進行恢復時會應用拷貝的 redo log ，應用已提交的事務，回滾未提交的事物，將資料庫恢復到一致性狀態。因為 Percona XtraBackup 備份出來的是物理文件，所以在使用備份出的文件進行恢復或者遷移時，不會像 mysqldump 那樣會存在很多問題。

使用 XtraBackup 備份時根據備份參數設置不同，對資料庫的變更會造成不同程度的影響，具體影響會在下文分析。

通過對比發現，XtraBackup 具有對資料庫影響小，且能快速恢復的優點，在日常備份中是首選；mysqldump 使用相對更加靈活，但是使用是要注意對資料庫原有數據的影響。

備份策略主要有：全量備份和增量備份，再加上 binlog 備份。

目前去哪兒網資料庫備份主要採用 XtraBackup 全量備份 +binlog 備份。資料庫的重要級別不同，全量備份的頻率不同。備份程序主要架構如下：

說明：

Percona XtraBackup 是目前備份 MySQL 使用最廣泛的工具。在備份過程中，資料庫可以進行正常的讀寫或者其他變更操作，但是偶爾也會遇見備份引起的元數據鎖，或提交事務時發現被 binlog lock 阻塞等情況。下面我們就看一下 Percona XtraBackup 的備份流程和加鎖時機。

說明：以下對 Percona XtraBackup 的分析都是基於 2.4.23 的版本，其他版本會略有差別，但是關鍵步驟基本相同。

XtraBackup 在備份開始時，會創建一個後台線程，專門用於拷貝資料庫的 redo log 。首先 XtraBackup 會掃描每組 redo log 的頭部，找出當前的 checkpoint lsn ，然後從該 lsn 後順序拷貝所有的 redo log ，包括後續新產生的 redo log 。該線程會一直持續到將非事務表完全拷貝完成，才會安全退出。備份日誌輸出中會記錄拷貝開始時的 checkpoint lsn 。日誌輸出如下：

在拷貝ibd文件之前，會先掃描資料庫的數據文件目錄，獲取ibdata1，undo tablespaces及所有的ibd文件列表，並會記錄相應的 space id，因為在恢復時需要這些 space id來找到對應 doublewrite buffer里頁面的內容，以及對應的redo log條目。然後開始循環拷貝ibdata1，undo tablespaces及所有的ibd文件。

這裡可通過設置–parallel進行多線程備份，提高物理文件的拷貝效率。不設置則默認為1。

在所有ibd文件拷貝完成後，XtraBackup開始備份非ibd文件。這一部分的邏輯比較複雜，因為備份非ibd文件前需要加鎖，具體是否會加鎖主要受到–no-lock 參數設置的影響。

若是設置了–no-lock為TRUE，則不會使用”FLUSH TABLES WITH READ LOCK”去加全局讀鎖，但是若備份過程中對non-InnoDB表執行了DDL或者DML操作，這會導致備份的不一致，恢復出來的數據就會有問題。所以是不建議將–no-lock為TRUE，默認值是FALSE，也就是在不指定該選項的情況下會在備份非ibd文件前加全局讀鎖。

下面我們結合源碼來看看判斷是否加全局鎖這部分的具體流程邏輯：

流程圖如下：

總結來看：

1）若–no-lock為FALSE（默認值），則先施加全局讀鎖，然後再進行拷貝文件，另外若 –safe-slave-backup 設置為TRUE ，則會在加全局鎖之前關閉SQL_THREAD線程；

2）若–no-lock為TRUE，則不會施加鎖，直接進行拷貝文件。

加鎖的邏輯主要由lock_tables_maybe實現,先看一下lock_tables_maybe源代碼，如下：

lock_tables_maybe 函數簡化處理流程如下：

1）若備份實例上已經加鎖（ LOCK TABLES FOR BACKUP / FLUSH TABLES WITH READ LOCK）或者設置lock-ddl-per-table 則直接返回；

2）若支持備份鎖，則執行LOCK TABLES FOR BACKUP；

3）若不支持備份鎖，則執行 FLUSH TABLES WITH READ LOCK。根據相應選項設置，在執行該操作前會判斷是否有執行中的DDL/DML，以及等待超時時間，是否kill 對應的未結束的事務等。

從上文中我們還看到一個參數–safe-slave-backup ，該參數的主要作用是：

若是在從庫執行的備份操作時設置了該參數，可以防止因從庫同步主庫操作，而導致XtraBackup長時間請求不到鎖而造成備份失敗。

若是設置了 –safe-slave-backup 為TRUE，那麼會執行”STOP SLAVE SQL_THREAD”，並等待Slave_open_temp_tables 為零才開始拷貝非 ibd 文件，Slave_open_temp_tables 為零說明SQL thread執行的事務都已經完成，這樣就能保證備份的一致性。並且此時也不會有在執行的事務阻塞 XtraBackup 施加全局鎖。

備份完非 ibd 文件後，將會備份 slave 和 binlog 信息。

mysql-bin.000004 2004 6b7bda9f-15f0-11ec-ba14-fa163ea367a4:1-83,9841546e-15f0-11ec-9557-fa163e736db4:1

需要注意，在支持備份鎖的實例上備份，指定了 –slave-info 或–binlog-info 均會先施加 binlog 備份鎖（ LOCK BINLOG FOR BACKUP），這會阻塞任何會更改 binlog 位點的操作。

備份完資料庫的所有文件和binlog等相關信息，備份工作就基本完成了，之後主要執行的操作如下：

1）執行”FLUSH NO_WRITE_TO_BINLOG ENGINE LOGS”,將所有的redo log刷盤；

2）停止redo log複製線程；

3）釋放全局讀鎖（備份鎖），binlog鎖；

4）開啟SQL_THREAD；

5）拷貝ib_buffer_pool和ib_lru_dump文件；

6）生成配置文件backup-my.cnf；

7）列印備份信息到xtrabackup_info文件，這些信息主要包含備份時使用的參數信息，備份起止時間，binlog位點信息，以及將會回到的lsn點。

下面是xtrabackup_info記錄的部分內容：

加鎖對應的函數是 mdl_lock_tables ，釋放鎖對應的函數是 mdl_unlock_all，主要是執行COMMIT，結束 mdl_lock_tables 中開啟的顯式事務，來釋放MDL鎖。mdl_lock_tables 流程如下：

上面參數–lock-ddl和–lock-ddl-per-table是在 Percona XtraBackup 2.4.8 之後添加的，因為 MySQL 5.7 新增了一個叫做 Sorted Index Builds 的功能，這會導致某些 DDL 操作不記錄重做日誌而導致備份失敗。使用–lock-ddl或–lock-ddl-per-table 就會在備份開始時施加鎖，阻止 DDL 操作。

另外，若備份時指定了–lock-ddl或–lock-ddl-per-table，則在備份非 ibd 文件時就不是再有加鎖操作。

注意：LOCK TABLES FOR BACKUP和LOCK BINLOG FOR BACKUP 語句只有在支持備份鎖的實例上才會執行，Percona Server for MySQL已經在 5.6.16-64.0 版本開始支持這種更加輕量的備份鎖。

Q1: 使用 XtraBackup 備份的文件進行恢復時，恢復到哪個時間點？ A1：恢復到執行 LOCK BINLOG FOR BACKUP 或 FLUSH TABLES WITH READ LOCK 的時間點，因為這時任何改變 binlog 位點的操作都會被阻塞，redo log和binlog 是一致的。

Q2: 在開啟 binlog 的情況下，MySQL 的奔潰恢復是同時依賴 binlog 和 redo log 這兩種日誌的，為什麼XtraBackup 不用備份binlog？

A2：因為在備份中有執行LOCK BINLOG FOR BACKUP/FLUSH TABLES WITH READ LOCK，阻止了任何改變binlog位點的操作，這樣只需要根據redo log將有commit log 的事務提交，沒有commit log的事務進行回滾即可。

Q3: 使用Percona XtraBackup備份完成後redo的位點是和binlog是一樣還是比binlog多一些？

A3：通過分析備份流程可以發現備份 binlog 位點信息（加binlog鎖）是發生在停止 redo 拷貝線程前，而釋放鎖是在停止 redo 拷貝線之後，所以 redo log 會多一些。鎖住了 binlog 保證了在該 binlog 位點前已經提交的事務的 redo log 都有 commit log 的信息，未提交的事物也就沒有對應的 commit log 的信息，即便在鎖住 binlog 後有 Innodb 表新的 DML 產生的 redo log ，但是事務無法提交，也就沒有 commit log 的信息的，最後在回放的過程中對沒有 commit log 的事務進行回滾就可以了。

Q4：Percona XtraBackup什麼時候會加鎖，以及影響加鎖時間長度的因素有哪些？

A4：上面進行了分析，加鎖操作只在備份非 ibd 文件時執行，加鎖時長主要和非事務表的數量和大小有關，非事務表的數量越多，體積越大，拷貝文件所用的時間越長，那麼加鎖時間也就越長。也會和 redo log 生成的速度有關，只是 redo log 刷盤受到多個因素的影響，未及時刷盤的 redo log 一般很小。

Q5：Percona XtraBackup 和mysqldump選擇哪個更好？

A5：通過上面的的解析，若是整個實例備份，首先選擇 Percona XtraBackup ，因為對資料庫的影響最小。若只是備份某個庫表，這個就要視數據量而定，若數據量不大可以使用 mysqldump 。注意，對資料庫做備份時最好選擇業務連接最少的從庫，因為備份也會消耗一定的資源，避免影響業務。

MySQL資料庫崩潰怎麼辦

MySQL 隨著版本不停迭代，崩潰的現象越來越少，也越來越隱蔽。

一旦遇到生產環境上的 MySQL 崩潰，就需要保留現場信息，供分析用。雖然 MySQL 的 error log 中會列印部分信息，但對於比較隱蔽的崩潰，往往顯得力不從心。

通過開啟操作系統級別、放開用戶限制、啟用 MySQL 參數三個步驟，我們啟用了 MySQL 的 coredump 功能，使得 MySQL 崩潰時留下了足夠的線索。

對於複雜崩潰的分析，還是需要將 coredump 交給專業的研發工程師手裡，或者提交給 MySQL 開發團隊。

不過不管是什麼場景，能提供一份 coredump，所有技術人員都會感謝你的。

系統崩潰後，關於MYSQL恢復資料庫的問題！求救啊！

MySQL 在崩潰恢復時，會遍歷打開所有 ibd 文件的 header page 驗證數據字典的準確性，如果 MySQL 中包含了大量表，這個校驗過程就會比較耗時。 MySQL 下崩潰恢復確實和表數量有關，表總數越大，崩潰恢復時間越長。另外磁碟 IOPS 也會影響崩潰恢復時間，像這裡開發庫的 HDD IOPS 較低，因此面對大量的表空間，校驗速度就非常緩慢。另外一個發現，MySQL 8 下正常啟用時居然也會進行表空間校驗，而故障恢復時則會額外再進行一次表空間校驗，等於校驗了 2 遍。不過 MySQL 8.0 里多了一個特性，即表數量超過 5W 時，會啟用多線程掃描，加快表空間校驗過程。

如何跳過校驗MySQL 5.7 下有方法可以跳過崩潰恢復時的表空間校驗過程嘛？查閱了資料，方法主要有兩種：

1. 配置 innodb_force_recovery可以使 srv_force_recovery != 0 ，那麼 validate = false，即可以跳過表空間校驗。實際測試的時候設置 innodb_force_recovery =1，也就是強制恢復跳過壞頁，就可以跳過校驗，然後重啟就是正常啟動了。通過這種臨時方式可以避免崩潰恢復後非常耗時的表空間校驗過程，快速啟動 MySQL，個人目前暫時未發現有什麼隱患。2. 使用共享表空間替代獨立表空間這樣就不需要打開 N 個 ibd 文件了，只需要打開一個 ibdata 文件即可，大大節省了校驗時間。自從聽了姜老師講過使用共享表空間替代獨立表空間解決 drop 大表時性能抖動的原理後，感覺共享表空間在很多業務環境下，反而更有優勢。

臨時冒出另外一種解決想法，即用 GDB 調試崩潰恢復，通過臨時修改 validate 變數值讓 MySQL 跳過表空間驗證過程，然後讓 MySQL 正常關閉，重新啟動就可以正常啟動了。但是實際測試發現，如果以 debug 模式運行，確實可以臨時修改 validate 變數，跳過表空間驗證過程，但是 debug 模式下代碼運行效率大打折扣，反而耗時更長。而以非 debug 模式運行，則無法修改 validate 變數，想法破滅。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/220017.html