本文討論 MySQL 的備份和恢復(fù)機(jī)制,以及如何維護(hù)數(shù)據(jù)表,包括最主要的兩種表類型:MyISAM
和 Innodb
,文中設(shè)計(jì)的 MySQL 版本為 5.0.22。
目前 MySQL 支持的免費(fèi)備份工具有:mysqldump、mysqlhotcopy
,還可以用 SQL 語法進(jìn)行備份:BACKUP TABLE
或者 SELECT INTO OUTFILE
,又或者備份二進(jìn)制日志(binlog)
,還可以是直接拷貝數(shù)據(jù)文件和相關(guān)的配置文件
。MyISAM 表是保存成文件的形式,因此相對(duì)比較容易備份,上面提到的幾種方法都可以使用。Innodb
所有的表都保存在同一個(gè)數(shù)據(jù)文件 ibdata1
中(也可能是多個(gè)文件,或者是獨(dú)立的表空間文件),相對(duì)來說比較不好備份,免費(fèi)的方案可以是拷貝數(shù)據(jù)文件
、備份 binlog
,或者用 mysqldump
。
1、mysqldump
1.1 備份
mysqldump
是采用SQL級(jí)別的備份機(jī)制,它將數(shù)據(jù)表導(dǎo)成 SQL 腳本文件,在不同的 MySQL 版本之間升級(jí)時(shí)相對(duì)比較合適,這也是最常用的備份方法。
現(xiàn)在來講一下 mysqldump
的一些主要參數(shù):
- --compatible=name
它告訴 mysqldump,導(dǎo)出的數(shù)據(jù)將和哪種數(shù)據(jù)庫或哪個(gè)舊版本的 MySQL 服務(wù)器相兼容。值可以為 ansi、mysql323、mysql40、postgresql、oracle、mssql、db2、maxdb、no_key_options、no_tables_options、no_field_options
等,要使用幾個(gè)值,用逗號(hào)將它們隔開。當(dāng)然了,它并不保證能完全兼容,而是盡量兼容。
- --complete-insert,-c
導(dǎo)出的數(shù)據(jù)采用包含字段名的完整 INSERT
方式,也就是把所有的值都寫在一行。這么做能提高插入效率,但是可能會(huì)受到 max_allowed_packet
參數(shù)的影響而導(dǎo)致插入失敗。因此,需要謹(jǐn)慎使用該參數(shù),至少我不推薦。
- --default-character-set=charset
指定導(dǎo)出數(shù)據(jù)時(shí)采用何種字符集,如果數(shù)據(jù)表不是采用默認(rèn)的 latin1
字符集的話,那么導(dǎo)出時(shí)必須指定該選項(xiàng),否則再次導(dǎo)入數(shù)據(jù)后將產(chǎn)生亂碼問題。
- --disable-keys
告訴 mysqldump
在 INSERT
語句的開頭和結(jié)尾增加 /*!40000 ALTER TABLE table DISABLE KEYS */;
和 /*!40000 ALTER TABLE table ENABLE KEYS */;
語句,這能大大提高插入語句的速度,因?yàn)樗窃诓迦胪晁袛?shù)據(jù)后才重建索引的。該選項(xiàng)只適合 MyISAM
表。
- --extended-insert = true|false
默認(rèn)情況下,mysqldump
開啟 --complete-insert
模式,因此不想用它的的話,就使用本選項(xiàng),設(shè)定它的值為 false
即可。
- --hex-blob
使用十六進(jìn)制格式導(dǎo)出二進(jìn)制字符串字段。如果有二進(jìn)制數(shù)據(jù)就必須使用本選項(xiàng)。影響到的字段類型有 BINARY、VARBINARY、BLOB
。
- --lock-all-tables,-x
在開始導(dǎo)出之前,提交請(qǐng)求鎖定所有數(shù)據(jù)庫中的所有表,以保證數(shù)據(jù)的一致性。這是一個(gè)全局讀鎖,并且自動(dòng)關(guān)閉 --single-transaction
和 --lock-tables
選項(xiàng)。
- --lock-tables
它和 --lock-all-tables
類似,不過是鎖定當(dāng)前導(dǎo)出的數(shù)據(jù)表,而不是一下子鎖定全部庫下的表。本選項(xiàng)只適用于 MyISAM
表,如果是 Innodb
表可以用 --single-transaction
選項(xiàng)。
- --no-create-info,-t
只導(dǎo)出數(shù)據(jù),而不添加 CREATE TABLE
語句。
- --no-data,-d
不導(dǎo)出任何數(shù)據(jù),只導(dǎo)出數(shù)據(jù)庫表結(jié)構(gòu)。
- --opt
這只是一個(gè)快捷選項(xiàng),等同于同時(shí)添加 --add-drop-tables --add-locking --create-option --disable-keys --extended-insert --lock-tables --quick --set-charset
選項(xiàng)。本選項(xiàng)能讓 mysqldump
很快的導(dǎo)出數(shù)據(jù),并且導(dǎo)出的數(shù)據(jù)能很快導(dǎo)回。該選項(xiàng)默認(rèn)開啟,但可以用 --skip-opt
禁用。注意,如果運(yùn)行 mysqldump
沒有指定 --quick
或 --opt
選項(xiàng),則會(huì)將整個(gè)結(jié)果集放在內(nèi)存中。如果導(dǎo)出大數(shù)據(jù)庫的話可能會(huì)出現(xiàn)問題。
- --quick,-q
該選項(xiàng)在導(dǎo)出大表時(shí)很有用,它強(qiáng)制 mysqldump
從服務(wù)器查詢?nèi)〉糜涗浿苯虞敵龆皇侨〉盟杏涗浐髮⑺鼈兙彺娴絻?nèi)存中。
- --routines,-R
導(dǎo)出存儲(chǔ)過程以及自定義函數(shù)。
- --single-transaction
該選項(xiàng)在導(dǎo)出數(shù)據(jù)之前提交一個(gè) BEGIN
SQL語句,BEGIN
不會(huì)阻塞任何應(yīng)用程序且能保證導(dǎo)出時(shí)數(shù)據(jù)庫的一致性狀態(tài)。它只適用于事務(wù)表,例如 InnoDB
和 BDB
。
本選項(xiàng)和 --lock-tables
選項(xiàng)是互斥的,因?yàn)?LOCK TABLES
會(huì)使任何掛起的事務(wù)隱含提交。
要想導(dǎo)出大表的話,應(yīng)結(jié)合使用 --quick
選項(xiàng)。
- --triggers
同時(shí)導(dǎo)出觸發(fā)器。該選項(xiàng)默認(rèn)啟用,用 --skip-triggers
禁用它。
其他參數(shù)詳情請(qǐng)參考手冊(cè),我通常使用以下 SQL 來備份 MyISAM
表:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr \
--default-character-set=utf8 --opt --extended-insert=false \
--triggers -R --hex-blob -x db_name > db_name.sql
使用以下 SQL 來備份 Innodb
表:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr \
--default-character-set=utf8 --opt --extended-insert=false \
--triggers -R --hex-blob --single-transaction db_name > db_name.sql
另外,如果想要實(shí)現(xiàn)在線備份,還可以使用 --master-data
參數(shù)來實(shí)現(xiàn),如下:
/usr/local/mysql/bin/mysqldump -uyejr -pyejr \
--default-character-set=utf8 --opt --master-data=1 \
--single-transaction --flush-logs db_name > db_name.sql
它只是在一開始的瞬間請(qǐng)求鎖表,然后就刷新binlog了,而后在導(dǎo)出的文件中加入CHANGE MASTER
語句來指定當(dāng)前備份的binlog位置,如果要把這個(gè)文件恢復(fù)到slave里去,就可以采用這種方法來做。
1.2 還原
用 mysqldump
備份出來的文件是一個(gè)可以直接倒入的 SQL 腳本,有兩種方法可以將數(shù)據(jù)導(dǎo)入。
- 直接用
mysql
客戶端
例如:
/usr/local/mysql/bin/mysql -uyejr -pyejr db_name < db_name.sql
- 用 SOURCE 語法
其實(shí)這不是標(biāo)準(zhǔn)的 SQL 語法,而是 mysql
客戶端提供的功能,例如:
SOURCE /tmp/db_name.sql;
這里需要指定文件的絕對(duì)路徑,并且必須是 mysqld
運(yùn)行用戶(例如 nobody)有權(quán)限讀取的文件。
2、 mysqlhotcopy
2.1 備份
mysqlhotcopy
是一個(gè) PERL 程序,最初由Tim Bunce編寫。它使用 LOCK TABLES、FLUSH TABLES
和 cp
或 scp
來快速備份數(shù)據(jù)庫。它是備份數(shù)據(jù)庫或單個(gè)表的最快的途徑,但它只能運(yùn)行在數(shù)據(jù)庫文件(包括數(shù)據(jù)表定義文件、數(shù)據(jù)文件、索引文件)所在的機(jī)器上。mysqlhotcopy
只能用于備份 MyISAM
,并且只能運(yùn)行在 類Unix
和 NetWare
系統(tǒng)上。
mysqlhotcopy
支持一次性拷貝多個(gè)數(shù)據(jù)庫,同時(shí)還支持正則表達(dá)。以下是幾個(gè)例子:
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr \
db_name /tmp (把數(shù)據(jù)庫目錄 db_name 拷貝到 /tmp 下)
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr \
db_name_1 ... db_name_n /tmp
root#/usr/local/mysql/bin/mysqlhotcopy -h=localhost -u=yejr -p=yejr \
db_name./regex/ /tmp
更詳細(xì)的使用方法請(qǐng)查看手冊(cè),或者調(diào)用下面的命令來查看 mysqlhotcopy
的幫助:
perldoc /usr/local/mysql/bin/mysqlhotcopy
注意,想要使用 mysqlhotcopy
,必須要有 SELECT、RELOAD(要執(zhí)行 FLUSH TABLES)
權(quán)限,并且還必須要能夠有讀取 datadir/db_name 目錄的權(quán)限。
2.2 還原
mysqlhotcopy
備份出來的是整個(gè)數(shù)據(jù)庫目錄,使用時(shí)可以直接拷貝到 mysqld
指定的 datadir (在這里是 /usr/local/mysql/data/)目錄下即可,同時(shí)要注意權(quán)限的問題,如下例:
root#cp -rf db_name /usr/local/mysql/data/
root#chown -R nobody:nobody /usr/local/mysql/data/ (將 db_name 目錄的屬主改成 mysqld
運(yùn)行用戶)
3、 SQL 語法備份
3.1 備份
BACKUP TABLE
語法其實(shí)和 mysqlhotcopy
的工作原理差不多,都是鎖表,然后拷貝數(shù)據(jù)文件。它能實(shí)現(xiàn)在線備份,但是效果不理想,因此不推薦使用。它只拷貝表結(jié)構(gòu)文件和數(shù)據(jù)文件,不同時(shí)拷貝索引文件,因此恢復(fù)時(shí)比較慢。
例子:
BACK TABLE tbl_name TO '/tmp/db_name/';
注意,必須要有 FILE
權(quán)限才能執(zhí)行本SQL,并且目錄 /tmp/db_name/ 必須能被 mysqld
用戶可寫,導(dǎo)出的文件不能覆蓋已經(jīng)存在的文件,以避免安全問題。
SELECT INTO OUTFILE
則是把數(shù)據(jù)導(dǎo)出來成為普通的文本文件,可以自定義字段間隔的方式,方便處理這些數(shù)據(jù)。
例子:
SELECT * INTO OUTFILE '/tmp/db_name/tbl_name.txt' FROM tbl_name;
注意,必須要有 FILE
權(quán)限才能執(zhí)行本SQL,并且文件 /tmp/db_name/tbl_name.txt 必須能被 mysqld
用戶可寫,導(dǎo)出的文件不能覆蓋已經(jīng)存在的文件,以避免安全問題。
3.2 恢復(fù)
用 BACKUP TABLE
方法備份出來的文件,可以運(yùn)行 RESTORE TABLE
語句來恢復(fù)數(shù)據(jù)表。
例子:
RESTORE TABLE FROM '/tmp/db_name/';
權(quán)限要求類似上面所述。
用 SELECT INTO OUTFILE
方法備份出來的文件,可以運(yùn)行 LOAD DATA INFILE
語句來恢復(fù)數(shù)據(jù)表。
例子:
LOAD DATA INFILE '/tmp/db_name/tbl_name.txt' INTO TABLE tbl_name;
權(quán)限要求類似上面所述。倒入數(shù)據(jù)之前,數(shù)據(jù)表要已經(jīng)存在才行。如果擔(dān)心數(shù)據(jù)會(huì)發(fā)生重復(fù),可以增加 REPLACE
關(guān)鍵字來替換已有記錄或者用 IGNORE
關(guān)鍵字來忽略他們。
4、 啟用二進(jìn)制日志(binlog)
采用 binlog
的方法相對(duì)來說更靈活,省心省力,而且還可以支持增量備份。
啟用 binlog
時(shí)必須要重啟 mysqld
。首先,關(guān)閉 mysqld
,打開 my.cnf
,加入以下幾行:
server-id = 1
log-bin = binlog
log-bin-index = binlog.index
然后啟動(dòng) mysqld
就可以了。運(yùn)行過程中會(huì)產(chǎn)生 binlog.000001
以及 binlog.index
,前面的文件是 mysqld
記錄所有對(duì)數(shù)據(jù)的更新操作,后面的文件則是所有 binlog
的索引,都不能輕易刪除。關(guān)于 binlog
的信息請(qǐng)查看手冊(cè)。
需要備份時(shí),可以先執(zhí)行一下 SQL 語句,讓 mysqld
終止對(duì)當(dāng)前 binlog
的寫入,就可以把文件直接備份,這樣的話就能達(dá)到增量備份的目的了:
FLUSH LOGS;
如果是備份復(fù)制系統(tǒng)中的從服務(wù)器,還應(yīng)該備份 master.info 和 relay-log.info 文件。
備份出來的 binlog
文件可以用 MySQL 提供的工具 mysqlbinlog
來查看,如:
/usr/local/mysql/bin/mysqlbinlog /tmp/binlog.000001
該工具允許你顯示指定的數(shù)據(jù)庫下的所有 SQL 語句,并且還可以限定時(shí)間范圍,相當(dāng)?shù)姆奖?,詳?xì)的請(qǐng)查看手冊(cè)。
恢復(fù)時(shí),可以采用類似以下語句來做到:
/usr/local/mysql/bin/mysqlbinlog /tmp/binlog.000001 | mysql -uyejr -pyejr db_name
把 mysqlbinlog
輸出的 SQL 語句直接作為輸入來執(zhí)行它。
如果你有空閑的機(jī)器,不妨采用這種方式來備份。由于作為 slave
的機(jī)器性能要求相對(duì)不是那么高,因此成本低,用低成本就能實(shí)現(xiàn)增量備份而且還能分擔(dān)一部分?jǐn)?shù)據(jù)查詢壓力,何樂而不為呢?
5、 直接備份數(shù)據(jù)文件
相較前幾種方法,備份數(shù)據(jù)文件最為直接、快速、方便,缺點(diǎn)是基本上不能實(shí)現(xiàn)增量備份。為了保證數(shù)據(jù)的一致性,需要在靠背文件前,執(zhí)行以下 SQL 語句:
FLUSH TABLES WITH READ LOCK;
也就是把內(nèi)存中的數(shù)據(jù)都刷新到磁盤中,同時(shí)鎖定數(shù)據(jù)表,以保證拷貝過程中不會(huì)有新的數(shù)據(jù)寫入。這種方法備份出來的數(shù)據(jù)恢復(fù)也很簡(jiǎn)單,直接拷貝回原來的數(shù)據(jù)庫目錄下即可。
注意,對(duì)于 Innodb
類型表來說,還需要備份其日志文件,即 ib_logfile*
文件。因?yàn)楫?dāng) Innodb
表損壞時(shí),就可以依靠這些日志文件來恢復(fù)。
6、 備份策略
對(duì)于中等級(jí)別業(yè)務(wù)量的系統(tǒng)來說,備份策略可以這么定:第一次全量備份,每天一次增量備份,每周再做一次全量備份,如此一直重復(fù)。而對(duì)于重要的且繁忙的系統(tǒng)來說,則可能需要每天一次全量備份,每小時(shí)一次增量備份,甚至更頻繁。為了不影響線上業(yè)務(wù),實(shí)現(xiàn)在線備份,并且能增量備份,最好的辦法就是采用主從復(fù)制機(jī)制(replication
),在 slave
機(jī)器上做備份。
7、 數(shù)據(jù)維護(hù)和災(zāi)難恢復(fù)
作為一名DBA(我目前還不是,呵呵),最重要的工作內(nèi)容之一是保證數(shù)據(jù)表能安全、穩(wěn)定、高速使用。因此,需要定期維護(hù)你的數(shù)據(jù)表。以下 SQL 語句就很有用:
CHECK TABLE 或 REPAIR TABLE,檢查或維護(hù) MyISAM 表
OPTIMIZE TABLE,優(yōu)化 MyISAM 表
ANALYZE TABLE,分析 MyISAM 表
當(dāng)然了,上面這些命令起始都可以通過工具 myisamchk
來完成,在這里不作詳述。
Innodb
表則可以通過執(zhí)行以下語句來整理碎片,提高索引速度:
ALTER TABLE tbl_name ENGINE = Innodb;
這其實(shí)是一個(gè) NULL
操作,表面上看什么也不做,實(shí)際上重新整理碎片了。
通常使用的 MyISAM
表可以用上面提到的恢復(fù)方法來完成。如果是索引壞了,可以用 myisamchk
工具來重建索引。而對(duì)于 Innodb
表來說,就沒這么直接了,因?yàn)樗阉械谋矶急4嬖谝粋€(gè)表空間了。不過 Innodb
有一個(gè)檢查機(jī)制叫 模糊檢查點(diǎn)
,只要保存了日志文件,就能根據(jù)日志文件來修復(fù)錯(cuò)誤??梢栽?my.cnf 文件中,增加以下參數(shù),讓 mysqld
在啟動(dòng)時(shí)自動(dòng)檢查日志文件:
innodb_force_recovery = 4
關(guān)于該參數(shù)的信息請(qǐng)查看手冊(cè)。
8、 總結(jié)
做好數(shù)據(jù)備份,定只好合適的備份策略,這是一個(gè)DBA所做事情的一小部分,萬事開頭難,就從現(xiàn)在開始吧!