数据丢失是每一个数据库管理员和开发者都不愿面对的噩梦。然而,意外总是难免,当不小心删除了重要的数据,如何才能迅速而有效地进行恢复呢?在数据库中有二进制日志 (Binlog),它不仅记录了所有更改数据的事件,还可以帮助将数据库恢复到任何一个特定的时间点。本篇文章将带您深入了解如何利用 Binlog 来应对数据丢失问题,在面对数据误删时不再慌张。
Binlog (二进制日志)的介绍在这里就不过多描述了,不了解 Binlog 的同学,可以前往GreatSQL用户手册中 GreatSQL 日志章节查看:(https://greatsql.cn/docs/8.0.32-26/2-about-greatsql/4-3-greatsql-binary-log.html)
为了利用 Binlog (二进制日志) 进行数据恢复,首先需要确保 Binlog 已经在 GreatSQL 数据库中启用并正确配置。以下是详细的配置步骤、状态检查方法及 Binlog 文件的存储位置和命名规则。
找到并编辑 GreatSQL 配置文件my.cnf
。该文件的路径因系统和安装方式不同而有所不同,常见路径包括 /etc/my.cnf
、/etc/MySQL/my.cnf
。
添加或修改以下配置项:
[mysqld]
log-bin=binlog
binlog-format=ROW
server-id=103306
log-bin
:指定启用 Binlog,并设置 Binlog 文件的基本名称。这里使用 binlog
作为前缀。
binlog-format
:设置 Binlog 的记录格式。推荐使用 ROW
格式,因为它记录的是行级别的变更,更详细和准确。
server-id
:为服务器设置唯一的 ID,必须设置该选项才能启用 Binlog。对于单个服务器,任何正整数都可以。对于主从复制环境,确保每个服务器的 server-id
唯一。
但关于 Binlog 的配置还不止这些,在 GreatSQL 推荐 my.cnf 模板(https://greatsql.cn/docs/8.0.32-26/3-quick-start/3-4-quick-start-with-cnf.html)中还有以下几个关于 Binlog 的配置
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
sync_binlog = 1
配置 GreatSQL 每次提交事务后都将 binlog 同步到磁盘。确保在系统崩溃时不会丢失已提交的事务,但可能会略微影响性能。同时配合innodb_flush_log_at_trx_commit=1
即所说的双1,这是最安全的设置。
binlog_cache_size = 4M
设置 Binlog 缓存大小为 4MB。当事务中的 SQL 语句较多时,事务的所有更改会被暂时保存在 Binlog 缓存中,然后一次性写入 Binlog 文件。
max_binlog_cache_size = 2G
设置 Binlog 缓存的最大大小为 2GB。这限制了单个事务可以使用的 Binlog 缓存大小,防止过大的事务占用过多内存。
max_binlog_size = 1G
设置单个 Binlog 文件的最大大小为 1GB。当 Binlog 文件达到此大小时,GreatSQL 会自动创建一个新的 Binlog 文件。这有助于管理和分割日志文件,使其更易于处理和备份。
binlog_space_limit = 500G
设置 Binlog 文件的总存储空间限制为 500GB。如果 Binlog 文件的总大小超过此限制,GreatSQL 会自动删除最旧的 Binlog 文件。这可以防止 Binlog 文件占用过多磁盘空间。
binlog_rows_query_log_events = 1
启用 Binlog 中的行查询日志事件。这将记录生成的行更改时的原始 SQL 语句,有助于调试和审计。
binlog_expire_logs_seconds = 604800
设置 Binlog 文件的过期时间为 604800 秒(7 天)。超过此时间的 Binlog 文件将自动删除。这有助于管理存储空间并限制 Binlog 文件的数量。
binlog_checksum = CEC32
控制二进制日志 (binlog) 文件的校验和机制。启用 CRC32 校验和,以确保 Binlog 文件的数据完整性和正确性
配置完成后需要重启 GreatSQL 服务,使配置生效
$ systemctl restart greatsql
配置完 Binlog 并重启 GreatSQL 服务后,可以通过以下方法检查 Binlog 是否已正确启用
登录 GreatSQL 并执行以下命令
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
如果返回结果为 ON
,表示 binlog 已启用。
greatsql> SHOW VARIABLES LIKE 'binlog_format';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| binlog_format | ROW |
+---------------+-------+
1 row in set (0.01 sec)
确保 Binlog 格式为 ROW
greatsql> SHOW BINARY LOGS;
+---------------+-----------+-----------+
| Log_name | File_size | Encrypted |
+---------------+-----------+-----------+
| binlog.000037 | 2347 | No |
| binlog.000038 | 220 | No |
| binlog.000039 | 703 | No |
| binlog.000040 | 428473707 | No |
+---------------+-----------+-----------+
4 rows in set (0.00 sec)
该命令将列出所有当前存在的 Binlog 文件及其大小
Binlog 文件的存储位置通常由 log-bin
选项的值和 GreatSQL 数据目录共同决定。如果在 my.cnf
中未指定路径,binlog 文件会存储在 GreatSQL 数据目录下。
可以通过以下命令查看 GreatSQL 数据目录:
greatsql> SHOW VARIABLES LIKE 'datadir';
+---------------+-----------------+
| Variable_name | Value |
+---------------+-----------------+
| datadir | /data/GreatSQL/ |
+---------------+-----------------+
1 row in set (0.00 sec)
如果 log-bin
选项指定了路径,则 binlog 文件存储在该路径下。例如:
log-bin=/data/GreatSQL/binlog
Binlog 文件名由 log-bin
选项的值和一个数字序列组成。例如,如果 log-bin
设置为 binlog
,则生成的 binlog 文件名类似于 binlogn.000001
、binlog.000002
等。
序列号是自动递增的,当一个 Binlog 文件达到最大大小(由 max_binlog_size
变量控制)时,GreatSQL 会创建一个新的 Binlog 文件,并将序列号递增。
此次测试环境情况如下:
创建一个testdb
库和employees
表
greatsql> CREATE DATABASE testdb;
Query OK, 1 row affected (0.01 sec)
greatsql> USE testdb;
Database changed
greatsql> CREATE TABLE employees (
-> id INT AUTO_INCREMENT PRIMARY KEY,
-> name VARCHAR(100),
-> position VARCHAR(100),
-> salary DECIMAL(10, 2)
-> );
Query OK, 0 rows affected (0.07 sec)
并插入几条示例数据
greatsql> INSERT INTO employees (name, position, salary) VALUES
('Alice', 'Manager', 60000.00),
('Bob', 'Developer', 50000.00),
('Charlie', 'Analyst', 40000.00),
('greatsql', 'DBA', 66666.00);
Query OK, 4 rows affected (0.05 sec)
Records: 4 Duplicates: 0 Warnings: 0
确认插入成功
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
0
这时候要删除一条id=2
的字段,而你却不小心删除了id=1
的字段
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
1
查看表确认被误删除了
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
2
在数据误删后,恢复数据的关键在于使用 GreatSQL 的二进制日志 (Binlog)。二进制日志记录了所有对数据库进行更改的操作,包括插入、更新和删除。因此,通过解析和重放 Binlog,可以恢复误删的数据。
记录下 GreatSQL 服务器的时间
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
3
记录下当前时间,以确定误删操作发生的大致时间范围。
GreatSQL 的 Binlog 文件按时间顺序记录了所有对数据库的更改。你需要找到包含误删操作的 Binlog 文件。
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
4
根据误删操作的大致时间,确定可能包含误删操作的 Binlog 文件。例如,如果误删操作发生在最近,可能需要检查 binlog.000040
。
或使用SHOW MASTER STATUS
命令确认当前正在使用的 Binlog
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
5
使用 mysqlbinlog
工具可以读取并解析 binlog 文件,以查找并提取相关的 SQL 语句。
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
6
这条命令将从 binlog.000040
文件中提取指定时间范围内的日志,并将其保存到 binlog.sql
文件中。
如果没办法确定误操作的具体时间,可以把 Binlog 全部提取
打开 binlog.sql
文件,查找并确认包含误删操作的 SQL 语句。
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
7
可以手工将查到的误删除数据转换为INSTER
语句重新插入回 GreatSQL 数据库。
或用以下命令,将解析后的 SQL 文件中的 DELETE
语句全部转换为 INSTER
语句
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
8
查看转换后的 SQL 语句结果
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
9
此时将该 SQL 语句在 GreatSQL 中执行即可恢复被误删除的数据
如果不小心将所有数据都删除了,那就可以使用重放 Binlog 让数据全部回来
例如本想删除ID=1
的数据,结果忘记加WHERE
语句
$ systemctl restart greatsql
0
导致了testdb.employees
表数据都没了,但是没关系。需要找到 Binlog 中employees
表的建表语句,从建表开始重放 Binlog 到删除语句为止
同样需要解析 Binlog
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
6
找到employees
建表语句
$ systemctl restart greatsql
2
可以看到该建表语句的开始 Pos 在428474954 结束,删除语句是在428476791开始。确定了起止 Pos 直接重放 Binlog 即可
$ systemctl restart greatsql
3
因为 GreatSQL 启用了 GTID 模式(@@GLOBAL.GTID_MODE = ON
),而 mysqlbinlog
工具默认尝试将 @@SESSION.GTID_NEXT
设置为 ANONYMOUS
,这与启用 GTID 模式的服务器不兼容,所以加上--skip-gtids
,在下方 GTID 恢复也解释为什么需要添加这个参数
因为表没有被删除,所以不用重放建表语句。若表也不存在了,可以从建表语句开始重放
再次查看数据,可以看到数据都回来了
$ cat /etc/my.cnf |grep bin
sync_binlog = 1
binlog_cache_size = 4M
max_binlog_cache_size = 2G
max_binlog_size = 1G
#控制binlog总大小,避免磁盘空间被撑爆
binlog_space_limit = 500G
binlog_rows_query_log_events = 1
binlog_expire_logs_seconds = 604800
binlog_checksum = CRC32
0
以上展示的是根据指定位置恢复数据
查看 GTID 开启前的设定
$ systemctl restart greatsql
5
主要是 gtid_mode
与 enforce_gtid_consistency
需要开启
同时开启后,也能看到 gtid_next=AUTOMATIC
可知 GTID 自动递增
在 GreatSQL 中,mysql.gtid_executed
表用于记录已执行的 GTID(全局事务标识符)。这是 GTID 复制机制中的一个关键部分,用于跟踪服务器上已经执行的所有 GTID,以确保数据一致性和事务的顺利复制。
$ systemctl restart greatsql
6
source_uuid:表示 GTID 的源服务器 UUID。这是生成 GTID 的服务器的唯一标识符。
interval_start:GTID 范围的起始值。它表示该事务范围的起始 GTID。
interval_end:GTID 范围的结束值。它表示该事务范围的结束 GTID。
一个 DDL 语句会产生一个 GTID ,同样 DML 一个事务也会产生一个 GTID
$ systemctl restart greatsql
7
同时也可以查看 Binlog
$ systemctl restart greatsql
8
当看到SET @@SESSION.GTID_NEXT=
这样的命令时,它意味着接下来的事务(或下一个将被写入二进制日志(Binlog)的事务)将被赋予指定的GTID。
启用GTID后,GreatSQL 在恢复 Binlog 时会过滤掉重复的 GTID 事务,这意味着相同的GTID语句只会被执行一次。然而,若多个GTID中存在相同的记录语句,这些语句将被忽略,可能因为语句缺失,从而导致数据恢复失败。因此,在进行 Binlog 备份时,添加 –skip-gtids
参数,确保忽略GTID的幂等性检查。
此时将创建test1
表删除,接着在使用 GTID 恢复
$ systemctl restart greatsql
9
查询 Binlog 可以看到 GTID 值已经到了 9815
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
0
因此需要跳过删除语句,则需要选取 GTID 值小于9815的 GTID 值,既 9814。
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
1
进入 GreatSQL 数据库查看
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
2
可以看到 test1 表已经恢复了
重放整个 Binlog 恢复数据
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
3
根据指定时间恢复数据
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
4
可以查看 Binlog 日志,把 DELETE 语句转为 INSERT 语句重新插入 GreatSQL 数据库恢复
在管理 GreatSQL 数据库时,避免数据丢失是至关重要的任务。以上演示的都是基于 Binlog 完整保存的情况下,才可以做到完整恢复,如果 Binlog 有丢失,则没有办法恢复数据,所以完整备份数据是至关重要的工作。
定期进行全量备份,通常每周一次。全量备份捕获数据库的完整状态,可以使用 mysqldump
或 xtrabackup
工具。
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
5
若有需要,也可以定期备份一下 Binlog 日志文件
使用FLUSH LOGS
刷新一下日志,此时会启用一个新的 Binlog
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
6
这时再把旧的 Binlog 备份下即可
定期测试恢复,确保备份文件是可用的,并且可以成功恢复。每个月进行一次恢复测试,确保备份策略的有效性。
使用 DELETE
语句或 UPDATE
语句,都需要加上WHERE 条件,避免误删除/误修改数据。
可以开启sql_safe_updates
参数,
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
7
此时重开一个会话,使用DELETE 语句没有加上 WHERE 条件,会报错
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
8
使用 UPDATE 语句没有加上 WHERE 条件,会报错
greatsql> SHOW VARIABLES LIKE 'log_bin';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| log_bin | ON |
+---------------+-------+
1 row in set (0.00 sec)
9
在管理 GreatSQL 数据库时,虽然有 Binlog 等强大的工具来帮助恢复误删的数据,但最好的办法还是预防。在进行任何数据操作时,应该保持高度的谨慎,充分备份数据,严格遵循操作规范。数据是企业的重要资产,任何疏忽都可能带来巨大的损失。因此,务必对每一次操作保持敬畏之心,防患于未然:)
Enjoy GreatSQL
GreatSQL是适用于金融级应用的国内自主开源数据库,具备高性能、高可靠、高易用性、高安全等多个核心特性,可以作为MySQL或Percona Server的可选替换,用于线上生产环境,且完全免费并兼容MySQL或Percona Server。
相关链接: GreatSQL社区 Gitee GitHub Bilibili
社区博客有奖征稿详情:https://greatsql.cn/thread-100-1-1.html
微信:扫码添加
GreatSQL社区助手
微信好友,发送验证信息加群
。