数据库意外被删除了整个目录中的数据文件,操作系统级别的删除,然而幸运的是这个数据库没有崩溃,仍然处于 open 状态的时候,这时候只要主进程还没退出,从文件句柄中可以恢复文件最终挽回损失。
如果是MYSQL数据库,相同场景同样适用。
模拟操作如下:
1. 在数据库 open 的时候,直接删除 users 表空间中的数据文件。
2. 尝试在 users 表空间中创建表,开始报错。
在告警日志中,同样也可以看到类似信息。
3. 检查 dbwr 的进程 PID
4. dbwr 会打开所有数据文件的句柄。在 proc 目录中可以查到,目录名是进程 PID,fd 表示文件描述符。
注意其中“/u01/app/oracle/oradata/RM/users01.dbf (deleted)”字样,表示该文件已经被删除,如果是 Solaris 操作系统,ls 命令不会有如此清晰的显示,为了在 Solaris 系统中确认哪个句柄对应哪个文件,则需要使用 lsof 程序。
5.其他表空间的操作暂时不受影响,并主动切日志,保证被删文件与其他文件的序号不一致
6. 直接 cp 该句柄文件名回原位置。
7. 进行数据文件 recover
完成数据文件恢复。
恢复的原理是,在 Linux 操作系统中,如果文件从操作系统级别被rm掉,之前打开该文件的进程仍然持有相应的文件句柄,所指向的文件仍然可以读写,并且该文件的文件描述符可以从 /proc 目录中获得。但是要注意的是,此时如果关闭数据库,则此句柄会消失,那么除了扫描磁盘进行文件恢复之外就没有其它方法了,因此在数据库出现问题的时候,如果不确认情况的复杂程度,千万不要随便关闭数据库。重启数据库往往是没有意义的,甚至是致命的。