在服务器端,Seafile 通过一种内部格式将文件存储在资料库中。Seafile 对于文件和目录有其独有的保存方式(类似于Git)。
默认安装下,这些内部对象,会被直接存储在服务器的文件系统中(例如 Ext4,NTFS)。由于大多数文件系统,不能在服务器非正常关闭或系统崩溃后,保证文件内容的完整性。所以,如果当系统崩溃时,正在有新的内部对象被写入,那么当系统重启时,这些文件就会被损坏,相应的资料库也无法使用。
注意: 如果你把 seafile-data 目录存储在有后备电源的 NAS(例如 EMC 或 NetApp)系统中,或者使用 S3 作为专业版的服务器,内部对象不会被损坏。
Seafile 服务器包含了 seafile-fsck
工具来帮助你恢复这些毁坏的对象(类似于git-fsck工具)。这个工具将会进行如下三项工作:
执行流程如下所示:
cd seafile-server-latest
./seaf-fsck.sh [--repair|-r] [repo_id_1 [repo_id_2 ...]]
seaf-fsck 有检查资料库完整性和修复损坏资料库两种运行模式。
执行 seaf-fsck.sh 不加任何参数将以只读方式检查所有资料库的完整性。
cd seafile-server-latest
./seaf-fsck.sh
如果你想检查指定资料库的完整性,只需将要检查的资料库 ID 作为参数即可:
cd seafile-server-latest
./seaf-fsck.sh [library-id1] [library-id2] ...
运行输出如下:
[02/13/15 16:21:07] fsck.c(470): Running fsck for repo ca1a860d-e1c1-4a52-8123-0bf9def8697f.
[02/13/15 16:21:07] fsck.c(413): Checking file system integrity of repo fsck(ca1a860d)...
[02/13/15 16:21:07] fsck.c(35): Dir 9c09d937397b51e1283d68ee7590cd9ce01fe4c9 is missing.
[02/13/15 16:21:07] fsck.c(200): Dir /bf/pk/(9c09d937) is curropted.
[02/13/15 16:21:07] fsck.c(105): Block 36e3dd8757edeb97758b3b4d8530a4a8a045d3cb is corrupted.
[02/13/15 16:21:07] fsck.c(178): File /bf/02.1.md(ef37e350) is curropted.
[02/13/15 16:21:07] fsck.c(85): Block 650fb22495b0b199cff0f1e1ebf036e548fcb95a is missing.
[02/13/15 16:21:07] fsck.c(178): File /01.2.md(4a73621f) is curropted.
[02/13/15 16:21:07] fsck.c(514): Fsck finished for repo ca1a860d.
被损坏的文件和目录将显示在输出的结果中。
有时,你会看到如下的输出结果:
[02/13/15 16:36:11] Commit 6259251e2b0dd9a8e99925ae6199cbf4c134ec10 is missing
[02/13/15 16:36:11] fsck.c(476): Repo ca1a860d HEAD commit is corrupted, need to restore to an old version.
[02/13/15 16:36:11] fsck.c(314): Scanning available commits...
[02/13/15 16:36:11] fsck.c(376): Find available commit 1b26b13c(created at 2015-02-13 16:10:21) for repo ca1a860d.
这意味着记录在数据库中的 "head commit" (当前资料库状态的标识)与数据目录中的记录不一致。这种情况下,fsck 会试着找出最近可用的一致状态,并检查其完整性。
建议: 如果你有很多资料库要检查,保存 fsck 的输出到日志文件中将有助于后面的进一步分析。
fsck 修复损坏的资料库有如下两步流程:
执行如下命令来修复所有资料库:
cd seafile-server-latest
./seaf-fsck.sh --repair
大多数情况下我们建议你首先以只读方式检查资料库的完整性,找出损坏的资料库后,执行如下命令来修复指定的资料库:
cd seafile-server-latest
./seaf-fsck.sh --repair [library-id1] [library-id2] ...
seaf-fsck 会自动将改资料库的所有同步客户端解除同步。用户需要重新同步该资料库。seaf-fsck 也会在资料库的历史中添加一个损坏文件和目录的列表,便于用户找到损坏的路径。
检查所有的资料库并且找出已损坏的资料库,系统管理员可以运行不带任何参数的 seaf_fsck.sh,并且将输出结果保存到日志文件中。在日志文件中搜索关键字 "Fail" 或 ‘‘damage’’ 来查找已损坏的库。
当管理员发现损坏的资料库时,他/她应该运行带有"--repair"的 seaf-fsck.sh。修复资料库后,管理员应该通知用户从其他地方恢复文件。有两个方法:
从Pro版本7.1.5开始,添加了一个选项以加快FSCK。seaf-fsck的大部分运行时间都用于计算文件内容的哈希值。该哈希值将与块对象ID进行比较。如果它们不一致,则将该块检测为损坏。 在许多情况下,文件内容通常不会被破坏。系统中只是缺少一些对象。因此仅检查对象是否存在就足够了。这将大大加快fsck的过程。
要跳过检查文件内容,请在seaf-fsck中添加“ --shallow”或“ -s”选项。
4.2.0版本以后,您可以使用seaf-fsck将资料库中的所有文件导出到外部文件系统(如Ext4)。该程序不依赖于 seafile 数据库。只要你有 seafile-data 目录,你可以随时将文件从seafile导出到外部文件系统。
命令语法是
cd seafile-server-latest
./seaf-fsck.sh --export top_export_path [library-id1] [library-id2] ...
参数 top_export_path 是放置导出文件的目录。每个资料库将导出为导出目录的子目录。如果不指定资料库的ID,将导出所有库。
目前只能导出未加密的资料库,加密资料库将被跳过。
Last modified by 郑杰, 2023-01-28