在 Linux 中查找和删除重复文件的 5 个最佳工具

文件管理本身就是一项复杂的任务。 添加到通常会占用存储空间的大量重复文件中,该过程变得越来越困难。

而处理重复文件的标准方法是手动定位和删除它们。 但是,使用专用的重复文件查找程序可以显着加快该过程。

因此,如果您打算摆脱重复文件并清理计算机,这里列出了一些在 Linux 中查找和删除重复文件的最佳工具。

1. 弗斯林特

Fslint 是一个基于 GUI 和 CLI 的实用程序,用于清理系统中的各种杂物。 它将这种混乱称为“lint”,并提供多种工具来帮助您执行大量任务,包括查找重复文件、空目录和有问题的文件名。

通过具有图形和命令行两种操作模式,fslint 使新 Linux 用户可以更轻松地从各种系统 lint 中释放他们的计算机存储空间。

要通过 GUI 访问 fslint,您只需打开终端并运行 fslint-gui 命令。

就高级功能而言,该程序在 CLI 模式下提供了 findup、findu8、findnl、findtf 和 found 等 10 种不同的功能。 使用这些,您可以优化搜索结果,以增加在系统上找到特定类型的重复文件的机会。

如何安装 fslint

在 Ubuntu 等基于 Debian 的发行版上:

sudo apt install fslint

在基于 RHEL 的发行版上,例如 CentOS 和 Fedora:

sudo yum install fslint
sudo dnf install fslint

在 Arch Linux 和 Manjaro 上:

sudo pacman -S fslint

2. 复制品

Fdupes 是识别和删除目录中重复文件的最简单程序之一。 根据 GitHub 上的 MIT 许可证发布,它是免费和开源的。

该程序通过使用 md5sum 签名和逐字节比较验证以确定目录中的重复文件。 如果需要,您还可以执行递归搜索,过滤掉搜索结果,并获得发现的重复文件的摘要视图。

一旦您确定了目录中的重复文件,您就可以使用 fdupes 删除文件或将它们替换为指向原始文件的链接。

Fdupes 安装

在基于 Debian 的发行版上:

sudo apt install fdupes

在基于 RHEL 的发行版上:

sudo yum install fdupes
sudo dnf install fdupes

在 Arch Linux 和 Manjaro 上安装:

sudo pacman -S fdupes

3. 查找

Rdfind 是另一个 Linux 实用程序,可帮助您跨不同目录查找计算机上的冗余文件。 它依赖于基于文件内容而不是名称来比较文件来识别重复项,这使其在工作中更加有效。

为了实现这一点,该程序通过对目录中相同的文件进行排序并确定原始文件和重复文件来工作:选择排名最高的文件作为原始文件,而其余的是重复文件。

此外,rdfind 还可以计算 校验和 在需要时比较文件。 最好的部分是将扫描结果保存到 结果.txt 主目录中的文件,因此您可以在要删除重复项时参考它,以确保不会删除错误的文件。

当然,与大多数其他重复文件查找器一样,rdfind 也提供了一些预处理器来对文件进行排序、忽略空文件或设置符号链接。 最后但并非最不重要的一点是,还可以选择删除重复文件。

如何安装 rdfind

在 Debian/Ubuntu 上:

sudo apt install rdfind

在 Fedora/中央操作系统:

sudo dnf install rdfind

4. 欺骗大师

DupeGuru 是一个跨平台工具,用于查找和删除机器上的重复文件。 它的最佳特性之一是可以选择自定义匹配引擎以适合您的偏好,从而增加您在目录中找到正确类型的重复文件的机会。 与其他一些重复查找程序类似,它还提供了一个 GUI 以方便操作。

谈到功能,dupeGuru 利用其 模糊匹配 算法扫描文件名或文件内容并快速有效地查找重复项。

此外,它还擅长处理音乐和图片特定信息,这使其优于其他重复文件查找器。 此外,如果需要,您可以选择调整其匹配引擎以准确定位您想要消除的重复文件类型。

DupeGuru 还允许您删除重复文件。 为此,它有一个参考目录系统,可以防止您意外删除错误的文件。 除了删除之外,还可以选择将它们移动或复制到其他地方。

DupeGuru 安装

在基于 Debian 的发行版上:

sudo add-apt-repository ppa:dupeguru/ppa
sudo apt-get update
sudo apt-get install dupeguru

在 Arch Linux 上:

sudo pacman -S dupeguru

5. 林林特

Rmlint 是另一种 lint(不仅仅是重复文件),适用于 Linux 的查找器和移除器。 它可以免费使用,而且在识别系统上的重复文件和目录方面速度极快。 您还将获得对 Btrfs 存储格式的支持,这使其在此列表中的其他工具中脱颖而出。

说到,rmlint 胜过其他竞争性重复文件删除工具的其他一些方面包括基于特定时间范围搜索文件、查找用户/组 ID 损坏的文件以及查找占用大量文件的非剥离二进制文件的能力的空间。 此外,与其他一些程序类似,它也将扫描结果保存到 rmlint.jsonrmlint.sh 文件,在删除操作期间派上用场。

但是,请注意,与其他工具不同,rmlint 并不是最容易使用的:它会生成一个用于删除重复项的脚本,这需要一定程度的理解才能有效使用。

如何安装 rmlint

在基于 Debian 的发行版上:

sudo apt install rmlint

在 Fedora 和 CentOS:

sudo yum install rmlint
sudo dnf install rmlint

在 Manjaro 等基于 Arch 的发行版上:

sudo pacman -S rmlint

在 Linux 上防止重复文件

使用上面列出的重复文件查找程序,您可以轻松识别可能占用计算机空间的重复文件并将它们完全删除。 但是,在使用此类工具时要特别注意您的操作,以免最终删除系统上的重要文件和文档。

如果您对要删除哪些文件以及要保留哪些文件有点怀疑,请确保备份系统上的整个数据以更安全。