Linux中查找大文件两种姿势

使用find命令查找大文件

find命令是Linux系统管理员工具库中最强大的工具之一。它允许你根据不同的标准(包括文件大小)搜索文件和目录。

例如,如果在当前工作目录中要搜索大小超过100MB的文件,请使用以下命令:

  1. sudo find . -xdev -type f -size +100M

. 代表当前目录。如要搜索其它目录替换.为要搜索目录的路径。

输出将显示的文件列表,不会包含其它信息。

  1. /var/lib/libvirt/images/centos-7-desktop_default.img
  2. /var/lib/libvirt/images/bionic64_default.img
  3. /var/lib/libvirt/images/winqcow2
  4. /var/lib/libvirt/images/debian-9_default.img
  5. /var/lib/libvirt/images/ubuntu-18-04-desktop_default.img
  6. /var/lib/libvirt/images/centos-7_default.img

find命令还可以与其他命令结合使用,例如lssort对这些文件执行操作。

在下面的示例中,我们传递find命令的输出到lsls将打印已找到的每个文件的大小,然后将将输出传递给sort命令,以根据文件大小的第5列对其进行排序。

  1. find . -xdev -type f -size +100M -print | xargs ls -lh | sort -k5,5 -h -r

输出像这样:

  1. -rw------- 1 root root 40967M Jan 5 14:12 /var/lib/libvirt/images/winqcow2
  2. -rw------- 1 root root 3725M Jan 7 22:12 /var/lib/libvirt/images/debian-9_default.img
  3. -rw------- 1 root root 1524M Dec 30 07:46 /var/lib/libvirt/images/centos-7-desktop_default.img
  4. -rw------- 1 root root 999M Jan 5 14:43 /var/lib/libvirt/images/ubuntu-18-04-desktop_default.img
  5. -rw------- 1 root root 562M Dec 31 07:38 /var/lib/libvirt/images/centos-7_default.img
  6. -rw------- 1 root root 378M Jan 7 22:26 /var/lib/libvirt/images/bionic64_default.img

如果输出包含大量信息,你可以使用该head命令仅打印前10行:

  1. find . -xdev -type f -size +100M -print | xargs ls -lh | sort -k5,5 -h -r | head

分解命令:find . -xdev -type f -size +100M -print

  • 仅搜索当前工作目录(.)中的 文件(-type f),大于100MB(-size +100M),不要查找其他文件系统上的目录(-xdev)并在标准输出上打印完整文件名,然后是新的一行(-print) 。
  • xargs ls -lh- find命令的输出通过管道xargs执行,ls -lh命令将以长列表可读格式打印输出。
  • sort -k5,5 -h -r- 基于第5列(-k5,5)对行进行排序,以可读格式(-h)的值并反转结果(-r)。
  • head :仅打印管道输出的前10行。

find命令带有许多强大的选项。例如,你可以搜索超过多少天的大文件,具有特定扩展名的大文件或属于特定用户的大文件。

使用du命令查找大文件和目录

du命令用于估计文件空间使用情况,对于查找占用大量磁盘空间的目录和文件特别有用。

以下命令将打印最大的文件和目录:

  1. du -ahx . | sort -rh | head -5

第一列包含文件大小,第二列包含文件名:

  1. 55G .
  2. 24G ./.vagrant.d/boxes
  3. 24G ./.vagrant.d
  4. 13G ./Projects
  5. 2G ./.minikube

命令说明:

  • du -ahx .:估算当前工作目录(.)中的磁盘空间使用情况,包括文件和目录(a),以比较接近人的常见可读格式打印大小(h)并跳过不同文件系统上的目录(x)。
  • sort -rh:通过可读格式(-h)的值并反转结果(-r)来对输出行进行排序。
  • head -5 :仅打印管道输出的前5行。

【Linux常用命令速查手册】关注【入门小站】,后台回复 「1001」 自取。

返回笔记列表
入门小站