4 herramientas útiles para buscar y eliminar archivos duplicados en Linux

4 herramientas útiles para buscar y eliminar archivos duplicados en Linux

Organizar su directorio personal o incluso su sistema puede ser particularmente difícil si tiene el hábito de descargar todo tipo de cosas de Internet.

A menudo puede encontrar que ha descargado el mismo mp3, pdf, epub (y todo tipo de extensiones de archivo) y lo copié en diferentes directorios. Esto puede hacer que sus directorios se llenen de todo tipo de cosas duplicadas inútiles.

En este tutorial, aprenderá cómo encontrar y eliminar archivos duplicados en Linux usando rdfind. y herramientas de línea de comandos fdupes. así como herramientas de GUI llamadas DupeGuru. y FSlint.

Una nota de precaución: siempre tenga cuidado con lo que elimina en su sistema, ya que esto puede provocar una pérdida de datos no deseada. Si está utilizando una nueva herramienta, primero pruébela en un directorio de prueba donde eliminar archivos no será un problema.

1. Rdfind: encuentra archivos duplicados en Linux

Rdfind. proviene de la búsqueda de datos redundantes. Es una herramienta gratuita que se utiliza para buscar archivos duplicados en varios directorios o dentro de ellos. Utiliza suma de comprobación y encuentra duplicados basados ​​en archivos que no solo contienen nombres.

freestar.config.enabled_slots.push

Rdfind. utiliza un algoritmo para clasificar los archivos y detecta cuál de los duplicados es el archivo original y considera el resto como duplicados. Las reglas de clasificación son:

  • Si se encontró A. mientras se escaneaba un argumento de entrada anterior a B. A. tiene una clasificación más alta.
  • Si A. se encontró a una profundidad inferior a B. A. tiene una clasificación más alta.
  • Si A. se encontró antes que B. A. tiene una clasificación más alta.

La última regla se usa particularmente cuando se encuentran dos archivos en el mismo directorio.

Para instalar rdfind. en Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install rdfind [En Debian/Ubuntu. $ sudo yum install epel-release && $ sudo yum install rdfind [En CentOS/RHEL. $ sudo dnf instalar rdfind [En Fedora 22+. $ sudo pacman-S rdfind [En Arch Linux]

Para ejecutar rdfind. en un directorio simplemente escriba rdfind y el objetivo di casa del párroco. Aquí hay un ejemplo:

$ rdfind/home/user  Buscar archivos duplicados en Linux  Buscar archivos duplicados en Linux Buscar archivos duplicados en Linux

Como puede ver, rdfind. guardará los resultados en un archivo llamado results.txt. ubicado en el mismo directorio desde donde ejecutó el programa. El archivo contiene todos los archivos duplicados que ha encontrado rdfind. Puede revisar el archivo y eliminar los archivos duplicados manualmente si lo desea.

Otra cosa que puede hacer es usar la opción-dryrun, una opción que proporcionará una lista de duplicados sin realizar ninguna acción:

$ rdfind-dryrun true/home/user

Cuando encuentre los duplicados, puede optar por reemplazarlos con enlaces duros.

$ rdfind-makehardlinks true/home/user

Y si lo desea para eliminar los duplicados puede ejecutar.

$ rdfind-deleteduplicates true/home/user

Para comprobar otras opciones útiles de rdfind. puede utilizar el rdfind. manual con.

$ man rdfind

2. Fdupes: escanea archivos duplicados en Linux

Fdupes es otro programa que te permite identificar archivos duplicados en tu sistema. Es gratuito y de código abierto y está escrito en C. Utiliza los siguientes métodos para determinar archivos duplicados:

  • Comparando firmas md5sum parciales
  • Comparando firmas md5sum completas
  • verificación de comparación byte a byte

Al igual que rdfind. tiene opciones similares:

  • Buscar de forma recursiva
  • Excluir archivos vacíos
  • Muestra el tamaño de los archivos duplicados
  • Eliminar duplicados inmediatamente
  • Excluir archivos con un propietario diferente

Para instalar fdupes. en Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install fdupes [En Debian/Ubuntu. $ sudo yum install epel-release && $ sudo yum install fdupes [En CentOS/RHEL. $ sudo dnf install fdupes [On Fedora 22+. $ sudo pacman-S fdupes [En Arch Linux]

La sintaxis de Fdupes. es similar a rdfind. Simplemente escriba el comando seguido del directorio que desea escanear.

$ fdupes

Para buscar archivos de forma recursiva, deberá especificar la opción-r como esta.

$ fdupes-r

También puede especificar varios directorios y especificar un directorio. para buscar de forma recursiva.

$ fdupes -r

Para que fdupes calcule el tamaño de los archivos duplicados utilice la opción-S.

$ fdupes-S

Para recopilar información resumida sobre los archivos encontrados utilice la opción-m.

$ fdupes-m

 Escanear archivos duplicados en Linux  Escanear duplicado Archivos en Linux Escanear archivos duplicados en Linux

Por último, si desea eliminar todos los duplicados, utilice la opción-d como esta.

$ fdupes-d

Fdupes. preguntará cuál de los archivos encontrados eliminar. Deberá ingresar el número de archivo:

 Eliminar archivos duplicados en Linux  Eliminar archivos duplicados en Linux Eliminar archivos duplicados en Linux

Una solución que definitivamente no se recomienda es usar la opción-N que resultará en preservar el primer archivo solamente.

$ fdupes-dN

Para obtener una lista de opciones disponibles para usar con fdupes. revise la página de ayuda ejecutando.

$ fdupes-help

3. dupeGuru-Encuentra archivos duplicados en un sistema Linux

dupeGuru. es una herramienta de código abierto y multiplataforma que se puede usar para encontrar archivos duplicados en un sistema Linux. La herramienta puede escanear nombres de archivos o contenido en una o más carpetas. También le permite encontrar el nombre de archivo que es similar a los archivos que está buscando.

dupeGuru viene en diferentes versiones para plataformas Windows, Mac y Linux. Su función de algoritmo de coincidencia aproximada rápida le ayuda a encontrar archivos duplicados en un minuto. Es personalizable, puede extraer los archivos duplicados exactos que desee y borrar los archivos no deseados del sistema.

Para instalar dupeGuru. en Linux, use el siguiente comando según su Distribución de Linux.

—————En Debian/Ubuntu/Mint————— $ sudo add-apt-repository ppa: dupeguru/ppa $ sudo apt-get update $ sudo apt-get install dupeguru —————En Arch Linux————— $ sudo pacman-S dupeguru DupeGuru-Encuentra archivos duplicados en Linux  DupeGuru-Buscar archivos fijos duplicados archivos en Linux DupeGuru-Buscar archivos duplicados en Linux

4. FSlint-Buscador de archivos duplicados para Linux

FSlint. es una utilidad gratuita que se utiliza para buscar y limpiar varias formas de pelusa en un sistema de archivos. También informa archivos duplicados, directorios vacíos, archivos temporales, nombres duplicados/conflictivos (binarios), enlaces simbólicos incorrectos y muchos más. Tiene modos de línea de comandos y GUI.

Para instalar FSlint. en Linux, use el siguiente comando según su distribución de Linux.

$ sudo apt-get install fslint [En Debian/Ubuntu. $ sudo yum install epel-release && $ sudo yum install fslint [En CentOS/RHEL. $ sudo dnf install fslint [En Fedora 22+. $ sudo pacman-S fslint [En Arch Linux]  FSlint-Buscador de archivos duplicados para-Linux  FSlint-Buscador de archivos duplicados para-Linux FSlint-Buscador de archivos duplicados para-Linux Conclusión

Estas son herramientas muy útiles para encontrar archivos duplicados en su sistema Linux, pero debería ser muy útil tenga cuidado al eliminar dichos archivos.

Si no está seguro de si necesita un archivo o no, sería mejor crear una copia de seguridad de ese archivo y recordar su directorio antes de eliminarlo. Si tiene alguna pregunta o comentario, envíelo en la sección de comentarios a continuación.