Como remover dados redundantes no Linux com Fdupes

Ninguém gosta de arquivos duplicados. Eles ocupam espaço desnecessário em um sistema e atrapalham. Felizmente, no Linux, existe uma maneira de remover dados redundantes e limpar arquivos duplicados, usando o Fdupes.

Instalar Fdupes

A ferramenta Fdupes é uma das melhores ferramentas de desduplicação de linha de comando na plataforma Linux. Quando executado, ele pode varrer qualquer diretório em busca de arquivos duplicados, farejar sua localização exata e transformar as duplicatas em links simbólicos – tanto links físicos quanto soft links. O melhor de tudo, ao transformar duplicatas em links do sistema, reduz o espaço, mantendo os arquivos intactos no mesmo local.

O Fdupes é fácil de instalar e tem muito suporte na maioria das distribuições Linux existentes. Na verdade, até o FreeBSD tem o software disponível. Para fazer o software funcionar, inicie um terminal e digite os comandos que correspondem ao seu sistema operacional Linux.

Ubuntu

sudo apt install fdupes

Debian

sudo apt-get install fdupes

Arch Linux

O Fdupes está no Arch Linux, através do repositório “Community”. Infelizmente, o repositório “Community” não está configurado por padrão. Para instalar este programa, primeiro você precisa editar o arquivo Pacman.conf.

  Como enviar comandos do Linux para um arquivo

Para editar o arquivo de configuração, abra-o no editor de texto Nano.

sudo nano /etc/pacman.conf

No arquivo de configuração, remova “#” da frente de tudo relacionado a “Community”. Lembre-se de que todos os “#” devem desaparecer, ou o repositório não funcionará. Quando as edições estiverem concluídas, salve-o com Ctrl + O e saia com Ctrl + X.

Sincronize o novo repositório da comunidade com o Pacman.

sudo pacman -Syy

Agora que a fonte de software “Community” foi sincronizada com sucesso, o Arch Linux tem acesso total a ela. Finalize o processo instalando o aplicativo Fdupes através do gerenciador de pacotes.

sudo pacman -S fdupes

Fedora

sudo dnf install fdupes

OpenSUSE

sudo zypper install fdupes

Verificar duplicatas

Antes que o Fdupes possa remover arquivos redundantes, ele precisa saber onde eles estão. Para encontrar os arquivos, você precisará usar a chave r. Com o switch r, você poderá pesquisar em todas as pastas do seu PC Linux, junto com todas as subpastas, tornando a localização de duplicatas muito, muito mais rápida.

Siga as instruções abaixo para saber como encontrar e remover arquivos duplicados em vários locais no seu PC Linux.

  Como verificar o kernel Linux e a versão do sistema operacional

Duplicatas na pasta pessoal

Um dos principais lugares em que os usuários armazenam arquivos é /home/. A razão pela qual esta pasta contém toneladas de arquivos é que tudo o que um usuário faz no Linux é colocado aqui. Como resultado, os arquivos se acumulam ao longo do tempo e, muitas vezes, as duplicatas se acumulam. Para encontrar essas duplicatas, abra um terminal e aponte fdupes para sua pasta pessoal.

fdupes -r ~/

ou, para verificar outro usuário em seu PC, não conectado no momento, faça:

fdupes -r /home/username/

Depois de executar a verificação, a ferramenta retornará uma lista inteira de duplicatas que encontrar no diretório inicial. Para salvar essas informações, canalize a saída para um arquivo na pasta Documentos.

fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt

ou

fdupes -r /home/username/ >> ~/Documents/fdupes-scan-home-user.txt

Duplicatas no sistema de arquivos raiz

O Fdupes tem a capacidade de escanear qualquer local, e não apenas a pasta pessoal. Se você estiver tentando encontrar arquivos duplicados no sistema de arquivos raiz do seu PC Linux, veja o que fazer.

Em um terminal, altere o shell de um usuário normal para a conta root. Mudar de uma conta tradicional para Root permitirá que o aplicativo Fdupes verifique em locais que estão fora dos limites de uma configuração normal.

sudo -s

ou

su -

Como root, verifique o sistema de arquivos root usando Fdupes.

fdupes -r /

Como alternativa, verifique um local específico, em vez de todo o sistema raiz com:

fdupes -r /location/on/your/pc

Precisa exportar os resultados da verificação para um arquivo para uso posterior? Execute este comando.

fdupes -r / >> /home/username/Documents/fdupes-scan.txt

ou

fdupes -r /location/on/your/pc >> /home/username/Documents/fdupes-scan.txt

Remover dados redundantes

A verificação de arquivos duplicados é uma parte crítica da remoção de dados redundantes. O próximo passo é lidar com os resultados e remover as redundâncias. Felizmente, livrar-se de dados redundantes é incrivelmente rápido. O melhor de tudo, nada realmente precisa ser excluído, pois o Fdupes suporta a troca de arquivos reais com links simbólicos.

  Como ocultar arquivos no Linux e protegê-los

Existem dois tipos de desduplicação que o Fdupes suporta: hard links e soft links. Para melhores resultados, recomendamos usar links físicos, pois eles são indistinguíveis dos arquivos reais. No entanto, links simbólicos suaves também funcionam. Para desduplicar, faça o seguinte em um terminal.

Nota: Não substitua dados duplicados em todo o sistema, a menos que você entenda os riscos que podem ocorrer!

Substituição de link rígido

fdupes -rH /home/username/

ou, para duplicatas em todo o sistema:

sudo -s
fdupes -rH /root/file/location

Substituição de link suave

fdupes -rS /home/username/

ou, para todo o sistema:

fdupes -rS /root/file/location