Fala galera do 🌎 dos 🎲🎲🎲! Dando continuidade a série de automatização de tarefas com Python aqui no blog Dados ao Cubo. Hoje vamos realizar a organização de pastas e arquivos com Python. A automatização de tarefas é uma habilidade valiosa que pode poupar tempo e esforço, especialmente em tarefas rotineiras e repetitivas. Portanto, neste case, exploraremos como Python pode ser utilizado para automatizar a organização de arquivos e pastas em um diretório específico, facilitando o gerenciamento de dados e proporcionando uma experiência mais eficiente.
Problema de Organização de Arquivos e Pastas
Imagine um cenário em que você tem uma pasta com centenas de arquivos de diferentes formatos, e a tarefa de classificar manualmente esses arquivos em pastas apropriadas parece interminável. Além disso, renomear cada arquivo para que sigam um padrão específico também seria um desafio demorado. Como exemplo na imagem a seguir com arquivos de vários formatos, imagina esse exemplo em milhões de arquivos.
A boa notícia é que o Python pode nos ajudar nessa missão.
Solução com Python para Organização de Arquivos e Pastas
Com Python, podemos criar um script simples, mas poderoso, para automatizar essa tarefa de organização e renomeação de arquivos. Usando as bibliotecas nativas do Python, como `os` e `shutil`, e técnicas de manipulação de strings, podemos facilmente criar um script eficiente. Conheça um pouco mais dessas bibliotecas Python.
Biblioteca os Python
A biblioteca “os” é uma biblioteca padrão do Python. É uma opção valiosa para desenvolvedores que precisam lidar com operações do sistema operacional em suas aplicações.
A biblioteca é especialmente útil para tarefas que envolvem manipulação de arquivos, configuração de ambientes de trabalho e automação de processos. Com ela, você poderá criar aplicações mais robustas e flexíveis, adequadas para atender às necessidades específicas do seu projeto. Aqui vamos utilizar ela para criar pastas, listar arquivos e diretórios.
Biblioteca shutil Python
A biblioteca “shutil” também é uma parte integrante da biblioteca padrão do Python, projetada especificamente para simplificar e tornar mais eficiente a manipulação de arquivos e diretórios em diferentes sistemas operacionais.
Ela é valiosa para desenvolvedores que precisam interagir com o sistema de arquivos de maneira mais intuitiva e simplificada. Seja para automatizar tarefas de gerenciamento de arquivos ou para garantir a integridade e segurança dos dados, a “shutil” oferece uma série de funções poderosas para lidar com essas operações. Aqui vamos utilizar ela para mover arquivos entre diretórios.
Organização de Arquivos e Pastas ao Cubo
Então chegou a hora da prática e fazer a organização de pastas e arquivos com Python. Confere o passo a passo na sequência com códigos e comentários.
Passo 1: Importando as Bibliotecas Necessárias
Primeiramente, começamos importando as bibliotecas necessárias para interagir com o sistema operacional e manipular os arquivos.
import os import shutil
Passo 2: Definindo e Criando as Pastas de Destino
Antes de iniciar a organização dos arquivos, definimos as pastas de destino para cada tipo de arquivo. Por exemplo, imagine que temos arquivos de imagens, documentos, planilhas e PDFs. Vamos criar pastas específicas para cada um deles. No código abaixo vamos criar uma variável com o diretório onde vamos criar as pastas, e dar nomes para cada uma delas.
directory = "/content/" image_folder = "imagens" document_folder = "documentos" spreadsheet_folder = "planilhas" pdf_folder = "pdfs" directory_folders = [image_folder, document_folder, spreadsheet_folder, pdf_folder]
E então, criamos cada pasta listada acima.
for dir in directory_folders: os.mkdir(directory+dir) print(directory+dir)
Confere na imagem abaixo as pastas criadas com o código acima.
Passo 3: Listando os Arquivos no Diretório
Agora, precisamos listar todos os arquivos no diretório que queremos organizar.
files = os.listdir(directory) files
A função irá retornar uma lista com todos os arquivos e pastas naquele diretório. Confere na imagem abaixo.
Passo 4: Classificando e Movendo os Arquivos
Com a lista de arquivos em mãos, podemos iterar por cada um deles, verificar sua extensão e movê-los para a pasta adequada.
for file in files: if file.lower().endswith((".jpg", ".jpeg", ".png", ".gif")): shutil.move(os.path.join(directory, file), os.path.join(directory, image_folder, file)) elif file.lower().endswith((".doc", ".docx", ".txt")): shutil.move(os.path.join(directory, file), os.path.join(directory, document_folder, file)) elif file.lower().endswith(".xlsx"): shutil.move(os.path.join(directory, file), os.path.join(directory, spreadsheet_folder, file)) elif file.lower().endswith(".pdf"): shutil.move(os.path.join(directory, file), os.path.join(directory, pdf_folder, file))
Observe na imagem abaixo a estrutura de pastas como ficaram organizados.
Passo 5: Renomeando os Arquivos
Por fim, se desejarmos renomear os arquivos de acordo com um padrão específico, podemos fazer isso utilizando as técnicas de manipulação de strings do Python.
for file in os.listdir(os.path.join(directory, image_folder)): new_name = "imagem_" + file os.rename(os.path.join(directory, image_folder, file), os.path.join(directory, image_folder, new_name))
Portanto, na imagem a seguir, temos os arquivos do tipo imagem renomeados conforme o código acima.
Arquivos e Pastas com Python ao Cubo
Com este script em Python, conseguimos automatizar a organização de arquivos em pastas apropriadas e renomear de acordo com um padrão específico. A automatização dessa tarefa não apenas economiza tempo, mas também torna o processo mais preciso e confiável, evitando erros humanos. A automação de tarefas com Python é uma habilidade poderosa que pode ser aplicada em diversas situações, tornando a vida de desenvolvedores e profissionais mais eficiente e produtiva. Não perca as novidades do Dados ao Cubo! Então, fica ligado com a nossa Newsletter. Um abraço e até a próxima!!!
Conteúdos ao Cubo
Então, se você curtiu o conteúdo, aqui no Dados ao Cubo tem muito mais. Então, deixo algumas sugestões de conteúdos que você pode encontrar. Sempre falando sobre o mundo dos dados!
- Time de Dados na Prática
- Etapas para Análise de Dados
- Tipos de Análise de Dados
- Dicas para Visualização de Dados
- Análise de Dados com Airbyte e Metabase
- Importar CSV no PostgreSQL com o DBeaver
- Deploy do Metabase com Docker
Para finalizar, se torne também Parceiro de Publicação Dados ao Cubo. Escreva o próximo artigo e compartilhe conhecimento para toda a comunidade de dados.
Apaixonado por dados e tecnologia ❤️ , criando soluções com dados 📊 📈 , desde 2015, sempre buscando tornar os processos orientados! Com formação em Engenharia da Computação 💾 , MBA Gestão da Informação e Business Intelligence e Especialização em Data Science.
Também atuo como professor na área de dados. Nas horas vagas crio modelos de Machine Learning 🤖 com Python em desafios do Kaggle e escrevo no Dados ao Cubo sobre o mundo dos dados 🎲 !
Compartilhando conhecimentos sempre 🚀