ExcelStructureValidator
O Excel Structure Validator é um projeto Python destinado a validar a estrutura de arquivos Excel.
Install / Use
/learn @lvgalvao/ExcelStructureValidatorREADME
Excel Structure Validator
Descrição
O Excel Structure Validator é um projeto Python destinado a validar a estrutura de arquivos Excel. Ele compara arquivos Excel recebidos com um modelo pré-definido para assegurar que os dados cumpram com os padrões estabelecidos. O projeto é ideal para cenários onde a qualidade e a consistência dos dados são críticas para análises subsequentes, como importações para o Power BI, análises de dados, entre outros.
Case do projeto
Documentação do projeto
Funcionalidades
- Valida a quantidade de linhas
- Verifica a existência de colunas a mais ou a menos
- Compara a ordem das colunas com o arquivo modelo
- Valida os tipos de dados das colunas
Requisitos
- Python 3.x
- Pandas
- Loguru
- Poetry (opcional)
Instalação
Usando pip
-
Clone este repositório
-
Navegue até o diretório do projeto e instale as dependências usando pip:
pip install -r requirements.txt
Usando Poetry (Opcional)
-
Clone este repositório
-
Navegue até o diretório do projeto e instale as dependências usando poetry:
poetry install
Para ativar o ambiente virtual do projeto:
poetry shell
Estrutura do Projeto
├── README.md
├── app
│ ├── __init__.py
│ ├── config.py
│ ├── pipeline.py
│ └── validacoes
│ ├── __init__.py
│ ├── colunas_estao_presentes.py
│ ├── colunas_estao_presentes_na_mesma_ordem.py
│ ├── existem_colunas_a_mais.py
│ ├── existem_colunas_a_menos.py
│ ├── quantidade_de_linhas.py
│ └── tipos_dados.py
├── data
│ ├── input
│ │ ├── arquivo_recebido_1.xlsx
│ │ ├── arquivo_recebido_2.xlsx
│ │ ├── arquivo_recebido_3.xlsx
│ │ ├── arquivo_recebido_4.xlsx
│ │ └── arquivo_recebido_5.xlsx
│ ├── modelo
│ │ └── arquivo_modelo.xlsx
│ ├── output_corretos
│ └── output_revisar
├── docs
│ └── index.md
├── mkdocs.yml
├── poetry.lock
├── pyproject.toml
├── requirements.txt
Uso
-
Coloque o arquivo modelo Excel em
data/modelo/ -
Coloque os arquivos Excel que você deseja validar em
data/input/ -
Execute o script
pipeline.pypara iniciar o processo de validação:
python3 -m app.pipeline
ou se você estiver usando Poetry:
task run
- Verifique os logs e os arquivos Excel movidos para os diretórios
output_corretosououtput_revisar.
Logs
Os logs são gerados para cada arquivo e são armazenados no mesmo diretório de destino dos arquivos Excel (output_corretos ou output_revisar), dependendo do resultado da validação.
Contato
Sinta-se à vontade para entrar em contato comigo se você tiver alguma dúvida ou sugestão sobre o projeto. email: lvgalvaofilho@gmail.com
Related Skills
node-connect
352.5kDiagnose OpenClaw node connection and pairing failures for Android, iOS, and macOS companion apps
frontend-design
111.3kCreate distinctive, production-grade frontend interfaces with high design quality. Use this skill when the user asks to build web components, pages, or applications. Generates creative, polished code that avoids generic AI aesthetics.
openai-whisper-api
352.5kTranscribe audio via OpenAI Audio Transcriptions API (Whisper).
qqbot-media
352.5kQQBot 富媒体收发能力。使用 <qqmedia> 标签,系统根据文件扩展名自动识别类型(图片/语音/视频/文件)。
