-
Você pode criar suas próprias pastas, mas já tomei a liberdade de criar algumas que vejo que são necessárias. Repositório organizado orienta escalabilidade ao projeto.
-
Na pasta 'data' teremos uma pasta para armazerar dados coletados em 'external' e dados já processados em 'processed'.
-
'docs' é uma pasta para seu uso livre. Geralmente uso para guardar testes e etc.
-
Na pasta 'reports' você encontra um lugar ideal para guardar seus relatórios de acurácia, avaliações de modelos e etc.
-
Em 'src' temos duas pastas. 'notebooks' para que você desenvolva o modelo, se preferir, em um notebook e separe ele de forma organizada. Na pastas 'models' é onde você transforma seu notebook em script, antes de colocá-lo em produção.
-
Deixei um pipeline no repositório para ajudar na orientaçaão dos passos.
-
Modo de uso:
7.1. Faça um pull do repositório:
git pull https://github.com/santander-coders-1175/machine-learning-1.git
7.2. Instale as dependências:
pip install -r requirements.txt
- Have fun! Se divirta enquanto trabalha, afinal, se estamos aqui, estamos fazendo o que gostamos, não é mesmo?!
Cuidadosamente,
Time de Ciência de Dados - Santander Coders