-
Você pode criar suas próprias pastas, mas já tomei a liberdade de criar algumas que vejo que são necessárias. Repositório organizado orienta escalabilidade ao projeto.
-
Na pasta 'data' teremos uma pasta para armazerar dados coletados em 'external' e dados já processados em 'processed'.
-
'docs' é uma pasta para seu uso livre. Geralmente uso para guardar testes e etc.
-
Na pasta 'reports' você encontra um lugar ideal para guardar seus relatórios de acurácia, assertividade, avaliações de modelos e etc.
-
Em 'src' temos duas pastas. 'notebooks' para que você desenvolva o modelo, se preferir, em um notebook e separe ele de forma organizada. Na pastas 'models' é onde você transforma seu notebook em script, antes de colocá-lo em produção.
-
Deixei um pipeline CRISP-DM no repositório, mas fique a vontade para seguir a metodologia que preferir.
-
Deixei um Dockerfile mas fique a vontade para apaga-lo se não for usar.
-
Crie seu ambiente virtual e, como boas práticas, sempre alimente o 'requirements.txt' com as versões de frameworks utilizadas no seu projeto.
-
Have fun! Se divirta enquanto trabalha, afinal, se estamos aqui, estamos fazendo o que gostamos, não é mesmo?!
Best,
Juan Vieira