Primeiramente, obrigado pelo seu interesse em trabalhar na JustForYou! Abaixo você encontrará todas as informações necessárias para iniciar o seu teste.
- Crie um repositório público na sua conta do GitHub sem citar nada relacionado a JustForYou;
- Faça seus commits no seu repositório;
- Após o término, envie o link de seu repositório para a Tech Recruiter que está conduzindo o seu processo seletivo
- Fique tranquilo(a), respire, assim como você, também já passamos por essa etapa. Boa sorte! :)
Você trabalha em uma empresa do tipo e-commerce que vende produtos para cabelo personalizados.
Para personalizar o produto, a empresa solicita que o cliente preencha um formulário onde
irá contar sobre a sua rotina e seu cabelo. Após finalizar o preenchimento, o cliente é
direcionado automaticamente para o checkout, onde ele irá optar por fechar a compra ou não.
A experiência de venda online é baseada em três etapas:
- Preenchimento do formulário
- Seleção dos produtos
- Fechamento da compra
A empresa está gastando muito dinheiro com disparos via Whatsapp para pessoas que preenchem o formulário (leads),
desta forma seria interessante qualificar quem são os leads que possuem maior probabilidade de efetuar uma compra
e assim tornar os disparos mais efetivos.
Você então é convocado para solucionar tal desafio, e portanto deve achar a correlação entre compradores e leads.
Para isso, acesse o banco de dados presente em sua empresa para fazer a coleta dos dados, e use os recursos ao seu alcance para solucionar o problema e apresentar as suas conclusões.
Sua empresa contém um banco de dados relacional (Postgres) hospedado remotamente, com as credenciais de acesso listadas aqui. O banco contém a seguinte estrutura de tabelas e relações:
A entrega deve conter um arquivo .ipynb (Jupyter notebook) contendo toda evolução da solução, sendo que os seguintes pontos devem estar presentes:
- Leitura dos dados e normalização
- Separação de bases para treinar e efetuar o crossvalidation
- Respaldo teórico e prático sobre as escolhas dos algoritmos (podendo ser mais de um)
- Como e porquê foram escolhidas as features analisadas
- Salvar o arquivo de treinamento para uma API consumir e gerar o score
- Resultado final com métricas de acertividade do algoritmo
Devem constar em seu repositório git:
- Arquivo .ipynb citado acima
- Arquivo .md contendo as conclusões de sua análise
- Arquivo .sql contendo as queries utilizadas para obtenção dos dados
- Scripts extras utilizados para as análises, caso tenha utilizado algum