Apresentação dos resultados das aulas do módulo 5 do Bootcamp de Data Science Aplicada 2 da Alura - Plataforma do Bootcamp
Workflow de Machine Learning
- Qual é um possível Workflow em um projeto de Data Science;
- Realizar uma transformação de dados em dados categóricos;
- Aumentar o número de iterações da regressão logística para convergir.
Métricas de Avaliação
- Como usar uma árvore de decisão;
- Analisar a qualidade dos resultados com a matriz de confusão;
- Gerar um relatório do resultado da classificação;
- O que é Recall, Precision, F-1 e AUC.
Aleatoriedade de Modelos
- Como criar uma função para treinar N vezes seu modelo;
- Como a aleatoriedade interfere na sua escolha;
- Cálculo do intervalo mínimo e máximo para a métrica AUC;
- Como reduzir o efeito de aleatoriedade na tomada de decisão.
Validação Cruzada
- O que é validação cruzada;
- Como usar a Validação cruzada do Sci-Kit Learn;
- Qual Validação cruzada usar no nosso caso de uso.
Desafios em Machine Learning
- O que é Overfit;
- Como verificar o Overfit;
- Usando o algoritmo de RandomForest.
Finalizando a validação
- Gerar uma matriz de correlação dos dados;
- Avaliar a importação dos atributos no resultado final;
- Desenvolver uma função para remover dados correlacionados.