Skip to content

Latest commit

 

History

History

modulo-05

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 

Bootcamp Data Science Aplicada 2 - Módulo 5

Apresentação dos resultados das aulas do módulo 5 do Bootcamp de Data Science Aplicada 2 da Alura - Plataforma do Bootcamp

Módulo 5: Modelos, métricas e validações em Machine Learning

Workflow de Machine Learning

  • Qual é um possível Workflow em um projeto de Data Science;
  • Realizar uma transformação de dados em dados categóricos;
  • Aumentar o número de iterações da regressão logística para convergir.

Métricas de Avaliação

  • Como usar uma árvore de decisão;
  • Analisar a qualidade dos resultados com a matriz de confusão;
  • Gerar um relatório do resultado da classificação;
  • O que é Recall, Precision, F-1 e AUC.

Aleatoriedade de Modelos

  • Como criar uma função para treinar N vezes seu modelo;
  • Como a aleatoriedade interfere na sua escolha;
  • Cálculo do intervalo mínimo e máximo para a métrica AUC;
  • Como reduzir o efeito de aleatoriedade na tomada de decisão.

Validação Cruzada

  • O que é validação cruzada;
  • Como usar a Validação cruzada do Sci-Kit Learn;
  • Qual Validação cruzada usar no nosso caso de uso.

Desafios em Machine Learning

  • O que é Overfit;
  • Como verificar o Overfit;
  • Usando o algoritmo de RandomForest.

Finalizando a validação

  • Gerar uma matriz de correlação dos dados;
  • Avaliar a importação dos atributos no resultado final;
  • Desenvolver uma função para remover dados correlacionados.