Construindo uma solução robusta e escalável em ciência de dados

100 % gratuito e online

Henrique Junqueira Branco
Engenheiro de Machine Learning Pleno no Grupo Boticário
Fala sobre #python

Uma das minhas maiores contribuições open-source para área de dados já está rolando!

Tendo em vista a grande defasagem de conhecimento dos profissionais da área de dados sobre engenharia de software, de forma generalizada, resolvi traduzir uma livro open-source que encontrei sobre o tema com objetivo de reduzir esse gap.

O livro e todo o código será disponibilizado, com a devida autorização da autora original do livro, 100 % em português e 100 % gratuito através do GitHub Pages ao final para que todos tenham acesso e possam usufruir e divulgar livremente!

A tradução já está em andamento e o livro contém algumas capítulos como:

  • Como estruturar um projeto de forma escalável do zero
  • Dicas de ferramentas para versionar dados, códigos, modelos;
  • Acelerando os processos de experimentação e modelagem com código de qualidade e escalável
  • Testes unitários aplicados ao projeto
  • Como criar o pipeline de execução completo do modelo de ponta-a-ponta, de forma automatizada

Algumas ferramentas usadas serão:

  • poetry
  • DVC
  • hydra
  • prefect
  • BentoML
  • pre-commit
  • pytest
    … e muitas outras! Todas com exemplo prático.

O link da tradução é este: https://henriqueajnb.github.io/data-science-escalavel
e o link da versão original é este: https://khuyentran1401.github.io/reproducible-data-science

Be the first to comment

Leave a Reply