100 % gratuito e online
Henrique Junqueira Branco
Engenheiro de Machine Learning Pleno no Grupo Boticário
Fala sobre #python
Uma das minhas maiores contribuições open-source para área de dados já está rolando!
Tendo em vista a grande defasagem de conhecimento dos profissionais da área de dados sobre engenharia de software, de forma generalizada, resolvi traduzir uma livro open-source que encontrei sobre o tema com objetivo de reduzir esse gap.
O livro e todo o código será disponibilizado, com a devida autorização da autora original do livro, 100 % em português e 100 % gratuito através do GitHub Pages ao final para que todos tenham acesso e possam usufruir e divulgar livremente!
A tradução já está em andamento e o livro contém algumas capítulos como:
- Como estruturar um projeto de forma escalável do zero
- Dicas de ferramentas para versionar dados, códigos, modelos;
- Acelerando os processos de experimentação e modelagem com código de qualidade e escalável
- Testes unitários aplicados ao projeto
- Como criar o pipeline de execução completo do modelo de ponta-a-ponta, de forma automatizada
Algumas ferramentas usadas serão:
- poetry
- DVC
- hydra
- prefect
- BentoML
- pre-commit
- pytest
… e muitas outras! Todas com exemplo prático.
O link da tradução é este: https://henriqueajnb.github.io/data-science-escalavel
e o link da versão original é este: https://khuyentran1401.github.io/reproducible-data-science
Be the first to comment