Nesta entrevista, mergulhamos no fascinante mundo da Visão Computacional com João Soutto, um cientista de dados especializado na aplicação prática dessa tecnologia.
Detecção precoce de incêndios florestais a outras inovações, João compartilha sua trajetória, desafios e insights sobre como a Visão Computacional está transformando nosso mundo.
Prepare-se para explorar as complexidades e o potencial dessa área em constante evolução, com um profissional que está na linha de frente da inovação.
1) Conte um pouco de você.
Bom, de forma um pouco mais filosófica, posso dizer que sempre fui um resolvedor de problemas, desde uma equação mais complexa a um lance de xadrez desafiador.
Logo no início da minha formação em Engenharia Civil, tive contato com a estatística e isso norteou minha forma de pensar, considero ela um “lifestyle”. Todo fenômeno que ocorre repetidas vezes na minha vida considero que possa ter insights ocultos que me guiem a melhores decisões.
Agora, falando de forma mais prática, diria que sou um Cientista de Dados especialista em soluções da área de Visão Computacional com habilidades desde a exploração dos dados para decisão da melhor solução até o deploy nos mais atuais provedores de Cloud Computing de hoje.
Nesse espectro, atuo no desenvolvimento de soluções da área de Meio Ambiente. Na Umgrauemeio sou o cientista de dados responsável pelo pipeline de inteligência artificial do software de Detecção e Gestão de incêndios florestais.
2) Conte como foi sua história com a área de dados, como começou, quais cursos fez e onde trabalhou.
Meu início eu diria que foi na primeira aula de estatística na Universidade Federal do Rio de Janeiro, devo a disciplina de Probabilidade e Estatística a faísca que iniciou minha jornada na área de dados.
Mais adiante, durante minha bolsa de iniciação científica PIBIC devolvi automações que me colocaram em contato com o python e o VBA, como primeiras linguagens de programação em 2016 e conforme o projeto ia avançando comecei a explorar dados de barragens de rejeito (especialidade na qual me formei) utilizando bibliotecas estatísticas do Python.
Palestra oferecida por João aos estudantes de Ciência de dados da ABRACD
Ainda nesse período, uma das coisas que mais brilhou meus olhos foi ao final de toda a análise, a montagem de uma narrativa envolvente e a apresentação dos resultados para os envolvidos.
Bom, já no meu primeiro emprego, no qual me dividi inicialmente como analista de dados e engenheiro júnior, o que realmente me motivava no dia a dia eram as automações utilizando ferramentas e linguagem de programação e os desafios presentes nas análises exploratórias de dados.
Vi nesse tempo a necessidade de fazer um curso mão na massa de Ciência de Dados, foi quando conversei com o Meigarom, da Comunidade DS, um dos melhores cursos do Brasil para Data Science e através dele fui desenvolvendo habilidades mais específicas para minha área.
Hoje já são 5 anos atuando na área.
3) Quais são as tecnologias que vão ter destaque em 2025 na sua opinião?
Acredito que conforme a área de Data Science vai se tornando cada vez mais atrativa, os profissionais terão que se diferenciar ainda mais do “Cientista de notebook”, aquele que não criou independência para executar soluções completas e fica somente em Jupyter Notebook. Vejo algumas áreas onde essa diferenciação pode surtir bons frutos, cito 2:
– Gen AI:
Essa não é nenhuma surpresa, mas não adianta estudar somente a teoria. Acredito que um DS de grande valor será aquele com projetos em portfólio provando a aplicação de Generative AI de forma tangível para resolução de problemas de negócio do início ao fim do projeto.
Treinar uma Gen AI boa é desafiador, mas será um destaque ainda maior que souber treinar, metrificar corretamente para o universo de aplicação, comunicar os ganhos para o business, optar e saber dar deploy “On-premise” ou em cloud e otimizar isso sem trazer custos exorbitantes para o cliente.
– DataOps e MLOps:
À medida que o volume de dados cresce, ferramentas de DataOps e MLOps se tornarão ainda mais importantes. Elas facilitam a gestão, versionamento, monitoramento de pipelines de dados e modelos de machine learning em produção, melhorando a eficiência e a confiabilidade das soluções.
Um cientista que tem maestria em DataOps e MLOps é um cientista mais organizado de forma geral, trazendo melhores decisões “data driven” e as empresas querem isso.
4) Em que você trabalha atualmente e qual é o impacto do projeto?
Atualmente auto como Cientista de Dados na Umgrauemeio, uma empresa que desenvolve um software de solução completa para a Detecção e Gestão dos incêndios florestais.
Hoje o Brasil está pegando fogo, todos estamos vendo. Poder atuar do lado que reduz esse que é um dos grandes problemas climáticos me traz um enorme prazer, ainda mais quando aliado a aplicações complexas da Visão Computacional.
Dentre outras contribuições, eu ajudei a formalizar e melhorar o Pipeline de Inteligência Artificial para detecção. Desde a escolha da arquitetura, criação de datasets, treinamento e até desenvolvimento do “Backend On-premise”.
5) Qual conselho você deixa para os novos profissionais deste mercado?
Um primeiro conselho seria se questionarem quanto a dependência de ferramentas. Um bom profissional é aquele que resolve, independente da ferramenta usada, pode ser visto como algo clichê, no entanto o hype de uma ou outra ferramenta pode nos levar a investir tempo em algo que não está realmente nos ajudando a diversificar nossa gama de soluções.
Um outro seria para não se assustarem com a quantidade de pré-requisitos que o mercado pede e buscarem se aprofundar em uma área que tenham verdadeiro interesse, para facilitar o processo de aprendizado e a constância, já que o estudo estará presente no dia a dia deles até o final da carreira e isto não pode ser um fardo.
6) Onde você fica sabendo das novidades do setor? Blogs, vídeos?
Recomendo seguir pessoas e páginas disruptivas do setor no LinkedIn, no Medium, no Towards Data Science, canais do Youtube, etc. Usar uns 5-10 min só pra atualidades uma vez por dia. Assino a newsletter do Andrew Ng, The Batch (escrito em inglês), trazendo inovações no mundo de IA.
Gosto de ouvir podcasts também como o Let’s Data, que fala de atualidade do mundo de Dados.
7) Use este espaço para concluir e deixar seus contatos e últimas considerações.
Como pude mostrar, sou fascinado por Ciência de Dados, mas podem acreditar, me satisfaço ainda mais ao ver que pude ajudar outra pessoa de alguma forma, então se serviu pra você que está lendo e você gostaria de conversar comigo, deixo aqui minhas redes pra gente se conectar e trocar ideia sobre a área, sobre carreira, sobre outros aspectos da vida (principalmente fora do computador) e qualquer outro assunto que parecer pertinente:
Linkedin – https://www.linkedin.com/in/joao-pedro-soutto-chaves/
GitHub – https://github.com/joaosoutto95
Portfolio de Visão Computacional – https://joaosoutto-vision.streamlit.app/