Os dados, quando limpos e coerentes, podem ser entendidos como um investimento de médio a longo prazo. No entanto, quem investe em ativos financeiros sabe que o potencial de retorno geralmente está atrelado ao risco de forma proporcional, ou seja, um grande potencial de retorno sempre é acompanhado do risco de perda.
Bom, quando o assunto é investimento em dados, a situação é um pouco diferente. O risco está em não os explorar. Tendo isso em vista, levanto perguntas comuns:
“ O que pode ser encontrado dentro dos dados de um negócio? ”
“ Como transformar dados em insights? ”
“ Quanto isso pode trazer de retorno frente ao tempo e montante investido? ”
As respostas variam de caso a caso, mas a primeira pista pode vir dos tipos de dados do business. Como a exploração de dados não é algo tão novo, os problemas de negócio se repetem em várias áreas do conhecimento, sendo assim entender o tipo de dado pode ajudar a explorar as diversas soluções que os usam.
Existem várias classificações, sendo a mais comum da ciência de dados em estruturados e não estruturados, no entanto para facilitar o raciocínio separei em 4 categorias, assim a partir delas aprofundarei em problemas e soluções conhecidas:
- Dados Numéricos e/ou Categóricos
- Textos semânticos
- Sons
- Imagens
Nesse contexto, na figura abaixo apresento um mapa das ramificações de problemas reais de negócio ligadas aos tipos de dados, cada número será o tema de um artigo que irei publicar, apelidei ele carinhosamente de Data Tree (imagem abaixo).
Para exemplificar, hoje atuo como cientista de dados no ramo de gestão de incêndios florestais. Esta é uma área que tem como objetivos a detecção precoce, o combate eficiente e a prevenção. Neste ramo, os tipos de dados trabalhados são numéricos/categóricos e imagens.
Sendo assim, a detecção de objetos (item 7 do Data Tree) participa de uma das etapas mais importantes, a detecção precoce, podendo ser em imagens de câmeras e/ou satélites. A partir dela, a brigada chega ao combate no início do incêndio, quando a força humana e os recursos ainda não são demasiados.
“Mas o que o entendimento dos dados tem a ver com isso?”
Para se alertar corretamente casos de fumaças de risco, precisa-se treinar um modelo estatístico para reconhecer os padrões existentes naquele fenômeno e isso só é possível através do entendimento de padrões de cor e forma atrelados a metadados como confirmações de ocorrências, meteorologia e até dados geográficos do local.
Nesse caso fica fácil de compreender o ganho né? Um modelo mais preciso resulta em um combate ligeiro e na economia de gastos com recursos, pessoal, área produtiva queimada e o mais importante: a vida.
Sobre o Autor: João Pedro Soutto
Olá! Sou João Pedro Soutto, Cientista de Dados especializado em aplicações de Visão Computacional no mundo real.
Atualmente, trabalho como Cientista de Dados, com foco na detecção precoce de incêndios florestais. 🔥
Sou apaixonado por solucionar problemas através de código e dados, contar histórias por meio da comunicação e pela liberdade de criar soluções inovadoras. ❤︎
Conecte-se comigo: