Data Science não é Estatística 2.0

Resumo de uma discussão em grupo de cientistas de dados (iniciantes e seniors), a pauta estava girando em torno da conceitualização do trabalho de cientista de dados, suas vertentes, desafios e profissionalização a partir de um post no Linkedin.

Os nomes dos debatedores não serão divulgados porém os pontos conversados e as conclusões estarão transcritas de modo intacto.

Opinião 1

A grande questão é que não dá pra diminuir a importância tanto do conhecimento computacional quanto do conhecimento estatística pra se fazer ciência de dados. Conheço muita gente que saiu de TI pra trabalhar com “data science” mas que no fundo, só roda algoritmo e não entende uma única vírgula dos conceitos por trás do que tá fazendo. Qualquer modelo de machine learning tem um profundo desenvolvimento matemático e estatístico que permitiu que ele exista. A maior prova que a maioria dos profissionais ignora esses conceitos é a forma que perpetuamos a própria seleção de parâmetros dos modelos na base da tentativa e erro.

Ignorar a importância do domínio estatístico, computacional, da capacidade de comunicação e transformação de dados em insights é construir uma carreira míope em ciência de dados.

Opinião 2

Data science é multidisciplinar.

O profissional de estatística naturalmente vai ver maior importância na sua área, assim como o profissional de negócios vai dizer que o maior desafio é aplicar a técnica para resolver problemas reais de negócio, ao mesmo tempo que o profissional de TI vai dizer que o maior desafio é fazer x coisa pra chegar ao resultado.

Opinião 3

Uma ciência essencialmente com o objetivo de responder perguntas, por isso o Science no nome.

Estatísticos são treinados para conduzir experimentos e ajustar modelos/algoritmos, cientistas da computação são treinados para criar/pensar na melhor estrutura de dados possível que garanta performance nas análises, segurança no acesso, etc e a pessoa do negócio tem uma visão estratégica sobre quais são as perguntas fundamentais que devem ser priorizadas.

Não consigo ver nenhum dos 3 atuando sozinho, querer uma única pessoa que saiba bem tudo é irreal ( ou na melhor das hipóteses muito cara), pra mim existe sim uma carência de rigor sim, isso não inviabiliza o trabalho mas pra mim é evidente que temos muito a caminhar no sentido de criar um ferramental teórico que suporte um monte de regras de bolso que usamos na prática.

Opinião 4

Pelo ponto de vista de muitos empresários não importa se o cientista tem mestrado ou fez cursos pela internet, o resultado sendo positivo ele continua no trabalho se não der resultado é trocado, assim o próprio mercado absorve e faz a melhor seleção dos profissionais.

Pin It on Pinterest