Portfólio Data Science como construir um?

Veja qual é o caminho a seguir quando se quer criar um Portfólio Data Science para alavancar a sua carreira de cientista de dados, esta pílula pertence ao evento CONACD e foi apresentada pelo palestrante Meigaron responsável pelo curso “Data Science em produção“.

Como construir um portfólio de projetos em data science

Nem todo projeto é considerado de Portfólio Data Science.

Vou explicar para você a diferença.

Existem basicamente dois tipos de projetos dentro da ciência de dados, tem os projetos de estudo e tem os projetos de portfolio. Os projetos de estudos são aqueles projetos com dados mais simples que você usa para fixar conhecimento, então usamos esses projetos para validar uma teoria ou para validar o entendimento de alguma coisa que você estudou para ver o comportamento específico de algum algoritmo.

São projetos auxiliares, projetos que ajudam no seu estudo e ajudam, claro, a validar o seu conhecimento e validar seu aprendizado, por outro lado, o projeto de portfólio são projetos com dados mais complexos, dados mais próximos dos dados reais de uma empresa, ou seja, a necessidade de muita limpeza, muita preparação, muito extração, precisa entender tudo do negócio para você poder interpretar suas variáveis de uma forma geral, são dados mais complexos.

Outra característica do seu portfólio é que ele precisa ter um objetivo de negócio.

Porque estudar ciência de dados.

Esta é uma profissão que é muito fácil você se apaixonar pela ferramenta, é muito legal ver o modelo fazendo predições, só que a gente precisa entender que a acessibilidade nasceu para resolver problemas, para usar toda essa massa de dados, entre traduzir isso em conhecimento, para gerar soluções para o negócio e aumentar o faturamento, diminuir custo, ou seja, otimizar algumas ações dentro da empresa tem uma diferença grande.

Então a gente não pode se perder na ferramenta, nós temos que ser apaixonados por resolver problemas e não pelas ferramentas que a gente utiliza, esse objetivo de negócio é aquilo que você quer resolver, o problema que você está se propondo a resolver com o seu projeto.

Você vai criar qualquer impacto financeiro dessa solução nesse projeto de Portfólio Data Science.

Por mais que você não esteja dentro de uma empresa ainda assim é possível medir o impacto financeiro fictício para o seu projeto de portfólio, e esse é o terceiro item que eu coloco aqui, você precisa ter um resultado financeiro. Você precisa saber traduzir a performance no seu algoritmo numa performance financeira, então setenta por cento de acurácia no modelo quando isso representa de ganhos financeiros para a empresa, porque essa é a primeira pergunta que vão te fazer quando você está trabalhando profissionalmente, você vai chegar lá para o seu chefe, vai chegar lá dentro de uma reunião com muitas pessoas de negócios.

Eles vão falar que não entendem nada do que você faz.

Você vai apresentar um projeto todo orgulhoso que você chegou num modelo com 70% se superou nessa acurácia, mas quanto que a gente ganha com esses setenta por cento de segurança, quanto que isso vai reduzir de custos ou vai aumentar de receita incremental no final do mês?

Não precisa que você saiba fazer essa tradução.

A performance de modelos para a performance de negócios, produtos fora de seu projeto de portfólio precisa ter esse elemento precisa ter esse valor monetário de quanto o modelo vai trazer. Ele pode ser fictício. A gente pode criar cenários aqui dentro desse projeto, mas ele precisa ter essa característica para ter esse retorno financeiro estimado do seu projeto.

Outra característica de um projeto de Portfólio Data Science é demostrar uma metodologia de criação, ou seja, você precisa ter passos bem definidos para construir esse projeto, esses passos precisam ser explicados. Então, porque existe passo? Porque tem que ser o passo dois, e não o passo três. Porque assim você tem uma metodologia de criação de projetos, essa metodologia organizada vai te ajudar também no seu histórico, que é basicamente um processo onde você mostra para as pessoas, como que você criou o seu modelo, quais foram as sanções que você fez para criar esse modelo?

Sob quais condições ele funciona? Como que as pessoas fazem para utilizar esses resultados do seu modelo para tomar decisões de alavancar ainda mais os resultados de negócio? Então, basicamente são esses dois tipos de projetos em ciência de dados e as características de cada um deles, é muito importante você saber essa definição para você não colocar projetos de estudo dentro do seu Portfólio Data Science.

Porque quando você tiver no processo seletivo e as pessoas perguntarem dos seus projetos, não podemos mostrar projetos de estudo para elas, ao invés de projetos de Portfólio, ao invés de você demonstrar que você conhece que você domina esse campo e consegue resolver problemas utilizando essas teorias, você vai demonstrar que você ainda é um estudante.

Então é importante você ter essas duas definições de projetos da sua cabeça, por exemplo, os projetos de estudos que são muito claros dentro desses projetos de ciência de dados existe alguns super batidos, basicamente ter as características de três tipos de flores, que são as medições. Esse é um tipo de conjunto de dados que você usa para validar o seu conhecimento para testar novos algoritmos, para ver se você entendeu determinada teoria.

Outro objeto de estudo é o famoso Titanic, eu vejo muitos portfólios de projetos onde a pessoa me apresenta um projeto do Titanic.

Eu falo para ela que tem um zilhão de soluções, praticamente todo mundo cria uma solução para esse projeto e falta muitas muitas características para ser considerado um projeto de portfólio, como por exemplo, qual é o problema está tentando resolver, é claro, também claro que é prever quando as pessoas vão sobreviver, mas não tem a questão do negócio.

A questão do retorno financeiro aqui dentro de mim não é mais um projeto para você validar o seu conhecimento, um terceiro projeto também é famoso, mostra ao desperdício DE DATA SETS onde você tem algumas características de algumas casas, alguns preços de venda dessas casas também não é um problema de portfólio. Sendo um projeto super batido onde tem muitas soluções e ainda falta alguns elementos, como, por exemplo a questão de negócios, outra, a tradução da performance.

Quanto essa solução vai trazer em termos financeiros, para o negócio?

Tá bom, Então esses são os projetos que ajudam muito mas em termos de você aprender, não em termos de demonstrar sua capacidade de resolver problemas, mas me fala os exemplos de projetos de forma que eu posso trabalhar, um exemplo: você fazer a predição de doenças cardiovasculares, então criar um modelo de classificação onde ele consegue classificar alguns resultados, alguns dados de clientes para saber se aquele cliente tem uma doença cardiovascular ou não.

Outro exemplo você fazer detecção de fraudes, através das transações financeiras realizadas na internet ou outro meio, você tem que definir se cada transação pode ser fraudulenta ou não. Por exemplo, você fazer a predição de higiene, ou seja, a identificação dos clientes que estão dentro de um período considerado de inatividade.

Então existem duas formas que as empresas comumente consideram o cliente. A primeira forma é quando a empresa tem um produto que funciona por contrato, então você tem essa operadora telefônica, você tem um contrato com ela que geralmente é de um ano depois que esse ano termina você pode mudar.

Portfólio Data Science
Cena do workshop

Constatar que você pode não querer renovar, que ele contrate outra operadora ou você pode renovar o contrato com a mesma operadora. Se você decidir renovar, ao contrário, você decidir não renovar o contrato e pela outra operadora para que ela, aquela operadora de telefonia que você estava. Você é um cliente em Churn, ou seja, um cliente que parou de consumir o produto daquela empresa.

Outro cenário é quando você não trabalha com um contrato, como por exemplo, você tá sempre comprando roupas ou comprando eletrodomésticos, eletrônicos, e aí para esse tipo de problema para esse tipo de empresa, eles consideram o cliente inativo quando o cliente fica sem comprar um período, fica por um período sem gastar nada na sua empresa, seja sem comprar nenhum produto seu e a esse período, você que decide baseado de algumas análises, baseado também no ciclo de negócios da empresa.

Então, por exemplo, uma empresa, ela pode considerar uma pessoa inativa se ela passa noventa dias sem fazer uma nova compra, imagina que se comprar um celular, por exemplo, você passou mais de noventa dias sem comprar qualquer outro produto dentro dessa empresa, segundo esses critérios dessa empresa você pode criar um modelo que, baseando algumas características de compra e do cliente, esse modelo prevê se o cliente vai entrar ou se vai continuar com você.

No primeiro cenário, ele vai renovar o contrato com a empresa. No segundo cenário, se ele vai fazer uma compra de novo.

Estes tipos de projetos são ótimos para seu portfólio.

Quer ter acesso ao conteúdo completo? clique no link abaixo:

Deixe um comentário

O seu endereço de e-mail não será publicado.