Antes de começarmos, saiba que, este artigo é uma releitura deste artigo da revista Harvard Business Review, de 2012: Data Scientist, the sexiest job of the 21st Century.
Vamos lá:
Você já parou para pensar quantas coisas ao seu redor utilizam ciência de dados para gerar resultados personalizados e recomendações para você?
Com a evolução tecnológica e a popularização da internet das coisas em expansão, o trabalho de um cientista de dados se torna cada vez mais importante. Hoje vou te contar uma história e nela você perceberá por que a ciência de dados é a carreira mais sexy do século XXI.
A observação de um problema
Em junho de 2006 Jonathan Goldman começou a trabalhar no LinkedIn. Nessa época a empresa tinha pouco mais de 8 milhões de usuários e sua estrutura ainda parecia a de uma startup em fase inicial.
Tudo acontecia de maneira rápida, a empresa crescia bastante, mas seus engenheiros ainda não sabiam como as pessoas poderiam se conectar dentro da rede social.
A estratégia de convidar um novo amigo para se tornar membro da rede social estava dando muito certo, no entanto, os usuários não estavam procurando conexões com as pessoas que já estavam na plataforma com a rapidez de crescimento que a diretoria esperava.
Isso gerava um descontentamento com a experiência do usuário e logo na primeira entrega de valor, os early adopters, “novatos” na rede social deixavam de utilizar a plataforma, com pouco tempo de uso, prejudicando a retenção de usuários no Linkedin, pela falta de interatividade de novos usuários entrantes na plataforma, que por sua vez, tinham dificuldade de encontrar suas conexões da "vida real" lá.
Algumas pessoas relataram que a experiência que se tinha na plataforma do Linkedin era como se as pessoas tivessem ido à uma grande conferência, e ao chegar lá e perceberam que não conheciam ninguém. Como se algumas pessoas poderiam até tentar ficar, pedir uma bebida, desconcertados no canto, mas logo logo iriam sair de lá... Percebeu-se que as pessoas precisavam se conectar na plataforma, algo natural da vida humana, precisa se refletir na realidade da rede social.
Percepção de uma oportunidade
Goldman, que era PHD em física, ficou intrigado com essa situação. Como uma rede social desse porte ainda não possui nenhum mecanismo que faça a ponte para a conexão entre pessoas conhecidas?
Ao observar o problema de retenção de usuários e da principal métrica OKR de uma Rede Social, o MAU e o DAU, Monthly Active Users e Daily Active Users, respectivamente, e percebeu que essa dor tinha origem na falta de conexão entre as pessoas, ele começou a elaborar hipóteses sobre como poderia se resolver este problema.
Ele procurou padrões de comportamento explorando o dataset, que o permitisse prever em que situações as pessoas poderiam se conhecer através da rede social e como provocar essas situações poderiam melhorar sua experiência.
Na época os outros engenheiros do LinkedIn não deram uma resposta positiva para essa ideia e logo rejeitaram o experimento de Goldman.
Ainda sim, ele acreditava que incentivar ações que pudessem conectar as pessoas com seus conhecidos seria uma solução para aumentar o engajamento dos usuários com a rede social, apesar de ainda não saber exatamente como...
Se o amigo ainda não tivesse cadastro no LinkedIn, o novo usuário poderia enviar um email convidando-o a participar. O famoso referencial. Modo como as redes sociais sempre cresceram por boas práticas de mercado, através da indicação de pessoas conhecidas e amigos.
Sabendo disso, os outros engenheiros não viam sentido nas teorias de Goldman e estavam preocupados em abrir novos canais de aquisição que fossem escaláveis com o objetivo de atrair novos usuários para a plataforma, invés de aumentar a retenção daqueles já cadastrados.
O início de um sonho
Por sorte, Reid Hoffman, então co-fundador CEO do LinkedIn e agora presidente executivo, sabia que a análise de dados era fundamental para tomada de decisões de negócio. Por ter vivenciado uma experiência positiva no PayPal onde a análise de dados era o principal diferencial das decisões de sucesso, Hoffman deu grande autonomia para Goldman trabalhar.
Logo o primeiro teste foi para o ar. Goldman queria saber o que aconteceria se as pessoas encontrassem outras pessoas que talvez já conhecessem na vida real. Talvez por motivos de haverem trabalhado na mesma empresa na mesma época ou tivesse estudado nas mesmas escolas ou faculdades.
O cruzamento destes dados poderia ser a chave para fazer com que as pessoas se conectassem mais com outros usuários na rede, encontrando sua rede de contatos, ou network lá dentro. Sendo assim, ele criou uma funcionalidade, capaz de apresentar as três melhores novas conexões no Linkedin que tivessem algo em comum com estes usuários.
Num segundo momento, Goldman refinou os anúncios um pouco mais e aplicou o que ele chamou de teoria da triangulação. A lógica dela partia da premissa que “Se você conhece João e Maria é possível que João e Maria se conheçam”.
Partindo da teoria da triangulação, Goldman e sua equipe fizeram uma modificação na forma com que as pessoas respondiam às sugestões de novas pessoas para se conectar. Essa mudança permitia que o usuário respondesse a sugestão com apenas 1 clique.
Não demorou muito para que os principais gerentes do LinkedIn reconhecessem uma boa ideia e a tornassem um recurso padrão. Foi quando as coisas realmente decolaram por lá.
Os anúncios “People You May Know” alcançaram uma taxa de cliques 30% maior do que a taxa obtida por outros prompts para visitar mais páginas do site.
Eles geraram milhões de novas visualizações de página. Graças a esse recurso, a trajetória de crescimento do LinkedIn mudou significativamente para cima. He had growth hacked it.
A importância de um Cientista de Dados
No processo explicado acima, Goldman uma as ferramentas de análise de dados para observar as informações, criando hipóteses, prevendo comportamentos e construindo algoritmos de recomendação para otimizar a experiência do usuário na plataforma, aumentar a retenção e engajamento deles na rede social, e hackear as taxas de crescimento do negócio com insights e decisões orientadas por dados.
O título de cientista de dados não é muito antigo, ele foi cunhado em 2008 por DJ Patil e Jeff Hammerbacher, líderes de engenharia de dados no Facebook e LinkedIn, respectivamente.
Hoje é possível ver que muitas empresas estão em busca desse profissional para “colocar ordem na casa”, estruturando os dados, e usando análises de grandes quantidades de dados, para ganhar vantagem competitiva, otimizar as métricas chave do business e dirigir o crescimento do negócio.
No entanto, existe pouca mão de obra qualificada disponível no mercado e com isso as empresas oferecem bons salários e benefícios para esse profissional. É a lei da oferta e procura!
Para ter noção da falta de profissionais disponíveis no mercado, a própria Greylock Partners, empresa que investiu em empresas gigantes como o próprio Facebook e LinkedIn montou uma equipe exclusiva para encontrar e formar cientistas de dados no mercado.
Como avaliar um bom Cientista de Dados?
A contratação cientistas de dados não é tarefa fácil. Os recrutadores devem ter um radar apurado para a seleção desses profissionais, e tech recruiters de todas as partes do mundo, mesmo sendo profissionais de Recursos Humanos, buscam cada vez mais compreender de tecnologia, para "falar a mesma língua" que os candidatos. Saber de tecnologia, mesmo que conceitualmente é fundamental para ter assertividade na contratação de cientistas de dados.
Ciência de Dados, nas grandes empresas de tecnologia, contam com times inteiros de vários profissionais, cada um com sua respectiva habilidade e especialização, como por exemplo: Engenheiro de Dados, Analista de Dados, Analista de Negócios, Cientista de Dados, Estatístico, Engenheiro de Machine Learning. Tudo isso fica dentro do guarda-chuva de Data Science.
O sucesso desse profissional, depende da maturidade da empresa com o assunto, infra-estrutura de tecnologia, mão de obra qualificada, e uma cultura orientada por dados.
Sendo assim, é muito importante ter claro, quais as expectativas para o trabalho de um cientista de dados em qualquer empresa:
- Qual são as expetativas, responsabilidades e metas do Cientista de Dados?
- Por que busca-se investir em ciência de dados? O que se busca otimizar?
- Temos a infra-estrutura tecnológica para viabilizar o trabalho de um cientista de dados?
- Devo terceirizar ou devo internalizar esse profissional?
- Preciso de um profissional mais senior ou um júnior já me atende?
- Quais etapas do processo de ciência de dados domina essa profissional?
- Quais métodos de análise de dados são os mais apropriados para resolver X problema?
Essas são algumas perguntas que os grandes negócios devem se fazer antes de começar a procurar esse profissional.
Qual o papel do Cientista de Dados?
O Data Scientist deve mergulhar nos dados para fazer descobertas importantes para inteligência do negócio. Ele deve receber os dados tratados e organizados para construção de algoritmos, compreender como as variáveis chave se relacionam, entender do domínio do mercado e como os dados estão armazenados e estruturados naquela companhia.
Junto do cientista de dados, o analista de negócios ou de dados é o responsável por encontrar as respostas mais assertivas e apresentá-las à equipe, auxiliando na tomada de decisão orientada por dados, exercendo um papel extremamente estratégico e próximo da alta gestão. Essa informação vai contribuir para encontrar a decisão mais ótima.
Além do lado técnico, o Cientista de Dados precisa ser criativo no momento de apresentação dos dados de uma forma atraente e bem explicativa. As empresas procuram cientistas de dados, que não dominam apenas as hard skills de programação e análise de dados, mas também as soft skills de comunicação e storytelling para dar vida aos dados e contar uma história clara e objetiva que simplifique a descrição da realidade para qualquer um que não seja da área ter facilidade de compreender seus relatórios.
Em algumas empresas, com alto nível de maturidade em ciência de dados, já ocorreu desses profissionais construírem e refinarem suas próprias ferramentas para trabalhar com os dados.
Esse foi o caso do Yahoo que até fez uma pesquisa no estilo acadêmico para melhorar sua plataforma, o Facebook também criou uma linguagem Hive para trabalhar com a programação de projetos Hadoop, uma das tecnologias mais sofisticadas e populares entre as grandes empresas de tecnologia quando se trata de Data Science.
Este profissional conta com um mix de características ligadas a comunicação, consultoria, programação, análise de dados, matemática e estatística.
Ciência de dados, programação e ciências da computação
É através da programação que o cientista de dados irá usufruir do poder computacional ligado a fórmulas matemáticas e estatísticas para construir algoritmos complexos e extremamente funcionais que antigamente, se fazia na mão. - na munheca mesmo! rsrs
Dentre as linguagens de programação mais famosas no mercado hoje, são:
Banco de dados:
- Postgres
- MySQL
- SQLServer
- MongoDB
- Oracle
- Cassandra
Ferramentas de Análise de Dados:
De onde vem o nome "Cientista de Dados"?
Uma das características que precisa existir no DNA desse profissional é a curiosidade. Já pensou se o Goldman, lá do LinkedIn, deixasse seus questionamentos de lado para seguir o mesmo caminho dos outros engenheiros de software?
Talvez a rede social não tivesse o crescimento que teve depois da otimização realizada por Goldman para conectar os usuários na plataforma. Talvez o Linkedin não fosse o gigante que é hoje...
Data is new oil. Quem tem mais informações tem vantagem. Por isso, quem sabe trabalhar bem os dados que possui, sai na frente da concorrência. Num mundo que vivemos, na era da informação e com velocidade e volume que os dados são produzidos, é dito que dados são o novo petróleo, em comparação à um dos bens mais valiosos do século XXI, agora, para o nosso século, dados vieram para mudar esse paradigma, não é atoa que as maiores empresas do mundo (e não coincidentemente são algumas das mais novas também) são empresas de tecnologia.
No meio digital, o mesmo acontece, a diferença é que em vez de componentes biológicos, como o petróleo, a matéria prima utilizada na ciência de dados são dados tecnológicos.
Bônus: Estudo de Caso
Um bom exemplo de como data science pode gerar uma vantagem competitiva no mercado, foi a situação onde alguns cientistas de dados estavam tentando resolver um problema complexo: O de como detectar fraudes em compras de cartões de crédito.
Por curiosidade, um dos cientistas de dados do time, tinha um background, o qual havia se formado em biologia na faculdade, em meio à um dos seus dias de hobby, estudando biologia, ele descobriu por acidente que o problema de detecção de fraude era completamente análogo à um tipo específico de sequenciamento de DNA, e juntando esses dois mundos, que inicialmente, não têm absolutamente nada a ver um com outro, criou uma solução capaz de detectar outliers no comportamento de compras online com cartão de crédito e reduzir drasticamente reduzir prejuízos causados por compras fraudadas.
Como o Mercado se comporta?
Poucos profissionais, normalmente os melhores, possuem soft skills necessárias para ocupar cargos de liderança, enquanto as hard skills, habilidades básicas para todos podem ser treinadas edesenvolvidas, dificilmnte as soft skills vão.
A técnica é possível de ser passada e mais fácil de ser aprendida, mas o comportamento pessoal de cada um, é um pouco mais difícil de ser ensinado.
Algumas instituições já perceberam essa necessidade e lançaram alguns programas de treinamento que unem o desenvolvimento tanto de habilidades técnicas, quanto comportamentais a fim de formar um profissional completo e desejado no mercado. Afinal de contas, a true data scientist, precisa ter fortes habilidades de comunicação, storytelling e persuasão.
Bootcamp de Ciência de Dados
A origem do nome bootcamp se deu no serviço militar, quando os soldados eram desafiados a participarem de um treinamento imersivo e intensivo.
Essa metodologia temo intuito de proporcionar experiências imersivas de aprendizagem. Através da vivência, prática e repetição, busca-se assimilar grandes quantidades de conteúdo em curtos períodos de tempo. É dito, de acordo com o livro “Fora de Série” que você precisa praticar uma tarefa, no mínimo 10 mil horas para se tornar um especialista. No bootcamp da Le Wagon, você terá uma carga horária de 500 horas, um bom ponto de partida para começar a engatar suas habilidades e ingressar no mercado de trabalho!
Outra característica relevante é o tempo, enquanto as graduações, cursos técnicos e intensos duram de 2 a 5 anos, os bootcamps duram entre 9 a 24 semanas. A diferença aqui é que na academia, você é exposto a muita teoria, e os formandos, e também os empresários e recrutadores, constatam que os alunos não vêm bem preparados para o mercado de trabalho. Já no bootcamp, você tem um aprendizado rico de práticas, desde o day 01, botando a mão na massa, com um aprendizado hands on.
Isso só é possível porque os bootcamps são focados no desenvolvimento de habilidades técnicas, como por exemplo, as de data science, que inclusive, não tem um bacharelado oficialmente em nenhuma parte do mundo ainda... É possível encontrar formação em ciência de dados em academias e universidades sim, mas é mais comum encontrar isso em mestrados ou MBAs que adotam data science mais como uma metodologia e não um objeto de estudo em si.
Como escolher a empresa ideal para se trabalhar?
Dentre as diferentes vagas disponíveis no mercado, escolher a mais adequada ao seu perfil é uma tarefa bem difícil. Uma dica que eu posso dar é verificar qual das ofertas apresentam os melhores desafios em Big Data, para que você tenha margem para se desenvolver.
Startups não costumam ter as remunerações mais altas do mercado, mas são ótimos lugares para oportunidades de crescimento rápido.
Fazendo essa observação e colocando esses contrapesos na balança você poderá escolher a oferta que vai te trazer satisfação quanto profissional, assim como ser bem remunerado por isso.
Além do emprego formal, hoje existem outras modalidades de prestação de serviços como consultoria. Você pode prestar consultoria para diferentes empresas e ser bem remunerado por isso, no entanto essa área é bem exigente e recomendo que antes de ingressar nesse trabalho você adquira o máximo de experiência possível.
A principal diferença entre um cientista de dados que atua como consultor de uma pessoa que trabalha internamente na empresa é que o consultor deve orientar os clientes no desenvolvimento de projetos únicos onde os objetivos estejam claros, ele deve entregar toda a estrutura para responder os principais questionamentos do cliente utilizando os dados como base.
Conclusões: Busque sua liberdade
Voltando ao Goldman, profissional do LinkedIn que falamos no início do texto, já pensou se o Hoffman tivesse limitado seu trabalho ou descrevesse exatamente o que ele deveria fazer? Com certeza a escalabilidade do LinkedIn poderia ter demorado muito mais.
É assim que os programadores que trabalham com ciência de dados devem ser tratados. Eles precisam de liberdade para analisar, observar e criar soluções criativas.
Estes profissionais, geram valor para o seu trabalho não apenas apresentando relatórios complexos, mas construindo soluções viáveis e atraentes para determinado negócio, e têm o objetivo de otimizar processos, produtos e enfim receita e lucro da empresa, conectando métricas e indicadores de negócio com os indicadores financeiros da companhia, construindo a engenheira de crescimento e a inteligência de negócio com uma cultura orientada por dados.
Mantenha suas habilidades afiadas
Vivemos num mundo VUCA: Vulnerável, Incerto, Complexo e Ambíguo. Embora isso esteja mudando devido a facilidade de relacionamento virtual, esse ainda é um desafio. Aqui vai mais uma recomendação para você que quer se destacar no mercado: participe de comunidades.
Elas vão permitir que você consiga otimizar seus conhecimentos a respeito de programação voltada para data science. Compartilhar conhecimento, principalmente no mundo e mercado de tecnologia é o que torna o crescimento e desenvolvimento dessas áreas tão dinâmico e exponencial. Não tenha medo de ensinar o que você sabe para seus colegas, e também de pedir ajuda para aprender com eles.
Ciência de Dados: A profissão mais sexy do Século XXI
“O trabalho atraente nos próximos 10 anos será o de estatísticos. As pessoas pensam que estou brincando, mas quem poderia imaginar que engenheiros de computação seriam o trabalho sexy da década?”. Essa frase foi dita por Hal Varian, economista-chefe do Google.
Nessa frase a palavra sexy significa a mais buscada da década. De fato essa profissão é uma das mais atraentes no mercado atual.
Em 2017 a
IBM lançou um relatório onde eles previam o crescimento quase 9x maior no número de posições para cientistas de dados nos Estados Unidos em 2020.
Segundo o LinkedIn, em 2019, data science era o cargo mais promissor nos Estados Unidos. Embora o Brasil ainda não esteja num nível de maturidade tão elevado quanto nosso vizinho da América do Norte, o crescimento pela busca desse profissional em território nacional também segue em alta.
No
Google Trends o termo “Ciência de Dados” aumentou em mais de 50% em 3 anos e com a
transformação digital nas empresas acelerada pelo Covid-19 a tendência é que esse número cresça ainda mais nos próximos anos.
O fato é que a tecnologia não dá sinais de desaceleração, milhões de dados serão produzidos a mais do que os dias de hoje. Com isso, as empresas que já enxergaram essas oportunidades estão na frente de seus concorrentes, e nós da Le Wagon, acreditamos, que todas as empresas, de big corporates à small business, vão precisar de contratar cientistas de dados. (bom, pelo menos adotar culturas mais orientadas à dados, em detrimento de gerir companhias orientadas por feelings e achismos)...
Para todas as empresas que querem surfar essa onda e sair na frente: Vocês precisam de um cientista de dados no seu negócio.
Quer seguir a carreira mais sexy do século XXI? Inscreva-se no bootcamp de data science da Le Wagon. A inscrição é gratuita e você pode fazer online.
Basta clicar aqui!