How To
Porque o cientista de dados ser a profissão do século não é modinha
O cientista de dados é o profissional mais sexy do século 21. Entenda por que isto vai além de uma simples modinha.
Porque o cientista de dados ser a profissão do século não é modinha
BuscarPorque o cientista de dados ser a profissão do século não é modinha
BuscarO cientista de dados é o profissional mais sexy do século 21. Entenda por que isto vai além de uma simples modinha.
ProXXIma
31 de julho de 2020 - 5h47
Por Marcel Ghiraldini (*)
No longínquo ano de 2012, a Harvard Business Review dizia que o Cientista de Dados seria a profissão mais sexy do século 21, corroborando com a estimativa que os EUA teriam de 140.000 a 190.000 cientistas desta área até 2019 segundo a McKinsey.
Bom, podemos dizer que a previsão do volume destes profissionais estava um pouco inflada, mas absolutamente correta em relação à tendência e popularidade deste profissional (sim, é a profissão mais sexy do século 21). Mas esta tendência está muito além da óbvio de estarmos cada vez mais data driven, e está muito mais ligada a maneira de como estes profissionais colaboram entre si.
O cientista de dados
Esse profissional parece algo vindo do futuro, alguém capaz de analisar, interpretar, modelar e até transformar em arte visual um imenso volume de dados inicialmente desestruturados e que não para de crescer exponencialmente. Mas na verdade eles sempre estiveram na nossa história, e não são viajantes do tempo como na série Dark do Netflix (pelo menos não temos nada comprovado ainda).
Veja, historicamente, os dados nos quais as teorias científicas se baseavam eram frequentemente descritos em cadernos científicos individuais, que posteriormente poderiam ser perdidos para sempre, ou na melhor das hipóteses seria arquivado em alguma biblioteca local. Os paralelos a se fazer com os dias de hoje são inúmeros. A começar pelo dado em si.
As anotações do cientista não estão mais registradas apenas em um caderno que será perdido, e elas podem ser replicadas facilmente e atualizadas em tempo real para todos que têm acesso a este caderno.
A biblioteca onde o caderno foi arquivado não está presa a um local físico, e pode ser acessada de qualquer lugar do mundo pela nuvem. Este é o aspecto mais futurista do cientista de dados ao primeiro olhar.
A maneira como este dado está disponível para o cientista e como ele trabalha com isto! Uma equipe de cientistas pode organizar, modelar e trabalhar em cima de um mesmo dado para extrair resultados e interpretações que servirão para múltiplos propósitos.
O artigo “How do Data Science Workers Collaborate? Roles, Workflows, and Tools” conclui que não apenas os profissionais de ciência de dados colaboram extensivamente entre si, como eles desempenham uma variedade de funções e trabalham com uma variedade de partes interessadas durante os diferentes estágios do fluxo de trabalho do projeto de ciência de dados. Também foi verificado que as práticas colaborativas utilizando ferramentas envolviam o código e documentação de dados.
Mas não podemos esquecer também, que a inteligência artificial caminha a passos promissores e é amplamente utilizada para auxiliar os cientistas para validarem hipóteses, comportamentos e outras estatísticas.
Mas como é o cientista de dado moderno?
Entendemos que as competências dos cientistas de dados são constantemente atualizadas conforme novas tecnologias influenciam a maneira como esses dados são armazenados, consumidos, modelados etc. Atualmente, acreditamos que o que faz o cientista de dados ser mais sexy em relação a outros, é um conjunto de habilidades que listamos a seguir.
MATEMÁTICA – Claro, esta skill deve ser inerente a qualquer cientista de dados, especialmente quando falamos de estatística e álgebra linear.
CIÊNCIA DA COMPUTAÇÃO – Essencialmente programação e design de infraestrutura
SABER CONTAR UMA BOA HISTÓRIA – A capacidade de criar narrativas em torno de seu trabalho, integrando os resultados em uma história maior. Um cientista de dados deve ser capaz de fazer as perguntas certas. Essa habilidade é mais difícil de avaliar do que qualquer habilidade específica, mas é essencial. Os cientistas de dados são valorizados por sua capacidade de criar narrativas em torno de seu trabalho. Eles não vivem em um mundo abstrato e matemático; eles entendem como integrar os resultados em uma história que contemple todo o cenário. Acreditamos que este seja um caráter fundamental do cientista de dados moderno. Por meio de uma boa história, conseguimos engajar áreas, equipes e pessoas de C-level.
ENTENDER DE NEGÓCIOS – Esta é uma habilidade que julgamos muito coerente com o cenário atual. O “pensamento de empresário” já é uma skill muito valorizada em diferentes profissões e vista com bons olhos pelos recrutadores mais exigentes. Ora, se temos um cientista de dados capaz de realizar cálculos matemáticos, programar, contar uma história, conseguimos dar um Norte estratégico a todas estas habilidades se ele consegue entender o negócio ao qual está inserido. Um exímio analista de dados de uma área específica, pode não ter a visão necessária de que os dados que ele lida todo o dia, pode ser a solução que toda a diretoria está quebrando a cabeça para tentar encontrar e alavancar os resultados.
A inteligência artificial
Entre as competências dos cientistas de dados, talvez a mais futurista como comentamos no começo deste artigo, seja a de operar inteligências artificiais. Falamos aqui de modelos bem mais simples que uma SkyNet da franquia Exterminador do Futuro. Mas os modelos de inteligência artificial (IA) auxiliam na compreensão de tendências e entendimento dos dados, facilitando o trabalho dos cientistas de dados em alguns aspectos do seu cotidiano.
Por exemplo, as IAs estão ajudando bastante a prever o comportamento do consumidor, e estão cada vez mais conquistando espaço no marketing, elas podem inclusive serem utilizadas para construir modelos de análise Descritivos, Diagnóstico, Preditivo e Prescritivo.
Uma das técnicas para programação desses modelos se chama redes neurais, que como o nome sugere, imita a estrutura dos neurônios no seu funcionamento. Sem ficar técnico demais, é importante dizer que as redes neurais são organizadas em camadas com N neurônios e que, para problemas muito complexos como o reconhecimento de fotos, tendem a ser necessárias várias camadas de neurônios (por isso o deep que dá o nome da técnica deeplearning), mas isso demanda um poder de processamento que até poucos anos atrás simplesmente não estava disponível, o que nos traz a esse momento curioso onde até nossa geladeira da cozinha possui IA em alguma coisa.
O caminho natural do cientista de dados é moldar suas habilidades conforme a maneira de como os dados se organizam é alterada pela tecnologia disponível. Um profissional que precisa estar em constante evolução, e tende a continuar sendo o mais sexy por algumas boas décadas.
Fontes:
What Is Data Science? | autor Mike Loukides | Publicado por O’Reilly Media
Data Driven | autores D.J. Patil e Hilary Mason | Publicado por O’Reilly Media
The Fourth Paradigm: Data-Intensive Scientific Discovery | autores Tony Hey Stewart Tansley Kristin Tolle | Publicado por Microsoft Research
How do Data Science Workers Collaborate? Roles, Workflows, and Tools | autores AMY X. ZHANG, MICHAEL MULLER e DAKUO WANG | Publicado por ACM Journals
(*) Marcel Ghiraldini é VP da Math Marketing, Professor da ESPM & FIA, Diretor da Conectt e Mentor da ACE Startups.
Veja também
O que é e como funciona o advergaming
Até o final de 2030, os jogos para dispositivos mobile devem atingir um valor aproximado de US$ 272 bilhões, já tendo atingido US$ 98 bilhões em 2020
Publicidade digital chega a R$ 23,7 bi e segue em expansão
Anunciantes que investem em canais digitais cresceram 57%, mas setor ainda está em desenvolvimento, segundo especialistas