Como aprender com um cientista de dados: as habilidades técnicas mais procuradas

Quais conhecimentos técnicos estão se tornando mais populares entre os empregadores e quais estão perdendo sua popularidade.

imagem

No meu artigo original em 2018 , analisei a demanda por habilidades comuns - estatística e comunicação. Também observei a demanda por Python e a linguagem de programação R. A tecnologia de software muda muito mais rapidamente que a demanda por habilidades gerais, portanto, incluo apenas tecnologia nesta análise atualizada. Pesquisei

palavras-chave que apareciam nas listas de empregos da Data Scientist nos EUA em sites como SimplyHired , Indeed , Monster e LinkedIn. Dessa vez, decidi escrever um código para examinar todas as listas em vez de pesquisar manualmente. Essa decisão foi muito bem-sucedida para SimplyHired, Indeed e Monster. Eu usei Requests and Beautiful Soup da biblioteca HTTP Python. Você pode ver o código com a análise no meu relatório no GitHub .

Passar pelo LinkedIn acabou sendo muito mais difícil. Você deve passar pelo processo de autorização para visualizar o número exato de listagens de empregos. Decidi usar o Selenium para visualizar páginas sem uma interface gráfica do usuário. Em setembro de 2019, o Supremo Tribunal dos EUAvenceu o caso contra o LinkedIn, permitindo limpar os dados do site. No entanto, não consegui acessar minha conta após várias tentativas de login. Talvez esse problema tenha surgido devido aos limites de velocidade. Atualização: ainda consegui efetuar login, mas tenho medo de que eles me bloqueiem quando eu tentar novamente.

Aliás, a Microsoft é dona do LinkedIn, a Randstad Holding é dona da Monster e a Recruit Holdings é dona da Indeed e da SimplyHired.

De qualquer forma, os dados do LinkedIn não forneceram uma comparação precisa do ano anterior com o presente. Neste verão, notei grandes flutuações ao procurar emprego na área técnica. Suponho que talvez eles tenham experimentado um algoritmo de busca usando processamento de linguagem natural. Pelo contrário, aproximadamente o mesmo número de vagas para 'Data Scientist' apareceu em outros sites nos últimos dois anos.

Por isso, excluí os resultados do LinkedIn 2019 e 2018 deste artigo.

Para cada site de pesquisa de emprego, calculei a porcentagem do número total de anúncios de emprego para cientistas de dados em que a palavra-chave apareceu. Em seguida, calculei a média dessas porcentagens em três sites para cada palavra-chave.

Explorei manualmente novas pesquisas e revi as mais promissoras. Nenhum dos novos pedidos atingiu uma média de 5% na lista de 2019; Abaixo você verá o resultado da seleção.

Vai!

resultados


Há pelo menos quatro maneiras de visualizar os resultados para cada palavra-chave:

  1. Divida o número de anúncios de palavras-chave pelo número total de consultas que incluem um "cientista de dados" em cada site de pesquisa de emprego para cada código. Em seguida, calcule a média dos três sites. É esse processo que eu descrevi anteriormente.
  2. 2018 2019 .
  3. 2018 2019 .
  4. . .

Vejamos as três primeiras opções usando histogramas. Depois, mostrarei uma tabela com dados e discutiremos os resultados.

Então, aqui está um gráfico com o primeiro parágrafo para 2019. Podemos ver que o Python aparece em quase 75% dos anúncios.

imagem

Abaixo está um gráfico com o segundo parágrafo, mostrando adições e reduções em termos da porcentagem média de anúncios entre 2018 e 2019. AWS cresceu 5% pontos. Em média, em 2018, apareceu em 14,6% dos anúncios, enquanto em 2019 cresceu para 19,4%.

imagem

Aqui está um gráfico para o terceiro parágrafo, mostrando a variação percentual de ano para ano. O PyTorch cresceu 108,1% em comparação com a porcentagem média de anúncios em que apareceu em 2018.

imagem

Todos os diagramas foram compilados em Plotly. Se você quiser aprender a usar o Plotly para criar visualizações interativas, confira meu guia. Se você quiser dar uma olhada nos gráficos interativos, acesse o arquivo HTML no meu relatório no GitHub. Código com análise e visualização no mesmo local.

Abaixo, na forma de tabelas, estão as informações dos gráficos acima, classificadas pela alteração percentual na porcentagem média de anúncios de 2018 a 2019.

imagem

Entendo que tudo isso é um pouco confuso, então aqui está um pequeno guia para as informações na tabela.

  • Média de 2018 é a porcentagem média de anúncios desde 10 de outubro de 2018 de SimplyHired, Indeed e Monster.
  • A média de 2019 é igual à média de 2018, mas somente para 4 de dezembro de 2019. Esses dados são mostrados no primeiro dos três diagramas acima.
  • A mudança na média é a coluna 2019 menos 2018. Esta informação é do segundo dos três diagramas acima.
  • % Variação é a variação percentual de 2018 a 2019. Esses dados estão no terceiro gráfico.
  • Classificação de 2018 é uma classificação em relação a outras palavras-chave em 2018.
  • Classificação de 2019 é uma classificação em relação a outras palavras-chave em 2019.
  • Mudança de classificação é um aumento ou diminuição da classificação nesses dois anos.

O que podemos aprender com essas informações?


Mudanças significativas ocorreram em menos de 14 meses.

Vencedores


Python ainda está a cavalo. Essa é de longe a palavra-chave mais comum. Literalmente em três dos quatro anúncios. O Python cresceu decentemente desde 2018.

SQL é a nossa estrela em ascensão. Ele quase superou R na segunda maior média. Nesse ritmo, ele chegará em segundo lugar.

O maior crescimento foi demonstrado pelas estruturas de aprendizado profundo .

No PyTorch foi o maior ganho de palavras-chave. Keras e TensorFlowtambém mostrou sucesso. Keras e PyTorch subiram quatro degraus, TensorFlow - três. Observe que o PyTorch começou com uma média baixa e o TensorFlow médio ainda é duas vezes maior que o PyTorch. As

habilidades da plataforma em nuvem estão se tornando mais populares. A AWS apareceu em quase 20% dos anúncios, o Azure em cerca de 10% e subiu quatro etapas.

Estas são as tecnologias mais avançadas.

Perdedores


Nós R o maior declínio no valor médio. Essa descoberta não é muito surpreendente, dados os resultados de outros estudos . Python está muito à frente do R como uma linguagem de programação. Seja como for, R continua a ser muito popular, aparecendo em 55% dos anúncios. Não se desespere se você possui R, mas também pense em aprender Python se quiser obter uma habilidade mais exigida.

Muitos produtos Apache , incluindo Pig , Hive , Hadoop e Sparkperdem sua popularidade. O porco caiu cinco posições no ranking - muito mais em comparação com qualquer outra tecnologia. Spark e Hadoop ainda estão em alta demanda, mas com base nas minhas descobertas, você pode ver a tendência em direção às tecnologias de Big Data.

Os pacotes de software estatístico MATLAB e SAS são bastante perdidos em popularidade. O MATLAB caiu quatro linhas no ranking, enquanto o SAS caiu do sexto para o oitavo lugar. Ambos os idiomas mostram uma diminuição percentual significativa em comparação com a média de 2018.

Gorjeta


Existem muitas tecnologias nesta lista. Claro, você não precisa saber tudo. Não é de admirar que o mítico cientista de dados seja chamado de unicórnio.

Meu conselho é o seguinte: se você está começando a trabalhar nessa área, concentre-se nas tecnologias que estão sendo procuradas.

Concentrado.
No.
Estudando.
1.
Tecnologias.
Atrás.
Tempo.

(Esse é um excelente conselho, embora eu nem sempre o tenha seguido.)

Nessa ordem, recomendo estudar:

  1. Aprenda Python para programação geral.
  2. Pandas. , , data scientist Python Pandas Scikit-learn. Scikit-learn , Pandas . Pandas Matplotlib NumPy.
  3. Scikit-learn. «Introduction to Machine Leaning with Python».
  4. SQL .
  5. Tableau . , .
  6. . AWS – - . Microsoft Azure – . , Google Cloud, . , Google Cloud, , Data Engineer Google Cloud.
  7. . TensorFlow. «Deep Learning with Python» Keras . Keras TensorFlow, . PyTorch . , .

Estas são minhas dicas gerais de aprendizado. Adapte-os aos seus objetivos ou martelo e faça o que quiser.



imagem
Aprenda os detalhes de como obter uma profissão procurada desde o início ou suba de nível em habilidades e salário fazendo cursos on-line SkillFactory:



Consulte Mais informação



All Articles