Cómo aprender de un científico de datos: las habilidades técnicas más buscadas

Qué conocimiento técnico se está volviendo más popular entre los empleadores y cuáles están perdiendo popularidad.

imagen

En mi artículo original en 2018 , analicé la demanda de habilidades comunes: estadísticas y comunicación. También analicé la demanda de Python y el lenguaje de programación R. La tecnología de software cambia mucho más rápido que la demanda de habilidades generales, por lo que solo incluyo tecnología en este análisis actualizado.

Busqué palabras clave que aparecieron en los listados de trabajo de Data Scientist en los EE. UU. En sitios como SimplyHired , Indeed , Monster y LinkedIn. Esta vez decidí escribir código para examinar todas las listas en lugar de buscar manualmente. Esta decisión fue muy exitosa para SimplyHired, Indeed y Monster. Usé Solicitudes y Beautiful Soup de la biblioteca Python HTTP. Puede ver el código con el análisis en mi informe sobre GitHub .

Pasar por LinkedIn resultó ser mucho más difícil. Debe pasar por el proceso de autorización para ver el número exacto de listados de trabajo. Decidí usar Selenium para ver páginas sin una interfaz gráfica de usuario. En septiembre de 2019, la Corte Suprema de los EE. UU.ganó el caso contra LinkedIn, lo que le permite borrar los datos del sitio. Sin embargo, no pude acceder a mi cuenta después de varios intentos de inicio de sesión. Quizás este problema surgió debido a los límites de velocidad. Actualización: todavía pude iniciar sesión, pero me temo que me bloquearán cuando vuelva a intentarlo.

Por cierto, Microsoft posee LinkedIn, Randstad Holding posee Monster y Recruit Holdings posee Indeed y SimplyHired.

En cualquier caso, los datos de LinkedIn no proporcionaron una comparación precisa del año anterior con el presente. Este verano, noté grandes fluctuaciones al buscar trabajo en el campo técnico. Supongo que tal vez experimentaron con un algoritmo de búsqueda utilizando el procesamiento del lenguaje natural. Por el contrario, aproximadamente el mismo número de vacantes para 'Data Scientist' ha aparecido en otros sitios en los últimos dos años.

Es por eso que excluí los resultados de LinkedIn 2019 y 2018 de este artículo.

Para cada sitio de búsqueda de empleo, calculé el porcentaje del número total de anuncios de empleo para científicos de datos donde apareció la palabra clave. Luego promedié estos porcentajes en tres sitios para cada palabra clave.

Exploré manualmente nuevas búsquedas y revisé las más prometedoras. Ninguna de las nuevas solicitudes alcanzó un promedio de 5% en la lista de 2019; A continuación verá el resultado de la selección.

¡Vamos!

resultados


Hay al menos cuatro formas de ver los resultados para cada palabra clave:

  1. Divida el número de anuncios de palabras clave por el número total de consultas que incluyen un "científico de datos" en cada sitio de búsqueda de empleo para cada código. Luego tome el promedio de los tres sitios. Es este proceso el que describí anteriormente.
  2. 2018 2019 .
  3. 2018 2019 .
  4. . .

Veamos las tres primeras opciones usando histogramas. Luego le mostraré una tabla con datos y discutiremos los resultados.

Entonces, aquí hay una tabla con el primer párrafo para 2019. Podemos ver que Python aparece en casi el 75% de los anuncios.

imagen

A continuación se muestra un gráfico con el segundo párrafo, que muestra adiciones y disminuciones en términos del porcentaje promedio de anuncios entre 2018 y 2019. AWS creció 5% puntos. En promedio, en 2018 apareció en el 14.6% de los anuncios, mientras que en 2019 creció al 19.4%.

imagen

Aquí hay un gráfico para el tercer párrafo, que muestra el cambio porcentual de año a año. PyTorch creció un 108,1% en comparación con el porcentaje promedio de anuncios en los que apareció en 2018.

imagen

Todos los diagramas fueron compilados en Plotly. Si desea aprender a usar Plotly para crear visualizaciones interactivas, consulte mi guía. Si desea echar un vistazo a los gráficos interactivos, vaya al archivo HTML en mi informe sobre GitHub. Código con análisis y visualización en el mismo lugar.

A continuación, en forma de tablas, se encuentra la información de los cuadros anteriores, ordenada por el cambio porcentual en el porcentaje promedio de anuncios de 2018 a 2019.

imagen

Entiendo que todo esto es un poco confuso, así que aquí hay una pequeña guía de la información en la tabla.

  • Promedio de 2018 es el porcentaje promedio de anuncios desde el 10 de octubre de 2018 de SimplyHired, Indeed y Monster.
  • El promedio de 2019 es el mismo que el promedio de 2018, solo que esto es para el 4 de diciembre de 2019. Estos datos se muestran en el primero de los tres diagramas anteriores.
  • El cambio en Promedio es la columna de 2019 menos 2018. Esta información es del segundo de los tres diagramas anteriores.
  • El% de cambio es el cambio porcentual de 2018 a 2019. Estos datos se encuentran en el tercer gráfico.
  • La Clasificación 2018 es una clasificación relativa a otras palabras clave en 2018.
  • 2019 Rank es una clasificación relativa a otras palabras clave en 2019.
  • El cambio de rango es un aumento o disminución en la calificación durante estos dos años.

¿Qué podemos aprender de esta información?


Se produjeron cambios significativos en menos de 14 meses.

Ganadores


Python todavía está a caballo. Esta es, con mucho, la palabra clave más común. Literalmente en tres de cuatro anuncios. Python ha crecido decentemente desde 2018.

SQL es nuestra estrella en ascenso. Casi superó a R en el segundo mayor promedio. A este ritmo, pronto vendrá en segundo lugar.

El mayor crecimiento fue demostrado por los marcos de aprendizaje profundo .

En PyTorch fue la mayor ganancia de palabras clave. Keras y TensorFlowTambién mostró éxito. Tanto Keras como PyTorch subieron cuatro escalones, TensorFlow, tres. Tenga en cuenta que PyTorch comenzó con un promedio bajo, y el TensorFlow promedio sigue siendo el doble que PyTorch. Las

habilidades de plataforma en la nube son cada vez más populares. AWS apareció en casi el 20% de los anuncios, Azure en aproximadamente el 10% y subió cuatro pasos.

Estas son las tecnologías más avanzadas.

Perdedores


Nos r el mayor descenso en el valor medio. Este descubrimiento no es muy sorprendente, dados los resultados de otros estudios . Python está muy por delante de R como lenguaje de programación. Sea como fuere, R sigue siendo muy popular, apareciendo en el 55% de los anuncios. No se desespere si posee R, pero también piense en aprender Python si desea obtener una habilidad más demandada.

Muchos productos de Apache , incluidos Pig , Hive , Hadoop y Sparkperder su popularidad Pig perdió cinco posiciones en el ranking, mucho más en comparación con cualquier otra tecnología. Spark y Hadoop todavía tienen una gran demanda, pero según mis hallazgos, puede ver la tendencia hacia las tecnologías Big-Data.

Los paquetes de software estadístico MATLAB y SAS están muy perdidos en popularidad. MATLAB cayó cuatro líneas en el ranking, mientras que SAS cayó del sexto al octavo lugar. Ambos idiomas muestran una disminución porcentual significativa en comparación con el promedio de 2018.

Propina


Hay muchas tecnologías en esta lista. Por supuesto, no necesitas saberlo todo. No es de extrañar que el científico de datos míticos se llame unicornio.

Mi consejo es el siguiente: si está comenzando a trabajar en esta área, concéntrese en las tecnologías que están en demanda.

Concentrado.
Sobre el.
Estudiando.
Uno.
Tecnologías
Detrás.
Hora.

(Este es un excelente consejo, aunque yo no siempre me he adherido a él).

En este orden, recomiendo estudiar:

  1. Aprende Python para la programación general.
  2. Pandas. , , data scientist Python Pandas Scikit-learn. Scikit-learn , Pandas . Pandas Matplotlib NumPy.
  3. Scikit-learn. «Introduction to Machine Leaning with Python».
  4. SQL .
  5. Tableau . , .
  6. . AWS – - . Microsoft Azure – . , Google Cloud, . , Google Cloud, , Data Engineer Google Cloud.
  7. . TensorFlow. «Deep Learning with Python» Keras . Keras TensorFlow, . PyTorch . , .

Estos son mis consejos generales de aprendizaje. Adáptelos a sus objetivos, o martillee y haga lo que quiera.



imagen
Aprenda los detalles de cómo obtener una profesión solicitada desde cero o subir de nivel en habilidades y salario tomando los cursos en línea de SkillFactory:



Lee mas



All Articles