12 cursos en línea de ingeniería de datos


Según Statista, para 2025, el mercado de big data crecerá a 175 zetabytes en comparación con 41 en 2019 ( gráfico ). Para obtener trabajo en esta área, debe comprender cómo trabajar con grandes datos almacenados en la nube. Cloud4Y ha compilado una lista de 12 cursos de ingeniería de datos gratuitos y de pago que ampliarán su conocimiento en esta área y pueden ser un buen punto de partida en el camino hacia las certificaciones en la nube.

Prólogo

¿Qué es un ingeniero de datos? Esta es la persona responsable de crear y mantener la arquitectura de datos en el proyecto Data Science. Sus responsabilidades pueden incluir garantizar un flujo de datos ininterrumpido entre el servidor y la aplicación, integrar un nuevo software para la gestión de datos, mejorar los procesos de datos subyacentes y crear canales de datos.

Hay una gran cantidad de tecnologías y herramientas que un ingeniero de datos debe poseer para trabajar con la computación en la nube, el almacenamiento de datos, ETL (extracción, transformación, carga), etc. Además, el número de habilidades requeridas está en constante crecimiento, por lo que un ingeniero de datos necesita reponer regularmente su equipaje conocimiento. Nuestra lista tiene cursos para principiantes y profesionales experimentados. Elige lo que sea adecuado para ti.

1. Certificación Nanodegree de ingeniería de datos ( Udacity )

Aprenderá a diseñar modelos de datos, crear almacenes de datos y lagos de datos, automatizar tuberías de datos y trabajar con matrices de conjuntos de datos. Al final del programa, usted prueba sus nuevas habilidades al completar el proyecto Capstone.

Duración : 5 meses, 5 horas a la semana
Idioma : Inglés
Precio : $ 1695
Nivel : Principiante

2. Conviértase en un Certificado de Ingeniero de Datos ( Coursera )

Aprende de lo básico. Puede desarrollarse por etapas utilizando conferencias y proyectos prácticos para trabajar en sus habilidades. Al final de la capacitación, estará listo para trabajar con ML y big data. Se recomienda que conozca Python al menos al nivel mínimo.

Duración : 8 meses, 10 horas a la semana
Idioma : inglés
Precio :?
Nivel : Principio

3. Conviértase en un ingeniero de datos: Dominando los conceptos ( LinkedIn Learning )

Desarrollará habilidades de diseño de datos y habilidades DevOps, aprenderá a crear aplicaciones de Big Data, crear tuberías de datos, procesar aplicaciones en tiempo real utilizando la base de datos Hazelcast y Hadoop .

Duración: depende de usted
Idioma : inglés
Precio : primer mes - gratis
Nivel : principiante

4. Cursos de ingeniería de datos ( edX )

Aquí hay una serie de programas que lo introducen a la ingeniería de datos y le enseñan cómo desarrollar soluciones analíticas. Los cursos se clasifican según el nivel de dificultad, por lo que puede elegir uno según su nivel de experiencia. Durante el proceso de capacitación, aprenderá a usar Spark, Hadoop, Azure y a administrar los datos corporativos.

Duración : depende de ti
Idioma : inglés
Precio : depende del curso elegido
Nivel : elemental, intermedio, avanzado

5. Ingeniero de datos ( DataQuest )

Vale la pena elegir este curso si tiene experiencia con Python y desea profundizar su conocimiento y desarrollar una carrera como especialista en procesamiento de datos. Aprenderá cómo construir tuberías de datos usando Python y pandas, cargar grandes conjuntos de datos en una base de datos Postgres después de limpiar, convertir y validar.

Duración : depende de ti
Idioma : inglés
Precio : depende de la forma de suscripción
Nivel : principiante, intermedio

6. Ingeniería de datos con Google Cloud ( Coursera )

Este curso lo ayudará a adquirir las habilidades que necesita para desarrollar una carrera en Big Data. Por ejemplo, trabajando con BigQuery, Spark. Obtendrá los conocimientos que necesita para prepararse para la certificación de ingeniero de datos profesional de Google Cloud profesional.

Duración : 4 meses
Idioma : inglés
Precio : gratis
Nivel : principiante, intermedio

7. Ingeniería de datos, Big Data en Google Cloud Platform ( Coursera )

Un curso interesante que brinda conocimiento práctico sobre los sistemas de procesamiento de datos en GCP. Durante las lecciones, aprenderá a diseñar sistemas antes de comenzar el proceso de desarrollo. Además, también analizará datos estructurados y no estructurados, aplicará escalado automático y aplicará métodos ML para extraer información.

Duración : 3 meses
Idioma : inglés
Precio : gratis
Nivel : principiante, intermedio

8. UC San Diego: Especialización en Big Data ( Coursera )

El curso se basa en el uso de la infraestructura de Hadoop y Spark y la aplicación de estos métodos de procesamiento de big data en el proceso de ML. Aprenderá los conceptos básicos del uso de Hadoop con MapReduce, Spark, Pig y Hive. Aprenda a construir modelos predictivos y usar análisis de gráficos para modelar problemas. Tenga en cuenta que este curso no requiere experiencia en programación.

Duración : 8 meses, 10 horas a la semana
Idioma : inglés
Precio : gratis
Nivel : inicial

9. Domando Big Data con Apache Spark y Python ( Udemy )

Aprenderá a usar la estructura de transmisión y los marcos de datos en Spark3, tendrá una idea de cómo usar el servicio Elastic MapReduce de Amazon para trabajar con su clúster en Hadoop. Aprenda a identificar problemas al analizar grandes datos y comprenda cómo funcionan las bibliotecas GraphX ​​con el análisis de red y cómo puede usar MLlib.

Duración : depende de usted
Idioma : inglés
Precio : de 800 rublos a $ 149.99 (qué suerte)
Nivel : elemental, intermedio

10. Programa PG en Ingeniería de Big Data ( upGrad )

Este curso le dará una idea de cómo funciona Aadhaar, cómo Facebook personaliza el feed y cómo se puede utilizar la Ingeniería de datos. Los temas clave serán el procesamiento de datos (incluido el procesamiento en tiempo real), MapReduce, análisis de big data.

Duración : 11 meses
Idioma : inglés
Precio : alrededor de $ 3000
Nivel : primaria

11. Profesión de Data Scientist ( Skillbox )

Aprenderá a programar en Python, aprenderá los marcos para entrenar redes neuronales Tensorflow y Keras. Domine las bases de datos MongoDB, PostgreSQL, SQLite3, aprenda a trabajar con las bibliotecas Pandas, NumPy y Matpotlib.

Duración : 300 horas de entrenamiento.
Idioma : ruso
Precio : el primer medio año es gratis, luego 3900 rublos al mes
Nivel : Principiante

12. Ingeniero de datos 7.0 ( Laboratorio de nuevas profesiones )

Tendrá un estudio en profundidad de Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-architecture y kappa-architecture. Aprenderá cómo conectar herramientas entre sí, formando tuberías y obteniendo una solución de referencia. Estudiar requiere un conocimiento mínimo de Python 3.

Duración : 21 lecciones, 7 semanas
Idioma : ruso
Precio : 60,000 rublos
Nivel : intermedio

Si desea agregar otro buen curso a la lista, puede darse de baja en los comentarios o en el PM. Complementaremos el post.

¿Qué más se puede leer en el Cloud4Y el blog

¿Cuál es la geometría del universo?
Huevos de Pascua en mapas topográficos de Suiza
Una historia simplificada y muy breve del desarrollo de “nubes”
Cómo se “rompió” el banco
Marcas de computadoras de los 90, parte 3, final

Suscríbete a nuestro canal de Telegram para no perderte otro artículo. Escribimos no más de dos veces por semana y solo por negocios. También le recordamos que el 21 de mayo a las 15:00 (hora de Moscú) realizaremos un seminario websobre el tema "Seguridad de la información de las empresas cuando se trabaja en un sitio remoto". Si desea comprender cómo proteger la información confidencial y corporativa cuando los empleados trabajan desde su hogar, ¡regístrese!

All Articles