12 cursos online de engenharia de dados


De acordo com Statista, até 2025, o mercado de big data aumentará para 175 zetabytes em comparação com 41 em 2019 ( gráfico ). Para trabalhar nesta área, você precisa entender como trabalhar com grandes dados armazenados na nuvem. O Cloud4Y compilou uma lista de 12 cursos gratuitos e pagos de engenharia de dados que expandirão seu conhecimento nessa área e podem ser um bom ponto de partida no caminho para as certificações em nuvem.

Prefácio

O que é um engenheiro de dados? Essa é a pessoa responsável por criar e manter a arquitetura de dados no projeto Data Science. Suas responsabilidades podem incluir garantir um fluxo ininterrupto de dados entre o servidor e o aplicativo, integrar novo software para gerenciamento de dados, melhorar os processos de dados subjacentes e criar pipelines de dados.

Há um grande número de tecnologias e ferramentas que um engenheiro de dados deve possuir para trabalhar com computação em nuvem, data warehousing, ETL (extração, transformação, carregamento) etc. Além disso, o número de habilidades necessárias está em constante crescimento, portanto, um engenheiro de dados precisa reabastecer regularmente sua bagagem conhecimento. Nossa lista tem cursos para iniciantes e profissionais experientes. Escolha o que é certo para você.

1. Certificação em nanodegree de engenharia de dados ( Udacity )

Você aprenderá como projetar modelos de dados, criar data warehouses e lagos de dados, automatizar pipelines de dados e trabalhar com matrizes de conjuntos de dados. No final do programa, você testa suas novas habilidades concluindo o projeto Capstone.

Duração : 5 meses, 5 horas por semana
Idioma : inglês
Preço : $ 1695
Nível : iniciante

2. Torne-se um engenheiro de dados ( Coursera )

Aprenda com o básico. Você pode se desenvolver em etapas usando palestras e projetos práticos para trabalhar em suas habilidades. Ao final do treinamento, você estará pronto para trabalhar com ML e big data. É recomendável que você conheça Python pelo menos no nível mínimo.

Duração : 8 meses, 10 horas por semana
Idioma : Inglês
Preço :?
Nível : início

3. Torne-se um engenheiro de dados: dominando os conceitos ( aprendizado do LinkedIn )

Você desenvolverá habilidades de design de dados e DevOps, aprenderá a criar aplicativos de Big Data, pipelines de dados, processar aplicativos em tempo real usando o banco de dados Hazelcast e Hadoop .

Duração: depende de você
Idioma : inglês
Preço : primeiro mês - grátis
Nível : iniciante

4. Cursos de engenharia de dados ( edX )

Aqui está uma série de programas que apresentam a você a engenharia de dados e ensina como desenvolver soluções analíticas. Os cursos são classificados de acordo com o nível de dificuldade, para que você possa escolher um de acordo com o seu nível de experiência. Durante o processo de treinamento, você aprenderá como usar o Spark, Hadoop, Azure e gerenciar dados corporativos.

Duração : depende de você
Idioma : inglês
Preço : depende do curso escolhido
Nível : elementar, intermediário, avançado

5. Data Engineer ( DataQuest )

Este curso vale a pena escolher se você tem experiência com Python e deseja aprofundar seu conhecimento e construir uma carreira como especialista em processamento de dados. Você aprenderá como criar pipelines de dados usando Python e pandas, carregar grandes conjuntos de dados em um banco de dados Postgres após limpar, converter e validar.

Duração : depende de você
Idioma : inglês
Preço : depende da forma de assinatura
Nível : iniciante, intermediário

6. Engenharia de dados com Google Cloud ( Coursera )

Este curso ajudará você a adquirir as habilidades necessárias para construir uma carreira em Big Data. Por exemplo, trabalhando com o BigQuery, Spark. Você obterá o conhecimento necessário para se preparar para a certificação do Google Cloud Professional Data Engineer, reconhecida pelo setor.

Duração : 4 meses
Idioma : inglês
Preço : enquanto gratuito
Nível : iniciante, intermediário

7. Engenharia de dados, big data no Google Cloud Platform ( Coursera )

Um curso interessante que fornece conhecimento prático sobre sistemas de processamento de dados no GCP. Durante as lições, você aprenderá como projetar sistemas antes de iniciar o processo de desenvolvimento. Além disso, você também analisará dados estruturados e não estruturados, aplicará o dimensionamento automático e aplicará métodos de ML para extrair informações.

Duração : 3 meses
Idioma : Inglês
Preço : enquanto gratuito
Nível : Iniciante, Intermediário

8. UC San Diego: Especialização em Big Data ( Coursera )

O curso é baseado no uso da infraestrutura Hadoop e Spark e na aplicação desses métodos de processamento de big data no processo de ML. Você aprenderá o básico do uso do Hadoop com o MapReduce, Spark, Pig e Hive. Aprenda a criar modelos preditivos e usar a análise de gráficos para modelar problemas. Observe que este curso não requer experiência em programação.

Duração : 8 meses, 10 horas por semana
Idioma : inglês
Preço : enquanto gratuito
Nível : inicial

9. Domando Big Data com Apache Spark e Python ( Udemy )

Você aprenderá como usar a estrutura do fluxo e os quadros de dados no Spark3, terá uma idéia de como usar o serviço Elastic MapReduce da Amazon para trabalhar com seu cluster no Hadoop. Aprenda como identificar problemas ao analisar big data e entender como as bibliotecas GraphX ​​funcionam com a análise de rede e como você pode usar o MLlib.

Duração : depende de você
Idioma : inglês
Preço : de 800 rublos a 149,99 dólares (que sorte)
Nível : iniciante, intermediário

10. Programa PG em engenharia de big data ( upGrad )

Este curso lhe dará uma idéia de como o Aadhaar funciona, como o Facebook personaliza o feed e como a Engenharia de Dados pode ser usada. Os principais tópicos serão processamento de dados (incluindo processamento em tempo real), MapReduce, análise de big data.

Duração : 11 meses
Idioma : Inglês
Preço : cerca de US $ 3000
Nível : elementar

11. Profissão Data Scientist ( Skillbox )

Você aprenderá como programar em Python, aprenderá as estruturas para o treinamento de redes neurais Tensorflow e Keras. Domine os bancos de dados MongoDB, PostgreSQL, SQLite3, aprenda a trabalhar com as bibliotecas Pandas, NumPy e Matpotlib.

Duração : 300 horas de treinamento
Idioma : Russo
Preço : o primeiro semestre de um ano é gratuito e, em seguida, 3900 rublos por mês.
Nível : Iniciante

12. Engenheiro de dados 7.0 ( laboratório de novas profissões )

Você fará um estudo aprofundado de Kafka, HDFS, ClickHouse, Spark, Airflow, arquitetura lambda e arquitetura kappa. Você aprenderá como conectar ferramentas entre si, formando pipelines e obtendo uma solução de linha de base. Estudar exige um conhecimento mínimo de Python 3.

Duração : 21 aulas, 7 semanas
Idioma : Russo
Preço : 60.000 rublos
Nível : intermediário

Se você deseja adicionar outro bom curso à lista, pode cancelar a inscrição nos comentários ou no PM. Vamos complementar o post.

O que mais você pode ler no blog Cloud4Y

Qual é a geometria do universo?
Ovos de Páscoa em mapas topográficos da Suíça
Uma história simplificada e muito curta do desenvolvimento de "nuvens"
Como o banco "quebrou"
Marcas de computadores dos anos 90, parte 3, final

Assine o nosso canal Telegram para não perder outro artigo. Escrevemos não mais do que duas vezes por semana e apenas a negócios. Também lembramos que em 21 de maio às 15:00 (horário de Moscou) realizaremos um webinarno tópico "Segurança da informação dos negócios ao trabalhar em um site remoto". Se você deseja entender como proteger informações confidenciais e corporativas quando os funcionários trabalham em casa - registre-se!

All Articles