12 cours en ligne d'ingénierie des données


Selon Statista, d'ici 2025, le marché du big data passera à 175 zétaoctets contre 41 en 2019 ( graphique ). Pour obtenir du travail dans ce domaine, vous devez comprendre comment travailler avec les mégadonnées stockées dans le cloud. Cloud4Y a compilé une liste de 12 cours gratuits et payants d'ingénierie des données qui élargiront vos connaissances dans ce domaine et peuvent être un bon point de départ sur la voie des certifications cloud.

Avant-propos

Qu'est - ce qu'un ingénieur de données? Il s'agit de la personne responsable de la création et de la maintenance de l'architecture des données dans le projet Data Science. Ses responsabilités peuvent inclure la garantie d'un flux de données ininterrompu entre le serveur et l'application, l'intégration de nouveaux logiciels de gestion des données, l'amélioration des processus de données sous-jacents et la création de pipelines de données.

Il existe un grand nombre de technologies et d'outils qu'un ingénieur de données doit posséder pour travailler avec le cloud computing, l'entreposage de données, l'ETL (extraction, transformation, chargement), etc. En outre, le nombre de compétences requises ne cesse de croître, de sorte qu'un ingénieur de données doit régulièrement réapprovisionner ses bagages connaissance. Notre liste contient des cours pour débutants et professionnels expérimentés. Choisissez ce qui vous convient.

1. Certification Nanodegree d'ingénierie des données ( Udacity )

Vous apprendrez à concevoir des modèles de données, à créer des entrepôts de données et des lacs de données, à automatiser les pipelines de données et à travailler avec des tableaux d'ensembles de données. À la fin du programme, vous testez vos nouvelles compétences en terminant le projet Capstone.

Durée : 5 mois, 5 heures par semaine
Langue : Anglais
Prix : 1695 $
Niveau : DĂ©butant

2. Devenez un ingénieur de données Certification ( Coursera )

Apprenez des bases. Vous pouvez vous développer par étapes à l'aide de conférences et de projets pratiques pour travailler vos compétences. À la fin de la formation, vous serez prêt à travailler avec le ML et le Big Data. Il est recommandé de connaître Python au moins au niveau minimum.

Durée : 8 mois, 10 heures par semaine
Langue : anglais
Prix :?
Niveau : DĂ©but

3. Devenez un ingénieur de données: Maîtriser les concepts ( apprentissage LinkedIn )

Vous développerez des compétences en conception de données et des compétences DevOps, apprendrez à créer des applications Big Data, créer des pipelines de données, traiter des applications en temps réel en utilisant la base de données Hazelcast et Hadoop .

Durée: dépend de vous
Langue : Anglais
Prix : premier mois - gratuit
Niveau : DĂ©butant

4. Cours d'ingénierie des données ( edX )

Voici une série de programmes qui vous initient à l'ingénierie des données et vous apprennent à développer des solutions analytiques. Les cours sont classés par niveau de difficulté, vous pouvez donc en choisir un en fonction de votre niveau d'expérience. Au cours du processus de formation, vous apprendrez à utiliser Spark, Hadoop, Azure et à gérer les données d'entreprise.

Durée : dépend de vous
Langue : anglais
Prix : dépend du cours choisi
Niveau : élémentaire, intermédiaire, avancé

5. Data Engineer ( DataQuest )

Ce cours mérite d'être choisi si vous avez de l'expérience avec Python et souhaitez approfondir vos connaissances et construire une carrière en tant que spécialiste du traitement des données. Vous apprendrez à créer des pipelines de données à l'aide de Python et de pandas, à charger de grands ensembles de données dans une base de données Postgres après le nettoyage, la conversion et la validation.

Durée : dépend de vous
Langue : anglais
Prix : dépend de la forme d'abonnement
Niveau : débutant, intermédiaire

6. Ingénierie des données avec Google Cloud ( Coursera )

Ce cours vous aidera à acquérir les compétences dont vous avez besoin pour bâtir une carrière dans le Big Data. Par exemple, travailler avec BigQuery, Spark. Vous obtiendrez les connaissances dont vous avez besoin pour vous préparer à la certification Google Cloud Professional Data Engineer reconnue par l'industrie.

Durée : 4 mois
Langue : anglais
Prix : gratuit
Niveau : débutant, intermédiaire

7. Ingénierie des données, Big Data sur Google Cloud Platform ( Coursera )

Un cours intéressant qui donne des connaissances pratiques sur les systèmes de traitement de données dans GCP. Au cours des leçons, vous apprendrez à concevoir des systèmes avant de commencer le processus de développement. En outre, vous analyserez également les données structurées et non structurées, appliquerez une mise à l'échelle automatique et appliquerez des méthodes ML pour extraire les informations.

Durée : 3 mois
Langue : anglais
Prix : gratuit
Niveau : débutant, intermédiaire

8. UC San Diego: spécialisation Big Data ( Coursera )

Le cours est basé sur l'utilisation de l'infrastructure Hadoop et Spark et l'application de ces méthodes de traitement des mégadonnées dans le processus ML. Vous apprendrez les bases de l'utilisation de Hadoop avec MapReduce, Spark, Pig et Hive. Apprenez à créer des modèles prédictifs et à utiliser l'analyse graphique pour modéliser des problèmes. Notez que ce cours ne nécessite pas d'expérience en programmation.

Durée : 8 mois, 10 heures par semaine
Langue : anglais
Prix : gratuit
Niveau : initial

9. Apprivoiser les Big Data avec Apache Spark et Python ( Udemy )

Vous apprendrez à utiliser la structure de flux et les trames de données dans Spark3, vous aurez une idée de la façon d'utiliser le service Elastic MapReduce d'Amazon pour travailler avec votre cluster dans Hadoop. Découvrez comment identifier les problèmes lors de l'analyse des mégadonnées et comprendre comment les bibliothèques GraphX ​​fonctionnent avec l'analyse de réseau et comment vous pouvez utiliser MLlib.

Durée : dépend de vous
Langue : anglais
Prix : de 800 roubles Ă  149,99 $ (quelle chance)
Niveau : débutant, intermédiaire

10. Programme PG en ingénierie des Big Data ( upGrad )

Ce cours vous donnera une idée du fonctionnement d'Aadhaar, de la façon dont Facebook personnalise le flux et de la façon dont l'ingénierie des données peut être utilisée. Les sujets clés seront le traitement des données (y compris le traitement en temps réel), MapReduce, l'analyse des mégadonnées.

Durée : 11 mois
Langue : anglais
Prix : environ 3000 $
Niveau : élémentaire

11. Profession Data Scientist ( Skillbox )

Vous apprendrez à programmer en Python, apprendrez les cadres de formation des réseaux neuronaux Tensorflow et Keras. Maîtrisez les bases de données MongoDB, PostgreSQL, SQLite3, apprenez à travailler avec les bibliothèques Pandas, NumPy et Matpotlib.

Durée : 300 heures de formation
Langue : russe
Prix : le premier semestre est gratuit, puis 3900 roubles par mois
Niveau : débutant

12. Data Engineer 7.0 ( New Professions Lab )

Vous aurez une étude approfondie de Kafka, HDFS, ClickHouse, Spark, Airflow, lambda-architecture et kappa-architecture. Vous apprendrez comment connecter les outils les uns aux autres, former des pipelines, obtenir une solution de base. L'étude nécessite une connaissance minimale de Python 3.

Durée : 21 leçons, 7 semaines
Langue : russe
Prix : 60 000 roubles
Niveau : intermédiaire

Si vous souhaitez ajouter un autre bon cours à la liste, vous pouvez vous désinscrire dans les commentaires ou dans le PM. Nous compléterons le message.

Que pouvez-vous lire d'autre sur le blog Cloud4Y

→ Quelle est la géométrie de l'univers?
→ Oeufs de Pâques sur les cartes topographiques de la Suisse
→ Une histoire simplifiée et très courte du développement des «nuages»
→ Comment la banque a «cassé»
→ Marques informatiques des années 90, partie 3, finale

Abonnez-vous à notre chaîne Telegram pour ne pas manquer un autre article. Nous écrivons pas plus de deux fois par semaine et uniquement pour affaires. Nous vous rappelons également que le 21 mai à 15h00 (heure de Moscou) nous organiserons un webinairesur le thème "Sécurité de l'information des entreprises lorsque vous travaillez sur un site distant". Si vous voulez comprendre comment protéger les informations sensibles et d'entreprise lorsque les employés travaillent à domicile - inscrivez-vous!

All Articles