IBM
IBM Data Engineering Certificat Professionnel
IBM

IBM Data Engineering Certificat Professionnel

Préparez-vous à une carrière d'ingénieur en données. Développez des compétences prêtes à l'emploi - et des compétences incontournables en IA - pour une carrière en demande. Obtenez un titre de compétences auprès d'IBM. Aucune expérience préalable n'est requise.

Enseigné en Français (doublage IA)

IBM Skills Network Team
Muhammad Yahya
Abhishek Gagneja

Instructeurs : IBM Skills Network Team

118 174 déjà inscrits

Inclus avec Coursera Plus

Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,731 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois, 10 heures par semaine
Apprenez à votre propre rythme
Préparer un diplôme
Obtenez une qualification professionnelle qui traduit votre expertise
4.7

(5,731 avis)

niveau Débutant

Expérience recommandée

Planning flexible
6 mois, 10 heures par semaine
Apprenez à votre propre rythme
Préparer un diplôme

Ce que vous apprendrez

  • Maîtrisez les compétences pratiques et les connaissances les plus récentes que les ingénieurs de données utilisent dans leur travail quotidien

  • Apprendre à créer, concevoir et gérer des bases de données relationnelles et appliquer des concepts d'administration de bases de données (DBA) à des SGBDR tels que MySQL, PostgreSQL et IBM Db2.

  • Développer une connaissance pratique de NoSQL et Big Data en utilisant MongoDB, Cassandra, Cloudant, Hadoop, Apache Spark, Spark SQL, Spark ML, et Spark Streaming.

  • Mettre en œuvre des ETL et des pipelines de données avec Bash, Airflow et Kafka ; architecturer, alimenter et déployer des entrepôts de données ; créer des rapports BI et des tableaux de bord interactifs

Compétences que vous acquerrez

  • Catégorie : Gestion des données
  • Catégorie : Bases de données
  • Catégorie : Big Data
  • Catégorie : Leadership et Management
  • Catégorie : SQL
  • Catégorie : Apprentissage automatique
  • Catégorie : sécurité des réseaux
  • Catégorie : Visualisation de Données
  • Catégorie : Cloud Computing
  • Catégorie : Programmation Informatique
  • Catégorie : Analyse des Données
  • Catégorie : Logiciel de Visualisation de Données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Enseigné en Français (doublage IA)

Certificat professionnel - 16 séries de cours

Ce que vous apprendrez

  • Dressez la liste des compétences de base requises pour un poste d'ingénieur en données au niveau débutant.

  • Discuter des différentes étapes et des concepts du cycle de vie de l'ingénierie des données.

  • Décrire les technologies d'ingénierie des données telles que les bases de données relationnelles, les magasins de données NoSQL et les moteurs Big Data.

  • Résumer les concepts de sécurité des données, de gouvernance et de conformité.

Compétences que vous acquerrez

Catégorie : Interface de ligne de commande
Catégorie : Extraction, transformation et chargement (ETL)
Catégorie : Script Shell
Catégorie : Bash (langage de script)
Catégorie : Systèmes d'Exploitation
Catégorie : Gestion de processus OS
Catégorie : Gestion des fichiers
Catégorie : Commandes Linux
Catégorie : Protocoles de réseau
Catégorie : Bash (Shell Unix)
Catégorie : Serveurs Linux
Catégorie : Automatisation
Catégorie : Administration Linux
Catégorie : Commandes Unix
Catégorie : Linux
Catégorie : Shell Unix
Catégorie : Langages de script
Catégorie : Unix

Ce que vous apprendrez

  • Apprenez Python - le langage de programmation le plus populaire pour la science des données et le développement de logiciels.

  • Appliquer la logique de programmation Python Variables, structures de données, branchements, boucles, fonctions, objets et classes.

  • Démontrer des compétences dans l'utilisation de bibliothèques Python telles que Pandas et Numpy, et dans le développement de code à l'aide des carnets Jupyter.

  • Accédez aux données et scrapez-les sur le web à l'aide d'API et de bibliothèques Python telles que Beautiful Soup.

Compétences que vous acquerrez

Catégorie : Bases de données
Catégorie : IBM Cloud
Catégorie : Langage de requête
Catégorie : Cloudant
Catégorie : Évolutivité
Catégorie : Informatique distribuée
Catégorie : NoSQL
Catégorie : Architecture et administration des bases de données
Catégorie : Gestion des bases de données
Catégorie : Modélisation des données
Catégorie : Cassandre
Catégorie : JSON
Catégorie : Base de données en nuage
Catégorie : Mongodb
Catégorie : Apache Cassandra

Ce que vous apprendrez

  • Démontrez vos compétences en Python pour travailler et manipuler des données

  • Mettre en œuvre le " webscraping " et utiliser les API pour extraire des données avec Python

  • Jouez le rôle d'un ingénieur de données travaillant sur un projet réel pour extraire, transformer et charger des données

  • Utilisez les blocs-notes Jupyter et les IDE pour mener à bien votre projet

Compétences que vous acquerrez

Catégorie : Professionnalisme
Catégorie : Communications interpersonnelles
Catégorie : Compétences en matière d'entretien
Catégorie : Réseautage professionnel
Catégorie : Établissement de relations
Catégorie : Concision
Catégorie : Communication technique
Catégorie : Développement professionnel

Ce que vous apprendrez

  • Décrire les données, les bases de données, les bases de données relationnelles et les bases de données en nuage.

  • Décrire les modèles d'information et de données, les bases de données relationnelles et les concepts de modèles relationnels (y compris les schémas et les tables).

  • Expliquez un diagramme de relations entre entités et concevez une base de données relationnelle pour un cas d'utilisation spécifique.

  • Développer une connaissance pratique des SGBD les plus courants, notamment MySQL, PostgreSQL et IBM DB2

Compétences que vous acquerrez

Catégorie : Web scraping
Catégorie : Analyse des Données
Catégorie : Programmation Informatique
Catégorie : Manipulation de données
Catégorie : Traitement des données
Catégorie : Principes de programmation
Catégorie : Numpy
Catégorie : Importation/exportation de données
Catégorie : Collecte de données
Catégorie : Pandas
Catégorie : Scripting
Catégorie : Jupyter
Catégorie : Automatisation
Catégorie : Pandas (paquetage Python)
Catégorie : Science des données
Catégorie : Programmation orientée objet (POO)
Catégorie : structures de données
Catégorie : Interface de programmation d'application (API)
Catégorie : Programmation en Python

Ce que vous apprendrez

  • Analyser les données d'une base de données en utilisant SQL et Python.

  • Créer une base de données relationnelle et travailler avec plusieurs tables à l'aide de commandes DDL.

  • Construire des requêtes SQL de niveau basique à intermédiaire en utilisant des commandes DML.

  • Composez des requêtes plus puissantes avec des techniques SQL avancées telles que les vues, les transactions, les procédures stockées et les jointures.

Compétences que vous acquerrez

Catégorie : Apache Hadoop
Catégorie : IA générative
Catégorie : Pipelines de données
Catégorie : Pipelines d'apprentissage automatique
Catégorie : Apprentissage supervisé
Catégorie : Ingénieur de données
Catégorie : Traitement des données
Catégorie : Analyse de régression
Catégorie : Apprentissage automatique
Catégorie : PySpark
Catégorie : SparkML
Catégorie : Apprentissage automatique
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Apprentissage non supervisé
Catégorie : Modélisation prédictive
Catégorie : Apache Spark
Catégorie : Ingénierie des caractéristiques
Catégorie : Apprentissage automatique appliqué
Catégorie : Transformation de données
Catégorie : Algorithmes d'apprentissage automatique

Ce que vous apprendrez

  • Décrire l'architecture Linux et les distributions Linux courantes et mettre à jour et installer des logiciels sur un système Linux.

  • Exécuter des commandes courantes d'information, de fichier, de contenu, de navigation, de compression et de mise en réseau dans l'interpréteur de commandes Bash.

  • Développer des scripts shell en utilisant des commandes Linux, des variables d'environnement, des tuyaux et des filtres.

  • Programmez des tâches cron sous Linux avec crontab et expliquez la syntaxe cron.

Compétences que vous acquerrez

Catégorie : Bases de données
Catégorie : Analyse des Données
Catégorie : Pipelines de données
Catégorie : IBM Cognos Analytics
Catégorie : Entreposage de données
Catégorie : Architecture des données
Catégorie : Bases de données relationnelles
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : NoSQL
Catégorie : SQL
Catégorie : IBM DB2
Catégorie : Examen technique des logiciels
Catégorie : PostgreSQL
Catégorie : Modélisation prédictive
Catégorie : Apache Spark
Catégorie : Apprentissage automatique appliqué
Catégorie : MySQL
Catégorie : Big Data
Catégorie : MongoDB
Catégorie : Tableau de bord
Catégorie : Programmation en Python

Ce que vous apprendrez

  • Créer, interroger et configurer des bases de données et accéder à des objets système tels que des tables et les construire.

  • Effectuer une gestion de base de données de base, y compris la sauvegarde et la restauration des bases de données, ainsi que la gestion des rôles et des autorisations des utilisateurs.

  • Surveillez et optimisez les aspects importants des performances de la base de données.

  • Dépanner les problèmes de base de données tels que la connectivité, la connexion et la configuration et automatiser les fonctions telles que les rapports, les notifications et les alertes.

Compétences que vous acquerrez

Catégorie : Guides de style
Catégorie : Web scraping
Catégorie : Extraction, transformation et chargement (ETL)
Catégorie : Bases de données
Catégorie : Manipulation de données
Catégorie : Ingénieur de données
Catégorie : Tests unitaires
Catégorie : Environnements de développement intégré
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : SQL
Catégorie : Examen du code
Catégorie : Transformation de données
Catégorie : Interface de programmation d'application (API)
Catégorie : Ingénierie de l'information
Catégorie : Programmation en Python

Ce que vous apprendrez

  • Décrire et comparer les processus d'extraction, de transformation et de chargement (ETL) et les processus d'extraction, de chargement et de transformation (ELT).

  • Expliquez les modes d'exécution batch et concurrent.

  • Mettre en œuvre le flux de travail ETL à l'aide de fonctions Bash et Python.

  • Décrire les composants, les processus, les outils et les technologies des pipelines de données.

Compétences que vous acquerrez

Catégorie : Web scraping
Catégorie : Extraction, transformation et chargement (ETL)
Catégorie : Script Shell
Catégorie : Bases de données
Catégorie : Optimisation des performances
Catégorie : Pipelines de données
Catégorie : Données en temps réel
Catégorie : Ingénieur de données
Catégorie : Entreposage de données
Catégorie : Migration de données
Catégorie : Évolutivité
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Data Mart
Catégorie : Apache Kafka
Catégorie : Transformation de données
Catégorie : Big Data
Catégorie : Intégration de données
Catégorie : Flux d'air Apache

Ce que vous apprendrez

  • Des compétences en Entrepôt de données prêtes à l'emploi en seulement 6 semaines, soutenues par une expérience pratique et un diplôme IBM.

  • Concevoir et alimenter un entrepôt de données, modéliser et interroger les données à l'aide de CUBE, ROLLUP et de vues matérialisées.

  • Identifier les outils et les fournisseurs les plus courants en matière d'analyse de données et de veille stratégique et créer des visualisations de données à l'aide d'IBM Cognos Analytics.

  • Comment concevoir et charger des données dans un entrepôt de données, écrire des requêtes d'agrégation, créer des tables de requêtes matérialisées et créer un tableau de bord analytique.

Compétences que vous acquerrez

Catégorie : Kubernetes
Catégorie : Apache Hive
Catégorie : Apache Hadoop
Catégorie : IBM Cloud
Catégorie : Traitement des données
Catégorie : PySpark
Catégorie : SparkML
Catégorie : Évolutivité
Catégorie : Informatique distribuée
Catégorie : SQL
Catégorie : SparkSQL
Catégorie : Docker (Logiciel)
Catégorie : Apache Spark
Catégorie : Big Data

Ce que vous apprendrez

  • Explorer l'utilité des outils d'analyse et d'informatique décisionnelle (BI)

  • Découvrez les capacités d'IBM Cognos Analytics et de Google Looker Studio

  • Démontrez votre maîtrise de l'analyse des données DB2 avec IBM Cognos Analytics

  • Créer et partager des tableaux de bord interactifs à l'aide d'IBM Cognos Analytics et de Google Looker Studio

Compétences que vous acquerrez

Catégorie : Traitement des transactions
Catégorie : Bases de données
Catégorie : Analyse des Données
Catégorie : Manipulation de données
Catégorie : Bases de données en nuage
Catégorie : Langage de requête
Catégorie : Bases de données relationnelles
Catégorie : SQL
Catégorie : Conception de la base de données
Catégorie : Gestion des bases de données
Catégorie : Système de gestion de base de données relationnelle (SGBDR)
Catégorie : Jupyter
Catégorie : Pandas (paquetage Python)
Catégorie : Carnets Jupyter
Catégorie : Procédure stockée
Catégorie : Programmation en Python

Ce que vous apprendrez

  • Faites la différence entre les quatre catégories principales de référentiels NoSQL.

  • Décrivez les caractéristiques, les avantages, les limites et les applications des outils de traitement des Big Data les plus populaires.

  • Effectuer des tâches courantes à l'aide de MongoDB, notamment des opérations de création, de lecture, de mise à jour et de suppression (CRUD).

  • Exécutez des opérations sur les espaces clés, les tables et les opérations CRUD dans Cassandra.

Compétences que vous acquerrez

Catégorie : Optimisation des performances
Catégorie : Sécurité des bases de données
Catégorie : Reprise après sinistre
Catégorie : Technologies de stockage des données
Catégorie : Base de données relationnelle
Catégorie : Bases de données relationnelles
Catégorie : l'administration de la base de données
Catégorie : Administration des systèmes
Catégorie : Authentifications
Catégorie : IBM DB2
Catégorie : Architecture et administration des bases de données
Catégorie : Gestion des bases de données
Catégorie : Comptes d'utilisateurs
Catégorie : PostgreSQL
Catégorie : Autorisation (informatique)
Catégorie : Moniteur du système
Catégorie : Serveurs de base de données
Catégorie : Base de données (SGBD)
Catégorie : MySQL
Catégorie : Procédure stockée
Catégorie : Systèmes de base de données

Ce que vous apprendrez

  • Expliquer l'impact du big data, y compris les cas d'utilisation, les outils et les méthodes de traitement.

  • Décrire l'architecture, l'écosystème, les pratiques et les applications liées à l'utilisateur d'Apache Hadoop, y compris Hive, HDFS, HBase, Spark et MapReduce.

  • Appliquer les bases de la programmation Spark, y compris les bases de la programmation parallèle pour les DataFrames, les ensembles de données et Spark SQL.

  • Utilisez les RDD et les ensembles de données de Spark, optimisez Spark SQL à l'aide de Catalyst et Tungsten, et utilisez les options de l'environnement de développement et d'exécution de Spark.

Compétences que vous acquerrez

Catégorie : Bases de données
Catégorie : Apache Hadoop
Catégorie : Gestion des données
Catégorie : Pipelines de données
Catégorie : Sécurité des données
Catégorie : Entreposage de données
Catégorie : Technologies de stockage des données
Catégorie : Architecture des données
Catégorie : Bases de données relationnelles
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : NoSQL
Catégorie : SQL
Catégorie : Stockage des données
Catégorie : Lacs de données
Catégorie : Science des données
Catégorie : Apache Spark
Catégorie : Gouvernance de données
Catégorie : Base de données (SGBD)
Catégorie : Transformation de données
Catégorie : Big Data
Catégorie : Ingénierie de l'information

Ce que vous apprendrez

  • Décrivez la ML, expliquez son rôle dans l'ingénierie des données, résumez l'IA générative, discutez des utilisations de Spark et analysez les pipelines de ML et la persistance des modèles.

  • Évaluer les modèles ML, distinguer les modèles de régression, de classification et de regroupement, et comparer les pipelines d'ingénierie des données avec les pipelines ML.

  • Construisez les processus d'analyse des données à l'aide de Spark SQL et effectuez des régressions, des classifications et des regroupements à l'aide de SparkML.

  • Démonstration de la connexion aux clusters Spark, de la construction de pipelines de ML, de l'extraction et de la transformation des caractéristiques, et de la persistance des modèles.

Compétences que vous acquerrez

Catégorie : Analytique
Catégorie : Présentation des données
Catégorie : Analyse des Données
Catégorie : Google Looker Studio
Catégorie : IBM Cognos Analytics
Catégorie : Logiciel d'informatique décisionnelle
Catégorie : Visualisation interactive des données
Catégorie : Looker (Logiciel)
Catégorie : Visualisation de Données
Catégorie : Tableaux de bord
Catégorie : Informatique décisionnelle
Catégorie : Tableau de bord
Catégorie : Logiciel de Visualisation de Données

Ce que vous apprendrez

  • Démontrer la maîtrise des compétences requises pour un poste d'ingénieur en données de niveau débutant.

  • Concevoir et mettre en œuvre divers concepts et composants dans le cycle de vie de l'ingénierie des données, tels que les référentiels de données.

  • Démontrer une connaissance pratique des bases de données relationnelles, des magasins de données NoSQL, des moteurs de big data, des entrepôts de données et des pipelines de données.

  • Appliquer les compétences en matière de scripts shell Linux, de langages de programmation SQL et Python aux problèmes d'ingénierie des données.

Compétences que vous acquerrez

Catégorie : Génération de données
Catégorie : IA générative
Catégorie : Interroger les bases de données
Catégorie : Réseaux neuronaux convolutifs
Catégorie : Ingénierie de l'information

Ce que vous apprendrez

  • Tirer parti de divers outils et techniques d'IA générative dans les processus d'ingénierie des données dans tous les secteurs d'activité

  • Mettre en œuvre divers processus d'ingénierie des données tels que la génération, l'augmentation et l'anonymisation des données à l'aide d'outils d'IA générative

  • Mettre en pratique les compétences en IA générative dans des laboratoires et des projets pratiques pour la conception de schémas d'entrepôt de données et la configuration de l'infrastructure

  • Évaluer des études de cas réels présentant l'application réussie de l'IA générative pour l'ETL et les référentiels de données

Compétences que vous acquerrez

Catégorie : Bases de données
Catégorie : Manipulation de données
Catégorie : Intégrité des données
Catégorie : Bases de données relationnelles
Catégorie : SQL
Catégorie : Architecture de la base de données
Catégorie : Conception de la base de données
Catégorie : Gestion des bases de données
Catégorie : IBM DB2
Catégorie : Architecture et administration des bases de données
Catégorie : Système de gestion de base de données relationnelle (SGBDR)
Catégorie : Modélisation des données
Catégorie : Postgresql
Catégorie : Conception de bases de données (BD)
Catégorie : structures de données
Catégorie : MySQL

Ce que vous apprendrez

  • Décrivez le rôle d'un ingénieur en données et quelques options de carrière, ainsi que les perspectives d'avenir dans ce domaine.

  • Expliquer comment jeter les bases d'une recherche d'emploi, y compris la recherche d'offres d'emploi, la rédaction d'un curriculum vitae et la création d'un portfolio.

  • Résumez ce à quoi un candidat peut s'attendre au cours d'un cycle d'entretien d'embauche typique, les différents types d'entretiens et la manière de se préparer aux entretiens.

  • Expliquez comment mener un entretien efficace, y compris les techniques pour répondre aux questions et comment faire une présentation personnelle professionnelle.

Compétences que vous acquerrez

Catégorie : Schémas en étoile
Catégorie : Validation des données
Catégorie : Schémas de flocon de neige
Catégorie : Langage de requête
Catégorie : Entreposage de données
Catégorie : Architecture des données
Catégorie : Marques de données
Catégorie : Extraction, transformation, chargement (ETL)
Catégorie : Rouleaux
Catégorie : SQL
Catégorie : Schéma en étoile
Catégorie : Conception de la base de données
Catégorie : Nettoyage des données
Catégorie : Data Mart
Catégorie : Qualité des données
Catégorie : IBM DB2
Catégorie : Lacs de données
Catégorie : Modélisation des données
Catégorie : PostgreSQL
Catégorie : Cubes
Catégorie : Intégration de données
Catégorie : Schéma du flocon de neige

Obtenez un certificat professionnel

Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.

Préparer un diplôme

Lorsque vous aurez terminé ce site Certificat Professionnel, vous pourrez peut-être faire reconnaître vos acquis si vous êtes admis et si vous vous inscrivez à l'un des programmes d'études en ligne suivants.¹

 

Instructeurs

IBM Skills Network Team
IBM
67 Cours1 236 165 apprenants
Muhammad Yahya
IBM
5 Cours78 042 apprenants
Abhishek Gagneja
IBM
6 Cours186 614 apprenants

Offert par

IBM

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Emplacement réservé

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

¹ Le salaire médian et les données sur les offres d'emploi proviennent du rapport Lightcast™ sur les offres d'emploi. Créateur de contenu, ingénieur en apprentissage automatique et représentant du développement Salesforce (1/1/2024 - 12/31/2024) Tous les autres rôles professionnels (4/1/2024 - 4/1/2025).