________________________________________________________________
Voulez-vous suivre ce cours à distance ou en personne?
Contactez-nous par email : info@nanforiberica.com , téléphones : +34 91 031 66 78 / +34 605 98 51 30, WhatsApp : +34 685 60 05 91 , ou contactez nos bureaux
________________________________________________________________
Cours DP-3012 : Implémentation d'une solution d'analyse de données avec Azure Synapse Analytics
Il s'agit d'un cours conçu pour former les étudiants sur les pools Spark dédiés et SQL Serverless et fournir des instructions sur le nettoyage des données et le processus ELT à l'aide des pipelines Synapse , qui sont très similaires à ceux familiers avec Azure Data Factory (ADF) pour déplacer les données vers la base de données du pool dédié Synapse.
Intermédiaire - Azure Microsoft Fabric - Ingénieur de données Administrateur
Cours destiné à
Le public doit être familiarisé avec les notebooks qui utilisent différents langages et un moteur Spark, tels que Databricks, Jupyter Notebooks, Zeppelin Notebooks, etc. Ils doivent également avoir une certaine expérience avec SQL, Python et les outils Azure tels que Data Factory.
Objectifs de formation DP-3012
- Identifier les problèmes commerciaux résolus par Azure Synapse Analytics.
- Description des principales fonctionnalités d’Azure Synapse Analytics.
- Déterminer quand utiliser Azure Synapse Analytics.
Contenu du cours DP-3012
Module 1 : Introduction à Azure Synapse Analytics
- Qu'est-ce qu'Azure Synapse Analytics
- Fonctionnement d'Azure Synapse Analytics
- Quand utiliser Azure Synapse Analytics
- Exercice : Découverte d'Azure Synapse Analytics
Module 2 : Utilisation d'un pool SQL sans serveur Azure Synapse pour interroger des fichiers dans un lac de données
- Comprendre les fonctionnalités et les cas d'utilisation des pools SQL sans serveur Azure Synapse
- Interrogation de fichiers à l'aide d'un pool SQL sans serveur
- Création d'objets de base de données externes
- Exercice : Interrogation de fichiers à l'aide d'un pool SQL sans serveur
Module 3 : Analyse de données avec Apache Spark dans Azure Synapse Analytics
- Introduction à Apache Spark
- Utilisation de Spark dans Azure Synapse Analytics
- Analyse de données avec Spark
- Visualisation des données avec Spark
- Exercice : Analyse de données avec Spark
Module 4 : Utilisation de Delta Lake dans Azure Synapse Analytics
- Description du lac Delta
- Création de tables Delta Lake
- Création de tables de catalogue
- Utilisation de Delta Lake avec des données en continu
- Utilisation de Delta Lake dans un pool SQL
- Exercice : Utilisation de Delta Lake dans Azure Synapse Analytics
Module 5 : Analyse des données dans un entrepôt de données relationnel
- Concevoir un schéma de stockage de données
- Créer des tables d'entrepôt de données
- Chargement des tables de l'entrepôt de données
- Interroger un entrepôt de données
- Exercice : Explorer un entrepôt de données
Module 6 : Création d'un pipeline de données dans Azure Synapse Analytics
- Comprendre les pipelines dans Azure Synapse Analytics
- Création d'un pipeline dans Azure Synapse Studio
- Définition des flux de données
- Exécution d'un pipeline
- Exercice : Création d'un pipeline de données dans Azure Synapse Analytics
Prérequis
Une connaissance des services Azure et une expérience avec Azure Machine Learning et Mlflow sont recommandées. De plus, ils doivent avoir de l’expérience dans l’exécution de tâches liées à l’apprentissage automatique à l’aide de Python .
Langue
- Cours : Anglais / Espagnol
- Laboratoires : anglais / espagnol