DP-3014 Implementing a Machine Learning Solution with Azure Databricks

Un curso práctico para aprender a usar Apache Spark, Delta Lake y SQL Warehouses en Azure Databricks

Introducción

Azure Databricks es un servicio de análisis de datos basado en la nube que permite ejecutar Apache Spark de forma fácil y escalable. Con Azure Databricks, puedes crear y ejecutar notebooks interactivos que te permiten explorar, transformar y visualizar datos, así como construir flujos de trabajo y aplicaciones de machine learning. Además, Azure Databricks se integra con otros servicios de Azure, como Azure Data Factory, Azure Data Lake Storage, Azure Synapse Analytics y Azure Machine Learning, para crear soluciones de datos completas y robustas.

En este programa de formación, aprenderás a usar Azure Databricks para realizar análisis de datos con Apache Spark, Delta Lake y SQL Warehouses. El programa está dirigido a profesionales de datos, analistas, científicos de datos e ingenieros de datos que quieran aprovechar las ventajas de Azure Databricks para sus proyectos. El programa tiene una duración estimada de 115 horas en modalidad de teleformación y se compone de los siguientes módulos:

  • Explore Azure Databricks: En este módulo, te familiarizarás con la interfaz de usuario de Azure Databricks, aprenderás a crear y gestionar clusters, y a ejecutar notebooks con diferentes lenguajes y librerías.
  • Use Apache Spark in Azure Databricks: En este módulo, aprenderás los conceptos básicos de Apache Spark, el framework de procesamiento distribuido más popular para el análisis de datos a gran escala. Aprenderás a usar las APIs de Spark para leer, escribir y transformar datos estructurados y no estructurados, así como a usar Spark SQL para consultar datos con SQL.
  • Use Delta Lake in Azure Databricks: En este módulo, aprenderás a usar Delta Lake, una capa de almacenamiento que aporta fiabilidad, rendimiento y calidad a los datos en Azure Databricks. Aprenderás a crear y gestionar tablas Delta, a realizar operaciones de lectura y escritura con ACID, y a usar las funcionalidades de esquema evolutivo, auditoría y time travel.
  • Use SQL Warehouses in Azure Databricks: En este módulo, aprenderás a usar SQL Warehouses, una solución de almacenamiento y análisis de datos que combina el poder de Azure Databricks con el de Azure Synapse Analytics. Aprenderás a crear y conectar SQL Warehouses con Azure Databricks, a realizar consultas con SQL y Spark, y a usar las herramientas de visualización integradas.
  • Run Azure Databricks Notebooks with Azure Data Factory: En este módulo, aprenderás a usar Azure Data Factory, un servicio de integración de datos que te permite crear y orquestar flujos de trabajo de datos. Aprenderás a crear y ejecutar pipelines de Azure Data Factory que invocan notebooks de Azure Databricks, y a monitorizar y depurar los resultados.

Objetivos

Al finalizar este programa de formación, serás capaz de:

  • Crear y configurar un entorno de Azure Databricks
  • Ejecutar y compartir notebooks interactivos con diferentes lenguajes y librerías
  • Usar Apache Spark para leer, escribir y transformar datos estructurados y no estructurados
  • Usar Spark SQL para consultar datos con SQL
  • Usar Delta Lake para crear y gestionar tablas fiables, rápidas y de calidad
  • Usar SQL Warehouses para almacenar y analizar datos con SQL y Spark
  • Usar Azure Data Factory para crear y ejecutar pipelines de datos que invocan notebooks de Azure Databricks

Requisitos previos

Para seguir este programa de formación, se recomienda tener los siguientes conocimientos y habilidades:

  • Conocimientos básicos de análisis de datos y estadística
  • Conocimientos básicos de programación en Python, Scala o R
  • Conocimientos básicos de SQL
  • Conocimientos básicos de Azure y sus servicios de datos
  • Acceso a una suscripción de Azure y a un espacio de trabajo de Azure Databricks

Evaluación

Para evaluar tu aprendizaje, deberás realizar una serie de ejercicios prácticos y un proyecto final que consistirá en crear una solución de datos con Azure Databricks. Los ejercicios prácticos se realizarán en los notebooks de Azure Databricks y se corregirán automáticamente. El proyecto final se realizará en un entorno real de Azure y se evaluará según los criterios establecidos por el instructor.

Certificación

Si completas satisfactoriamente el programa de formación, recibirás un certificado de aprovechamiento que acreditará tus conocimientos y habilidades sobre Azure Databricks. El certificado se emitirá en formato digital y tendrá un código de verificación único.

    €695.00

    Información relacionada a la formación

    Soporte siempre a tu lado

    Soporte de formación: Siempre a tu lado

    Formación presencial y telepresencial

    ¿Necesitas otra modalidad formativa?

    bonificaciones

    Bonificaciones para empresas