Programa del Curso

Introducción a Google Colab y Apache Spark

  • Descripción general de Google Colab
  • Introducción a Apache Spark
  • Configuración de Spark en Google Colab

Procesamiento de datos con Apache Spark

  • Trabajar con RDD y DataFrames
  • Carga y procesamiento de grandes conjuntos de datos
  • Uso de Spark SQL para consultar datos estructurados

Analítica avanzada con Spark

  • Aprendizaje automático con Spark MLlib
  • Realización de análisis de datos en tiempo real
  • Computación distribuida con Spark

Visualización y Collaboration en Google Colab

  • Integración de Colab con bibliotecas de visualización populares
  • Flujos de trabajo colaborativos con cuadernos Colab
  • Compartir y exportar resultados

Optimización Big Data de los flujos de trabajo

  • Ajuste de Spark para el rendimiento
  • Optimización del uso de memoria y almacenamiento
  • Escalado de flujos de trabajo para grandes conjuntos de datos

Big Data en la nube

  • Integración de Google Colab con herramientas basadas en la nube
  • Uso del almacenamiento en la nube para big data
  • Trabajar con Spark en entornos de nube distribuida

Estudios de casos y mejores prácticas

  • Revisión de aplicaciones de big data del mundo real
  • Casos de estudio con Apache Spark y Colab
  • Prácticas recomendadas para el análisis de big data

Resumen y próximos pasos

Requerimientos

  • Conocimientos básicos de conceptos de ciencia de datos
  • Familiaridad con Apache Spark
  • Python Habilidades de programación

Audiencia

  • Científicos de datos
  • Ingenieros de datos
  • Investigadores que trabajan con big data
 14 Horas

Número de participantes


Precio por Participante​

Testimonios (5)

Próximos cursos

Categorías Relacionadas