Inicio »

PySpark

Duración del curso
25 horas
Nivel
Integral

Modalidad

Presencial, Remoto-Aula Virtual

 

« Todos los cursos

Acerca del curso

Objetivos

Durante el curso, los participantes:

  • Conocerán la arquitectura deSpark y sus estructuras de Datos básica.
  • Sabrán mandar trabajos a un servidor local o remoto deSpark
  • Aprenderán el API de consulta y modificación de datos deSpark
  • Podrán manejar algoritmos de aprendizaje automatizado conSpark
  • Conocerán los mecanismos de tratamiento de datos en tiempo real conSpark
  • Sabrán manejar, consultar y analizar datos en forma de grafo conSpark

Contenido

1. Introducción

  • Instalación
  • Shell
  • Dataset
  • DFF´s
  • DataFrame
  • Mllib

2. Dataframe

  • Clasificaciones y Regresiones
  • Regresión linear
  • ClusteringKmeans
  • Reducción de Dimensiones: PCA
  • Clasificación: Árboles de Decisión
  • Regresión: Random Forest

3. Streaming

  • Introducción
  • StreamingContext
  • Dstream
  • Transformaciones

4. GraphX

  • Introducción
  • Grafos
  • Operadores
  • Algoritmos

Próximas convocatorias

Estamos preparando nuevas convocatorias.
Déjanos tus datos a través del formulario y te avisaremos lo antes posible.

Solicita Información