Inicio »
PySpark
Acerca del curso
Objetivos
Durante el curso, los participantes:
- Conocerán la arquitectura deSpark y sus estructuras de Datos básica.
- Sabrán mandar trabajos a un servidor local o remoto deSpark
- Aprenderán el API de consulta y modificación de datos deSpark
- Podrán manejar algoritmos de aprendizaje automatizado conSpark
- Conocerán los mecanismos de tratamiento de datos en tiempo real conSpark
- Sabrán manejar, consultar y analizar datos en forma de grafo conSpark
Contenido
1. Introducción
- Instalación
- Shell
- Dataset
- DFF´s
- DataFrame
- Mllib
2. Dataframe
- Clasificaciones y Regresiones
- Regresión linear
- Clustering: Kmeans
- Reducción de Dimensiones: PCA
- Clasificación: Árboles de Decisión
- Regresión: Random Forest
3. Streaming
- Introducción
- StreamingContext
- Dstream
- Transformaciones
4. GraphX
- Introducción
- Grafos
- Operadores
- Algoritmos
Próximas convocatorias
Fecha | Duración | Turno | Horario | Modalidad |
---|---|---|---|---|
25 horas | Presencial, Remoto-Aula Virtual |
