Inicio »
Spark Java
Acerca del curso
Objetivos
▶ Conocerán la Arquitectura de Spark desde la perspectiva de un desarrollador
▶ Sabrán integrar Spark con fuentes de datos: Hadoop, CVS, Bases de Datos
▶ Sabrán construir, procesar y modificar RDD ́s en Spark
▶ Sabrán aplicar algoritmos de Machine Learning en Scala para Spark tanto para clasificación, regresión y clusterización
Contenido
- Introducción
- Instalación
- Shell
- Dataset
- RDD ́s
- DataFrame
- RDD/DataSet/DataFrame
- Colecciones
- DataSet Externos
- Operaciones
- Básicas
- Pasando funciones
- Clave Valor
- Transformaciones
- Acciones
- Aleatoriedad
- Persistencia
- Variables compartidas
- Jobs
- Desplegando en un cluster
- Lanzando Jobs
- Unit Testing
- Job Scheduling
- DataSources
- Carga y guardado
- File Source
- Ficheros Parquet
- Ficheros JSON
- JDBC
- Ficheros AVRO
- MLLib
- DataFrame
- Clasificaciones y Regresiones
- Regresión linear
- Clustering: Kmeans
- Reducción de Dimensiones: PCA
- Clasificación: Arboles de Decisión
- Streaming
- Introducción
- StreamingContext
- Dstream
- Transformaciones
- GraphX
- Introducción
- Grafos
- Operadores
- Algoritmos
Próximas convocatorias
Fecha | Duración | Turno | Horario | Modalidad |
---|---|---|---|---|
35 horas | Presencial, Remoto |
