Inicio »

Spark Java

Duración del curso
35 horas
Nivel
Modalidad

Presencial, Remoto

 

Acerca del curso

Objetivos

▶  Conocerán la Arquitectura de Spark desde la perspectiva de un desarrollador

▶  Sabrán integrar Spark con fuentes de datos: Hadoop, CVS, Bases de Datos

▶  Sabrán construir, procesar y modificar RDD ́s en Spark

▶  Sabrán aplicar algoritmos de Machine Learning en Scala para Spark tanto para clasificación, regresión y clusterización

Contenido

  • Introducción
    • Instalación
    • Shell
    • Dataset
    • RDD ́s
    • DataFrame
  • RDD/DataSet/DataFrame
    • Colecciones
    • DataSet Externos
    • Operaciones
    • Básicas
    • Pasando funciones
    • Clave Valor
    • Transformaciones
    • Acciones
    • Aleatoriedad
    • Persistencia
    • Variables compartidas
  • Jobs
    • Desplegando en un cluster
    • Lanzando Jobs
    • Unit Testing
    • Job Scheduling
  • DataSources
    • Carga y guardado
    • File Source
    • Ficheros Parquet
    • Ficheros JSON
    • JDBC
    • Ficheros AVRO
  • MLLib
    • DataFrame
    • Clasificaciones y Regresiones
    • Regresión linear
    • Clustering: Kmeans
    • Reducción de Dimensiones: PCA
    • Clasificación: Arboles de Decisión
  • Streaming
    • Introducción
    • StreamingContext
    • Dstream
    • Transformaciones
  • GraphX
    • Introducción
    • Grafos
    • Operadores
    • Algoritmos

Próximas convocatorias

Estamos preparando nuevas convocatorias.
Déjanos tus datos a través del formulario y te avisaremos lo antes posible.

Solicita Información

    "Este sitio web utiliza cookies -propias y de terceros- para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y de nuestra política de cookies, pudiendo acceder al siguiente enlace política de cookies para más información"

    ACEPTAR
    Aviso de cookies