Corso SPARK
Documento rilasciato al termine del corso: ATTESTATO di frequenza
Descrizione
Il Corso fornisce una visione generale dell’universo Big Data e ne illustra i principali elementi, quindi si concentra sul cluster-computing framework Spark.
A chi è rivolto
Il corso è diretto a Professionisti interessati ad acquisire il set di competenze fondamentali per la creazione di valore dai dati e le logiche di recupero e le tecniche di correlazione.
Altre informazioni
Lingua: Italiano
Materiale: Dispense (ITA/ENG)
Durata: 5 giorni
Requisiti partecipazione: Nessuno
Principali argomenti del corso
Spark
- Evoluzione del calcolo computazionale rispetto al Map e Reduce di Hadoop
- Spark SQL per il prelievo dei dati da fonti esterne
- Gestione del cluster in memory
- Impostazione dell’ambiente di sviluppo
- Building Blocks
- Dataset distribuiti resilienti
- Operazioni RDD – Trasformazioni e azioni
- Dataframe
- Utilizzo di Spark SQL per elaborare i dati
- Spark streaming
- Spark mlib
- Spark graphx
- Dimensionamento di un cluster di produzione
- Performance e tuning
- Sviluppare applicazioni con Spark 2 usando Scala
Dove siamo
Sede operativa Via Vincenzo Lamaro, 13 00173 Roma
Gruppo Digital Engineering
Sede legale Via dell'Acquedotto Paolo, 80 00168 Roma