Durata: 1 giorno
Lingua: Italiano
Livello: Intermedio
Attività: Lezione frontale, laboratori, demo
In questo corso imparerete a costruire soluzioni di analisi dei dati batch utilizzando Amazon EMR, un servizio gestito da Apache Spark e Apache Hadoop di livello enterprise. Imparerete come Amazon EMR si integra con progetti open-source come Apache Hive, Hue e HBase e con i servizi AWS come AWS Glue e AWS Lake Formation.
Il corso affronta la raccolta, l'ingestione, la catalogazione, l'archiviazione e l'elaborazione dei dati nel contesto di Spark e Hadoop. Imparerete a utilizzare i notebook EMR per supportare i carichi di lavoro di analitici e di apprendimento automatico. Imparerete inoltre ad applicare le best practice di sicurezza, prestazioni e gestione dei costi al funzionamento di Amazon EMR.