Amazon Athena Supporta Apache Spark

Amazon Athena supporta ora il sistema di elaborazione distribuito open-source Apache Spark per eseguire carichi di lavoro di analisi veloci. Gli analisti e gli ingegneri dei dati possono utilizzare Jupyter Notebook in Athena per eseguire l’elaborazione dei dati e interagire in modo programmatico con le applicazioni Spark.

Per i carichi di lavoro interattivi di Spark che richiedono query a bassa latenza, i developers possono effettuare query provenienti da varie fonti e visualizzare i risultati delle loro analisi, con Athena che avvia le applicazioni in meno di un secondo.

Aggiungendo alle capacità SQL di Amazon Athena, Apache Spark su Athena fornisce scalabilità ed elasticità in funzione di volumi di dati e di esigenze di elaborazione variabili. Apache Spark è un sistema di elaborazione distribuito open-source progettato per eseguire carichi di lavoro di analisi veloci utilizzati da vari settori per eseguire analisi complesse dei dati e spesso utilizzati per esplorare i data lake per ricavare informazioni. Con la nuova funzione di Athena, i data engineer possono costruire applicazioni Apache Spark utilizzando i notebook dalla console AWS o in modo programmatico utilizzando le API di Athena.

Athena per Apache Spark è disponibile in un numero limitato di regioni AWS: Ohio, Northern Virginia, Oregon, Tokyo e Irlanda.