Visão Geral
Curso Apache Spark for Data Scientists. Apache Spark é um poderoso mecanismo de processamento de código aberto para dados no cluster Hadoop, otimizado para velocidade, facilidade de uso e análises sofisticadas. A estrutura Spark oferece suporte ao processamento de dados de streaming e algoritmos iterativos complexos, permitindo que os aplicativos sejam executados até 100 vezes mais rápido do que os programas Hadoop MapReduce tradicionais. Com o Spark, você pode escrever aplicativos sofisticados para executar decisões mais rápidas e ações em tempo real para uma ampla variedade de casos de uso, arquiteturas e setores.
Este Curso Apache Spark for Data Scientists, explora o uso do Spark para atividades comuns relacionadas a dados a partir de uma perspectiva de ciência de dados. Você aprenderá a construir aplicativos unificados de big data combinando análises em lote, streaming e interativas em seus dados.