Curso Data Science Overview
16 horasVisão Geral
Curso Data Science Overview. Obtenha uma compreensão básica dos principais conceitos, ferramentas e funções da ciência de dados.
Este Curso Data Science Overview, de nível básico apresenta à equipe multidisciplinar de ciência de dados os muitos termos relacionados e em evolução. Inclui foco em Big Data, Ciência de Dados, Análise Preditiva, Inteligência Artificial, Mineração de Dados e Armazenamento de Dados. Você também explorará o estado atual da arte e da ciência, os principais componentes de uma infraestrutura moderna de ciência de dados, funções e responsabilidades da equipe e definição de níveis de resultados possíveis para seu investimento.
Este Curso Data Science Overview fornece uma visão de alto nível das tecnologias, conceitos, estratégias, conjuntos de habilidades, iniciativas e ferramentas de suporte atuais relacionados à ciência de dados em práticas empresariais comuns. O objetivo deste curso é fornecer a você uma compreensão básica dos conceitos principais.
Objetivo
Apos realizar este Curso Data Science Overview, voce será capaz de:
- Fundações: Grades e Estruturas Virtualização; SOA, ESB/EMB e a nuvem
- O ecossistema Hadoop: HDFS, navegadores de recursos, MapReduce, Spark e distribuições
- Big Data, NOSQL e ETL
- ETL: Troca, Transformação, Carga
- Tratamento de dados e levantamento de ferramentas úteis
- Padrões de integração empresarial e barramentos de mensagens
- Desenvolvendo no ecossistema Hadoop: R, Python, Java, Scala, Pig e BPMN
- Inteligência Artificial e Sistemas de Negócios
- Quem está na equipe? Papéis e funções na ciência de dados
- Expandindo sua infraestrutura
Publico Alvo
- Analistas de negócios, analistas de dados,
- arquitetos de dados, administradores de banco de dados,
- administradores de rede
- desenvolvedores,
- gerente técnico
- ou qualquer outra pessoa no domínio da ciência de dados que precise ter uma compreensão básica das principais áreas das tecnologias e práticas modernas de ciência de dados, e ferramentas.
Pre-Requisitos
- Exposição à tecnologia da informação empresarial
- Familiaridade com bancos de dados relacionais
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Foundations
- Grids and Virtualization
- Service-Oriented Architecture
- Enterprise Service Bus
- Enterprise Message Bus
- The Cloud
The Hadoop Ecosystem
- HDFS: Hadoop Distributed File System
- Resource Negotiators: YARN, Mesos, and Spark; ZooKeeper
- Hadoop Map/Reduce
- Spark
- Hadoop Ecosystem Distributions: Cloudera, Hortonworks, OpenSource
Big Data, NOSQL, and ETL
- Big Data vs. RDBMS
- NOSQL: Not Only SQL
- Relational Databases: Oracle, MariaDB, DB/2, SQL Server, PostGreSQL
- Key/Value Databases: JBoss Infinispan, Terracotta, Dynamo, Voldemort
- Columnar Databases: Cassandra, HBase, BigTable
- Document Databases: MongoDB, CouchDB/CouchBase
- Graph Databases: Giraph, Neo4J, GraphX
- Apache Hive
- Common Data Formats
- Leveraging SQL and SQL variants
ETL: Exchange, Transform, Load
- Data Ingestion, Transformation, and Loading
- Exporting Data
- Sqoop, Flume, Informatica, and other tools
Enterprise Integration Patterns and Message Busses
- Enterprise Integration Patterns: Apache Camel and Spring Integration
- Enterprise Message Busses: Apache Kafka, ActiveMQ, and other tools
Developing in Hadoop Ecosystem
- Languages: R, Python, Java, Scala, Pig, and BPMN
- Libraries and Frameworks
- Development, Testing, and Deployment
Artificial Intelligence and Business Systems
- Artificial Intelligence: Myths, Legends, and Reality
- The Math
- Statistics
- Probability
- Clustering Algorithms, Mahout, MLLib, SciKit, and Madlib
- Business Rule Systems: Drools, JRules, Pegasus
The Team
- Agile Data Science
- NOSQL Data Architects and Administrators
- Developers
- Grid Administrators
- Business and Data Analysts
- Management
- Evolving your Team
- Growing your Infrastructure