Visão Geral
Curso Data Science Overview. Obtenha uma compreensão básica dos principais conceitos, ferramentas e funções da ciência de dados.
Este Curso Data Science Overview, de nível básico apresenta à equipe multidisciplinar de ciência de dados os muitos termos relacionados e em evolução. Inclui foco em Big Data, Ciência de Dados, Análise Preditiva, Inteligência Artificial, Mineração de Dados e Armazenamento de Dados. Você também explorará o estado atual da arte e da ciência, os principais componentes de uma infraestrutura moderna de ciência de dados, funções e responsabilidades da equipe e definição de níveis de resultados possíveis para seu investimento.
Este Curso Data Science Overview fornece uma visão de alto nível das tecnologias, conceitos, estratégias, conjuntos de habilidades, iniciativas e ferramentas de suporte atuais relacionados à ciência de dados em práticas empresariais comuns. O objetivo deste curso é fornecer a você uma compreensão básica dos conceitos principais.
Conteúdo Programatico
Foundations
- Grids and Virtualization
- Service-Oriented Architecture
- Enterprise Service Bus
- Enterprise Message Bus
- The Cloud
The Hadoop Ecosystem
- HDFS: Hadoop Distributed File System
- Resource Negotiators: YARN, Mesos, and Spark; ZooKeeper
- Hadoop Map/Reduce
- Spark
- Hadoop Ecosystem Distributions: Cloudera, Hortonworks, OpenSource
Big Data, NOSQL, and ETL
- Big Data vs. RDBMS
- NOSQL: Not Only SQL
- Relational Databases: Oracle, MariaDB, DB/2, SQL Server, PostGreSQL
- Key/Value Databases: JBoss Infinispan, Terracotta, Dynamo, Voldemort
- Columnar Databases: Cassandra, HBase, BigTable
- Document Databases: MongoDB, CouchDB/CouchBase
- Graph Databases: Giraph, Neo4J, GraphX
- Apache Hive
- Common Data Formats
- Leveraging SQL and SQL variants
ETL: Exchange, Transform, Load
- Data Ingestion, Transformation, and Loading
- Exporting Data
- Sqoop, Flume, Informatica, and other tools
Enterprise Integration Patterns and Message Busses
- Enterprise Integration Patterns: Apache Camel and Spring Integration
- Enterprise Message Busses: Apache Kafka, ActiveMQ, and other tools
Developing in Hadoop Ecosystem
- Languages: R, Python, Java, Scala, Pig, and BPMN
- Libraries and Frameworks
- Development, Testing, and Deployment
Artificial Intelligence and Business Systems
- Artificial Intelligence: Myths, Legends, and Reality
- The Math
- Statistics
- Probability
- Clustering Algorithms, Mahout, MLLib, SciKit, and Madlib
- Business Rule Systems: Drools, JRules, Pegasus
The Team
- Agile Data Science
- NOSQL Data Architects and Administrators
- Developers
- Grid Administrators
- Business and Data Analysts
- Management
- Evolving your Team
- Growing your Infrastructure