Visão Geral
Neste Curso Matlab for Predictive Analytics, a análise preditiva é o processo de análise de dados para fazer previsões sobre o futuro. Este processo usa dados juntamente com técnicas de data mining, estatísticas e técnicas de machine learning para criar um modelo preditivo para a previsão de eventos futuros.
Objetivo
Ao final deste treinamento, os participantes serão capazes de:
- Crie modelos preditivos para analisar padrões em dados históricos e transacionais
- Use modelagem preditiva para identificar riscos e oportunidades
- Construa modelos matemáticos que captem tendências importantes
- Use dados para dispositivos e sistemas de negócios para reduzir o desperdício, economizar tempo ou reduzir custos
Publico Alvo
- Desenvolvedores
- Engenheiros
- Especialistas em domínio
Pre-Requisitos
- Experiência com Matlab
- Nenhuma experiência prévia com ciência de dados é necessária
Informações Gerais
Carga horaria: 24h
- Se noturno este curso e ministrado de segunda-feira a sexta-feira das 19h às 23h, total de 6 encontros.
- Se aos sábados este curso e ministrado das 09h às 18h, total de 3 encontros.
Formato de entrega:
- 100% on-line ao vivo via Microsoft Teams, na presença de um instrutor/consultor ativo no mercado e docente em sala de aula.
- Nota: não é curso gravado (o mesmo acontece em tempo real na presença de um instrutor).
- Apostila + exercícios práticos
Materiais
Inglês/Português/Exercício prático
Conteúdo Programatico
- Introduction
- Predictive analytics in finance, healthcare, pharmaceuticals, automotive, aerospace and manufacturing
- Big Data Concepts Overview
- Capture data from different sources
- What are data-driven predictive models?
- Overview of statistical and machine learning techniques
- Case study: predictive maintenance and resource planning
- Applying Algorithms to Large Datasets with Hadoop and Spark
- Predictive analytics workflow
- Accessing and exploring data
- Data pre-processing
- Develop a predictive model
- Training, testing and validating a dataset
- Applying different machine learning approaches (time series regression, linear regression, etc.)
- Integrating the model into existing web applications, mobile devices, embedded systems, etc.
- Matlab and Simulink integration with embedded systems and enterprise IT workflows
- Creating portable C and C++ code from MATLAB code
- Deploying predictive applications to large-scale production systems, clusters, and clouds
- Acting on the results of your analysis
- Next Steps: Automatically Responding to Results Using Prescriptive Analytics
- Closing remarks
Introduction to Big Data
- Main characteristics of Big Data -- Volume, Variety, Velocity and Veracity.
- MPP (Massively Parallel Processing) architecture
- Data Warehouses – static schema, slowly evolving dataset
- MPP Databases: Greenplum, Exadata, Teradata, Netezza, Vertica etc.
- Hadoop Based Solutions – no conditions on structure of dataset.
- Typical pattern : HDFS, MapReduce (crunch), retrieve from HDFS
- Apache Spark for stream processing
- Batch- suited for analytical/non-interactive
- Volume : CEP streaming data
- Typical choices – CEP products (e.g. Infostreams, Apama, MarkLogic etc)
- Less production ready – Storm/S4
- NoSQL Databases – (columnar and key-value): Best suited as analytical adjunct to data warehouse/database
NoSQL solutions
- KV Store - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- KV Store - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- KV Store (Hierarchical) - GT.m, Cache
- KV Store (Ordered) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Actord
- KV Cache - Memcached, Repcached, Coherence, Infinispan, EXtremeScale, JBossCache, Velocity, Terracoqua
- Tuple Store - Gigaspaces, Coord, Apache River
- Object Database - ZopeDB, DB40, Shoal
- Document Store - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- Wide Columnar Store - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
TENHO INTERESSE