Visão Geral
Curso Cassandra Developer, Nos tempos de hoje, as empresas precisam processar um volume muito grande e uma variedade de dados. Isso gera um requisito para um banco de dados altamente disponível e de baixa latência. O Cassandra resolve esse desafio permitindo leituras e gravações em alta velocidade em um sistema grande e distribuído.
O que e Cassandra Database?
Cassandra é um banco de dados distribuído NoSQL de código aberto desenvolvido originalmente pelo Facebook e agora mantido pela Apache Software Foundation. Ele é projetado para lidar com grandes volumes de dados estruturados e não estruturados, em várias localizações geográficas, sem um ponto único de falha.
O Cassandra é altamente escalável e tolerante a falhas, o que significa que pode lidar com grandes quantidades de dados e continuar funcionando mesmo se ocorrerem falhas em alguns dos seus nós. Ele também oferece suporte para replicação de dados em vários centros de dados, permitindo que os dados sejam acessados rapidamente a partir de qualquer localização.
O Cassandra usa um modelo de dados baseado em coluna, o que significa que os dados são armazenados em colunas em vez de linhas, o que permite uma melhor flexibilidade no esquema de dados. Além disso, ele oferece uma linguagem de consulta chamada CQL (Cassandra Query Language) para manipulação de dados.
O Cassandra é usado por empresas de grande porte para armazenar e processar grandes quantidades de dados em tempo real, incluindo empresas como Apple, Netflix, eBay e outras.
Objetivo
Após realizar este Curso Cassandra Developer você será capaz de:
- Arquiteto e engenheiro de bancos de dados NoSQL Cassandra
- Dados do modelo em Cassandra
- Acessando Cassandra usando CQL e Java
- Garantindo altas velocidades de leitura/gravação, mantendo a consistência dos dados
- Integrando Cassandra com Hadoop, Pig e Hive
- Implementando padrões de design Cassandra comumente usados
Porque devo aprender cassandra database?
-
Escalabilidade: O Cassandra é um banco de dados altamente escalável e pode lidar com grandes volumes de dados em vários centros de dados, permitindo que você expanda seu armazenamento de dados à medida que sua empresa cresce.
-
Disponibilidade: O Cassandra é altamente tolerante a falhas e pode garantir alta disponibilidade em casos de interrupções ou falhas no sistema, garantindo que seus dados estejam sempre disponíveis.
-
Desempenho: O Cassandra é otimizado para trabalhar com grandes volumes de dados, permitindo que você processe e consulte dados rapidamente, mesmo em cenários de tempo real.
-
Flexibilidade de esquema: O Cassandra usa um modelo de dados baseado em colunas que oferece flexibilidade no esquema de dados, permitindo que você faça alterações no esquema de dados sem afetar a integridade dos dados já existentes.
-
Popularidade: O Cassandra é uma tecnologia popular usada por empresas de grande porte em todo o mundo, incluindo empresas como Apple, Netflix, eBay e outras, o que significa que é uma habilidade valiosa para adicionar ao seu currículo.
Publico Alvo
- Arquiteto e engenheiro de bancos de dados NoSQL Cassandra
- Dados do modelo em Cassandra
- Acessando Cassandra usando CQL e Java
- Garantindo altas velocidades de leitura/gravação, mantendo a consistência dos dados
- Integrando Cassandra com Hadoop, Pig e Hive
- Implementando padrões de design Cassandra comumente usados
O Cassandra é uma tecnologia popular em empresas que precisam armazenar e processar grandes quantidades de dados, em vários centros de dados e com alta disponibilidade. Portanto, quem trabalha com grandes volumes de dados em uma organização pode se beneficiar ao aprender o Cassandra.
Em particular, os desenvolvedores que trabalham com aplicativos web e móveis que precisam lidar com grandes volumes de dados, incluindo dados de usuário, podem se beneficiar ao aprender o Cassandra. Os administradores de banco de dados também podem se beneficiar ao aprender o Cassandra para configurar, gerenciar e manter os bancos de dados distribuídos.
Os cientistas de dados e analistas que precisam trabalhar com grandes quantidades de dados também podem se beneficiar ao aprender o Cassandra, especialmente se estiverem trabalhando com dados em tempo real ou com necessidade de escala.
Em resumo, qualquer pessoa que trabalhe com grandes quantidades de dados pode se beneficiar ao aprender o Cassandra, incluindo desenvolvedores, administradores de banco de dados e cientistas de dados.
Pre-Requisitos
- Conhecimento básico de Linux
Materiais
Português/Inglês + Exercícios + Lab Pratico
Conteúdo Programatico
Cassandra Fundamentals and Features
- Distributed and Decentralized
- Elastic Scalability
- High Availability and Fault Tolerance
- Tune-able Consistency
- Row-Oriented
- Schema-Free
- High Performance
The Cassandra Data Model
- The Relational Data Model
- A Simple Introduction
- Clusters
- Keyspaces
- Hands-on Session
Installation and Setup of Cassandra
- Single Node Setup
- Multi-Node Cluster Setup
- Key Configurations for Cassandra
- CLI and Hands-On with Cassandra
Cassandra Modeling
- Cassandra (Column Family NoSQL DB)
- Key Concepts
- Key Space
- Column Family
- Column Family Options
- Wide Rows
- Skinny Row
- Column Sorting
- Super Columns
- Counter Column Family
- Composite Keys and Columns
- Time To Live
- Secondary Indexes in Cassandra
- A comparison between Custom Indexes and Secondary Indexes
- A comparison between Relational Modeling and Cassandra Modeling
- Key Points while modeling a Cassandra Database
- Patterns and Anti-Patterns in Cassandra Modeling
Cassandra Architecture & Intro to CQL
- Anatomy of Reading operation in Cassandra
- Anatomy of the Write operation in Cassandra
- How is Deletes handled in Cassandra
- System Keyspace
- Peer to Peer Model Logical Data Model: Keyspace, Column Family/Table, Rows, Columns
- Traditional Ring design vs. VNodes
- Partitioners: Murmer3, Random (md5) and ByteOrdered
- Gossip and Failure Detection
- Anti-Entropy and Read Repair
- Memtables, SSTables and Commit Log
- Compaction fundamentals to reduce SSTable data files
- Hinted Handoff
- Compaction
- Bloom Filters, Tombstones
- Managers and Services
- VNodes
- Indexes and Caches
- Coordinator node
- Seed nodes
- Write/Read consistency levels: Any, One, Two, Three, Quorum
- Snitches: Dynamic snitching, Simple Snitch, Rack Inferring Snitch, Property File Snitch, Gossiping Property File Snitch
- Routing Client requests
- Nodetool commands: gossipinfo, cfstats, describing
- YAML file fundamentals
- Operations management web GUI
- Stress testing Cassandra
- CQL command fundamentals
Cassandra API
- Key concepts for Reading and Write in Cassandra
- Tunable Consistency
- Simple Get, Multi-get Slice
- Range and Slice
- Slice Predicate
- Delete
- Hands-on CLI commands
Cassandra CQSHL
- SQL over Cassandra
- Composite Keys
- Hands-on examples on CQL 3.0
Cassandra Clients
- How to establish Client Connections
- Thrift Client
- Connection Pooling
- Auto-discovery and Failover in Hector
- Client with CQL
Cassandra Monitoring and Administration
- Backup and Recovery methods
- Tuning Cassandra
- Balancing
- Bootstrapping
- Node Tools Commands
- Upgrades
- Monitoring critical metrics
- Bulk Loading Data to Cassandra
- Bulk Export of Data from Cassandra
- Hands-on Examples for each of them
Cassandra Analytics Cluster
- Cassandra Hadoop Integration
Cassandra Search Cluster
- Integration of Solr with Cassandra
- Search Query on Cassandra
TENHO INTERESSE