Visão Geral
No Curso MarkLogic Data Curation, você aprenderá a construir um MarkLogic Data Hub alimentado pelo banco de dados MarkLogic para ajudar a acelerar projetos de integração de dados e entregar valor mais rápido aos seus clientes.
Objetivo
Ao participar do Curso MarkLogic Data Curation, os participantes aprenderão a:
- Desenvolva, teste, depure e implante código personalizado usando um IDE local (Visual Studio Code)
- Use código personalizado durante a ingestão, mapeamento e masterização
- Implementar um modelo de entidade que inclua aninhamento e relacionamentos
- Carregue dados de diversas fontes
- Carregue dados usando vários métodos e descreva os casos de uso e as práticas recomendadas para cada método
- Use código personalizado durante a ingestão de dados
- Implementar configurações de mapeamento para um modelo de dados mais complexo
- Implemente configurações de masterização inteligentes com mais complexidade e personalização
Publico Alvo
O Curso MarkLogic Data Curationé ideal para:
- Arquitetos de dados, desenvolvedores MarkLogic, engenheiros de dados
Pre-Requisitos
- Conhecimento do Hub Central
- Conhecimento de segurança MarkLogic
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Data Services First
- Understand the high-level approach to data integration projects using the MarkLogic Data Hub
- Understand the customer and business requirement for the course hands-on project
- Understand the user stories and technical requirements for the course hands-on project
- Understand the data sources available for the course hands-on project
The MarkLogic Data Hub
- Understand what it is
- Understand what it does
- Initialize and install a new MarkLogic Data Hub project
Implement Security
- Create users and roles for both business users and members of the technical project team
- Understand how to use Data Hub specific roles
- Implement role hierarchies
- Assign execute privileges necessary to meet project requirements
- Deploy security configuration using QuickStart and ml-gradle
Create an Entity
- Create a new entity
- Define properties
- Configure Indexed
- Protect access to PII (personally identifiable information)
Ingest Data
- Create flow pipelines
- Configure ingestion steps
- Understand the purpose and use of the staging and final databases in a MarkLogic Data Hub
- Implement key data modeling concepts including document URIs, collections, document permissions, property naming best practices, geospatial data modeling patterns, denormalization, and the use of the envelope pattern
Curate Data
- Configure mapping steps
- Use pre-built mapping functions
- Program, deploy and use a custom mapping function
- Test and debug mapping steps
Use Semantics
- Understand key semantic data modeling concepts including triples, IRIs, ontology triples, managed and unmanaged triples
- Load triples to a MarkLogic Data Hub
- Program, deploy and use a custom harmonization step to add triples to the envelope of a document
Access Data
- Explore the use of JavaScript APIs
- Explore the use of SPARQL
- Validate that the curated data from the hub can be used to meet the business and technical requirements for the hands-on project
Adapt to Change: Perform Another Iteration of Ingest | Curate | Access
- Ingest a new data source
- Curate the new data so that it can be consumed in the same way as existing data
Use Smart Mastering
- Configure a matching step
- Configure a merging step
- Test Smart Mastering
- Explore mastered data
TENHO INTERESSE