Curso Generative AI Application Deployment and Monitoring
20 horasVisão Geral
O curso Generative AI Application Deployment and Monitoring oferece uma jornada prática e abrangente para profissionais que desejam aprender como implantar, gerenciar e monitorar aplicações baseadas em modelos de IA generativa, com foco em LLMs (Large Language Models). Exploraremos os fundamentos da implantação de modelos, métodos modernos de entrega (batch e real-time), além de práticas essenciais de observabilidade e LLMOps, garantindo robustez, desempenho e escalabilidade em sistemas de IA generativa.
Objetivo
Após realizar este Curso Generative AI Application Deployment and Monitoring, você será capaz de:
- Compreender e aplicar métodos de implantação de modelos generativos
- Utilizar workflows de inferência em batch e em tempo real
- Servir e gerenciar LLMs com ferramentas como Databricks Model Serving
- Implantar pipelines de IA com monitoramento e testes A/B
- Aplicar conceitos de LLMOps para manutenção e governança de sistemas de IA generativa
Publico Alvo
- Engenheiros de Machine Learning
- Engenheiros de Dados
- Cientistas de Dados
- Profissionais de DevOps com foco em IA
- Arquitetos de soluções baseadas em IA
- Desenvolvedores interessados em IA generativa aplicada
Pre-Requisitos
- Conhecimento básico de Machine Learning e modelos de IA generativa
- Experiência com Python e APIs REST
- Familiaridade com ambientes como Databricks, AWS, Azure ou GCP (desejável)
- Noções de MLOps e ferramentas de CI/CD (desejável)
Conteúdo Programatico
Módulo 1 – Fundamentos da Implantação de Modelos
- Introdução à implantação de aplicações de IA
- Fundamentos da gestão de modelos e versionamento
- Visão geral dos métodos de implantação (batch, real-time, pipelines)
- Ciclo de vida da entrega de modelos em produção
Módulo 2 – Implantação em Lote (Batch Deployment)
- Introdução à inferência em lote
- Casos de uso e limitações
- Workflow de inferência em lote com SLMs (Self-learning Models)
- Automação de execuções com notebooks e pipelines
Módulo 3 – Implantação em Tempo Real (Real-Time Deployment)
- Conceitos de model serving em tempo real
- Servindo modelos treinados no Databricks
- Integração com APIs REST para inferência em tempo real
- Servindo modelos externos com Databricks Model Serving
- Implantação de cadeias LLM (LLM Chains) usando LangChain ou similares
- Estratégias de implantação com testes A/B e rollback
Módulo 4 – Monitoramento de Sistemas de IA Generativa
- Introdução ao monitoramento de aplicações de IA
- Métricas chave: latência, acurácia, deriva de dados, consumo de recursos
- Monitoramento de pipelines com MLflow e Databricks
- Observabilidade em cadeias RAG (Retrieval-Augmented Generation)
- Monitoramento contínuo e alertas automatizados
Módulo 5 – Conceitos de LLMOps
- Introdução ao MLOps tradicional
- Diferenças entre MLOps e LLMOps
- Desafios exclusivos na entrega e operação de LLMs
- Estratégias de automação e governança para LLMs
- Gerenciamento de experimentos, reuso e rastreabilidade
- Ferramentas e práticas recomendadas em LLMOps