Curso Open Source LLM Deployment

40h

Visão Geral

Este curso aborda a implantação, operação e gerenciamento de Large Language Models (LLMs) Open Source em ambientes corporativos. O participante aprenderá a selecionar modelos adequados, preparar infraestrutura, realizar otimizações de desempenho, implementar arquiteturas de inferência escaláveis e operar soluções de IA Generativa utilizando modelos de código aberto. O curso explora tecnologias como Llama, Mistral, Qwen, Gemma, DeepSeek, vLLM, Ollama, Hugging Face, Kubernetes e plataformas de inferência modernas, com foco em ambientes de produção.

Objetivo

Após realizar este curso, você será capaz de:

Compreender o ecossistema de modelos Open Source para IA Generativa
Selecionar modelos adequados para diferentes cenários corporativos
Implantar LLMs em ambientes locais, cloud e híbridos
Configurar plataformas modernas de inferência para alta performance e escalabilidade
Implementar observabilidade, segurança e governança em ambientes de produção
Operar e otimizar soluções corporativas baseadas em LLMs Open Source

Publico Alvo

Engenheiros de IA e Machine Learning
Engenheiros MLOps e LLMOps
Arquitetos de Soluções
Administradores de Infraestrutura e Cloud
Profissionais DevOps e Platform Engineering
Desenvolvedores de aplicações baseadas em IA Generativa

Pre-Requisitos

Conhecimentos básicos de Inteligência Artificial e Large Language Models
Familiaridade com Linux e linha de comando
Conhecimentos de containers e Kubernetes são recomendados
Experiência com ambientes cloud ou infraestrutura corporativa é desejável

Conteúdo Programatico

Module 1: Introduction to Open Source LLMs

Evolution of open-source AI
Open-source versus proprietary models
Enterprise adoption drivers
Open-source AI ecosystem overview
Licensing considerations
Model selection strategies

Module 2: Overview of Modern Open Source LLMs

Llama family models
Mistral and Mixtral models
Qwen model ecosystem
Gemma models
DeepSeek models
Emerging open-source models

Module 3: Infrastructure Fundamentals for LLM Deployment

Compute requirements
GPU architectures and selection
CPU-based inference considerations
Memory planning strategies
Storage requirements
Networking fundamentals

Module 4: Model Acquisition and Management

Hugging Face ecosystem
Model repositories
Model versioning
Artifact management
Secure model distribution
Enterprise model governance

Module 5: Local and Single-Node Deployments

Ollama deployment architecture
LM Studio environments
Local inference workflows
Quantized model execution
Performance tuning
Resource optimization

Module 6: Production Inference Platforms

vLLM architecture
Text Generation Inference (TGI)
SGLang fundamentals
High-performance serving frameworks
Throughput optimization
Latency management

Module 7: Containerization and Kubernetes Deployment

Containerizing LLM workloads
Docker best practices
Kubernetes architecture
GPU scheduling
Scaling strategies
High-availability deployments

Module 8: Performance Optimization and Quantization

Model quantization strategies
GPTQ and AWQ implementations
Memory optimization
Throughput tuning
Cost-performance trade-offs
Hardware acceleration techniques

Module 9: Security and Governance

Secure model deployment
Identity and access management
API security controls
Data privacy considerations
AI governance requirements
Compliance and auditability

Module 10: Monitoring, Observability and LLMOps

LLM observability fundamentals
Metrics collection
Performance monitoring
Log management
Capacity planning
Operational excellence practices

Module 11: Enterprise Integration Architectures

API gateway integration
RAG integration patterns
Agent architectures
Multi-model routing
Hybrid AI environments
Enterprise architecture patterns

Module 12: Open Source LLM Deployment Workshop

Ollama deployment laboratory
vLLM production deployment exercises
Kubernetes deployment projects
Quantization and optimization activities
Monitoring and governance implementation
Final enterprise open-source LLM deployment project

TENHO INTERESSE

Cursos Relacionados

Curso TensorFlow

24 Horas

Ver Curso

Curso Machine Learning Python & R In Data Science

32 Horas

Ver Curso

Curso Container Management with Docker

24 Horas

Ver Curso

Curso Docker Advanced

16 horas

Ver Curso

Curso Docker for Developers and System Administrators

16 horas

Ver Curso

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

40 horas Curso Pratico

Ver Curso

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

32h

Ver Curso

Curso Generative AI Application Deployment and Monitoring

20 horas

Ver Curso

Curso Engenharia de IA Generativa com Databricks

16 horas

Ver Curso

Curso MCP Advanced Secure & Enterprise Integrations

20 horas

Ver Curso

Curso Open Source LLM Deployment

Curso Open Source LLM Deployment

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso TensorFlow

Curso Machine Learning Python & R In Data Science

Curso Container Management with Docker

Curso Docker Advanced

Curso Docker for Developers and System Administrators

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

Curso Generative AI Application Deployment and Monitoring

Curso Engenharia de IA Generativa com Databricks

Curso MCP Advanced Secure & Enterprise Integrations

O que você quer aprender hoje?

Curso Open Source LLM Deployment

Curso Open Source LLM Deployment

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso TensorFlow

Curso Machine Learning Python & R In Data Science

Curso Container Management with Docker

Curso Docker Advanced

Curso Docker for Developers and System Administrators

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

Curso Generative AI Application Deployment and Monitoring

Curso Engenharia de IA Generativa com Databricks

Curso MCP Advanced Secure & Enterprise Integrations