Curso Quantization Techniques

32h

Visão Geral

Este curso aborda as principais técnicas de quantização utilizadas em Large Language Models (LLMs), modelos de Deep Learning e aplicações de Inteligência Artificial Generativa. O participante aprenderá como reduzir o consumo de memória, aumentar a velocidade de inferência e otimizar custos computacionais por meio da utilização de representações numéricas de menor precisão. O curso explora métodos como Post-Training Quantization (PTQ), Quantization-Aware Training (QAT), GPTQ, AWQ, GGUF, bitsandbytes e outras abordagens modernas utilizadas em ambientes corporativos e de produção.

Objetivo

Após realizar este curso, você será capaz de:

Compreender os fundamentos matemáticos da quantização de modelos de IA
Avaliar os impactos da quantização em desempenho, precisão e consumo de recursos
Implementar diferentes técnicas de quantização em modelos de Deep Learning e LLMs
Selecionar estratégias adequadas para cenários de inferência e produção
Otimizar modelos para execução em ambientes com recursos limitados
Implantar modelos quantizados de forma eficiente e segura em ambientes corporativos

Publico Alvo

Engenheiros de Machine Learning
Engenheiros de IA Generativa
Cientistas de Dados
Arquitetos de IA e soluções inteligentes
Desenvolvedores de aplicações baseadas em LLMs
Profissionais envolvidos em otimização e implantação de modelos de IA

Pre-Requisitos

Conhecimentos de Machine Learning e Deep Learning
Familiaridade com Python
Conhecimentos básicos de Transformers e Large Language Models
Noções de hardware, GPUs e inferência de modelos são recomendadas

Conteúdo Programatico

Module 1: Introduction to Model Quantization

Fundamentals of model optimization
Challenges of large-scale AI models
Quantization concepts and objectives
Benefits and trade-offs
Enterprise use cases
Quantization ecosystem overview

Module 2: Numerical Representations and Precision

Floating-point representations
FP32, FP16 and BF16 formats
Integer representations
Precision and accuracy concepts
Numerical stability considerations
Hardware implications

Module 3: Foundations of Quantization

Quantization theory
Scale and zero-point concepts
Uniform and non-uniform quantization
Static and dynamic quantization
Error analysis techniques
Quantization performance metrics

Module 4: Post-Training Quantization (PTQ)

PTQ fundamentals
Calibration datasets
Weight quantization
Activation quantization
Accuracy preservation strategies
PTQ implementation workflows

Module 5: Quantization-Aware Training (QAT)

QAT architecture
Simulated quantization during training
Training optimization strategies
Accuracy improvement techniques
Fine-tuning quantized models
QAT implementation practices

Module 6: Quantization for Large Language Models

LLM-specific quantization challenges
Memory optimization strategies
Quantization of transformer architectures
Attention layer considerations
Inference optimization
Enterprise deployment scenarios

Module 7: Modern Quantization Methods

GPTQ fundamentals
AWQ concepts
SmoothQuant techniques
Activation-aware quantization
Advanced quantization approaches
Comparative analysis of methods

Module 8: Low-Bit Quantization Techniques

INT8 quantization
INT4 quantization
8-bit and 4-bit inference
Mixed-precision techniques
Extreme quantization approaches
Performance trade-offs

Module 9: Quantization Tooling and Frameworks

bitsandbytes overview
GGUF format fundamentals
Quantization libraries
Model conversion workflows
Open-source tooling ecosystem
Integration best practices

Module 10: Deployment and Performance Optimization

Quantized model serving
CPU and GPU optimization
Edge AI deployment
Throughput and latency tuning
Cost optimization strategies
Production readiness validation

Module 11: Governance, Security and Operational Considerations

AI governance requirements
Validation and quality controls
Model lifecycle management
Monitoring quantized models
Security considerations
Responsible AI practices

Module 12: Quantization Workshop

PTQ implementation exercises
QAT laboratory
GPTQ and AWQ experimentation
LLM quantization projects
Performance benchmarking activities
Final enterprise quantization optimization project

TENHO INTERESSE

Cursos Relacionados

Curso TensorFlow

24 Horas

Ver Curso

Curso Machine Learning Python & R In Data Science

32 Horas

Ver Curso

Curso Container Management with Docker

24 Horas

Ver Curso

Curso Docker Advanced

16 horas

Ver Curso

Curso Docker for Developers and System Administrators

16 horas

Ver Curso

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

40 horas Curso Pratico

Ver Curso

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

32h

Ver Curso

Curso Generative AI Application Deployment and Monitoring

20 horas

Ver Curso

Curso Engenharia de IA Generativa com Databricks

16 horas

Ver Curso

Curso MCP Advanced Secure & Enterprise Integrations

20 horas

Ver Curso

Curso Quantization Techniques

Curso Quantization Techniques

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso TensorFlow

Curso Machine Learning Python & R In Data Science

Curso Container Management with Docker

Curso Docker Advanced

Curso Docker for Developers and System Administrators

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

Curso Generative AI Application Deployment and Monitoring

Curso Engenharia de IA Generativa com Databricks

Curso MCP Advanced Secure & Enterprise Integrations

O que você quer aprender hoje?

Curso Quantization Techniques

Curso Quantization Techniques

Visão Geral

Objetivo

Publico Alvo

Pre-Requisitos

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso TensorFlow

Curso Machine Learning Python & R In Data Science

Curso Container Management with Docker

Curso Docker Advanced

Curso Docker for Developers and System Administrators

Curso Python com Inteligencia Artificial Generativa OpenAI Hugging Face

Curso AI Project Manager Gestao de Projetos com Inteligencia Artificial

Curso Generative AI Application Deployment and Monitoring

Curso Engenharia de IA Generativa com Databricks

Curso MCP Advanced Secure & Enterprise Integrations