Visão Geral
O reconhecimento de texto em imagens, conhecido como OCR (Optical Character Recognition), é uma das aplicações mais clássicas e úteis da Visão Computacional. Presente em digitalização de documentos, leitura automática de placas e extração de informações, o OCR exige uma combinação sólida de processamento de imagens e Inteligência Artificial. Neste curso, você irá aprender a construir sistemas completos de reconhecimento de texto utilizando ferramentas consolidadas como OpenCV e Tesseract OCR, seguindo uma abordagem prática e estruturada.
Conteúdo Programatico
Module 1 – Introduction to OCR
- What is OCR
- History and evolution
- Applications and use cases
- OCR pipeline overview
Module 2 – Image Preprocessing for OCR
- Grayscale conversion
- Noise reduction
- Thresholding techniques
- Image binarization
Module 3 – Text Detection in Images
- Detecting text regions
- Bounding boxes
- Layout analysis
- Practical examples
Module 4 – Using Tesseract OCR
- Installing and configuring Tesseract
- Extracting text from images
- Language configuration
- Improving recognition accuracy
Module 5 – Advanced OCR Techniques
- Handling complex backgrounds
- Skew correction
- Multi-line text recognition
- Post-processing text
Module 6 – Deep Learning for OCR
- CNNs for text recognition
- Sequence models (RNN, LSTM)
- End-to-end OCR systems
- Practical applications
Module 7 – OCR Optimization and Evaluation
- Accuracy metrics
- Error correction
- Improving performance
- Real-world challenges
Module 8 – Project: OCR Application
- Building a complete OCR system
- Document processing
- Text extraction and validation
- Final project presentation