Curso Speech Recognition e Conversational AI Fundamentos e Aplicacoes Praticas
32 horas Curso PraticoVisão Geral
O Curso Speech Recognition e Conversational AI Fundamentos e Aplicacoes Praticas é uma capacitação de 32 horas (4 semanas, 08 horas/semana) para estudantes, desenvolvedores e profissionais de TI. Ensina a criar sistemas de reconhecimento de fala e chatbots conversacionais com Python, usando ferramentas como SpeechRecognition, PyTorch, Rasa e Dialogflow.
Justificativa da Necessidade
O mercado de IA cresce rapidamente, com 290 mil vagas previstas até 2024. Speech recognition e conversational AI lideram inovações em assistentes virtuais e chatbots, mas faltam profissionais qualificados. O curso capacita para desenvolver sistemas práticos, promovendo empregabilidade e transformação digital.
Objetivo
Após realizar ete Curso Speech Recognition e Conversational AI Fundamentos e Aplicacoes Praticas você será capaz de:
- Compreender speech recognition
- Aplicar conversational AI
- Usar SpeechRecognition, PyTorch, Rasa, Dialogflow
- Desenvolver transcrição de áudio
- Criar chatbot com APIs
- Construir assistente de voz
- Aplicar boas práticas e ética
- Desenvolver portfólio
Publico Alvo
- Estudantes: Ciência da computação, engenharia
- Desenvolvedores: Profissionais de TI
- Entusiastas: Interessados em IA
- Nível: Iniciante a intermediário
- Pré-requisitos: Python básico, Git/GitHub, Anaconda, VS Code
- Motivações: Criar assistentes, chatbots, ingressar em IA
Informações Gerais
Benefícios para Participantes
- Habilidades em speech e IA conversacional
- Empregabilidade (290 mil vagas)
- Projetos inovadores
- Portfólio com assistente de voz
- Transformação digital
Benefícios para o Mercado
- Suprir demanda por talentos
- Inovação em educação, saúde
- Inclusão digital
- Crescimento econômico
Materiais
Inglês/Português/Lab PráticoConteúdo Programatico
Módulo 1: Introdução ao Speech Recognition
- Objetivo: Compreender fundamentos e aplicações
- Tópicos Teóricos: Definição, componentes, tecnologias (Google Speech), desafios, case de call center
- Atividades Práticas: Configurar ambiente, criar script de transcrição, testar configurações, discutir aplicações
- Ferramentas: Python 3.8+, Anaconda, SpeechRecognition, PyAudio, GitHub
- Saídas: Ambiente configurado, script de transcrição, relatório (150 palavras)
- Relevância: Demanda em assistentes e automação
Módulo 2: Processamento de Áudio
- Objetivo: Processar áudio para precisão
- Tópicos Teóricos: Áudio digital, MFCCs, pré-processamento, Librosa, case de IoT
- Atividades Práticas: Processar áudio com Librosa, criar pipeline, comparar precisão, propor melhorias
- Ferramentas: Python 3.8+, Librosa, SciPy, SpeechRecognition, GitHub
- Saídas: Pipeline de áudio, relatório (200 palavras), áudio processado
- Relevância: Robustez em condições adversas
Módulo 3: Modelos de Machine Learning
- Objetivo: Aplicar modelos de fala
- Tópicos Teóricos: HMM, Transformers, datasets (LibriSpeech), PyTorch, case multilíngue
- Atividades Práticas: Treinar modelo PyTorch, usar DeepSpeech, ajustar hiperparâmetros, comparar precisão
- Ferramentas: Python 3.8+, PyTorch, DeepSpeech, Common Voice, GitHub
- Saídas: Modelo treinado, script DeepSpeech, relatório (200 palavras)
- Relevância: Base de sistemas comerciais
Módulo 4: Aplicações Práticas
- Objetivo: Desenvolver aplicações com APIs
- Tópicos Teóricos: Comandos, transcrição, APIs (Google Speech), case de aulas online
- Atividades Práticas: Criar sistema de comandos, integrar Google Speech, desenvolver app web, testar aplicações
- Ferramentas: Python 3.8+, SpeechRecognition, Google Cloud SDK, Node.js 16+, GitHub
- Saídas: Sistema de comandos, app web, documentação (200 palavras)
- Relevância: Acessibilidade e IoT
Módulo 5: Fundamentos de Conversational AI
- Objetivo: Criar chatbot básico
- Tópicos Teóricos: Chatbots, intents, Rasa, case de e-commerce, desafios
- Atividades Práticas: Configurar Rasa, definir intents/entities, testar chatbot, simular atendimento
- Ferramentas: Python 3.8+, Rasa, GitHub
- Saídas: Chatbot Rasa, arquivos de configuração, relatório (150 palavras)
- Relevância: Automação de atendimento
Módulo 6: Processamento de Linguagem Natural
- Objetivo: Melhorar interações com NLP
- Tópicos Teóricos: Tokenização, BERT, datasets (SNIPS), spaCy, case de intents
- Atividades Práticas: Processar texto com spaCy, treinar modelo Hugging Face, integrar BERT ao Rasa, comparar precisão
- Ferramentas: Python 3.8+, spaCy, Hugging Face, Rasa, GitHub
- Saídas: Script spaCy, modelo de intents, chatbot aprimorado, relatório (200 palavras)
- Relevância: Base de chatbots avançados
Módulo 7: Chatbots Conversacionais Avançados
- Objetivo: Criar chatbots com APIs
- Tópicos Teóricos: Diálogo gerenciado, APIs (OpenWeather), UX, case educacional
- Atividades Práticas: Criar chatbot Rasa com API, implementar diálogo, desenvolver interface web, testar interações
- Ferramentas: Python 3.8+, Rasa, OpenWeather, Node.js 16+, GitHub
- Saídas: Chatbot com API, interface web, documentação (200 palavras)
- Relevância: Automação em varejo
Módulo 8: Projeto Final - Assistente de Voz
- Objetivo: Integrar speech e IA conversacional
- Tópicos Teóricos: Integração, aplicações, ética, mercado (290 mil vagas), case médico
- Atividades Práticas: Desenvolver assistente, criar README, apresentar projeto, pitch de inovação
- Ferramentas: Python 3.8+, SpeechRecognition, Rasa, PyTorch, Google Speech, GitHub
- Saídas: Assistente funcional, README, apresentação, pitch (200 palavras)
- Relevância: Valor em startups e saúde