Visão Geral
Curso Text Mining ou a mineração de texto é um processo que exige muito conhecimento e é uma habilidade fundamental no mundo atual, orientado pela informação. Envolve interagir com coleções de documentos baseados em texto usando ferramentas de análise poderosas para descobrir insights e padrões valiosos em vastas fontes de dados, sejam relatórios, artigos ou dados de mídia social. Neste Curso de Ciência de Dados, os participantes embarcam em uma jornada para dominar a mineração de texto, um conjunto de habilidades crucial para profissionais que navegam no mar de informações textuais.
Compreender a mineração de texto é vital para profissionais de diversas áreas, incluindo analistas de dados, pesquisadores de mercado, criadores de conteúdo e cientistas da informação. À medida que o conteúdo digital continua a explodir, a capacidade de extrair informações significativas de fontes de texto torna-se uma vantagem competitiva.
O Curso Text Mining oferece uma compreensão abrangente das operações de mineração de texto e técnicas de pré-processamento. Os delegados irão aprofundar os meandros da categorização de texto, explorar algoritmos significativos, aproveitar dados não rotulados de forma eficaz e avaliar classificadores de texto para melhorar a precisão. O treinamento aprimora a capacidade de ajustar os processos de mineração de texto por meio de restrições e filtros de especificação
Objetivo
Após realizar este Curso Text Mining com êxito você será capaz de:
- Compreender os fundamentos das técnicas de mineração e pré-processamento de texto
- Para utilizar algoritmos-chave para categorização de texto eficiente
- Para avaliar e aprimorar classificadores de texto usando dados não rotulados
- Para obter experiência em clustering e extração de informações (IE)
- Explorar técnicas para tratamento de restrições e filtragem de especificações
- Dominar a aplicação de modelos de Markov ocultos e modelos de Markov de entropia máxima para extração de informações
Publico Alvo
- Cientistas de Dados
- Engenheiros de software
- Analistas de dados
- Profissionais de marketing digital
- Gerentes de Produto
- Analistas de Inteligência de Negócios
- Engenheiros de PNL
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Introduction to Text Mining
- What is Text Mining?
- Text Mining Systems Architecture
Core Text Mining Operations
- What is Core Text Mining Operations?
- Text Mining Query Languages
Text Mining Pre-Processing Techniques
- Task-Oriented Approaches
Categorisation
- Text Categorisation Applications
- Document Representation
- Knowledge Engineering to TC
- Using Unlabeled Data
- Evaluating Text Classifiers
Introduction to Clustering
- Partitioning of Networks
- Clustering Tasks in Text Analysis
- Clustering Algorithms
- Clustering of Textual Data
Information Extraction (IE)
- Define Information Extraction
- IE Systems Architecture
- Anaphora Resolution
- IE Inductive Algorithms
- Structural Information Extraction (IE)
Probabilistic Models for IE
- Hidden Markov Models
- Stochastic Context-Free Grammar
- Maximal Entropy Modelling
- Conditional Random Fields
Pre-Processing Applications
- HMM to Textual Analysis Applications
- Using MEMM for IE
- Applications of CRFs to Textual Analysis MEMM for IE
- Using SCFG Rules
- Bootstrapping
Presentation-Layer Considerations
- Browsing
- Accessing Constraints and Simple Specification Filters at the Presentation Layer
- Accessing the Underlying Query Language
Visualisation Approaches
- Architectural Considerations
- Text Mining Visualisation Approaches
- Visualisation Techniques in Link Analysis
Introduction to Link Analysis
- Automatic Layout of Networks
- Paths and Cycles in Graphs
- Centrality
- Partitioning of Networks
- Networks Pattern Matching
TENHO INTERESSE