Visão Geral
Curso Text Mining with R. Estima-se que mais de 70% das informações comerciais potencialmente utilizáveis não são estruturadas, muitas vezes na forma de dados de texto. A mineração de texto fornece uma coleção de técnicas que nos permitem obter insights acionáveis desses dados.
O Curso Text Mining with R cobrirá as diversas ferramentas e principais técnicas de mineração e análise de dados de texto para descobrir padrões interessantes, extrair conhecimento útil e apoiar a tomada de decisões, com ênfase em abordagens estatísticas, para dar sentido a dados não estruturados. Trabalhe com um exemplo vivo de extração de dados da Web e execute todas as facetas da mineração de texto usando R.
Objetivo
Ao participar do Curso Text Mining with R, os participantes aprenderão:
- Análise de sentimentos
- Palavra nuvem
- Ngramas
- Modelagem de Tópico
- LDA
- Extraindo texto de mídias sociais
Publico Alvo
- Cientistas de Dados
- Analistas de dados
- Analistas Financeiros
- Profissionais de marketing
Pre-Requisitos
- Conhecimento básico de R.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Introduction
- What is text mining
- Applications of text mining
Basic Text Functions
- Text manipulation functions
- Working with strings
- Working with gsub
- Advanced methods
- Convert to corpus
Importing Data
- Converting docx into corpus
- Converting pdf into corpus
- Converting html to corpus
- Web scraping
Tidytext Package
- Tidying text objects
- Tidying document term matrix objects
- Tidying document frequency matrix objects
- Tidying corpus objects
- Mining literacy works
Word Frequencies & Relationships
- Pre-processing text
- Wordcloud
- Frequency analysis
- nGrams & bigrams
- Bigrams for sentiment analysis
- Visualizing bigrams network
Sentiment Analysis
- Sentiment libraries
- Analyzing positive & negative words
- Comparing 3 sentiment libraries
- Common positive & negative words
Topic Modelling
- Latent Semantic Indexing (LSI)
- Latent Dirichlet Allocation (LDA)
- Word topic probabilities
- Document - topic probabilities
- Chapters probabilities
- Per document classification
Document Similarity & Classifier
- Text alignment & pairwise comparison
- Minihashing and locality sensitive hashing
- Extract key words
- Classify by location, language, topic
Working internet and social media (Optional)
- Extracting data from amazon
- Extracting data from twitter
- Extracting youtube comments
- Extracting facebook comments
TENHO INTERESSE