Curso Text Analytics and Natural Language Processing NLP with R

  • RPA | IA | AGI | ASI | ANI | IoT | PYTHON | DEEP LEARNING

Curso Text Analytics and Natural Language Processing NLP with R

24 horas
Visão Geral

O Curso Text Analytics and Natural Language Processing NLP with R, cobre métodos para ingerir dados de texto de uma variedade de fontes, como arquivos de texto simples, PDFs ou a web, e depois processar esses dados usando o processamento de linguagem natural mais recente e profundo técnicas de aprendizagem.

Objetivo

Ao participar do Curso Text Analytics and Natural Language Processing NLP with R, os participantes aprenderão a:

  • Importe dados de texto de vários formatos de origem
  • Tokenizar dados de texto em unidades significativas
  • Discutir dados de texto usando funções textuais específicas
  • Calcular medidas de agregação em dados tokenizados
  • Traduzir entre formatos de dados de texto
  • Conclua uma análise de sentimento
  • Realizar classificação de documentos
  • Execute a modelagem de tópicos
  • Construiu uma rede neural simples apropriada para modelagem de PNL
Pre-Requisitos
  • Conhecimento prático da linguagem R, RStudio e dos pacotes dplyr/tidyverse.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico

Working with unstructured text data

  1. string methods
  2. regex
  3. reading in text files
  4. review of base (R/Python)

Importing

  1. parsing data from a text file
  2. importing it into a tidy structure
  3. parsing data from a pdf
    1. From a "pile of pdfs"
  4. scraping data from the web
  5. Discussion of other methods
    1. OCR
    2. Handwriting recognition

Managing Text Data 1

  1. a tidy text format
  2. Overview of text data formats
    1. tidy text
    2. token list
    3. Bag of words
    4. document term matrix or document frequency matrix (dfm/dt)
    5. corpus
    6. docvars
  3. associated formats
    1. stop words
    2. Sentiment lexica
    3. word vectors / models

Managing Text Data 2

  1. tokenizing text
  2. units of tokenization
    1. tokens
    2. lemma
    3. stems
    4. n-grams
    5. sentences
    6. Tweets
  3. Tf-idf
  4. Log-odds (tidylo)

Sentiment Analysis

  1. Sentiment lexica
  2. Sentiment analysis with inner_join
  3. Analyzing by other units
  4. Valence shifting
  5. VADER

Document Classification

  1. Text similarity - stringiest
    1. Cosine
    2. Edit distance
  2. Machine Learning for document classification
    1. Naive Bayes model

Modeling / Document Clustering

  1. LDA
  2. stm

Text and Deep Learning

  1. Deep learning introduction
  2. Architecture of neural networks
  3. Tensorflow + keras
  4. Word vectors
    1. word2vec
    2. Text2vec
    3. GloVe
    4. Spacy
  5. Combining Deep Learning and NLP
    1. CNN
    2. RNN
    3. LSTM
  6. Named Entity Recognition (NER)
  7. Part of Speech tagging (POS)
  8. Dependency Parsing
TENHO INTERESSE

Cursos Relacionados

Curso AI ML Toolkits with Kubeflow Foundation

24 horas

Curso Container Management with Docker

24 Horas

Curso Machine Learning Python & R In Data Science

32 Horas

Curso Docker for Developers and System Administrators

16 horas

Curso artificial inteligence AI for Everyone Foundation

16 horas

Curso IA Inteligência Artificial e Código Aberto Foundation

16 horas

Curso Artificial Intelligence with Azure

24 Horas

Curso RPA Robotic Process Automation Industria 4.0

32 horas