Curso Web Scraping with Python
16 horasVisão Geral
Nosso Curso Web Scraping with Python, ministrado por instrutor experiente, lhe dará as habilidades para criar scripts automatizados para obter dados da web, com base nos critérios necessários para construir relatórios valiosos em fontes relevantes.
Alguns dos principais casos de uso de Web Scraping incluem:
Monitoramento da concorrência : extração de detalhes de produtos e serviços, como preço, imagens e outros conteúdos, observando as mudanças ao longo do tempo.
Acompanhamento de políticas : extração de circulares de sociedades comerciais e outras organizações, filtrando palavras-chave específicas de interesse.
Coleta de dados de várias fontes : coleta, agregação e análise de dados sobre um conjunto de produtos ou serviços (por exemplo, imóveis) de vários sites, a fim de obter insights mais ricos sobre os itens específicos.
Rastreamento de reputação online : análise de opiniões sobre produtos ou marcas, a partir de análises online ou postagens em blogs.
Coleta de dados para treinamento de sistemas de Aprendizado de Máquina .
Você se beneficiará de extensos laboratórios práticos, ministrados por um especialista em ciência de dados que lhe dará conhecimento suficiente de Python para dar o pontapé inicial em seu projeto.
Objetivo
Após realizar est Curso Web Scraping with Python você será capaz de:
- Python refresher / primer - apenas o suficiente para fazer o que você precisa fazer
- Visão geral de Web Scraping
- Aquisição de dados
- Extração de dados
- Processamento e limpeza de dados
- Armazenamento de dados: bancos de dados relacionais
Publico Alvo
Analistas de dados, analistas de negócios, pesquisadores, desenvolvedores de software que precisam adquirir dados de fontes da web, manipular, limpar e moldar esses dados para suas necessidades comerciais personalizadas.
Pre-Requisitos
Os delegados devem ter alguma experiência em análise de dados usando ferramentas como Excel, Tableau, Power BI ou bancos de dados SQL convencionais. Qualquer experiência existente com a linguagem Python (ou similar) seria muito útil.
Materiais
Inglês | PortuguêsConteúdo Programatico
Python Refresher
- Data structures
- Control flow statements
- Working with files in different formats (CSV, JSON, ...)
Overview on Web Scraping
- What is Web Scraping?
- Web Crawling vs. Web Scraping
- Uses Cases of Web Scraping
- Components of a Web Scraper
- Alternatives to Web Scraping: Using Web APIs
Data Acquisition
- Simple web client using Requests
- Building a crawler using Scrapy
- Simulating user clicks and browser interactions using Selenium
- Handling JavaScript/AJAX in dynamic web pages
- Automatic form submission
Data Extraction
- Data formats: HTML, XML, JSON
- Extracting data from HTML tables using pandas
- Ad-hoc parsing of HTML documents using BeautifulSoup
Data Processing and Cleaning
- Preparing your data for downstream analysis and computation
- Handling missing data and duplicate data
- String manipulation and pattern matching
- Overview on Natural Language Processing tools for dealing with text data
Data Storage: Relational Databases
- Connecting to SQL databases using SQLAlchemy
- Inserting data into SQL databases
- Reading data from SQL databases
- Overview on alternatives to SQL databases: file formats, NoSQL databases