Curso Haskell Data Analysis
16 horasVisão Geral
Este Curso Haskell Data Analysis, é voltado para desenvolvedores Python experientes, analistas ou outros profissionais orientados a dados que desejam utilizar Haskell para trabalhar e gerar visualizações prontas para publicação rapidamente.
Cada empresa e organização que coleta dados é capaz de explorar seus próprios dados para obter insights sobre como melhorar. Haskell é uma linguagem de programação puramente funcional, adequada para lidar com problemas significativos de análise de dados. Este curso o conduzirá pelos problemas mais complexos de análise de dados de maneira prática. Este curso ajudará você a se familiarizar com os fundamentos da análise de dados e abordagens na linguagem Haskell.
Você aprenderá sobre computação estatística, formatos de arquivo (CSV e SQLite3), estatísticas descritivas, gráficos e avançará para conceitos mais avançados, como entender a importância da distribuição normal. Embora a matemática seja uma grande parte da análise de dados, tentamos manter este curso acessível e direto para que você possa aplicar o que aprendeu no mundo real. Ao final deste curso, você terá uma compreensão completa da análise de dados e das diferentes maneiras de analisar dados. Você dominará as ferramentas e técnicas de Haskell para análise de dados eficaz.
Objetivo
Após realizar este Curso Haskell Data Analysis, você será capaz de:
- Aprenda a analisar um arquivo CSV e ler dados no ambiente Haskell
- Crie funções Haskell para funções estatísticas descritivas comuns
- Crie um banco de dados SQLite3 usando um arquivo CSV existente
- Aprenda a versatilidade das consultas SELECT para dividir os dados em partes menores
- Aplique expressões regulares em conjuntos de dados de grande escala usando arquivos CSV e SQLite3
- Crie uma visualização do Estimador de Densidade do Kernel usando a distribuição normal
Publico Alvo
- Desenvolvedores
- Analistas
- Gerentes de TI
- gerentes de produto
Pre-Requisitos
- Um conhecimento prático de Python é necessário para participar deste curso.
Materiais
Inglês + Exercícios + Lab PraticoConteúdo Programatico
Descriptive Statistics
- Descriptive Statistics
- The CSV library – working with CSV files
- Data range
- Data mean and standard deviation
- Data median
- Data mode
SQLite3
- SQLite3
- SQLite3 command line
- Working with SQLite3 and Haskell
- Slices of data
- Working with SQLite3 and descriptive statistics
Regular Expressions
- Regular Expressions
- Dots and pipes
- Atom and Atom modifiers
- Character classes
- Regular expressions in CSV files
- SQLite3 and regular expressions
Visualizations
- Visualizations
- Line plots of a single variable
- Plotting a moving average
- Creating publication-ready plots
- Feature scaling
- Scatter plots
Kernel Density Estimation
- Kernel Density Estimation
- The central limit theorem
- Normal distribution
- Introducing kernel density estimation
- Application of the KDE
Course Review
- Course Review
- Converting CSV variation files into SQLite3
- Using SQLite3 SELECT and the DescriptiveStats module for descriptive statistics
- Creating compelling visualizations using EasyPlot
- Reintroducing kernel density estimation