Visão Geral
Este Curso Data Science Fundamentals with Python for Healthcare, ensina profissionais quantitativos (engenheiros, estatísticos, analistas e outros) como aplicar com sucesso métodos de ciência de dados para analisar e visualizar problemas do mundo real em dados de saúde.
Objetivo
Após realizar este Curso Data Science Fundamentals with Python for Healthcare você será capaz de:
- Compreender e implementar os principais conceitos do Python (tipos de dados, funções)
- Use bibliotecas para importar dados dinâmicos de EHR (Registro Eletrônico de Saúde) e dados estáticos
- Analise dados de texto clínico não estruturados em dados estruturados
- Aplique funções em Pandas e NumPy para limpar e explorar dados rapidamente
- Compreender técnicas para avaliar a falta de dados do paciente
- Estenda as técnicas de limpeza para remodelar dados para uso em análises avançadas
- Explore e limpe dados de texto clínico
- Aplique expressões regulares para manipular e extrair dados de texto
- Compreender abordagens de Processamento de Linguagem Natural (PNL) baseadas em regras para extração de informações, como diagnósticos ou medicamentos
- Identifique testes para diferenças de grupo usando estatísticas inferenciais
- Implementar regressão linear para modelar e prever dados clinicamente relevantes
- Usar termos não lineares, bem como compreender termos de confusão e interação para modelagem de sistema mais avançada
- Aplicar regressões logísticas para modelar resultados não numéricos, como acompanhamento de pacientes
Pre-Requisitos
- Todos os participantes devem ter experiência anterior em programação e compreensão de estatísticas básicas.
Materiais
Inglês/Português/Lab Prático
Conteúdo Programatico
Overview of Data Science in Healthcare
- Limitations of EHR data
- Importance of NLP methods
- Overview of advanced data science work in healthcare (image recognition and temporospatial modeling)
An Accelerated Introduction and Overview to Python for Data Science
- Review of course and computing environment
- Explanation of Integrated Development Environments (IDEs) Jupyter and Spyder
- Python syntax essentials
- Primitive data types
- Collection variable types
- Control flow operations
- Function syntax
- Error handling
- Managing libraries
Reading and Manipulating Datasets with Libraries (NumPy and Pandas)
- Overview of NumPy
- Data types in NumPy
- Array masks
- Manipulation and broadcasting
- Random number generation
- Data processing methods with Pandas
- Using DataFrames and Series
- Creating calculated columns
- Discretizing data
- Filtering and indexing syntax
- Merging datasets
- Melting/pivoting DataFrames
Exploratory Data Analysis (EDA) and Graphics Fundamentals
- Statistical summaries, and outlier detection for both univariate and multivariate variables using graphical and numeric methods
- Visualization crash course with Seaborn and Matplotlib
- Generating publication-quality documents with Jupyter
Applied NLP Techniques for Clinical Text
- Unstructured data fundamentals
- Implementing regular expressions for basic information extraction
- Applying MedSpaCy for advanced processing of clinical text
- Measuring accuracy and limitations in rules-based methods
- Using Term Frequency Inverse Document Frequency (TF-IDF) techniques for term importance
Applying Statistical Models for Analysis in Python
- Explanation of statsmodels library of functions
- Inferential and descriptive statistics refresher
- Implementing A/B tests for detecting group differences
- Applying linear regressions
- Overview of generalized linear models (GLMs) and the link function
- Applying logistic regression
- Discussion of confounding, interaction terms and model building approaches
TENHO INTERESSE