Curso Fundamentals of Accelerated Data Science Training
8hVisão Geral
Quer você trabalhe em uma empresa de software que precisa melhorar a retenção de clientes, em uma empresa de serviços financeiros que precisa mitigar riscos ou em uma empresa de varejo interessada em prever o comportamento de compra dos clientes, sua organização tem a tarefa de preparar, gerenciar e coletar insights de grandes volumes. de dados sem desperdiçar recursos críticos. Os fluxos de trabalho tradicionais de ciência de dados orientados por CPU podem ser complicados, mas com o poder das GPUs, suas equipes podem entender os dados rapidamente para orientar decisões de negócios.
Objetivo
Após concluir este Curso Fundamentals of Accelerated Data Science Training, você será capaz de:
- Implementar preparação de dados acelerada por GPU e extração de recursos usando quadros de dados cuDF e Apache Arrow
- Aplique um amplo espectro de tarefas de aprendizado de máquina acelerado por GPU usando XGBoost e uma variedade de algoritmos cuML
- Execute análises gráficas aceleradas por GPU com cuGraph, obtendo análises em grande escala em pequenos períodos de tempo
- Obtenha rapidamente análises gráficas em grande escala usando rotinas cuGraph
Pre-Requisitos
- Experiência com Python, de preferência incluindo pandas e NumPy
Materiais
Inglês/Português/Lab PraticoConteúdo Programatico
- Introduction
- GPU-Accelerated Data Manipulation
- Ingest and prepare several datasets (some larger-than-memory) for use in multiple machine learning exercises later in the workshop.
- Read data directly to single and multiple GPUs with cuDF and Dask cuDF.
- Prepare population, road network, and clinic information for machine learning tasks on the GPU with cuDF.
- GPU-Accelerated Machine Learning
- Apply several essential machine learning techniques to the data that was prepared in the first section.
- Use supervised and unsupervised GPU-accelerated algorithms with cuML.
- Train XGBoost models with Dask on multiple GPUs.
- Create and analyze graph data on the GPU with cuGraph.
- Project: Data Analysis to Save the UK
- Apply new GPU-accelerated data manipulation and analysis skills with population-scale data to help stave off a simulated epidemic affecting the entire UK population.
- Use RAPIDS to integrate multiple massive datasets and perform real-world analysis.
- Pivot and iterate on your analysis as the simulated epidemic provides new data for each simulated day.
- Assessment and Q&A