Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

  • Machine Learning

Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

8h
Visão Geral

Este curso ensina as ferramentas e técnicas fundamentais para acelerar aplicativos C/C++ para execução em GPUs massivamente paralelas com CUDA. Você aprenderá como escrever código, configurar a paralelização de código com CUDA, otimizar a migração de memória entre a CPU e o acelerador GPU e implementar o fluxo de trabalho que aprendeu em uma nova tarefa – acelerando uma partícula totalmente funcional, mas somente CPU. simulador para ganhos massivos de desempenho observáveis. Ao final do curso, você terá acesso a recursos adicionais para criar por conta própria novos aplicativos acelerados por GPU.

Objetivo

Após concluir este Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training, você será capaz de:

 

  • Escreva o código a ser executado por um acelerador GPU
  • Expor e expressar dados e paralelismo em nível de instrução em aplicativos C/C++ usando CUDA
  • Utilize memória gerenciada por CUDA e otimize a migração de memória usando pré-busca assíncrona
  • Aproveite a linha de comando e perfis visuais para orientar seu trabalho
  • Utilize fluxos simultâneos para paralelismo em nível de instrução
  • Escreva aplicativos CUDA C/C++ acelerados por GPU ou refatore aplicativos existentes somente de CPU, usando uma abordagem orientada por perfil
Pre-Requisitos
  • Competência básica em C/C++, incluindo familiaridade com tipos de variáveis, loops, instruções condicionais, funções e manipulações de array
  • Nenhum conhecimento prévio de programação CUDA é assumido
Materiais
Inglês/Português/Lab Pratico
Conteúdo Programatico
  • Introduction
  • Accelerating Applications with CUDA C/C++
    1. Learn the essential syntax and concepts to be able to write GPU-enabled C/C++ applications with CUDA.
    2. Write, compile, and run GPU code.
    3. Control parallel thread hierarchy.
    4. Allocate and free memory for the GPU.
  • Managing Accelerated Application Memory with CUDA C/C++
    1. Learn the command-line profiler and CUDA-managed memory, focusing on observation-driven application improvements and a deep understanding of managed memory behavior.
    2. Profile CUDA code with the command-line profiler.
    3. Go deep on unified memory.
    4. Optimize unified memory management.
  • Asynchronous Streaming and Visual Profiling for Accelerated Applications with CUDA C/C++
    1. Identify opportunities for improved memory management and instruction-level parallelism.
    2. Profile CUDA code with NVIDIA Nsight Systems.
    3. Use concurrent CUDA streams.
  • Final Review
TENHO INTERESSE

Cursos Relacionados

Curso Deep Learning Prático em Redes Neurais Artificiais

24 horas

Curso Especialista em Machine Learning

24 Horas

Curso Machine Learning AI Foundation

24 Horas

Curso Física Quântica e Matemática para Computação Quântica

16 horas

Practical Data Science with Python

24 horas

Fundamentals of Statistics for Data Analysis

24h

Machine Learning with Amazon SageMaker

16h

Curso Algorithms of Machine Learning

24h