Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

Visão Geral

Este curso ensina as ferramentas e técnicas fundamentais para acelerar aplicativos C/C++ para execução em GPUs massivamente paralelas com CUDA. Você aprenderá como escrever código, configurar a paralelização de código com CUDA, otimizar a migração de memória entre a CPU e o acelerador GPU e implementar o fluxo de trabalho que aprendeu em uma nova tarefa – acelerando uma partícula totalmente funcional, mas somente CPU. simulador para ganhos massivos de desempenho observáveis. Ao final do curso, você terá acesso a recursos adicionais para criar por conta própria novos aplicativos acelerados por GPU.

Objetivo

Após concluir este Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training, você será capaz de:

Escreva o código a ser executado por um acelerador GPU
Expor e expressar dados e paralelismo em nível de instrução em aplicativos C/C++ usando CUDA
Utilize memória gerenciada por CUDA e otimize a migração de memória usando pré-busca assíncrona
Aproveite a linha de comando e perfis visuais para orientar seu trabalho
Utilize fluxos simultâneos para paralelismo em nível de instrução
Escreva aplicativos CUDA C/C++ acelerados por GPU ou refatore aplicativos existentes somente de CPU, usando uma abordagem orientada por perfil

Pre-Requisitos

Competência básica em C/C++, incluindo familiaridade com tipos de variáveis, loops, instruções condicionais, funções e manipulações de array
Nenhum conhecimento prévio de programação CUDA é assumido

Materiais

Inglês/Português/Lab Pratico

Conteúdo Programatico

Introduction
Accelerating Applications with CUDA C/C++
1. Learn the essential syntax and concepts to be able to write GPU-enabled C/C++ applications with CUDA.
2. Write, compile, and run GPU code.
3. Control parallel thread hierarchy.
4. Allocate and free memory for the GPU.
Managing Accelerated Application Memory with CUDA C/C++
1. Learn the command-line profiler and CUDA-managed memory, focusing on observation-driven application improvements and a deep understanding of managed memory behavior.
2. Profile CUDA code with the command-line profiler.
3. Go deep on unified memory.
4. Optimize unified memory management.
Asynchronous Streaming and Visual Profiling for Accelerated Applications with CUDA C/C++
1. Identify opportunities for improved memory management and instruction-level parallelism.
2. Profile CUDA code with NVIDIA Nsight Systems.
3. Use concurrent CUDA streams.
Final Review

TENHO INTERESSE

Cursos Relacionados

Curso Deep Learning Prático em Redes Neurais Artificiais

24 horas

Ver Curso

Curso Especialista em Machine Learning

24 Horas

Ver Curso

Curso Machine Learning AI Foundation

24 Horas

Ver Curso

Curso Física Quântica e Matemática para Computação Quântica

16 horas

Ver Curso

Curso TensorFlow Foundation

24 Horas

Ver Curso

Practical Data Science with Python

24 horas

Ver Curso

Fundamentals of Statistics for Data Analysis

24h

Ver Curso

Fundamentals of Machine Learning

24h

Ver Curso

Machine Learning with Amazon SageMaker

16h

Ver Curso

Curso Algorithms of Machine Learning

24h

Ver Curso

Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

Visão Geral

Objetivo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso Deep Learning Prático em Redes Neurais Artificiais

Curso Especialista em Machine Learning

Curso Machine Learning AI Foundation

Curso Física Quântica e Matemática para Computação Quântica

Curso TensorFlow Foundation

Practical Data Science with Python

Fundamentals of Statistics for Data Analysis

Fundamentals of Machine Learning

Machine Learning with Amazon SageMaker

Curso Algorithms of Machine Learning

O que você quer aprender hoje?

Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

Curso Fundamentals of Accelerated Computing with CUDA C/C++ Training

Visão Geral

Objetivo

Pre-Requisitos

Materiais

Conteúdo Programatico

Ficha do Curso

Investimento

Formato de Entrega

Calendário

Receba todas informações

Cursos Relacionados

Curso Deep Learning Prático em Redes Neurais Artificiais

Curso Especialista em Machine Learning

Curso Machine Learning AI Foundation

Curso Física Quântica e Matemática para Computação Quântica

Curso TensorFlow Foundation

Practical Data Science with Python

Fundamentals of Statistics for Data Analysis

Fundamentals of Machine Learning

Machine Learning with Amazon SageMaker

Curso Algorithms of Machine Learning