Шаблоны разработки

GPU Coder™ поддерживает некоторые шаблоны разработки, которые сопоставляют эффективно со структурами графического процессора.

Получите обработку с помощью шаблона

Операции ядра шаблона вычисляют каждый элемент выходного массива в зависимости от небольшой области входного массива. Можно описать много операций фильтрации как операцию шаблона. Примеры включают свертку, медианную фильтрацию и методы конечных элементов.

В реализации GPU Coder ядра шаблона каждый поток вычисляет один элемент выходного массива. Поскольку к данному входному элементу неоднократно получают доступ для вычисления нескольких соседних выходных элементов, GPU Coder использует общую память, чтобы улучшить пропускную способность памяти и местность данных.

Используйте gpucoder.stencilKernel функционируйте и создайте код CUDA^® для функций шаблона. Для примера, который демонстрирует шаблон preocessing, смотрите, что Шаблон Обрабатывает на графическом процессоре.

Для очень больших входных размеров, gpucoder.stencilKernel функция может произвести код CUDA, который численно не совпадает с симуляцией MATLAB^®. В таких случаях полагайте, что сокращение размера входа приводит к точным результатам.

Матрично-матричная обработка

Много научных приложений содержат матричные операции над матрицей включая Общую Матрицу к Умножению матриц (GEMM) формы C = AB где можно опционально транспонировать A и B. Код для таких матричных операций над матрицей обычно берет шаблон:

for x = 1:M
    for y = 1:N
        for z = 1:K
            C(x,y) = F(A(x,z),B(z,y));
        end
    end
end

где F() пользовательская функция. В этих операциях строка из одной входной матрицы и столбец из второй входной матрицы используются для расчета соответствующий элемент выходной матрицы. Каждый поток перезагружает строку и столбец. Этот шаблон разработки позволяет оптимизацию этой структуры, снова используя данные и заставляя каждый поток вычислить несколько выходных элементов.

Например, F() может быть постоянный клиент, умножение матриц, F()=@mtimes. Для таких шаблонов GPU Coder обеспечивает MatrixMatrix ядро, чтобы создать высокоэффективное, внедрение FAST матричных операций над матрицей на графическом процессоре.

Используйте gpucoder.matrixMatrixKernel функционируйте и создайте код CUDA для выполнения матрично-матричных операций типа.

Связанные примеры

Получите обработку с помощью шаблона на графическом процессоре

Больше о

Документация GPU Coder

Поддержка

Сообщество Экспонента

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация