Open MPI, OpenMP, OpenACC, CUDA, OpenCL, C++ AMP и многое другое

Высокопроизводительные вычисления

Основная информация

Open MPI, OpenMP, OpenACC, CUDA, OpenCL, C++ AMP и многое другое

Рейтинг: 1
Создана 9 лет назад
Владелец root

Стена группы

Загрузка...
7 лет назад
#

Как стать GPU-инженером за час | Технострим


9 лет назад
#
Advanced OpenACC Profiling — Lecture #1, May 2016



Office Hour for Advanced OpenACC Course, May 2016



Advanced Multi GPU Programming with OpenACC — Lecture #2, May 2016

Den
9 лет назад
#
96 вычислительных ядер и оптимизация кода муравьиного алгоритма поиска маршрутов

Сегодня поговорим об оптимизации кода, который реализует муравьиный алгоритм нахождения оптимальных путей на графах. Узкие места в программе будем искать с помощью Intel VTune Amplifier XE 2016 Update 2, а оптимизировать с использованием MPI, OpenMP и библиотеки Intel Threading Building Blocks.

Белка

Наша цель заключается в том, чтобы добиться эффективной работы программы на компьютере с четырьмя процессорамиIntel Xeon E7-8890 v4. Система оснащена 512 Гб оперативной памяти, на ней установлена Linux 3.10.0-327.el7.x86_64, код компилировался с помощью Intel Parallel Studio XE 2016 U2.

Проблема поиска оптимального маршрута в транспортной сети известна как «задача коммивояжёра». На практике это, например, нахождение оптимальных путей перевозок товаров. Изначально «эффективность» в задачах такого рода означала выбор наиболее дешёвого пути, но за последние несколько десятилетий понятие «стоимость маршрута» расширилось. Теперь сюда включают и воздействие на окружающую среду, и цену энергоресурсов, и время. В дополнение к этому, глобализация бизнеса и цепочек поставок привели к тому, что размеры и сложность транспортных сетей, а значит – и моделей, на которых базируются расчёты, значительно выросли. Теперь типичные задачи оптимизации маршрутов классифицируют как НП-трудные. Обычно для решения таких задач не подходят детерминированные методы.

С развитием распределённых и многоядерных вычислительных систем были разработаны и успешно применены эвристические методы решения задач, в частности – так называемый муравьиный алгоритм (Ant Colony Optimization, ACO). Сейчас мы рассмотрим процесс анализа базовой реализации ACO и расскажем о поэтапном улучшении кода. Забегая вперёд, отметим, что наша методика оптимизация позволила вывести программу на уровни производительности и масштабируемости, близкие к теоретически достижимым.

Подробнее
Den
9 лет назад
#
NVIDIA представит GeForce GTX TITAN P на Gamescom

Сайт TechPowerUp утверждает, что компания NVIDIA готовится представить флагманскую видеокарту, основанную на архитектуре Pascal, которая пока носит кодовое имя GeForce GTX TITAN P, анонс карты должен состояться на мероприятии Gamescom, которое пройдёт в Кёльне с 17 по 21 августа.

Ожидается, что карта будет основана на процессоре GP100 и будет выпущена в двух версиях: с 16 ГБ и с 12 ГБ видеопамяти. Кроме того, платы будут отличаться и шириной шины памяти. Версия с 16 ГБ должна содержать 4 стека HBM2 с шиной 3072 бита, в то время как 12 ГБ вариант получит три стека с шиной 3072 бита. Данное решение идентично тому, что представила NVIDIA в акселераторе Tesla P100, основанном на той же микросхеме. Тепловыделение флагманской видеокарты составит 300—375 Вт, а дополнительное питание она будет получать по двум 8-контактным штекерам.

Nvidia Titan P

Подробнее

Авторизация

Войдите, используя Ваш аккаунт

Войти с помощью

Пользователи

Skyeng
GeekBrains
Lingualeo