Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Реферат. Пронченко.docx
Скачиваний:
25
Добавлен:
04.06.2015
Размер:
503.58 Кб
Скачать

6. Подсистема памяти. Иерархия памяти.

Архитектура Kepler поддерживает унифицированные запросы к памяти для загрузки и хранения данных благодаря кэшу первого уровня (L1) на каждом из SMX мультипроцессоров. Kepler GK110 также позволяет компилятору использовать дополнительный кэш только для чтения данных.

Каждый SMX мультипроцессор имеет, 64 килобайт памяти внутри кристалла, которая может быть сконфигурирована как 48 килобайт разделяемой памяти с 16 килобайтами кэша первого уровня (L1) или 16 килобайт разделяемой памяти с 48 килобайтами кэша первого уровня. Новая организация памяти в архитектуре Kepler также позволяет делить внутреннюю память поровну, то есть 32 килобайта разделяемой памяти с 32 килобайтами кэша первого уровня. Увеличенная пропускная способность позволяет при этом обрабатывать до 256 байт информации за такт процессора.

Вместе с кэшем первого уровня архитектура Kepler позволяет использовать дополнительную кэш память размером 64 килобайт для данных, которые доступны только для чтения на время выполнения функции. Доступ к кэшу только для чтения данных может управляться как компилятором, так и программистом

Графический процессор Kepler GK110 также имеет 1536 килобайт выделенной кэш памяти второго уровня (L2), что в два раза больше по сравнению с архитектурой Fermi. Кэш второго уровня это основной механизм объединения данных между мультипроцессорами SMX, который отвечает за загрузку данных, их хранение, запросы к текстурам, а также высокосортной обмен данными в графическом процессоре. Алгоритмы, адресация данных в которых заранее неизвестна, такие как физические исследования, отслеживание луча и прочие, особенно выигрывают от такой иерархии памяти. Данные, которые требуют использования нескольких мультипроцессоров SMX для обработки, также выигрывают от подобной реализации памяти.

В архитектуре Kepler вся память, включая регистровые файлы, общую память, кэш первого и второго уровней, DRAM защищена при помощи кода исправления одиночных и обнаружения двойных ошибок (Single‐Error Correct Double‐Error Detect или SECDE). Помимо этого кэш только для чтения данных поддерживает исправление одиночных ошибок при помощи проверки на четность: если данные не проходят проверку на четность, кэш только для чтения данных автоматически обнуляет ошибочные данные и производит загрузку этих же данных из кэша второго уровня.

Режим проверки данных на наличие ошибок несколько снижает пропускную способность DRAM.

7. Заключение.

В отличие от технологий, примененных в архитектуре Fermi, новая архитектура от NVIDIA разрабатывалась с нуля, для того, чтобы обеспечить конечного пользователя максимальным быстродействием. Видеоадаптеры, построенные на основе этой технологии, созданы для работы с параллельными исчислениями в высокопроизводительных системах типа HMC.  Оглядываясь на все новшества, которые используются в видео решениях подобного рода, нельзя не согласиться с тем, что их выход стал новым витком в развитии графических ускорителей, да и графики в целом.