- •Параллельные
- •Проблемы
- •Уровни параллелизма
- •Уровни параллелизма
- •Уровни параллелизма
- •Уровни параллелизма
- •Сильно связанные процессора
- •Слабо связанные процессора
- ••Внутрипроцессорный параллелизм (а); сопроцессор (б); мультипроцессор (в); мультикомпьютер (г); слабо связанная распределенная вычислительная
- •Внутрипроцессорный
- •Параллелизм на уровне команд
- •Конвейер
- •Внутрипроцессорная
- •VLIW-процессор TriMedia
- ••Мультимедийные операции выполняет обработчик цифровых сигналов
- •Прогнозирование
- •Внутрипроцессорная
- •Мелкомодульная
- •Правило
- •Крупномодульная
- ••Вне зависимости от используемого варианта многопоточности, необходимо как-то отслеживать принадлежность каждой операции к
- •Синхронная
- •Многопоточность в Pentium 4
- ••По результатам экспериментальных исследований разработчики Intel выяснили, что увеличение площади микросхемы на 5
- •Гиперпоточность Intel
- ••В контексте гиперпоточности разработчики Intel выделили четыре полезных стратегии управления совместным потреблением ресурсов:
- ••Разделение ресурсов между программными потоками в микроархитектуре NetBurst, реализованной в Pentium 4
- •Гомогенные
- •однокристальные
- •Портативный DVD-плеер
- •Логическая схема простого DVD-плеера с
- ••Помимо процессоров и памяти, необходимо разработать схему взаимодействия ядер друг с другом
- •Архитектура CoreConnect компании IBM
- •Сопроцессоры
- •Сетевые процессоры
- ••Скорость передачи данных в локальной сети приближается к 40 Гбит/с, а размер пакета
- •ASIC
- •FPGA
- •Сетевой процессор
- •Кристалл и плата
- •РРЕ-контроллер
- ••У всех сетевых процессоров имеется управляющий процессор для выполнения всех действий, не относящихся
- •Мультимедиа-процессоры
- •однокристальный мультипроцессор Nexiperia
- •Криптопроцессоры
- •Основные подходы к защите данных
- •Вопросы?
Логическая схема простого DVD-плеера с
гетерогенным мультипроцессором и несколькими специализированными ядрами для выполнения различных функций
•Помимо процессоров и памяти, необходимо разработать схему взаимодействия ядер друг с другом
•Во многих случаях проблема решается установкой нескольких шин или
•организацией кольцевой топологии. В последнем случае арбитраж осуществляется путем отправки по кольцу небольшого пакета — так называемого маркера, или токена (token)
•Перед передачей данных ядро должно удержать полученный токен
•Завершив передачу, ядро пускает токен далее по кругу. Таким образом, исключаются конфликты при передаче данных
Архитектура CoreConnect компании IBM
Сопроцессоры
•Иногда процессор передает сопроцессору на исполнение команду или набор команд, в иных случаях сопроцессор действует
независимо и выполняет собственные команды
•Конструктивно сопроцессоры могут быть выполнены в отдельном корпусе, в виде подключаемой платы (как в сетевых процессорах) или установлены на основной микросхеме (таковы сопроцессоры для обработки чисел с плавающей точкой)
Сетевые процессоры
•В зависимости от сети и самого пакета, поступающий в сеть пакет перед отправкой по исходящей линии или передачей прикладной программе может требовать той или иной о
•Обработка может включать принятие решения о том, куда передавать пакет, разбиение пакета на части или сборку его из частей, управление качеством обслуживания, защиту данных, компрессию и декомпрессию
•Скорость передачи данных в локальной сети приближается к 40 Гбит/с, а размер пакета — к 1 Кбайт сетевой компьютер должен обрабатывать почти 5 млн. пакетов в секунду.
•Для пакетов размером 64 байт это значение возрастает примерно до 80 млн. пакетов в секунду.
•Выполнение всех упомянутых функций просто невозможно реализовать программно.
•Аппаратная поддержка здесь принципиально необходима
ASIC
•Одним из путей аппаратного решения проблемы быстрой обработки пакетов является использование специализированных интегральных схем (Application- Specific Integrated Circuit, ASIC)
•Такая микросхема подобна аппаратно реализованной программе, которая может выполнять любое из заранее предусмотренных действий
•Существует ряд проблем – долгое производство, невозможность внести новую функциональность и исправить ошибку
FPGA
•Второй подход основан на использовании программируемых вентильных матриц (Field Programmable Gate Array, FPGA)
•Такая матрица представляет собой набор вентилей, из которых путем
перекоммутации строится требуемая схема
•НО - они очень сложные, дорогие и более медленные, чем схемы ASIC
Сетевой процессор
•Обычно реализуются в виде съемной платы, содержащей, помимо кристалла сетевого процессора, память и вспомогательную логику
•К плате подключается одна или несколько сетевых линий
•Процессор получает из линии пакеты, обрабатывает их, после чего передает по другой линии, если это маршрутизатор, или отправляет в главную системную шину
Кристалл и плата
типичного сетевого процессора