- •ОрГэвм - Ответственные
- •1. Развитие и классификация однопроцессорных архитектур компьютеров.
- •2.Конвейерная обработка команд
- •3. Cуперскалярная обработка команд.
- •4. Классификация архитектуры sisd
- •5. Cisc и risc-архитектуры микропроцессоров.
- •6. Vliw-архитектура компьютера и epic-концепция.
- •Vliw-архитектура
- •7. Simd-архитектура. Способы её реализации.
- •8. Многоядерные структуры процессора и многопотоковая обработка команд.
- •9. Технические и эксплуатационные характеристики эвм Производительность компьютера
- •Энергоэффективность процессора
- •10.Энергоэффективность процессора.
- •11. Классификация эвм по назначению и функциональным возможностям.
- •12. Функциональные возможности, пути развития, современные разработки супер эвм и мэйнфреймов
- •Особенности и характеристики современных мэйнфреймов
- •13.Назначение, классификация, структурная организация серверов. Серверы
- •Блейд-серверы
- •14.Классификация, структурная организация персональных компьютеров.
- •15.Функциональные возможности, назначение, платформы рабочих станций.
- •16.Типы данных интеловских процессоров.
- •Данные типа указатель
- •Теги и дескрипторы.
- •17. Структура и форматы команд эвм
- •18.Способы адресации информации в эвм.
- •Базирование способом суммирования:
- •Относительная адресация с совмещением составляющих aи:
- •Индексная адресация
- •Стековая адресация:
- •19.Принципы организации системы прерывания программ.
- •21.Стратегия развития процессоров Intel.
- •22.Особенности процессорной микроархитектуры Intel Core.
- •23.Микроархитектура Intel Nehalem. Микроархитектура Intel Nehalem
- •Усовершенствования вычислительного ядра
- •Новая структура кэш-памяти
- •Реализация многопоточности
- •Интегрированный в процессор контроллер памяти
- •Новая процессорная шина qpi
- •Модульная структура процессора
- •Управление питанием и Turbo-режим
- •Технология Turbo Boost
- •Процессоры Nehalem
- •Технология txt – (Trusted Execution Technology, ранее известная как LaGrande) – защищает информацию, хранящуюся в виртуальных вычислительных средах.
- •24.Семейство процессоров Intel Westmere.
- •25. Иерархическая структура памяти эвм.
- •26.Способы организации кэш-памяти.
- •Прямое распределение
- •Полностью ассоциативное распределение
- •Частично ассоциативное распределение
- •27.Принципы организации оперативной памяти.
- •28.Методы повышения пропускной способности оп. Методы повышения пропускной способности оп
- •29. Методы управления памятью
- •30.Организация виртуальной памяти.
- •31.Общая характеристика и классификация интерфейсов эвм.
- •32.Способы организации передачи данных.
- •Программно-управляемая передача данных
- •Передача по запросу прерывания от пу
- •Прямой доступ к памяти (пдп)
- •33. Системная организация компьютеров на базе современных чипсетов
- •34.Архитектуры вычислительных систем. Сильносвязанные и слабосвязанные многопроцессорные системы. Архитектуры вычислительных систем
- •Сильносвязанные многопроцессорные системы
- •Архитектура smp
- •Слабосвязанные многопроцессорные системы
Усовершенствования вычислительного ядра
Несмотря на то, что процессоры семейства Nehalem преподносятся Intel, как носители новой микроархитектуры, основная их часть – вычислительное ядро – по сравнению с Core изменилась не столь значительно, наибольшие улучшения кроются в инфраструктуре.
Сначала х86 инструкции выбираются (Fletch) из кэш-памяти команд. Если в потоке команд оказывается команда условного перехода (ветвление программы), то включается механизм предсказания ветвления, который формирует адрес следующей выбираемой команды до того, как будет определено условие выполнения перехода. Основной частью блока предсказания ветвлений является ассоциативная память, называемая буфером адресов ветвлений ВТВ (Branch Target Buffer), в котором хранятся адреса ранее выполненных переходов. Кроме того, ВТВ содержит биты, хранящие предысторию ветвления, которые указывают, выполнялся ли переход при предыдущих выборках данной команды.
Далее разделенные х86 инструкции (Pre Decode) на простые и сложные организуются в виде очередей (Instruction Queues) на входах четырех декодеров. Декодеры преобразуют х86 команды в микрокоманды, под управлением которых в процессоре выполняются элементарные операции (микрооперации). Как в Intel Core, три декодера используются для обработки простых инструкций, один – для сложных. Каждая простая х86 инструкция преобразуется в 1–2 микрокоманды, а для сложной инструкции из памяти микрокода (u Code ROM) выбирается последовательность микрокоманд (микропрограмма), которая содержит более двух микрокоманд (технология micro-ops fusion). Используя технологию macro fusion, четыре декодера могут обработать одновременно пять х86 команд, преобразуя их в четыре микрокоманды.
Следующее усовершенствование, связанное с повышением продуктивности начальной части исполнительного конвейера, коснулось блока обнаружения циклов в программе Loop Stream Detector. Этот блок появился впервые в процессорах с микроархитектурой Core и предназначался для ускорения обработки циклов. Определяя в программе циклы небольшой длины, Loop Stream Detector (LSD) сохранял их в специальном буфере, что давало возможность процессору обходиться без их многократной выборки из кэша и предсказания переходов внутри этих циклов. В процессорах Nehalem блок LSD стал ещё более эффективен благодаря его переносу за стадию декодирования инструкций.
Новая структура кэш-памяти
К двум уровням кэша в Nehalem добавился и L3 кэш, который объединяет ядра между собой и является разделяемым. В результате, L2 кэш выступает буфером при обращениях процессорных ядер в разделяемую кэш-память, имеющую достаточно большой объём.
Использование трёхуровневой кэш-памяти невольно вызывает ассоциации с процессорами AMD с микроархитектурой K10, однако кэш-память Nehalem устроена всё же совершенно по-другому. Во-первых, L3 кэш в Nehalem работает на более высокой частоте, которая для первых представителей этого семейства установлена равной 2,66 ГГц. Во-вторых, Intel не стал отказываться от дублирования данных, хранящихся в кэшах первого и второго уровней, в L3 кэше, что обеспечивает в многоядерных процессорах более высокую скорость работы подсистемы памяти.
Кроме того существенно увеличился размер TLB (Translation-Lookaside Buffer). TLB – это высокоскоростной буфер, который используется для установления соответствия между виртуальными и физическими адресами страниц. Увеличение размера TLB, таким образом, позволяет повысить число страниц памяти, которые могут быть одновременно использованы без дополнительных дорогостоящих преобразований по таблицам трансляции адресов, находящимся в обычной памяти.
Более того, TLB в процессорах Nehalem стал двухуровневым. Фактически, к унаследованному от процессоров Core 2 TLB был добавлен ещё один буфер второго уровня. При этом новый L2 TLB отличается не только высокой вместительностью. Ещё одна особенность L2 TLB заключается в том, что он унифицирован и способен транслировать адреса страниц любого размера.