Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Доп_материалы_Вычислительные_системы.doc
Скачиваний:
21
Добавлен:
23.08.2019
Размер:
3.82 Mб
Скачать

Основные усовершенствования архитектуры в процессорах Phenom:

  • Расширенная шина данных между исполнительными устройствами и L1 кэшем процессора, а также между L1 и L2 кэшами. Ширина шины между кэш-памятью первого и второго уровня у Phenom увеличилась до 128 бит в каждую сторону, а сам процессор стал способен выполнять по две 128-битные загрузки данных из L1 кэша за такт.

  • Усовершенствованная предварительная выборка данных. Процессоры Phenom получили возможность прямой выборки данных в L1 кэш, без увеличивающей латентность загрузки данных в кэш второго уровня. Кроме того, блок предварительной выборки новых процессоров научился распознавать и упреждающе обрабатывать последовательные загрузки данных, выполняемые с постоянным смещением.

  • 32-байтовая выборка инструкций. Загрузка кода в декодер Phenom выполняется не 16-байтными, а 32-байтными блоками, что в конечном итоге позволяет уменьшить простои исполнительных устройств процессора.

  • Улучшенное предсказание переходов. Процессоры с обновлённой микроархитектурой стали правильно обрабатывать косвенные переходы, что в целом значительно увеличило вероятность правильных предсказаний переходов в программах, написанных с использованием объектно-ориентированных языков и современных компиляторов.

  • Спекулятивная внеочередная загрузка данных. Подобно процессорам с микроархитектурой Core, Phenom может обрабатывать операции загрузки неопределённых данных вперёд других операций, способных изменить эти данные.

  • Новый механизм Sideband Stack Optimizer, позволяющий уменьшить накладные расходы при работе со стеком за счёт независимого мониторинга состояния регистра ESP.

  • Реализация 128-битных устройств с плавающей точкой (против 64-битных устройств в процессорах Athlon 64), благодаря которым каждое из ядер Phenom может выполнять до четырёх FPU инструкций с двойной точностью за такт, а большинство 128-битных SSE операций способно обрабатываться за один такт. Кроме того, в новых процессорах добавлена поддержка новых SSE команд из набора SSE4A. Впрочем, SSE4A не совместим с набором SSE4.1, поддерживаемым в новых 45-нм процессорах Intel.

  • Улучшение работы технологии виртуализации, благодаря чему достигается ускорение работы приложений, исполняемых в виртуальных машинах.

Шина Hyper Transport 3.0

Вместе с внесением изменений в архитектуру процессорных ядер, инженеры AMD уделили пристальное внимание модернизации интерфейсов, по которым процессоры Phenom общаются с внешним миром. В первую очередь необходимо отметить увеличенную скорость шины HyperTransport, которая в новых CPU приведена в соответствие со спецификацией версии 3.0. В то время как процессоры Athlon 64 использовали шину HyperTransport с пропускной способностью 8 Гбайт/сек, Phenom могут обмениваться данными с чипсетом уже на скорости, достигающей 14,4-16,0 Гбайт/сек. При этом, спецификация HyperTransport 3.0 позволяет дополнительно нарастить пропускную способность шины до 20,8 Гбайт/сек, что, очевидно, будет сделано в будущих моделях четырёхъядерных CPU. В то же время версии протоколов HyperTransport обратно совместимы, что позволяет без каких бы то ни было проблем использовать процессоры Phenom в старых материнских платах, построенных на наборах логики, поддерживающих только предыдущую версию шины, HyperTransport 2.0.