[irt.od.ua]КонспектАПСПК / КонспектАПСПК
.pdfВтом же году и далее до 2004 года предлагалась Low-End версия AMD Duron с урезанным до 64 Кбайт кэшем второго уровня. Конкурент Celeron, но более производительный при меньшей цене. Содержит более 25 млн. транзисторов с шагом 180-130 нм; тактовая частота: 600-1800 МГц; кэш первого уровня: 128 Кб (64 Кб на данные и 64 Кб на инструкции); кэш второго уровня 64 Кб (полноскоростной); процессорная шина – Alpha EV-6 200МГц-266МГц.
В2001-2003 годах выпускались мобильные версии Duron и Athlon, а также Athlon MP для многопроцессорных систем.
C 2000-го года Intel начала выпускать процессоры Pentium IV, которые имели меньшую производительность, чем Pentium III. Поэтому с 2002-го года AMD начинает производство процессоров Athlon XP 1500+ и выше с рейтингом относительно Pentium IV (официально – относительно Athlon Thunderbird). Основной способ роста производительности – повышение частоты ядра и шины, а также увеличение кэш-памяти второго уровня. Кроме того, введена поддержка технологии SSE.
Первая генерация – ядро Palomino - по техпроцессу 180 нм, 37 млн. транзисторов. Частота системной шины – 266МГц. Рейтинг 1500+…2000+. Вторая генерация – ядро Thoroughbred, 130 нм. – FSB=266-333 МГц. Рейтинг – 1700+ …2800+. Третья генерация – ядро Barton, 130 нм, SOI. Кэш второго уровня 512 КБ. 54 млн. транзисторов, FBS=333-400 МГц. Рейтинг – 2500+…3200+ (реальная частота 1.8-2.2 ГГц). Максимальная мощность 70 Вт. Быстрее Pentium 166 MMX в 20 раз.
В2004-м году линейка Duron переименована в Sempron с новой системой рейтинга, привязанного к процессору Celeron D.
23.1. Athlon64 – восьмое поколение процессоров
В 2003 г. объявлен процессор Athlon64 3200+. Техпроцесс – 130 нм, 105 млн. транзисторов, тактовая частота 2 ГГц, разъем Socket 754, типичное тепловыделение - 90 Вт. Более поздние модели перешли на техпроцесс 90 нм и на разъем Socket 939 (67 Вт) и Socket AM2 (35-62 Вт) с поддержкой двухканального контроллера памяти.
Преимущества Athlon64 над процессором Athlon:
•поддерживается технология x86-64, совместимая с 32-х разрядной архитектурой, но допускающая также выполнение 64-битных приложений: большинство регистров CPU имеют длину 64 бита.
•улучшены алгоритмы предсказания ветвлений и увеличен объем TLB (кэш декодированных инструкций), что позволяет поднять производительность Athlon64 по сравнению с Athlon XP на одинаковых тактовых частотах. Производительность Athlon64 3000+ соответствует Athlon XP 3200+.
•Целочисленный конвейер Athlon64 удлинен для достижения более высоких тактовых частот. Так, целочисленный конвейер этого процессора имеет 12 стадий, а конвейер FPU – 17 стадий против 10 и 17 соответственно у Athlon XP.
91
•В Athlon64 появилась поддержка набора инструкций SSE2. Таким образом, процессор этот будет поддерживать все существующие расширения к системе команд x86, что позволит ему быстрее работать с приложениями, оптимизированными для процессоров Intel Pentium 4.
•Athlon64 имеет встроенный контроллер DDR SDRAM, что позволяет ему напрямую обращаться с памятью, значительно сокращая латентности при запросе данных.
•Кэш-память первого и второго уровня составляют 128 КБ и 512 КБ. Организации кэш-памяти аналогична Athlon XP: 16 областей ассоциативности с длиной строки 64 байта.
•В качестве шины, соединяющей процессор и северный мост, в Athlon64 используется шина HyperTransport, имеющая пропускную способность до 3.2 Гбайт в секунду в каждую сторону. Аналогичная шина используется фирмами VIA и NVIDIA для соединения северного и южного мостов.
Функциональная схема системы на Athlon64 дана на рис. 19.1.
|
|
|
|
|
8x HT |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
CPU Athlon64 |
|
|
|
|
|
|
|
|
AGP 8x |
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
L1 128К |
|
|
|
North Bridge |
|
|
|
(PCI-e16x) |
|
LAN |
|
||||||||||
L2 512К |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ATA |
|
|
|
|
|
|
|
PCI Slots |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
DDR 400 |
|
|
|
(PCI-e) |
|
|
|
|
|
|
|
|
|
|
|
SATA |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
(DDR2) |
|
|
|
|
|
|
|
South Bridge |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
USB 2.0 |
|
|
|
|
|
|
|
|
|
|
|
BIOS |
|
|||
DDR 400 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
(DDR2) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
AC 97 |
|
|
|
|
|
|
Mouse |
|
|
|
S I/O |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
Modem |
|
|
KeyB |
|
|
Serial |
|
|
PPort |
|
Floppy |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Рис. 23.1. Функциональная схема системы на Athlon64
Для рабочих станций выпушен процессор Athlon-FX Opteron, который позволяет объединить несколько процессоров в системе, имеет кэш второго уровня 1 МБ и поддерживает двухканальную память DDR.
23.2. Athlon 64 X2 - девятое поколение процессоров
Вмае 2005 года представлен двухядерный процессор Athlon64 X2 4200+.
В2006 году представлены модели X2 3600+ - X2 5200+. Процессор представляет собой два ядра Athlon 64, объединенных на одном кристалле. Выполнен по технологии 90-65 нм и функционирует на частотах 2-2.4 ГГц. В сокете
92
AM2 характеризуется тепловыделением до 65 Вт. Имеет раздельные кэш L1 (128k) и L2 (256-1000k) для каждого ядра. Рейтинг соответствует Pentium IV последнего поколения. В среднем на 20% быстрее одноядерного варианта.
23.2.Phenom – деcятое поколение процессоров (Stars Core)
Вконце 2007 года был представлен процессор Phenom X4 (K10). В сравнении с архитектурой AMD K8 имеет следующие особенности:
•Реализация 128-битных (против 64-битных у AMD K8) исполнительных устройств с плавающей точкой (FP) — блоки FADD, FMUL и FSTORE;
•Расширение шины L1-LSU (Load-Store Unit) до 2x128 бит (чтение) и 2x64 бит (запись);
•Расширение шины L1-L2 кэша ядра процессора до 128 бит;
•Реализация предвыборки данных в L1-кэш процессора (как мы увидим ниже, действующей на всех уровнях кэша процессора, а также оперативной памяти);
•Наличие объединенного кэша инструкций/данных третьего уровня (L3) эксклюзивной (неинклюзивной) архитектуры, расположенного в интегрированном контроллере памяти и общего по отношению к ядрам процессора;
93
•Наличие интегрированного двухканального контроллера памяти (2x64бит, с возможностью «спаренного» (ganged) либо «распаренного» (unganged) режимов работы), поддерживающего память типа DDR2 и DDR3.
Рис. 23.2. Ядро Phenom
Рис. 23.3. Архитектура Phenom
94
Контрольные вопросы
1.Каковы особенности процессоров Am286-Am586 по сравнению с аналогичными от Intel?
2.Укажите преимущества и недостатки рейтинговой системы.
3.Почему для процессоров AMD серии “K” введен P-рейтинг?
4.Объясните лучшую производительность процессоров K5 и K6 в офисных приложениях, но худшую в игровых по сравнению с Pentium?
5.Почему процессоры K7 и K8 имеют по сравнению с Pentium IV выше производительность в игровых приложениях, но уступают по скорости сжатия аудио и видео данных?
6.Почему процессор Athlon64 называют революционным?
7.Какова особенности структуры системы на базе CPU Athlon64?
95
Лекция 24-25. Мультимедиа – Видеосистема
Мультимедийная (много информационная) – это такая интерактивная (т.е. с обратной связью) система, которая, действуя на наши органы чувств: зрение, слух, осязание, обоняние, вкус и т.д., создает эффект присутствия (виртуальную реальность). Примером являются компьютерные игры, хотя просмотр видео и прослушивание музыки также следует отнести к мультимедиа.
24.1. Технология и стандарты видеосистемы
Двухмерное изображение. Изображение представляет собой совокупность цветояркостных точек. Объединенные в триады, они образуют пикселы (пкс). Стандарты изображения – CGA (200*160*4 – ширина, пкс * высота, пкс * цветояркость, бит), EGA – 640*350*4, VGA – 640*480*4, Super VGA – 640*480*8 – 1600*1200*32.
Отображение информации на экране требует до 64 МБ памяти. Для уменьшения этого объема предлагаются различные методы сжатия. Один из наиболее распространенных форматов сжатия с потерями является JPEG (Joint Pictures Expert Group - Объединенная группа экспертов по изображениям).
Алгоритм сжатия сводится к разделению изображения на фреймы (прямоугольные области), применения дискретного косинусного преобразования (ДКП) к каждому фрейму, отбрасывания высокочастотных составляющих и сжатие полученного результата по алгоритму Хаффмана (метод словаря).
В результате объем изображения уменьшается на порядок без заметного снижения качества картинки.
Одним из главных компонентов мультимедийной системы является передача видео (движущегося изображения). Представляет собой поток картинок последовательных фаз движения (кадров). Отсутствие рывков определяется задержкой между фазами: не более 50 мс, если кадр переключается мгновенно
ипорядка 12-20 мс, если кадр изменяется непрерывно. Иными словами, требуется не менее 20-60 кадров в секунду. Учитывая объем каждого кадра, видеопоток составляет десятки мегабайт в секунду.
Для уменьшения объемов применяются алгоритмы сжатия с потерями. Наиболее известный из них является MPEG. Суть алгоритма сводится к выделению каждого k-го опорного кадра (k=10…30) и сжатию его в JPEG формат. Между кадрами формируется, запоминается и используется приращение относительно предыдущего кадра. Таким образом, объемы снижаются в 50…100
иболее раз.
Синтез трехмерного изображения
Процесс синтеза трехмерного изображения объекта строится в следующей последовательности (3D-конвейер):
1. Построение геометрической модели поверхности объекта путем задания трехмерных координат опорных (ключевых) точек, а также уравнений соединяющих их линий.
96
2.Разбиение поверхности полученного объекта на элементарные плоские элементы — прямоугольники или треугольники.
3.Трансформация (Transformation). На этом этапе моделируется движение объекта: его перемещение, вращение и изменение размеров (формы). Она сводится к стандартному преобразованию координат вершин граней (Vertex) и реализуется путем выполнения множества различных операций матричной (линейной) алгебры и тригонометрических функций.
4.Расчет освещенности (Lighting) и затенения (Shading) объекта методами Гуро (по вершинам) или Фонга (по пикселам).
5.Проецирование полученного трехмерного объекта на плоскость экрана. Использование z-буфера - одна из главных особенностей трехмерной графики.
6.Удаление скрытых поверхностей (Технология Hyper Z).
8.Закраска элементарных треугольников, или текстурирование - выполняется путем наложения текстур (Texture mapping).
9.Коррекция изображения - применение текстур с различным разрешением (МIP-mapping), коррекция перспективы, линейная и анизотропная фильтрация и другие действия.
10.Моделирование эффектов прозрачности и полупрозрачности. Здесь на основе информации о взаимной прозрачности объектов и среды выполняется коррекция цвета пикселов — альфа-смешение (alpha-blending) и затуманивание или дымка (fogging).
11.Коррекция дефектов картинки, вызванных зазубренностью линий на границах объектов, — антиалиасинг (anti-aliasing).
12.Окончательное формирование кадрового буфера (frame buffer) —с помощью механизма двойной буферизации, при котором выделяется память одновременно для двух смежных кадров
При вычислениях активно используются как центральный процессор, так и ускоритель графической карты (GPU).
24.2. Видео карта
Упрощенная структурная схема видеокарты представлена рис. 24.1.
В состав карты входят интерфейсы для подключения к системной плате (AGP/PCI-E), дисплею и графической памяти Gmem. В ней хранится текущий и следующий экран, а также текстуры и результаты промежуточных вычислений 3D-графики. Кроме того, в карте содержатся N вертексных конвейера и L пиксельных конвейера, а также видеопроцессор для коррекции изображения. Имеются блоки антиалиасинга и удаления скрытых поверхностей Hyper Z. Базовые установки и управление видеопроцесором, конвейерами и др. блоками осуществляются с помощью BIOS.
Типовые характеристики видеоакселератора (Radeon X800):
•160 млн. транзисторов по технологии 130 нм, low-k диэлектрики
•Тактовая частота ядра — 500 МГц, видеопамяти — 1 ГГц (GDDR3)
•16 конвейеров обработки пикселей
97
•6 конвейеров построения вертексов
•Производительность около 200 миллиардов операций в секунду (200 GFLOPS). Скорость закраски (Fillrate) — 8 млрд. пикселей в секунду.
AGP Interface |
|
Mem Interface |
|
|
GMem |
|
|
|
|
|
64…256MB |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2D Engine |
|
|
|
|
|
|
|
Video |
|
|
N Vertex Pipes |
|
|
|
|
||
|
|
Processing |
|
|
|
Display |
|
|
|||
|
Engine |
|
|
|
|
Interface |
|
|
|
|
Video BIOS |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Anti-aliasing |
|
K Pixel Pipes |
|
|
Hyper Z |
|
|
|
|
|
|
Рис. 24.1. Структура видеокарты
Вместе с тем, требуется еще значительное увеличение производительности для достижения полностью реалистичной графики.
Технологии CrossFire и SLI (Scan Line Interleave). Технология Direct 10x. Универсальные процессоры в ядре. Многоядерные графические процессоры.
GeForce |
Radeon |
|
8800 |
GT, 8800 GTS (V2), 8800 GTX, 8800 Ultra |
|
8800 |
GTS (v1) |
HD 2900 XT, 3870 |
7950 |
GX2 |
X1950 XTX |
7800 |
GTX 512, 7900 GTO, 7900 GTX |
X1900 XT |
7800 |
GTX, 7900 GT, 7950 GT |
X1800 XT, X1900 AIW, X1900 GT, X1950 PRO, HD |
|
|
2900 GT |
7800 |
GT, 7900 GS, Go 7950 GTX, 8600 GTS |
X1800 XL, X1950 GT, Mobility X1800 XT |
6800 |
Ultra, 7600 GT, 7800 GS, Go 7800 GTX, Go |
X800 XT (& PE), X850 XT (& PE), X1650 XT, |
7900 |
GTX, 8600 GT |
X1800 GTO, Mobility X1900, HD 2600 XT |
6800 |
GT, 6800 GS (PCIe), Go 7800, Go 7900 GS, |
X800 XL, X800 GTO2/GTO16, Mobility X800 XT, |
8700M GT |
HD 2600 PRO, Mobility HD 2600 XT |
|
6800 |
GS (AGP), Go 6800 Ultra, Go 7600 GT, |
X800 GTO 256mb, X800 PRO, X850 PRO, X1650 |
8600M GT |
GT, Mobility HD 2600 |
|
6600 |
GT, 6800LE, 6800 XT, 7300 GT DDR2, Go |
9800 XT, X700 PRO, X800 GT, X800 SE, Mobility |
7600 |
(128-bit), 8500 GT |
X800, X1300 XT, X1600 PRO, HD 2400 XT |
FX 5900, FX 5900 Ultra, FX 5950 Ultra, 6600 |
9500 PRO, 9600 XT, Mobility 9800, 9800 PRO |
|
(128-bit), Go 6800 (128-bit) |
(128-bit), X600 XT, Mobility X700, X1050 (128- |
|
|
|
bit), Mobility X1350, Mobility X1400, Mobility |
|
|
X2300, Mobility HD 2400 |
4 Ti 4600, 4 Ti 4800, FX 5700 Ultra, 6200 |
9600 PRO, Mobility 9700 (128-bit), 9800 LE, X600 |
|
|
|
PRO, Mobility X600, Mobility X1300, Xpress 1250, |
|
|
Mobility HD 2300 |
4 Ti4200, 4 Ti4400, 4 Ti4800 SE, FX 5600 Ultra, |
8500, 9100, 9000 PRO, 9600 LE, Mobility 9700 |
|
FX 5700, 6600 (64-bit), 7300 GS, 8400 GS |
(64-bit), X300 SE, X1150 |
|
3, 3 Ti200, FX 5200 (128-bit), FX 5500, Go 5600, |
9000, 9200, 9250, Mobility 9600 (64-bit), Mobility |
|
Go 6200, Go 6400, Go 7200, Go 7300, Go 7400 |
X300 |
|
(64-bit) |
|
98
25.1. Мониторы
Мониторы на основе ЭЛТ (CRT)
Принцип действия – вторичное свечение люминофора под воздействием сканирующего электронного луча под управлением электромагнитного поля.
Мониторы имеют аналоговый вход, поддерживают технологию Plug&Play, являются мультичастотными с разрешением от 640*480 до 1600*1200 и частотой кадровой развертки 60-120 Гц. Популярностью пользуются плоские экраны с небольшими геометрическими искажениями. Диагональ – 15…24 дюйма. Размер пиксела (зерна) – 0.2…0.24 мм.
Преимущества: доступность, низкая стоимость, хорошая цветопередача, малая инерционность.
Недостатки: большая глубина, большой вес, большое энергопотребление и тепловыделение, возможна значительная нелинейность растра. Затруднительно сделать широкоформатные мониторы. Имеются опасные излучения, регламентированные спецификациями MPR II, TCO 92, TCO 95, TCO 99. TCO – Tjanstemannens Centralorganisation (в английском варианте – The Swedish Confederation for Professional Employees) – Шведская конфедерация профессиональных служащих)
Жидкокристаллические мониторы и проекторы (LCD)
Принцип действия – светофильтр, электронноуправляемый за счет эффекта поляризации световой волны. Источником света является электролюминесцентная лампа с холодным катодом, либо светодиоды. Далее следуют фильтр и пассивный слой жидких кристаллов (поляризатор). В качестве поглотителя света (анализатора) применяются активные жидкие кристаллы, к которым прикладывается невысокое напряжение с помощью тонкопленочных транзисторов (TFT).
Наиболее часто используемые технологии – TN+film и PVA.
TN+film
Рис. 25.1
99
Достоинства технологии – низкая стоимость, малая инерционность. Недостатки – цветопередача сильно зависит от угла зрения.
MVA/PVA
Рис. 25.2
Достоинства – хорошая цветопередача и большие углы обзора. Недостаток – высокая стоимость.
LCD-мониторы пользуются большой популярностью. Их характеристики постоянно улучшаются.
Общие достоинства: компактные размеры при высоком разрешении. Возможно создание любых соотношений ширина-высота. Правильная геометрия. Отсутствие мерцаний.
Общие недостатки. Высокая стоимость моделей с большой диагональю. Невысокая глубина черного цвета. Недостаточные углы обзора. Излишняя резкость.
Плазменные дисплеи (Plasma Display Panel)
Принцип действия - в качестве пикселов изображения используется свечение ионизированного газа.
Рис. 25.3
100