Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
КНИГА_ТСИ.doc
Скачиваний:
119
Добавлен:
18.09.2019
Размер:
10.81 Mб
Скачать
  1. Сжатие видеоинформации

Видеосжатие  метод удаления настолько больших фрагментов данных, насколько это возможно без снижения качества. Методы видеосжатия обычно приводят к потерям  т. е. результат расшиф­ровки не идентичен первоначально закодированному сигналу. Со­кращая видеоразрешение, цветовую глубину и частоту кадров, ПЭВМ сначала управляли окнами размером в почтовую марку, но затем были изобретены методы, чтобы представить изображения бо­лее эффективно и уменьшить объем данных, не затрагивая размеры изображения.

Методы с потерями уменьшают объем потока данных как путем сложного математического шифрования, так и через намеренную выборочную потерю визуальной информации, которую человече­ский глаз или мозг обычно игнорирует, и могут вести к ощутимой потере качества фильма. Сжатие «без потерь», наоборот, удаляет только избыточную информацию. Кодеки обеспечивают отношения сжатия в пределах от слабого (2 : 1) до очень сильного (100 : 1), соз­давая возможность иметь дело с огромными количествами видео­данных. Чем выше отношение сжатия, тем хуже выходное изобра­жение. Цветовая достоверность исчезает, на картине появляются ар­тефакты и шумы, границы объектов размываются, и в конечном счете результат оказывается «несмотрибельным».

К концу 1990-х гг. основные методы базировались на алгорит­ме с тремя стадиями, известном как дискретное косинусное преоб­разование (ДКП или DCT). ДКП использует факт, что рядом рас­положенные пиксели  или геометрически (смежные на одном кадре), или во времени (в последовательных изображениях)  мо­гут иметь аналогичные значения. Математическое преобразование (сходное с преобразованием Фурье) выполняется на блоках разме­ра 8 × 8 пикселей. Затем осуществляется изменение весовых коэф­фициентов различных частотных составляющих сигнала. Общепри­нято, что для визуальных систем низкочастотные компоненты бо­лее важны, чем высокочастотные, поэтому удаляются те из них, которые наименее искажают визуальную информацию в зависимо­сти от требуемого уровня сжатия. Например, потеря 50% преобра­зованных данных может кончиться потерей только 5% визуальной информации. Затем производится энтропийное зашифровывание (технология без потерь), которая удаляет все действительно ненужные биты.

M-JPEG

Первые системы, использующие аппаратное видеосжатие, из­вестны как M-JPEG («движущееся» JPEG). Название происходит от DCT-стандарта, разработанного для неподвижных изображений (фото), известного как JPEG. Эта технология не применялась для видеосжатия, но в начале 1990-х гг. фирма C-cube выпустила чип кодека, который мог осуществлять JPEG-сжатие неподвижного изображения 30 раз в секунду. При частоте обработки 50 фото в секун­ду можно достигнуть качества VHS в цифровом видео, которое могло быть передано на ПЭВМ.

Когда ПК стали быстрее и память дешевле, это позволило опе­рировать большими массивами данных, использовать меньшие ко­эффициенты сжатия и достичь большего качества видеосигнала. Коэффициент сжатия 10:1 в принципе обеспечивал приемлемое качество, и в середине 90-х гг. сформировалось мнение, что получе­но идеальное решение для нелинейного монтажа.

Однако вскоре выяснилось, что данная технология не лишена ряда недостатков. Большинство кадров хорошо восстанавливаются при сжатии 10:1, но некоторый материал (при большом количестве деталей или областей высокого контраста) может быть испорчен. Эти дефекты заметил бы не каждый зритель, однако большинство инженеров телевещания быстро научились определять так называе­мые артефакты «звон» и «блоки» сжатия, произведенного методами DCT. Также для того чтобы отредактировать содержание видеообразов, добавить эффект или графический образ, видеоматериал должен быть сначала восстановлен, а затем повторно сжат. Этот процесс, хотя и цифровой, является родственным аналоговым технологиям. Артефакты добавляются подобно шуму с каждым циклом такого процесса, названного конкатенацией (сцеплением).

В связи с этим уровни сжатия были понижены, поскольку при 5:1 искажения начали исчезать, и даже самый требовательный видеоинженер должен был признать, что такое видео сопоставимо па качеству с широко используемой аналоговой лентой BetaSP. Средняя степень сжатия позволила Sony выпустить удачный цифровой видеомагнитофон формата Digital Betacam, который теперь считают «золотым стандартом». При сжатии чуть выше чем 2 : 1 частота артефактов так уменьшается, что можно осуществить десятки пере­записей («поколений») без заметной деградации изображения.

Стоимость аппаратных кодеков M-JPEG резко снизилась за прошедшие годы и теперь широко доступны PCI-карты, способные к сжатию в отношении 3 : 1, а также связанное с NLE программное обеспечение. Однако технология M-JPEG все же не предназначена для того, чтобы распространять видеоматериалы, и в этих целях су­щественные преимущества предлагает семейство стандартов MPEG, специально разработанных для видео.

Форматы MPEG

Стандарты MPEG созданы и продолжают создаваться организа­цией Motion Picture Expert Group. MPEG входит в подкомитет Меж­дународной организации по стандартизации (ISO). Эта группа, как и большинство других современных мировых институтов стандартиза­ции, весьма виртуальна. Работу над стандартами проводят эксперты, находящиеся в самых разных странах, и повседневным средством об­щения служит электронная почта. MPEG ввела ряд стандартов сжа­тия видеоизображения и звуковых сигналов сопровождения, исполь­зуя сжатие по методу DCT (дискретное косинус-преобразование), которые обеспечивают обычный уровень высококачественного циф­рового видео. При этом используется алгоритм JPEG для того, чтобы сжать индивидуальные кадры, затем устраняются избыточные дан­ные, которые остаются неизменными в последовательных кадрах. Алгоритмы MPEG асимметричны  требуется больше времени, что­бы сжать видео, чем восстановить исходный сигнал, т. е. требуется серьезная вычислительная мощность для уменьшения размера фай­ла. Вкратце охарактеризуем основные разновидности спецификаций.

MPEG-1. Наиболее широкое распространение получил стандарт MPEG-1. Он был принят в 1992 г. как ISO 11172. С точки зрения получаемого качества видеосигнала его можно назвать цифровым аналогом видеоформата VHS. Размер кадра в MPEG-1 составляет 325 × 288 при оцифровке сигналов PAL и SECAM и 352 × 240  для NTSC. Характерные значения потоков лежат в диапазоне от 0,5 до 3 Мбит/с.

MPEG-2. Стандарт MPEG-2, принятый в 1994 г., предназначен для получения более качественного изображения при более высокой скорости передачи. MPEG-2 не всегда лучше MPEG-1: картинка MPEG-2 при скоростях передачи MPEG-1 выглядит хуже по сравне­нию с MPEG-1. Однако при рекомендованных потоках 310 Мбит/с с полным разрешением, составляющим 720 × 576 для PAL и 720 × 480 для NTSC, качество изображения сопоставимо с видеофильмами формата S-VHS и Hi-8. Еще одним плюсом MPEG-2 является со­вместимость сверху вниз с MPEG-1: файлы MPEG-1 можно проиг­рывать на декодирующих устройствах MPEG-2. В последнее время популярность MPEG-2 растет в связи с тем, что он был принят стан­дартом для DVD.

MPEG-3. Стандарт MPEG-3 начинали разрабатывать для кодирования сигналов телевидения высокой четкости (ТВЧ, HDTV). Однако после двухлетней работы над MPEG-2 было принято решение о расширении его возможностей: в него были включены алгоритмы для кодирования изображения ТВЧ, после этого MPEG-3 как само­стоятельный стандарт перестал использоваться.

MPEG-4. В 1993 г. была начата работа над MPEG-4, форматом мультимедиа узкой полосы пропускания, который родственен QuickTime и может поддерживать смешивание сигналов, позволяя сочетать видео- (и аудио-) запись с их машинно-генерируемыми аналогами.

Стандарт MPEG-4 предназначен для передачи видеоданных в низкоскоростных системах мультимедиа и видеоконференций по цифровым телефонным каналам. В этом случае используется стандарт развертки с четкостью, в 4 раза меньшей, чем в стандарте MPEG-1: 144 активные строки в кадре и 176 отсчетов в активной части строки, что позволяет снизить скорость цифрового потоки до 64 Кбит/с. Стандарт MPEG-4 не предназначен для кодирования программ вещательного телевидения.

Важно то, что MPEG-4 обеспечивает стандартизированные способы представления блоков звукового, визуального или аудио­визуального содержания, как дискретные «медиаобъекты». Они могут иметь естественное или синтетическое происхождение, на­пример, записаны с камеры или микрофона либо произведены компьютером. Возможно, наибольший результат, достигнутый С помощью MPEG-4,  его интерактивность, или то, что он позволяет зрителям и слушателям взаимодействовать с объектами в пределах сцены.

MPEG-7 формально называется «Мультимедиаинтерфейс для описания содержимого» (Multimedia Content Description Interface) и имеет целью стандартизировать описание мультимедийного мате­риала, поддерживающего некоторый уровень интерпретации смысла информации, которая может быть передана для обработки на ЭВМ. Стандарт MPEG-7 не ориентирован на какое-то конкретное приложение, он стандартизует некоторые элементы, которые рассчитаны на поддержку как можно более широкого круга приложений. Следо­вательно, средства MPEG-7 позволят формировать описания (т. е. наборы схем описания и соответствующих дескрипторов по жела­нию пользователя) материала, который может содержать:

  • информацию, описывающую процессы создания и производ­ства материала (указатель, заголовок, короткометражный иг­ровой фильм);

  • информацию, относящуюся к использованию материала (ука­затели авторского права, история использования, расписание вещания);

  • информацию о характеристиках записи материала (формат записи, кодирование);

  • структурную информацию о пространственных, временных или пространственно-временных компонентах материала (раз­резы сцены, сегментация областей, отслеживание перемеще­ния областей);

  • информацию о характеристиках материала нижнего уровня (цвета, текстуры, тембры звука, описание мелодии);

  • концептуальную информацию о реальном содержании мате­риала (объекты и события, взаимодействие объектов);

  • информацию о том, как эффективно просматривать материал (конспекты, вариации, пространственные и частотные субдиапазоны и пр.);

  • информацию о собрании объектов;

  • информацию о взаимодействии пользователя с материалом (предпочтения пользователя, история использования).

Формат сжатия DV

Прямая запись видео в цифровом виде была достигнута только с приходом формата Digital Video (цифровое видео). По специфика­ции ITU-R (международного профессионального ТВ-сообщества) кадр в DV стандарта PAL содержит 576 строк по 720. Пиксель имеет прямоугольное соотношение 1,067 (в отличие от M-JPEG с квадрат­ным пикселем) и содержит значения YUV (яркость и два цветоразностных сигнала U и V). Каждому отводится по 1 байту. При рав­ном числе независимых значений обозначается как 4:4:4, что до­вольно расточительно с точки зрения ресурсов.

Обычно в работе используется соотношение 4:2:2 (в одной строке в 2 раза меньше пикселей). В DV для камер субформата DVCAM, поддерживаемого фирмой Sony, уменьшают еще и цветовое разрешение. В итоге формат работы  4:2:0, а цветовая матрица  360 × 288 пикселей. Физическое разрешение формата при матрице CCD  от 500 линий. DV-формат является альтернативой более до­рогому и профессиональному аналоговому формату Betacam SP.

Хотя шкала представления графики в компьютере по RGB из­меряется от 0, 0, 0 до 255, 255, 255 для каждой точки, что в совокуп­ности и дает 16,7 млн. цветов, в DV используется ограничение. Лю­бое изображение стандарта DV редактируется к динамическому диа­пазону значений от 8, 8, 8 (черный) до 235, 235, 235 (белый).

Материал в DV обычно имеет скорость передачи 25 Мбит/с или 3,6 Мбайт/с при несжатом стереозвуке 48 кГц и 16 бит на канал. Су­ществует формат, позволяющий записать четыре аудиоканала с час­тотой 32 кГц и глубиной 12 бит. Достигается такая плотность записи с помощью дискретно-косинусного преобразования. Компрессия по видеоканалу имеет постоянную величину (5:1), минута DV занима­ет 200 Мбайт, а на стандартную видеокассету mini-DV помещается 60 мин. При использовании субформатов DVCam и DVCPro изменя­ется только способ кодирования. При записи в любом из этих суб­форматов DV на ленту пишется до 1/3 избыточной информации для восстановления (маскирования ошибок) в случае повреждения лен­ты, что не влияет на формат представления DV в компьютере.

Формат DV поддерживается консорциумом 60 производителей, в числе которых Canon, JVC, Panasonic, Sharp и Sony. Три основных варианта DV  потребительский DV, DVCAM фирмы Sony и DVCPRO фирмы Panasonic  имеют некоторые различия, которые не влияют на качество изображения.

DivX. Формат DivX базируется на видео MPEG-4 технологии Microsoft, с дополнением звукового потока МРЗ. Поскольку сжатый в формате DivX кинофильм составляет от 10 до 20% размера ориги­нала DVD (обычно 5 Гбайт), DVD-фильм на 8090 мин занимает приблизительно 650 Мбайт в разрешении 640×480 (кинофильм Голливуда может храниться на единственном CD-ROM). Недостатком является то, что не предусмотрена возможность преобразовать, изображение формата 16:9 в 4:3. Просмотр осуществляется на широко распространенном Windows Media Player (Microsoft) с не­большими добавлениями.

Мультимедийные функции видеоадаптеров

К. мультимедиафункциям относят ускорение вывода видео в форматах AVI, Indeo, MPEG-1 и других, аппаратную цифровую ком­прессию и декомпрессию видео (что почти не встречается на массовых видеокартах), наличие композитного видеовыхода, вывод TV-сигнала на монитор, низкочастотный видеовход и высокочастот­ный TV-вход, модуль для работы с телетекстом и другие функции.

Новым моментом является также интеграция графического адаптера с другими устройствами, например с платой для захвата изображений, аппаратным MPEG-проигрывателем. Подавляющее большинство современных 20-ускорителей являются в то же время и видеоускорителями, а некоторые, например ATI Rage 128, способ­ны воспроизводить видео в формате MPEG-2 (т. е. с исходным раз­решением 720 × 480). Следует отметить, что эти модели графических адаптеров разрабатываются только под шину PCI.

Рассмотрим некоторые специализированные видеокарты.

Фрейм-грабберы (карты видеозахвата)  устройства, объединяю­щие аналого-цифровые и графические микросхемы для обработки видеосигнала, которые позволяют оцифровывать видеосигнал (рас­сматривались ранее).

MPEG-декодеры. Так называемые MPEG-плееры позволяют вос­производить последовательности видеоизображений (фильмы), за­писанные на компакт-дисках или DVD-дисках. MPEG-плееры раз­личных производителей могут иметь ряд особенностей. Соединение с графическим адаптером выполняется обычно либо через один из ва­риантов разъема расширения (см. рис. 6.7), либо по шине PCI. Ино­гда графический адаптер и MPEG-декодер интегрируются на одной плате. Если для воспроизведения звука первым MPEG-плеерам была необходима дополнительная звуковая карта, то в настоящее время микросхема аудиодекодера входит в стандартный набор микросхем для MPEG-плееров. Альтернативой MPEG-картам часто выступает программный вариант реализации алгоритма декодирования.

Преобразователи SVGA-TV. Преобразователи SVGA-TV  это устройства, транслирующие сигнал о цифровом образе SVGA-изо­бражения в аналоговый сигнал, пригодный для вывода на телевизи­онный приемник с большим размером экрана. Это удобно, напри­мер, при проведении презентаций. Как правило, подобные преобра­зователи поддерживают стандарты PAL и NTSC и допускают одновременный вывод изображения на экран телевизора и монитор компьютера. Некоторые из преобразователей позволяют регулиро­вать изображение программным способом или с помощью регули­ровок (для внешнего исполнения), другие  накладывать компью­терную графику на внешний видеосигнал, например для создания титров. В последнее время наличие TV-выхода на графической пла­те стало почти стандартной функцией, поэтому описанные преобра­зователи SVGA-TV понемногу сходят со сцены.

ТВ-тюнеры. Телевизионные приемники, обычно выполненные в виде платы расширения или внешнего устройства, преобразуют высокочастотный аналоговый видеосигнал, поступающий по сети кабельного телевидения или от антенны, либо низкочастотный ана­логовый видеосигнал от видеомагнитофона или видеокамеры в изо­бражение на экране монитора. Существует несколько вариантов подключения TV-тюнера: во-первых, через внешний кабель (при этом невозможна работа в оконном режиме, но зато возможен про­смотр телепередач на мониторе при выключенном компьютере, если используется внешний TV-тюнер); во-вторых, через так назы­ваемый разъем расширения на видеокарте; в-третьих, по шине PCI без дополнительных соединений.

В качестве примера рассмотрим характеристики Tuner AverTV Studio 305 int. PCI (рис. 6.5). Это устройство для просмотра ТВ, циф­ровой записи видео и проведения видеоконференций. Программное обеспечение AVerTV работает с WDM-драйверами, и это обеспечи­вает их функциональность в операционных системах Win98SE/ МЕ/2000/ХР. Характеристики:

  • поддерживаемые форматы  SECAM -D/K, PAL-D/K, NTSC;

  • чип-процессор  Philips SAA7130HL, высокочастотный мо­дуль  Philips FM1256/IH-3;

  • диапазон  тюнер рассчитан на поддержку российского диа­пазона частот;

  • захват  широкие возможности для записи видео в формате MPEG-4. Предлагается на выбор несколько форматов для записи видео  VCD, SVCD, DVD, MPEG-1, MPEG-2 и AVI. Параметры оцифровки для VCD, SVCD и DVD находятся в ПЗУ и изменению не подлежат. При выборе формата MPEG-1 или MPEG-2 появляется возможность изменять размер кадра и уровень качества. Можно воспользоваться дополнительны­ми настройками MPEG-кодека и самостоятельно установить такие параметры оцифровки, как скорость потока данных, значение GOP и SubGOP (группы и подгруппы кадров), ин­дексы векторов движения, а также изменить параметры сжа­тия звука. Функции полноэкранной и фоновой записи изобра­жения (с разрешением 720 × 480 для NTSC, 768 × 576 для PAL/SECAM);

    • функция I-Record позволяет во время продолжения записи воспроизвести любую часть уже записанной программы;

    • проигрывание записанных файлов в режиме «картинка в кар­тинке»;

    • запись телепрограмм по таймеру;

    • ввод видеосигнала с видеоустройства (телевизор, видеокамера, видеомагнитофон и др.) с помощью S-Video и композитного (RCA) видеовходов;

    • функция отложенного просмотра (Time Shift): можно поста­вить просмотр или прослушивание FM на паузу, а через не­сколько минут продолжить с этого места;

    • телетекст-приложения AVerTV отображают телетекст в отдель­ном окне. Навигация в окне телетекста стандартная. Програм­ма позволяет переключаться между страницами и полстрани­цами телетекста, фиксировать нужную подстраницу, сохра­нять отдельные страницы, страницы с набором полстраниц и целые группы страниц;

    • разрешение  до 800 × 600;

    • поддержка API  DirectX 8.1 и выше;

    • входные разъемы  вход приемника пульта ДУ, аудиовход (Jack 3,5 мм), S-Video вход, композитный (RCA) видеовход, вход антенны FM-приемника;

    • выходные разъемы  аудиовыход (Jack 3,5 мм); . поддержка ОС  Win98SE/ME/2000/XP.

Существует также FM-тюнер модели AVerTV Studio, который способен принимать станции УКВ/FM диапазона и при поиске программ сканирует весь частотный радиодиапазон от 62 до 108 МГц.