- •Рекомендована література:
- •1 Вступ
- •2.0 Цифрове представлення звуку
- •2.2 Передискретизація (oversampling)
- •2.3 Компоненти звукової карти
- •2.4 Ефект-процесор
- •2.5Деякі аспекти якісного відтворення цифрового звуку
- •2.6 Методи, використовувані для ефективного стискування цифрового звуку
- •2.7 Формати, використовувані для представлення цифрового звуку
- •2.8 Mpeg: Загальна інформація
- •2.9 Що таке mp3 ?
- •Висновок
2.6 Методи, використовувані для ефективного стискування цифрового звуку
Нині найбільш відомі Audio MPEG, PASC і ATRAC. Усі вони використовують так зване "кодування для сприйняття"(perceptual coding) при якому із звукового сигналу видаляється інформація, малопомітна для слуху. В результаті, незважаючи на зміну форми і спектру сигналу, його слухове сприйняття практично не міняється, а міра стискування виправдовує незначне зменшення якості. Таке кодування відноситься до методів стискування з втратами(lossy compression), коли із стислого сигналу вже неможливо точно відновити початкову хвилеву форму.
Прийоми видалення частини інформації базуються на особливості людського слуху, що називається маскуванням : за наявності в спектрі звуку виражених піків(переважаючих гармонік) слабкіші частотні складові у безпосередній близькості від них слухом практично не сприймаються(маскуються). При кодуванні увесь звуковий потік розбивається на дрібні кадри, кожен з яких перетвориться в спектральне представлення і ділиться на ряд частотних смуг. Усередині смуг відбувається визначення і видалення маскованих звуків, після чого кожен кадр піддається адаптивному кодуванню прямо в спектральній формі. Усі ці операції дозволяють значно(у декілька разів) зменшити об'єм даних при збереженні якості, прийнятної для більшості слухачів.
Кожен з описаних методів кодування характеризується швидкістю бітового потоку(bitrate), з якою стисла інформація повинна поступати в декодер при відновленні звукового сигналу. Декодер перетворить серію стислих миттєвих спектрів сигналу в звичайну цифрову хвилеву форму.
Audio MPEG - група методів стискування звуку, стандартизованная MPEG(Moving Pictures Experts Group - експертною групою по обробці зображень, що рухаються). Методи Audio MPEG існують у вигляді декількох типів - MPEG - 1, MPEG - 2 і так далі; нині найбільш поширений тип MPEG - 1.
Існує три рівні(layers) Audio MPEG - 1 для стискування стереофонічних сигналів : 1 - коефіцієнт стискування 1: 4 при потоці даних 384 кбит/з; 2 - 1: 6.1: 8 при 256.192 кбит/з; 3 - 1: 10.1: 12 при 128.112 кбит/с.
Мінімальна швидкість потоку даних в кожному рівні визначається в 32 кбит/з; вказані швидкості потоку дозволяють зберегти якість сигналу приблизно на рівні компакт-диска.
Усі три рівні використовують вхідне спектральне перетворення з розбиттям кадру на 32 частотних смуги. Найбільш оптимальним відносно об'єму даних і якості звуку визнаний рівень 3 із швидкістю потоку 128 кбит/з і щільністю даних близько 1 Мб/хв. При стискуванні з нижчими швидкостями починається примусове обмеження смуги частот до 15-16 кГц, а також виникають фазові спотворення каналів(ефект типу фэйзера або фленжера).
Audio MPEG використовується в комп'ютерних звукових системах, CD - i/DVD, " звукових" дисках CD - ROM, цифровому радіо/телебаченні і інших системах масової передачі звуку.
PASC(Precision Adaptive Sub - band Coding - точне адаптивне внутрішньосмугове кодування) - окремий випадок Audio MPEG - 1 Layer 1 із швидкістю потоку 384 кбит/з(стискування 1: 4). Застосовується в системі DCC.
ATRAC(Adaptive TRansform Acoustic Coding - акустичне кодування адаптивним перетворенням) базується на стереофонічному звуковому форматі з 16-розрядним квантуванням і частотою дискретизації 44.1 кГц.
При стискуванні кожен кадр ділиться на 52 частотних смуги, результуюча швидкість потоку - 292 кбит/з(стискування 1: 5). Застосовується в системі MiniDisk.