Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
50- архівація.doc
Скачиваний:
3
Добавлен:
02.08.2019
Размер:
173.06 Кб
Скачать
  1. Програма WinRar

WinRAR – розробка українського автора Євгенія Рошала. RAR існує вже багато років і широко відомий не тільки в нас у країні, але й у світі. WinRAR – це вдосконалена версія архіватора, що має зручну графічну оболонку.

WinRAR уміє створювати не тільки архіви власного формату (файли з розширенням rar), але і zip. А „діставати” файли може з архівів arj, cab, lzh, tar, gz, ace, uue. Причому для роботи з cab, arj і lzh-архівами не потрібна навіть наявність цих архіваторів на вашому комп’ютері; у WinRAR для цього є убудований модуль.

За ступенем стискання файлів WinRAR перевершує WinZIP і навіть ARJ. Крім того, в останніх версіях з’явився спеціальний алгоритм для роботи з мультимедійними файлами: звуковими і графічними.

У WinRar є трохи властивих тільки йому можливостей. Наприклад, він може додавати в архів деякі надлишкові дані – інформацію для відновлення, за допомогою якої зможе полагодити ушкоджений при пересиланні по мережі або через збій дискети архів. WinRar може створювати так званий неперервний архів (solid archive), у якому ступінь стиску вищий, ніж у звичайному, у середньому на 15-50 відсотків. У цьому випадку всі файли, що архівуються, розглядаються як один довгий файл і відповідним чином обробляються. Цей метод найбільш ефективний при стисканні великого числа дрібних файлів. Також програма дає можливість перевіряти файли в архіві на наявність комп’ютерних вірусів без їх розархівації (використовується встановлений в системі антивірус).

Для архівованих файлів виводяться атрибути:

  • имя – ім’я архівованого файла;

  • размер – розмір файла до архівації;

  • сжат – упакований розмір;

  • тип – тип файла;

  • изменен – дата і час створення файла;

  • C RC32 – контрольна сума, за допомогою якої можна визначити, чи однакові упаковані в архіві файли, не розпаковуючи їх.

Робота з архівом WinRar аналогічна до програми WinZip, причому російськомовний інтерфейс значно спрощує „спілкування” з програмою. Останню версію програми можна знайти за адресою розробника http://www.rarlab.com.

Методи архівації

Ступінь стиснення інформації залежить від вмісту файлу, а також від обраного методу архівації. Ступінь (якість) стиснення файлів характеризується коефіцієнтом стиснення Kc, який визначається як відношення обсягу стисненого файлу VС до обсягу вихідного файлу V0, виражене у відсотках:

Чим менша величина Kс, тим вищий ступінь стиснення інформації.

Всі існуючі методи стиску інформації можна розділити на два класи: упаковка без втрат інформації (оборотний алгоритм) та упаковка з втратою інформації (необоротний алгоритм). У першому випадку вихідну інформацію можна точно відновити за наявною упакованої інформації. У другому випадку розпаковане повідомлення буде відрізнятися від вихідного повідомлення.

При кодуванні символів в ЕОМ використовують кодові таблиці. При цьому кожен символ кодується або одним байтом (CP-1251, ЯКІ-8), або двома байтами (Unicode). Кодові таблиці стандартизують процедуру кодування. Однак для передачі інформації по каналу зв'язку (або для довготривалого зберігання) можна використовувати складнішу процедуру кодування, яка забезпечить зменшення розміру файлу при повному збереженні вихідної інформації. При архівації не використовуються стандартні кодові таблиці, а створюються власні. При цьому вигляд кодової таблиці щоразу змінюється і залежить від змісту архівіруемого документа.

При упаковці по методу Хаффмана часто зустрічаються символи кодуються (замінюються) короткими послідовностями бітів, а більш рідкісні символи - довгими послідовностями. До кожного стиснутому архіву прикладається таблиця відповідності наявних символів і кодів, які замінюють ці символи. Архіви як би скасовують стандартні кодові таблиці.

Припустимо, що вхідний алфавіт повідомлення складається всього з чотирьох символів: a, b, c, d, частоти появи яких у вихідному (нестислому) документі рівні відповідно, 1 / 2, 1 / 4, 1 / 8 і 1 / 8. Порядок кодування за методом Хаффмана для зазначеного алфавіту ілюструється таблицею:

Т екст abbadaca, представлений на вході кодом 00 01 01 00 11 00 10 00, після архівації буде мати вигляд: 0 10 10 0 111 0 110 0. Таким чином, 16 біт вихідного тексту перетворилися в 14 біт упакованої інформації. Зауважимо, що вказані в таблиці частоти не відображають реальної статистичної картини частот появи перерахованих букв англійського алфавіту, а взяті такими лише для ілюстрації даної ідеї (тільки для навчальних цілей).

Стиснення даних за методом Хаффмана проводиться в такій послідовності.

Спочатку проводиться аналіз частоти повторення кожного символу вихідного повідомлення. Потім символ, який найчастіше зустрічається, замінюється самим коротким кодом, а наступний за частотою появи символ кодується довшою послідовністю і т. д. До архіву додається кодова таблиця відповідності символів.

Друга основна ідея архівації полягає у використанні того факту, що в повідомленнях часто зустрічаються кілька поспіль однакових байтів, а деякі послідовності байтів повторюються багато разів. При упаковці такі місця документа (тексту або малюнка) можна замінити командами виду «повторити даний байт n раз» або «взяти частину тексту довжиною k байтів, яка зустрічалася m байтів назад». Такий алгоритм архівації носить ім'я RLE (Run Length Encoding - кодування шляхом обліку повторень).

6

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]