Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ.doc
Скачиваний:
13
Добавлен:
11.02.2016
Размер:
415.23 Кб
Скачать

1. Поняття про кодування і архівацію інформації

1.1. Архівація. Загальна інформація про архівацію даних

Під архівацією розуміють стиснення даних. Стиснення даних — це процедура перекодування даних, яка проводиться з метою зменшення їх об'єму, розміру, обсягу. Стиснення буває без втрат (коли можливе відновлення вихідних даних без спотворень) або з втратами (відновлення можливе з незначними спотвореннями). Стиснення без втрат використовується при обробці та збереженні комп'ютерних програм і даних. Стиснення з втратами зазвичай застосовується для зменшення об'єму звукової, фото, та відеоінформації. І, як показує практика, стиснення з втратами для такого роду інформації є набагато дієвим. Стиснення базується на видалені надлишку інформації, яка міститься у вихідних даних. Прикладом надлишку є повторення в тексті фрагментів (наприклад, слів природної або машинної мови). Подібний надлишок зазвичай усувається заміною повторюваних послідовностей більш коротким значенням (кодом). Інший вид надлишку пов'язаний з тим, що деякі значення в даних зустрічаються частіше інших. А від так можна замінити дані, що часто зустрічаються більш короткими кодами, а ті, що рідше зустрічаються - більш довгими (ймовірнісне стиснення). Стиснення даних, які не мають властивості надлишку (наприклад випадковий сигнал чи шум), неможливе, зазвичай неможливо стиснути і зашифровану інформацію. [1]

Архів — файл, що містить у собі один або декілька файлів та метадані. Файли можуть бути як стиснені (без втрат), так і мати початковий розмір та структуру, але першочергове завдання архіву тримати у собі саме стиснуті файли. Метедані можуть містити інформацію про початковий розмір файлів, інформацію про формат файлів, структуру директорій, коментарі до файлів, інформацію для відновлення архіву і т. д. Архіви файлів створюються за допомогою спеціалізованих програм — архіваторів, які можуть бути як окремими програмами, так і частиною інших програм. Далі буде розглянуто декілька з цих програм. Різновиди архівів поділяються на ті, які складається з одного або декількох файлів і метаданих та на ті, що містять рівно один стиснутий файл. Деякі архіватори та формати архівів об'єднують ці дві функції в довільному порядку — наприклад, 7-Zip, ARJ, ZIP. У таких випадках, якщо стиснення проводиться після об'єднання, архів називається «безперервним». Це дозволяє зменшити розмір отриманого архіву, але ускладнює відновлення при пошкодженні даних. Сам архів може складатися з декількох файлів для полегшення зберігання і перенесення великої кількості даних при обмеження на розмір однієї частини — наприклад, носія даних, або повідомлення e-mail. Такий архів називається «багатотомним».

1.2. Кодування інформації в пк

Будь-яка робота із записами потребує їх кодування. Як правило, повідомлення зберігаються у вигляді кодів. Кодування повідомлень — це подання їх за допомогою деякої послідовності знаків. Кодування — спо­сіб зберігання і передавання повідомлень, форма подання їх на носієві. Одне і те саме повідомлення можна кодувати по-різному. Однією з систем кодування є азбука. Можна кодувати і звуки. Одні­єю з таких систем кодування є ноти. Зберігати можна не тільки тексто­ву та звукову інформацію. У вигляді кодів зберігаються і зображення. Якщо розглянути газетний малюнок через збільшувальне скло, то можна побачити, що він складається із світлих і темних точок. Коор­динати кожної точки можна запам'ятати у вигляді чисел. Колір кожної точки також можна запам'ятати у вигляді числа. Такі числа можна зберігати в пам'яті комп'ютера та передавати на будь-які відстані. Для подання та опрацювання повідомлень у комп'ютері використо­вують двійкові коди, що подаються за допомогою лише двох символів — 0 i l, оскільки пристрої комп'ютера побудовані на елементах, що мають два стійких стани (які позначають через 0 та 1). Це дозволяє технічно реалізувати збереження і опрацювання повідомлень за допомогою комп'ютера. Біт (англ. bit — двійкова одиниця) — найменша довжина двійко­вого коду (один двійковий розряд). Байт — це послідовність з 8 бітів. Загальна кількість різних комбінацій двійкових розрядів у байті до­рівнює 28=256. Для кодування різних символів та для їх зберігання в запам'ятовуючих пристроях комп'ютера найчастіше використовують американський стандартний код для обміну інформацією — ASCII (англ. American Standard Code for Information Interchange), який являє собою стандартну таблицю кодування знаків. Одне і те саме повідомлення можна закодувати різними способами, тобто виразити різними мовами. За всю історію існування, люди ство­рили багато різних мов кодування: • розмовні мови; • мова міміки і жестів; • мова малюнків та креслень; • мова науки (математичні, хімічні, біологічні й інші символи та формули); • мова мистецтва (музики, живопису, скульптури); • спеціальні мови (есперанто, морський семафор, азбука Морзе, азбука Брайля для незрячих)