Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ebanniy Pizdec.doc
Скачиваний:
16
Добавлен:
27.09.2019
Размер:
1.37 Mб
Скачать

22) Файловая структура (папка, каталог). Обслуживание файловой системы.

Существует множество систем представления данных. С одной из них, принятой в информатике и вычислительной технике, двоичным ко­дом, мы познакомились выше. Наименьшей единицей такого представ­ления является бит (двоичный разряд).

Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с би­товым представлением удобнее работать, если этот рисунок имеет регу­лярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами.

Понятие о байте, как группе взаимосвязанных битов, появилось вместе с первыми образцами электронной вычислительной техники. Долгое время оно было машинно-зависимым, то есть для разных вы­числительных машин длина байта была разной. Только в конце 60-х годов понятие байта стало универсальным машинно-независимым.

Выше мы видели, что во многих случаях целесообразно исполь­зовать не восьмиразрядное кодирование, а 16-разрядное, 24-разрядное, 32-разрядное и более. Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 раз­ряда) называются удвоенным словом, а группы из восьми байтов (64 разряда) — учетверенным словом. Пока, на сегодняшний день, такой системы обозначения достаточно.

Единицы измерения данных.

Существует много различных систем и единиц измерения данных. Каждая научная дисциплина и каждая область человеческой деятельности может использовать свои, наиболее удобные или тра­диционно устоявшиеся единицы. В информатике для измерения дан­ных используют тот факт, что разные типы данных имеют универ­сальное двоичное представление, и потому вводят свои единицы дан­ных, основанные на нем.

Наименьшей единицей измерения является байт. Поскольку од­ним байтом, как правило, кодируется один символ текстовой инфор­мации, то для текстовых документов размер в байтах соответствует лексическому объему в символах (пока исключение представляет рассмотренная выше универсальная кодировка UNICODE?).

Более крупная единица измерения - килобайт (Кбайт). Условно можно считать, что 1 Кбайт примерно равен 1000 байт. Условность связана с тем, что для вычислительной техники, работающей с дво­ичными числами, более удобно представление чисел в виде степени двойки, и потому на самом деле 1 Кбайт равен 210 байт (1024 байт). Однако всюду, где это не принципиально, с инженерной погрешно­стью (до 3 %) «забывают» о «лишних» байтах.

В килобайтах измеряют сравнительно небольшие объемы дан­ных. Условно можно считать, что одна страница неформатированного машинописного текста составляет около 2 Кбайт.

Более крупные единицы измерения данных образуются добавле­нием префиксов мега-, гига-, тера-; в более крупных единицах пока нет практической надобности.

1 Мбайт = 1024 Кбайт = 1020 байт 1 Гбайт =1024 Мбайт = 1030 байт 1 Тбайт = 1024 Гбайт = 1040 байт

Особо обратим внимание на то, что при переходе к более круп­ным единицам «инженерная» погрешность, связанная с округлением, накапливается и становится недопустимой, поэтому на старших еди­ницах измерения округление производится реже.

Единицы хранения данных.

При хранении данных решаются две проблемы: как сохранить дан­ные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом, как мы уже знаем, образуется «паразитная на­грузка» в виде адресных данных. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру. Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (кило­байтах, мегабайтах и т. п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл - это последовательность произ­вольного числа байтов, обладающая уникальным собственным име­нем. Обычно в отдельном файле хранят данные, относящиеся к одно­му типу. В этом случае тип данных определяет тип файла.

Проще всего представить себе файл в виде безразмерного канце­лярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда. Поскольку в определении файла нет огра­ничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хра­нящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Понятие файловой структуры.

Требование уникальности имени файла очевидно - без этого не­возможно гарантировать однозначность доступа к данным. В средст­вах вычислительной техники требование уникальности имени обес­печивается автоматически - создать файл с именем, тождественным уже имеющемуся, не может ни пользователь, ни автоматика.

Хранение файлов организуется в иерархической структуре, кото­рая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри кото­рых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ «\» (обратная косая черта).Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем дос­тупа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

<имя носителя>\<имя каталога- 1>\...\<имя каталога - N > \ Соб­ственное имя файла>

Вот пример записи двух файлов, имеющих одинаковое собствен­ное имя и размещенных на одном носителе, но отличающихся путем доступа, то есть полным именем. Для наглядности имена каталогов (папок) напечатаны прописными буквами.

С:\АВТОМАТИЧЕСКИЕАППАРАТЫ\ЕЕНЕРА\АТМОСФЕРЛ\Результаты исследований С:\ РАДИОЛОКАЦИЯ \BEHEPA \РЕЛЬЕФ Результаты исследований.

О том, как на практике реализуются файловые структуры, мы уз­наем несколько позже, когда познакомимся со средствами вычисли­тельной техники и с понятием файловой системы.

Обслуживание файловой структуры.

Несмотря на то, что данные о местоположении файлов хранятся в табличной структуре, пользователю они представляются в виде иерар­хической структуры - людям так удобнее, а все необходимые преобразо­вания берет на себя операционная система. К функции обслуживания файловой структуры относятся следующие операции, происходящие под управлением операционной системы:

создание файлов и присвоение им имен; создание каталогов (папок) и присвоение им имен; переименование файлов и каталогов (папок);

• копирование и перемещение файлов между дисками компьютера и между каталогами (папками) одного диска;

• удаление файлов и каталогов (папок);

• навигация по файловой структуре с целью доступа к заданному файлу, каталогу (папке);

• управление атрибутами файлов.

Создание и именование файлов

Файл - это именованная последовательность байтов произвольной длины. Поскольку из этого определения вытекает, что файл может иметь нулевую длину, то фактически создание файла состоит в присвое­нии ему имени и регистрации его в файловой системе - это одна из функций операционной системы. Даже когда мы создаем файл, работая в какой-то прикладной программе, Е общем случае для этой операции привлекаются средства операционной системы.

По способам именования файлов различают «короткое» и «длинное» имя. До появления операционной системы Windows 95 общепринятым способом именования файлов на компьютерах IBM PC было соглаше­ние 83. Согласно этому соглашению, принятому в MS-DOS, имя файла состоит из двух частей: собственно имени и расширения имени. На имя файла отводится 8 символов, а на его расширение - 3 символа. Имя от расширения отделяется точкой. Как имя, так и расширение могут включать только алфавитно-цифровые символы латинского алфавита.

Соглашение 83 не является стандартом, и потому в ряде случаев отклонения от правильной формы записи допускаются как операци­онной системой, так и ее приложениями. Так, например, в большин­стве случаев система «не возражает» против использования некото­рых специальных символов (восклицательный знак, символ подчер­кивания, дефис, тильда и т. п.), а некоторые версии MS-DOS даже до­пускают использование в именах файлов символов русского и других алфавитов. Сегодня имена файлов, записанные в соответствии с со­глашением 83, считаются «короткими».

Основным недостатком «коротких» имен является их низкая со­держательность. Далеко не всегда удается выразить несколькими сим­волами характеристику файла, поэтому с появлением операционной системы Windows 95 было введено понятие «длинного» имени. Такое имя может содержать до 256 символов. Этого вполне достаточно для создания содержательных имен файлов. «Длинное» имя может содер­жать любые символы, кроме девяти специальных: V:*?"<>|.B имени разрешается использовать пробелы и несколько точек. Расширением имени считаются все символы, идущие после последней точки.

Наряду с «длинным» именем операционные системы Windows 95 и Windows 98 создают также и короткое имя файла - оно необходимо для возможности работы с данным файлом на рабочих местах с уста­ревшими операционными системами.

Особенности Windows: Использование «длинных» имен файлов в операционных системах Windows 95 и Windows 98 имеет ряд осо­бенностей.

1. Если «длинное» имя файла включает пробелы, то в служебных операциях его надо заключать в кавычки. Рекомендуется не использо­вать пробелы, а заменять их символами подчеркивания.

2. В корневой папке диска (на верхнем уровне иерархической файловой структуры) нежелательно хранить файлы с длинными име­нами - в отличие от прочих папок в ней ограничено количество еди­ниц хранения, причем, чем длиннее имена, тем меньше файлов мож­но разместить в корневой папке.

3. Кроме ограничения на длину имени файла (256 символов) суще­ствует гораздо более жесткое ограничение на длину полного имени фай­ла (в него входит путь доступа к файлу, начиная от вершины иерархиче­ской структуры). Полное имя не может быть длиннее 260 символов.

4. Разрешается использовать символы любых алфавитов, в том чис­ле и русского, но если документ готовится для передачи, с заказчиком (потребителем документа) необходимо согласовать возможность воспроизведения файлов с такими именами на его оборудовании.

5. Прописные и строчные буквы не различаются операционной системой. Для нее имена Письмо. М и письмо. М соответствуют одному и тому же файлу. Однако символы разных регистров исправно отображаются операционной системой, и, если для наглядности надо использовать прописные буквы, это можно делать.

Программисты давно научились использовать расширение имени файла для передачи операционной системе, исполняющей программе или пользователю информации о том, к какому типу относятся дан­ные, содержащиеся в файле, и о формате, в котором они записаны. В ранних операционных системах этот факт использовался мало. По существу, операционные системы MS-DOS анализировали только Расширения. ВАТ (пакетные файлы с командами MS-DOS), .EXE, COМ (исполнимые файлы программ) и .SYS (системные файлы конфигурации). В современных операционных системах любое расширение имени файла может нести информацию для операционной системы. Системы Windows имеют средства для регистрации свойств типов файлов по расширению их имени, поэтому во многих случаях выбор расширения имени файла не является частным делом пользо­вателя. Приложения этих систем предлагают выбрать только основ­ную часть имени и указать тип файла, а соответствующее расширение имени приписывают автоматически.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]