Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
информатика 5-8 вопрос.doc
Скачиваний:
3
Добавлен:
19.09.2019
Размер:
143.87 Кб
Скачать

Вопрос№8

Файловая система — это то, на чем держится далеко неидеальный, но маломальский порядок на наших жестких дисках. Носители информации способны лишь хранить, записывать или считывать биты данных из определенных секторов, а за доступ к информации отвечает именно файловая система. Этому термину можно дать несколько определений, каждое из которых верно. Файловая система — это система организации и хранения информации на жестком диске или других носителях, программные алгоритмы операционной системы для управления данной системой организации информации, и, наконец, на бытовом уровне это совокупность всех файлов и папок на диске.

ФС позволяет оперировать не нулями и единицами, а более удобными и понятными объектами — файлами. Ради удобства пользователей (программе удобнее работать с числовыми индексами, но программы, как известно, пишутся людьми) в работе с файлами используются их символьные идентификаторы — имена. Содержимое же файлов (0 и 1) записано в кластеры — мельчайшие единицы данных, которыми оперирует файловая система, размер их кратен 512 байтам. Для организации информации кроме имени файла используются также каталоги, как некая абстракция, позволяющая группировать файлы по определенному критерию. По сути, каталог — это файл, содержащий информацию о «вложенных» в него каталогах и файлах.

Вся информация о файлах хранится в особой области раздела — таблице файлов. Таблица файлов позволяет ассоциировать числовые идентификаторы файлов и дополнительную информацию о них (дата изменения, права доступа, имя и т. д.) с непосредственным содержимым файла, хранящимся в другой области раздела.

Раздел — это определенная область диска, созданная во время операции разметки диска. Каждый раздел содержит один (редко — несколько) отформатированный том. Том — область раздела со своей файловой системой, своей таблицей файлов и областью данных. Один или несколько разделов составляют диск.

В начале диска находится особая область — MBR (Master Boot Record), содержащая программную логику, необходимую BIOS для загрузки системы с жесткого диска. Таблица разделов (partition table) также расположена в начале диска, ее задача — хранить информацию о разделах: начало раздела, его длина, какой раздел является загрузочным. На загрузочном разделе расположен загрузочный сектор (boot sector), хранящий программу загрузки операционной системы.

Файловые системы прошли очень долгий по компьютерным меркам путь, усложняясь параллельно с развитием операционных систем и аппаратного обеспечения компьютеров. Так, используемая в MS DOS 1.0 (1981 г.) FAT (или FAT12) изначально предназначалась для работы с гибкими дисками. Свое название она получила от наименования таблицы размещения файлов — File Allocation Table. Благодаря 12-битной адресации и кластеру в 4 Кбайта она, однако, поддерживала разделы до 16 Мбайт. В целом же это была простая файловая система, обеспечивавшая основные функции — имя файла в формате 8.3, каталоги, атрибут файла, время создания (изменения).

Чуть позже с добавлением 16-битной адресации и максимального размера кластера в 32 Кбайта появилась FAT16, поддерживавшая разделы до 2 Гбайт. В первой версии Windows 95 была реализована поддержка длинных имен файлов (до 255 символов) и сохранение регистра символов в названии. Эта модификация получила название VFAT.

Файловая система NTFS (New Technology File System) была разработана еще для Windows NT 3.1, однако долго находилась в тени мейнстрима того времени — FAT, которому Microsoft в каждой новой версии «подкрашивала фасад» для соответствия запросам времени. Основным недостатком NTFS была большая требовательность к системным ресурсам, компьютеры просто не могли извлечь преимуществ из NTFS, зато замедление работы было очень заметно.

.

Том NTFS состоит из MFT (Master File Table — главная таблица файлов), содержащей каталог файлов, и пространства для хранения файлов. Сама MFT тоже является файлом, и в первой записи описывает именно файл MFT, всего же в таблице файлов NTFS первые 16 записей являются служебными, а с семнадцатой записи и далее идет описание прочих файлов тома. Для большей отказоустойчивости спецификацией предусмотрены копии MFT и сектора начальной загрузки.

Таким образом, в NTFS, как и в любой другой файловой системе, MFT хранит каталог файлов (идентификатор, занимаемые кластеры), содержимое же файлов записано в кластеры диска. Одна из интересных особенностей — хранение содержимого маленьких файлов (несколько сотен байт) прямо в MFT — позволяет значительно оптимизировать работу с мелкими файлами и не сказывается на размерах самой таблицы, так как данные пишутся лишь в том случае, если в записи MFT для них есть необходимое пространство (1 запись MFT занимает 1 Кбайт). «Нормальные» же файлы расположены в кластерах области данных тома NTFS. При этом каждый файл состоит из потоков, где первый поток — содержимое файла, а в остальных может содержаться дополнительная информация.

Каталоги теперь хранят список вложенных элементов в виде бинарного дерева, что значительно ускоряет поиск файлов.

Некоторые нововведения NTFS направлены на увеличение совместимости со стандартом POSIX (на нем основаны файловые системы Unix): атрибуты времени последнего доступа и изменения файла, жесткие ссылки (фактически, два имени одного файла), символические ссылки (настоящее имя остается неизменным, а символическая ссылка позволяет давать «псевдонимы»).

Нельзя обойти вниманием и самые известные нововведения NTFS — сжатие и шифрование. Обе функции полностью прозрачны для пользователей, необходимо лишь установить соответствующие атрибуты в свойствах файлов и папок, все остальные операции Windows будет выполнять по мере необходимости, пользователь же не заметит никакой разницы.

NTFS обеспечивает мощную и сложную систему распределения прав доступа к файлам и папкам. Конечно, эти параметры контролируются лишь операционной системой, то есть их можно обойти, получив доступ к файлам из другой ОС (например, Linux с возможностью чтения томов NTFS). Впрочем, от этого обезопасит NTFS-шифрование. Еще одна функция — дисковые квоты — позволяет устанавливать объем доступного пользователям свободного места на диске.

Одно из важнейших преимуществ NTFS — журналируемость. NTFS, как журналируемая файловая система, обладает высокой отказоустойчивостью и способна самостоятельно исправлять большинство возникающих ошибок. Защита основана на принципе транзакций — любая операция, изменяющая данные на диске, рассматривается как транзакция, то есть такая последовательность действий, которая может или пройти успешно, или не пройти вообще. Данные о предстоящих действиях заносятся в журнал транзакций, и в случае ошибок система отменяет все изменения. Поэтому любые промежуточные результаты, чреватые нарушением файловой системы, невозможны. Журналируемость, к сожалению, не защитит от некачественного «железа» и не убережет пользовательские данные в экстренных ситуациях (впрочем, такой цели и не ставится), но без проблем справится с повседневными ошибками и сохранит целостность файловой системы. Концепция транзакций, используемая в NTFS для защиты целостности файловой системы, заимствована из систем управления базами данных (СУБД). И, судя по всему, это лишь «первая ласточка» сращивания файловых систем и СУБД в единое целое.

Рост объема цифровой информации рано или поздно вынудит перейти от папок и файлов к более гибкой и совершенной схеме организации. Уже сейчас в корпоративном секторе эту роль исполняют базы данных, на пользовательских компьютерах заметно распространение систем локального поиска (Google Desktop Search, Copernic DS…) по файлам, электронной почте пользователя, посещенным веб-страницам.

Решить задачу более гибкой организации информации взялась и Microsoft в своей новой файловой системе (если вообще в данном случае уместен этот термин) WinFS. Перед WinFS ставятся три основные задачи:

  1. Поиск информации с учетом ее типа. Текст, мультимедиа — особенности всех типов информации должны быть известны WinFS, и учитываться ею.

  2. Построение связей (отношений, relations) между отдельными «порциями» информации (файлами). То есть для каждого текущего файла система будет подбирать связанные с ним файлы, документы, электронные письма и т. д.

  3. Обработка доступной информации — WinFS позволит фильтровать, разбивать по категориям, ранжировать (определять важность информации в контексте текущей задачи пользователя) файлы, чтобы отсечь лишнее. Предоставляя лишь необходимые данные, Microsoft надеется снизить «информационное переутомление» пользователей.

На лицо интересный сплав технологий файловых систем, систем управления реляционными базами данных и поисковых технологий. Остается ждать практической реализации.