ОРГАНИЗАЦИЯ ДАННЫХ В СОСТАВЕ МАШИННОЙ ИНФОРМАЦИОННОЙ БАЗЫ

Файлы - основные единицы машинной информационной базы

Файл - совокупность данных, объединенная общим именем, размещенная на внешнем запоминающем устройстве; хранимая, пересылаемая и обрабатываемая как единое целое

Файл (англ, file) в переводе с английского - это некая совокупность информации, документ, лист. К автоматизированным системам понятие «файл» впервые было применено в середине XX века, когда понятие «файл» стали использовать для обозначения совокупности данных, идентификация и доступ к которой осуществляется по ее имени. Файл, таким образом, противопоставлялся другим объектам, доступ к которым осуществляется по их адресу, например, записям внутри файла или блокам на диске.

Файл (совокупность файлов), формируемый в компьютерной программе пользователя или в автоматизированной системе и содержащий в зафиксированном виде данные, предназначенные для восприятия с помощью средств вычислительной техники, трактуется ГОСТ Р 7.0.95-2015 «СИБИД. Электронные документы. Основные виды, выходные сведения, технологические характеристики» как электронный объект системы электронных документов. Файл (совокупность файлов), представляя собой кодированную запись информации, создаваемую и воспринимаемую программно-техническими средствами, реализует внутреннее представление электронного документа. В то время как внешним представлением электронного документа является его воспроизведение в пригодной для восприятия человеком форме.

Файл или набор файлов, рассматриваемый как единое целое для представления содержания электронных документов, этим же стандартом определен как информационная единица. Электронный документ может быть реализован в виде одного файла (простой электронный документ) или набора файлов, состоящего из однородных или разнородных информационных единиц, связанных или не связанных друг с другом прямыми ссылками (составной электронный документ). При этом формат электронного документа (файла) характеризуется ГОСТ Р

7.0.95-2015 как определенная спецификация, описывающая структуру файла, в соответствии с которой осуществляется его интерпретация, передача по сети в виде потока данных и хранение.

Файл является именованной последовательностью байтов, состоящих, в свою очередь, из битов. Размер файла - автоматически определяемое компьютером количество информации в файле (или файлах, образующих электронный документ) в стандартных единицах, производных от понятия «байт», например, килобайт, мегабайт, гигабайт. Фактический объем дискового пространства, занимаемого файлом, зависит от конкретной файловой системы.

Файлы машинной информационной базы можно классифицировать по различным признакам (см. таблицу 14).

Таблица 14

Классификация файлов машинной информационной базы

Классификационный

признак

Типы файлов

Этап автоматизированной обработки информации

Входные файлы;

базовые файлы (основные, служебные, рабочие, промежуточные, резервных копий, архивные, временные и др.); результатные файлы; выходные файлы

Состав информации

Файлы с оперативной (переменной) информацией;

файлы с условно-постоянной информацией (справочной,

нормативной, расценочной и др.)

Назначение

Файлы данных;

файлы программных средств (программные файлы): исполняемые файлы программ, файлы программ на языках программирования, системные файлы, конфигурационные файлы, пакетные файлы, файлы помощи, файлы драйвера и др.

Вид информации

Текстовые файлы; двоичные (бинарные) файлы; графические файлы; звуковые (аудио-) файлы; видеофайлы; мультимедийные файлы; файлы географических данных; веб-файлы; файлы баз данных

Классификационный

признак

Типы файлов

Степень защиты

Защищенные (зашифрованные) файлы; незащищенные файлы

Степень доступности для чтения и обработки

Активные файлы; неактивные файлы

Тип логической организации данных

Файлы с линейной, иерархической, реляционной и другой структурой

Способ физической организации

Файлы с последовательным, прямым (произвольным) способом доступа

Место создания

Файлы функциональных подсистем АБИС

Типы файлов, выделяемые в составе базовых файлов, характеризуются следующими особенностями содержания и применения:

  • • основные файлы - файлы с переменной и условно-постоянной информацией, используемые для решения задач автоматизированной обработки данных;
  • • служебные файлы - файлы, предназначенные для ускорения поиска информации в основных файлах (включают в себя справочники, индексные файлы и каталоги);
  • • рабочие файлы - файлы, создаваемые для решения конкретных задач на базе основных файлов путем выборки части информации из нескольких основных файлов с целью сокращения времени обработки данных;
  • • промежуточные файлы - файлы, образующиеся в результате решения конкретных задач; хранятся с целью дальнейшего использования для решения других задач;
  • • файлы резервных копий - файлы, предназначенные для восстановления данных в оригинальном месте их расположения в случае их повреждения или разрушения;
  • • архивные файлы - файлы, содержащие ретроспективные данные из основных файлов и используемые для решения аналитических, например, прогнозных, задач; могут также использоваться для восстановления информационной базы при разрушениях;
  • • временные файлы - файлы, создаваемые определенной программой или операционной системой для сохранения промежуточных результатов в процессе обработки или передачи данных.

Оперативные файлы могут создаваться на базе одного или нескольких входных файлов и отражать информацию одного или нескольких первичных документов, участвующих в текущих операциях обработки данных. Файлы с условно-постоянной информацией могут содержать справочную информацию различных видов.

Каждый файл характеризуется совокупностью атрибутов (свойств), указывающих на его особенности. Атрибутами файлов являются: имя файла, тип файла, дата и время создания (изменения) файла, размещение файла, размер файла, имя владельца файла, права и метод доступа к файлу. Невидимыми для пользователя, но явными для компьютера являются атрибуты файла, определяющие метод доступа к файлу. Видами этих атрибутов файла являются:

  • • Н - скрытый (англ. Hidden) - файлы с этим атрибутом обычно не видны пользователю;
  • • R - только для чтения (англ. Read-Only) - файлы, содержание которых нельзя изменить без специальной команды пользователя;
  • • S - системный (англ. System) - файлы, отмеченные этим атрибутом, характеризуются как самые важные файлы в операционной системе, отвечающие за загрузку компьютера;
  • • А - архивный (англ. Archive) - файлы с атрибутом, который устанавливается обычно во время работы с файлом при его изменении.

Имя файла состоит из двух частей: собственное имя и идентификатор, определяющий его тип, называемый расширением (расширением имени файла или расширением файла). Собственное имя файла определяется человеком и может быть выбрано произвольно, но с учетом ограничений интерфейса той или иной операционной системы. В операционной системе Windows в именах файлов допускается использование русских букв. Для Windows в имени файла разрешены любые заглавные и строчные буквы, цифры, некоторые знаки препинания, пробелы; запрещены символы: звездочка (*), вертикальная черта (|), обратная косая черта (), двоеточие (:), двойные кавычки ("), меньше (<), больше (>), вопросительный знак (?), косая черта (/). Неверно записанная информация в имени файла не сохраняется.

Расширение имени файла указывает на тип (формат) файла, определяя тип данных, содержащихся в файле, и позволяя операционной системе осуществить выбор соответствующей ему программы работы с данными. Отсюда - в соответствии с ГОСТ Р 7.0.95-2015 - формат файла является частной формой формата данных. При этом формат данных определяется данным стандартом как конкретная форма представления данных, в которой установлены ограничения типа данных. Расширение отделяется от основной части имени точкой. Самыми распространенными расширениями файлов с документом считаются: .DOC, .PDF, .ODT. Наиболее распространенные расширения имен файлов и соответствующие типы файлов приведены ниже в таблице 15.

Таблица 15

Расширения имени файла

Условное обозначение расширения файла

Тип файла

.ехе, .сом

Файлы с исполняемыми программами

.Bas, .pas, .срр

Файлы, содержащие программы на языках программирования

.bat

Пакетные файлы, предназначенные для последовательного запуска нескольких программ

.cfg

Конфигурационные файлы, в которых программа указывает параметры своей работы

.hip, .hip

Файлы справок, в которых хранятся «подсказки» по работе с той или иной программой (или полное руководство по работе с ней)

.txt, .doc, .docx, .rtf, .odt

Текстовые файлы

.htm, .html

Файлы гипертекстовых документов

.xls, .xlsx

Файлы электронных таблиц Excel

.wav, .mp3, .midi, .kar, •°gg

Звуковые файлы

.bmp, .gif, .tif, .ipg, .emf, •png, .pds

Графические файлы (рисунки, фотографии)

.ppt, .pptx, .key

Файлы электронных презентаций

.avi, .mpeg

Видеофайлы

.pdf

Файлы, позволяющие сохранять в одном документе текст, изображения, электронные подписи и другие формы представления информации

.arj, .zip, .rar

Файлы «архивов», то есть сжатой с помощью специальных программ - «архиваторов» информации

На каждом машиночитаемом носителе информации может храниться большое количество файлов. Порядок хранения файлов на машиночитаемом носителе определяется используемой файловой системой. Файловая система (англ. File system) - это система, определяющая порядок организации, хранения и именования данных на машиночитаемых носителях. Именно файловая система устанавливает, где и как физически будет записан файл (например, на жёстком диске, CD, флеш-памяти или др.). Файловая система связывает машиночитаемый носитель информации, с одной стороны, и интерфейс операционной системы для доступа к файлам - с другой. Основные функции любой файловой системы нацелены на решение задач именования файлов и программного интерфейса работы с файлами для приложений. В частности, например, файловая система отслеживает размещение файлов на жестком диске и свободное дисковое пространство. Каждый диск разбивается на две области: область хранения файлов и каталог. Каталог (англ, directory - алфавитный справочник) или директория, папка-файл, содержащий записи о входящих в него файлах. Каталоги могут содержать записи о других каталогах, образуя древовидную структуру, а при наличии ссылок - сетевую структуру. Для дисков с небольшим количеством файлов (до нескольких десятков) может использоваться простая или одноуровневая файловая система, когда каталог (оглавление диска) представляет собой линейную последовательность имен файлов. Для отыскания файла на диске в этом случае достаточно указать лишь имя файла. Если на диске хранятся сотни и тысячи файлов, то для удобства их поиска файлы хранятся в многоуровневой иерархической файловой системе, которая имеет «древовидную» структуру. Расположение файлов на жестком диске связывается именно с «древовидной структурой». При этом начальный корневой каталог содержит вложенные каталоги 1 -го уровня, в свою очередь каждый из которых может содержать вложенные каталоги 2-го уровня и т. д. Каталоги могут содержать записи о других каталогах, образуя древовидную структуру с возможностью монтирования и вставки дополнительных связей (то есть ссылок). Современные операционные системы позволяют размещать на одном физическом диске несколько файловых систем, выделяя каждой из них фиксированную часть диска. Такие части диска называются разделами (англ. Partition) или срезами (англ. Slice).

Конкретная файловая система определяет размер имен файлов и набор атрибутов файла. Некоторые файловые системы предоставляют сервисные возможности, например, разграничение доступа или шифрование файлов. Сетевые файловые системы поддерживают доступ к файлам, находящимся на удалённом компьютере. Виртуальная файловая система (англ. Virtual File System - VFS) или виртуальный коммутатор файловой системы (англ. Virtual File System Switch) является абстрактным представлением реализации конкретной файловой системы. Целью VFS является обеспечение единообразного доступа клиентских приложений к различным типам файловых систем. VFS может быть использована, например, для прозрачного доступа к локальным и сетевым устройствам хранения данных без использования специального клиентского приложения (независимо от типа файловой системы). VFS определяет интерфейс между ядром операционной системы и конкретной файловой системой; таким образом, можно легко добавлять поддержку новых типов файловых систем, внося изменения только в ядро операционной системы.

Назначение файловых систем связывают с типом машиночитаемого носителя. Примеры наименований файловых систем в зависимости от типа машиночитаемого носителя приведены ниже:

  • • для носителей с произвольным доступом (например, жёсткий диск): FAT32 (аббр. от англ. File Allocation Table, таблица размещения файлов) - версия классической архитектуры файловой системы FAT), HPFS (аббр. от англ. High Performance File System), ext2 (англ. Second Extended File System - дословно: «вторая расширенная файловая система») и др.
  • • для оптических носителей - CD и DVD: файловая система ISO9660 для дисков CD-ROM; Joliet, разработанная Microsoft; HFS (аббр. от англ. Hierarchical File System, иерархическая файловая система) - файловая система, разработанная Apple Computer для компьютеров с установленной операционной системой Mac OS); UDF (аббр. от англ. Universal Disk Format, универсальный дисковый формат) - спецификация формата файловой системы, не зависящей от операционной системы, для хранения файлов на оптических носителях) и др.
  • • для флэш-памяти: YAFFS (аббр. от англ. Yet Another Flash File System) - файловая система, разработанная специально для использования на NAND накопителях), Extreme FFS, exFAT.

В среде виртуальных файловых систем используют файловую систему AEFS (аббр. от англ. Advanced Encrypted File System - «Продвинутая зашифрованная файловая система») - шифрующая виртуальная файловая система для операционных систем класса OS/2 или UNIX) и др. Примерами сетевых файловых систем являются: NFS (аббр. от англ. Network File System - протокол сетевого доступа к файловым системам); CIFS (сокр. от англ. Server Message Block) - сетевой протокол прикладного уровня для удалённого доступа к файлам, принтерам и другим сетевым ресурсам, а также для межпроцессного взаимодействия и др.

При решении вопроса о выборе в конкретной ситуации оптимального типа файловой системы принято ориентироваться на тип машиночитаемого носителя, его информационную емкость, а также тип и версию операционной системы.

Для того чтобы найти имеющиеся файлы в данной иерархической файловой системе, нужно указать путь к файлу. В указание пути к файлу входят: имя диска, последовательность имен каталогов и имя файла, которые при записи разделяются обратной косой чертой (). На одном компьютере может быть несколько дисководов - устройств работы с дисками. Каждому дисководу присваивается однобуквенное имя. Имя диска состоит из одной буквы, двоеточия и обратной косой черты (например, АЛ). Далее в указании пути к файлу следуют директории- папки и подпапки. Третий элемент адреса - имя самого файла. Максимальная длина полного имени файлов в Windows ограничивается 260 символами, включая путь поиска.

Работа с файлами реализуется средствами операционных систем. Операции с файлами условно подразделяются на операции, связанные с открытием файла и операции, выполняющиеся без его открытия. В зависимости от операционной системы те или иные операции могут отсутствовать. Операции первого типа обычно служат для чтения/записи информации или подготовки к записи/чтению. В операциях второго типа оперируют его «внешними» признаками - размером, именем, положением в дереве каталогов. При таких операциях невозможно получить доступ к содержимому файла. Возможные операции с файлами включают: создание, открытие, просмотр для изменения, удаление, переименование, редактирование, конвертирование, копирование, перемещение, сохранение, восстановление, поиск, перенос на платформу другой файловой систе- мы/носителя информации, выявление или изменение атрибутов файла, создание и использование ярлыков, архивирование, закрытие, удаление файла и др. Перемещать, копировать и удалять можно не только отдельные файлы и папки, но и группы выделенных файлов и папок.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >