Формат файлов

Формат файлов

Термин формат файла (или тип файла) используется для описания структуры данных, записанных в компьютерном файле.

Так как файл представляет собой просто последовательность битов (то есть нулей и единиц), компьютерные программы, сохраняющие данные в файле, должны как-то преобразовывать обрабатываемую ими информацию в последовательность битов и наоборот (в ООП эти операции называются, соответственно, «сериализацией» и «десериализацией»). Алгоритм этого преобразования, а также соглашения о том, как различные фрагменты информации после преобразования располагаются внутри файла, и составляют его «формат».

Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат

Содержание

Спецификации

Для многих форматов файлов существуют опубликованные спецификации, в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример — форматы файлов пакета Microsoft Office. В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой. В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате PNG.

Определение типа файла

Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

Расширение имени файла

Некоторые операционные системы, например, CP/M, Microsoft Windows используют для определения типа файла часть его имени, т. н. «расширение имени файла». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением .exe — изображение с другим расширением. В то же время, опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

Магические числа

Другой способ, широко используемый в «магическое число» — последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».

Метаданные

Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, т. н. «метаданные». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh. Метаданные поддерживаются такими современными файловыми системами как NTFS, ext3 и другими. Недостатком этого метода является плохая переносимость — при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны.

MIME

Типы данных, определённые стандартом сетевых протоколах, однако в файловых системах они пока применяются редко.

См. также

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Полезное


Смотреть что такое "Формат файлов" в других словарях:

  • формат файлов (взаимодействия ресурсов) — Содержит семейство форматов, включающих форматы аудиофайлов (WAVE, RDIB, RMID), файлов изображений (DIB, WMF, РAL), мультимедиа (МММ), текстовых файлов (RTF). Файл RIFF содержит специальный заголовок, определяющий формат данных и идентифицирующий …   Справочник технического переводчика

  • формат файлов изображений — Реализует сжатие данных методом кодирования длины серий (RLE), при котором в файле выделяются последовательные данные, состоящие из одинаковых элементов. [http://www.morepc.ru/dict/] Тематики информационные технологии в целом EN IFFimage file… …   Справочник технического переводчика

  • Deb (формат файлов) — Пакет Debian (dpkg) Иконка deb файлов в среде GNOME Расширение файла: .deb Тип MIME: application/x deb …   Википедия

  • Двоичный формат файлов Microsoft Excel 97—2007 — Microsoft Excel (Windows) Microsoft Excel 2007 Тип Табличный процессор Разработчик ОС Microsoft Windows …   Википедия

  • Двоичный формат файлов Microsoft Excel 97—2000 — Microsoft Excel (Windows) Microsoft Excel 2007 Тип Табличный процессор Разработчик ОС Microsoft Windows …   Википедия

  • собственный [частный] формат файлов — Собственный формат файлов какого либо приложения. Используется для хранения документов, рисунков и т. п. Приложение преобразует в него файлы, импортируемые из других программ или имеющие общедоступные (стандартные) форматы.… …   Справочник технического переводчика

  • ZIP (формат файлов) — ZIP  популярный формат сжатия данных и архивации файлов. Файл в этом формате обычно имеет расширение .zip и хранит в сжатом или несжатом виде один или несколько файлов, которые можно из него извлечь путём распаковки с помощью специальной… …   Википедия

  • deb (формат файлов) — У этого термина существуют и другие значения, см. Deb. Пакет Debian (dpkg) Иконка d …   Википедия

  • ICO (формат файлов) — ICO, Windows icon Расширение .ico MIME image/vnd.microsoft.icon[1] Разработан Microsoft Тип формата растровая графика ICO (Windows icon)  формат хранения значков файлов в …   Википедия

  • Zoo (формат файлов) — Zoo  формат, а также программа сжатия файлов, написанная Раулем Деси (Rahul Dhesi) в середине 1980 х годов. Формат основан на известном алгоритме сжатия LZW и определяется по расширению файла .zoo. В настоящее время этот формат используется… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»