Архивация данных
Оценка 4.7

Архивация данных

Оценка 4.7
Статья
13.11.2019
Архивация данных

Характерной особенностью большинства типов данных является их избыточность. Степень избыточности данных зависит от типа данных. Например, для видеоданных степень избыточности в несколько раз больше чем для графических данных, а степень избыточности графических данных, в свою очередь, больше чем степень избыточности текстовых данных. Другим фактором, влияющим на степень избыточности является принятая система кодирования. Примером систем кодирования могут быть обычные языки общения, которые являются ни чем другим, как системами кодирования понятий и идей для высказывания мыслей. Так, установлено, что кодирование текстовых данных с помощью средств русского языка дает в среднем избыточность на 20-25% большую, чем кодирование аналогичных данных средствами английского языка.

Для человека избыточность данных часто связана с качеством информации, поскольку избыточность, как правило, улучшает понятность и восприятие информации. Когда речь идет о хранении и передаче информации средствами компьютерной техники, то избыточность играет отрицательную роль, поскольку она приводит к возрастанию стоимости хранения и передачи информации. Особенно актуальной эта проблема стает в случае обработки огромных объемов информации при незначительных объемах носителей данных. В связи с этим, постоянно возникает проблема уменьшения избыточности или сжатия данных. Если методы сжатия данных применяются к готовым файлам, то часто вместо термина "сжатие данных" употребляют термин "архивация данных", сжатый вариант данных называют архивом, а программные средства, которые реализуют методы сжатия называются архиваторами.

В зависимости от того, в каком объекте размещены данные, подлежащие сжатию, различают:

  1. Сжатие (архивация) файлов: используется для уменьшения размеров файлов при подготовке их к передаче каналами связи или к транспортированию на внешних носителях маленькой емкости;
  2. Сжатие (архивация) папок: используется как средство уменьшения объема папок перед долгим хранением, например, при резервном копировании;
  3. Сжатие (уплотнение) дисков: используется для повышения эффективности использования дискового пространства путем сжатия данных при записи их на носителе информации (как правило, средствами операционной системы).

Сжатие данных

Система двоичного кодирования, которая используется в компьютерах, очень удобна для хранения, передачи и обработки данных с точки зрения надежности этих процессов. Однако двоичное кодирование увеличивает размеры файлов по сравнению с другими системами кодирования. Потому возникает необходимость в уменьшении размеров файлов для более эффективной реализации информационных процессов.

Для уменьшения размеров файлов используют специальные способы сжатия данных, которые называют алгоритмами (методами) сжатия данных. Сжатие данных используется при создании файлов определенных типов, например графических типа JPEG или звуковых типа MPEG3, для передачи файлов по сети и т. д.

Сжатие данных – это процесс перекодирования данных, который осуществляется с целью уменьшения размеров файлов.

Различают алгоритмы сжатия, которые обеспечивают сжатие без потери данных, и алгоритмы, которые предусматривают частичную потерю данных. Алгоритмы с частичной потерей данных используют, когда целостность данных не является очень существенной. Например, при сжатии графических, видео, звуковых файлов, поскольку органы чувств человека не всегда способны заметить незначительное отличие в оттенках цветов на фотографии, незначительную разницу в воспроизведении звуковых или видеоданных и т. п.

Архивация данных

Невзирая на высокий уровень надежности компьютеров и компьютерных носителей данных, все же полной гарантии сохранности данных они не дают. Потеря данных может привести к очень серьезным последствиям. Так, уничтожение данных о вкладах и перечислениях средств клиентов приведет к краху банка, потеря данных о продаже билетов повлечет перебои в перевозке пассажиров, потеря результатов опытов может свести на нет многолетние научные исследования. Даже потеря записной книжки с телефонами друзей принесет вам значительные проблемы. Поэтому возникает необходимость в создании копий данных. Важнейшие данные дублируют, записывая на другие жесткие диски, на магнитную ленту стримера, на оптические диски и т. д. Размеры файлов, которые нужно хранить, большие, и необходимы дополнительные затраты на носители. Чтобы уменьшить размеры файлов в копиях и соответственно уменьшить затраты, используют сжатие данных. При этом используются методы, которые обеспечивают сжатие без потери данных.

Создание копий данных с помощью специальных программ, которые могут сжимать данные, называется архивацией.

Программы, которые используются для выполнения архивации, называются архиваторами.

Результатом работы этих программ является архивный файл, или просто архив, который содержит в сжатом или не в сжатом состоянии файлы и папки. В процессе архивации могут быть использованы дополнительные средства для защиты данных от несанкционированного доступа, например установка пароля на доступ к данным в архиве.

В зависимости от алгоритмов, по которым осуществляется архивация данных, различают такие форматы архивных файлов:

  • ZIP,
  • RAR,
  • ARJ,
  • CAB,
  • LZH,
  • ACE,
  • ISO и т. д.

Если при сжатии данных происходит только изменение структуры данных, то метод сжатия называется обратимым. В этом случае, из архива можно восстановить информацию полностью. Обратимые методы сжатия можно применять к любым типам данных, но они дают меньшую степень сжатия по сравнению с необратимыми методами сжатия. Примеры форматов сжатия без потери информации:

  • GIF, TIFF - для графических данных;
  • AVI - для видеоданных;
  • ZIP, ARJ, RAR, CAB, LH - для произвольных типов данных.

В таблице приведены распространенные форматы сжатия и соответствующие им программы-архиваторы, использующиеся на практике.

Формат сжатия Операционная система MS DOS Операционная система Windows
Программа архивации Программа разархивации Программа архивации Программа разархивации
ARJ Arj.exe Arj.exe WinArj.exe WinArj.exe
RAR Rar.exe Unrar.exe WinRar.exe WinRar.exe
ZIP Pkzip.exe Pkunzip.exe WinZip.exe WinZip.exe

Кроме того, современные архиваторы предоставляют пользователю полный спектр услуг для работы с архивами, основными из которых являются:

  1. создание нового архива;
  2. добавление файлов в существующий архив;
  3. распаковывание файлов из архива;
  4. создание самораспаковающихся архивов;
  5. создание распределенных архивов фиксированного размера для носителей маленькой емкости;
  6. защита архивов паролями от несанкционированного доступа;
  7. просмотр содержимого файлов разных форматов без предварительного распаковывания;
  8. поиск файлов и данных внутри архива;
  9. проверка на вирусы в архиве к распаковыванию;
  10. выбор и настройка коэффициента сжатия.

Архивный файл включает оглавление, содержащее следующую информацию о файлах, хранящихся в архиве:

  • имя файла;
  • сведения о каталоге, в котором он находился;
  • дату и время последней модификации файла;
  • размер файла на диске и в архиве;
  • код циклического контроля для каждого файла, используемый для проверки целостности архива.

В качестве расширений архивным файлам по умолчанию устанавливается имя соответствующей программы-архиватора.

Большинство программ-архиваторов позволяют создавать многотомные архивы.

Многотомный архив — это последовательность архивных файлов, размер которых не превышает заданного размера тома. Обычно создается при необходимости переноса архива на гибких дисках, если размер архива превышает емкость дискеты. При создании таких архивов архиватор делает паузу для смены дискеты. Многотомный архив имеет общее имя, в расширении же каждого файла многотомного архива указывается номер тома.

Самораспаковывающийся архив — это определенным образом обработанный архивный файл, являющийся выполняемым файлом. Выполнение такого файла приводит к распаковке содержащихся в нем файлов.

Непрерывный архив — это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует.

Чаще всего, особенно в сети Интернет, используют архивные файлы формата ZIP. При выборе формата архивного файла следует учитывать, что формат RAR обеспечивает самое эффективное сжатие. Однако на процесс архивации в этом формате уходит больше времени. Примерами архиваторов являются программы WinZIP, WinRAR, 7_Zip, Winace, PowerArchiver, ArjFolder, BitZipper, Gnochive bzip2 и т. д.

Программы архиваторы

Архиватор WinRar

Одним из архиваторов является программа WinRAR российского программиста Александра Рошала, которая использует высокоэффективные алгоритмы сжатия данных. WinRAR — это файловый архиватор для Windows.

Графический интерфейс программы WinRar

Основные функции программы:

  • создание архивов файлов и папок с возможным сжатием данных;
  • добавление файлов и папок к уже существующим архивам;
  • просмотр содержимого архивов;
  • замена и обновление файлов и папок в архивах;
  • извлечение из архива всех или только избранных файлов и папок;
  • создание многотомных архивов (архив разбивается на несколько отдельных файлов – томов); размер томов устанавливает пользователь;
  • создание обычных и многотомных архивов, которые содержат программы самостоятельного извлечения файлов и папок, без участия прораммы-архиватора – так называемых SFX-архивов (англ. SelF eXtracting – самоизвлечение);
  • проверка целостности данных в архивах;
  • шифровка данных и имен файлов в архивах и т. д. Программа WinRAR выполняет все эти операции над

Программа WinRAR выполняет все эти операции над архивными данными формата RAR и ZIP, а также предоставляет возможность просматривать содержимое и извлекать объекты из архивов форматов CAB, ARJ, LZH, TAR, GZ и т. д.

Для создания архива с использованием программы WinRAR нужно выполнить алгоритм:

  1. Запустить программу WinRAR на выполнение (например, Пуск Все программы WinRAR WinRAR) Добавить файлы в архив (или выбрать кнопку Добавить на Панели инструментов).
  2. Выбрать вкладку Файлы.
  3. Выбрать нужные объекты для архивации, для этого использовать кнопку Добавить возле поля Добавляемые файлы.
  4. Выбрать вкладку Общие.
  5. Ввести в поле Имя архива имя архивного файла.
  6. Указать папку, в которой будет сохранен архив (кнопка Обзор).
  7. Выбрать в списке Метод сжатия один из шести методов сжатия: от метода без сжатия до метода, который обеспечивает максимальное сжатие (при максимальном сжатии размер архивного файла будет наименьшим, но время архивации будет наибольшим).
  8. При необходимости, указать значения параметров архивации установкой меток флажков.
  9. Выбрать формат архивного файла (RAR или ZIP) выбором соответствующего переключателя.
  10. Если планируется разделить архивный файл на несколько частей, то указать размер тома в поле со списком Разделить на тома размером (в байтах).
  11. Выбрать кнопку ОК.

Многотомные архивы создаются для разделения архивного файла на несколько частей, если полностью архив не помещается на одном носителе, например на дискете, на компакт-диске, на DVD-диске и т. д., или если нужно передать файл по сети с низкой скоростью передачи данных. Для добавления объектов к уже существующему архиву необходимо выполнить такой алгоритм:

1. Запустить архиватор WinRAR.

2. Открыть архив, в который нужно добавить объект (Файл Открыть архив).

3. Выполнить Команды Добавить файлы в архив (или выбрать кнопку Добавить на Панели инструментов).

4. Выделить в диалоговом окне Выберите файлы, которые нужно добавить объекты, которые следует поместить в архив.

5. Установить значения параметров архивации.

6. Выбрать кнопку ОК.

Иным способом добавления файлов в архив является перетягивание файлов в окно уже существующего архива или на значок архива.

Для извлечения объектов из архива необходимо:

  1. Запустить архиватор WinRAR.
  2. Выбрать архив, объекты которого нужно извлечь.
  3. Выполнить Команды Извлечь в указанную папку (или выбрать кнопку Извлечь в на Панели инструментов).
  4. Указать в диалоговом окне Путь и параметры извлечения папку, в которую будет осуществлено извлечение.
  5. Установить значения параметров извлечения.
  6. Выбрать кнопку ОК.

Для удаления отдельных объектов из архива нужно выполнить такой алгоритм:

  1. Запустить архиватор WinRAR.
  2. Открыть архив, объекты из которого нужно удалить.
  3. Выделить объекты, которые необходимо удалить.
  4. Выполнить Команды Удалить файлы (или выбрать кнопку Удалить на Панели инструментов).
  5. Закрыть окно программы.

В случаях, когда нужно перенести архивный файл на другой компьютер и не известно, установлен на нем архиватор или нет, при архивации используют специальный формат архивных файлов – SFX. Архивные файлы, созданные в этом формате, имеют расширение ехе и включают модуль самоизвлечения, что дает возможность извлекать файлы из архива без архиватора.

Для защиты архива от постороннего доступа пользователь может установить пароль доступа к архиву. Для этого необходимо на вкладке Дополнительно выбрать кнопку Установить пароль и ввести пароль и его подтверждение в соответствующие поля.

При инсталляции программы WinRAR к контекстному меню объектов добавляются основные команды работы с архивами.

Выбор команды Добавить в архив или Добавить в архив и отправить по e-mail открывает окно установки режимов архивации. Выбор других двух команд – Добавить в архив «Vlad.rar» или Добавить в архив «Vlad.rar» и отправить по e-mail приводит к созданию архива с предложенным именем (в нашем примере – «Vlad.rar»). Контекстное меню файла архива содержит команды извлечения файлов, которые открывают соответствующие окна установки режимов извлечения: Извлечь файлы, Извлечь в текущую папку или Извлечь в …

13.11.2019