Характерной особенностью большинства типов данных является их избыточность. Степень избыточности данных зависит от типа данных. Например, для видеоданных степень избыточности в несколько раз больше чем для графических данных, а степень избыточности графических данных, в свою очередь, больше чем степень избыточности текстовых данных. Другим фактором, влияющим на степень избыточности является принятая система кодирования. Примером систем кодирования могут быть обычные языки общения, которые являются ни чем другим, как системами кодирования понятий и идей для высказывания мыслей. Так, установлено, что кодирование текстовых данных с помощью средств русского языка дает в среднем избыточность на 20-25% большую, чем кодирование аналогичных данных средствами английского языка.
Для человека избыточность данных часто связана с качеством информации, поскольку избыточность, как правило, улучшает понятность и восприятие информации. Когда речь идет о хранении и передаче информации средствами компьютерной техники, то избыточность играет отрицательную роль, поскольку она приводит к возрастанию стоимости хранения и передачи информации. Особенно актуальной эта проблема стает в случае обработки огромных объемов информации при незначительных объемах носителей данных. В связи с этим, постоянно возникает проблема уменьшения избыточности или сжатия данных. Если методы сжатия данных применяются к готовым файлам, то часто вместо термина "сжатие данных" употребляют термин "архивация данных", сжатый вариант данных называют архивом, а программные средства, которые реализуют методы сжатия называются архиваторами.
В зависимости от того, в каком объекте размещены данные, подлежащие сжатию, различают:
Система двоичного кодирования, которая используется в компьютерах, очень удобна для хранения, передачи и обработки данных с точки зрения надежности этих процессов. Однако двоичное кодирование увеличивает размеры файлов по сравнению с другими системами кодирования. Потому возникает необходимость в уменьшении размеров файлов для более эффективной реализации информационных процессов.
Для уменьшения размеров файлов используют специальные способы сжатия данных, которые называют алгоритмами (методами) сжатия данных. Сжатие данных используется при создании файлов определенных типов, например графических типа JPEG или звуковых типа MPEG3, для передачи файлов по сети и т. д.
Сжатие данных – это процесс перекодирования данных, который осуществляется с целью уменьшения размеров файлов.
Различают алгоритмы сжатия, которые обеспечивают сжатие без потери данных, и алгоритмы, которые предусматривают частичную потерю данных. Алгоритмы с частичной потерей данных используют, когда целостность данных не является очень существенной. Например, при сжатии графических, видео, звуковых файлов, поскольку органы чувств человека не всегда способны заметить незначительное отличие в оттенках цветов на фотографии, незначительную разницу в воспроизведении звуковых или видеоданных и т. п.
Невзирая на высокий уровень надежности компьютеров и компьютерных носителей данных, все же полной гарантии сохранности данных они не дают. Потеря данных может привести к очень серьезным последствиям. Так, уничтожение данных о вкладах и перечислениях средств клиентов приведет к краху банка, потеря данных о продаже билетов повлечет перебои в перевозке пассажиров, потеря результатов опытов может свести на нет многолетние научные исследования. Даже потеря записной книжки с телефонами друзей принесет вам значительные проблемы. Поэтому возникает необходимость в создании копий данных. Важнейшие данные дублируют, записывая на другие жесткие диски, на магнитную ленту стримера, на оптические диски и т. д. Размеры файлов, которые нужно хранить, большие, и необходимы дополнительные затраты на носители. Чтобы уменьшить размеры файлов в копиях и соответственно уменьшить затраты, используют сжатие данных. При этом используются методы, которые обеспечивают сжатие без потери данных.
Создание копий данных с помощью специальных программ, которые могут сжимать данные, называется архивацией.
Программы, которые используются для выполнения архивации, называются архиваторами.
Результатом работы этих программ является архивный файл, или просто архив, который содержит в сжатом или не в сжатом состоянии файлы и папки. В процессе архивации могут быть использованы дополнительные средства для защиты данных от несанкционированного доступа, например установка пароля на доступ к данным в архиве.
В зависимости от алгоритмов, по которым осуществляется архивация данных, различают такие форматы архивных файлов:
Если при сжатии данных происходит только изменение структуры данных, то метод сжатия называется обратимым. В этом случае, из архива можно восстановить информацию полностью. Обратимые методы сжатия можно применять к любым типам данных, но они дают меньшую степень сжатия по сравнению с необратимыми методами сжатия. Примеры форматов сжатия без потери информации:
В таблице приведены распространенные форматы сжатия и соответствующие им программы-архиваторы, использующиеся на практике.
Формат сжатия | Операционная система MS DOS | Операционная система Windows | ||
Программа архивации | Программа разархивации | Программа архивации | Программа разархивации | |
ARJ | Arj.exe | Arj.exe | WinArj.exe | WinArj.exe |
RAR | Rar.exe | Unrar.exe | WinRar.exe | WinRar.exe |
ZIP | Pkzip.exe | Pkunzip.exe | WinZip.exe | WinZip.exe |
Кроме того, современные архиваторы предоставляют пользователю полный спектр услуг для работы с архивами, основными из которых являются:
Архивный файл включает оглавление, содержащее следующую информацию о файлах, хранящихся в архиве:
В качестве расширений архивным файлам по умолчанию устанавливается имя соответствующей программы-архиватора.
Большинство программ-архиваторов позволяют создавать многотомные архивы.
Многотомный архив — это последовательность архивных файлов, размер которых не превышает заданного размера тома. Обычно создается при необходимости переноса архива на гибких дисках, если размер архива превышает емкость дискеты. При создании таких архивов архиватор делает паузу для смены дискеты. Многотомный архив имеет общее имя, в расширении же каждого файла многотомного архива указывается номер тома.
Самораспаковывающийся архив — это определенным образом обработанный архивный файл, являющийся выполняемым файлом. Выполнение такого файла приводит к распаковке содержащихся в нем файлов.
Непрерывный архив — это архив RAR, упакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных. Непрерывная архивация поддерживается только в формате RAR, для формата ZIP такого типа архива не существует.
Чаще всего, особенно в сети Интернет, используют архивные файлы формата ZIP. При выборе формата архивного файла следует учитывать, что формат RAR обеспечивает самое эффективное сжатие. Однако на процесс архивации в этом формате уходит больше времени. Примерами архиваторов являются программы WinZIP, WinRAR, 7_Zip, Winace, PowerArchiver, ArjFolder, BitZipper, Gnochive bzip2 и т. д.
Одним из архиваторов является программа WinRAR российского программиста Александра Рошала, которая использует высокоэффективные алгоритмы сжатия данных. WinRAR — это файловый архиватор для Windows.
Основные функции программы:
Программа WinRAR выполняет все эти операции над архивными данными формата RAR и ZIP, а также предоставляет возможность просматривать содержимое и извлекать объекты из архивов форматов CAB, ARJ, LZH, TAR, GZ и т. д.
Для создания архива с использованием программы WinRAR нужно выполнить алгоритм:
Многотомные архивы создаются для разделения архивного файла на несколько частей, если полностью архив не помещается на одном носителе, например на дискете, на компакт-диске, на DVD-диске и т. д., или если нужно передать файл по сети с низкой скоростью передачи данных. Для добавления объектов к уже существующему архиву необходимо выполнить такой алгоритм:
1. Запустить архиватор WinRAR.
2. Открыть архив, в который нужно добавить объект (Файл Открыть архив).
3. Выполнить Команды Добавить файлы в архив (или выбрать кнопку Добавить на Панели инструментов).
4. Выделить в диалоговом окне Выберите файлы, которые нужно добавить объекты, которые следует поместить в архив.
5. Установить значения параметров архивации.
6. Выбрать кнопку ОК.
Иным способом добавления файлов в архив является перетягивание файлов в окно уже существующего архива или на значок архива.
Для извлечения объектов из архива необходимо:
Для удаления отдельных объектов из архива нужно выполнить такой алгоритм:
В случаях, когда нужно перенести архивный файл на другой компьютер и не известно, установлен на нем архиватор или нет, при архивации используют специальный формат архивных файлов – SFX. Архивные файлы, созданные в этом формате, имеют расширение ехе и включают модуль самоизвлечения, что дает возможность извлекать файлы из архива без архиватора.
Для защиты архива от постороннего доступа пользователь может установить пароль доступа к архиву. Для этого необходимо на вкладке Дополнительно выбрать кнопку Установить пароль и ввести пароль и его подтверждение в соответствующие поля.
При инсталляции программы WinRAR к контекстному меню объектов добавляются основные команды работы с архивами.
Выбор команды Добавить в архив или Добавить в архив и отправить по e-mail открывает окно установки режимов архивации. Выбор других двух команд – Добавить в архив «Vlad.rar» или Добавить в архив «Vlad.rar» и отправить по e-mail приводит к созданию архива с предложенным именем (в нашем примере – «Vlad.rar»). Контекстное меню файла архива содержит команды извлечения файлов, которые открывают соответствующие окна установки режимов извлечения: Извлечь файлы, Извлечь в текущую папку или Извлечь в …
© ООО «Знанио»
С вами с 2009 года.