ПРЕДСТАВЛЕНИЕ ТЕКСТА, ИЗОБРАЖЕНИЙ И ЗВУКА.docx

  • docx
  • 29.04.2020
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала ПРЕДСТАВЛЕНИЕ ТЕКСТА, ИЗОБРАЖЕНИЙ И ЗВУКА.docx

ПРЕДСТАВЛЕНИЕ ТЕКСТА, ИЗОБРАЖЕНИЙ И ЗВУКА

Представление текста. Информация в форме текста обычно представляется с помощью кода, причем каждому отлич- ному от других символу (например, букве алфавита или знаку пунктуации) присваивается уникальная комбинация двоичных разрядов. В этом случае текст будет представлен как длинный ряд битов, в котором следующие друг за другом комбинации битов отражают последовательность символов в исходном тексте.

В ранний период развития компьютерной технологии было разработано много подобных кодов, причем каждый из них использовался в различных элементах оборудования. Это привело к появлению ряда проблем, связанных с передачей ин- формации. Во избежание этих проблем Американский национальный институт стандартов (American National Standards Institute, ANSI) принял Американский стандартный код для обмена информацией (American Standard Code for Information Interchange, ASCII – произносится как "эс-кии"), который приобрел очень большую популярность. В этом коде комбинации двоичных разрядов длиной семь бит используются для представления строчных и прописных букв английского алфавита, знаков пунктуации, цифр от 0 до 9, а также кодов управления передачей информации (перевод строки, возврат каретки и та- буляция). В наше время код ASCII часто употребляется в расширенном восьмиразрядном формате, который получается посред- ством добавления нуля в старший конец каждого семиразрядного кода. Благодаря этому можно получить не только код, раз- мер которого соответствует типичной однобайтовой ячейке памяти, но и 128 новых дополнительных комбинаций двоичных разрядов (которые получаются в результате добавления в старший конец бита со значением 1). Это позволяет представлять сим- волы, не поддерживаемые исходной версией кода ASCII. К сожалению, из-за того, что фирмы-разработчики широко исполь- зовали собственные варианты толкования этих дополнительных кодов, данные, представленные в этих кодах, оказалось не так-то просто переносить с одной программы в другую, особенно если эти программы были разработаны разными фирмами.

Ниже приведен неполный список ASCII-кодов символов. В этом списке к исходным семиразрядным двоичным кодам слева приписаны нули – для получения восьмибитовых кодов, общепринятых в настоящее время.

 

Символ

ASCII-код

Символ

ASCII-код

Символ

ASCII-код

(пробел)

00100000

?

00111111

~

01011110

!

00100001

@

01000000

_

01011111

00100010

А

01000001

а

01100001

#

00100011

В

01000010

b

01100010

$

00100100

С

01000011

с

01100011

%

00100101

D

01000100

d

01100100

&

00100110

Е

01000101

е

01100101

00100111

F

01000110

f

01100110

(

00101000

G

01000111

g

01100111

)

00101001

Н

01001000

h

01101000

*

00101010

I

01001001

i

01101001

+

00101011

J

01001010

j

01101010

,

00101100

К

01001011

k

01101011

00101101

L

01001100

1

01101100

.

00101110

M

01001101

m

01101101

/

00101111

N

01001110

n

01101110

0

00110000

О

01001111

о

01101111

1

00110001

P

01010000

p

01110000

2

00110010

Q

01010001

q

01110001

3

00110011

R

01010010

г

01110010

4

00110100

S

01010011

s

01110011

5

00110101

Т

01010100

t

01110100

6

00110110

U

01010101

u

01110101

7

00110111

V

01010110

v

01110110

8

00111000

W

01010111

w

01110111

9

00111001

X

01011000

x

01111000

:

00111010

Y

01011001

у

01111001

;

00111011

Z

01011010

z

01111010

00111100

[

01011011

{

01111011

=

00111101

\

01011100

}

01111101

 

00111110

]

01011101

 


На рис. 1.17 показано, как в этой кодировке приветствие Hello представляется с помощью следующей комбинации би- тов: 01001000 01100101 01101100 01101100 01101111 00101110.

Несмотря на то что ASCII – это один из наиболее широко используемых кодов, сегодня растет популярность кодов с более широкими возможностями, которые способны представлять документы на разных языках. Одним из них является Uni- code, который был разработан в результате объединенных усилий нескольких ведущих фирм-производителей программного и аппаратного обеспечения. В этом коде для представления каждого символа используется уникальная комбинация из 16 двоичных                         разрядов.      В                                      результате                    кодировка                                        Unicode                        включает 65 536 различных двоичных кодов, что вполне достаточно даже для представления всех широко употребляемых китайских и японских алфавитов. Международная организация по стандартизации (International Organization for Standardization, часто именуемая ISO, от греческого isos – одинаковый) разработала код, способный соперничать даже с кодировкой Unicode. Здесь для выражения символов используются комбинации из 32 бит, в результате чего этот код позволяет представить более 17 миллионов символов. Будущее покажет, какой из двух кодов приобретет большую популярность.

Рис. 1.17. Представление слова Hello, в кодах ASCII

Несмотря на то что метод хранения информации в виде закодированных символов достаточно удобен, он оказывается неэффективным при записи чисто числовой информации. Например, пусть в память требуется записать число 25. Если вос- пользоваться символами в кодах ASCII, то для записи этого числа потребуется один байт на каждый символ, а всего – 16 бит (более того, самое большое число, которое мы сможем представить с помощью 16 битов, – это 99). Используя двоичную сис- тему счисления, можно в одном байте сохранить любое целое число в диапазоне от 0 до 255 (от 00000000 до 11111111), а в двух байтах – уже любое целое число в диапазоне от 0 до 65 535. Это намного лучше, нежели сохранять в двух байтах только целые числа от 0 до 99, как при использовании для кодировки числа однобайтовых символов в кодах ASCII.

Представление изображений. Наиболее распространенные из существующих методов представления изображений можно разделить на две большие категории: растровые методы (bitmap techniques) и векторные методы (vector techniques). При растровом методе изображение представляется как совокупность точек, называемых пикселями (pixel, сокращение от picture element – элемент изображения). Говоря упрощенно, изображение кодируется в виде длинных строк битов, которые представляют цвет пикселей в изображении. Для черно-белых изображений каждый пиксель представляется 1 битом. При этом каждый бит равен 0 или 1, в зависимости от того, является ли соответствующий пиксель черным или белым.

Для передачи градаций серого цвета в черно-белых изображениях каждый пиксель кодируется комбинацией из 8 бит.

Это позволяет передать 256 значений серого цвета.

Большинство периферийных устройств современных вычислительных машин, например факсимильные аппараты, ви- деокамеры или сканеры, преобразует цветные изображения в графические файлы с растровым форматом. Чаще всего эти устройства записывают цвет каждого пикселя, раскладывая его на три составляющие красную (Red, R), зеленую (Green, G) и синюю (Blue, B), соответствующие трем первичным цветам. Такая система кодирования называется системой RGB по пер- вым буквам основных цветов.

Для передачи интенсивности каждого цвета обычно используется один байт (или 24 двоичных разрядов на 1 пиксель). Это позволяет определить 16,5 млн. различных цветов. Такой режим представления цветной графики называется полноцвет- ным (True Color).

При уменьшении количества двоичных разрядов до 16 на 1 пиксель удается передать 65 тыс. различных цветов. Такой режим представления цветной графики называется High Color.

Аналогичный трехкомпонентный пиксельный подход к передаче графической информации используется и при выводе изображений на экраны мониторов современных компьютеров. Экраны этих устройств содержат десятки тысяч пикселей, каждый из которых состоит из трех компонентов (красного, зеленого и синего), что можно заметить, воспользовавшись уве- личительным стеклом, а иногда даже невооруженным глазом.

Формат "три байта на пиксель" означает, что для хранения изображения, в котором 1280 рядов по 1024 пикселя (фото- графия обычного размера), потребуется несколько мегабайт памяти, что существенно превышает размер стандартной диске- ты. В разделе 1.6 будут рассмотрены два наиболее распространенных формата для сжатия подобных изображений до более при- емлемых размеров (это форматы GIF и JPEG).

Одним из недостатков растровых методов является трудность пропорционального изменения размеров изображения до произвольно выбранного значения. В сущности, единственный способ увеличить изображение – это увеличить сами пиксе- ли. Однако это приводит к появлению зернистости, что также часто встречается и при фотографировании на пленку. Век- торные методы позволяют избежать проблем масштабирования, характерных для растровых методов. В этом случае изобра- жение представляется в виде совокупности линий и кривых. Вместо того, чтобы заставлять устройство воспроизводить за- данную конфигурацию пикселей, составляющих изображение, ему передается подробное описание того, как расположены образующие изображение линии и кривые. На основе этих данных устройство, в конечном счете, и создает готовое изобра- жение. С помощью подобной технологии описываются различные шрифты, поддерживаемые современными принтерами и мониторами. Они позволяют изменять размер символов в широких пределах и по этой причине получили название масшта- бируемых шрифтов. Например, технология True Type, разработанная компаниями Microsoft и Apple Computer, описывает способ отображения символов в тексте. Для подобных целей предназначена и технология PostScript (разработанная компа- нией Adobe Systems), позволяющая описывать способ отображения символов, а также других, более общих графических данных. Векторные методы также широко применяются в автоматизированных системах проектирования (computer-aided design, CAD), которые отображают на экране мониторов чертежи сложных трехмерных объектов и предоставляют средства


манипулирования ими. Однако векторная технология не позволяет достичь фотографического качества изображений объек- тов, как при использовании растровых методов. Именно поэтому в современных цифровых фотокамерах используются рас- тровые методы представления изображения.

Представление звука. При наиболее распространенном способе кодирования звуковой информации амплитуда сигнала измеряется через равные промежутки времени и записываются полученные значения. Например, последовательность 0, 1.5, 2.0, 1.5, 2.0, 3.0, 4.0, 3.0, 0 описывает волну звука, амплитуда которой сначала увеличивается, затем немного уменьшается, затем снова повышается и, наконец, падает до 0 (рис. 1.18). Этот способ кодирования, в котором частота дискретизации со- ставляет 8000 отсчетов в секунду, используется не первый год в дальней телефонной связи. Голос на одном конце канала кодировался в виде числовых значений, отражавших амплитуду звукового сигнала, восемь тысяч раз в секунду. Эти значе- ния затем передавались по каналам связи и использовались для воспроизведения звука.

Может показаться, что 8000 отсчетов в секунду – это большая частота дискретизации, но она все же недостаточна для высокой точности воспроизведения музыки. Для получения качественного звучания на современных музыкальных компакт- дисках используется частота дискретизации, равная 44 100 отсчетов в секунду. Для данных, полученных при каждом отсче- те, отводится 16 битов памяти (или 32 бита для стереозаписей). Следовательно, для хранения одной секунды звучания требу- ется более миллиона битов.

В музыкальных синтезаторах, компьютерных играх и звуковом фоне, сопровождающем Web-страницы, широко исполь- зуется более экономная система кодирования, которая называется цифровым интерфейсом музыкальных инструментов (Musical Instrument Digital Interface – MIDI).


При использовании стандарта MIDI не требуется столько места в памяти, как при дискретизации звукового сигнала, так как эта система кодирует указания, как следует порождать музыку, а не сам звуковой сигнал.

Рис. 1.18. Звуковой сигнал, представленный последовательностью

0, 1.5, 2.0, 1.5, 2.0, 3.0, 4.0, 3.0, 0

Точнее, MIDI кодирует информацию о том, какой инструмент должен играть, какую ноту и какова продолжительность зву- чания этой ноты. Это означает, что для кларнета, играющего ноту ре в течение двух секунд, потребуются три байта, а не бо- лее двух миллионов битов, как в случае дискретизации сигнала с частотой 44 100 отсчетов.

Можно сказать, что стандарт MIDI скорее похож на нотную запись, которую читает исполнитель, чем на само исполне- ние. Издержки метода – музыкальная запись в стандарте MIDI может звучать по-разному в исполнении различных музы- кальных синтезаторов.

Вопросы для самопроверки

1.  Ниже приведено сообщение, представленное в виде символов ASCII с использованием восьми битов на один символ. Какой текст этого сообщения?

01000011 01101111 01101101 01110000 01110101 01110100

01100101 01110010 00100000 01010011 01100011 01101001

01100101 01101110 01100011 01100101

2.  Какая взаимосвязь между представлением строчных и соответствующих прописных букв в кодировке ASCII?

3.  Зашифруйте приведенные ниже предложения с помощью символов кода ASCII.

a) Where are you?

б) "How" Cheryl asked.

в) 2 + 3 = 5.

4.  Опишите устройство, которое используется в повседневной жизни и может пребывать в одном из двух состояний, подобно флажку на флагштоке, который может быть поднят или опущен. Присвойте одному из состояний значение 1, а дру- гому значение 0, а затем покажите, как будет выглядеть код ASCII для буквы b, если представить ее таким способом.

5.   Какое наибольшее числовое значение может быть представлено в трех байтах памяти, если каждая цифра будет за- шифрована в виде символа кода ASCII? Каким будет ответ при использовании двоичного представления числа?

6.  В чем состоят преимущества векторной графики по сравнению с растровой? Каковы преимущества растровой графи-

ки?

7.  Предположим, что стереозапись одного часа музыки закодирована с частотой дискретизации 44100 отсчетов в секун-

ду. Как размер закодированного сигнала соотносится с емкостью компакт-диска?