Лекция № 19 КОМПЬЮТЕРНЫЕ СЕТИ. ОРГАНИЗАЦИЯ И УСЛУГИ ИНТЕРНЕТ
ПЛАН
1. Организация глобальных сетей.
а) История развития глобальных сетей.
б) Аппаратные средства Интернета.
в) Каналы связи.
г) Программное обеспечение Интернета.
д) Как работает Интернет.
2. Интернет как глобальная информационная система.
3. World Wide Web - Всемирная паутина.
1 Организация глобальных сетей
а) История развития глобальных сетей.
Из истории человеческого общества вам должно быть известно, что многие научные открытия и изобретения сильно повлияли на ее ход, на развитие цивилизации. К их числу относятся изобретение парового двигателя, открытие электричества, овладение атом ной энергией, изобретение радио и пр. Процессы резкого изменения в характере производства, в быту, к которым приводят важные научные открытия и изобретения, принято называть научно-технической революцией.
Появление и развитие компьютерной техники во второй поло вине ХХ века стали важнейшим фактором научно-технической революции. В этом процессе выделим три этапа.
Первый этап начался с создания первой ЭВМ в 1945 году. Приблизительно в течение 30 лет компьютерами пользовалось сравнительно небольшое число людей, главным образом в научной и производственной областях.
Второй этап начался в середине 70-х годов ХХ века и связан с появлением и распространением персональных компьютеров (ПК). ПК стали широко использоваться не только в науке и производстве, но и в системе образования, сфере обслуживания, быту. ПК вошли в дом как один из видов бытовой техники наряду с радиоприемниками, телевизорами, магнитофонами.
Третий этап связан с появлением глобальной компьютерной сети Интернет. В результате персональный компьютер, который помещается на письменном столе, стал « окном » в огромный мир информации. Появились новые понятия, такие как « мировое ин формационное пространство », « киберпространство ». Распространение Интернета решает важную социальную проблему информационного неравенства, которое существует между людьми, живущими в разных странах, на разных континентах, а также
в крупных городах и на периферии. Именно развитие Интернета дает основание говорить о том, что в истории цивилизации наступает этап информационного общества.
С распространением компьютеров возникает понятие компьютерной грамотности. Это необходимый уровень знаний и умений человека, позволяющий ему использовать компьютер для общественных и личных целей.
На первом этапе развития ЭВМ компьютерная грамотность сводилась к умению программировать. Программирование главным образом изучалось в высших учебных заведениях, владели им ученые, инженеры, профессиональные программисты.
На втором этапе под общим уровнем компьютерной грамотности стали понимать умение работать на персональном компьютере с прикладными программами, выполнять минимум необходимых действий в среде операционной системы. Компьютерная грамотность на таком уровне становится массовым явлением благодаря обучению в школе, на многочисленных курсах, в самостоятельном режиме.
На третьем, современном этапе важным элементом компьютерной грамотности стало умение использовать Интернет. Появилось более широкое понятие - информационная культура. Быстро растет число компьютеров, подключенных к мировой сети. И всё более необходимым становится умение использовать компьютер для общения с другими людьми, для дистанционного обучения, поиска справочной информации, коммерческой деятельности и многого другого.
Понятие глобальной сети - системы объединенных компьютеров, расположенных на больших расстояниях друг от друга, - появилось в процессе развития компьютерных сетей. В 1964 году в США была создана компьютерная система раннего оповещения о приближении ракет противника. Первой глобальной сетью невоенного назначения стала сеть ARP ANET в США, введенная в действие в 1969 году. Она имела научное назначение и объединяла компьютеры нескольких университетов страны.
В 80-90-х годах прошлого века в разных странах создается множество отраслевых, региональных национальных компьютерных сетей. Их объединение в международную сеть произошло на базе межсетевой среды Интернет.
Важным годом в истории Интернета стал 1993 год, когда была создана служба World Wide WеЬ (WWW) - Всемирная информационная сеть (Всемирная паутина). С появлением WWW резко возрос интерес к Интернету, пошел процесс его бурного развития и распространения. Многие люди, говоря об Интернете, подразумевают именно WWW, хотя это только лишь одна из его служб.
Интернет - это сложная аппаратно-программная система, в которой нам с вами предстоит разобраться. Постараемся получить ответы на три вопроса:
• из чего состоит Интернет;
• как работает;
• для чего используется.
Часто в литературе вместо слова «Интернет» употребляют термин «Сеть» (уважительно с большой буквы). Мы также иногда будем им пользоваться.
б) Аппаратные средства Интернета
Основными составляющими любой глобальной сети являют- ся компьютерные узлы и каналы связи.
Здесь можно провести аналогию с телефонной сетью: узлами телефонной сети являются АТС - автоматические телефонные станции, которые между собой объединены линиями связи и образуют городскую телефонную сеть. Телефон каждого абонента подключается к определенной АТС.
К узлам компьютерной сети подключаются персональные компьютеры пользователей подобно тому, как с телефонными станциями соединяются телефоны абонентов . Причем в роли абонента компьютерной сети может выступать как отдельный чело век через свой ПК, так и целая организация через свою локальную сеть. В последнем случае к узлу подключается сервер локальной сети.
Организация, предоставляющая услуги обмена данными с сетевой средой, называется провайдером сетевых услуг. Английское слово provider обозначает « поставщик», « снабженец». Пользователь заключает договор с провайдером на подключение к его узлу и в дальнейшем оплачивает ему предоставляемые услуги (подобно тому, как мы оплачиваем услуги телефонной сети).
Узел содержит один или несколько мощных компьютеров, которые находятся в состоянии постоянного подключения к сети. Информационные услуги обеспечиваются работой программ-серверов, установленных на узловых компьютерах.
Каждый узловой компьютер имеет свой постоянный адрес в Интернете; он называется IР-адресом.
IР-адрес состоит из четырех десятичных чисел, каждое в диапазоне от 0 до 255, которые записываются через точку. Например:
193.126.7.29
128.29.15.124
Такие же IР-адреса получают и компьютеры пользователей Сети, но они действуют лишь во время подключения пользователя к сети, т. е. изменяются в каждом новом сеансе связи, в то время как адреса узловых компьютеров остаются неизменными.
Наряду с цифровыми IР-адресами в Интернете действует система символьных адресов, более удобная и понятная для пользователей. Она называется доменной системой имен (DNS - Domain Name System).
Например, IР-адресу 87.242.99.97 сервера методической службы издательства « БИНОМ. Лаборатория знаний» соответствует доменное им.я metodist.Lbz.ru. Данное имя состоит из трех доменов, разделенных точками.
Система доменных имен построена по иерархическому принципу. Первый справа домен (его еще называют суффиксом) - домен верхнего уровня, следующий за ним - домен второго уровня и т. д. Последний (первый слева) - имя компьютера. Домены верхнего уровня бывают географическими (двухбуквенными) или административными (трехбуквенными). Например, российской зоне Интернета принадлежит географический домен ru. Еще примеры: uk - домен Великобритании; са - домен Канады; de - до мен Германии; jp - домен Японии. Административные домены верхнего уровня чаще всего относятся к американской зоне Интернета: gov - правительственная сеть США; mil - военная сеть; edu - образовательная сеть; сот - коммерческая сеть.
Среди узлов Интернета есть своя иерархия. Например, некоторый узел в Самаре имеет соединение с узлом в Москве, который, в свою очередь, связан с рядом узлов европейской опорной сети. Последние имеют связь с узлами США, Японии и др. И всё-таки структура Интернета - это не дерево, а именно сеть. Как правило, каждый узел имеет связь не с одним, а с множеством других узлов. Поэтому маршруты, по которым поступает информация на некоторый узел, могут быть самыми разными. Этим обеспечивается устойчивость работы Сети: при выходе из строя одного узла информационные потоки к другим узлам не прерываются. Они лишь могут изменить свои маршруты.
в) Каналы связи
Существуют самые разные технические способы связи в глобальной сети:
• телефонные линии;
• электрическая кабельная связь;
• оптоволоконная кабельная связь;
• радиосвязь (через радиорелейные линии, спутники связи).
Различные каналы связи различаются тремя основными свойствами: пропускной способностью, помехоустойчивостью, стоимостью.
По параметру стоимости самыми дорогими являются оптоволоконные линии, самыми дешевыми - телефонные. Однако с уменьшением цены снижается и качество работы линии: уменьшается пропускная способность, сильнее влияют помехи. Практически не подвержены помехам оптоволоконные линии.
Пропускная способность - это максимальная скорость передачи информации по каналу. Обычно она выражается в О килобитах в секунду (Кбит/с) или в мегабитах в секунду (Мбит/с).
Пропускная способность телефонных линий - десятки и сот ни Кбит/с; пропускная способность оптоволоконных линий и линий радиосвязи измеряется десятками и сотнями Мбит/с.
На протяжении многих лет большинство пользователей Сети подключались к узлу через коммутируемые (т. е. переключаемые) телефонные линии. Такое подключение производится с помощью специального устройства, которое называется модемом. Слово «модем» - это объединение сокращений двух слов: «модулятор» - «демодулятор». Модем устанавливается как на компьютере пользователя, так и на узловом компьютере. Модем выполняет преобразование дискретного сигнала (выдаваемого компьютером) в непрерывный (аналоговый) сигнал (используемый в телефонной связи) и обратное преобразование. Основной характеристикой модема является предельная скорость передачи данных. В разных моделях она колеблется в диапазоне от 1200 до 56 000 бит/с.
Кабельная связь обычно используется на небольших расстояниях (между разными провайдерами в одном городе). На больших расстояниях выгоднее использовать радиосвязь. Всё большее число пользователей в наше время переходят от коммутируемых низкоскоростных подключений к высокоскоростным некоммутируемым линиям связи.
в) Программное обеспечение Интернета
Работа Сети поддерживается определенным программным обеспечением (ПО). Это ПО функционирует на серверах и на персональных компьютерах пользователей. Как вам известно из курса информатики основной школы, основой всего программного обеспечения компьютера является операционная система, которая организует работу всех других программ. Программное обеспечение узловых компьютеров очень разнообразно. Условно его можно разделить на базовое (системное) и прикладное. Базовое ПО обеспечивает поддержку работы сети по протоколу ТСР /IP - стандартному набору протоколов Интернета, т. е. оно решает проблемы рассылки и приема информации. Прикладное ПО занимается обслуживанием разнообразных информационных услуг Сети, которые принято называть службами Интернета. Служба объединяет серверы и клиентские программы, обменивающиеся данными по некоторым прикладным протоколам. Для каждой службы существует своя сервер-программа: для электронной почты, для телеконференций, для WWW и пр. Узловой компьютер выполняет функцию сервера определенной службы Интернета, если на нем работает сервер-программа этой службы. Один и тот же компьютер в разное время может выполнять функции сервера различных услуг; всё зависит от того, какая сервер-программа на нем в данный момент выполняется. На ПК пользователей сети обслуживанием различных информационных услуг занимаются программы-клиенты. Примерами популярных клиентов являются: Outlook Express - клиент электронной почты, Internet Explorer - клиент службы WWW (браузер). Во время работы пользователя с определенной службой Интернета между его программой-клиентом и соответствующей программой-сервером на узле устанавливается связь. Каждая из этих программ выполняет свою часть ра боты в предоставлении данной информационной услуги. Такой способ работы Сети называется технологией «клиент - сервер».
д) Как работает Интернет
В Интернете используется пакетная технология передачи ин формации. Чтобы в этом лучше разобраться, представьте себе следующую ситуацию. Вам нужно переслать товарищу в другой город какой-то многостраничный документ (например, распечатку романа, который вы сочинили). Полностью в конверт весь ваш роман не помещается, а посылать бандеролью вы не хотите - слишком долго будет идти. Тогда вы делите весь документ на части по 4 листа, вкладываете каждую часть в почтовый конверт, на каждом конверте пишете адрес и всю эту пачку конвертов опускаете в почтовый ящик. Например, если ваш роман занимает 1 00 страниц, то вам придется отправить 25 конвертов. Вы даже можете опустить конверты в разные почтовые ящики на разных узлах связи (для интереса, чтобы узнать, какие дойдут быстрее). Но поскольку на них указан один и тот же адрес, все конверты должны дойти до вашего товарища. А еще, чтобы товарищу было удобно собрать роман целиком, на конвертах желательно указать порядковые номера.
Аналогично работает пакетная передача информации в Интернете. За ее работу отвечает протокол ТСР /IP, о котором уже говорилось раньше. Пора разобраться, что же обозначают эти загадочные буквы.
Фактически речь идет о двух протоколах. Первый - ТСР-протокол расшифровывается так: Transmission Control Protocol - протокол управления передачей. Именно согласно этому протоколу всякое сообщение, которое нужно передать по Сети, разбивается на части. Эти части называются ТСР-пакетами. Для доставки пакеты передаются протоколу IP, который к каждому пакету дописывает IР-адрес его доставки и еще некоторую служебную ин формацию. Таким образом, ТСР-пакет - это аналог конверта с «кусочком» романа и адресом получателя. Каждый такой пакет будет самостоятельно перемещаться по сети независимо от других, но все они вместе соберутся у адресата. Далее, согласно протоколу ТСР, происходит обратный процесс : из отдельных пакетов собирается исходное сообщение. Здесь, очевидно, необходимы те самые порядковые номера на конвертах; аналогичные номера со держатся и в ТСР-пакетах. Если какой-то из пакетов не дошел или был испорчен при транспортировке, его передача будет запрошена повторно.
Согласно протоколу ТСР, передаваемое сообщение разбивается на пакеты на отправляющем сервере и восстанавливается в исходном виде на принимающем сервере.
Назначение IР-протокола (lnternet Protocol) - доставка каждого отдельного пакета до места назначения.
Пакеты передаются, как эстафетные палочки, от одного узла к другому. Причем маршруты для разных пакетов из одного и того же сообщения могут оказаться разными. Описанный механизм передачи пакетов отображен на рис. 2.1. Вопрос о маршруте решается отдельно для каждого па1сета. Всё зависит от того, куда его выгоднее передать в момент обработки. Если на каком-то участке Сети произошел « обрыв», то передача пакетов пойдет в обход этого участка.
Рис. 2.1. Пакетная технология передачи информации в глобальной сети
Таким образом, в любой момент времени по любому каналу Сети перемещается «вперемешку» множество пакетов из самых разных сообщений. Использование всякого канала связи стоит денег: междугородние, а тем более международные, телефонные разговоры достаточно дороги. Если бы, работая в Сети, вы в течение всего сеанса связи монопольно занимали международный канал, то расходы вас быстро разорили бы. Однако, согласно описанной технологии, канал вы делите с сотнями (а может - тысячами) других пользователей, и поэтому на вашу долю приходится лишь небольшая часть расходов
Система основных понятий
2 Интернет как глобальная информационная система
Далее мы будем говорить об Интернете с точки зрения выполнения им своего главного назначения: быть глобальной информационной системой. Системой, дающей пользователю неограниченные возможности как для информационных коммуникаций с другими людьми, так и для получения любой интересующей его информации.
Средства обеспечения определенных информационных услуг для пользователей Сети принято называть службами (сервисами) Интернета. Число различных служб в Сети непрерывно растет. Опишем лишь некоторые самые известные службы, разделив их на коммуникационные и информационные.
Всякая услуга в Интернете предоставляется с помощью программ-серверов. Серверы делятся на несколько видов, в зависимости от типа услуги, которая предоставляется пользователям:
- wеЬ-серверы предоставляют доступ к информации в виде wеЬ-страниц, файловые серверы обеспечивают доступ к файлам,
- почтовые серверы выполняют обмен почтовыми сообщениями,
- игровые серверы служат для одновременной игры нескольких пользователей и др.
С сервером взаимодействует программа-клиент, работающая на компьютере пользователя.
Работа связки «клиент - сервер» подчиняется определенному протоколу: стандарту на представление, обработку, передачу информации средствами данной службы.
Если протокол ТСР /IP называется базовым протоколом Интернета, то протоколы служб можно назвать прикладными протоколами (иногда их называют протоколами второго уровня).
Коммуникационные службы Интернета
Коммуникационные службы обеспечивают общение между пользователями.
Электронная почта - e-mail. Это наиболее старая и одна из самых массовых служб Сети. Ее назначение - поддержка обмена электронными письмами между пользователями. Схема работы электронной почты отражена на рис.2.2. Почтовый сервер - это своеобразное «почтовое отделение», куда по ступает входящая корреспонденция зарегистрированных на нем пользователей. Эта корреспонденция помещается в почтовые ящики пользователей - специально отведенные разделы на жест ком диске. Каждый пользователь получает персональный почто вый адрес, по которому к нему будут поступать письма.
Рис. 2.2. Схема функционирования электронной почты
Каждый почтовый ящик имеет минимум один адрес следующего формата:
имя@адрес_сервера
Адрес почтового ящика должен быть уникальным. Для работы с почтой можно использовать wеЬ-интерфейс (т. е. работать с обычным браузером) или установить специализированный почтовый клиент.
Почтовый клиент - программа, помогающая составлять и посылать электронные сообщения, а также получать и отображать письма на компьютере пользователя. Примеры почтовых клиентов: Outlook Express , Netscape Messenger, The Bat . Пример подготовленного к передаче письма в среде Outlook Express приведен на рис . 2.3.
Рис. 2.3. Окно почтовой программы Outlook Express
Из схемы на рис. 2.2 видно, что сервер и клиент работают по разным протоколам. Безусловно, «язык» у них общий и они «понимают» друг друга. Но их функции отличаются. РОРЗ (Post Office Protocol - протокол почтового отделения), кроме всего прочего, выполняет функцию защиты информации. Во время сеанса связи он устанавливает личность пользователя, обеспечивает связь с его персональным ящиком. Задача программы-клиента - передать на сервер исходящие письма и принять поступившие. Здесь используется более простой протокол SMTP (Simple Mail Transfer Protocol - простейший протокол передачи почты).
По электронной почте можно не только отправлять текст, но и вкладывать в сообщение файлы любого формата.
Службы мгновенного обмена сообщениями (chat). Следующей популярной службой, предназначенной для мгновенного обмена сообщениями между пользователями Интернета, являются системы мгновенного обмена сообщениями. Это, например, программа ICQ ( « ай-си-кью » - игра слов, подобным образом читается выражение I Seek You, что означает «Я ищу вас»).
ICQ позволяет пользователю получить уникальный номер, называемый UIN (Universal Internet Nuшber, универсальный номер Интернета), используемый для вызова и прямого общения. IСQ-клиент можно бесплатно загрузить с сервера www.icq. com.
После установки программы на компьютер необходимо зарегистрироваться в системе серверов ICQ и получить UIN. При каждом подключении к Интернету программа ICQ определяет текущий IР-адрес вашего компьютера и по нему определяет UIN. Зная UIN собеседника, можно быстро отправить ему сообщение.
Сеть ICQ позволяет осуществлять поиск нужного абонента по целому ряду полей, включая фамилию, имя, адрес электронной почты, место проживания, возраст и т. д. Помимо службы ICQ, в Интернете есть несколько других аналогичных систем.
IР-телефония (Интернет-телефония) - система, позволяющая вести разговор в реальном времени с использованием каналов связи Интернета.
Голосовая связь через IР-сеть может осуществляться двумя основными способами.
1) Компьютер - компьютер. Это самый первый и простой способ IР-телефонии. Для его реализации необходимы два компьютера со звуковыми картами, а также системами ввода/вывода звуковой информации (колонки или наушники, микрофон).
2) Компьютер - телефон. Один абонент должен иметь компьютер со звуковой картой и системой ввода/вывода звука, либо специальный IР-телефон, подключаемый к порту USB. Второй абонент имеет обычный телефон, находящийся в любой точке мира. Соединение осуществляется через специальные телефонные шлюзы, предоставляемые провайдерами телефонных услуг в Интернете. Звонок через телефонный шлюз стоит намного дешевле, чем обычный междугородний звонок по схеме «телефон - телефон». Одной из наиболее популярных про грамм для IР-телефонии в настоящее время является Skype (рис.2.4). Она обеспечивает цифровую голосовую связь через Интернет между компьютерами, а также платные
Рис. 2.4. Интерфейс программы Skyp
услуги для связи с абонентами обычной телефонной сети. При подключении к компьютеру wеЬ-камеры Skype поддерживает также и видеосвязь между двумя абонентами.
Видеоконференция - это информационная услуга, обеспечивающая одновременную двухстороннюю передачу, обработку, пре образование и представление видео- и звуковой информации на расстояние в режиме реального времени с использованием компьютеров для более чем двух абонентов.
Для общения в режиме видеоконференции абоненты должны иметь микрофон, видеокамеру (wеЬ-камеру), устройство отображения информации и воспроизведения звука, а также компьютер с необходимым программным обеспечением. Популярной системой поддержки видеоконференций является Vidicor.
Различают конференции симметричные, т. е. такие, где все абоненты видят и слышат друг друга, и асимметричные, т.е. такие, где часть участников только видит и слышит, но не участвует постоянно. С помощью видеоконференций организуются совещания, встречи людей, находящихся в разных точках мира, дистанционное обучение и др.
Информационные службы Интернета
Информационные службы предоставляют пользователям возможность доступа к определенным информационным ресурсам, хранящимся в Интернете. Такими ресурсами являются либо файлы стандартных форматов, либо разного рода документы (в том числе мультимедийные), которые можно просмотреть, сохранить, распечатать.
Служба передачи файлов. Часто эту службу называют по имени используемого протокола: FTP (File Transf er Protocol - протокол передачи файлов). Со стороны Сети работу службы обеспечи вают FТР-серверы, а со стороны пользователей - FТР-клиенты.
Назначение FТР-сервера - хранение набора файлов самого разнообразного назначения (обычно в архивированном виде). Чаще всего это программные файлы: средства системного и прикладного программного обеспечения. Но в наборах могут хранить ся файлы и любых других форматов : графические, звуковые, документы Microsoft Word, Microsoft Excel и др. Вся эта информация образует иерархическую структуру папок (каталогов и под каталогов).
После соединения FТР-клиента с сервером на экране пользователя открывается файловый интерфейс хранилища папок и файлов на сервере (наподобие Проводника Windows). Далее работа происходит так же, как с файловой системой на собственном ПК: папки и файлы можно просматривать, сортировать, копировать на свои диски.
Клиент FTP входит в состав программы Internet Explorer и поэтому всегда имеется на ПК, работающем под управлением ОС Microsoft Windows .
World Wide WеЬ (WWW, Всемирная паутина) - самая массовая сегодня информационная служба Интернета. Это огромная, распределенная по всему миру информационная система, содержащая миллионы документов на самые разнообразные темы.
Работает эта служба на базе протокола НТТР. Подробно о WWW будет рассказано в следующем параграфе. О популярности WWW говорят такие данные: с момента создания Интернета (1969 г) до появления WWW (1993 г.) к услугам Сети подключились около 2 миллионов пользователей; с появлением WWW за 5-7 лет это число увеличилось приблизительно до 200 миллионов человек. В последнее время Интернет стал отождествляться с WWW. В настоящее время в мире насчитывается более 2 миллиардов пользователей Интернета и World Wide WеЬ.
WеЬ-2-сервисы
Начиная с 2005 года в Интернете развивается новая методика использования wеЬ-технологии, объединяющая в себе информационные и коммуникационные функции, которая получила название Web-2. Основная ее особенность состоит в том, что информационный контент, выкладываемый в Сеть, создают сами пользователи. К сервисам, существующим на основе этой методики, относятся социальные сети (Одноклассники, Вконтакте и др.), блоги, живые журналы, видеохостинги (для размещения видеороликов, например YouTube), фотохостинги (для размещения фото альбомов), файловые обменники и т. д.
Блог (от web log - интернет-дневник) - wеЬ-сайт, основное содержание которого составляют регулярно добавляемые записи владельца (блоггера). Обычно записи отсортированы в обратном хронологическом порядке, т. е. вначале располагается последняя запись. Блоги доступны любым читателям и допускают публичную полемику с блогером.
Живой журнал (ЖЖ, LiveJournal)- исторически первый, созданный в 1999 г., сервис Интернета для ведения блогов. ЖЖ поддерживает общение между блогерами, позволяет вести коллективные блоги, пополнять «ленту друзей» и др. Живой журнал - один из вариантов социальных сетей, существующих в Интернете. Наряду с ЖЖ существуют другие платформы ведения блогов.
Система основных понятий
3 World Wide Web - Всемирная паутина
Системные основы WWW
Рассмотрим более подробно, что же такое World Wide Web (WWW). Обычно это словосочетание переводят как «Всемирная паутина». Каждый представляет себе паутину - это сеть, которую плетет паук. По смыслу слово «паутина» (Web) является синонимом слова «сеть» .
World Wide WеЬ (WWW) - это сеть документов, связанных между собой гиперссылками.
Таким образом, за использованием разных терминов закрепился разный смысл: сеть - это система взаимосвязанных компьютеров, т.е. техническая система, а паутина (Web) - это система взаимосвязанных документов, т.е. структура данных.
Разумеется, « паутина» документов существует на базе компьютерной сети. Каждый отдельный документ, имеющий собственный адрес, называется wеЬ-страницей.
Каждая wеЬ-страница может иметь множество связей с другими страницами, которые хранятся как на том же самом компьютере, так и на других компьютерах сети. На рис . 2.5 схематически показано наложение паутины документов на компьютерную сеть. Сплошными линиями обозначены wеЬ-серверы и связи между ними, пунктирными - wеЬ-документы и их связи.
Рис. 2.5. Компьютерная сеть и « паутина» документов
WеЬ-сервер - это компьютер, на котором работает сервер-программа WWW. В его дисковой памяти хранятся wеЬ-страницы.
WеЬ-страница (документ) может содержать самую разную ин формацию: текст, рисунок, звукозапись, видео. Каждая страница хранится в отдельном файле, имя которого имеет расширение htm или html.
Гиперссылка - это некоторое ключевое слово или объект в документе, с которым связан указатель для перехода на другую страницу в паутине. Обычно изображение гиперссылки на странице каким-то образом выделяется, например цветом или подчеркиванием. При подведении к гиперссылке указателя мыши он принимает вид руки с указывающим пальцем. Если при этом щелкнуть левой кнопкой мыши, то произойдет переход по указателю к связанному документу. Текст, в котором используются гиперссылки, называется гипертекстом. Гиперссылки могут быть связаны не только с текстом, но и с другими видами объектов: рису нок, фото, видео, звукозапись, телеканал и др.
В основе технологии WWW лежат следующие понятия:
• НТТР (HyperText Transf er Protocol, протокол передачи гипертекста);
• адрес URL (Universal Resource Locator, универсальный указатель ресурса);
• язык HTML (HyperText Markup Language , язык разметки гипертекста).
НТТР (HyperText Transfer Protocol) - протокол передачи гипертекста. Используется службой WWW. Браузер - клиент-про грамма WWW посылает запрос wеЬ-серверу, хранящему файл с необходимым документом. В ответ на запрос сервер высылает клиенту требуемый файл или сообщение об ошибке, если файл недоступен. Протокол НТТР регулирует данный вид взаимодействия между клиентом и сервером.
URL-aдpec. Уже рассказывалось о системе адресации в компьютерном пространстве Сети. Это IР-адреса, доменные адреса. В пространстве информационных ресурсов Интернета использует ся своя система адресации. Она называется URL (Uniformed Resource Locator) - универсальный указатель ресурса. Каждая wеЬ-страница или файл имеют свой уникальный URL-aдpec, который состоит из трех частей: имя используемого для доступа протокола; имя сервера, на котором хранится ресурс; полное имя файла (путь+имя) на сервере. Например, URL-aдpec главной страницы wеЬ-сайта газеты «Первое сентября» выглядит так:
http: //www. l september . ru/ru/first . htm
Здесь http:// - протокол доступа;
www. l september. ru - имя сервера;
/ru/first.htm - полное имя файла.
Префикс «www» образовался больше 20 лет назад и обозначал то, что на соответствующем домене работает именно wеЬ-сервер, а не какой-либо иной сервис. Но теперь, когда WWW стал доминирующим сервисом, смысл в его указании почти пропал.
Следует заметить, что имя составлено по правилам операционной системы Unix, под управлением которой работают серверы Интернета. В отличие от Windows вместо символа «\» (обратный слеш) здесь используется символ «/» (слеш). Кроме того, строчные и прописные буквы не являются взаимозаменяемыми.
WеЬ-сайт (другое название - wеЬ-узел) - это совокупность взаимосвязанных страниц, принадлежащих какому-то одному лицу или организации. WеЬ-сайт организуется на wеЬ-сервере провайдера сетевых услуг. Всякий сайт имеет главную страницу, являющуюся своеобразным титульным листом сайта. Как правило, главная страница представляет владельца сайта и содержит гиперссылки на разные его разделы . Пример главной страницы wеЬ-узла издательства «БИНОМ. Лаборатория знаний» приведен на рис.2.6.
Рис. 2.6. Фрагмент главной страницы сайта издательства БИНОМ
HTML - стандартный язык описания wеЬ-страниц. Теги (метки) языка HTML интерпретируются браузером, который на их основе строит в памяти компьютера объектную модель документа, а затем выводит эти объекты на экран .В результате пользователь видит отображение wеЬ-страницы в окне браузера. Язык HTML является основой любого гипертекстового документа, даже если он был создан в одном из конструкторов сайтов или визуальном редакторе.
WеЬ-браузер - программа-клиент WWW. Слово browser можно перевести как «обозреватель ». Наиболее распространенными программами этого типа являются Netscape Navigator, Internet Explorer, Opera, Google Chrome.
Средства поиска информации в W WW
Как уже говорилось выше, WWW - это система wеЬ-страниц, связанных между собой гиперссылками. Однако эти связи не имеют регулярности, как, например, в иерархической структуре данных. В этом смысле можно говорить о том, что система wеЬ-стра ниц не структурирована.
Единственной координатой wеЬ-документа является его URL-aдpec. Однако URL-aдpec никак не связан с содержанием до кумента. Но поиск данных осуществляется именно по содержанию. Как же в такой ситуации можно выполнять поиск нужной информации в паутине?
В поиске информации в WWW пользователю помогает поисковая служба Интернета - услуга поисковых серверов. Существуют две разновидности поисковых серверов: поисковые каталоги и поисковые указатели.
Поисковые каталоги. Если вам приходилось пользоваться услугами больших библиотек, то вы знаете, что такое библиотечный каталог. Существуют алфавитные и предметные каталоги. В алфавитных каталогах карточки с библиографическими данными книг разложены в алфавитном порядке фамилий авторов. В предметных каталогах карточки систематизированы по содержанию книг.
Систематизация в предметном каталоге производится по иерархическому принципу. На первом уровне иерархии весь книжный фонд делится на крупные разделы: художественная литература, учебная литература, общественно-политическая литература, научно-техническая литература и т. п. Каждый из этих разделов делится на подразделы; например, учебная литература делится на разделы высшего, среднего, дошкольного образования. Книги для среднего образования могут делиться по предметам, которые, в свою очередь, делятся по классам. Чтобы подобрать литературу по нужной теме, читатель должен понимать принцип организации каталога.
Поисковые каталоги WWW организованы по аналогичному иерархическому принципу. Только в них систематизируется ин формация не о книгах, а о документах, хранящихся в World Wide Web. На главной странице поискового каталога располагается список основных тематических разделов (рубрик). Например: финансы и экономика, государство и право, наука и образование, компьютеры, политика и т. д. Каждое имя в этом списке являет ся внутренней гиперссылкой поискового каталога. Щелчок мышью по гиперссылке вызывает на экран список заголовков следующего подраздела и т.д. Очевидно, такая система подобна де реву файловой системы. Перемещаясь по дереву внутренних гиперссылок каталога, пользователь в конечном итоге получает список внешних ссылок на искомые wеЬ-документы.
Поисковые каталоги заполняются вручную специалистами, обслуживающими данную службу. При ручном способе отбора невозможно получить в каталоге исчерпывающую информацию о ресурсах Сети, и в этом состоит основной недостаток каталогов. Однако такой способ классификации исключает ссылки на случайные документы, не имеющие отношения к указанной теме . Таким образом, поисковые каталоги при относительно небольшом охвате ресурсов Сети обеспечивают хорошее качество подборки документов.
Примерами русскоязычных поисковых каталогов являются:
Yandex - http: //yaca.yandex.ru;
Mail. ru (List . ru) - http://www. mail.ru;
Russia on the Net - http: //www.ru.
Поисковые указатели.
Другое название этого вида поисковой службы - поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели - это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово « процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.
Принцип работы поисковых указателей заключается в создании и использовании индексных списков - аналогов книжных предметных указателей.
Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что та ким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически. Основной составляющей поисковых машин являются про граммы просмотра wеЬ-документов, которые называют по-разному: роботами, червяками, пауками и пр. Наверное, наиболее под ходящим названием является «пауки», если уж сеть WWW называть паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все документы, определяя в них ключевые слова и записывая в свою базу индексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержание паутины всё время меняется и дополняется. Даже в уже просмотренные документы авторы могут внести изменения или вообще удалить их. Поисковая машина всё время должна поддерживать информацию в актуальном состоянии.
Эффективность работы поисковой машины зависит от используемых алгоритмов формирования базы указателей. Эти алгоритмы представляют «know how», т.е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число указателей к некоторым ключевым словам составляет многие тысячи. Чем лучше алгоритм, тем меньше в индексный список попа дает «мусора» - случайных документов, не имеющих отношения к теме поиска.
В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову система выдает список ссылок на документы, расположенные по убыванию рейтинга. Рейтинг определяется по числу обращений к документу, которые были сделаны ранее. Самые популярные доку менты попадают в начало списка.
Число поисковых указателей превышает число поисковых каталогов . Популярными в России указателями являются:
Апорт 2000 - www . aport.ru;
Рамблер - www. ramЫer.ru;
Yandex.ru - www.yandex.ru;
Google - www.google.ru.
Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.
Система основных понятий
ВОПРОСЫ И ЗАДАНИЯ
1. Организация глобальных сетей
1. Обоснуйте, почему создание и развитие компьютерной техники можно отнести к важнейшим факторам научно-технической революции ХХ столетия.
2. Какие технические и социальные проблемы решаются средствами глобальных компьютерных сетей?
3. Что такое глобальная сеть? Что такое Интернет?
4. Как с развитием компьютерной техники изменялось представление о компьютерной грамотности?
5. Попробуйте предсказать последствия для человечества дальнейшего развития компьютерной техники и глобальных сетей.
6. Чем отличается узловой компьютер от ПК пользователя сети? Обозначьте разницу по следующим позициям: назначение, режим работы, программное обеспечение.
7. Что обозначает слово « сервер » в сетевых технологиях?
8. Что такое IР-адрес и доменный адрес?
9. Сопоставьте различные типы каналов связи по двум их свойствам: цена и качество.
10. Для чего используется модем?
11. Как проявляется технология « клиент - сервер » в организации работы Сети?
12. Объясните, почему пакетный принцип передачи информации способствует повышению надежности работы Сети.
13. В чем разница назначения протоколов ТСР и IP?
14. Объясните, почему международная связь по сети Интернет дешевле телефонной или телеграфной связи.
2. Интернет как глобальная информационная система
1. Объясните различие между коммуникационными информационными службами Сети.
2. Чем отличается сhаt-конференция от видеоконференции?
3. В чем преимущество Интернет-телефонии по сравнению с традиционной телефонной связью?
4. Для каких целей используется FТР-служба?
5. Какое значение для развития Интернета имело появление службы WWW? 6. В чем специфика wеЬ-2-сервисов?
7. Что такое блог?
8. Какие способы размещения информации в Интернете используете лично вы?
3. World Wide Web - Всемирная паутина
1. Какое смысловое различие подразумевается в использовании терминов «сеть» и «паутина»?
2. Что является наименьшей адресуемой единицей информации в WWW?
3. По какому признаку можно отличить адрес wеЬ-сервера от других адресов в Сети?
4. Сопоставьте структуру полного имени файла (адреса файла) на автономном компьютере и URL-aдpeca в сети. Отметьте сходство и различие. 5. Представьте себе, что вы проектируете сайт своей школы. Какую информацию вы бы поместили на главной странице?
6. Обоснуйте необходимость существования поисковых служб в Интернете. 7. В чем различие между поисковыми каталогами и поисковыми указателями?
8. Какую работу выполняют роботы (пауки) поисковых машин?
9. Какими поисковыми службами вы чаще всего пользуетесь?
Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.