Служба World Wide Web (WWW) – это единое информационное пространство, состоящее из сотен миллионов взаимосвязанных электронных документов, хранящихся на Web-серверах. Отдельные документы называются Web-страницами. Группы тематически объединенных Web-страниц называют Web-узлами или Web-сайтами.
Программы для просмотра Web-страниц называют браузерами (обозревателями). Web-страницы имеют особый формат и создаются с помощью специального языка разметки гипертекста – HTML (HyperText Markup Language). Основное достоинство такого формата – возможность быстрого перехода по гипертекстовым ссылкам.
Адрес любого документа в сети Интернет определяется унифицированным указателем ресурса - URL.
Универсальный указатель ресурсов (URL — Universal Resource Locator) включает в себя способ доступа к документу, имя сервера, на котором находится документ, а также путь к файлу (документу).
URL – универсальный и уникальный адрес, присваиваемый любому ресурсу в Интернет.
URL имеет следующий общий формат:
протокол://адрес сервера:номер порта/имя директории/имя файла
Способ доступа к документу определяется используемым протоколом передачи информации. Для доступа к Web-страницам используется протокол передачи гипертекста HTTP (Hyper Text Transfer Protocol).
Например, для начальной Web-страницы Internet Explorer универсальный указатель ресурсов принимает вид http://home.microsoft.com/intl/ru/
Он состоит из трех частей:
http:// — протокол доступа;
home.microsoft.com — имя сервера фирмы Microsoft;
/intl/ru/ — путь к Web-странице,
Для доступа к FTP-серверам используется специальный протокол передачи файлов FTP (File Transfer Protocol), который позволяет передавать и получать файлы.
Например, для одного из файлов на FTP-сервере фирмы US Robotics универсальный указатель ресурсов принимает вид ftp://ftp.usr.com/usr/d107/mdm3com.exe
Он состоит из трех частей:
ftp:// — протокол доступа;
ftp.usr.com — имя FTP-сервера;
/usr/d107/mdm3com.exe — путь к файлу.
Сеть Интернет растет очень быстрыми темпами, и найти нужную информацию среди десятков миллионов документов (Web-страниц, файлов и др.) становится все сложнее. Для поиска информации используются специальные поисковые серверы, которые содержат более или менее полную и постоянно обновляемую информацию о Web-страницах, файлах и других документах, хранящихся на десятках миллионов серверов Интернет.
Различные поисковые серверы могут использовать различные поисковые механизмы (search engine) поиска, хранения и предоставления пользователю информации. Однако общим является то, что к моменту запроса пользователя вся информация о документах Интернет в компактном виде хранится в базе данных поискового сервера.
Имеющиеся поисковые системы можно условно разделить на три группы:
1) справочники (тематические каталоги) Интернет;
2) поисковые системы общего назначения (индексные);
3) специализированные поисковые системы.
Справочник Интернет является аналогом тематического указателя в библиотеке: он предоставляет перечень наиболее важных документов (Web-страниц) по заданной теме. Пример такой системы — поисковый сервер Yahoo:
http://www.yahoo.com
Поисковые системы общего назначения позволяют находить документы во Всемирной паутине по ключевым словам. Принцип, на котором основано большинство таких систем, состоит в том. что специальные программы-роботы автоматически «обходят» WWW-серверы, читают и индексируют все встречающиеся документы, выделяя при этом ключевые слова, относящиеся к данному документу, и запоминая их вместе с URL этого документа в базе данных. Большинство поисковых систем разрешают также автору новой Web-страницы самому внести информацию в базу данных.
Обращаясь к такой поисковой системе, вы вводите одно или несколько ключевых слов, которые, по вашему мнению, могли бы вывести вас на интересующую информацию, и отправляете запрос. Через несколько секунд поисковая система вернет вам список документов (с указанием URL), в которых были найдены указанные вами ключевые слова. Примером такой поисковой системы является Rambler:
http//www.Rambler.ru
Специализированные поисковые системы позволяют вам находить информацию, находящуюся в других информационных «слоях» Интернет, смежных со Всемирной паутиной, например, на FTP-серверах. Примером такой системы является Lycos:
http//ftpsearch.lycos.com
Так как информация в Интернет постоянно меняется (создаются новые документы, удаляются старые и т. д.), поисковые роботы не всегда успевают отследить все эти изменения. Информация, хранящаяся в базе данных поискового сервера, может отличаться от реального состояния Интернет, и поэтому иногда пользователь может получить ссылку на уже не существующий или перемещенный документ.
Материалы на данной страницы взяты из открытых источников либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.