Поисковые указатели

  • docx
  • 12.11.2021
Публикация на сайте для учителей

Публикация педагогических разработок

Бесплатное участие. Свидетельство автора сразу.
Мгновенные 10 документов в портфолио.

Иконка файла материала Л2-00828.docx

Поисковые указатели.

Другое название этого вида поисковой службы - поисковые машины. Очень часто в учебной и научной литературе в конце книги присутствуют предметные указатели - это перечень основных терминов с указанием страниц, на которых они встречаются. Например, в учебнике по информатике вы ищете в таком списке слово « процессор», напротив которого указаны номера страниц. Затем на этих страницах читаете всё, что написано о процессоре.

Принцип работы поисковых указателей заключается в созда­нии и использовании индексных списков - аналогов книжных предметных указателей.

Задачи поисковых машин состоят в формировании индексных списков, охватывающих как можно большее число документов паутины, а также в ответах на запросы клиентов. Ясно, что та­ ким способом проиндексировать вручную все документы WWW невозможно. Их число давно перевалило за миллиард. Поэтому поисковые машины строят индексные списки автоматически. Основной составляющей поисковых машин являются про­ граммы просмотра wеЬ-документов, которые называют по-разно­му: роботами, червяками, пауками и пр. Наверное, наиболее под­ ходящим названием является «пауки», если уж сеть WWW назы­вать паутиной! Непрерывно, днем и ночью, они сканируют всё информационное пространство WWW, просматривая все докумен­ты, определяя в них ключевые слова и записывая в свою базу ин­дексов данное слово с указателем на документ, в котором оно присутствует. Этот процесс не прерывается, поскольку содержа­ние паутины всё время меняется и дополняется. Даже в уже про­смотренные документы авторы могут внести изменения или вооб­ще удалить их. Поисковая машина всё время должна поддержи­вать информацию в актуальном состоянии.

Эффективность работы поисковой машины зависит от исполь­зуемых алгоритмов формирования базы указателей. Эти алгорит­мы представляют «know how», т.е. объекты интеллектуальной собственности авторов, и обычно держатся в секрете. Число ука­зателей к некоторым ключевым словам составляет многие тыся­чи. Чем лучше алгоритм, тем меньше в индексный список попа­ дает «мусора» - случайных документов, не имеющих отношения к теме поиска.

В отборе наиболее важных документов пользователю помогает рейтинговый принцип, используемый некоторыми поисковыми указателями. На запрос пользователя по ключевому слову систе­ма выдает список ссылок на документы, расположенные по убы­ванию рейтинга. Рейтинг определяется по числу обращений к до­кументу, которые были сделаны ранее. Самые популярные доку­ менты попадают в начало списка.

Число поисковых указателей превышает число поисковых ка­талогов . Популярными в России указателями являются:

Апорт 2000 - www . aport.ru;

Рамблер - www. ramЫer.ru;

Yandex.ru - www.yandex.ru;

Google - www.google.ru.

Поисковая служба Google работает как в международном, так и в российском секторе Интернета и является самой популярной.