Аннотация. В статье рассказывается про поисковые системы в основе которых лежит автоматический сбор информации.
Ключевые слова: информация, поиск, поисковые системы, поисковый запрос.
Поисковая система оперирует со структурами данных и исполняет алгоритм. Разнообразие алгоритмов не очень велико, но оно есть. Три алгоритма из четырех требуют «индексирования», предварительной обработки документов, при котором создаются вспомогательный файл, сиречь «индекс», призванный упростить и ускорить сам поиск.
РАЕЦКАЯ_СТАТЬЯ_1.doc
УДК 004.912
Раецкая О.В.
Филиал федерального государственного казенного военного образовательного
учреждения высшего образования «Военный учебнонаучный центр Военно
воздушных сил «Военновоздушная академия имени профессора Н.Е.
Жуковского и Ю.А. Гагарина» (г. Воронеж) Министерства обороны Российской
Федерации в г. Сызрани
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
Аннотация. В статье рассказывается про поисковые системы в основе которых
лежит автоматический сбор информации.
Ключевые слова: информация, поиск, поисковые системы, поисковый запрос.
В мире написаны сотни поисковых систем, а если считать функции поиска,
реализованные в самых разных программах, то счет надо вести на тысячи. И как бы
ни был реализован процесс поиска, на какой бы математической модели он не
основывался, идеи и программы, реализующих поиск, достаточно просты. Так или
иначе, но именно поисковые системы стали одним из двух новых чудес света,
предоставив Homo Sapiens неограниченный и мгновенный доступ к информации.
Первым чудом, очевидно, можно считать Интернет как таковой, с его
возможностями всеобщей коммуникации.
Как и любая программа, поисковая система оперирует со структурами данных
и исполняет алгоритм. Разнообразие алгоритмов не очень велико, но оно есть. Три
алгоритма из четырех требуют «индексирования», предварительной обработки
документов, при котором создаются вспомогательный файл, сиречь «индекс»,
призванный упростить и ускорить сам поиск. Это алгоритмы инвертированных
файлов, суффиксных деревьев, сигнатур. В вырожденном случае предварительный этап индексирования отсутствует, а поиск происходит при помощи
последовательного просмотра документов.
Все поисковые системы объединяет то, что они расположены на специально
выделенных мощных серверах и привязаны к эффективным каналам связи.
Поисковые системы называют еще информационнопоисковыми системами (ИПС).
Самые известные обслуживают в сутки миллионы клиентов. В случаях, когда
поисковая система имеет в своей основе каталог, она называется каталогом. В ее
основе лежит работа модераторов. В основе же ИПС с полнотекстовым поиском
лежит автоматический сбор информации. Он осуществляется специальными
программами. Эти программы периодически исследуют содержимое всех ресурсов
Интернета. Для этого они перемещаются, или как говорят, ползают, по разным
ресурсам. Соответственно такие программы называются роботы. Есть и другие
названия: поскольку WWW – это аббревиатура выражения Всемирная паутина, то
такую программу естественно назвать спайдером по англ. – паук. В последнее
время используются другие названия: автоматические индексы или директории.
Все эти программы исследуют и «скачивают» информацию с разных URLадресов.
Программы указанного типа посещают каждый ресурс через определенное время.
Ни одна поисковая система не в состоянии проиндексировать весь Интернет.
Поэтому БД, в которых собраны адреса проиндексированных ресурсов, у разных
поисковых систем разные. Тем не менее, многие из них стремятся, по
возможности, охватывать в своей работе все пространство мировой Сети. Это
универсальные системы.
Мощные поисковые системы универсального типа созданы для работы на всех
основных языках мира. Каждая страна старается создать хотя бы одну
собственную поисковую систему. Познакомимся с основными отечественными и
зарубежными поисковыми системами.
Поиск информации является одной из
составляющих человеческой
деятельности. В Интернете ежедневно появляется и исчезает огромное количество ресурсов. Необходимо уметь в них ориентироваться. Чтобы эффективно
выполнить поиск, нужно умело составить запрос к поисковой системе.
Если ответ ищется в каталоге, то особых сложностей при работе здесь нет.
Создатели каталога и модераторы озаботились созданием разделов каталога.
Пользователь должен только четко определиться с предметом поиска и затем
воспользоваться структурой, которая ему предложена.
Поисковые системы Интернета
Таблица 1
www.yandex.ru
"Яндекс"
поисковая система
по русскому
интернету
www.rambler.ru
www.google.ru
"Рамблер"
информационно
поисковая
система
"Google"
поисковая
система
www.yahoo.com
www.filesearch.ru
"Yahoo!"
поисковая
система
Русский FTP
Search
www.meta.ua
"МетаУкраина"
украинская
поисковая
система
www.sites.ru
"Sites.ru" лица
Учёт русской морфологии.
Подсветка
найденных
документов,
показ
контекстов.
Параллельный
поиск в "Энциклопедиях",
"Новостях",
"Маркете".
Структурирование поиска по
разделам каталога и серверам.
российская
Первая
поисковая
система.
возможность
Имеет
учета
морфологии
русского языка.
Система поиска
информации в сети
интернет (включая
русскоязычный
интернет). Возможность
поиска картинок и
новостей в конференциях
Usenet.
Возможен поиск на
русском языке.
Файловая поисковая
система. Top 100
крупнейших FTP
серверов в России.
Учёт
морфологии
украинского и русского
языков.
Выделение
контекстов найденных
слов. Перевод запросов и
результатов на русский,
украинский и английский
языки.
Иллюстрированный
Цитируемость:
39000
Регион:
Россия
Цитируемость:
16000
Регион:
Россия
Цитируемость:
11000
Цитируемость:
5300
Цитируемость:
4000
Регион:
Россия
Цитируемость:
4700
Регион:
Украина
Цитируемость: российских
сайтов
поисковый каталог
сайтов
275
В основе полнотекстового поиска лежит умение удачно составить поисковый
запрос. При прочих равных условиях следует выбирать для поиска наиболее
суженное, мало распространенное слово. В то же время может случиться и так, что
поиск по слишком узкому термину не дает результатов. Тогда надо переходить к
более широким терминам.
Интернет прочно вошел в жизнь практически каждого современного человека.
Людям уже сложно представить, как можно было раньше обходиться без этого
гигантского хранилища информации, в котором можно почерпнуть столько
полезного и занимательного. Глобальная сеть стала не только местом, где можно
найти ответы на все вопросы, но также способом общения, взаимодействия с
другими людьми. С помощью компьютерной сети каждый человек сегодня может
получить образование, найти работу, наладить личную жизнь, в общем, стать
полноценным членом общества.
Согласно данным, представленным на вебресурсе gs.seoauditor.com.ru,
лидирующие позиции среди русскоязычных пользователей, так называемого Рунета
уверенно занимают Yandex и Google.
Отчет о динамике изменения популярности поисковых систем за 2017 года
показывает что Яндекс немного уступил Google в разницу 0,89%. За
лидерами выстроились менее востребованные поисковики, а именно: Mail.ru —
3,45%;Рамблер — 0,52%; Bing — 0,32%; Yahoo! — 0,26%; QIP — 0,06%; Nigma —
0,04%; Ask — 0,03%.
По данным сайта www.smartinsights.com, согласно чистой рыночной доле (по
состоянию на апрель 2017 года) доля глобального маркетинга с точки зрения
использования Google составляет более 77%. Это еще раз подтверждает тот факт,
что Google является лидером на рынке, но также подчеркивается, что другие, такие как Yahoo, Bing, Baidu и т. д. не стоит игнорировать. Интересно отметить,
что значительная доля рынка Google попрежнему растет.
Количество людей, использующих поисковые системы, растет с каждым годом.
На сегодня это 6 586 013 574 поисковых запросов в день по всему миру.
Кстати на мобильных устройствах больше поисковых запросов Google, чем на
компьютерах в 10 странах, включая США и Японию.
Рассмотрим наиболее популярные системы и выясним, какими достоинствами
они обладают по сравнению с остальными участниками рейтинга.
Поисковые запросы в Интернете
Таблица 2
Поисковик
Google
Bing
Baidu
Yahoo
Другое (AOL, Ask и т.д.)
Запросов в день
4 464 000 000
873 964 000
583 520 803
536 101 505
128 427 264
Google является одним из наиболее используемых не только на просторах
стран СНГ, но и во всем мире. По данным исследователей, самое большое
количество посещений отмечено за юзерами Соединенных Штатов Америки, но и
пользователи с других уголков планеты также не оставляют без внимания
сайт google.com. В чем заключается основное преимущество этого ресурса? Дело в
том, что на главной странице поисковика нет ничего лишнего, только строка
поиска и логотип компании. Пользуясь этой поисковой системой, человек не
отвлекается на рекламу или другие посторонние вещи, а четко выполняет
запланированное действие. Еще недавно yandex.com уверенно лидировал среди поисковиков, которыми
пользуются жители постсоветского пространства. Но в 2017 году позиции системы
заметно пошатнулись, что связано, скорее всего, с указом президента Украины о
необходимости блокирования провайдерами сервисов Яндекс. Кстати, такое же
ограничение касается интернетресурса mail.ru, на который также наложены
санкции.
Yahoo занимает четвертое место по популярности в мире. Но при этом сложно
назвать yahoo.com очень востребованной среди граждан государств СНГ. Сложно
сказать, по какой именно причине, но поисковик не пользуется такой
популярностью, как у американских юзеров (24% от общего количества запросов в
США).
Список использованной литературы
1.
Алгоритмы: построение и анализ, Т. Кормен, Ч. Лейзерсон, Р.Ривест
МЦНМО, 2000 http://www.ozon.ru/?context=detail&id=114200
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
ЗНАЧИМЫЕ ПОИСКОВЫЕ СИСТЕМЫ ИНТЕРНЕТА
Материалы на данной страницы взяты из открытых истончиков либо размещены пользователем в соответствии с договором-офертой сайта. Вы можете сообщить о нарушении.