Cтраница 1
Поисковая машина просматривает базу данных индексов, составляет список страниц, удовлетворяющих условиям запроса ( точнее, список ссылок на эти страницы) и возвращает его Web-серверу. [1]
Поисковые машины постоянно автоматически исследуют Сеть с целью пополнения своих баз данных документов. Обычно это не требует никаких усилий со стороны человека. Сетевой агент - автоматический робот ( паук - spider) обходит все заданные ему web - серверы и собирает у себя индекс - информацию о том, что и на какой странице найдено. Но индексация выполняется чисто формально, проверяется наличие заданных ключевых слов в текстах документов, и по этим подчас случайным совпадениям делаются содержательные выводы. Поэтому никакой осмысленной классификации в поисковых машинах не выполняется. Такие системы часто называют индексаторами. Поисковые машины часто привлекают для поиска фрагменты классификаторов, заимствованные в каталогах, поскольку последние выполняют более содержательный отбор информации. [2]
Поисковые машины - это специальные программы, позволяющие получить перечень ссылок на конкретные Web-страницы, которые содержат ключевые слова, указанные в запросе. С помощью мощных компьютеров сети поисковая машина практически мгновенно выдает список адресов страниц, на которых эти слова встречаются. [3]
Поисковые машины Open Text Index, AltaVista, Yahoo, Lycos и другие представляют собой мощные информационно-поисковые системы, размещенные на серверах свободного доступа, специальные программы которых непрерывно в автоматическом режиме сканируют информацию Сети на основе заданных алгоритмов, проводя индексацию документов. В последующем поисковые машины предоставляют пользователю на основе созданных баз данных доступ к распределенной на узлах Сети информации через выполнение поискового запроса в рамках собственного интерфейса. [4]
Освоение интерфейса поисковой машины AltaVista является прекрасным фундаментом для работы с другими поисковыми системами. [5]
Общая архитектура системы WebCrawler. [6] |
Как правило, поисковые машины обеспечивают интерфейс типа меню, с помощью которого пользователь может скомпоновать запрос на поиск информации, используя ключевые слова и / или фразы и логические связки И-ИЛИ-НЕ. Большинство машин поиска находят огромное количество релевантных страниц по запросу пользователя. Каждый найденный документ обычно ранжируется по степени его корреляции с запросом. Релевантность каждого документа оценивается с помощью различных технологий, например учета частоты появления на странице искомых слов. Некоторые поисковые механизмы используют дополнительно другие факторы, такие как частота посещения страницы и / или близость расположения друг к другу искомых терминов. [7]
Самая известная из поисковых машин - Alta Vista ( www. [8]
В процессе сканирования поисковой машине приходится получать доступ к ресурсам Сети, естественно, что такой доступ реализуется в рамках одного из протоколов прикладного уровня. В связи с этим принято различать поисковые машины по области сканирования, прежде всего это - гипертекстовые базы данных Web, ресурсы всемирного пространства GopherSpace, FTP-архивы. [9]
Для WWW наиболее характерны поисковые машины и поисковые каталоги. [10]
Более того, многие поисковые машины WWW позволяют заранее задавать в поисковом запросе то текстовое поле, в котором должен встретиться данный термин. [11]
Процесс управления с помощью поисковых машин осуществляется в результате поиска оптимума на основе имеющегося критерия для получения конечной цели. [12]
Каталоги в отличие от поисковых машин пополняют свою информацию по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге тематическим разделам. Каталог представляет собой упорядоченную по темам коллекцию ссылок на многочисленные web - страницы и сайты. Каталог, как правило, составляется, обслуживается и поддерживается специалистами разного профиля, которые по заявкам владельцев сайтов или самостоятельно пополняют перечень ссылок и составляют обзоры web - страниц, содержащие краткое описание информационного ресурса, его. Каталоги часто называют классификаторами, поскольку они представляют собой иерархические структуры, где все информационные ресурсы расклассифицированы по темам. [13]
Перекачивается три файла. [14] |
Конечно, обращение к поисковой машине потребует известного времени, но когда с выбранным сервером работа вообще не происходит или идет в час по чайной ложке, a GetRight находит ему замену, пусть и через пару минут, это же здорово. [15]