Интернет для отдыха и работы. Самоучитель
Шрифт:
В поисковой системе Рамблер знаки «+» и «–» не действуют. В этой системе используют операторы AND (– ) – логическое И, OR (|) – логическое ИЛИ, NOT (!) – логическое И-НЕ. Поиск операторов в документе не производится, они служат лишь инструкцией поисковой машине. Иными словами, по запросу собака AND кошка найдутся только те документы, которые содержат и слово «собака», и слово «кошка». Сложному запросу, состоящему из двух запросов, соединенных оператором OR (логическое ИЛИ), удовлетворяют все документы, удовлетворяющие хотя бы одному из этих двух запросов. По запросу собака OR кошка найдутся
Некоторые слова и символы по умолчанию исключаются из запроса в связи с их малой информативностью. Это так называемые стоп-слова – самые частотные слова русского и английского языков, например местоимения, предлоги, частицы и артикли. Присутствие этих слов может замедлить поиск и негативно повлиять на полноту результатов. В поисковой системе Яндекс рекомендуется использовать для поиска таковых слов знак «+».Чтобы найти цитату из Гамлета «Быть или не быть», надо задать запрос +быть или +не быть. В Рамблере есть возможность обозначить необходимость этих слов в запросе, взяв запрос в двойные кавычки или воспользовавшись поиском точной фразы в расширенном поиске.
Одни поисковые системы «понимают» знаки препинания, другие игнорируют их. Например, запрос в поисковой системе Рамблер может состоять из одного или нескольких слов и включать знаки препинания. Составлять простые запросы можно и не вдаваясь в тонкости языка запросов. Так, если ввести в поисковую строку несколько слов без знаков препинания и логических операторов, будут найдены документы, содержащие все эти слова (причем на ограниченном расстоянии друг от друга).
Если вам надо найти фамилию человека, то желательно не учитывать форму слов из запроса при поиске. Например, при поиске фамилии в Яндексе поставьте перед фамилией восклицательный знак. Тогда на запрос !новгородцев найдутся только страницы с упоминанием этой фамилии, а не города Новгорода.
Таким образом, восклицательный знак в начале слова ставится перед словом для указания нормальной формы. Иногда некоторые формы разных слов совпадают. Например, слово «мед» – это полная форма существительного «мед» и часть слова «медик» или «медицинский». Чтобы снять подобную неоднозначность, вы можете указать в запросе слово с восклицательным знаком впереди !мед, тем самым подчеркивая, что вам нужно искать слово только в этой форме. Это позволит отсечь хотя бы часть ненужных словоформ и как-то ограничить выдачу результатов.
Для поиска цитат можно использовать двойные кавычки. Слова запроса, заключенного в двойные кавычки, ищутся в документах именно в том порядке и в тех формах, в которых они встретились в запросе. Чтобы определить источник короткой цитаты, например «То, что не разрушает меня, делает меня крепче», введите нужную цитату в поисковой системе. Не беда, если вы точно не помните текст: с высокой вероятностью выданные страницы не только подскажут вам, откуда взялось высказывание, но и дадут его точную форму.
Двойные
Как мы уже упоминали выше, рассказывая о поисковой системе Апорт, вы можете пользоваться специальными метасимволами (*, ?), чтобы в результатах были показаны все формы искомых слов. Но Рамблер, например, пока не поддерживает поиск с использованием метасимволов.
В большинстве поисковых систем можно пользоваться обычным человеческим языком. Поисковые системы часто неплохо работают с повседневными разговорными фразами, так что такие запросы, как где забронировать билеты на самолет или что такое интернет-пейджер, могут оказаться очень эффективными.
Важнейшие критерии поиска информации в Интернете
Релевантность поиска — это степень соответствия ответа вашему запросу. Релевантность очень важна при поиске, так как самое главное – это полнота поиска, чтобы ничего не было потеряно или забыто, и точность – чтобы не было найдено ничего лишнего. Релевантность тем лучше, чем ближе к началу списка результатов оказался ответ на ваш запрос. Зависит релевантность от следующих моментов.
Глубина и охват поиска. Охват поиска напрямую зависит от объема базы данных той или иной поисковой машины. Глубина поиска – это ограничение на количество страниц или же на глубину вложенности папок на одном сервере.
Обновляемость информации на поисковом сервере. Информационные ресурсы Интернета очень динамичны: одни появляются, другие исчезают или перемещаются на другие серверы. Важно, чтобы поисковая машина, которой вы пользуетесь, постоянно проверяла проиндексированные в ее базе данных ссылки и добавляла новые, в таком случае ссылки, которые она будет выдавать в ответ на ваш запрос, будут существовать (вы не будете сталкиваться с сообщением File Not Found) и соответствовать вашему требованию.
Помимо соответствия ответа вашему запросу важен еще комфорт пользователя при работе с поисковыми системами. Этот комфорт напрямую зависит от скорости поиска. Например, метапоисковые системы удобны тем, что ищут информацию сразу в нескольких базах данных, но их существенным минусом является низкая скорость поиска. Но учтите, что часто скорость поиска напрямую зависит не только от качества работы поисковой машины, но и от тех каналов, по которым вы выходите в Интернет.
Также очень важны поисковые возможности (работа с языком документа, язык запросов). Наличие средств для анализа морфологии дает возможность находить искомые слова во всех склонениях или спряжениях. Идеально использование в поисковых системах естественно-языкового запроса, который не требует знания стандартных логических операторов поиска (например, И, ИЛИ, НЕ), на изучение которых у пользователя зачастую не хватает времени.
Не менее важную роль в комфортном поиске играют дополнительные возможности, которые предоставляет пользователям та или иная поисковая машина. Это специализированные страницы, поиск других похожих документов, ограничение области поиска, расширенный поиск, поиск по датам и серверам и т. д.