Шрифт:
A. ГультяевСaмоe главное о…Поиск в интернете
Вместо предисловия
В последнее время понятия «Интернет» и «Всемирная паутина» – World Wide Web (WWW) – все чаще используются как синонимы. Хотя на самом деле серфинг (навигация, прогулка – как вам больше нравится) по страницам WWW – это лишь один из сервисов, предоставляемых посетителям Сети. Помимо «прогулки по паутине» посетитель Сети может также воспользоваться услугами электронной почты, поучаствовать в телеконференции, пообщаться с друзьями или оппонентами в чате, просмотреть последние новости по интересующей теме, обменяться файлами
По приблизительным оценкам, Всемирная паутина уже сейчас содержит более двух миллиардов страниц, и каждую секунду к ним добавляются 25 новых. Но за ту же секунду около десятка страниц «уходят» из Сети. И нет такого человека или программы, которые располагали бы исчерпывающей информацией о текущем состоянии «паутины». Не случайно для аббревиатуры WWW иногда используется новый вариант расшифровки – World Wide Wandering («Всемирное блуждание»).
Посетителя далеко не всегда интересует некая страница целиком. Зачастую он ищет размещенную на ней фотографию или конкретную фразу. Как же найти веб-страницу с той цитатой из любимой книги, которую вы мучительно пытаетесь вспомнить уже третий день? А как получить самые свежие спортивные новости или последнюю фотографию своего кумира?
Приведенные в книге советы и рекомендации рассчитаны на тех читателей, в распоряжении которых имеется компьютер, подключенный к Интернету (через модемное соединение или по выделенной линии). Они уже знакомы с веб-браузером и, возможно, даже совершили несколько путешествий по Всемирной паутине и при этом смогли убедиться, что поиск нужной информации в Интернете – дело не только увлекательное, но и весьма непростое, требующее определенных знаний и навыков.
От издательства
Ваши замечания, предложения и вопросы отправляйте по адресу электронной почты comp@piter.com (издательство «Питер», компьютерная редакция).
Мы будем рады узнать ваше мнение!
Подробную информацию о наших книгах вы найдете на веб-сайте издательства: http://www.piter.com.
1. Представление информации в Интернете
Прежде чем перейти к рассказу о том, как искать, попробуем выяснить, что же, собственно, следует ожидать от результатов поиска.
Что такое гипертекст?
Практически любая публикация в Интернете представляет собой одну или несколько связанных между собой страниц. Если бы каждая такая страница существовала в бумажном варианте, то вся публикация оказалась бы похожа на своеобразную гирлянду. Роль нитей, связывающих страницы, играют так называемые гипертекстовые ссылки (или просто гиперссылки). Щелкнув мышью на гиперссылке, можно перейти на другую страницу либо к определенному месту на той же странице.
Набор страниц, связанных гиперссылками, обычно называют гипертекстовым документом. Основная особенность гипертекстового документа в том, что его можно просматривать не только последовательно, страницу за страницей, но и в произвольном порядке, перемещаясь по гиперссылкам. Если, например, создать в виде гипертекстового документа инструкцию по работе с кухонным комбайном, то покупатель сможет знакомиться с ее разделами как поочередно («Технические характеристики» – «Обслуживание» – «Использование насадок» – «Рецепты»), так и «перескакивая» с одной страницы на другую, чтобы уточнить тот или иной
Рис. 1.1. Пример гипертекстового документа.
В качестве гиперссылки может использоваться слово, фраза или некоторый графический элемент документа. Понятие «гипертекстовый» не ограничивает содержимое документа только текстовой информацией. Такой документ может содержать рисунки, видеоклипы, звуковой ряд и другие мультимедийные элементы.
ПРИМЕЧАНИЕ: Несколько забегая вперед, отметим, что в большинстве случаев посетитель Интернета не знаком со структурой публикации, а ее создатель не способен заранее предугадать, по какому маршруту захочет перемещаться посетитель. Это одна из основных причин того, что даже найдя интересующий его веб-сайт, посетитель может не добраться до нужной информации (конкретной фразы или иллюстрации).
Как правило, каждая страница реализована в виде отдельного HTML-файла (файла с расширением. htm или. html). HTML (Hypertext Markup Language – язык гипертекстовой разметки) – это язык программирования, предназначенный для описания содержимого документа. Другими словами, такой язык позволяет указать, что вот здесь, например, должен быть текст, здесь – картинка, а вот там должна появляться реклама жевательной резинки. Но главное достоинство HTML – это возможность быстро и легко создавать гиперссылки.
Именно HTML-файл загружается в браузер – специальную программу, предназначенную для просмотра гипертекстовых документов и для перехода от одной страницы к другой. В настоящее время наибольшей популярностью среди посетителей Интернета пользуются браузеры Internet Explorer от компании Microsoft (он лидирует с большим отрывом) и Opera (продукт фирмы Opera Software), а также браузеры семейства Mozilla (в частности, Mozilla FireFox).
Браузер обрабатывает HTML-файл последовательно, сверху вниз, и по мере обработки загруженного документа его содержимое отображается в окне браузера.
ПРИМЕЧАНИЕ: По умолчанию текстовые гиперссылки выделяются при выводе документа в окне браузера голубым цветом и (или) подчеркиванием. Однако веб-дизайнер (создатель документа) может использовать и другие средства для выделения ссылок на фоне статичного текста. В любом случае гиперссылка должна «реагировать», когда на нее попадает указатель мыши. Виды реакции также могут быть разными: может изменяться цвет гиперссылки, стиль шрифта и т. д. Кроме того, при попадании на гиперссылку обычно видоизменяется указатель мыши.
Если документ содержит графические иллюстрации, флэш-фильмы или другие «нетекстовые» элементы, то браузер выполняет дополнительные действия, например распознает формат рисунков. Если формат оказывается «знаком» браузеру, то рисунок выводится на экран. Если в документе содержится флэш-фильм, то браузер вызывает дополнительную программу, предназначенную для воспроизведения такого фильма, – флэш-плеер. Аналогичные действия выполняются и при обнаружении на странице ссылки на звуковой файл.
Важно понимать, что все «нетекстовые» элементы документа хранятся в отдельных файлах, а непосредственно в HTML-файле присутствуют лишь команды вызова этих элементов. Поэтому если какой-то из таких файлов окажется недоступен или «непонятен» браузеру, в документе на месте отсутствующего элемента останется «дыра» (рис. 1.2).