Журнал «Компьютерра» № 3 от 23 января 2007 года
Шрифт:
И задолго до того, как мы научимся делать полные компьютерные «копии» самих себя, эти разработки позволят обогатить наш мозг новыми функциями и расширить его возможности. Что, в свою очередь, приведёт — хоть и не сразу — к возможности постепенной замены частей наших тел (включая мозг) с исправлением всех дефектов, которые сегодня укорачивают человеческую жизнь. И чем больше мы узнаем о том, как работает мозг, тем больше найдём способов, чтобы обеспечить его умениями, которые никогда не появились бы естественным путём.
Марвин Мински
один из пионеров computer science
ТЕХНОЛОГИИ: Ищите и обрящете: Новое обличье интернет-поиска
Автор: Родион Насакин
Поиск в Сети был и остаётся наиболее
Однако стартапы не унывают и упорно продвигают свои разработки, справедливо полагая, что если добиться всенародной популярности под своим брэндом не удастся, то всегда можно попробовать продать себя подороже какой-нибудь из вышеперечисленных акул бизнеса. Впрочем, коммерческие перспективы «новичков» интересны постольку поскольку, чего не скажешь о собственно поисковых возможностях таких проектов, по которым можно уже сегодня попробовать угадать, во что превратится интернет-поиск в обозримом будущем.
Абсолютное большинство продвигаемых стартапами сервисов можно разбить на три категории. Одни пытаются привлечь внимание улучшенным интерфейсом, демонстрируя результаты поиска в более наглядном и привлекательном виде. Вторые делают ставку на улучшенные или просто альтернативные технологии поиска, не ограничиваясь простым вычислением степени соответствия (релевантности) той или иной веб-страницы запросу или вовсе отказываясь от подобного метода. Третьи развивают различные направления вертикального поиска, то есть оптимизируют свои сервисы под нахождение определённого вида контента — например, записей в блогах, музыкальных файлов, вакансий и резюме и т. д.
Среди сайтов, пытающихся подходить к визуализации результатов нестандартно, относительно широкую известность получили проекты Snap, Kartoo и Quintura.
Разработчики Snap использовали модный нынче AJAX для вывода в результатах поиска скриншотов найденных веб-страниц. Спору нет, беглое ознакомление с внешним видом и основными заголовками сайта нередко позволяет сразу сделать вывод о том, насколько он соответствует сделанному запросу, и, по всей видимости, наличие превью может сократить время, затрачиваемое на поиск. Но только если качество поиска будет оставаться на должном уровне. В случае со Snap этого пока не наблюдается. Релевантность и количество выдаваемых ссылок нельзя назвать удовлетворительными даже для англоязычных запросов. Компенсировать убогость движка создатели попытались, введя в поиск социальный элемент, который выражается в том, что пользователи имеют возможность влиять на рейтинг выдаваемых результатов. Для голосования необходимо под скриншотом кликнуть на «Perfect» или «Junk». Как бы то ни было, идея с предварительным просмотром результатов в виде изображений не только при поиске картинок, но и текста вызвала определённый интерес, и в Сети уже появилось несколько сайтов-клонов. Так что вполне возможно, что со временем скриншоты сайтов станут привычным атрибутом поисковиков.
Сервисы Kartoo и Quintura весьма похожи и эксплуатируют одну и ту же популярную идею графического представления связей между результатами поиска, что должно существенно упростить отбор нужных ссылок. Своих баз эти ресурсы не имеют и импортируют данные из других поисковиков. Kartoo — уже не молодой сайт, особенно по сравнению с другими экспериментаторами от поиска. Он был запущен почти пять лет назад одноимённой компанией, специализировавшейся на интерактивной картографии, но по сей день сервис, несмотря на многочисленные почётные титулы и на дифирамбы компьютерной прессы, не завоевал широкой популярности. Суть его работы состоит в следующем. Когда пользователь вводит запрос, система анализирует ключевые слова, пересылает их подходящим поисковикам, выбирает из полученных результатов наиболее релевантные и помещает эти ссылки на экран в виде интерактивной карты, выстраиваемой по собственному алгоритму Kartoo. Узлами на карте являются найденные сайты, а соединительные линии представляют собой связи с ключевыми словами. При наведении курсора сайты и ключевые слова подсвечиваются, а на боковой панели появляется аннотация по заинтересовавшему ресурсу. Для визуализации была использована Flash-технология.
Для русскоязычной аудитории Kartoo особой ценности не представляет, чего не скажешь о его аналоге Quintura, созданном отечественными разработчиками. Помимо работы с сайтом через браузер, программный клиент Quintura Search можно загрузить на компьютер. Результаты поиска в этом сервисе наряду с перечнем ссылок содержат «облако» слов, по смыслу близких к запросу. Пользователь может уточнить, какая именно часть результатов (кластер) его интересует, удаляя не относящиеся к теме слова. Параллельно система будет удалять из списка соответствующие ссылки. Чтобы случайное удаление не привело к потере значимой части найденной информации предусмотрена возможность восстановления кластера. Также в Quintura предусмотрены такие функции, как сохранение результатов поиска в отдельном файле, управление точностью поиска и настройка показываемого на карте количества слов.
По умолчанию система загружает результаты с Google, Яндекса и Рамблера, но для зарубежных пользователей и отечественных «гурманов» предусмотрены плагины для поддержки Yahoo, MSN Search, блоговых поисковиков Google Blog и Technorati, а также Google Desktop. Недавно в Quintura появился поиск по картинкам. Правда, в облаке изображения не «витают», просто в списке результатов помимо ссылок теперь присутствуют и превью.
В нынешнем январе интернет-общественности был представлен новый проект — поисковик для людей старшего поколения Cranky.com, который выдаёт результаты, наиболее релевантные запросам людей в возрасте от 50 лет. Смущает только имя ресурса: cranky (англ.) — раздражённый, капризный).
Ещё одной альтернативой нынешнему поиску в Сети считается привлечение человеческого ресурса. Самой яркой картинкой удачного использования социальных возможностей является небезызвестный del.icio.us [Подробнее о сервисе можно прочитать в статье Андрея Письменного на сайте «КТ» (www.computerra.ru/online/web2/258713)]. Ресурс изначально задумывался как собрание подборок ссылок, снабжённых тегами. Однако по мере расширения базы сайта становился очевидным поисковый потенциал сервиса. В системе хранятся данные по каждой ссылке, в том числе количество пользователей, хранящих линк в своём «Избранном». Такой показатель является как минимум не менее адекватным отражением «качества» сайта, нежели PageRank от Google, так как поисковая оптимизация в данном случае бессильна. И кроме того, социальная ориентированность сервиса открывает новые возможности, позволяя, например, посмотреть, какие ещё сайты по выбранной тематике пользуются популярностью у пользователей. По сути, речь идёт о возвращении поиска в каталогах, который постепенно утратил симпатии пользователей, поскольку автоматически составляемые поисковиками подборки ссылок и методика вычисления рейтингов нередко мало соответствуют реальной популярности ресурсов.
Учитывать общественное мнение при определении рейтинга того или иного сайта планирует и создатель Википедии Джимми Уэльс (Jimmy Wales). Он обещает в нынешнем году запустить новый поисковик Wikiasari, который составит конкуренцию Google. Уэльс считает, что сервис «доткома №1» не свободен от критически серьёзных недостатков, что им фактически манипулируют спамеры и получить адекватный результат на запрос зачастую невозможно. Мнение «отца» Википедии по поводу корня проблемы не оригинально — алгоритм, основанный на «машинном интеллекте», в принципе не способен отвечать пользовательским потребностям. Компьютер не может принять решение, хорош сайт или нет, но человек разберётся в этом с первого взгляда. Новый проект останется верен wiki-принципам. Результаты поиска в системе будут базироваться на сведениях, предоставляемых пользователями. Первые три ссылки в результатах поиска Wikiasari приведут на страницы онлайн-энциклопедии. Сам же движок поисковика обещают сделать общедоступным в рамках GFDL-лицензии. Однако до конца преданным идеалам open source поисковик все же не останется. На Wikiasari будет размещаться реклама.