Журнал «Компьютерра» № 30 от 21 августа 2007 года
Шрифт:
Динамику развития свободного ПО я почувствовал на очень наглядном примере: ровно год назад, по пути из Обнинска в Москву, мы обсуждали слабое развитие свободных инструментов синтеза и распознавания образов и речи. Ситуация тогда выглядела очень мрачно: свободных систем texttospeech, поддерживающих русский язык, в природе не существовало, приемлемых свободных OCR-движков не было вообще, не только для русского языка. В этом году «образной» тематике на конференции было уделено довольно много времени, и картинка стала несколько более веселой.
Николай Шмырев рассказал о поддержке русского языка в системах синтеза речи Festival и распознавания CMU Sphinx, появившейся в этих проектах лишь недавно. Одна из наиболее трудоемких задач на этом фронте – создание баз данных речи (озвученных текстов), которые затем анализируются
Подобные базы обладают и независимой ценностью (например, для исследователей языка) – но, к сожалению, свободной информации такого рода пока не очень много: существующие свободные системы распознавания обычно используют уже готовые модели, "звуковые исходники" которых закрыты. Впрочем, озвучка текста не требует особой квалификации и специальных знаний, так что здесь поговорка "с миру по нитке" вполне применима как руководство к действию. Реализацией этого подхода занимается проект VoxForge.org: всем желающим предлагается озвучить произвольный текст и загрузить его в систему в виде файла (или, например, наговорить по телефону). Получающиеся в результате этой деятельности базы будут выпускаться под GPL и использоваться в различных свободных программах.
Еще одна разработка, о которой шла речь на конференции, – свободный синтезатор eSpeak, также недавно заговоривший по-русски и имеющий определенные преимущества перед (в основном, исследовательским) проектом Festival. Впрочем, его качество звука пока отстает от последнего, и здесь предстоит провести немалую работу.
Наконец, не обошлось и без обсуждения систем распознавания текстов (OCR).
Нельзя сказать, чтобы свободными OCR никто не занимался – напротив, список таких проектов довольно внушителен – но, к сожалению, почти все они были заброшены своими создателями на самых ранних стадиях разработки и так и не добрались до практической применимости. Павел Семин, представлявший на конференции свою библиотеку libocr, связывает это с высокой «наукоемкостью» задачи – получение приемлемого результата требует вложения кучи сил и времени. Сам Павел занимается разработкой libocr для своей диссертации – и хочется верить, что после защиты этот проект не постигнет участь многих других, что возможно, только если он станет точкой приложения усилий специалистов по OCR со всего мира (в одиночку такая задача не решается). Впрочем, следует отметить, что в данный момент Google серьезно заинтересовался свободными OCR-системами (проекты Tesseract и Ocropus), что может привести если не к прорыву на этом фронте, то, по крайней мере, к значительному прогрессу. Правда, про поддержку русского языка и кириллицы в них пока ничего не известно – но участие в Ocropus как минимум одного российского разработчика (Илья Межиров) вселяет некоторый оптимизм.
Дефицит свободных информационных баз не ограничивается аудиоданными. Например, практически отсутствуют гарантированно свободные географические карты. Несмотря на то что в России информация о расположении различных объектов, высоте поверхности земли над уровнем моря и прочие топографические данные не охраняются авторским правом, изображения карт вполне могут содержать охраняемые элементы [Подробный анализ см. в блоге Федора Зуева: lqp.livejournal.com/176522.html], а в некоторых странах (например, в Англии) режим защиты картографических материалов более жесткий. Однако никакое авторское право не может запретить ходить по улицам – даже если в кармане лежит GPS-приемник, записывающий траекторию движения (трек). Григорий Баталов рассказал о проекте OpenStreetMap.org, участники которого решили воспользоваться этой возможностью и собрать свободную карту мира "по ниткам" – то бишь по таким трекам. Увы, по традиции территория одной шестой части суши покрыта в этом проекте из рук вон плохо – сказывается недостаток участников из России. Впрочем, скорее всего, пополняться база будет достаточно быстро – записать трек во время прогулки или поездки гораздо проще, чем написать статью в Википедию.
Вспоминая темы, обсуждавшиеся на конференции, – как вошедшие, так и не вошедшие в этот краткий обзор, – не могу не отметить общую мысль, пронизывавшую атмосферу конференции: работая вместе в рамках открытых проектов, мы можем сделать вещи, недоступные ни отдельным разработчикам, ни крупнейшим корпорациям. И именно взаимодействие свободных людей составляет жизнь того, что называется громким словом "сообщество".
СОФТЕРРА: Софтерринки
Автор: Илья Шпаньков
ОС Windows
Адрес tinyurl.com/ythspz
Версия 1.0
Размер 347 Кбайт
Интерфейс многоязычный (русский не поддерживается)
Цена бесплатно
Лицензия проприетарная (freeware)
Наряду с мощными поисковыми программами, создаваемыми именитыми компаниями, в мире софта полным-полно добротных миниатюрных утилит, выполняющих практически те же функции. Вот, например, софтинка под названием NeoSearch. Принцип ее работы стандартный: после того как при первом старте программа проиндексировала содержимое вашего компьютера, вы в считанные секунды сможете отыскать нужный документ или музыкальную композицию, как бы глубоко в подкаталогах они ни были зарыты. Настройки позволяют исключать из поиска указанные вами каталоги, осуществлять реиндексацию по заданному расписанию и находить MP3-композиции по тегам. Одна беда – с кириллицей у NeoSearch отношения напряженные.
ОС Windows
Адрес altools.net
Версия 7.0 beta 1
Размер 6,6 Мбайт
Интерфейс многоязычный (русский поддерживается)
Цена бесплатно
Лицензия проприетарная (freeware)
Работа с архивами – неотъемлемая часть нашей компьютерной жизни, так что без программ-архиваторов мы как без рук. Сегодня в обзоре – малоизвестная, но довольно продвинутая и нетребовательная к железу бесплатная программа ALZip. Она умеет открывать архивы тридцати шести форматов и создавать файлы восьми форматов (ALZ, BH, CAB, TGZ, JAR, LZH, TAR, ZIP), просматривать содержимое BIN– и ISO-образов, восстанавливать утерянные пароли к архивам и собственно сами архивы, создавать самораспаковывающиеся архивы (SFX) – в общем, содержит весь спектр функций, наиболее часто используемых в повседневной работе. При больших объемах архивирования допускается использование скриптов, запускаемых из командной строки.
ОС Windows
Адрес anonimsurfer.profikom.ru/index.php
Версия 2.2.2
Размер 318 Кбайт
Интерфейс многоязычный (русский поддерживается)
Цена бесплатно
Лицензия проприетарная (freeware)
Однажды каждому из нас может понадобиться поработать в Интернете анонимно. Как правило, для подобных целей используются различные прокси-серверы, однако с настройкой подобных соединений способны справиться далеко не все. Небольшая утилита AnonimSurfer возьмет на себя обязанности по заметанию следов и поможет вам стать невидимкой для интернет-аудитории. Настраивать программу практически не требуется, также нет никаких проблем и с ее использованием. Пожалуй, главным неудобством можно назвать необходимость периодически обновлять список общедоступных прокси-серверов, но автор обещает в следующих версиях возложить эту обязанность на плечи программы.
ОС Windows
Адрес www.longgame.com/fss.htm
Версия 1.1
Размер 1,9 Мбайт
Интерфейс английский (русский не поддерживается)
Цена $29,99
Демонстрационная версия функционально урезана
Скринсейверы давно стараются перещеголять друг друга в битве за пользователя: тут вам и красочные трехмерные заставки, и морские аквариумы, почти не отличимые от реальных, и абстрактные геометрические фигуры… Разработчики одной из подобных утилит под названием Flight Simulator Screensaver пошли еще дальше: они не только подготовили живую картинку полета боевых истребителей, но и добавили возможность управлять ими с помощью клавиатуры. Другими словами, скромный скринсейвер превратился в простую, но довольно увлекательную игрушку-симулятор. Следует отметить превосходную отрисовку как самих боевых машин, так и окружающих пейзажей – для пущего эффекта полеты выполняются вблизи поверхности Земли.
Webология
Автор: Илья Шпаньков
Адрес www.stardict.org
Интерфейс английский
Интеграция возможность установки формы на своем сайте
Онлайновые переводчики давно стали незаменимым инструментом для миллионов людей, но стартовавший пару месяцев назад сервис StarDict обладает некоторыми функциями, выделющими его из общего ряда. Это приложение основано на популярном свободном словаре StarDict. Поиск перевода или толкования слова производится в специализированных словарях, размещенных на сайте авторов проекта. Пользователь может самостоятельно подключать и отключать необходимые в данный момент источники информации, тем самым сужая или расширяя зону поиска, а также получать сведения из энциклопедий и толковых словарей. Для удобства предусмотрен не только AJAX-интерфейс, но и обычный, в виде HTML. Кроме того, сервис может быть интегрирован в браузер Firefox. Интерфейс, к сожалению, только английский, однако русскоязычные словари в системе присутствуют.