Электронные издания
Шрифт:
7.5.1. Загрузчик
Загрузчик является той частью издательской системы, которая должна сделать ввод изданий и документов настолько эффективным, насколько это возможно. Поскольку количество вводимой информации велико, становится понятно требование минимизации ручного труда в этом процессе.
При вводе документов одновременно должны генерироваться метаданные для каталогизации и индексирования, на основе которых документы могут затем извлекаться пользователями. Существует несколько способов автоматизации, соответствующих разным методам доступа к данным. Наиболее известен и хорошо отработан метод автоматической индексации полного текста. Самые прогрессивные средства индексации текста базируются на технологии семантических сетей, в которой значения слов определяются по контексту, а не просто подбором унифицированных терминов для отдельных слов; однако пока работу программных средств нельзя назвать безупречной. Представляется оправданным включение в метаданные ключевых слов и выражений, отобранных автором (иногда редактором), так как лучше них никто не сможет подобрать набор ключевых слов, оптимально характеризующих как тематическую область издания, так и его отличия от близких по тематике. Возможен отбор этих слов из уже имеющегося в атрибутивной базе данных набора, но иногда оправдано и расширение этого общего набора путем ввода дополнительных элементов, характерных для нового издания.
Чем более структурирован язык
Пока не существует общих средств автоматического выделения специфической информации из изображений, аудио и видео, но ряд фирм и лабораторий занимаются исследованиями в этой области. Иногда атрибутивные метаданные могут генерироваться просто путем извлечения информации из определенных форматов данных. В качестве примера можно сослаться на внутренний формат файлов программного пакета Photoshop.
При загрузке следует добавлять в атрибутивную базу данных не только метаданные, но и вспомогательные представления документов, в частности, миниатюры, отражающие внешний вид издания. Генерация миниатюр может быть автоматизирована. Например, большинство графических форматов содержат свои собственные миниатюры; для других, например для изображений с высоким разрешением, можно сгенерировать их "на лету". Аналогично можно спроектировать загрузчик таким образом, чтобы он, получая цифровые аудиообъекты, создавал клипы первых нескольких секунд (например, в формате WAV 10 кГц). Таким же образом видео в формате MPEG-2 может преобразовываться в клипы QuickTime длительностью в 5 или 10 с.
7.5.2. Средства доставки медиа-информации клиенту
Существует два базовых способа доставки цифровых документов пользователю: передача файлов – ее можно использовать для текстов, изображений, аудио и видео с низким качеством, и поточная передача для высококачественного "движущегося" медиа, т. е. аудио, видео и анимации. Этот последний способ налагает очень серьезные требования на возможности сервера.
Сервер доставки аудио/видео обязан обеспечивать гарантированную полосу пропускания для потока данных, поэтому в архитектуре сервера должны быть сбалансированы ресурсы процессора, периферия ввода/вывода и сетевых интерфейсов. Программное обеспечение сервера доставки, во-первых, должно включать средства низкого уровня для работы с файлами, обеспечивающие различные режимы проигрывания медиа. Во-вторых, нужно, чтобы это ПО определяло стандартные интерфейсы для разработки приложений – "плееров" на клиентской стороне и реализовывало серверную часть этих интерфейсов.
В большинстве случаев используется сквозное проигрывание (playthrough), что дает возможность начать просмотр мультимедийного издания еще до того, как он полностью загружен на сервер доставки. Например, сервер MediaCenter фирмы Sun позволяет начать воспроизведение аудио– или видеоданных уже через 5 секунд после начала загрузки. Сквозное проигрывание необходимо для приложений с быстрым и непрерывным обновлением содержания. Режим playthrough развивает метод оперативной загрузки, который заключается в способности сервера одновременно загружать один и воспроизводить другой документ.
На уровне операционной системы видеоматериалы представляются взаимосвязанной совокупностью файлов. Так, для фильма в цифровой форме хранятся файлы одного или нескольких видеопотоков и файл для аудиопотока.
В дополнение к файлам содержания существуют вспомогательные файлы, которые поддерживают распределение первичного файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают разные режимы воспроизведения.
Из имеющихся технических и программных средств системы доставки цифрового медиа в наибольшей степени подходят серверы семейства MediaCenter известной фирмы Sun и специализированное программное обеспечение этой же фирмы. Характеристики некоторых серверов представлены в табл. 7.1.
Таблица 7.1. Сравнительные характеристики серверов доставки медиа фирмы Sun
Рассмотрим подробнее одну из моделей сервера – Sun MediaCenter UltraSPARC. Это высокопроизводительная масштабируемая система с невысокой стоимостью базовой конфигурации. Как и все модели этой линии, она предназначается для доставки цифрового видео по сетевым и вещательным каналам в режиме video-on-demand.
MediaCenter UltraSPARC базируется на сервере Sun Ultra Enterprise 2 и имеет масштабируемую многопроцессорную архитектуру с двумя процессорами UltraSPARC 167 МГц, каждый с 512 Кбайт памяти на чипе и 2 Мбайт кэшпамяти на модуль. Обмен данными между процессорами, памятью и портами ввода/вывода осуществляется пакетным переключателем с малой задержкой. Из 50 Гбайт внешней памяти Raid-4, 42 Гбайт – это чистая память для хранения видео, и еще 8 Гбайт используются для контроля. Новая версия 2.0 ПО MediaCenter позволяет масштабировать внешнюю память 100 Гбайт (124 часа видео при компресии 1,5 Мбайт/с). Сетевые интерфейсы в стандартах ATM, Fast Ethernet, Ethernet обеспечивают гарантированную пропускную способность 100 Мбит/с для передачи видео. Серверы MediaCenter оснащаются всеми необходимыми компонентами для хранения и доставки видео. В частности, используемая в них операционная система Solaris дополнена специализированным обеспечением, превращающим файл-сервер Ultra Enterprise в медиа-сервер. Как обычно, в системах такого класса большое внимание уделяется надежности. Сервер Sun MediaCenter защищен от сбоя одного диска механизмом контроля четности Block-Interleaved Parity, соответствующим Raid Level 4. Средства системного администрирования включают замену дисков без перезагрузки системы, управление размещением медиа-документов и мониторинг сети.
Специальное программное обеспечение Sun MediaCenter включает:
✓ модифицированное ядро операционной системы Solaris;
✓ модифицированные драйверы сетевых интерфейсов, настроенные на вывод мультимедиа;
✓ файловую система MFS (Media File System), оптимизированную для доставки удовлетворяющего строгим временным ограничениям битового потока;
✓ менеджер медиапотока MSM (Media System Manager), позволяющий управлять проигрываемыми потоками;
✓ менеджер загрузки документов СМ (Configuration manager).
Оба менеджера – MSM и CM – поддерживают интерфейс с программой-клиентом на основе протокола удаленного вызова процедур RPC (Remote Procedure Call), а сервер обладает двумя важными свойствами. Во-первых, он гарантирует требуемую скорость передачи видеопотока (в рамках максимальной полосы пропускания). Поскольку Sun MediaCenter оптимизирован на доставку видео, он может поддерживать больший, чем стандартный сервер, видеопоток, при тех же аппаратных ресурсах. Во-вторых, менеджер MFS спроектирован специально для приложений с высоким уровнем ввода/вывода, и поэтому MediaCenter гарантирует среднюю производительность дискового ввода/вывода, в отличие от серверов с обычной файловой системой, которые гарантируют более низкий уровень производительности. Кроме того, MFS обеспечивает независимость передачи: если пользователи запрашивают даже одни те же битовые потоки, временные ограничения по их доставке не будут нарушены, при условии, конечно, что они укладываются в максимальную полосу пропускания. В обычной файловой системе, не оптимизированной для видео, множественные запросы к одному битовому потоку ведут к падению производительности сервера.
В сервере реализована модель "выталкивания", согласно которой он только инициирует и посылает поток битов по сетевому интерфейсу, выделенному для видеовывода. На этом интерфейсе нет канала для передачи информации в обратном направлении: от декодера к серверу. На сервер возлагается единственная задача – строго выдерживать временные ограничения потока. На принимающем конце должен быть достаточно быстрый декодер. Достоинства модели "выталкивания" очевидны – она более простая, а значит, принимающее устройство может быть более дешевым.
Sun MediaCenter начинает проигрывание уже через 5 секунд после начала загрузки. Сквозное проигрывание необходимо для приложений с быстрым и непрерывным обновлением содержания. Этот режим не налагает никаких ограничений на тип документов – они могут быть любыми, единственное ограничение в том, что видеопоток проигрывается только в нормальном режиме в прямом направлении. Сквозное проигрывание поддерживается менеджером документов CM и менеджером потока MSM, что позволяет использовать программы, которые практически одновременно записывают и проигрывают документы с сервера. Утилиты CM, распознавая режим сквозного проигрывания, предотвращают преждевременное уничтожение документов.
На уровне операционной системы видеодокументы представляются взаимосвязанной совокупностью файлов. Таким образом, для фильма в цифровой форме хранятся файлы одного или нескольких видеопотоков и файл для аудиопотока. В дополнение к файлам содержания существуют вспомогательные файлы, которые поддерживают распределение первичного файла по разным дискам (striping), синхронизацию между видео и аудио, обеспечивают разные режимы проигрывания. Менеджер документов делает все эти сложности невидимыми для глаза, позволяя работать с абстракцией видеофайла. Например, копирование и удаление видеофайлов производится так же, как и обычных текстовых, но, естественно, видеофайлы имеют дополнительные свойства – клиент MSM может заказать их доставку для проигрывания.
Из других типов медиа-серверов упомянем семейство Challenge фирмы SGI. Фирма эта известна своими разработками в области трехмерной графики (например, браузер и язык VRML – см. разд. 4.3.1). Ее системы Cosmo и WebForce оснащены медиа-серверами. Линейка серверов Challenge начинается с простой модели "S", а заканчивается суперсервером модели "XL". Их данные сведены в табл. 7.2.
Это семейство серверов имеет симметричную многопроцессорную архитектуру. Масштабируемость серверов достигается не только за счет увеличения числа процессоров и каналов ввода-вывода, но и путем перехода от младших моделей к старшим. Все модели полностью совместимы и работают под управлением операционной системы IRIX, причем ее версии, начиная с 6.X, поддерживают 64-разрядную архитектуру. Challenge S – настольный медиасервер, цена которого лишь немного превышает стоимость ПК. Для работы с внешней памятью используются 3 SCSI-интерфейса. Два слота ввода/вывода обеспечивают полосу пропускания до 267 Мбит/с.Таблица 7.2. Сравнительная характеристика серверов семейства Challenge фирмы SGI
Старшая модель Challenge XL способна обслужить до 1000 видеопотоков. Объем оперативной памяти в ней может достигнуть 16 Гбайт. Помимо обычной внешней памяти емкостью до 2 Тбайт предусмотрена внешняя память с особо высокой надежностью на основе RAID-технологий, емкость которой достигает 6,3 Тбайт. Естественно, что цена старшей модели достаточно высока.
Операционная система IRIX представляет собой адаптированный вариант UNIX и соответствует стандарту X/Open. В нее входит файловая система XPS (Expert System), которая поддерживает:
✓ 64-разрядную адресацию;
✓ специальную журнализацию;
✓ детерминированное время ответа.
Такая адресация, в отличие от 32-разрядной, практически не ограничивает размер адресуемой памяти. В этой файловой системе адресуется до 9 млн. Тбайт. Пока аппаратные ограничения не позволяют иметь память такого объема. Журнализация в файловой системе состоит в систематической регистрации транзакций, что обеспечивает быстрое восстановление файловой системы при повреждениях. А детерминированное время ответа означает, что файловая система гарантирует получение запрашиваемой полосы пропускания в течении определенного промежутка времени.
На рынке медиасерверов в последние годы растет конкуренция. Выпускаются серверы на основе оборудования фирмы Hewllett-Packard с программным обеспечением OKI MediaServer. Работы в данном направлении ведутся и компьютерным гигантом IBM совместно с фирмами BellSouth и Panasonic.7.5.3. Клиентское рабочее место
Браузер представляет собой интерфейс пользователя для доступа и просмотра любых электронных изданий. Отделение браузера от уровня клиентских сервисов подчеркивает тот факт, что он может быть реализован с помощью любого стандартного Web-браузера, что дает множество преимуществ, например, независимость от платформы. Наращивание функциональных возможностей может происходить путем добавления сервисов в рамках задаваемой браузером общей организации.
Браузер создает интерфейс с сервисом запросов и должен обеспечивать следующие функции:
✓ иерархический доступ каталог/файл, аналогичный менеджеру файлов;
✓ интерфейсы для поиска;
✓ просмотр списка ответов, включающего миниатюры;
✓ навигацию по связям между документами.
Если данный клиент обладает правами доступа к хранилищу изданий, он может, выбрав одну из миниатюр, сформировать запрос к хранилищу изданий на получение соответствующего документа. После определенного времени ожидания, связанного с выбором соответствующего информационного носителя в хранилище, сервер доставки начнет передачу клиенту запрошенной информации. Второй главный компонент браузера – средства просмотра для мультимедийных изданий. Для этого компонента существенно, чтобы медиадокументы были представлены в распространенных форматах либо легко преобразовывались в них. Браузер, однако, должен быть способен получать документы в их "родных" форматах и активизировать соответствующие приложения обработки, например, чтобы пользователь мог просматривать, а при необходимости и редактировать документы. В данном случае для воспроизведения медиа-потоков с сервера доставки используется интерфейс MSMC (Media System Manager Client) API (Application Program Interface). Это программный интерфейс пользователя для взаимодействия с сервером Sun MediaCenter. Поддержку этого API обеспечивает менеджер потока (MSM), являющийся агентом клиента на сервере. Скрывая все детали управления и передачи видеопотоков, API MSMC предоставляет пользователю несколько абстракций, в том числе – титулы (наименования медиадокументов) и список титулов для проигрывания. Операции над титулами полностью имитируют управление обычным видеопроигрывателем: воспроизведение, быструю перемотку, обратное проигрывание. Сказанное иллюстрируется рис. 7.11.