Мультимедиа технологии. Часть 1. Основы Мультимедиа технологий
Шрифт:
Звуковые файлы. Как подчеркивают специалисты, звук является наиболее выразительным элементом ММ. Классификация звуковых компонентов приведена на рис.1.3 [13].
Рис. 1.3. Классификация звуковых компонентов
Наиболее часто используются следующие звуковые форматы [4, 14]:
wave (WAV) (.wav) – наиболее широко распространенный звуковой формат, 16 бит и выше, стерео. В его основе лежит файловый формат обмена ресурсами (Resourse Interchange File Format, RIFF),
WavePack (.wv) – также включает уникальный гибридный режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл коррекции (.wvс), который в комбинации с предыдущим позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придется выбирать между сжатием без потерь и с потерей качества. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота сэмплирования до 192 кГц;
цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface, MIDI) (.mid, .midi) – определяет обмен данными музыкальными и звуковыми синтезаторами разных производителей. Представляет собой протокол передачи музыкальных нот и мелодий. MIDI-файл представляет собой последовательность 8-битных команд, которыми записаны действия, например, сыграть на таком-то инструменте такую-то ноту в течение стольких-то секунд. Это просто ссылки на ноты, способ записи команд, посылаемых музыкальным инструментам (компьютерные ноты, показывающие, как проигрывать музыку). Когда MIDIсовместимая звуковая карта получает такую ссылку, она ищет необходимый звук в таблице (Wave Table). Файлы MIDI значительно компактнее оцифрованной записи. Существует 3 разновидности стандарта MIDI:
General MIDI (GM), регламентирующий набор тембров (инструментов) фирмы Roland в музыкальных синтезаторах. Синтезатор должен иметь 128 мелодических тембров с возможностью воспроизведения звуков разной высоты в каналах 1-9 и 11-16, а также 46 ударных инструментов в канале 10. Мелодический набор состоит из 16 групп инструментов (фортепиано, органы, гитары, струнные, духовые, ударные и т.п.) по 8 в каждой группе. За всеми инструментами закреплены номера;
General Synth (GS) – общий стандарт фирмы Roland. Кроме инструментов General MIDI он включает дополнительные наборы мелодических и ударных инструментов, а также различные эффекты (скрип двери, звук мотора, крики и т.п.);
Extended General (XG) – новый стандарт фирмы Yamaha, включающий несколько сотен мелодических и ударных инструментов, применяемых в профессиональной музыке, а также более развитые средства управления синтезом. В частности, он обязывает синтезатор иметь по одному резонансному фильтру на канал и 3 независимых вида эффект-обработки, обеспечивает управление в РВ атакой/затуханием звуков, параметрами фильтров, раздельную настройку ударных звуков, подключение множества звуковых эффектов. Его использование позволяет создавать переносимые MIDI-файлы со звучанием, приближенным к профессиональному. Использует 3 типа эффект-обработки: reverb, chorus, variation (последний включает по несколько видов первых двух, также echo, delay, flanger, phaser, rotary speaker, wah-wah, distortion, jverdrive, equalizer и пр.);
CD (Digital) Audio (CD-DA) (.cda) – формат, в котором аудио треки формата WAV записываются на Audio CD;
Motion Picture Expert Group (MPEG) Audio Layer 3 (MP3) (.mp3) –
MP3Pro – в его основе лежит MP3, используется технология Spectral Band Replication (SBR), за счет чего кодек обеспечивает неплохое качество на низких битрейтах. Но качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других ко-деков. Поэтому он применяется для трансляций в Сети и демонстрации фрагментов новых музыкальных композиций;
OGG Vorbis (OggVorbis) (.ogg) – свободный формат сжатия звука с потерями, появившийся в 2002 г. Его психоакустическая модель по принципам действия близка к модели MP3 и подобным, но ее математическая обработка и практическая реализация существенно отличаются, обеспечивая лучшую четкость воспроизведения при равной плотности потока. Поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц до 32 битов (чего не обеспечивает ни один формат сжатия с потерями); прекрасно подходит для кодирования 6-канального звука DVD-Audio. Формат изначально разрабатывался с возможностью потокового вещания, что дает полезный эффект: в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов. OggVorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жесткими значениями, и он может варьироваться даже на 1 Кб/c. При максимальных настройках кодирования варьируется в диапазоне 400-700 Кб/c. Частота дискретизации может выбираться в пределах 2-192 кГц;
продвинутое аудио кодирование (Advanced Audio Coding, AAC) (.aac) – формат аудиофайла с меньшей потерей качества при кодировании. Создавался как преемник MP3 с улучшенным качеством кодирования. Вышел в свет в 1997 г. как MPEG-2, часть 7. Существует и формат AAC, известный как MPEG-4, часть 3;
WMA (.wma) – формат, разработанный Microsoft для хранения и трансляции аудио, который входит в семейство форматов Windows Media, поддерживает битрейты до 192 Кбит/с. По степени компрессии WMA в два раза превышает МРЗ при том же качестве звучания, особенно на низких битрейтах; по параметрам конкурирует с OggVorbis и AAC;
WMA Lossless – поддерживает теги, высокие частоты сэмплирования, многоканальный до 7.1 звук, трансляцию аудио через Сеть [14-16];
VQF (.vqf) – новый формат фирмы Yamaha, использует сжатие с битрейтами 8-96 Кбит/с. Разработчиками декларируется, что по качеству звука VQF-файл с битрейтом 80 Кбит/с эквивалентен MP3-файлу с битрейтом 128 Кбит/с;
свободный аудиокодек без потерь (Free Lossless Audio Codec, FLAC) (.fla) – предназначен для сжатия аудио. В отличие от кодеков с потерями OggVorbis, MP3 и AAC не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для хранения коллекции музыки в высоком качестве. Поддерживает любые частоты семплирования в диапазоне 1-65535 Гц, разрядность аудио 4-32 бита, а также возможность кодирования многоканального звука;
формат Monkey's Audio или APE (от английского ape – обезьяна, примат) (.ape) – популярный формат кодирования цифрового звука без потерь. Средний битрейт в аудиофайле составляет 600-700 Кбит/с, среднее сжатии – 40-50 % в зависимости от жанра музыки (лучше сжимаются классика и джаз). Существует 4 степени сжатия. Обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции, а также проверку целостности файла при раскодировании. Поддерживается восстановление оригинального WAV-файла из сжатого APE-файла [14-16].