Журнал 4PDA. Февраль-Март 2006
Шрифт:
Стандарт MPEG-4 разделён на множество разных подстандартов, из которых к видео относятся:
ISO 14496-2. Продвинутый Простой Профайл (Advanced Simple Profile – ASP). На данное время доступны следующие ASP кодеки: XviD, DivX, DivX4/OpenDivX, ffmpeg/ffvfw/ffdshow, 3ivx, Nero Digital, Skal, Quicktime, mpegable, Envivio, Sorenson и многие другие.
ISO 14496-10. Продвинутое Кодирование Видео (Advanced Video Coding – AVC), так же известное как H.264. В настоящее время наиболее доступны следующие реализации AVC/H.264: x264, MainConcept, Ateme, ffdshow и Nero (тот же Ateme).
Кодеки AVC обеспечивают лучшее сжатие и качество
На первую часть вопроса мы частично ответили в начале статьи. Допустим, мы сохраняем видео без сжатия с размером кадра 352х288 пикселей и цветностью 24 бит на пиксель. Для сохранения минуты видео потребуется примерно 435 Мбайт. В этом и есть основная проблема цифрового видео – неимоверные размеры файлов.
Для борьбы с таким аппетитом существует два основных способа: уменьшение основных параметров видеоряда (размер кадра, кодировка цвета и частота кадров) и сжатие.
Сжатие разделяют на два типа: «без потери качества» и «с потерей качества». Разница между этими типами понятна из их названия. Максимальная степень сжатия, достигаемая с помощью алгоритмов «без потерь», не превышает 3 к 1, поэтому они не очень помогут в решении нашей задачи. В то время, как алгоритмы, работающие с потерей качества, могут сжимать вплоть до 100 к 1 по отношению к несжатому потоку.
Каким же образом методы сжатия видео достигают столь впечатляющих результатов? Как известно, пороговая частота дискретного восприятия человеком сменяющих друг друга графических образов – 25 кадров/сек. В силу этого обстоятельства, наличие в выходном потоке большего числа кадров не оправдано. Более того, смежные кадры содержат одни и те же объекты сцены. Следовательно, хранение каждого из кадров можно заменить хранением изменений, произошедших со времени показа предыдущего кадра. Таким образом, весь фильм можно представить в виде последовательности ключевых кадров, сохраненных с небольшим коэффициентом сжатия и промежуточных (зависимых) кадров, ссылающихся на предыдущие ключевые или зависимые кадры. Зависимые кадры минимальны по размеру и содержат только изменения, которые претерпела сцена. При этом, алгоритм выясняет то, что глаз может не заметить, и выбрасывает это, а затем вычисляет лучший способ для сохранения оставшегося. Вот за счет этого и достигается впечатляющая экономия дискового пространства.
А к каким проблемам приводит сжатие видео? Оно приводит к, так называемым, артефактам. Артефакты – это видимые нарушения качества видео, возникающие в процессе сжатия с потерями. Искажения, получаемые при сжатии, варьируются от алгоритма к алгоритму. Наиболее часто встречающийся артефакт сжатия – разбиение картинки на квадратные блоки. Также часто наблюдаются: «мусор» рядом с контрастными границами и движущимися объектами, «волнующиеся» и «расплывшиеся» цвета или «замыливание» картинки.
Здесь ключевым моментом является количество бит, выделяемых для хранения цвета одного пикселя. В этой связи появляется термин «битрейт». Битрейт – это размер видеопоследовательности в битах, отнесенный к его длительности в секундах. Единицей измерения битрейта служит 1 бит/с – один бит в секунду (1bps – 1 bit(s)-per-second). Поскольку 1 бит/с – величина очень маленькая в приложении к цифровому видео, также вводятся килобит/с (кбит/с). Чем выше битрейт и, соответственно, бит выделено под хранение одного пикселя, тем реалистичнее картинка, но тем больше объем конечного файла.
Итак, из всего вышесказанного можно сделать вывод, что основные параметры, на которые мы можем повлиять – это битрейт и размер картинки. Частоту кадров не стоит трогать, так как это может привести к рывкообразному воспроизведению видеоряда и проблемам синхронизации со звуковой дорожкой.
Но, это еще не все рычаги управления. Повлиять на качество можно, выбирая режимы сжатия. Существует четыре режима: однопроходный с постоянным битрейтом, однопроходный с переменным битрейтом, однопроходный с постоянным качеством и двухпроходный. Рассмотрим подробнее принципы работы каждого из режимов.
Однопроходный режим с постоянным битрейтом
Этот режим – самый простой: каждый кадр имеет одинаковый размер, а результирующий поток видеоданных имеет постоянный битрейт. Алгоритм этого режима весьма прост и, соответственно, нересурсоемок. Однако, результаты, полученные в таком режиме, существенно уступают результатам в других однопроходных режимах. В современных кодеках практически не используется.
Однопроходный режим с переменным битрейтом
Он реализует простейшую схему: если кадр простой для сжатия, то используется лишь часть выделенных для нее битов. Остальные биты «откладываются» в своего рода копилку – резервуар. Благодаря этому на сложных сценах мы можем использовать больше бит для сжатия кадра, заимствуя часть битов из резервуара. Данная схема проста и эффективна, потому она дает лучшее качество изображения, чем в режиме с постоянным битрейтом. Но, реальный битрейт получится на усмотрение кодека, поэтому точно контролировать размер фала не получится.
Однопроходный с постоянным качеством
Название этого режима – «с постоянным качеством», – не совсем корректно. В процессе сжатия остается постоянным так называемый quantizer – численная характеристика степени сжатия кадра. Quantizer задаёт коэффициент потерь в качестве видео. При выставлении его в постоянное значение, качество видео будет одинаково на протяжении всего фильма, не зависимо от количества движения. Уменьшение значения «квантизатора» ведёт к улучшению качества картинки. А, чем этот показатель выше, тем больше сжатие, тем ниже качество, тем более заметны квадраты (артефакты). Основной недостаток этого режима – мы не можем узнать заранее (до сжатия), какой размер будет иметь файл в результате.
Двухпроходный режим
Как можно догадаться из названия, сжатие видео в этом режиме проводится в два прохода и, соответственно, занимает примерно вдвое больше времени. Во время первого прохода собирается статистика о сжимаемости видео материала. Во втором проходе эта статистика используется для перераспределения битов, причем биты могут перераспределяться не только в пределах некоторого небольшого промежутка времени, как было в случае однопроходного режима и схемой с резервуаром битов, а на протяжении всего материала. Поэтому, именно двухпроходный режим обеспечивает максимальное качество видео при заданном битрейте. При этом можно очень точно посчитать, какой размер будет иметь конечный файл.