Tw-city.info

IT Новости
1 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Параметры качества видео

Форматы сжатия видео

Прежде чем строить систему видеонаблюдения, техническому специалисту предстоит решить ряд важнейших вопросов и задач. Наряду с выбором камер, серверов и программного обеспечения, необходимо подобрать оптимальный формат сжатия видеопотока системы. Основными форматами для систем видеонаблюдения являются MJPEG, MPEG-4 и H.264 (MPEG-4 part 10). Споры «какой формат лучше?» сродни спорам «за чем будущее: аналогом или ip?»- они ведутся уже не первый год, но специалисты так и не могут прийти к единому мнению. В этой статье мы расскажем об особенностях форматов, о параметрах, которые необходимо учитывать при выборе, о технологиях, использующихся для анализа видеопотоков.

Сжатие видеоизображения

Видео с IP-камер наблюдения приходят на сервер в сжатом виде. Обычно сжатие заключается в удалении особенностей изображения, практически незаметных человеческому глазу, хотя иногда производится сжатие без потерь какой-либо информации. Сжатый видеопоток требует меньшую пропускную способность сети и меньший объем свободной памяти жесткого диска. Для просмотра или анализа видео полученный поток необходимо распаковать-применить алгоритм преобразования, обратного сжатию. Комбинация алгоритмов для сжатия и обратного восстановления кадра называется видеокодеком. Видеокодеки разных стандартов не совместимы друг с другом — видеоинформация, сжатая с помощью одного кодека, как правило, не может быть распакована с помощью другого.

Существует несколько видов сжатия

Сжатие без потерь позволяет получить после декодирования изображение, не отличающееся от исходного кадра.
Сжатие с потерями упускает часть информации после декодирования.

Возможно несколько реализаций сжатия с потерями:

  • сжатие с процентными потерями — потери настолько незначительны для человеческого глаза, что кадр до и после декодирования практически неразличимы для оператора;
  • сжатие с естественными потерями — различия между кадрами до и после декодирования заметны, но все-таки они довольно не выражены, вся необходимая для анализа событий информация сохраняется;
  • сжатие с неестественными потерями — низкое качество сжатия видеопотока, которое приводит к появлению артефактов (заметных искажений видео) при декодировании. Появление артефактов приводит к снижению четкости изображения, появлению полей одного цвета (при объединенииразличных цветовых оттенков в один), появлению блочности картинки (пиксельности, зернистости). Наличие артефактов ведет к ложным результатам анализа видеопотока программным обеспечением системы.

В процессе сжатия, для сокращения размера видеопотока уменьшают число цветовых оттенков изображения, цветовые разрешения, устраняют мелкие детали картинки, неразличимые глазом человека; предсказывают изменения на основании уже полученных данных; устраняют повторяющиеся значения пикселей.

Форматы сжатия видео

Существует множество форматов сжатия, в видеонаблюдении наибольшей популярностью пользуются MJPEG, MPEG-4 и H.264.

Формат MJPEG

Для формата сжатия MJPEG видеопоток представляет собой последовательность статичных картинок- изображений формата JPEG. Сжатие происходит индивидуально для каждого кадра (внутрикадровое). Получаем полную независимость отдельных изображений. При воспроизведении видеоархива качество картинки остается хорошим- из формата MJPEG всегда можно получить кадры с четким изображением происходящих событий, он не требует высокой производительности процессора, но существенно нагружает сеть и требует большого объема дискового пространства. Для этого формата характерны артефакты блочности изображения, полей одного цвета. Данные с камеры приходят с потерями, поэтому говорить, что искажений нет, нельзя. Другое дело, что при правильной настройке камеры глаз человека в JPEG искажения почти не замечает.

Форматы MPEG-4 И H.264

Для форматов MPEG-4 и H.264 сжатие осуществляется как внутри одного кадра, так и для серии кадров (межкадровое). Видео формата H.264 (оптимизированный MPEG-4 или MPEG-4part 10)представляет собой не последовательность отдельных изображений, а цепочку связанных данных- потоковое видео. Преимущества этого формата в том, что производится сохранение не каждого кадра, а лишь опорного изображения и дальнейших его изменений.

Когда значительная часть изображения остается неизменной, получается гораздо меньший размер итогового видеофрагмента чем для MJPEG. В случае если формат MJPEG может отправлять набор изображений по 200 кбайт каждое, формат H.264 отправит одно опорное изображение весом 200 кбайт и последующие его изменения, имеющие гораздо меньший размер. В результате видеофрагмент в формате H.264 будет меньше аналогичного фрагмента формата MJPEG на 70-90%. Соответственно, и пропускная способность сети требуется гораздо меньшая, зато вычислительных ресурсов формат H.264 требует существенно больших.

Механизмы сжатия для разных форматов

Алгоритм сжатия MJPEG просто удаляет избыточную информацию, незаметную для человеческого глаза в каждом кадре.

Для формата H.264 характерны кадры I-frames, содержащие полное изображение (опорный кадр), P-frames, содержащие информацию о изменении опорного кадра и двунаправленные кадры B-frames, которые содержат информацию об изменении одного предыдущего изображения и одного последующего. В потоковом сжатии применяют методы дифференциального кодирования и поблочной компенсации движения.

В случае дифференцированного кодирования текущий кадр сравнивается с основным. Кодировка происходит только для изменившихся пикселей. Этот метод оптимален при незначительном изменении картинки.

Если сжимаемое изображение существенно меняется, используют поблочную компенсацию. В этом случае вся картинка разбивается на части — макроблоки, сравнение текущей картинки с основной сводится к сравнению этих макроблоков. При изменении кадров видеопотока меняется не все изображение целиком, а перемещаются или меняются его отдельные части или сменяются другими. В случае совпадения макроблоков, программа сохраняет лишь информацию о его расположении в кадре. Для кодирования этой информации требуется гораздо меньше бит, чем для кодирования содержимого блока.

Для повышения эффективности сжатия видео формата H.264 появился более совершенный метод. Для кодирования кадров I-frames используется метод предсказания, он приводит к уменьшению размера сохраняемых изменений, при этом качество картинки не снижается. Для реализации этого метода используются моноблоки, сравнение пикселей проводится уже для них. Для кодирования P-frames и B-frames используется усовершенствованный механизм поблочной компенсации движения: кодировщик может по своему выбору искать совпадения в произвольном количестве областей (блоков) основных кадров. Если для выделения более точного совпадения необходимо изменить размер или форму блока, кодировщик делает это.

Процесс сжатия/распаковки происходит всегда с задержкой — системе необходимо потратить время на сжатие, перенос кадра по сети, распаковку, отображение на клиентский монитор. Время задержки является важным фактором, если необходимо управлять камерами в реальном времени.

Еще один важный параметр — коэффициент сжатия. Он определяет, насколько декодированный кадр будет отличаться от реальной картинки. Чем сильнее сжимается кадр, тем меньше бит он занимает, следовательно, тем проще его передать по сети. Однако при кодировании значительная часть информации будет потеряна.

Режим видеопотока

Важной характеристикой для формата сжатия MPEG-4 и H.264 является режим видеопотока. Чаще всего выбор сводится к переменному (VBR) или постоянному (CBR) режиму. Для разных условий съемки и различных характеристик системы оптимальными будут разные режимы.

CBR передает по сети видеопоток постоянного размера, поэтому его используют для случая ограниченной ширины канала. Этот режим гарантирует, что все видеоданные будут переданы по сети. При постоянном размере качество картинки будет меняться. Качество кадра, в котором движение отсутствует будет существенно отличаться для случая, когда движение есть, чем больше движения в кадре, тем хуже картинка. Этот вариант в системах видеонаблюдения используется редко, так как обычно большую ценность и интерес для оператора представляют отрезки видео, на которых происходит изменение-совершается движение.

VBR позволяет задать постоянное качество изображения, размер кадров для различных условий при этом будет меняться. Этот режим использует подавляющее большинство систем видеонаблюдения. Так как размер кадров может существенно меняться, при расчете сетевых параметров (пропускной способности) стоит выбирать сеть «с запасом».

Обработка сжатого видеопотока программным обеспечением

Запись поступающего с камеры видео сама по себе не представляет большой ценности. Современные системы видеонаблюдения строятся прежде всего для анализа происходящих на охраняемом объекте событий, предотвращения угроз. Максимально облегчить работу оператора в этом направлении помогает профессиональное программное обеспечение. Большинство современных программных систем получают закодированное сжатое видео с камер, производят его распаковку, анализ, запись в архив. На распаковку полученного видеопотока требуются огромные вычислительные ресурсы серверного оборудования. В случае построения масштабной системы расходы на обрабатывающие серверы очень высоки.

Эту проблему позволяет решить технология анализа видеопотока без его полной распаковки — программе не надо распаковывать кадры целиком, для анализа достаточно данных промежуточного декодирования. При сохранении высокого качества аналитики, ресурсов вычислительного оборудования требуется гораздо меньше. Использование описанной технологии особенно актуально в видеосистемах с большим количеством камер, а также в системах, требующий больших вычислительных затрат.

Что выбрать?

Однозначного ответа не даст ни один эксперт, просто потому что все зависит от особенностей и параметров видеосистемы. Так или иначе, придется идти на компромисс: не существует еще формата, который минимально нагружает сеть и процессор, обеспечивая при этом высокое качество картинки.

Итак, для построения оптимальной видеосистемы при выборе формата видео необходимо учитывать следующее:

  • характер и интенсивность изменений в кадре;
  • пропускная способность сети;
  • частота смены кадров;
  • желаемое качество изображения (зависит от коэффициента сжатия);
  • допустимое время задержки;
  • бюджет системы.

Итак, для построения масштабных систем, использующих мегапиксельные камеры, наиболее оптимальным форматом является H.264- он требует сравнительно низкой ширины канала, обеспечивает высокую скорость передачи денных, а видеоархив в этом формате занимает минимальный объем дискового пространства. Однако для построения видеосистем с низкими требованиями (небольшая частота кадров, маленькое разрешение камер) приемлемым вариантом остается MJPEG. К тому же потери качества изображения в этом формате меньше, чем в H.264.

Опубликовано в журнале «Технологии Защиты», №4, 2012

Практика: разбираемся с форматами цифрового видео

Сколько весит видео

Видеоизображение стандарта PAL или SECAM – это последовательность картинок, отображаемая с частотой 25 кадров в секунду. В одном цифровом кадре содержится 720х576 точек, то есть 414 тыс. 720 элементов (пикселей). Каждая точка может иметь один из 16,7 млн. цветов и занимать 3 байта в компьютере. Следовательно, один кадр занимает порядка 1,2 Мб. При стандартной частоте получаем цифру около 30 Мб в секунду, то есть хранение одного лишь часа видео (вместе со звуком) без компрессии обойдётся в 107 Гб. Выглядит устрашающе, но уже сейчас допустимо.

Но ведь прогресс видео не стоит на месте. Максимально возможное качество сейчас достигается в HDTV (ТВ высокой чёткости), этот формат подразумевает разрешение 1920х1080 точек, то есть, при прочих равных условиях, серия кадров, рассчитанных на одну секунду, уже займет 148 Мб (521 Гб в час).

Читать еще:  Как в муви мейкере перевернуть видео

Чтобы избежать подобных объемов хранимого видео и нерационального использования ресурсов компьютера, а также получить возможность распространения видеосюжетов, были созданы различные способы сжатия видео. Достигнутые за 15 лет наработки развития цифровой техники активно используются в повседневной жизни, в видеотрансляциях, бытовых устройствах (видеокамерах, DVD-плеерах) и в сети интернет. В зависимости от вида кодека, можно достичь разной степени сжатия и разного «веса» готового фильма.

Как происходит сжатие

В отличие от универсальных архиваторов (вроде WinRar или WinZip), сжатие видео происходит с некоторыми потерями, величина которых зависит от выбранного кодека. Это связано с тем, что алгоритмы обычных архиваторов видеоинформацию (равно как и звук) практически не сжимают. Современные алгоритмы сжатия прибегают к всестороннему логическому анализу видеоролика с целью извлечь повторяющиеся куски между кадрами и уменьшить размер конечного файла. При воспроизведении сжатая информация «раскрывается», и уже после этого демонстрируется пользователю. Раскрытие изображений, сжатых некоторыми кодеками, может потребовать большого времени от маломощного компьютера.

Для сжатия видео используют различные кодеки

Самые популярные кодеки

Сегодня самые распространенные кодеки – это семейство MPEG. Основу ему положило сжатие фотографий. Все мы знакомы с компактными картинками с расширением JPG, а многие даже смогут отличить сильно сжатую картинку (с кубической структурой) от качественной (на глаз, сравнимой с оригиналом). Анатомические особенности глаза человека позволяют, незаметно сжимать картинку в десять раз, используя кодер JPEG.

На приведенных примерах можно видеть, какие артефакты, так называемые кубики, возникают на фотографии сжатой неправильно (с большим коэффициентом сжатия) и их отсутствие на фото с правильным сжатием. Подобные потери качества при большом сжатии большинством кодеков, в том числе и JPEG, необратимы.

Очень популярный формат во всём мире, с основой, взятой от кодека JPG. Сжатие в нем производится сериями по три кадра. Это один из самых старых кодеков, так что, практически на любых, даже самых «слабых» машинах вы сможете просмотреть видео со стереозвуком в этом формате. Однако и качество изображения невысокое: оно сравнимо с привычным аналоговым форматом VHS. Картинка имеет разрешение 352х288 точек, да и качество ее оставляет желать лучшего. И хотя MPEG-1 не требователен к ресурсам, его судьба предрешена: с развитием ёмкости и скорости передачи данных в компьютерах и интернете формат будет постепенно забываться

Получить файлы MPEG-1 можно с помощью программы AVI2MPG. Для увеличения нажмите здесь.

Формат использует простую обработку кодированного аналогового видеосигнала по стандарту JPG (с разрешением 768х576 точек). Расшифровывается как Motion-JPEG (движущийся JPEG). На сегодняшний день этот формат практически не используется, т.к. качественно сжатые ролики занимают достаточно много места. В некоторых моделях устройств (например, фотокамерах с функцией видео) встречается упрощенный вариант M-JPEG с разрешением 320х240 точек.

Доминирующий формат на сегодня это MPEG-2 (с разрешением 720х576 точек). Все DVD-video диски работают именно в формате MPEG-2. Трансляции со спутников в несколько каналов на одной частоте, эфирная трансляция, в том числе ТВ высокой четкости, разнообразные плееры DVD, microMV-видеокамеры используют этот формат сжатия. И это не удивительно. После триумфального успеха MPEG-1, новый формат, обеспечивающий практически профессиональное качество картинки утверждался довольно долго, и получился очень удачным. MPEG-2 подходит для записи полуторачасового фильма отличного качества на стандартный диск DVD (4,7 Гб). Кроме того, в этом формате можно записывать на двойные DVD (9 Гб) фильмы повышенного качества с использованием нескольких разных дорожек звука (дубляж), разных форматов многоканального звучания, субтитров, разных углов обзора видеоматериала (несколько синхронных дорожек видео) и других цифровых новшеств. Среди них, например, присутствует произвольный мгновенный доступ к любой части видеоматериала на диске и отсутствие перемотки при достижении конца видеоматериала, что раньше являлось довольно большой проблемой.

MPEG-2 позволяет использовать разрешения вплоть до 1920х1080 пикселов (25 кадров в секунду, с полями и без полей, с прогрессивной разверткой) и поддерживает 6-канальный звук.

Особенности этого формата широко использует компания Sony в своем расширенном стандарте microMV, хотя поток информации там повышен до 12 Мбит/с (по сравнению с максимальным стандартом DVD 9,8 Мбит/с), а размер кассеты уменьшен (по сравнению с DV). И всё же стандарт DV отличается большей устойчивостью и большим распространением по всему миру.

Недавно появились камеры, которые пишут сразу на miniDVD диски в формате MPEG-2. Они имеют несколько важных достоинств — перезапись дисков до 1000 раз без потери качества, доступность материала и некоторые другие преимущества. Но очевиден и недостаток – ограниченный объем записанного материала (до 30 минут на 1 miniDVD диск). Хотя для любительских съемок это очень подходящий вариант: миниDVD диски прекрасно воспроизводятся на бытовых плеерах и ПК, а программы идущие с такими камерами позволяют проводить монтаж на любом компьютере, оснащенном DVD-приводом.

Общепринятые стандарты для формата MPEG

Развитием формата MPEG-2 является MPEG-4. Все мы уже давно привыкли к звуку MP3, а формат MPEG-4 сочетает отличный звук и максимальное уплотнение видеосигнала (до 30-40% лучше чем у предшественника). Разница заключается в том, что кодируется последовательность более чем из трех кадров (обычно до 250 кадров). Тем самым достигается большее сжатие и возможность смотреть в режиме реального времени качественное потоковое видео в интернет. Динамическое сжатие также эффективно использует ресурсы, и на обычный компакт-диск помещается 1,5 часа видео в достаточно хорошем качестве. Однако, в большинстве случаев, внимательный зритель сможет увидеть на хорошем экране разницу между изображением, закодированном в MPEG2 и MPEG4.

Некоторые параметры, которые можно настроить при кодировании видео в MPEG-4

Некоторые видеокамеры позволяют записывать в формате MPEG-4 видео на собственную карту памяти или работать как web-камера, передавая по USB кабелю видео со звуком в формате MPEG-4.

Кроме того, современные технологии позволяют даже воспроизводить цифровое телевидение (сжатое в формате MPEG-4 или MPEG-2) с помощью мобильных телефонов, используя GPRS.

На сегодня, MPEG-4 — это наиболее популярный формат распространения видео в интернете и на персональных компьютерах. Рациональное использование памяти при хорошем качестве видео дают о себе знать. Каждая последующая версия кодека MPEG-4 (на сегодня используются 3.хх, 4.хх и 5.хх версии) привносит всё новые и новые прогрессивные улучшения. Большое количество бытовых плееров, КПК и прочих устройств без проблем работают с этим форматом. MPEG-4 будет актуален еще, как минимум, лет десять, пока ему на смену не придёт что-то принципиально новое.

Это формат был разработан программистами компании Apple. Используется он в основном на компьютерах этой компании, хотя также распространен довольно сильно и в интернете. Стандарт MOV считается устаревшим, и позволяет хранить несжатое видео, и довольно популярен по сей день, так как воспроизводится практически на любом компьютере. Однако стоит заметить при его использовании неэффективное использование ресурсов ни по качеству изображения, ни по размеру итогового файла.

Windows Media Video предназначен для небольших файлов и плохих каналов передачи данных. Компания Microsoft активно внедряет этот переходной формат в массы. Для просмотра видео небольшого размера в интернете кодек приходится весьма кстати, а потому используется повсеместно, в том числе для прямых трансляций. Некоторые портативные устройства (например, КПК) также используют этот формат хранения сжатых медиа-данных.

Популярностью этот формат пользуется лишь потому, что его продвигает гигант Microsoft. Также Windows Media Video позиционируют для создания высококачественного видео для DVD (в формате Microsoft Windows Media Video High-Definition, или WMV HD), но со скоростью передачи данных, такой же, как и на стандартном DVD. Воспроизводить его можно с использованием плеера Windows Media 10 Series на компьютерах с ОС Microsoft Windows XP. Будущее этой новинки зависит исключительно от настойчивости Микрософт и количество денег, вкладываемых в эту лицензированную разработку.

Digital Video (DV)

По-настоящему качественное цифровое видео появилось с разработкой формата DV (а также с разновидностями DVCAM, DVCPRO, miniDV). Для полноценной работы с этим форматом требуется соединение DV-камеры с компьютером. И оно было найдено – это формат передачи данных IEEE-1394 (также имеющий названия i.Link или FireWire). С помощью порта IEEE-1394 можно копировать все, что отснято на видеокамеру в компьютер и обратно (если камера поддерживает такую возможность). Так как происходит передача цифрового сигнала в обе стороны, потери при переносе информации исключены.

Не вдаваясь в тонкости процесса кодирования, отметим, что благодаря новым методам преобразования, размер кадра в DV достигает 720×576 точек, звук — 48 кГц/стерео, а поток видео — 3,6 Мбайт/с. Таким образом, видео практически профессионального качества стало доступно каждому с цифровой камерой формата DV. Тем более на одну видеокассету подобного формата вмещается до 90 минут (LP режим) высококачественного материала.

Будущее этого формата практически безоблачно. И будет ещё долго радовать всех любителей и ценителей качественного домашнего видео, которое повсеместно используется на ТВ (документальные фильмы, прямые репортажи и пр.)

Реальными возможностями наращивания качества является улучшение «цифры». Уже не за горами практическое внедрение стандарта HDV (высококачественное DV) в массы, которое подразумевает увеличение четкости кадра и использует в своей основе все тот же формат DV.

Blue Ray диски уже готовы к массовому использованию, а основное их отличие от DVD – в объеме (на один Blue Ray диск вмещается до 25 Гб информации). Такой объем позволит увеличить объем готовых фалов, а значит, уменьшить степень сжатия и увеличить конечное качество. Видеокамеры с возможностью записи на подобные диски должны появиться в ближайшем будущем и станут очередной ступенькой в развитии прогресса цифровой видеотехники.

Оценочные параметры качества сжатого видео

Не так давно, мой коллега Евгений с проекта otstrel.ru, недавно написавший инструкцию о том «Как и чем пересжать видео», решил не бросать начатое и написал статью, отвечающую на возникшие у многих вопросы и просто поясняющую некоторые вещи, которые необходимо знать для вышеуказанного процесса. Прошу к чтению 😉

Если вам когда либо приходилось пользоваться программами сжатия видеопотоков, то вы наверняка встречали среди характеристик выходного файла такие параметры, как размер (size) выходного файла или его битрэйт ( bitrate ) и задавались вопросом: а как же выбрать правильное значение?

Читать еще:  Как повернуть видеозапись

Аудиофайлы

С аудиофайлами таких проблем как правило не возникает, ибо качество звука практически однозначно определяется его битрэйтом (т.е. скоростью воспроизведения потока, как правило выраженной в килобитах в секунду). Если мы видим, что битрэйт сжатого аудиофайла (mp3) равен 128 kpbs (килобитам в секунду), то нам понятно, что качество звука соответствует CD -диску, если это 64 или 96 kbps , то это уже звук низкого качества, если 256 kbps — то звук высокого студийного качества и т.п.

Хотя внутри себя качество звука характеризуется ещё и такими параметрами, как частота оцифровки, но как правило этот параметр уже включен в битрэйт и потому качество звука обычно определяют по битрэйту. Т.е. если мы видим файл mp3 с музыкой с описанием, что он сжат с качеством 128 kbps , то мы уже подразумеваем, что это стереозвук с частотой оцифровки в 44 или 48 кгц.

Вводная

С видео всё несколько сложнее. У видео есть такие параметры как размер кадра и частота кадров в секунду. А потому знание лишь одного битрэйта недостаточно — нужно дополнительно знать размер кадра и количество в кадров в секунду. А потому, глядя на параметры видео, например, 640×480 (размер кадра), 25 fps (кадров в секунду), 1300 kbps (битрэйт), новичку сложно что-то сказать о его качестве даже приблизительно. Точно также, задавая параметр 1300 kbps при сжатии видео, непонятно, что получим на выходе. И это критично, учитывая, что процесс пересжатия видеофильмов длится несколько часов.

Качество сжатия видеопотока более однозначно определяется коэффициентом «bits/pixel», означающий среднее количество бит, потраченное на 1 пиксель изображения. Далее я этот коэффициент буду обозначать буквой K (потому как не знаю, как его обычно обозначают).
Если взять 24 -битную глубину цвета, закодированного в формате RGB (т.е. когда красный, зелёный и синий каналы кодируются по 8 бит на канал), то несжатый видеопоток будет характеризоваться значением K=24. Современные видеокодеки дают изображение хорошего качества при довольно низком значении K. Для кодеков XviD и DivX хорошее качество изображения будет при значении K в диапазоне 0.25-0.35 , для H264 — в диапазоне 0.15-0.2 (т.е. видеопоток сжимается по размеру файла более чем в 100 раз по отношению к несжатому). Значениями для других кодеков не владею, но чем хуже (старее) кодек, тем больше будет значение K, при котором будет хорошее качество изображения.

Коэффициент вычисляется по следующей формуле:

  • size — размер видеопотока в байтах
  • width, height — размер кадра (ширина и высота) в пикселях
  • fps — количество кадров в секунду
  • time — время видеопотока в секундах

При этом не забываем, что 1 килобайт равен 1024 байта (а не 1000), и, соответственно, 1 мегабайт равен 1024 килобайтам = 1048576 байт.

Надо понимать, что приведённые выше значения K для кодеков — они взяты для «среднего» видео. Если видео представляет собой рисованный мультик или флэш-мультик, то хорошее качество будет и при более низких значениях коэффициента. Если в видео очень много движения и постоянного изменения цвета и яркости (например, муравейник), то для хорошего качества видео придётся сжимать с бОльшим значением коэффициента. Если не нужно чёткого изображения (например, когда нужно заснять какие-то физические упражнения, но при этом нам совершенно не важны чёткие контуры лица и окружающих предметов), то коэффициент можно уменьшать. И так далее.

Обычно программы сжатия просят указать значение битрэйта (как правило в килобитах в секунду) или целевого размера файла (как правило в килобайтах). Исходя из того, что битрэйт это размер файла в битах поделённый на время в секундах, то соответствующие параметры вычисляются по формулам:

  • Bitrate_kbps — искомый битрэйт в килобитах в секунду (kbps)
  • Size_kbyte, Size_mbyte — искомый размер видеопотока в килобайтах (Kbytes) и мегабайтах (Mbytes) соответственно
    K — выбранный нами коэффициент, характеризующий степень сжатия
    width, height — размер кадра (ширина и высота) в пикселях
    fps — количество кадров в секунду
    time — время видеопотока в секундах
    frames — количество кадров (в некоторых программах выдаётся именно это значение), которое по сути есть fps * time

ВНИМАНИЕ! Все эти размеры касаются строго размера видеопотока. Программы, как правило, также работают с этими параметрами применительно к видео (а не к итоговому файлу). Важно не забывать, что в файле будет присутствовать аудиопоток. Как правило, его битрэйт задаётся, а его размер в файле будет составлять

где
Bitrate_kbps — битрэйт аудио в килобитах в секунду (kbps)
Size_kbyte_audio, Size_mbyte_audio — искомый размер аудиопотока в килобайтах (Kbytes) и мегабайтах (Mbytes) соответственно
time — время видеопотока (и, соответственно, аудиопотока) в секундах

Если в процессе пересжатия будете изменять размер картинки (кадра), то обязательно следите за тем, чтобы соотношение ширины и высоты кадра оставалось прежним. Полезно так же выбирать размеры такими, чтобы длина и ширина были кратны 16 (но вроде бы как необязательно). Это связано с особенностями работы кодеков.

Теперь рассмотрим два конкретных примера.

Пример 1

Имеется видеофайл, снятый на фотоаппарат. Фотоаппарат как правило очень слабо сжимает видео, а потому файлы занимают слишком много места. Нам нужно его пересжать (при этом мы НЕ стремимся к какому-то конкретному размеру, потому что знаем, что он будет в несколько раз меньше, но конкретное значение нам неважно). Параметры исходного файла: 1024×768, 15fps, 20 минут. Будем сжимать кодеком XviD (по той причине, что H264 ещё не сильно распространён, к тому же не все железячные DVD -плееры поддерживают H264 ). Видео домашнего застолья, где движения сильного нет, в основном сидят люди и чешут языком. В этом случае будем исходить из значения коэффициента K=0.25 . Какие-то детали типа названия книг на полках нам совершенно неинтересны, а потому сократим размер до 640×480 . Итого имеем параметры выходного видео:

  • K = 0.25
  • width = 640
  • height = 480
  • fps = 15
  • time = 20 минут = 1200 секунд

Если программа-перекодировщик просит значение битрэйта, то выдаём ему значение (по формуле 1):

  • Bitrate_kbps = (0.25 * 640 * 480 * 15) / 1024 = 1125 kbps

при этом время видео в формуле не учитывается, т.к. мы задаём значения битрэйта (где время уже косвенно включено в этот параметр)

Если же программа-перекодировщик просит указать размер видеопотока, то подставляем значение (по формуле 2):

  • Size_kbyte = (0.25 * 640 * 480 * 15 * 1200) / (1024 * 8 ) = 168750 Kbytes

к содержанию ↑

Пример 2

Имеется видеофильм (беру реальный пример). 1024×432, 25fps, длительность 2 часа 3 минуты 19 секунд (что есть 7399 секунд). Размер файла 3.74 гигабайт. Мы хотим за счёт уменьшения размера картинки сократить размер изображения до 1.37 гигабайт (что есть 1403 мегабайта) — обычно до такого размера делают DVD -rip’ы, чтобы влезло 3 штуки на один DVD -диск.

Поскольку конечной целью является уложиться в размер, здесь вспоминаем, что в файле есть видео и аудио потоки. Параметры видео будут зависеть от того, какую часть размера мы потратим на аудио. При таком сокращении размера файла качество картинки в любом случае ухудшится, а потому держать 6 -канальный звук нет никакого смысла. Поэтому при перекодировке будем использовать стереозвук в формате mp3 и битрэйтом 128 kpbs. Значит звук будет занимать размер (по формуле 5):

  • Size_mbyte_audio = (128 * 7399) / (1024 * 8 ) = 116 мегабайт.

Следовательно, на видео остаётся 1403-116=1287 мегабайт

Теперь нам надо вычислить, до какого размера можно сократить картинку. Сжимать будем кодеком XviD (опять-таки исходя пока ещё из малой распространённости H264). Картинка нам нужна качественная, а потому берём значение K=0.35 . Из формулы 3 вычисляем:

  • width * height = (Size_mbyte * 1024 * 1024 * 8 ) / (K * fps * time) = (1287 * 1024 * 1024 * 8 ) / (0.35 * 25 * 7399) = 166758

Фактически мы вычислили площадь картинки в пикселях. Теперь нам надо подогнать размер картинки под эту площадь, сохранив при этом соотношение длины и ширины исходной картинки. Т.е. фактически решить систему уравнений:

  • width * height = 166758
  • width / height = 1024 / 432

Получаем округлённые до целого значения width = 629 , height = 265 . В принципе, можно оставить и эти значения, но лучше привести их к значениям, кратным 16. Ближайшие значения снизу и сверху для width это 624 и 640 , для height — 256 и 272 . Посмотрим соотношение сторон у оригинала и у картинок, с приведёнными значениями:

Наиболее близким к оригиналу соотношение сторон получилось у разрешения 640×272. Поскольку при таких значениях мы получим бОльшее произведение width * height , чем высчитали, то итоговый размер файла будет немного больше расчётного. Но это не страшно, т.к. при размере в 1.37 гигабайт 3 файла влезают на DVD -диск не впритык, а с запасом. Главное как можно точнее сохранить пропорции изображения. В файле помимо видео- и аудиопотоков хранится вспомогательная информация, обусловленная форматом файла. Вряд ли она занимает более 1% от размера всего файла, но этот фактор надо учитывать, если нужно точно подгонять размер файла

Послесловие

Итого, параметры искомого файла

  • K = 0.35
  • width = 640
  • height = 272
  • f ps = 25
  • time = 7399 секунд

Ну а далее по формуле 1 или 2 вычисляем нужное нам значение битрэйта или размера файла и подставляем его в программу-перекодировщик.

PS: За существование материала спасибо Evg с нашего форума

Оценка качества видео. Субъективная оценка качества видео

Что такое качество? В словаре Даля содержится следующее определение: «качество — свойство или принадлежность, все, что составляет сущность лица или вещи». Что же делать, если нам нужно оценить визуальное качество, например, сжатого кодеком видео? Можно понимать качество видео как среднюю оценку мнений людей, смотрящих это видео. Именно этот показатель в конечном счете хотят улучшить создатели систем обработки видео, поэтому хотелось бы уметь его численно оценить. Существует два подхода к решению этой задачи: субъективная и объективная оценка качества видео. В первой части этой статьи мы расскажем об этих подходах, а во второй приведем результаты проведенного нами субъективного сравнения современных видеокодеков. Объективное тестирование

Можно оценить качество видео при помощи какой-либо формулы или алгоритма, например, PSNR, VQM или SSIM (см. Сравнение видеокодеков при помощи метрики PSNR). Главное достоинство этого подхода в возможности автоматизировать процесс тестирования, что позволяет измерить качество обработки видеосистемы при большом количестве различных настроек и тестовых видео или измерять качество в реальном времени. Также в результате измерений получаются точные и воспроизводимые данные. Минус этого подхода в том, что автоматические метрики могут неверно отражать субъективно воспринимаемое качество. Это может привести, например, к неверному выводу о превосходстве одного кодека над другим.Субъективное тестирование

Читать еще:  Гугл хром тормозит видео онлайн

Альтернативный способ получить оценку качества видео — провести субъективное тестирование. Идея этого метода в том, чтобы получить оценку качества непосредственно от зрителей, проводящих оценку видео. Аналогичный подход в оценке качества звука используется уже долгое время. Например, на форуме hydrogenaudio.org регулярно проходят субъективные тестирования аудиокодеков. Что же нужно, чтобы провести субъективное тестирование?

  • Выбрать видеопоследовательности для тестирования. Обычно используется видео около 8-10 секунд, чтобы предотвратить рассеивание внимания экспертов и сократить общее время экспериментов.
  • Выбрать настройки систем обработки видео, которые вы хотите сравнить.
  • Выбрать метод тестирования.
  • Пригласить достаточное число экспертов (рекомендуется не менее 15).
  • Основываясь на их мнении, получить окончательные оценки.

Еще в 1974 году была опубликована первая версия рекомендаций ITU-R BT.500 «Methodology for the subjective assessment of the quality of television pictures». Эти рекомендации содержат исчерпывающее описание того, как следует решать все вышеперечисленные вопросы. С тех пор проводилось много субъективных тестирований, из недавних стоит отметить Subjective Quality Assessment of The Emerging AVC/H.264 Coding Standard, Subjective Quality of Internet Video Codecs. Объемные субъективные тестирования проводятся VQEG (Video Quality Experts Group).

Несмотря на то, что субъективные тестирования многократно проводились различными организациями, до недавнего времени в свободном доступе не было стабильных программ для проведения тестирования, рассчитанных на работу с персональными компьютерами. Это стало причиной разработки MSU Perceptual Video Quality tool, в которой реализовано несколько методов субъективного сравнения и анализа результатов.Методы субъективного тестирования

Метод субъективного тестирования – это сочетание способов демонстрации последовательностей, сбора мнений экспертов и обработки результатов.
Рассмотрим на примере сравнения видеокодеков процедуру тестирования методом SAMVIQ, недавно разработанным в EBU (European Broadcasting Union), реализация MSU Perceptual Video Quality tool. Этот метод использовался в Субъективном Сравнении Современных Видеокодеков.

1. Эксперт вводит свое имя (любая уникальная последовательность символов).

2. Тест на цветовосприятие (используются стандартные таблицы Ишихары).

3. Для каждой тестовой последовательности:

  • Демонстрируется эталонное (исходное) видео.
  • До тех пор, пока есть не просмотренные сжатые варианты этого видео, эксперт выбирает очередной вариант видео, смотрит его и выставляет оценку. Оценка для фильма принадлежит отрезку от 0 до 100, чем выше, тем лучше. Оценка уже просмотренных вариантов последовательности может быть изменена в любой момент, также возможно пересмотреть любой из вариантов.
  • Если все варианты видео просмотрены, то эксперт может перейти к следующей тестовой последовательности.

Разные варианты сжатой последовательности скрыты за буквенными обозначениями, поэтому эксперт не знает, какой кодек он оценивает в данный момент. Эталонное видео доступно явно, также оно скрыто под одним из буквенных обозначений и оценивается наравне со сжатыми видеопоследовательностями.

Для чего нужны такие сложности? Есть несколько задач, которые должны решать методики субъективного тестирования. Первая из них – создание у всех экспертов общей шкалы оценок, то есть чтобы оценка “хорошо” значила для разных экспертов приблизительно одно и то же. Это достигается при помощи приема под названием “anchoring”: во время теста демонстрируется как видео с самым высоким качеством (“high anchor”, должно ассоциироваться у всех экспертов с максимальной оценкой), так и с самым низким (“low anchor”, должно ассоциироваться с минимальной оценкой).

Еще одна задача – минимизация эффекта памяти, влияния очередности показа видео на оценки экспертов. В некоторых тестовых методах эта задача решается при помощи демонстрации референсного (исходного) видео вместе с каждой обработанной видеопоследовательностью. В методе SAMVIQ, который мы использовали при сравнении, первая проблема решается при помощи явно доступного и скрытого эталонного видео, а вторая – при помощи более гибкой, чем в других методах, процедуры оценки (эксперт может пересматривать видео и менять свои оценки).

При любом тестовом методе на результаты субъективного тестирования может повлиять множество сторонних факторов. Необходимо, чтобы все эксперты были проинструктированы о способе прохождения тестирования, в помещении было обеспеченно достаточное освещение, тестирование не должно утомить экспертов. Несколько изменить результаты может все, что угодно, от пола экспертов до их профессий и времени проведения тестирования. Интересно, что по сравнению со всеми остальными факторами характеристики монитора (разрешение, LCD/CRT и т.д.) не оказывают значительного влияния на результаты (см. M.Pinson, S.Wolf, “The Impact of Monitor Resolution and Type on Subjective Video Quality Testing” NTIA TM-04-412). Обработка результатов

Основные результаты получаются после простого усреднения оценок по экспертам. Полученная оценка называется MOS (Mean Opinion Score). Также для оценки разброса мнений обычно приводится доверительный интервал (интервал, в котором с заданной вероятностью находится реальное среднее мнение). Существуют методики, позволяющие исключить экспертов, дающих нестабильные и сильно отличающиеся от средних результаты.Субъективное сравнение современных видеокодеков

В конце 2005 года нашей лабораторией было проведено субъективное тестирование видеокодеков. Задачами тестирования были субъективное сравнение новых версий популярных кодеков, сравнение результатов с данными объективных метрик и отработка технологии субъективного тестирования. В этой статье приведена лишь часть полученных результатов.

Разрешение видео: основные стандарты и характеристики

В наше время практически все любители просмотра фильмов, роликов или даже почитатели компьютерных игр сталкиваются с понятием «разрешение видео». Правда, не все четко себе представляют, что означает этот термин. Поэтому поговорим об этом несколько подробнее.

Что такое разрешение видео?

Некоторые ошибочно полагают, что такой термин означает фактический размер видео, умещающегося на экране. Отчасти, правда, это так и есть, хотя в большей степени разрешение видео применяется не только к обозначению размеров сторон кадра, выраженного в пикселях, но и к их суммарной совокупности, приходящейся на один кадр, и подразумевает качество изображения на экране.

Проще говоря, это количество точек, которое умещается в одном кадре. Вычисляется простым арифметическим действием — умножением высоты на ширину. Для удобства произведение в расчет не принимается, а в обозначении используется именно ширина и высота кадра, например, 1280 х 720 пикселей.

Типы разрешения видео

Сегодня различают несколько основных типов, на которые подразделяется разрешение видео: стандартное (SD – standard definition), высокое (HD – high definition) и ультравысокое (UHD – ultra high definition, обозначаемое еще и литерой «k»).

Естественно, любое качество имеет свои отличия. Рассмотрим все форматы разрешения видео по отдельности. Кроме того, обратим внимание на то, что в обозначениях применяются буквы «i» и «p». В первом случае это чересстрочная развертка, когда изображение состоит из двух других, накладываемых, как уже понятно, через строку. Второй вариант является более прогрессивным (кстати, и сокращение пошло от английского progressive). Здесь картинка является цельной.

Кроме того, в некоторых случаях можно встретить и промежуточные варианты с нестандартным соотношением сторон, а также фактическими размерами кадра. Но остановимся на самых основных (устаревший формат видео для мобильных телефонов как нижайший стандарт по понятным причинам рассматриваться не будет).

Стандартное разрешение

Стандартная четкость является самым низким разрешением и, как правило, обозначается сокращением 480i и 480p, а более высокое – 576i или 576p.

В первом случае мы имеем разрешение видео для варианта «i» на уровне 640 х 240 пикселей, для обозначения «p» — 640 х 480 пикселей.

Для второго стандарта фактическое разрешение видео составляет 720 х 288 и 720 х 576 пикселей соответственно. Но в обоих случаях соотношение сторон равняется 4:3.

Видео высокого разрешения

Что касается этого стандарта, он уже давно является одним из самых распространенных. Разрешение HD-видео тоже имеет свое обозначение. Здесь уже по сравнению со стандартным размером картинки соотношение сторон составляет 16:9, то есть видео растягивается по всему экрану, скажем, телевизионной панели или монитора для комфортного просмотра.

Что касается качества, здесь имеется два типа: HD и Full HD. Для стандарта HD разрешение картинки составляет 1280 х 720 пикселей (обозначается как 720p), а Full HD характеризуется разрешением изображения на уровне 1920 х 540 точек (1080i) или 1920 х 1080 пикселей (1080p).

Ультравысокое разрешение

Самая высокая четкость как один из стандартов разрешения видео появилась относительно недавно. Надо сказать, что и не все модели телевизионных панелей старого поколения поддерживают такое качество, хотя развитие техники на месте не стоит, и уже появились смартфоны и планшеты, способные воспроизводить видео нового стандарта качества.

Что касается основных характеристик, параметры соотношения сторон составляют 16:9 (так же, как в случае HD или Full HD), а вот разрешение заслуживает отдельного внимания.

Для четкости, обозначаемой 4k UHD (2160p), фактические размеры составляют 3840 х 2160 точек, а для стандарта 8k UHD (4320p) – 7680 х 4320 пикселей.

Сравнительный итог

Как уже понятно, разрешение видео любого из типов напрямую влияет на качество отображаемой на экране картинки. Наверное, не нужно говорить, что, чем оно выше, тем четче и естественнее выглядит не только сама картинка, но и все цветовые оттенки гаммы.

Правда, при сравнении стандартов нужно еще учитывать немаловажные параметры: глубину цвета (битность) и применяемую частоту кадров в секунду. Ведь многие, наверняка, встречали обозначения типа 60 fps. В данном случае это есть сокращенное обозначение параметра, образованное от английского frames per second.

Равно как разрешение, это значение во многом существенно влияет на качество. При более высокой частоте раскадровки, например, динамичные сцены проходят без задержек на аппаратном уровне, а переходы между кадрами незаметны благодаря плавности.

К сожалению, сегодня на рынке можно встретить не так много техники, которая поддерживает самый высокий стандарт, да и стоит она, увы, достаточно дорого. Пока еще в основном спросом пользуются модели со стандартом Full HD. Однако что-то уходит в прошлое, что-то появляется на смену устаревающим стандартам. Так что со временем можно ожидать, что и на 8k технологии не остановятся. Соответственно, это повлечет за собой снижение цен на технику, ориентированную на работу с ультравысоким разрешением видео.

Ссылка на основную публикацию
ВсеИнструменты 220 Вольт
Adblock
detector
×
×