Кодек h 264 что это?

Разбираемся с форматами и кодеками видео

Содержание

Содержание

Современные медийные платформы позволяют пользователям наслаждаться высокодетализированным видео и потрясающими аудиоэффектами в режиме онлайн.

Однако создание подобного контента было бы невозможно без существования кодеков и контейнеров.

Чем кодеки отличаются от контейнера — их часто путают

Для ответа на вопрос, чем кодеки отличаются от контейнеров, необходимо понять, что такое кодеки.

Смысл понятия «кодек» лежит прямо в его названии:

  • «ко» — компрессор,
  • «дек» — декомпрессор.

Фактически кодек — это цифровой инструмент компрессии и декомпрессии данных. Компрессия (сжатие данных) необходима для экономии занимаемого файлом места. Например, несжатое видео высокой четкости в raw-формате, при 60 кадрах в секунду способно достигать размеров в полтерабайта на каждый час записи.

Восьмиканальная аудиодорожка в 24-битном разрешении будет занимать 16 мегабит за одну секунду записи. Такие объемы данных не подходят ни для штатного хранения, ни для их передачи онлайн, поэтому для их сжатия применяются специальные формулы, которые и называются кодеками.

Для хранения сжатой информации создаются контейнеры-обертки в определенном формате. Современные контейнеры способны хранить информацию, обработанную разными кодеками. Такие обертки указывают устройству на то, какими кодеками была сжата информация, и по какой формуле ее восстанавливать.

Если разобрать стандартное видео со звуком на кодеки и контейнеры, в результате получится три составные части:

  • Видеокодек, отвечающий за степень сжатия и потери качества в процессе.
  • Аудиокодек, отвечает за хранение звуковой дорожки.
  • Контейнер-обертка, хранилище обоих кодеков и дополнительной метаинформации.

В случае если в видео нет звука, аудиокодек не нужен.

Популярные и прогрессивные кодеки

Большинство создаваемого видеоконтента обрабатывается кодеками XviD, MPEG-12, H.264, MPEG-4, DivX, WMV, MJPEG, RealVideo, Bink Video и их вариациями. Для аудиоформатов в основном используют AAC, Opus и MP3-кодеки. Из новинок стоит отметить кодек H.266/VVC, разрабатываемый для потоковой передачи видео в 4K и 8K.

Новый кодек позволяет вдвое сократить объем файла относительно H.265 кодека за счет более сложных алгоритмов. Сложные вычисления потребляют больше ресурсов, до 1000 % от потребления H.265 при кодировании, и до 200% при декодировании.

Какие кодеки в основном поддерживаются современными ТВ и обновляются ли они с прошивкой

Современные системы поддерживают большинство существующих кодеков.

Поддержка кодеков MPEG от первого до четвертого, вариации H.264 для воспроизведения Blu-Ray, а также XviD и DivX, входят в базовый пакет любого современного телевизора.

Ведущие производители всегда следят за ошибками и актуальностью своего программного обеспечения.

Обновление кодеков в процессе прошивки регулируется разработчиками индивидуально под каждую модель SmartTV.

Если новые кодеки необходимы, поддерживаются устройством на аппаратном уровне и не вызывают ошибок отображения, ничего не мешает разработчикам добавить их в ближайших обновлениях.

Не все устройства совместимы с новыми кодеками, поэтому установка неофициальных обновлений прошивки не рекомендуется потому как может привести к ошибкам воспроизведения.

Какие кодеки используются при проигрывании онлайн-видео (современные кодеки youtube)

В настоящее время стандартом большинства видеосервисов стали кодеки H.264 и MPEG-4, значительно реже встречаются кодеки FFDshow, XviD и DivX.

Одним из самых перспективных кодеков является бесплатный AV1-кодек. Разработан сообществом AOMedia, включающим в себя таких гигантов как AMD, Google, Netflix, Mozilla, Nvidia, Intel, ARM и Cisco. Исходный код кодека открыт и свободно распространяется без каких-либо лицензионных отчислений.

Что даст конечному пользователю переход ютуба на современный AV1

Кодек AV1 разрабатывался для воспроизведения видео онлайн, в браузерах Safari, Firefox, Edge и Chrome. Степень сжатия видео кодеком AV1 превосходит кодеки VP8 и H.264 от 30% до 50%, а кодек HEVC до 30–43 % на высоких битрейтах.

Полный переход видео платформы YouTube на AV1-кодек не только ускорит загрузку всех видеороликов от 20% до 50%, но и позволит стримить в разрешении 4K.

Для минимизации потерь качества, при сохранении и конвертации файла рекомендуется использовать кодеки AV1 для видео и Opus для аудио, обернутые в MP4-контейнер.

H.264, чем открыть?

«У меня имеется система видеонаблюдения, и я хочу просмотреть свои прошлые записи. Видеофайлы загружаются в формате .h264, я пробовал открывать их с помощью VLC Player, но проиграть файлы не удалось».

Эти и другие вопросы, связанные с файлами формата .h264, сегодня встречаются достаточно часто. Связано это с тем, что стандарт H.264 завоевал большую популярность, как в любительском, так и в профессиональном цифровом видео.

Что такое файл стандарта H.264?

Говоря простым языком, файл H.264 (MPEG-4 AVC) – это видеофайл, закодированный в лицензируемом стандарте сжатия видео H.264, обеспечивающем высокий уровень компрессии (низкий битрейт) при отличном качестве получаемого изображения.

Справка! Битрейт – количество бит (единиц информации), передающихся за единицу времени. Для фильмов стандарта Full HD (1080 p) битрейт видеофайла составляет около 10 Мбит/сек.

Из-за высокого уровня компрессии и других своих достоинств кодек H.264 заменил собой предыдущий кодек MPEG-4 ASP и широко применяется в видеокамерах AVCHD, на дисках Blu-ray и HD DVD, на ТВ HDTV и т.д.

Преимущества H.264 AVC:

  • аудио в кодеке может быть сжато отдельно и захвачено вместе с видео потоком H.264;
  • обратно совместим со старыми стандартами сжатия, к примеру H.263/H.261 и т.д.;
  • уменьшает размер цифрового видеофайла примерно на 50%;
  • открыт для лицензирования для всех поставщиков;
  • является стандартом взаимодействия между различными устройствами;
  • позволяет передавать видео с камер высокого разрешения (high definition) через Интернет.

Чем открыть файл формата .h264 в ОС Windows?

Существует множество медиаплееров в ОС Windows, проигрывающих файлы формата h.264.

Некоторые лучшие из них:

  • VLC Media Player;
  • KMPlayer;
  • BSPlayer;
  • Light Alloy;
  • GOM Player;
  • Media Player Classic.

Воспроизведение файлов H.264 с помощью медиаплеера VLC

Узнайте о проверенных способах конвертирования видео, из нашей новой статьи — «Как переформатировать видео».

К примеру, у пользователя имеется отснятый материал с камер видеонаблюдения или бытовой видеокамеры в формате .h264 и ему требуется воспроизвести отснятое видео в ОС Windows.

Шаг 1. Открыть интернет-браузер, перейти по ссылке: http://www.videolan.org/vlc/index.html и нажать «Download VLC» («Скачать») для загрузки последней версии VLC плеера.

Примечание! Скачанный файл можно найти в «Настройках» браузера, перейдя в его «Загрузки».

Шаг 2. Запустить скачанный файл.

Шаг 3. Выбрать язык и нажать «OK».

Шаг 4. Трижды нажать «Далее».

Шаг 5. Нажать «Установить».

Шаг 6. После установки программного обеспечения нажать «Готово».

Шаг 7. После запуска программы нажать «Инструменты» и щелкнуть «Настройки».

Шаг 8. Раскрыть слева щелчками мыши пункт «Ввод/кодеки» и выбрать «Демультиплексоры».

Шаг 9. Выбрать справа в выпадающем списке «Модуль демультиплексора» вариант «Демультиплексор H264» и нажать «Сохранить».

Теперь можно открывать и просматривать файлы H.264 в медиаплеере VLC. Для этого необходимо:

Шаг 1. Нажать «Медиа» и щелкнуть «Открыть файл…».

Шаг 2. Выбрать в раскрывающемся списке «все файлы», щелкнуть мышью в окне на нужном файле и нажать «Открыть».

Также можно просто перетащить нужный файл из папки Windows в окно медиаплеера для открытия файла.

Видео откроется в окне видеоплеера.

После просмотра видео можно вернуть автоматический выбор демультиплексора.

Совет! При проблемах воспроизведения видео с кодеками H.264 также можно попробовать переименовать расширение файла .h264 в файл .mpg и попробовать воспроизвести его.

Установка медиа декодера ffdshow

Если файл не проигрывается, в операционную систему можно установить универсальный медиа декодер ffdshow.

Шаг 1. Перейти по адресу: http://ffdshow-tryout.sourceforge.net/download.php и нажать на ссылку с 32- или 64-bit ОС, в зависимости от установленной у пользователя версии Windows.

Шаг 2. Запустить скачанный файл из папки «Загрузки» или из другой папки, в которую сохранили при скачивании.

Шаг 3. Нажать «OK».

Шаг 4. Шесть раз нажать «Далее».

Шаг 5. Нажать «Установить».

Шаг 6. Снять галочки с пунктов настройки декодера и нажать «Завершить».

Читайте также  Где в телефоне ключ безопасности сети?

После установки медиа декодера он сможет проигрывать видеопоток H.264 в любом DirectShow-совместимом медиаплеере автоматически.

Видео — Как открыть формат H.264?

Понравилась статья?
Сохраните, чтобы не потерять!

Что такое H.264, H.264+, H.265, H.265+ ?

Видеонаблюдение – это одна из наиболее конкурентных сфер на мировом рынке. И это не удивительно, ведь на каждом объекте, вне зависимости от того, это офис, квартира, частный дом, склад, производство и т.д., необходимо обезопасить собственное имущество. Именно эта конкуренция поспособствовала тому, что среди производителей началась гонка по созданию инновационных решений для качественной съемки и стандартной для сжатия готового материала.

Важно было достигнуть того, чтобы было эффективное сжатие видео или фото для экономии места на жестком диске или карте памяти без потери качества. И еще в далеком 2003 году был предоставлен первый стандарт Н.264, который и сегодня используется во многих камерах наблюдения и прочем цифровом оборудовании. Разберемся с вами, что такое H.264, H.264+, H.265, H.265+ и в чем преимущество последних разработок.

Стандарты кодирования H.264 и H.264+

Этот стандарт способен обеспечить запись потока из камеры видеонаблюдения в формате HD со скоростью порядка 7-8 мегабайт за секунду. Буквально через несколько лет на смену Н.264 пришел Н.264+ стандарт, который способен проводить запись и съемку в том же формате, но скорость потока значительно выше – от 12 до 20 мегабайт за секунду.

Именно благодаря созданию этих форматов, удалось достигнуть развития цифровых камер, которые сегодня просто поражают своим уровнем качества. Когда появились камеры видеонаблюдения на 2, 3, 4 мегапикселя и т.д., появилась необходимость увеличить уровень производительности сжатия, чтобы гарантировать передачу сигнала в высоком качестве без увеличения пропускной способности канала. В связи с этим технология была снабжена рядом интеллектуальных алгоритмов, которые дали возможность значительно снизить размер – до 75%.

Новый формат, несмотря на похожее название, только с приставкой «+», получил некоторые изменения, которые еще больше повысили эффективность работу оборудования:

  • появился фоновый инструмент, предназначенный для подавления любых шумов во время работы;
  • технология интеллектуального кодирования работала по модели предсказания фона;
  • появилась система управления битрейтом и регулировки.

Но, несмотря на столь прекрасные возможности, появился новый кодек — H.265 и H.265+.

Стандарты кодирования H.265 и H.265+

Именно с момента появления H.265 и H.265+ начался новый этап развития кодека для сжатия видео, который стал на 50% более эффективным, чем формат Н.264. Новая технология смогла получить название HEVC, что в переводе и демонстрирует все основные возможности – сжатие видео с высокой эффективностью.

Благодаря использованию формата H.265, удалось значительно снизить уровень нагрузки на каналы связи, этим самым дает возможность установить более современную камеру в существующей архитектуре наблюдения. Чтобы добиться идеальных результатов, был разработан обновленный H.265+, который вобрал в себя доработанный алгоритм от инженеров компании Hikvision, что увеличило уровень производительности на 67%. Это передовой видеокодек, а специалисты его считают первооткрывателем эры 4К в камерах видеонаблюдения. Теперь высококачественное видео «весит» столько же, сколько раньше стандартное видео HD. Стандарт H.265+ гарантирует следующие преимущества:

  • фокусируется на движущемся объекте;
  • обрабатывает статичный фон для максимального уменьшения;
  • обработке поддается только то время, когда в кадре наблюдается движение;
  • максимально подавляет цифровой зум.

Как видите, стандарт H.265 и H.265+ — это просто настоящая находка для разработчиков цифровых технологий. Остановимся подробней на возможностях H.265+.

Уникальные возможности стандарта кодирования H.265+

Интеллектуальное кодирование

Во время работы кодек разделяет фон и посетителей. Создается модель из одного или нескольких ранее созданных кадров, что позволяет проводить своего рода «прогнозирование», где блоки обработки предсказываются информацией из ранее переданных блоков и того же кадра. Таким образом, сжатие потока осуществляется благодаря проведению трансляции исключительно динамической части кадра. Учитывая то, что большая часть объектов в системах наблюдения обладает статичным фоном, подобная доработка пошла вперед, сравнивая с H.265 и более ранними моделями.

Подавляется цифровой шум

Интегрированная интеллектуальная система анализа способствует тому, что кодек H.265+ научился различать движущиеся объекты и фоновые изображения таким образом, что каждый из них может быть закодирован под разной стратегией кодирования. Если фон сжимается под высоким уровнем сжатия для подавления шума, то модуль кодируется также визуальный шум в сцене. Это привело к тому, что удается достигать высокого уровня качества, несмотря на небольшой вес видеопотока.

Битрейт под долгосрочным контролем

Производитель не остановился на достигнутом уровне и ввел долгосрочный средний битрейт, чтобы максимально использовать возможность пропускного канала. Он рассчитывает ставку на протяжении определенного времени – обычно это сутки. При средней скорости передачи данных, камера автоматических назначает высокую скорость передачи во время активности посетителей, либо снижает, если начинается время простоя. Это значительно экономит ресурсы и повышает эффективность работы системы.

Немного реальных цифр

Чтобы обычному пользователю было понятно, почему H.265+ находится на пике популярности среди пользователей и других производителей, проведем тестирование форматов на основе камер с разрешением Full HD при записи 25 кадров в секунду. Если сравнить стандарты H.264 и H.265+, то средний битрейт уменьшили на 83%, а разница между стандартами H.265 и H.265+ — 67%.

Что касается размеров файла, то после суточного наблюдения, вес видеозаписи при стандарте сжатия H.264 составлял 22,7 гигабайт, при H.265 – 11,8 гигабайт, а при использовании инновационного H.265+ — всего 3,9 гигабайт, что показывает реальную экономию пространства.

Очевидно, что все стандарты сжатия H.264, H.264+, H.265, H.265+ являются просто незаменимым элементом современной системы видеонаблюдения. Наш интернет-магазин предлагает купить камеры наблюдения и регистраторы, которые поддерживают все стандарты сжатия, и вы сможете подобрать идеальное решение для себя. В каталоге только сертифицированная продукция известных брендов, которая оставит у вас исключительно положительные впечатления. Всегда поможем вам подобрать оптимальное решение, учитывая ваши цели, предпочтения и финансовые возможности. Доставку проводим по всей Украине.

Магия H.264

H.264 — стандарт сжатия видео. И он вездесущ, его используют для сжатия видео в интернете, на Blu-ray, телефонах, камерах наблюдения, дронах, везде. Все сейчас используют H.264.

Нельзя не отметить технологичность H.264. Он появился в результате 30-ти с лишним лет работы с одной единственной целью: уменьшение необходимой пропускной способности канала для передачи качественного видео.

С технической точки зрения это очень интересно. В статье будут поверхностно описаны подробности работы некоторых механизмов сжатия, я постараюсь не наскучить с деталями. К тому же, стоит отметить, что большинство изложенных ниже технологий справедливы для сжатия видео в целом, а не только для H.264.

Видео в несжатом виде это последовательность двумерных массивов, содержащих информацию о пикселях каждого кадра. Таким образом это трёхмерный (2 пространственных измерения и 1 временной) массив байтов. Каждый пиксель кодируется тремя байтами — один для каждого из трёх основных цветов (красный, зелёный и синий).

1080p @ 60 Hz = 1920x1080x60x3 =>

370 Мб/с данных.

Этим практически невозможно было бы пользоваться. Blu-ray диск на 50Гб мог бы вмещать всего около 2 мин. видео. С копированием так же будет не легко. Даже у SSD возникнут проблемы с записью из памяти на диск.

Поэтому да, сжатие необходимо.

Обязательно отвечу на этот вопрос. Но сперва я покажу кое-что. Взгляните на главную страницу Apple:

Я сохранил изображение и приведу в пример 2 файла:

Эмм… что? Размеры файлов кажется перепутали.

Нет, с размерами всё в порядке. Видео H.264 с 300 кадрами весит 175 Кб. Один единственный кадр из видео в PNG — 1015 Кб.

Кажется, мы храним в 300 раз больше данных в видео, но получаем файл весом в 5 раз меньше. Получается H.264 эффективнее PNG в 1500 раз.

Как такое возможно, в чём заключается приём?

А приёмов очень много! H.264 использует все приёмы о которых вы догадываетесь (и уйму о которых нет). Давайте пройдёмся по основным.

Читайте также  Dts в телевизоре что это?

Избавляемся от лишнего веса.

Представьте, что вы готовите машину к гонкам и вам нужно её ускорить. Что вы сделаете в первую очередь? Вы избавитесь от лишнего веса. Допустим, машина весит одну тонну. Вы начинаете выбрасывать ненужные детали… Заднее кресло? Пфф… выбрасываем. Сабвуфер? Обойдёмся и без музыки. Кондиционер? Не нужен. Коробка передач? В мусо… стойте, она еще пригодится.

Таким образом вы избавитесь от всего, кроме необходимого.

Этот метод отбрасывания ненужных участков называется сжатием данных с потерями. H.264 кодирует с потерями, отбрасывая менее значимые части и сохраняя при этом важные.

PNG кодирует без потерь. Это означает, что вся информация сохраняется, пиксель в пиксель, и поэтому оригинал изображения можно воссоздать из файла, закодированного в PNG.

Важные части? Как алгоритм может определять их важность в кадре?

Существует несколько очевидных способов урезания изображения. Возможно, верхняя правая четверть картинки бесполезна, тогда можно удалить этот угол и мы уместимся в ¾ исходного веса. Теперь машина весит 750 кг. Либо можно вырезать кромку определенной ширины по всему периметру, важная информацию всегда ведь по середине. Да, возможно, но H.264 всего этого не делает.

Что же на самом деле делает H.264?

H.264, как и все алгоритмы сжатия с потерями, уменьшает детализацию. Ниже, сравнение изображений до и после избавления от деталей.

Видите как на сжатом изображении исчезли отверстия в решётке динамика у MacBook Pro? Если не приближать, то можно и не заметить. Изображение справа весит всего 7% от исходного и это при том, что сжатия в традиционном смысле не было. Представьте машину весом всего лишь 70 кг!

7%, ого! Как возможно так избавиться от детализации?

Для начала немного математики.

Информационная энтропия

Мы подходим к самому интересному! Если вы посещали теорию информатики, то возможно вспомните про понятие информационной энтропии. Информационная энтропия это количество единиц для представления некоторых данных. Заметьте, что это вовсе не размер самих данных. Это минимальное количество единиц, которое нужно использовать, чтобы представить все элементы данных.

Например, если в виде данных взять один бросок монеты, то энтропия получится 1 единица. Если же бросков монетки 2, то понадобятся 2 единицы.

Предположим, что монета весьма странная — её подбросили 10 раз и каждый раз выпадал орёл. Как бы вы кому нибудь рассказали об этом? Вряд ли как-то вроде ОООООООООО, вы бы сказали «10 бросков, все орлы» — бум! Вы только что сжали информацию! Легко. Я вас спас от многочасовой утомительной лекции. Это, конечно же, огромное упрощение, но вы преобразовали данные в некое короткое представление с той же информативностью. То есть уменьшили избыточность. Информационная энтропия данных не пострадала — вы только преобразовали представление. Такой способ называется энтропийным кодированием, который подходит для кодирования любого вида данных.

Частотное пространство

Теперь, когда мы разобрались с информационной энтропией, перейдем к преобразованию самих данных. Можно представить данные в фундаментальных системах. Например, если использовать двоичный код, будут 0 и 1. Если же использовать шестнадцатеричную систему, то алфавит будет состоять из 16 символов. Между вышеупомянутыми системами существует взаимно однозначная связь, поэтому можно легко преобразовывать одно в другое. Пока всё понятно? Идём дальше.

А представьте, что можно представить данные, которые изменяются в пространстве или времени, в совершенно иной системе координат. Например, яркость изображения, а вместо системы координат с x и y, возьмём частотную систему. Таким образом, на осях будут частоты freqX и freqY, такое представление называется частотным пространством[Frequency domain representation]. И существует теорема, что любые данные можно без потерь представить в такой системе при достаточно высоких freqX и freqY.

Хорошо, но что такое freqX и freqY?

freqX и freqY всего лишь другой базис в системе координат. Так же как можно перейти из двоичной системы в шестнадцатеричную, можно перейти из X-Y в freqX и freqY. Ниже изображён переход из одной системы в другую.

Мелкая решётка MacBook Pro содержит высокочастотную информацию и находится в области с высокими частотами. Таким образом мелкие детали имеют высокую частоту, а плавные изменения, такие как цвет и яркость низкую. Всё, что между, остаётся между.

В таком представлении, низкочастотные детали находятся ближе к центру изображения, а высокочастотные в углах.

Пока всё понятно, но зачем это нужно?

Потому что теперь, можно взять изображение, представленное в частотных интервалах, и обрезать углы, иными словами применить маску, понизив тем самым детальность. А если преобразовать изображение обратно в привычное, можно будет заметить, что оно осталось похожим на исходное, но с меньшей детализацией. В результате такой манипуляции, мы сэкономим место. Путём выбора нужной маски, можно контролировать детализацию изображения.

Ниже знакомый нам ноутбук, но теперь уже с, применёнными к ней, круговыми масками.

В процентах указана информационная энтропия относительно исходного изображения. Если не приближать, то разница не заметна и при 2%! — машина теперь весит 20 кг!

Именно таким образом нужно избавляться от веса. Такой процесс сжатия с потерями называется Квантованием.

Это впечатляет, какие еще приёмы существуют?

Цветовая обработка

Человеческий глаз не особо хорошо различает близкие оттенки цвета. Можно легко распознавать наименьшие различия в яркости, но не цвета. Поэтому должен существовать способ избавления от лишней информации о цвете и сэкономить ещё больше места.

В телевизорах, цвета RGB преобразуются в YCbCr, где Y это компонента яркости (по сути яркость черно-белого изображения), а Cb и Cr компоненты цвета. RGB и YCbCr эквиваленты в плане информационной энтропии.

Зачем же тогда усложнять? RGB разве не достаточно?

Во времена чёрно-белых телевизоров, была только компонента Y. А с началом появления цветных телевизоров у инженеров встала задача о передаче цветного RGB изображения вместе с чёрно-белым. Поэтому вместо двух каналов для передачи, было решено кодировать цвет в компоненты Cb и Cr и передавать их вместе с Y, а цветные телевизоры уже сами будут преобразовывать компоненты цвета и яркости в привычный им RGB.

Но вот в чём хитрость: компонента яркости кодируется в полном разрешении, а компоненты цвета лишь в четверть. И этим можно пренебречь, т.к. глаз/мозг плохо различает оттенки. Таким образом можно уменьшить размер изображения в половину и с минимальными отличиями. В 2 раза! Машина будет весить 10 кг!

Данная технология кодирования изображения со снижением цветового разрешения называется цветовой субдискретизацией. Она используется повсеместно уже давно и относится не только к H.264.

Это самые значительные технологии в уменьшении размера при сжатии с потерями. Нам удалось избавиться от большинства детализации и сократить информацию о цвете в 2 раза.

Да. Обрезание картинки это лишь первый шаг. До этого момента мы разбирали отдельно взятый кадр. Пришло время взглянуть на сжатии во времени, где нам предстоит работать с группой кадров.

Компенсация движения

H.264 стандарт, который позволяет компенсировать движения.

Представьте, что вы смотрите теннисный матч. Камера зафиксирована и снимает с определенного угла и единственное что движется это мячик. Как бы вы закодировали это? Вы бы сделали что и обычно, да? Трёхмерный массив пикселей, две координаты в пространстве и один кадр за раз, так?

Но зачем? Большая часть изображения одинакова. Поле, сетка, зрители не меняются, единственное что движется это мячик. Что если определить единственное изображение фона и одно изображение мячика, движущегося по нему. Не сэкономило бы это значительно места? Вы видите к чему я клоню, не так ли? Компенсация движения?

Читайте также  Как быстро ускорить работу компьютера?

И это именно то, что H.264 делает. H.264 разбивает изображение на макроблоки, обычно 16х16, которые используются для расчёта движения. Один кадр остаётся статичным, обычно его называют I-кадр [Intra frame], и содержит всё. Последующие кадры могут быть либо P-кадры [predicted], либо B-кадры [bi-directionally predicted]. В P-кадрах вектор движения кодируется для каждого макроблока на основе предыдущих кадров, таким образом декодер должен использовать предыдущие кадры, взяв последний из I-кадров видео и постепенно добавляя изменения последующих кадров пока не дойдёт до текущего.

Ещё интереснее обстоят дела с B-кадрами, в которых расчёт производится в обоих направлениях, на основании кадров идущих до и после них. Теперь вы понимаете почему видео в начале статьи весит так мало, это всего лишь 3 I-кадра, в которых мечутся макроблоки.

При такой технологии кодируется только различия векторов движения, тем самым обеспечивая высокую степень сжатия любого видео с перемещениями.

Мы рассмотрели статическое и временное сжатия. С помощью квантования мы во много раз уменьшили размер данных, затем с помощью цветовой субдискретизации ещё вдвое сократили полученное, а теперь еще компенсацией движения добились хранения лишь 3х кадров из 300, которые были первоначально в рассматриваемом видео.

Выглядит впечатляюще. Теперь что?

Теперь мы подведём черту, используя традиционное энтропийное кодирование без потерь. Почему нет?

Энтропийное кодирование

После этапов сжатия с потерями, I-кадры содержат избыточные данные. В векторах движения каждого из макроблоков в P-кадрах и B-кадрах много одинаковой информации, так как зачастую они двигаются идентично, как это можно наблюдать в начальном видео.

От такой избыточности можно избавиться энтропийным кодированием. И можно не переживать за сами данные, так как это стандартная технология сжатия без потерь, а значит всё можно восстановить.

Вот теперь всё! В основе H.264 лежат вышеупомянутые технологии. В этом и заключаются приёмы стандарта.

Отлично! Но меня разбирает любопытство узнать, сколько же весит теперь наша машина.

Исходное видео было снято в нестандартном разрешении 1232×1154. Если посчитать, то получится:

5 сек. @ 60 fps = 1232x1154x60x3x5 => 1.2 Гб
Сжатое видео => 175 Кб

Если соотнести результат с оговорённой массой машины в одну тонну, то получится вес равный 0.14 кг. 140 граммов!

Да, это магия!

Конечно же я в очень упрощённом виде изложил результат десятилетних исследований в этой сфере. Если захотите узнать больше, то страница в википедии вполне познавательна.

Видеокодеки H.264, H.265 и H.265+. Плюсы и минусы

Видеокодеки H.264, H.265 и H.265+. Плюсы и минусы

Первые версии кодеков видеосжатия H.264 появились еще в 2013 году. Сегодня формат Н.265 уверенно вошел на рынок видеонаблюдения и диктует свои условия. Многие производители выпускают оборудование с поддержкой видеосжатия данного формата.

Формат сжатия H.264, в отличие от предыдущих кодеков MJPEG и MPEG-4 позволяет с высокой эффективностью решить задачу передачи большого количества видеопотоков высокого разрешения.

Использование в системах IP-видеонаблюдения формата H.264 обеспечивает высокое качество изображения при меньшем объеме данных, требует меньшую пропускную способность сети и меньший объем жестких дисков для хранения видеоархива. Однако есть и жирный минус. Использование Н.264 приводит к высоким нагрузкам на вычислительное оборудование.

Для того, чтобы увеличить экономичность использования вычислительных ресурсов, разработчики применяют различные методы. Например, перенос части операций на видеокарту. Благодаря этому видеокарта способна брать на себя выполнение части вычислений по декодированию. Применение этой функции обеспечилоснижение загрузки процессора до двух раз, и возможность использования процессоров меньшей мощности, а значит, и стоимости.

Перенос операций декодирования на видеокарту также позволяет сэкономить не только на серверной, но и на клиентской части системы видеонаблюдения. Для того, чтобы воспользоваться этой функцией, в настройках клиентской части программного обеспечения необходимо указать, где производить обработку – на центральном процессоре или на видеокарте.

Для снижения нагрузки на вычислительное оборудование также применяется технология видеоанализа сжатых видеопотоков от IP-камер без их полного декодирования. Применение этой технологии приводит к увеличению скорости обработки данных, за счет чего загрузка на центральный процессор снижается. Причем снижение может достигать в среднем в 4 раза.

Благодаря этому появляется возможность подключить к одному серверу в 4 раза больше видеокамер. Еще один вариант экономии — это использование менее мощных, а значит, и более бюджетных процессоров, и снижение стоимости серверного оборудования.

Еще один минус кодека H.264 заключается в том, что большинство мобильных и web-клиентов для систем видеонаблюдения не поддерживают данный формат, и для того, чтобы получить видеоизображение, требуется процедура перекодирования видеопотока в MJPEG. Такая операция очень ресурсоемка и приводит к дополнительным нагрузкам на вычислительные ресурсы.

Обработка формата H.264 возможна при достаточно мощных вычислительных ресурсах мобильного устройства. Если ресурсов не хватает, видеопоток автоматически переключается в формат MJPEG. Да и сам пользователь может самостоятельно выбирать формат видеопотока.

Как видим плюсов и минусов у кодека H.264, применяемого для видеонаблюдения, достаточно много. Однако большая нагрузка на вычислительные ресурсы зачастую сводит все плюсы на нет.

Еще большую нагрузку несет новый формат Н.265. Он использует в своей работе более сильные и совершенные алгоритмы сжатия видео. При одинаковом визуальном качестве новый кодек Н.265 предполагает примерно двукратное уменьшение размера файла по сравнению с его предшественником Н.264. Это серьезно экономит место на дисковом пространстве регистраторов и видеосерверов. А вдвое меньший битрейт уменьшает трафик в сетях передачи видеоданных.

Благодаря более мощным механизмам компрессии, кодек Н.265 отлично справляется с кодированием видео высокого и высочайшего разрешения более 8K UHD (8192×4320). Причем для качественного воспроизведения видеоинформации разрешением 4К кодека необходим поток со скоростью всего 50 МВ/с.

Что немаловажно, Н.265 сжимает видео практически без потерь, качество сжатого видео остается на высоком уровне. Специальные алгоритмы компрессии устраняют присущие Н.264 артефакты, такие как зернистость или размытые края движущихся объектов.

Но самое главное преимущество кодека Н.265 заключается в том, что объем видео, обработанного по новому стандарту, оказался почти на 85% меньше, чем при использовании Н.264. Однако кодеку Н.265 требуется более мощные по производительности элементы и процессоры в оборудовании.

Двигаясь в направлении увеличесния сжатия видеоданных на рынке не так давно появился кодек H.265 + Он позволяет уменьшить битрейт с видеокамер, что в свою очередь снижает стоимость внедрения и использовать меньше дисковых массивов для хранения видеоархива.

H.265+ улучшает степень сжатия за счет трех ключевых технологий: технологии кодирования с предсказанием, технологии подавления фонового шума и технологии долгосрочного управления видеопотоком.

Как известно, камеры видеонаблюдения умеют различать моменты, когда на выделенном участке наблюдения ничего не происходит и в это время снижают качество, чтобы уменьшить нагрузку на сеть и место на жестком диске. Это может делать кодек Н.265, значения при этом все равно держатся около установленного максимума, в то время как Н.265+ может снизить его вдвое. Такая функция называется управление длительным битрейтом.

Н.265+ может также определять на видео движущиеся объекты и отделять их от фона. В то время, как эти объекты передаются в максимально хорошем качестве, на сжатие повторяющегося фона уходит меньше ресурсов. Что также является большим плюсом и снижает нагрузку на вычислительные ресурсы.

В этой статье мы не стремились рассказать подробно о всех современных видеокодеках, используемых в видеонаблюдении. Наша цель заключалась в том, чтобы показать различия форматов сжатия, а также плюсы и минусы каждого из них.