IP-видео CCTV и Н.264

ЧТО ЖЕ ТАКОЕ Н.264?

Н.264 — это стандарт видеокодека (кодера или декодера). Видеокодек предназначен для сжатия и распаковки цифрового видео с целью уменьшения полосы пропускания, требуемой для передачи и хранения видео. Это необходимо,^поскольку исходный поток данных несжатого активного цифрового видео CCIR601 (720 х 480 пикселей 4:2:2 видео при 30 кадрах в секунду) больше 158 Мбит/с, что в 300 раз превышает пропускную способность ADSL интернет-соединения со скоростью 512 кбит/с и позволяет хранить чуть более одного часа видео на жестком диске емкостью 80 Гб. Просто приведение видео к разрешению SIF (352 х 240 пикселей 4:2:0 видео при 30 кадрах в секунду) и сжатие с помощью стандартных средств, таких как WinZip и gzip, обеспечивает сжатие до 10:1. Однако для потоковой передачи видео в режиме реального времени через ADSL-соединение и хранения 300 часов видео на жестком диске емкостью 80 Гб требуется сжатие до минимум 300:1. Такой уровень сжатия может быть достигнут с помощью стандарта Н.264.

РЕАЛИЗАЦИЯ СТАНДАРТА

Прежде чем приступить к подробному рассмотрению стандарта Н.264, необходимо понять разницу между сравнением стандарта и реализацией стандарта. Эти понятия весьма различаются. Таким образом, когда говорят: «Н.264 обеспечивает лучшее качество видео, чем MPEG-2», — это не совсем соответствует действительности. Н.264 является стандартом сжатия видео. Стандарт Н.264 определяет синтаксис соответствующего цифрового потока, которому должен точно отвечать декодер, реализующий весь необходимый инструментарий, определенный стандартом для декодирования цифрового потока.

Кодер Н.264, наоборот, может реализовывать лишь подгруппу синтаксиса, определенную стандартом, обеспечивая создание соответствующего цифрового потока. Различные виды ‘ реализации и алгоритмы кодера также не определяются стандартом и создаются разработчиком. Собственно, кодеры Н.264 от различных поставщиков будут создавать потоки различного качества для одной и той же скорости передачи данных. Поэтому гораздо уместнее говорить: «Стандарт Н.264 предоставляет более широкий синтаксис и инструментарий, чем MPEG-2, и поэтому дает возможность реализовать лучший видеокодер, который может создавать более качественное видео для той же скорости передачи данных и то же качество видео при меньшей скорости передачи данных».

Это можно продемонстрировать с помощью справочного программного кодера (JM11), доступного бесплатно в Международной организации стандартизации (ISO). Справочный Н.264 кодер позволяет пользователю выбрать используемый инструментарий, чтобы перекодировать конкретную видеопоследовательность. В приведенной ниже таблице продемонстрирован результат кодирования одной и той же видеопоследовательности с использованием различных инструментов справочного кодера Н.264. Каждый цифровой поток на выходе каждого теста является полностью соответствующим цифровым потоком Н.264, и каждый цифровой поток эквивалентного качества видео.

Реализация алгоритма	Размер потока данных	Общее время выполнения кодирования (относительная)
Кодирование только 1-кадров	2279	1
I и Р-кадры, но без оценки движения (0 диапазон поиска)	1055	1.5
I и Р-кадры с +/- 16 поиска при помощи упрощенного алгоритма поиска	453	14
I и Р-кадры с использованием полного алгоритма поиска с компенсацией движения	421	56

Данная таблица демонстрирует, что чем больше количество используемых инструментов и алгоритмов, тем больше сжатие для того же качества видео. Однако также очевидно, что дополнение инструментов осуществляется за счет увеличившейся сложности, которая в данном случае измеряется временем выполнения кодирования. Именно это увеличение сложности часто приводит к тому, что некоторые инструменты или алгоритмы в конфигурации Н.264 кодера не используются.

ВЗАИМООТНОШЕНИЯ С MPEG-4 ЧАСТЬ 2

MPEG-4 (ISO/IEC 14496) представляет собой совокупность стандартов, определяющих кодирование аудиовизуальных объектов. Данная совокупность разделена на ряд частей, описывающих стандарты сжатия видео и аудио, а также частей системного уровня, описывающих свойства, такие как формат файла MPEG-4. Стандарт сжатия видео, присущий многим сегодняшним изделиям, представляет собой стандарт MPEG-4 Часть 2 (ISO/IEC 14496-2). Стандарт сжатия видео Н.264 был внедрен в MPEG-4 в качестве MPEG-4 Часть 10 (IS0/IEC 14496-10). Это означает, что в настоящее время MPEG-4 содержит два стандарта сжатия видео. Однако эти два стандарта сжатия видео неинтероперабельны, поскольку каждый из стандартов использует различные методы сжатия и представления данных, например, MPEG-4 Часть 10 (Н.264) не может декодировать цифровой поток MPEG-4 Часть 2, и наоборот.

IP-ВИДЕО И Н.264

Понять преимущества стандарта Н.264 в системах IP-видео можно на примерах его фактической реализации. Так на рынке представлен передатчик (кодер), в котором видеокадры захватываются с камеры и направляются во внутренний Н.264 кодер для сжатия. Затем каждый видеокадр сжимается одним из двух способов: в качестве I-кадра или Р-кадра. I-кадр представляет собой видеокадр, который был перекодирован без ссылки на какой-либо иной кадр видеозаписи. Видеопоток или запись всегда начинаются с I-кадра и, как правило, содержат обычные I-кадры во всем потоке. Такие регулярные I-кадры, также называемые внутренними кадрами (intra frames), основными кадрами (key frames) или точками доступа (access points), являются ключевыми для произвольного доступа записанных Н.264 файлов, такого как операции перемотки или поиска во время воспроизведения. Регулярность таких I-кадров известна как «интервал I-кадров»; однако недостатком I-кадров является то, что они гораздо крупнее Р-кадров.

Р-кадры представляют собой кадры с компенсацией сдвига, другими словами, кодер использует разницу между обрабатываемым в настоящее время кадром и предыдущим кадром видео, проверяя, что информация не менялась, например, статичный задний план не передается постоянно. В отличие от кодеков, основанных исключительно на различиях, таких как дельта-MJPEG, Н.264 ищет не только различия, но также происходящее на видео движение. Это означает, что кодеки с компенсацией движения, как правило, будут демонстрировать лучшую работу, чем простые кодеки, основанные на поиске различий. Процесс поиска движения известен как «предсказание движения».

Оценивающий движение элемент является одной из наиболее затратных в вычислительном отношении частей и наиважнейшей для работы кодера Н.264. Предсказание движения является сложной процедурой, и часто кодеры, особенно программные real-time и кодеры на базе DSP, будут использовать уменьшенные площади поиска или ограниченный алгоритм поиска для обеспечения работы в реальном времени. Однако часто это может приводить к низкому качеству видео и значительно ограниченному сжатию.

По сравнению с MPEG-4 стандарт Н.264 может обеспечить экономию трафика от 20% до 25% в обычных условиях и свыше 50% в период, когда сцена не активна — т. е. когда в кадре нет движения. Это не только снижает общие требования к полосе пропускания для 1Р-видеосис-темы, но, что более важно, может значительно сократить объем хранилища, требуемого для записи видео, и который часто является одним из наиболее дорогих элементов системы.

ТРЕБОВАНИЯ К АППАРАТНОМУ ОБЕСПЕЧЕНИЮ

Как видно из способов реализации Н.264, требования к обрабатывающей способности кодека значительны, если используется полный диапазон свойств и должны реализовываться все преимущества технологии. Стандарт Н.264 является стандартом сжатия видео общего назначения, который не разрабатывался непосредственно для приложений CCTV. Однако с использованием специально разработанных кодеров на базе чипов FPGA может быть обеспечена необходимая мощность обработки, и разработка может быть приспособлена к приложениям CCTV. Например, дополнительное сжатие может достигаться при низкой активности видео — ситуация, типичная для многих приложений охранного видеонаблюдения. Использование специализированных аппаратных кодеров на базе FPGA имеет ряд дополнительных преимуществ:

-Высококачественное видео может обрабатываться при быстром движении в поле зрения камеры без потери кадров, независимо от скорости передачи данных и движения. Это является наиважнейшим требованием для таких приложений, как системы наблюдения за столами в казино.

-Низкая стоимость, высокая производительность кодирования видео с разрешением 4SIF при 30 кадрах в секунду, которое полностью соответствует стандарту Н.264.

-Возможность обновления уже установленных систем для использования новых стандартов сжатия.

-Аналитика в реальном времени, которая может работать на высокопроизводительном аппаратном обеспечении раньше, чем на программном обеспечении. Работа аналитики на периферии сети, т. е. камерой, что обеспечивает по-настоящему масштабируемое решение.

РЕЗЮМЕ

Стандарт Н.264 предоставляет значительные выгоды пользователю и разработчику системы. Однако дополнительная сложность реализации приводит к дополнительным издержкам. Таким образом, стандарт Н.264 не сразу заменит MPEG-4, но будет существовать параллельно, предоставляя конечному пользователю более широкий выбор решений. Даже, несмотря на то, что стандарты сжатия MPEG-4 и Н.264 несовместимы, IP-сети позволяют обеим системам сосуществовать, и MPEG основы могут бит за битом быть усовершенствованы с помощью продуктов на основе Н.264.

SIF ИЛИ CIF? ЧТО ПРАВИЛЬНО?

И то и другое, но первое означает, что у вас MPEG-4, а второе — что вы используете старое сжатие на основе Н.261/Н.263. Которое из них?

CIF и SIF являются видами измерения разрешения видео. Проще говоря, разрешение CIF означает 352 х 288 пикселей, независимо от системы входящего сигнала видео, NTSC или PAL. Разрешение SIF, с другой стороны, определяет 352 х 288 пикселей для камер системы PAL и разрешение в 352 х 240 для камер системы NTSC. В других источниках встречается разрешение 320 х 240, также являющееся действительным разрешением SIF. Хотя это и не следует из чисел, в действительности CIF не имеет преимущества перед SIF. Разрешение CIF, как правило, ассоциируется с Н.261 /Н.263, a SIF — с MPEG. К сожалению, по причине фонетического сходства и идентичности для источников PAL эти термины иногда используются равнозначно несмотря на то, что, строго говоря, они различаются. Таким образом, иногда, когда говорят CIF, в действительности имеется в виду SIF. Итак, если ваша система — CIF (2CIF или 4CIF), вы используете старый кодек, основанный на Н.261/263; система не будет совместима с MPEG-4 или Н.264. Все системы MPEG-4 и Н.264 основаны на SIF. Поэтому если есть потребность в действительном MPEG-4, Часть 2 или Часть 10, написание должно начинаться с буквы S!

Автор: Майк СМАРТ,
руководитель отдела по разработке кодеков компании Indigo Vision

IP-видео CCTV и Н.264

Вам может также понравиться...

Контакты

IP-видео CCTV и Н.264

Вам может также понравиться...

Как транслировать IP-камеру на YouTube с помощью функции RTMP (метод 2023 г.)

Одномодовый (SM) и многомодовый (MM) оптический кабель

Нормативные требования к лестницам

Контакты