Главная Случайная страница


Категории:

ДомЗдоровьеЗоологияИнформатикаИскусствоИскусствоКомпьютерыКулинарияМаркетингМатематикаМедицинаМенеджментОбразованиеПедагогикаПитомцыПрограммированиеПроизводствоПромышленностьПсихологияРазноеРелигияСоциологияСпортСтатистикаТранспортФизикаФилософияФинансыХимияХоббиЭкологияЭкономикаЭлектроника






Сжатие с неестественными потерями качества

Низкое качество сжатия, в значительной степени искажающее изображение и вносящее в него искусственные (не существующие в оригинале) детали сцены, называется неестественным сжатием с потерей качества. Примером тому может служить некоторая «блочность» в сильно сжатом MPEG-е и в некоторых других компрессорах.

Неестественность заключается в первую очередь в нарушении самых важных с точки зрения восприятия человеком характеристик изображения — контуров. Опыт показывает, что именно контуры позволяют человеку правильно идентифицировать тот или иной визуальный объект.

Отметим также, что все широко используемые видеокомпрессоры используют технологии сжатия с потерями качества. При различных значениях ФКС может дать на выходе качество видео как без потерь с точки зрения восприятия, так и с неестественными потерями.

Бит - это "атом" цифровой информации: переменная, которая может принимать ровно два различных значения:

■ " 1" (единица, да, истина, существует);

■ "0" (нуль, нет, ложь, не существует).

Любая система, которую можно перевести в одно из двух различных задаваемых состояний и удержать в нем в течение требуемого промежутка времени, может быть использована для хранения 1 бита информации.

Емкость для хранения бита можно представлять себе как небольшой "ящик" где-то в пространстве-времени (в микросхеме, на магнитном/оптическом диске, линии связи) с двумя возможными состояниями: полный -" 1" и пустой - "О".

Данные - информация в цифровом виде.

Объем данных измеряется в битах, но может быть и рациональным числом, а не только целым.

Байт - это 8-битовый элемент: совокупность 8 битов.

Входная последовательность в общем случае бесконечна, но ее элементы обязательно пронумерованы, поэтому имеют смысл понятия "предыдущие" и "последующие" элементы. В случае многомерных данных есть много способов создания последовательности из входного множества.

Блок - конечная последовательность цифровой информации.

Поток - последовательность с неизвестными границами: данные поступают маленькими блоками, и нужно обрабатывать их сразу, не накапливая. Блок - последовательность с произвольным доступом, а поток - с последовательным.

Сжатием блока называется такое его описание, при котором создаваемый сжатый блок содержит меньше битов, чем исходный, но по нему возможно однозначное восстановление каждого бита исходного блока. Обратный процесс, восстановление по описанию, называется разжатием.

Используют и такие пары терминов: компрессия/декомпрессия, кодирование/декодирование, упаковка/распаковка.

Конечную последовательность битов назовем кодом, а количество битов в коде - длиной кода.

Конечную последовательность элементов назовем словом, а количество элементов в слове - длиной слова. Иногда используются синонимы строка и фраза. В общем случае слово построено из R-битовых элементов, а не 8-битовых. Таким образом, код - это слово из 1-битовых элементов.

Например, в блоке из 14 элементов "кинчотсихыннад" одно слово длиной 14 элементов, два слова длиной 13 элементов, и т. д., 13 слов длиной 2 и 14 слов длиной 1. Аналогично в блоке из семи битов 100110" один код длиной 7 бит, два кода длиной 6 бит, и т. д., семь кодов длиной 1 бит.

Символ - это "атом" некоторого языка (например, буквы, цифры, ноты, символы шахматных фигур, карточных мастей). Во многих случаях под символом имеют в виду R-битовый элемент (обычно байт), однако элементы мультимедийных данных все-таки не стоит называть символами: они содержат количественную, а не качественную информацию.

Качественными можно называть данные, содержащие элементы - указатели на символы внутри таблиц или указатели на ветви алгоритма (и таким образом "привязанные" к некоторой структуре: таблице, списку, алгоритму и т. п.). А количественными - множества элементов, являющиеся записями значений каких-либо величин.

Эффективность сжатия учитывает не только степень сжатия (отношение длины несжатых данных к длине соответствующих им сжатых данных), но и скорости сжатия и разжатия. Часто пользуются обратной к степени сжатия величиной - коэффициентом сжатия, определяемым как отношение длины сжатых данных к длине соответствующих им несжатых. Еще две важные характеристики алгоритма сжатия - объемы памяти, необходимые для сжатия и для разжатия (для хранения данных, создаваемых и/или используемых алгоритмом).

Базовые стратегии сжатия

Базовых стратегий сжатия три:

1. Преобразование потока ("Скользящее окно-словарь"). Описание поступающих данных через уже обработанные. Сюда входят LZ-методы для потоков "слов", т. е. когда комбинации поступающих элементов предсказуемы по уже обработанным комбинациям. Преобразование по таблице, RLE, LPC, DC, MTF, VQ, SEM, Subband Coding, Discrete Wavelet Transform - для потоков "элементов", т. е. когда не имеет смысла рассматривать комбинации длиной два и более элемента или запоминать эти комбинации, как в случае Linear Prediction Coding.

Никаких вероятностей, в отличие от второй стратегии, не вычисляется. В результате преобразования может быть сформировано несколько потоков. Даже если суммарный объем потоков увеличивается, их структура улучшается и последующее сжатие можно осуществить проще, быстрее и лучше.

Статистическая стратегия.

а) Адаптивная (поточная). Вычисление вероятностей для поступающих данных на основании статистики по уже обработанным данным. Кодирование с использованием этих вычисленных вероятностей. Семейство РРМ-методов- для потоков "слов", адаптивные варианты методов

Хаффмана и Шеннона - Фано, арифметического кодирования - для потоков "элементов". В отличие от первого случая, давно собранная статистика имеет тот же вес, что и недавняя, если метод не борется с этим специально, что гораздо сложнее, чем в случае LZ. Кроме того, считаются вероятными все комбинации, даже те, которые еще не встречались в потоке и скорее всего никогда не встретятся.

б) Блочная. Отдельно кодируется и добавляется к сжатому блоку его статистика. Статические варианты методов Хаффмана, Шеннона - Фано и арифметического кодирования - для потоков "элементов". Статическое СМ - для "слов".

3. Преобразование блока. Входящие данные разбиваются на блоки, которые затем трансформируются целиком, а в случае блока однородных данных лучше брать весь блок, который требуется сжать. Это методы сортировки блоков ("BlockSorting''-методы: ST, BWT, PBS), а также Fourier Transform, Discrete Cosine Transform, фрактальные преобразования, Emimerative Coding.

Как и при первой стратегии, в результате могут формироваться несколько блоков, а не один. Опять же, даже если суммарная длина блоков не уменьшается, их структура значительно улучшается и последующее сжатие происходит проще, быстрее и лучше.

Резюмируя одним предложением: метод сжатия может быть или статистическим, или трансформирующим и обрабатывать данные либо поточно, либо блоками, причем

■ чем больше и однороднее данные и память, тем эффективнее блочные методы;

■чем меньше и неоднороднее данные и память, тем эффективнее поточные методы;

■ чем сложнее источник, тем сильнее улучшит сжатие оптимальная преобразование;

■ чем проще источник, тем эффективнее прямолинейное статистическое решение.

Типы избыточности

Для снижения скорости передачи бит или для сжатия данных сигнала используется определенная избыточность процесса формирования видеоизображения, что позволяет не терять при кодировании и раскодировании данные, которые должны быть как можно более безошибочными и полностью обратимыми. Необратимые методы кодирования неминуемо приводят к потере некоторой части информации изображения, однако, опираясь на психовизуальные характеристики зрительной системы человека, можно использовать больше степеней сжатия, обеспечивающих декодированные изображения все еще приемлемого для определенных применений качества.

Все видеоизображения имеют существенную часть избыточной информации, наличие которой обусловлено самим содержанием картинок и способом их сканирования.

Пространственная избыточность. На картинке, где есть большие участки одинакового цвета и яркости, например небо или луг, соседние элементы изображения, формирующие такие области, являются пространственно-коррелированными, и эту избыточность можно использовать для уменьшения количества бит, необходимых для описания указанной части кадра. Пространственное сжатие осуществляется в рамках отдельного кадра изображения — его иногда называют внутрикадровым.

Временная избыточность. Нет необходимости передавать фактически одинаковое изображение двадцать пять раз в секунду, как это делается в традиционных системах, — передаются лишь разности между последовательными изображениями. Если можно найти удовлетворительные методы выполнения этого, то совершенные изображения без ухудшения качества достижимы, поскольку вся отброшенная информация была избыточной. На практике использование этого типа избыточности имеет свои недостатки, поскольку последующие движения могут происходить в динамичной быстродвижущейся части кадра, и при передаче возможны ошибочные преобразования в следующих кадрах. Поскольку временная избыточность возникает между соседними кадрами, то выполняемая таким образом компрессия известна как межкадровая компрессия.

Статистическая избыточность. Сигналы видеоизображения содержат много повторяющейся информации, включая регулярность сигналов синхронизации строки кадров, так что значения отсчетов сигнала в определенной степени являются предсказуемыми. Для уменьшения объема передаваемых данных может использоваться статистическая вероятность следующего отсчета данных, который по известному соотношению связан с предыдущим. Количество бит может быть также уменьшено, поскольку нет необходимости передавать информацию, которая обычно включается в темные строки и поля аналоговой видеокартинки. Все, что нужно передавать, — это коды, показывающие синхронизацию строк и кадров. Избыточная информация тоже не передается, так что скорость передачи бит, уменьшается без какого-либо ухудшения качества изображения. Это процесс без потерь. Анализ материалов некоторых программ показал, что объем избыточной информации может достигать уровня 98 %.

1.4. Преобразование цветового представления растрового изображения.

Цветное изображение содержит как яркостную, так и цветовую информацию. Яркостная информация существенно важнее для качества изображения, чем цветовая, поскольку зрение человека значительно сильнее реагирует на небольшие изменения яркости, чем на небольшие изменения цветового тона. Это обусловлено тем, что в сетчатке глаза плотность палочек, пригодных для восприятия только яркостной информации, гораздо выше, чем колбочек.

В связи с этим в схеме кодирования видеоданные переводятся в YUV-представление, также называемое YCrCb (Y – компонент яркости и U (или Cr) и V (или Cb) – два компонента цветности, где Cr – Chromatic red (хроматический красный), Cb – Сhromatic blue (хроматический синий)). Это необходимо потому, что при представлении изображений в RGB–виде нельзя различить яркостную и цветовую информацию.

Преобразование цветового пространства RGB в цветовое пространство YUV представляется с помощью матрицы перехода в виде

Обратное преобразование осуществляется с помощью обратной матрицы перехода в виде

Теоретически каждый элемент изображения требует 3 байта. Такое представление, когда и яркость, и компоненты цветности имеют равное число независимых значений, обычно обозначают как схема 4 : 4 : 4. Способ сжатия цветовой информации называется субдискретизацией и заключается в объединении цветовой информации для соседних элементов изображений. При использовании данного способа значения яркости Y запоминаются для каждого элемента изображения. Для значений U и V вычисляется и запоминается только среднее значение для четырех (схема субдискретизации 4 : 2 : 2), восьми (схема субдискретизации 4 : 1 : 1) и 16 элементов (схема субдискретизации 16 : 1 : 1). Требуемый объем памяти на каждый пиксел при таких способах составляет, соответственно, 12, 10 и 9 битов. Таким образом, количество данных на элемент изображения можно сократить с 24 до 12, 10 или 9 битов соответственно.

Последнее изменение этой страницы: 2016-06-09

lectmania.ru. Все права принадлежат авторам данных материалов. В случае нарушения авторского права напишите нам сюда...