Контекстная классификация изображений - Contextual image classification

Контекстная классификация изображений, тема распознавание образов в компьютерное зрение, это подход классификация на основе контекстной информации в изображениях. «Контекстный» означает, что этот подход сосредотачивается на взаимосвязи соседних пикселей, что также называется соседством. Цель этого подхода - классифицировать изображения с использованием контекстной информации.

Вступление

Подобно как язык обработки, одно слово может иметь несколько значений, если не указан контекст, а шаблоны в предложениях являются единственными информативными сегментами, которые нас интересуют. Для изображений принцип такой же. Найдите закономерности и придайте им правильное значение.

Как показано на изображении ниже, если отображается только небольшая часть изображения, очень трудно сказать, о чем это изображение.

Даже попробуйте другую часть изображения, все равно трудно классифицировать изображение.

Однако, если мы увеличим контекстность изображения, тогда будет больше смысла распознавать.

Увеличенное поле улыбающегося лица

Как показано на полных изображениях ниже, почти каждый может легко его классифицировать.

Полное изображение

Во время процедуры сегментация, методы, которые не используют контекстную информацию, чувствительны к шуму и вариациям, поэтому результат сегментации будет содержать большое количество неправильно классифицированных областей, и часто эти области имеют небольшой размер (например, один пиксель).

По сравнению с другими методами, этот подход устойчив к шуму и существенным вариациям, так как учитывает непрерывность сегментов.

Некоторые методы этого подхода будут описаны ниже.

Приложения

Работа в качестве фильтра пост-обработки для помеченного изображения

Этот подход очень эффективен против небольших участков, вызванных шумом. И эти небольшие области обычно образованы несколькими пикселями или одним пикселем. Этим регионам присваивается наиболее вероятная метка, однако у этого метода есть недостаток. Небольшие области также могут быть сформированы правильными областями, а не шумом, и в этом случае метод фактически ухудшает классификацию. Этот подход широко используется в дистанционное зондирование Приложения.

Улучшение классификации постобработки

Это двухэтапный процесс классификации:

Для каждого пикселя пометьте пиксель и сформируйте для него новый вектор признаков.
Используйте новый вектор признаков и объедините контекстную информацию, чтобы назначить окончательную метку для

Объединение пикселей на более ранних этапах

Вместо использования отдельных пикселей соседние пиксели могут быть объединены в однородные области с использованием контекстной информации. И предоставить эти регионы классификатору.

Получение пиксельной функции из района

Исходные спектральные данные могут быть расширены путем добавления контекстной информации, переносимой соседними пикселями, или даже в некоторых случаях заменены. Такие методы предварительной обработки широко используются в текстурированное изображение признание. Типичные подходы включают средние значения, дисперсии, описание текстуры и т. Д.

Объединение спектральной и пространственной информации

Классификатор использует уровень серого и соседство пикселей (контекстную информацию) для присвоения меток пикселям. В таком случае информация представляет собой комбинацию спектральной и пространственной информации.

На основе байесовского классификатора минимальных ошибок

Контекстная классификация данных изображения основана на классификаторе минимальных ошибок Байеса (также известном как наивный байесовский классификатор ).

Представьте пиксель:

Пиксель обозначается как ${ displaystyle x_ {0}}$ .
Окрестности каждого пикселя ${ displaystyle x_ {0}}$ $х_ {0}$ вектор и обозначается как ${ displaystyle N (x_ {0})}$ ${ displaystyle N (x_ {0})}$ .
- Значения в векторе окрестности обозначаются как ${ displaystyle f (x_ {i})}$ .
- Каждый пиксель представлен вектором

{ displaystyle xi = left (е (x_ {0}), f (x_ {1}), ldots, f (x_ {k}) right)}

{ displaystyle x_ {i} in N (x_ {0}); quad i = 1, ldots, k}

Метки (классификация) пикселей в окрестности ${ displaystyle N (x_ {0})}$ представлены в виде вектора

{ displaystyle eta = left ( theta _ {0}, theta _ {1}, ldots, theta _ {k} right)}

{ displaystyle theta _ {i} in left { omega _ {0}, omega _ {1}, ldots, omega _ {k} right }}

{ displaystyle omega _ {s}}

здесь обозначает присвоенный класс.

Вектор представляет метки в окрестности ${ displaystyle N (x_ {0})}$ без пикселя ${ displaystyle x_ {0}}$

{ displaystyle { hat { eta}} = left ( theta _ {1}, theta _ {2}, ldots, theta _ {k} right)}

Соседство: Размер квартала. Ограничений по размеру нет, но он считается относительно небольшим для каждого пикселя. ${ displaystyle x_ {0}}$ .Разумный размер района ${ displaystyle 3 times 3}$ из 4-возможность подключения или 8-связность ( ${ displaystyle x_ {0}}$ помечен красным цветом и помещен в центр).

4-связь район,
8-подключение район

Расчет:

Применяйте минимальную классификацию ошибок к пикселю ${ displaystyle x_ {0}}$ , если вероятность класса ${ displaystyle omega _ {r}}$ представляя пиксель ${ displaystyle x_ {0}}$ является самым высоким среди всех, тогда назначьте ${ displaystyle omega _ {r}}$ как его класс.

{ displaystyle theta _ {0} = omega _ {r} quad { text {if}} quad P ( omega _ {r} mid f (x_ {0})) = max _ { s = 1,2, ldots, R} P ( omega _ {s} mid f (x_ {0}))}

Правило контекстной классификации описано ниже, оно использует вектор признаков ${ displaystyle x_ {1}}$ скорее, чем ${ displaystyle x_ {0}}$ .

{ displaystyle theta _ {0} = omega _ {r} quad { text {if}} quad P ( omega _ {r} mid xi) = max _ {s = 1,2 , ldots, R} P ( omega _ {s} mid xi)}

Используйте формулу Байеса для вычисления апостериорной вероятности ${ Displaystyle P ( omega _ {s} mid xi)}$

{ Displaystyle P ( omega _ {s} mid xi) = { frac {p ( xi mid omega _ {s}) P ( omega _ {s})} {p left ( xi right)}}}

Количество векторов совпадает с количеством пикселей в изображении. Для классификатора используется вектор, соответствующий каждому пикселю ${ displaystyle x_ {i}}$ , а вектор генерируется из окрестности пикселя.

Основные этапы контекстной классификации изображений:

Вычислить вектор признаков ${ displaystyle xi}$ для каждого пикселя.
Рассчитать параметры распределения вероятностей ${ displaystyle p ( xi mid omega _ {s})}$ и ${ Displaystyle P ( omega _ {s})}$
Рассчитайте апостериорные вероятности ${ Displaystyle P ( omega _ {r} mid xi)}$ и все ярлыки ${ displaystyle theta _ {0}}$ . Получите результат классификации изображений.

Алгоритмы

Соответствие шаблонов

В сопоставление шаблонов представляет собой реализацию этого подхода методом «грубой силы».^[1] Идея состоит в том, чтобы сначала создать набор шаблонов, а затем искать мелкие детали на изображении, совпадающие с шаблоном.

Этот метод требует больших вычислительных ресурсов и неэффективен. Он ведет полный список шаблонов на протяжении всего процесса, а количество комбинаций чрезвычайно велико. Для ${ Displaystyle м раз п}$ пиксельное изображение, может быть максимум ${ Displaystyle 2 ^ {м раз п}}$ комбинации, что приводит к большим вычислениям. Этот метод является нисходящим и часто называется просмотр таблицы или же поиск в словаре.

Марковская цепь нижнего порядка

В Цепь Маркова^[2] также может применяться в распознавании образов. Пиксели в изображении можно распознать как набор случайных величин, а затем использовать цепь Маркова более низкого порядка, чтобы найти взаимосвязь между пикселями. Изображение рассматривается как виртуальная линия, и в методе используется условная вероятность.

Кривые заполнения гильбертова пространства

В Кривая Гильберта проходит по уникальному шаблону через все изображение, проходит через каждый пиксель, не посещая ни один из них дважды, и сохраняет непрерывную кривую. Это быстро и эффективно.

Марковские сетки

Упомянутые выше цепи Маркова нижнего порядка и кривые заполнения гильбертова пространства трактуют изображение как линейную структуру. Однако сетки Маркова будут учитывать двумерную информацию.

Дерево зависимостей

В дерево зависимостей^[3] - это метод, использующий древовидную зависимость для аппроксимации распределений вероятностей.

внешняя ссылка

[1] G.T. Туссен "Использование контекста в распознавании образов "Распознавание образов", том 10, 1977, стр. 189–204.

[2] К. Абенд, Т.Дж. Харли, Л. Канал "Классификация двоичных случайных образов, "IEEE Transactions по теории информации, том 11, № 4, октябрь 1965 г., стр. 538–544.

[3] C.K. Чоу и К. Лю "Аппроксимация дискретных распределений вероятностей деревьями зависимостей, "IEEE Transactions on Information Theory, том 14, № 3, май 1965 г., стр. 462–467.

[1]

[2]

[3]