Вопрос 19: Задачи распознавания образов. Когнитрон и неокогнитрон.

Теория распознавания образа — раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Такие задачи решаются довольно часто, например, при переходе или проезде улицы по сигналам светофора. Распознавание цвета загоревшейся лампы светофора и знание правил дорожного движения позволяет принять правильное решение о том, можно или нельзя переходить улицу. Распознавание образов, упрощает работу во многих сферах, и помогает оптимизировать временные и материальные затраты в ряде случаев.

Формальная постановка задачи Распознавание образов — это отнесение исходных данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных данных.

При постановке задач распознавания стараются пользоваться математическим языком, стремясь - в отличие от теории искусственных нейронных сетей, где основой является получение результата путём эксперимента, - заменить эксперимент логическими рассуждениями и математическими доказательствами.

Классическая постановка задачи распознавания образов: Дано множество объектов. Относительно них необходимо провести классификацию. Множество представлено подмножествами, которые называются классами. Заданы: информация о классах, описание всего множества и описание информации об объекте, принадлежность которого к определенному классу неизвестна. Требуется по имеющейся информации о классах и описании объекта установить - к какому классу относится этот объект.

Наиболее часто в задачах распознавания образов рассматриваются монохромные изображения, что дает возможность рассматривать изображение как функцию на плоскости. Если рассмотреть точечное множество на плоскости T, где функция f(x,y) выражает в каждой точке изображения его характеристику — яркость, прозрачность, оптическую плотность, то такая функция есть формальная запись изображения.

Множество же всех возможных функций f(x,y) на плоскости T есть модель множества всех изображений X. Вводя понятие сходства между образами можно поставить задачу распознавания. Конкретный вид такой постановки сильно зависит от последующих этапов при распознавании в соответствии с тем или иным подходом.

Примеры задач распознавания образов Оптическое распознавание символов Распознавание рукописного текста Распознавание штрих-кодов Распознавание автомобильных номеров Распознавание лиц Распознавание речи Распознавание изображений Распознавание локальных участков земной коры, в которых находятся месторождения полезных ископаемых Классификация документов

Когнитро́н Искусственная нейронная сеть на основе принципа самоорганизации. Своей архитектурой когнитрон похож на строение зрительной коры, имеет иерархическую многослойную организацию, в которой нейроны между слоями связаны только локально. Обучается конкурентным обучением (без учителя). Каждый слой мозга реализует различные уровни обобщения; входной слой чувствителен к простым образам, таким, как линии, и их ориентации в определенных областях визуальной области, в то время как реакция других слоев является более сложной, абстрактной и независимой от позиции образа. Аналогичные функции реализованы в когнитроне путём моделирования организации зрительной коры.

Неокогнитро́н Иерархическая многослойная искусственная нейронная сеть, сверточного типа, производная от когнитрона, способная к робастному распознаванию образов, обычно обучаемая по принципу «обучение без учителя». Сеть данного вида также часто применяется для распознавания рукописного текста и OCR, образов с сильно искажённой или зашумлённой структурой. Прообраз сети был позаимствован из модели, предложенной Хьюбелом и Визелем, согласно которой, существует два вида клеток в первичной зрительной коре: простая и сложная клетка, расположенные каскадно. Неокогнитрон также состоит из каскадно соединённых нейронов S-типа (простой, англ. simple) и C-типа (сложный, англ. complex). В процессе работы сети, локальные признаки образа извлекаются при помощи клеток S-типа, а искажения признаков, такие как, например, сдвиг, — компенсируются клетками C-типа. Локальные признаки на входе обобщаются поэтапно, и окончательная классификация выполняется в оконечных слоях.

Неокогнитрон является дальнейшим развитием идеи когнитрона и более точно отражает строение зрительной системы, позволяет распознавать образы независимо от их преобразований, вращений, искажений и изменений масштаба. Неокогнитрон может как самообучаться, так и обучаться с учителем. Неокогнитрон получает на входе двумерные образы, аналогичные изображениям на сетчатке глаза, и обрабатывает их в последующих слоях аналогично тому, как это было обнаружено в зрительной коре человека. Конечно, в неокогнитроне нет ничего, ограничивающего его использование только для обработки визуальных данных, он достаточно универсален и может найти широкое применение как обобщенная система распознавания образов.

results matching ""

    No results matching ""