Полная версия
Теория и практика распознавания инженерных сооружений, промышленных предприятий и объектов железнодорожного транспорта при дешифрировании аэроснимков
1.2. Порядок выполнения дешифрирования
В совокупности приемы, пути и способы организации и выполнения дешифрирования должны быть направлены на эффективное использование сил и средств подразделения дешифрирования с целью решение двух важных задач: получение информации высокого качества в минимально короткие сроки и максимальное использование информации изображений.
В зависимости от поставленной задачи, возможностей подразделения и отведенного времени дешифрирование может выполняться один раз с выдачей первоочередной или сразу полной и подробной информации, а также в два и даже в три этапа с постепенным увеличением ее полноты и подробности.
Порядок выполнения дешифрирования состоит из следующих этапов:
1) изучение условий получения изображений и подготовка материалов к дешифрированию;
2) поиск сложных объектов и определение их элементов, привязка к топографической карте и ориентирование объектов;
3) определение координат объектов;
4) распознавание простых объектов, оценка и обобщение его результатов;
5) определение состояния объектов и их количественных характеристик;
6) оформление результатов дешифрирования.
Первые три-четыре этапа обычно резко различаются между собой и выполняются последовательно, последующие этапы в процессе работы могут частично или полностью вклиниваться в предыдущие, выполняться в комплексе, составляя единый сложный процесс.
Процесс составления фотодокумента и выполнение по аэроснимкам измерительных работ, связанных с определением масштаба аэросъемки, ориентированием относительно сторон света и местности и определением координат объектов, называется фотограмметрической обработкой.
Получив аэроснимок, дешифровщик должен, прежде всего, изучить по отчетному листу условия, при которых было получено изображение. В целях экономии времени изучаться должно только то, что необходимо для дешифрирования, и в порядке изложения данных. Для этого нужно хорошо знать структуру отчетного листа и задачу дешифрирования. При изучении необходимо записать в соответствующем месте и запомнить тип и параметры системы, определяющие вид, масштаб и качество изображения, время, вид и способ съемки местности, район и объект аэросъемки. Запоминание необходимых данных облегчит и ускорит работу, так как в процессе не придется отвлекаться и затрачивать время на их поиск в отчетном листе.
После этого с помощью счетного прибора, графиков или таблиц нужно определить средний масштаб изображения по элементам внешнего и внутреннего ориентирования аэроснимков, что значительно облегчит дальнейшие действия по поиску и определению элементов сложного объекта и привязке его к топографической карте. Если получено несколько фотосхем или на одной фотосхеме сфотографировано несколько сложных объектов с различных высот и с применением различных способов, то условия нужно изучать перед дешифрированием каждого объекта (комплекта аэроснимков).
Подготовка аэроснимка к дешифрированию заключается в установке его в устройство просмотра. Аэроснимок с перспективным изображением при дешифрировании нужно расположить так, чтобы перспектива была направлена от дешифровщика, с планово-перспективным, панорамным, ИК-изображениями – в обе стороны от него. Радиолокационный снимок ориентируется всегда тенями от дешифровщика.
Перед дешифрированием аэроснимки должны быть предварительно разобраны по комплектам (сложные объекты, маршруты и т. д.), а в комплектах – по номерам. При разборе их необходимо одновременно одинаково ориентировать по направлению перспективы и теней. Затем все комплекты нужно уложить на столе в порядке их просмотра по одну сторону от дешифровщика. При этом направление теней от объектов должно совпадать с направлением освещения на рабочем месте.
Поиск сложного объекта следует начинать с первого изображения, просматривая их последовательно одно за другим, пока не будет обнаружен он сам или составляющие его простые объекты. В основу поиска должен быть положен дедуктивный принцип: от общего к частному. Просмотр каждого изображения (аэроснимка) нужно начинать с быстрого общего обзора его невооруженным глазом и/или с помощью использования увеличения изображения. Часть сложных объектов или их элементов обнаруживается сразу, и тогда дальнейший просмотр материалов, поиск элементов и простых объектов строится от них. К таким объектам относятся: аэродромы, порты и военно-морские базы, боевые и походные порядки кораблей, стационарные позиции зенитных ракет, стационарные склады, железнодорожные станции, районы обороны, промышленные комплексы.
При аэросъемке других сложных объектов обнаружить их на аэроснимках сразу не всегда представляется возможным. Распознать сложный объект в этом случае можно только после обнаружения и распознавания основных или почти всех входящих в него простых объектов. Такими сложными объектами являются: войска и боевая техника в различных условиях обстановки, пункты управления, узлы связи и радиотехнического обеспечения, ракетные комплексы оперативного и тактического назначения, зенитные ракетные комплексы. Если эти объекты располагаются на открытой местности, то их поиск следует вести от верхнего левого угла аэроснимка по спирали в направлении движения часовой стрелки или по линиям, параллельным верхнему и нижнему краям. Если местность закрытая и сильно пересеченная, то аэроснимок для просмотра нужно разбить на участки, ограниченные какими-либо естественными или искусственными границами: реками, дорогами, оврагами, опушками леса и т. д.
Дешифровщик, не имеющий большой практики, должен просмотреть в намеченной им последовательности каждый из участков, рассматривая их слева направо параллельными рядами. Этот способ может потребовать много времени, однако он гарантирует отсутствие пропуска объектов при их естественной и искусственной маскировке. Квалифицированный дешифровщик должен работать более эффективно. Часть участков, на которых заведомо не может быть объектов, например, занятых болотами, он может пропускать или просматривать быстрее, чем другие. Производя поиск объектов, дешифровщик должен быть дисциплинированным и не отвлекаться от намеченной им последовательности просмотра, даже если на соседнем участке ему бросится в глаза какой-либо выделяющийся объект. Нужно приучиться работать последовательно, четко, контролировать свои действия и поступки.
Если по прямым признакам объект не обнаружен, то это не всегда означает, что его на аэроснимке нет. Его может быть на первый взгляд не видно в связи с удачным использованием маскирующих свойств местности или маскировочных средств. Поэтому нужно всегда искать косвенные и комплексные признаки. Надо помнить, что как бы тщательно ни был замаскирован объект, на местности всегда остаются следы деятельности людей и техники. Рассматривая аэроснимки, нужно обращать внимание на различного рода нарушения природных образований, границ сельскохозяйственных угодий и других объектов природного ландшафта, а также социально-географических объектов. При поиске объекта нужно обращать внимание на характер местности и делать предположения, как ее можно использовать для расположения элементов сложного объекта и составляющих его простых объектов.
Обнаружив объект, определяют границы его расположения. После выявления границ сложного объекта выделяются его основные элементы и группы простых объектов в них.
После обозначения границ сложного объекта производят его ориентирование – определение направления истинного меридиана (север – юг) и привязку к топографической карте. Выполнение этих операций облегчается, если имеются текущие координаты самолета, а также схема выполнения полета или район выполнения аэросъемки. При любой полноте регистрации элементов внешнего и внутреннего ориентирования привязка объекта к карте и ориентирование относительно сторон света, в конечном счете, сводятся к визуальному отождествлению характерных ориентиров.
Ориентирование относительно местности (привязка к топографической карте) заключается в определении и обозначении, если необходимо, на карте границ участка, занимаемого сложным объектом или аэроснимком. За характерные ориентиры можно принимать углы земельных участков и лесных массивов, пересечения дорог, элементы населенных пунктов, отдельно стоящие местные предметы и т. п. Однако при этом необходимо учитывать возможные изменения на местности: появление новых дорог, предприятий, населенных пунктов, а также изменение облика многих объектов и их уничтожение.
После распознавания характерных ориентиров площадь, занимаемая объектом, обозначается на карте. Отбивка района осуществляется либо по контурам местности, либо переносом узловых точек площади объекта с аэроснимка на карту одним из известных фотограмметрических способов.
1.3. Модель зрительного анализатора оператора-дешифровщика и критерии оценки качества аэроснимков
Процесс отражения внешней среды характеризуется определенной детерминированностью, активностью и динамичностью. Как показывают исследования последних лет, этот процесс реализуется у человека на основе сложной системы психического управления и имеет характер активной, познавательной деятельности.
В общем виде детерминированно-эвристическую концепцию моделирования психофизиологических функций человека можно свести к следующим позициям:
а) управление представляет собой процесс формулирования и решения задачи, сформировавшейся в результате сопоставления воспринятой информации с прошлым опытом и в соответствии с потребностями системы;
б) уяснение задачи и оценка ситуации включает планирование и предвосхищение результатов предстоящих действий системы;
в) процесс решения задачи сводится к выбору или построению программ действий;
г) анализаторы обеспечивают полное, синтетическое и предметное отображение внешней среды («афферентный синтез»);
д) в ходе решения задачи идет непрерывный процесс саморегулирования системы за счет реализации обратных связей (обратная афферентация о результатах действия системы).
Психическое управление имеет два основных аспекта: логико-психологический и операциональный. Логико-психологический аспект связан с формулированием (переформулированием) задач управления. Операциональный аспект связан с процедурами преобразования входной информации и перцептивных образов в интересах выдвижения (построения) и проверки гипотез с использованием внутренних эвристических, структурных и вероятностных механизмов.
Причем сенсорные преобразования выполняют кодирование внешнестимульной информации, последовательно переводя описание внешней среды с одного языка на другой, более абстрактный.
Перцептивные операции осуществляют обратное перекодирование абстрактных, символьных данных в конкретные образы. Система перцептивных операций является в общем случае системой управления познавательным действием, использующей сформированный образ (модель).
Проблема реализации психического управления в технических воспринимающих устройствах сводится к формальному построению сенсорно-перцептивной системы, формирующей и использующей для решения сложных задач модель среды, адекватную задачам и среде.
В настоящее время еще нет формальных, т. е. имеющих строгое математическое построение, моделей информационных процессов, которые бы учитывали основные свойства психического отражения (управления). В нейрофизиологии и психофизиологии имеется описание моделирования некоторых сенсорных процессов, памяти, элементарных мыслительных операций в интересах количественного описания психофизиологических функций и явлений. Однако психологические модели не лишены недостатков – они охватывают изолированные процессы и лишены универсальности даже в рамках одной психологической модели, и не всегда их можно рассматривать как программу формального описания психофизиологических функций человека.
К основным внешним и внутренним закономерностям, свойственным содержательным психологическим моделям, в свете рассмотренной выше структурной теории восприятия могут быть отнесены:
а) обусловленность функционирования «внутренних» моделей среды воспринимаемыми структурами и решаемой задачей;
б) активно-избирательный характер отражения внешней среды на основе действия замкнутых систем постоянных и временных связей различной природы и уровня;
в) этажность обработки информации на основе взаимодействия сенсорных, перцептивных и концептуальных моделей разного ранга, обеспечивающих отражение внешних структур любой сложности;
г) использование динамических, иерархических систем описания и внутреннего воссоздания элементов среды;
д) выработка оптимальной стратегии функционирования в процессе отражения;
е) реконструкция моделей при реализации новых познавательных целей в рамках «гностической саморегуляции».
В структурном смысле рассматриваемые модели представляют собой иерархические системы данных с переменным числом уровней разной сложности, на каждом из которых с помощью определенных лингвистических средств отражаются (в той или иной степени абстрактно) внешняя среда и схемы поведения. Рассмотренная система моделей образует весьма гибкий и тонкий аппарат отражения внешней среды, обладающий высокой чувствительностью и разрешающей способностью, измерительными возможностями с автоматической настройкой.
С точки зрения автоматизации процессов первичной обработки дешифровочной информации особое значение имеет анализ особенностей функционирования перцептивных моделей.
Выполненные экспериментальные исследования позволяют конкретизировать закономерности функционирования перцептивных моделей при восприятии дешифровочной информации:
слойно-ступенчатая природа процесса восприятия первичной информации с формированием на выходе «слоев» промежуточных, а на выходе исчисления – «итогового» образа;
использование естественного языка единичных объектов, опирающегося на переменный алфавит оперативных единиц восприятия;
взаимодействие структурных и эвристических механизмов при построении образов и структурных, вероятностных механизмов – при распознавании;
непрерывное взаимодействие в процессе восприятия поисковых, ориентировочно-исследовательских и распознавательно-информационных действий;
сочетание структурного анализа с индикаторным при восприятии и распознавании зашумленных стимулов;
непрерывное регулирование процесса извлечения и обработки информации; развитое перцептивное обучение (самообучение).
С позиции автоматизации процессов вторичной обработки дешифровочной информации большое значение имеет учет особенностей функционирования концептуальных моделей, связанных с использованием системы эвристик: упреждающего планирования процессов; последовательного структурного расчленения воспринимаемой ситуации и установления отношений между ее элементами; избирательного поиска на каждом уровне без полного перебора вариантов; формирования алгоритмов распознавания в ходе решения задачи и т. п.
Анализ закономерностей, свойственных содержательным психологическим моделям, позволяет сформулировать два основных принципа «действия» таких моделей:
а) детерминированность функционирования моделей воспринимаемыми структурами и задачей и как следствие их адаптивность;
б) эвристичность функционирования моделей при решении сложных перцептивно-опознавательных задач, проявляющуюся прежде всего в многоуровневом решении задачи и общей композиционной активности процесса, включая самопрограммирование.
Последнее не исключает вероятностных аспектов перцептивно-распознавательной деятельности. Все эти особенности определяют преимущества человека перед машиной в информационном плане: активность, избирательность, гибкость, огромный арсенал «лингвистических» средств, возможность использования недостаточной и искаженной информации, огромные возможности обучения, т. е. универсальность функционирования.
Для расширения сферы применения автоматических распознающих и других технических средств с «интеллектуальными» функциями в них должны воспроизводиться основные особенности функционирования соответствующих содержательных психологических моделей. Разумеется, преимущества человека должны использоваться с учетом возможностей и преимуществ машины: высокого быстродействия, пропускной способности, точности, постоянной работоспособности при заданном уровне надежности и т. д. Конечно, не все слепо должно заимствоваться у природы, у человека. Большое значение имеет поиск и использование более экономных или вообще более выгодных в каком-то отношении решений по сравнению с биологическими системами. Однако эти решения, как правило, могут касаться лишь частных, узкоспециализированных функций. Для полифункциональных технических систем, а к ним относятся распознающие автоматы, более или менее полное соответствие с функциями человека является весьма желательным. Это будет способствовать резкому повышению надежности и эффективности технических средств.
Итак, в основу моделирования процессов восприятия и распознавания в интересах построения технических устройств широкого назначения должен быть положен «детерминированно-эвристический» подход с реализацией основных принципов функционирования содержательных психологических моделей, «структурной» детерминированности, взаимодействия моделей разного характера и уровня, эвристичности перцептивно-опознавательной деятельности. Детерминированность рассматривается с содержательно-психологических позиций, а эвристичность – в широком смысле слова, не исключая вероятностные аспекты. Из указанных принципов вытекают как следствие все перечисленные преимущества психического управления и восприятия, включая иерархичность, взаимную корреляцию функциональной и лингвистической структур, кольцеобразность (замкнутость) функциональной структуры в целом и ее элементов и т. д.
Возможные пути построения эффективно действующих непримитивных автоматов на принципах психики:
а) анализ характера психофизиологических и психологических моделей, описывающих в естественном языке деятельность человека;
б) формальное описание психофизиологических функций человека при решении соответствующих задач и построение математических моделей (цифровых, аналитических);
в) создание физических моделей из специализированных (например, оптико-электронных) конструкций и экспериментальная проверка их в различных условиях;
г) формирование интегральной системы, содержащей совокупность физических и математических моделей.
Основными задачами построения формальных моделей являются:
обеспечение универсальности функционирования рецепторных устройств, производящих обработку любой входной информации; воспроизведение функциональной структуры психического управления с реализацией соответствующих эвристик и алгоритмов выделения, преобразования и фиксации информации как при построении психологических моделей, так и их функционировании; разработка иерархического языка для адекватного описания объектов среды и отражающих их текущих образов;
разработка принципов построения внутренней модели проблемной ситуации в ходе ее решения на перцептивно-опознавательном уровне. В настоящее время эти задачи являются центральными в области кибернетической психологии.
При построении моделей восприятия и распознавания необходимо учитывать следующие основные требования:
а) модель должна быть непротиворечивой в рамках моделируемых процессов, способной «вписываться» в более общую модель, быть основой для детализации частных моделей;
б) модель должна выполнять определенные информационные функции, нести новые знания о структуре моделируемых процессов, обеспечивать прогнозирование их функционирования;
в) модель должна быть реализуемой на современных технических средствах, обладать практической полезностью и представлять собой новое средство автоматического выполнения всей системы операций, реализуемых в моделируемых ею психофизиологических структурах.
Полная модель, учитывающая все свойства зрительного анализатора, до настоящего времени не разработана, поэтому при составлении и оценке алгоритмов аналого-цифрового преобразования основные особенности зрительного анализатора учитываются раздельно, а не в совокупности. Особенности зрения выявляются при этом с помощью относительно простых тестовых изображений (штрихов, резких перепадов яркости и т. п.). Полученные результаты затем распространяются на изображения с более сложной структурой.
Сетчатка, которая содержит сложную сеть нейронов, связывающих перекрестно фоторецепторы и соединяющихся с ганглиозными клетками, аксоны которых образуют зрительный нерв, а также связывающих друг с другом ганглиозные клетки, осуществляет преобразование оптического изображения в нейронное, представляющее собой распределение интенсивности возбуждения нейронов, образующих сетчатку. Это преобразование является нелинейным и определяется химическими процессами в фоторецепторах и в системе взаимосвязанных клеток сетчатки, расположенных сразу после фоторецепторов. Изменения, происходящие при этом с изображением, моделируются путем его поэлементного преобразования нелинейной функцией, обычно логарифмической или степенной, с показателем степени 1/3. Использование логарифмической функции удобнее с методической точки зрения, т. к. она согласуется с законом Вебера-Фехнера, который сам является приближенным, применение же степенной функции позволяет получить несколько более точные результаты.
Существует три типа колбочек, входящих в сетчатку, называемых «красные», «синие», «зеленые», которые различаются по чувствительности к различным участкам длины волн λ светового излучения. На рисунке 1.1 приведены кривые спектральных чувствительностей трех типов колбочек, выраженных в процентах, поглощенных зрительными пигментами квантов.
При построении функциональной модели зрительной системы это обстоятельство учитывается включением в нее трех звеньев, «сигналы» с которых соответственно вычисляются по формулам
ek(x,y) = ƒ L(x,y,λ)εk(λ)dλ,
eз(x,y) = ƒ L(x,y,λ)εз(λ)dλ, (1.1)
ec(x,y) = ƒ L(x,y,λ)εc(λ)dλ,
где L(x,y,λ) – распределение яркости (светового потока) по координатам x,y и длин волн света εk(λ),εз(λ),εc(λ) – спектральные чувствительности «красных», «зеленых» и «синих» колбочек, ek(x,y),eз(x,y),ec(x,y) – сигналы с «красных», «зеленых» и «синих» фоторецепторов (колбочек).
Рисунок 1.1 – Кривые спектральных чувствительностей колбочек
В сетчатке глаза происходит первичная обработка изображения, в результате которой формируется ахроматическая (черно-белая) и цветностные составляющие изображения, причем, последние не зависят от яркости наблюдаемого изображения. Сформированные таким образом составляющие изображения фильтруются сетчаткой. При фильтрации ахроматической (яркостной) составляющей имеет место ослабление нижних пространственных частот (ПЧ) за счет латерального торможения. Степень ослабления определяется условиями наблюдения. Если яркость изображения не меняется во времени, то это ослабление максимально. В случае наблюдения мелькающих изображений ослабление нижних ПЧ оказывается тем меньше, чем выше частота мелькания, а при частотах мелькания f ≥ 6 Гц ослабление вообще отсутствует.
Верхние ПЧ как ахроматической, так и цветностных составляющих изображений ослабляются в процессе фильтрации глазом. Процесс ослабления формализуется экспериментальными графиками передаточных функций, представляемых обычно в виде зависимостей контрастной чувствительности зрительной системы в децибелах от пространственной частоты пространственно-гармонического сигнала.
Таким образом, в процессе описанного преобразования оптического изображения в нейронное уменьшается зависимость зрительного ощущения от освещенности сцены, «срезаются» пространственные частоты, сужается спектр, что приводит к сокращению количества информации, поступающей в зрительный нерв за счет устранения всего несущественного. Это сокращение потока информации можно оценить, если учесть, что число колбочек равно 6,5–7 млн, а число волокон зрительного нерва 0,8–1 млн, т. е. оно составляет 6,5–8,75 раз.
Полная функциональная модель зрительной системы на уровне сетчатки, в которой были бы отражены все известные в настоящее время ее характеристики, хотя и может быть построена, но она оказывается слишком сложной и представляет скорее теоретический интерес. При построении модели, пригодной для практического использования, делается ряд упрощающих допущений. Основными из них являются допущения об инвариантности к сдвигу и повороту, а также допущение относительно непрерывности мозаики сетчатки.