Cтраница 1
Программа Гузмана заложила фундамент эвристического подхода к проблеме зрительного восприятия и воплощает идею глобального использования информации, собираемой локально в каждом узле. [1]
Программа Гузмана работает со сценой в два приема, каждый из которых очень прост. Во время первого прохода программа собирает локальные данные, а при втором проходе эти факты взвешиваются и на основании этого предлагается гипотеза о том, как области должны быть сгруппированы в отдельные тела. [2]
Программа SEE Гузмана в соответствии с геометрией соединений линий устанавливает связи между областями этих соединений. Связи устанавливаются также и между областями, которые не являются соседними. Для этого необходимо, чтобы в каждой области были соединения линий, удовлетворяющие специальным критериям сходства. Две области ( или, следуя рекурсивному определению, ядра) образуют ядро, если между ними установлено не менее двух связей. В конечном итоге ядра отождествляются с телами. Таким образом, в рамках программы телом считается совокупность областей, характер объединения которых выражен связями. В описанном здесь алгоритме в явном виде определено, что представляют собой эти объединения; это дало возможность сформулировать более детальные описания сцены. Важное отличие данной работы состоит в выяснении того обстоятельства, что характеризующие тела объединения - это объединения не областей, а поверхностей, которые на рисунке выражены этими областями. [3]
Возникает, однако, вопрос: составляет ли программа Гузмана теорию. Если мы воспользуемся неформальным определением, связывающим представление о полезной теории с идеей описания, то можно с определенностью утверждать, что работа Гузмана - это теория того аспекта зрительного восприятия, который мы могли бы назвать способностью к разбиению видимой сцены на части, независимо от того, представлена ли эта теория в описанном здесь виде или воплощена непосредственно в действующей программе Гузмана. Следует, однако, своевременно оговориться, что с точки зрения некоторых критериев оценки качества теорий данная теория не вполне удовлетворительна. [4]
С точки зрения семантики подобные программы, улучшающие программу Гузмана, находятся на том же уровне, что и программа Фрейдера. Мы были уже готовы применить такие программы, когда Вальц радикально изменил наши взгляды как на проблему теней, так и на более раннюю задачу разбиения изображения на тела. [5]
Вальц ( см. [47]) изучил случаи, когда программа Гузмана не справляется с разбиением изображения. В результате он усовершенствовал метод Гузмана за счет учета при описании несколько большей информации относительно изображения. [6]
Программа Орбана вызывает те же возражения, что и программа Гузмана: она слишком эмпирична и не имеет основательных семантических корней. Предложенная идея годится для одних сложных сцен и не годится для других. [7]
Смысл второго прохода состоит в объединении полученных локальных фактов в гипотезу о разбиении. Чтобы понять, как процедура второго прохода программы Гузмана получила свою окончательную форму, рассмотрим ряд идей о том, как локальные факты могут быть использованы с максимальным эффектом. Поэтому для иллюстрации некоторых экспериментальных наблюдений, послуживших базой для развития ряда последовательных теорий, используются более сложные случаи, изображенные на фиг. [8]
Этого дополнения оказывается вполне достаточно для правильного анализа сцены на фиг. Добавление этой идеи о запрещении связей приводит нас к программе Гузмана в ее окончательном виде. [9]
Ответ состоит в том, что на двумерном контурном изображении трехгранные вершины наиболее часто дают проекции в виде L-вершин, которые мы игнорируем, или стрелок и вилок, которые порождают связи. Программа работает успешно, когда слабое обратное утверждение о том, что стрелки и вилки на изображении являются проекциями именно трехгранных вершин, оказывается правильным. Поскольку мы часто ставим объекты один на другой и, таким образом, на получаемой проекции скрываем вершины типа стрелки и вилки, для окончательного вывода необходимо использовать информацию о - вершинах. С этой точки зрения программа Гузмана является эвристической теорией, в которой связь образуется всякий раз, когда вершина на изображении является отображением трехгранной пространственной вершины. [10]
В настоящей работе описана процедура разбиения изображения на элементарные области с однородной зачерненностью. После выполнения этой процедуры при помощи двух эвристик производится объединение областей таким образом, чтобы границы полученных областей соответствовали естественным линиям сцены, а не тем побочным линиям, которые обусловлены квантованием и шумами. Затем границы полученных областей аппроксимируются прямыми линиями. После выполнения всех указанных операций специальная процедура анализа сцены интерпретирует изображение. Эта процедура основана на проверке определенных гипотез о совокупностях областей, которые формулируются процедурой, сходной с программой Гузмана. [11]