Cтраница 1
Описание сцены выполняется в терминах плоских многоугольников, заданных своими ребрами. Координаты вершин отсчитаны в экранной системе координат; предполагается, что все вершины лежат в пределах экрана. Каждое ребро содержит указатель на два многоугольника, которым оно принадлежит. [1]
К задаче описания сцен, составленных из трехмерных объектов, ведут два явно различных пути. Один подход заключается в том, чтобы игнорировать трехмерную природу реальных объектов и описывать сцену в терминах двумерных конструкций, как мы это уже делали. Часто, однако, более полезно интерпретировать сцену в терминах трехмерных объектов. Таким образом, второй подход состоит в том, чтобы описывать не саму картинку в чистом виде, а трехмерную обстановку, с которой был снят вид сцены. [2]
Программа Робертса [22] строит описание сцены по фотографии. Это описание трехмерно, поскольку программа устанавливает координаты х, у, г всех углов тела. В качестве начала координат выбирается точка ( программа вычисляет ее положение) в трехмерном пространстве, в которой нужно установить камеру, чтобы получить исходную фотографию. Описание строится при помощи заранее заданных моделей. [3]
Например, выходная информация может являться описанием сцены в какой-либо форме. [4]
В романах писателей XIX в то и дело попадаются описания сцен, где дамам, лишившимся чувств от сильного нервного потрясения ( или просто от духоты), дают вдохнуть из флакончика с нюхательной солью Какая это соль. [5]
На этом уровне с помощью специально разработанных алгоритмов происходит обнаружение объектов в описании сцены и разбиение изображений на значимые сегменты. Эффективность алгоритмов анализа сцен определяет скорость работы системы восприятия. [6]
Работа Фалька полностью основывается на идеологии Робертса и Гузмана и не выходит за рамки традиционной постановки задачи получения описания сцены. В то же время в этой работе были предложены некоторые новые приемы, в том числе эвристики, позволяющие осуществлять анализ реальных зашумленных изображений и неполных контурных рисунков. [7]
Конкретные постановки задачи зрительного восприятия почти во всех разрабатываемых экспериментальных системах роботов примерно одинаковы: система зрительного восприятия должна, используя телевизионное изображение трехмерной сцены, давать описание сцены в терминах имен имеющихся на изображении объектов и их точного положения в некоторой фиксированной системе координат и дополнительно в терминах пространственных отношений между объектами. [8]
Основные проблемы, возникающие при создании систем зрительного восприятия роботов, таковы: получение изображения, выделение базовых признаков на изображении, разбиение полного изображения на части, соответствующие отдельным телам, идентификация, определение дальности, построение описания сцены, организация эффективного процесса восприятия, организация взаимодействия с другими подсистемами робота, работа с реальными зашумленными изображениями и изображениями с тенями. [9]
Второе важное отличие состоит в том, что программа Робертса в явном виде вычисляет положение точки наблюдения. Этот важный аспект описания сцены в изложенном нами алгоритме совсем не затрагивается. Отсюда следует, что в установленном по этому алгоритму соответствии между трехмерной сценой и двумерным изображением координата z отсутствует. Описанная таблицей предикатов ( табл. 4) связь характеризует внешнее выражение моделей углов в разных условиях видимости через соединения линий. Модели Робертса - это структуры данных, которые описывают все поверхности, ребра и углы многогранника безотносительно к условиям видимости. Условия видимости определяются лишь после нахождения точки наблюдения для каждой модели. В рамках описанного здесь алгоритма точка наблюдения характеризуется в терминах подклассов моделей, которые соответствуют вариациям условий видимости поверхности и ребра. Такое соответствие между изображением и сценой никак нельзя свести к числовому соответствию, в то время как в программе Робертса это комбинация вычислений ( тригонометрические преобразования), топологического сопоставления и процедур удаления линий, соответствующих загороженным ребрам и точкам их пересечения. [10]
В традиционных задачах опознавания образов описание сцены понимается как ее отнесение к одному из некоторого заранее заданного числа классов. Хотя такая точка зрения полезна во многих практических ситуациях, существуют другие важные и интересные виды задач, в которых она не является естественной. При решении задач из этих областей нас интересует скорее логически стройное описание, объяснение структуры сцены, чем ее классификация. I, оказываются неадекватными, и должны применяться другие методы, имеющие дело непосредственно со структурными отношениями. [11]
Рекурсивность отдельных фрагментов сюжетов может способствовать усилению психологических эффектов. В повести Н. В. Гоголя Портрет имеется описание сцены страшного сна художника Чартко-ва, купившего загадочный портрет старика. [12]
Главным отличием гетерархическои схемы от горизонтальной является способ инициирования процедур. В горизонтальной схеме жесткий последовательный процесс развертывается от элементарных процедур к процедурам построения выходного описания сцены. [13]
Конечно, первый тип идентификации, когда рассматривается вся сцена в целом, является наиболее легким. Мы просто утверждаем, что а) все стрелки типа Должно быть присутствуют в описании сцены и б) все стрелки типа Не должно быть отсутствуют. Для большей уверенности мы рассматриваем кроме главных все другие различия между моделью и сценой и судим о надежности идентификации по их числу и типу. [14]
Краткое размышление приводит к выводу, что трехмерное описание может быть получено по единственной картинке только с помощью предварительной информации об объектах, которые входят в интересующее нас окружение. Фундаментальная причина этого заключена в природе перспективных преобразований, отображающих много точек в одну; существует бесконечно много трехмерных объектов, которые могут соответствовать некоторому единственному виду. Тогда для того, чтобы получать трехмерное описание сцены, нам нужен как набор трехмерных моделей объектов окружения, так и хорошо определенная процедура интерпретации заданной сцены в терминах этих моделей. Если окружение достаточно простое, набор моделей не нужно задавать слишком детально, и процедура подбора модели может быть тривиальной. Чтобы продолжить с помощью примера рис. 12.1, предположим, что все объекты окружающей обстановки представляют собой коробки и цилиндры. Тогда наша модель окружающей обстановки может быть задана в такой грубой форме: коробка, у которой все края прямые, и цилиндр, у которого некоторые края кривые. [15]