Cтраница 3
Так как когнитрон реализован в виде многослойной сети, возникают сложные проблемы обучения, связанные с выбранной структурой. Автор отверг управляемое обучение, как биологически неправдоподобное, используя взамен этого обучение без учителя. Получая обучающий набор входных образов, сеть самоорганизуется посредством изменения силы синаптических связей. При этом отсутствуют предварительно определенные выходные образы, представляющие требуемую реакцию сети, однако сеть самонастраивается с целью распознавания входных образов с замечательной точностью. [31]
Здесь индекс i пробегает все выходы многослойной сети. [32]
Как мы видели, вычисления в многослойных сетях выполняются слой за слоем, начиная с ближайшего к входу слоя. Величина NET каждого нейрона первого слоя вычисляется как взвешенная сумма входов нейрона. Затем активационная функция F сжимает NET и дает величину OUT для каждого нейрона в этом слое. [33]
Можно показать, что в этом случае линейная многослойная сеть не является более мощной, чем однослойная сеть; рассматриваемые возможности сети могут быть улучшены только введением нелинейности в передаточную функцию нейрона. Говорят, что сеть, использующая сигмоидальную функцию активации и метод обучения Хэбба, обучается по сигнальному методу Хэбба. [34]
Уильямса [75], в которой был предложен алгоритм обучения многослойных сетей перцептронного типа, получивший название метод обратного распространения ошибки. [35]
Свыше 80 % всех приложений нейронных сетей относится к так называемым многослойным сетям без обратных связей. В них сигнал пересылается в направлении от входного слоя через скрытые слои ( если они имеются) к выходному слою. Сети именно такого типа будут рассматриваться в последующих главах книги в контексте генетических алгоритмов и нечетких систем. Поэтому в настоящей главе мы обсудим в первую очередь базовые элементы многослойных нейронных сетей - персептрон и системы типа Адалайн ( с линейным и нелинейным выходом), после чего определим два алгоритма обучения этих сетей: алгоритм обратного распространения ошибки и рекуррентный алгоритм метода наименьших квадратов. [36]
![]() |
Подавление малых значений весов в методе прореживания связей. [37] |
Эти алгоритмы характеризуются относительно быстрым темпом обучения; поскольку разделяют сложную задачу обучения большой многослойной сети на ряд более простых задач, обычно - обучения однослойных подсетей составляющих большую сеть. [38]
К настоящему моменту с некоторым успехом проведены предварительные исследования по разработке алгоритмов адаптации для многослойных сетей из адаптивных пороговых элементов при использовании принципа селективной обратной связи. Если качество работы, наблюдаемое на некотором множестве выходов, лучше, чем среднее, то каждый элемент сети адаптируется при использовании положительной обратной связи. Если же качество выходных сигналов хуже среднего, то все элементы адаптируются с отрицательной обратной связью. Предполагается, что формула ( 37) будет полезна при предсказании скорости адаптации в таких сетях. При работе с сетями, вместо использования временной последовательности решений, решения принимаются одновременно по всему пространству. [39]
Очевидна высокая степень согласованности результатов, касающихся вклада отдельных переменных, которые дают обычная регрессия и многослойная сеть. Такое соответствие повышает нашу уверенность в правильности результатов и одновременно говорит о том, что, по крайней мере, линейная составляющая связи между доходом по индексу и выбранным фактором улавливается нейронной сетью вполне успешно. [40]
Случайные изменения могут проводиться не только для отдельных весов, но и для всех нейронов слоя в многослойных сетях или даже для всех нейронов сети одновременно. [41]
Однослойные сети несколько ограничены с точки зрения проблем, которые они могут решать; однако в течение многих лет отсутствовали методы обучения многослойных сетей. Статистическое обучение обеспечивает путь решения этих проблем. [42]
Представление о том, что микрофибриллы откладываются перпендикулярно длинной оси клетки, а затем переориентируются под влиянием деформации и образуют таким путем в конечном счете многослойную сеть, обычно называют теорией многосеточного роста. Теория многосеточного роста не отвечает, однако, на вопрос о том, почему микрофибриллы в процессе их синтеза приобретают специфическую ориентацию. Релофсен указывает, что синтезируемые молекулы полимера, по-видимому, всегда откладываются в направлении, соответствующем наибольшему напряжению. [43]
Следовательно, каждому моменту времени t е [ О, Г ] соответствует своя подмодель, изображенная на рис. 8.7. Все такие статические подмодели связаны друг с другом фиктивными дугами через уз-лы - запасы, которые описаны далее, а на рис. 8.10 дана общая конструкция модели, которую можно представить в виде многослойной сети с кратными дугами. [44]
Как видно из публикаций, нет общепринятого способа подсчета числа слоев в сети. Многослойная сеть состоит, как показано на рис. 1.6, из чередующихся множеств нейронов и весов. Ранее в связи с рис. 1.5 уже говорилось, что входной слой не выполняет суммирования. Эти нейроны служат лишь в качестве разветвлений для первого множества весов и не влияют на вычислительные возможности сети. [45]