Метод обратного распространения точности для гарантированных интервальных оценок
Пусть нам заданы допустимые погрешности вычислений для выходных сигналов сети. Для каждого элемента решим задачу: определить допустимые погрешности на входах элемента по заданным максимально допустимым погрешностям на его выходе. Если эту задачу решить для каждого элемента сети, то можно оценить допустимые погрешности для всех сигналов, проходящих через сеть, переходя по сети от элемента к элементу в обратном направлении (от выходов сети к ее входам). Этот процесс мы назовем обратным распространением точности. В ходе него движение сигналов происходит от выходов ко входам, сигнал, проходящий по связи в обратном направлении, является допустимой погрешностью сигнала, проходящего по этой связи в прямом направлении.
Последним элементом стандартного нейрона является точка ветвления, поэтому начинаем рассмотрение метода обратного распространения точности именно с нее.
Точка ветвления имеет несколько выходов. Пусть для каждого ее выхода задана допустимая погрешность



Следующим элементом стандартного нейрона является нелинейный преобразователь. Пусть входной сигнал нелинейного преобразователя равен











Ввиду непрерывности и дифференцируемости функции активации нелинейного преобразователя очевидно, что


Пойдем традиционным путем, оценивая допустимую погрешность в линейном приближении:


Пользуясь этим неравенством, подберем


Получили погрешность, допустимую для входного сигнала нелинейного преобразователя, которая одновременно является допустимой погрешностью для выходного сигнала сумматора. Аналогично можем вычислить погрешность входного сигнала нелинейного преобразователя любого стандартного нейрона, если известна погрешность его выходного сигнала.
Двойственный к нелинейному преобразователю элемент - просто линейная связь! Ее вес равен



Перейдем к следующему элементу стандартного нейрона - адаптивному сумматору с



Каждый вход



Рассмотрим сначала равномерное распределение. Для этого полагаем, что на всех входах погрешности равны между собой






где




где максимум берется по всем




При пропорциональном распределении погрешностей допустимая погрешность выходного сигнала сумматора делится сначала на число входов, а затем для каждого входа делится на соответствующий вес синапса. То есть погрешности распределяются пропорционально весам соответствующих синапсов.
Формула расчета допустимой погрешности для каждого входа сумматора имеет вид:




При приоритетном распределении погрешностей сначала назначаются погрешности для тех входов, которые наиболее значимы по какому-либо признаку, а затем оставшуюся часть допустимой погрешности выходного сигнала сумматора распределяют между оставшимися входами равномерно или пропорционально.
Аналогично можно вычислить допустимые погрешности для входных сигналов сумматора любого стандартного нейрона, если известны погрешности для выходного сигнала сумматора.
Рассмотрим обученную нейросеть с вычисленными весами синапсов





Рассмотрим теперь эту же сеть, но предположим, что все сигналы сети имеют некоторые погрешности. Пусть


Предполагаем, что внутри каждого слоя погрешности сигналов

Пусть нам задана







Нам нужно выяснить, каким образом могут распределяться дисперсии сигналов при заданном




Зная среднеквадратическое отклонение выходных сигналов, можем вычислить дисперсию выходных сигналов



Типичным участком сети является стандартный нейрон. Из стандартных нейронов состоит любая нейронная сеть. Поэтому нам достаточно определить, как вычисляются среднеквадратические отклонения сигналов для элементов стандартного нейрона. Тогда мы будем иметь возможность вычислить среднеквадратические отклонения для любого участка сети.
Выясним, как вычисляются среднеквадратические отклонения для входных сигналов точки ветвления, нелинейного преобразователя и сумматора, если нам будут известны среднеквадратические отклонения выходных сигналов этих элементов.
Если дисперсии выходных сигналов точки ветвления


Пусть




и дисперсия

Пусть нелинейный преобразователь имеет функцию активации





Найдем математическое ожидание и дисперсию величины



С другой стороны, нам известно, что дисперсия выходного сигнала нелинейного преобразователя равна


Таким образом, мы вычислили среднеквадратическое отклонение входного сигнала нелинейного преобразователя для любого распределения погрешности входного сигнала

Мы получили среднеквадратическое отклонение входного сигнала нелинейного преобразователя


Погрешность выходного сигнала сумматора равняется

где

Вычислим среднеквадратические отклонения


Предположим дополнительно, что


Получили формулу для равномерного распределения среднеквадратических отклонений





Получили погрешность, допустимую для входного сигнала нелинейного преобразователя, которая одновременно является допустимой погрешностью для выходного сигнала сумматора. Аналогично можем вычислить погрешность входного сигнала нелинейного преобразователя любого стандартного нейрона, если известна погрешность его выходного сигнала.
Двойственный к нелинейному преобразователю элемент - просто линейная связь! Ее вес равен



Перейдем к следующему элементу стандартного нейрона - адаптивному сумматору с



Каждый вход



Рассмотрим сначала равномерное распределение. Для этого полагаем, что на всех входах погрешности равны между собой






где




где максимум берется по всем




При пропорциональном распределении погрешностей допустимая погрешность выходного сигнала сумматора делится сначала на число входов, а затем для каждого входа делится на соответствующий вес синапса. То есть погрешности распределяются пропорционально весам соответствующих синапсов.
Формула расчета допустимой погрешности для каждого входа сумматора имеет вид:




При приоритетном распределении погрешностей сначала назначаются погрешности для тех входов, которые наиболее значимы по какому-либо признаку, а затем оставшуюся часть допустимой погрешности выходного сигнала сумматора распределяют между оставшимися входами равномерно или пропорционально.
Аналогично можно вычислить допустимые погрешности для входных сигналов сумматора любого стандартного нейрона, если известны погрешности для выходного сигнала сумматора.
Для адаптивного сумматора можно вычислять как допустимые погрешности входных сигналов сумматора, так и допустимые погрешности весов синапсов. Для вычисления допустимых погрешностей весов синапсов также можно использовать равномерное, пропорциональное и приоритетное распределение погрешностей. При равномерном распределении допустимые погрешности для весов синапсов вычисляются по формуле:

где

При пропорциональном распределении допустимые погрешности для весов синапсов вычисляются по формуле:



При приоритетном распределении сначала назначаются допустимые погрешности для тех весов синапсов, которые наиболее значимы по какому-либо признаку, а затем оставшуюся часть допустимой погрешности для выходного сигнала сумматора распределяют между оставшимися весами синапсов равномерно или пропорционально.
При обратном распространении точности имеет место специфическая двойственность - элементы сети заменяются на двойственные им. Однако, эта двойственность отличается от той, с которой мы встречаемся при изучении обратного распространения ошибки для вычисления градиентов функции оценки. Так, если в обычном обратном распространении двойственным элементом к точке ветвления является простой сумматор, то при обратном распространении точности вместо него, как было показано, появляется элемент, вычисляющий минимум приходящих на него сигналов.
Нелинейный преобразователь при обратном распространении точности заменяется двойственным ему элементом, умножающим сигнал на число. Но если при обратном распространении ошибки множителем является значение градиента, то в нашем случае сигнал умножается на величину обратную производной от входного сигнала нелинейного преобразователя. Адаптивный сумматор также заменяется двойственным ему элементом. Этот элемент является своеобразной точкой ветвления. Но, в отличии от простой точки ветвления, он сначала преобразует приходящий к нему сигнал в соответствии с выбранным распределением погрешностей по входам адаптивного сумматора, а затем передает полученные сигналы дальше.
Теперь мы знаем, каким образом вычислять гарантированную интервальную оценку погрешности для любого элемента стандартного нейрона методом обратного распространения точности.
- Точка ветвления. Если допустимые погрешности выходных сигналов точки ветвления равны , то в качестве погрешности входного сигнала точки ветвления выбирается( рис. 6.2).
Рис. 6.2. - Нелинейный преобразователь. Пусть при прямом функционировании входной сигнал нелинейного преобразователя равен , его выходной сигнал равени нелинейный преобразователь имеет функцию активацииЕсли допустимая погрешность выходного сигнала нелинейного преобразователя равняется, то погрешность его входного сигнала не должна превышать, гдеили в линейном приближении( рис. 6.3).
Рис. 6.3. - Адаптивный сумматор. Если при обратном распространении допустимая погрешность выходного сигнала адаптивного сумматора равняется , то погрешность каждого входа сумматора не должна превышать, гдедля равномерного распределения идля пропорционального распределения ( рис. 6.4).
Рис. 6.4.
Зная, как вычисляются допустимые погрешности для всех элементов стандартного нейрона, можно вычислить допустимые погрешности сигналов для всей сети. Рассмотрим участок сети, состоящий из сумматора




То есть мы рассматриваем два последних слоя нейронной сети, состоящие из стандартных нейронов.

Рис. 6.5.
Если заданы допустимые погрешности для выходных сигналов сети, можно вычислить допустимые погрешности для последнего слоя сети. Когда вычислены допустимые погрешности всех входных сигналов последнего слоя сети, переходим к вычислению допустимых погрешностей предпоследнего слоя и так далее. Переходя по сети в обратном направлении от слоя к слою, мы можем вычислить допустимые погрешности всех сигналов сети, в том числе допустимые погрешности входных сигналов.
Мы рассмотрели, как изменяются погрешности сигналов при прохождении через элементы сети. Предположим теперь, что не только сигналы имеют погрешности, но и все элементы сети передают приходящие к ним сигналы с некоторыми погрешностями. Пусть собственные погрешности элементов известны и фиксированы. Выясним, как влияют собственные погрешности элементов на погрешности сигналов.
Bыясним, как действуют элементы сети, имеющие собственные погрешности, при прямой работе сети.
Точка ветвления может либо вообще не иметь погрешности, либо она имеет собственную погрешность




Рис. 6.6.
Предположим, что сумматор имеет собственную погрешность

- погрешность прибавляется к выходному сигналу сумматора, т.е. при прохождении сигналов через сумматор выходной сигнал сумматора будет иметь вид:
- погрешность сумматора действует по каждому входу пропорционально ( рис. 6.7).

Рис. 6.7.
Считаем при этом, что погрешности



Пусть собственная погрешность нелинейного преобразователя равна







Рис. 6.8.
Мы выяснили как вычисляются допустимые погрешности сигналов сети.
При этом мы не выделяли особо тот вклад, который вносят в погрешность сигнала сами элементы. Рассмотрим теперь, как вычисляются допустимые погрешности сигналов сети при обратном распространении точности с учетом собственных погрешностей элементов стандартного нейрона.
Начнем вычисление допустимых погрешностей сигналов сети с учетом собственных погрешностей элементов с точки ветвления. Пусть точка ветвления имеет собственную погрешность



Следующий элемент стандартного нейрона - нелинейный преобразователь. Если нелинейный преобразователь имеет собственную погрешность




или в линейном приближении

Предположим теперь, что собственная погрешность нелинейного преобразователя




В этом случае допустимая погрешность входного сигнала нелинейного преобразователя вычисляется следующим образом:

где

Рассмотрим допустимую погрешность в линейном приближении:

По условию

Получаем:

или

И, наконец, перейдем к вычислению допустимых погрешностей входных сигналов сумматора. Рассмотрим вариант, при котором собственная погрешность сумматора



Если же собственная погрешность сумматора пропорционально распределяется по его входам, и допустимая погрешность выходного сигнала сумматора равняется






где



необходимо, чтобы

где максимум берется по всем




Мы получили формулы для вычисления допустимых погрешностей сигналов для любого участка сети с учетом того, что все элементы имеют собственные погрешности, которые вносят свой вклад в погрешность выходного сигнала этих элементов.
Пусть




и дисперсия

Пусть нелинейный преобразователь имеет функцию активации





Найдем математическое ожидание и дисперсию величины



С другой стороны, нам известно, что дисперсия выходного сигнала нелинейного преобразователя равна


Таким образом, мы вычислили среднеквадратическое отклонение входного сигнала нелинейного преобразователя для любого распределения погрешности входного сигнала

Мы получили среднеквадратическое отклонение входного сигнала нелинейного преобразователя


Погрешность выходного сигнала сумматора равняется

где

Вычислим среднеквадратические отклонения


Предположим дополнительно, что


Получили формулу для равномерного распределения среднеквадратических отклонений





Кроме равномерного и пропорционального распределения среднеквадратических отклонений погрешностей по входам сумматора, может быть использовано приоритетное распределение среднеквадратических отклонений. При этом сначала назначаются среднеквадратические отклонения погрешностей для тех входов сумматора, которые наиболее значимы по какому-либо признаку, а затем оставшаяся часть среднеквадратического отклонения погрешности выходного сигнала сумматора распределяется по остальным входам равномерно или пропорционально.
Мы рассмотрели, как изменяются погрешности сигналов при прохождении через элементы сети. Предположим теперь, что не только сигналы имеют погрешности, но и все элементы сети передают приходящие к ним сигналы с некоторыми погрешностями. Пусть среднеквадратические отклонения погрешностей элементов известны и фиксированы. Выясним, как влияют собственные погрешности элементов на погрешности сигналов.
Вычислим среднеквадратические отклонения входных сигналов точки ветвления, нелинейного преобразователя и сумматора, если известны среднеквадратические отклонения выходных сигналов и собственные погрешности этих элементов.
Пусть точка ветвления имеет собственную погрешность



Если при обратном распространении получаем дисперсии выходных сигналов точки ветвления


Пусть среднеквадратическое отклонение собственной погрешности нелинейного преобразователя равно





Рассмотрим оба варианта.
Пусть погрешность


Отсюда получаем, что дисперсия непосредственно выходного сигнала нелинейного преобразователя равна

Среднеквадратическое отклонение для входного сигнала нелинейного преобразователя вычисляется как указано выше. В качестве дисперсии выходного сигнала в формуле используется вычисленная дисперсия


Пусть теперь собственная погрешность нелинейного преобразователя добавляется к его входному сигналу:


и дисперсию

Вычислим математическое ожидание и дисперсию выходного сигнала нелинейного преобразователя, рассматривая линейное приближение



Отсюда получаем

Перейдем к вычислению среднеквадратических отклонений входных сигналов сумматора. Пусть среднеквадратическое отклонение выходного сигнала сумматора равно


Собственная погрешность сумматора может добавляться либо к выходному сигналу сумматора:

либо к каждому входу сумматора:

где

Пусть собственная погрешность добавляется к выходному сигналу сумматора. Вычислим среднеквадратическое отклонение погрешностей для входных сигналов сумматора. Рассмотрим для этого дисперсию

Для равномерного распределения среднеквадратических отклонений предполагаем, что


Если будем рассматривать пропорциональное распределение среднеквадратических отклонений входных сигналов сумматора, то получим

Пусть теперь собственное среднеквадратическое отклонение сумматора добавляется к каждому входу сумматора:

Вычислим среднеквадратическое отклонение погрешностей для входных сигналов сумматора. Рассмотрим для этого дисперсию

Для равномерного распределения среднеквадратических отклонений предполагаем, что


Если будем рассматривать пропорциональное распределение среднеквадратических отклонений входных сигналов сумматора, то получим

Зная, как вычисляются среднеквадратические отклонения погрешностей для всех элементов стандартного нейрона, можно вычислить среднеквадратические отклонения погрешностей сигналов для всей сети. Если заданы среднеквадратические отклонения погрешностей для выходных сигналов сети, можно вычислить среднеквадратические отклонения погрешностей для последнего слоя сети. Когда вычислены среднеквадратические отклонения погрешностей всех входных сигналов последнего слоя сети, переходим к вычислению среднеквадратических отклонений погрешностей предпоследнего слоя и так далее.
Рассмотрим пример на рис. 6.10. Пусть дана сеть с тремя нейронами входного слоя, двумя нейронами скрытого слоя и одним выходным нейроном.
На рисунке показаны сигналы, проходящие по сети при данном векторе входных сигналов, и веса связей. В данном примере элементы сети не имеют собственных погрешностей. Характеристическая функция нелинейных преобразователей имеет вид:




Рис. 6.10.
Вычислим среднеквадратические отклонения для всех сигналов сети при данном векторе входных сигналов. Все вычисленные значения в этом примере округляются до двух знаков после запятой. На рис. 6.11 показаны вычисленные среднеквадратические отклонения для данного примера.

Рис. 6.11.













Таким образом, получены формулы для вычисления среднеквадратических отклонений погрешностей сигналов сети, в предположении, что погрешности являются независимыми случайными величинами.