Нейроинформатика

       

Существуют ли функции многих переменных ?


Вопрос, вынесенный в заголовок раздела, естественно возникает при изучении возможностей нейронных сетей. Из схем предыдущих разделов видно, что нейронные сети вычисляют линейные функции, нелинейные функции одного переменного, а также всевозможные суперпозиции - функции от функций, получаемые при каскадном соединении сетей. Что можно получить, используя только такие операции? Какие функции удастся вычислить точно, а какие функции можно сколь угодно точно аппроксимировать с помощью нейронных сетей? Чтобы изучить возможности нейронных сетей, нужно ответить на эти вопросы.

Заданный вопрос имеет очень большую историю и заведомо старше, чем исследования искусственных нейронных сетей.

Какие функции может вычислять человек? Если мы умеем складывать и умножать числа, то мы можем точно вычислять многочлены и рациональные функции (отношения многочленов) с рациональными коэффициентами от рациональных же аргументов.

Можно, однако, задавать функции с помощью уравнений. Если считать решения нескольких простых уравнений известными, то класс вычисляемых функций расширится - решения некоторых более общих уравнений удастся выразить через эти, более простые функции.

Классический пример: если использовать радикалы - решения уравнений xn=a, то можно явно получить решения произвольных уравнений 2-й, 3-й и 4-й степеней. Так, функция 3-х переменных a, b, c - решение уравнения ax2+bx+c=0 - может быть точно выражена с помощью сложения, умножения, деления и функции одного переменного - квадратного корня.

Вопрос: можно ли представить решение любого алгебраического уравнения с помощью радикалов, был окончательно и отрицательно решен Абелем и Галуа - уже уравнения 5-й степени неразрешимы в радикалах.

Все же можно подбирать другие простые функции небольшого числа переменных - сложнее, чем радикалы, но проще, чем общие решения уравнений высоких степеней. Удастся ли с помощью этих функций построить решение любого уравнения? Вопрос был настолько важен, что Гильберт в списке своих проблем, которые, по его мнению, должны были определять развитие математики XX века, под номером 13 поместил следующую задачу:


Представляется ли корень уравнения

x7+ax3+bx2+cx+1=0

(как функция коэффициентов) суперпозицией каких-либо непрерывных функций двух переменных?

Для уравнений 5-й и 6- й степени такое представление возможно не только с помощью непрерывных, но даже аналитических функций.

Оказалось полезным абстрагироваться от уравнений и поставить общий вопрос: можно ли произвольную непрерывную функцию n переменных получить с помощью операций сложения, умножения и суперпозиции из непрерывных функций двух переменных? Ответ оказался положительным! В серии работ [1.1, 1.2, 1.3] А.Н.Колмогоров, затем В.И.Арнольд и вновь А.Н.Колмогоров решили эту проблему: можно получить любую непрерывную функцию n переменных с помощью операций сложения, умножения и суперпозиции из непрерывных функций одного переменного.

Последняя теорема А.Н.Колмогорова [1.3] из этой серии настолько проста и изящна, что мы чуть позже приведем ее целиком. А пока - несколько замечаний о условиях теоремы.

От условия непрерывности можно отказаться - тогда получится довольно тривиальный результат связанный, по существу, с равномощностью отрезка и куба любой размерности. Условие непрерывности нельзя значительно усилить: существуют аналитические функции многих переменных, которые не допускают представления с помощью суперпозиции аналитических функций двух переменных. Более того, все l раз непрерывно дифференцируемые функции трех переменных нельзя представить в виде суперпозиций функций двух переменных, каждая из которых дифференцируема [2l/3] раз и все частные производные которых порядка [2l/3] удовлетворяют условию Липшица (выражение [2l/3] означает целую часть числа 2l/3). Это доказано А.Г,Витушкиным [1.4].



Существуют ли функции многих переменных ?


(2)
Доказательство настолько просто, изящно и поучительно, что мы приведем его практически полностью для случая n=2, следуя изложению В.И.Арнольда [1.5]. Возможность представления (2) доказывается в несколько этапов.

1. "Внутренние" функции
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
представления (2) совершенно не зависят от разлагаемой функции
Существуют ли функции многих переменных ?
.

Для определения этих функций нам понадобятся некоторые предварительные построения. Рассмотрим изображенный на рис. 1.8 "город" - систему одинаковых "кварталов" (непересекающихся замкнутых квадратов), разделенных узкими "улицами" одной и той же ширины. Уменьшим гомотетично наш "город" в
Существуют ли функции многих переменных ?
раз; за центр гомотетии можно принять, например, точку
Существуют ли функции многих переменных ?
- мы получим новый" город", который будем называть "городом ранга 2". "Город ранга 3" точно также получается из "города ранга 2" гомотетичным уменьшением с коэффициентом гомотетии
Существуют ли функции многих переменных ?
; "город ранга 4" получается гомотетичным уменьшением в
Существуют ли функции многих переменных ?
раз "города ранга 3" и т.д. Вообще "город ранга
Существуют ли функции многих переменных ?
" получается из исходного "города" (который мы будем называть "городом первого ранга") гомотетичным уменьшением в
Существуют ли функции многих переменных ?
раз (с центром гомотетии в
Существуют ли функции многих переменных ?
; впрочем, выбор центра гомотетии не существенен для дальнейшего).

Существуют ли функции многих переменных ?

Рис. 1.8.  Система кварталов

Построенную систему "городов" мы назовем 1-й системой. "Город первого ранга
Существуют ли функции многих переменных ?
-й системы" (
Существуют ли функции многих переменных ?
) получается из изображенного на рис. 1.8 "города" при помощи параллельного переноса, совмещающего точку
Существуют ли функции многих переменных ?
с точкой
Существуют ли функции многих переменных ?
. Нетрудно понять, что "улицы" "города" можно выбрать настолько узкими, что каждая точка плоскости будет покрыта по крайней мере тремя кварталами наших пяти "городов первого ранга". Точно так же "город
Существуют ли функции многих переменных ?
-го ранга"
Существуют ли функции многих переменных ?
-й системы (
Существуют ли функции многих переменных ?
) получается из "города
Существуют ли функции многих переменных ?
-го ранга 1-й системы" параллельным переносом, переводящим точку
Существуют ли функции многих переменных ?
в точку
Существуют ли функции многих переменных ?
, где
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
получаются из точек
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
гомотетией, переводящей "город первого ранга" 1-й системы (т.е.


наш исходный "город") в "город
Существуют ли функции многих переменных ?
- го ранга" той же системы; при этом каждая точка плоскости будет принадлежать кварталам по крайней мере трех из пяти "городов" любого фиксированного ранга
Существуют ли функции многих переменных ?
.

Функцию

Существуют ли функции многих переменных ?


(
Существуют ли функции многих переменных ?
)

мы определим теперь так, чтобы она разделяла любые два "квартала" каждого "города" системы
Существуют ли функции многих переменных ?
, т.е. чтобы множество значений, принимаемых
Существуют ли функции многих переменных ?
на определенном "квартале" "города
Существуют ли функции многих переменных ?
-го ранга" (здесь
Существуют ли функции многих переменных ?
- произвольное фиксированное число)
Существуют ли функции многих переменных ?
-й системы, не пересекалось с множеством значений, принимаемых
Существуют ли функции многих переменных ?
на любом другом "квартале" того же "города". При этом нам, разумеется, будет достаточно рассматривать функцию
Существуют ли функции многих переменных ?
на единичном квадрате (а не на всей плоскости).

Для того, чтобы функция
Существуют ли функции многих переменных ?
разделяла "кварталы" "города первого ранга", можно потребовать, например, чтобы
Существуют ли функции многих переменных ?
на проекциях "кварталов" "города" на ось
Существуют ли функции многих переменных ?
весьма мало отличалась от различных целых чисел, а
Существуют ли функции многих переменных ?
на проекциях "кварталов" на ось
Существуют ли функции многих переменных ?
весьма мало отличалась от различных кратных
Существуют ли функции многих переменных ?
(ибо
Существуют ли функции многих переменных ?
при целых
Существуют ли функции многих переменных ?
,
Существуют ли функции многих переменных ?
,
Существуют ли функции многих переменных ?
,
Существуют ли функции многих переменных ?
, лишь если
Существуют ли функции многих переменных ?
). При этом наложенные условия не определяют пока еще, разумеется, функций
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
(на "улицах" функция
Существуют ли функции многих переменных ?
вообще пока может задаваться совершенно произвольно); используя это, можно подобрать границы значений
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
на "кварталах" "города второго ранга" так, чтобы функция
Существуют ли функции многих переменных ?
разделяла не только "кварталы" "города 1-го ранга", но и "кварталы" "города 2-го ранга". Намеченную программу можно осуществить, если
Существуют ли функции многих переменных ?
достаточно велико (так что кварталы последующих рангов не соединяют кварталы предыдущих). А.Н. Колмогоров выбрал
Существуют ли функции многих переменных ?
. Привлекая подобным же образом к рассмотрению "города" последующих рангов и уточняя каждый раз значения функций
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
, мы в пределе получим непрерывные функции
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
(можно даже потребовать, чтобы они были монотонными), удовлетворяющие поставленным условиям.

2. Функции
Существуют ли функции многих переменных ?
разложения (2), напротив того, существенно зависят от исходной функции
Существуют ли функции многих переменных ?
.



Для построения этих функций докажем прежде всего, что любую непрерывную функцию
Существуют ли функции многих переменных ?
двух переменных
Существуют ли функции многих переменных ?
и
Существуют ли функции многих переменных ?
, заданную на единичном квадрате, можно представить в виде

Существуют ли функции многих переменных ?


(3)
где
Существуют ли функции многих переменных ?
- функции, построенные выше, и

Существуют ли функции многих переменных ?


(3^а)
Существуют ли функции многих переменных ?


(3^б)
Существуют ли функции многих переменных ?
.

Выберем ранг
Существуют ли функции многих переменных ?
столь большим, чтобы колебание (т.е. разность наибольшего и наименьшего значений) функции
Существуют ли функции многих переменных ?
на каждом "квартале" любого из "городов ранга
Существуют ли функции многих переменных ?
" не превосходило
Существуют ли функции многих переменных ?
; это, разумеется, возможно, так как с ростом ранга
Существуют ли функции многих переменных ?
размеры " кварталов" уменьшаются неограниченно. Далее, пусть
Существуют ли функции многих переменных ?
- определенный "квартал" "города 1-й системы" (и выбранного ранга
Существуют ли функции многих переменных ?
); в таком случае (непрерывная) функция
Существуют ли функции многих переменных ?
принимает на этом "квартале" значения, принадлежащие определенному сегменту
Существуют ли функции многих переменных ?
числовой оси (причем в силу определения функции
Существуют ли функции многих переменных ?
этот сегмент не пересекается с сегментами значений, принимаемых
Существуют ли функции многих переменных ?
на всех других "кварталах"). Положим теперь функцию
Существуют ли функции многих переменных ?
на сегменте
Существуют ли функции многих переменных ?
постоянной, равной
Существуют ли функции многих переменных ?
значения, принимаемого функцией
Существуют ли функции многих переменных ?
в какой-либо (безразлично какой) внутренней точке
Существуют ли функции многих переменных ?
квартала
Существуют ли функции многих переменных ?
(эту точку можно назвать "центром квартала"). Таким же образом мы определим функцию
Существуют ли функции многих переменных ?
на любом другом из сегментов, задаваемых значениями функции
Существуют ли функции многих переменных ?
на "кварталах" "города
Существуют ли функции многих переменных ?
-го ранга" 1-й системы; при этом все значения
Существуют ли функции многих переменных ?
будут по модулю не превосходить
Существуют ли функции многих переменных ?
(ибо значение
Существуют ли функции многих переменных ?
в "центре" любого "квартала" по модулю не превосходит
Существуют ли функции многих переменных ?
). Доопределим теперь функцию
Существуют ли функции многих переменных ?
при тех значениях аргумента
Существуют ли функции многих переменных ?
, при каких она еще не определена, произвольно, с тем лишь, чтобы она была непрерывна и чтобы выполнялось неравенство (3б); совершенно аналогично определим и все остальные функции
Существуют ли функции многих переменных ?
(
Существуют ли функции многих переменных ?
).

Докажем теперь, что разность

Существуют ли функции многих переменных ?


удовлетворяет условию (3а), т.е. что
Существуют ли функции многих переменных ?
, где
Существуют ли функции многих переменных ?
- произвольная точка единичного квадрата. Эта точка (как и все точки плоскости) принадлежит по крайней мере трем кварталам "городов ранга
Существуют ли функции многих переменных ?
"; поэтому заведомо найдутся такие три из пяти функций
Существуют ли функции многих переменных ?
, которые принимают в точке
Существуют ли функции многих переменных ?
значение, равное
Существуют ли функции многих переменных ?
значения
Существуют ли функции многих переменных ?
в "центре" соответствующего "квартала", т.е.


отличающееся от
Существуют ли функции многих переменных ?
не более чем на
Существуют ли функции многих переменных ?
(ибо колебание
Существуют ли функции многих переменных ?
на каждом квартале не превосходит
Существуют ли функции многих переменных ?
); сумма этих трех значений
Существуют ли функции многих переменных ?
будет отличаться от
Существуют ли функции многих переменных ?
по модулю не более чем на
Существуют ли функции многих переменных ?
. А так как каждое из оставшихся двух чисел
Существуют ли функции многих переменных ?
в силу (3) по модулю не превосходит
Существуют ли функции многих переменных ?
то мы получаем:

Существуют ли функции многих переменных ?


что и доказывает (3а).

Применим теперь то же разложение (3) к входящей в (3) функции
Существуют ли функции многих переменных ?
; мы получим:

Существуют ли функции многих переменных ?


или

Существуют ли функции многих переменных ?


где

Существуют ли функции многих переменных ?


и

Существуют ли функции многих переменных ?


(
Существуют ли функции многих переменных ?
).

Затем мы применим разложение (3) к полученной функции
Существуют ли функции многих переменных ?
и т.д.; после
Существуют ли функции многих переменных ?
-кратного применения этого разложения мы будем иметь:

Существуют ли функции многих переменных ?


Существуют ли функции многих переменных ?


где

Существуют ли функции многих переменных ?


и

Существуют ли функции многих переменных ?
(
Существуют ли функции многих переменных ?
).

Последние оценки показывают, что при
Существуют ли функции многих переменных ?
получим:

Существуют ли функции многих переменных ?


Существуют ли функции многих переменных ?


где стоящий справа бесконечный ряд сходится равномерно; также и каждый из пяти рядов

Существуют ли функции многих переменных ?
(
Существуют ли функции многих переменных ?
)

сходится равномерно, что позволяет ввести обозначения

Существуют ли функции многих переменных ?


(
Существуют ли функции многих переменных ?
).

Итак, окончательно получаем:

Существуют ли функции многих переменных ?


то есть требуемое разложение (2).

До сих пор речь шла о точном представлении функций многих переменных с помощью функций одного переменного. Оказалось, что в классе непрерывных функций такое представление возможно. Но кроме вопроса о точном представлении существует еще один - об аппроксимации. Можно даже предположить, что он важнее - вычисление большинства функций производится приближенно даже при наличии "точных" формул.

Приближение функций многочленами и рациональными функциями имеет историю, еще более давнюю, чем проблема точного представления. Знаменитая теорема Вейерштрасса утверждает, что непрерывную функцию нескольких переменных
Существуют ли функции многих переменных ?
на замкнутом ограниченном множестве Q можно равномерно приблизить последовательностью полиномов: для любого ?>0 существует такой многочлен
Существуют ли функции многих переменных ?
, что

Существуют ли функции многих переменных ?


Чтобы сформулировать обобщения и усиления теоремы Вейерштрасса, необходимо перейти к несколько более абстрактному языку. Рассмотрим компактное пространство X и алгебру C(X) непрерывных функций на X с вещественными значениями.

Сильным обобщением теоремы о возможности равномерного приближения непрерывных функций многочленами является теорема Стоуна [1.6, 1.7]:

Пусть
Существуют ли функции многих переменных ?
- замкнутая подалгебра в C(X),
Существуют ли функции многих переменных ?
и функции из E разделяют точки в X (то есть для любых различных
Существуют ли функции многих переменных ?
существует такая функция
Существуют ли функции многих переменных ?
, что
Существуют ли функции многих переменных ?
).


Тогда E=C(X) .

Теорема Стоуна обобщает теорему Вейерштрасса по двум направлениям. Во-первых, рассматриваются функции на произвольном компакте, а не только функции многих действительных переменных. Во-вторых, доказано утверждение, новое даже для функций одного переменного (не говоря уже о многих): плотно не только множество многочленов от координатных функций, но вообще кольцо многочленов от любого набора функций, разделяющих точки. Следовательно, плотно множество тригонометрических многочленов, множество линейных комбинаций функций вида exp[-(x-x0,Q(x-x0))], где (x,Qx) - положительно определенная квадратичная форма и др.

Дан рецепт конструирования таких обобщений: достаточно взять произвольный набор функций, разделяющих точки, построить кольцо многочленов от них - и получим плотное в C(X) множество функций.

Разложения по ортогональным системам функций (ряды Фурье и их многочисленные обобщения) не дают, вообще говоря, равномерного приближения разлагаемых функций - как правило, можно гарантировать лишь монотонное стремление к нулю интеграла квадрата остатка "функция минус приближение" с какой-либо положительной весовой функцией. Все же, обращаясь к задаче аппроксимации, нельзя забывать об ортогональных разложениях. Для ряда прикладных задач простота получения коэффициентов такого разложения может оказаться важнее, чем отсутствие гарантированной равномерности приближения.

Так существуют ли функции многих переменных? В каком-то смысле - да, в каком-то - нет. Все непрерывные функции многих переменных могут быть получены из непрерывных функций одного переменного с помощью линейных операций и суперпозиции. Требования гладкости и аналитичности существенно усложняют вопрос. На этом фоне совершенно неожиданно выглядит тот факт, что любой многочлен от многих переменных может быть получен из одного произвольного нелинейного многочлена от одного переменного с помощью линейных операций и суперпозиции. Простое доказательство этой теоремы будет дано в разделе 6.


Содержание раздела