Печать рукописи
Даже в пору, когда чистописание было одним из главных предметов первоклассника, воспитывающих красоту и порядок (несомненно, стимулирующий внутренний порядок) владения пером № 86 с нажимом, разбор рукописного текста был проблемой для развитого воображения. Мы содрогаемся, видя, с каким разнообразием извращений приемов владения современными изобразительными средствами студенты конспектируют мудрость своих наставников.
По прошествии некоторого времени мы с трудом понимаем собственные каракули, не говоря уж о чужих. А если Время поработало капитально, и ваши старания сравнимы с прочтением Кумранских рукописей? Ясно, что только ассоциативное мышление способно восстановить рукописный текст.
Поэтому автоматизация воспроизведения написанного является актуальной задачей.
… И окончательно впадая в детство, мы видим в основе распознавания по признакам все ту же методику чистописания.
Еще в лекции 2 мы обратили внимание на "признаковое" определение букв: а – кружочек с палочкой справа, заканчивающейся хвостиком вправо, б
– кружочек с хвостиком сверху, вверх и вправо, ц – палочка с хвостиком вправо, к нему примыкает палочка, а к ней, справа внизу, странный специфический крючок, позволяющий сказать "что-то странное, но обязательно существующее", и т.д.
Представим себе "окно просмотра", сканирующее текст (
рис. 16.8 ).
Рис. 16.8. Распознавание буквы по признакам
Оно "наложено" на входной слой нейросети. Связи нейронов входного слоя – рецепторов – соединяют их (скорее всего, на следующем же слое) с нейронами промежуточного выходного слоя (или на коре), закрепленными за признаками. Это соединение выполнено так, чтобы "захватить" случайно (в зависимости от почерка) отклоненную от эталона в букваре букву и выявить в ней отдельные признаки. Комбинация выявленных признаков на следующем (следующих) окончательно выходном слое определяет распознаваемую букву.
Возможно, что при наложении очередной буквы, ожидаемой в сложной вязи письма, нам понадобится процедура разглядывания: увеличение/уменьшение, наклон влево/вправо, – до тех пор, пока при некоторой фиксации образа не начнется их действительное распознавание.
Поэтому, в дополнение к попытке "захвата", изображение располагается в " окне просмотра" так, что его "центр тяжести" совмещается с центром окна. Далее, изображение растягивается или сжимается, наклоняется влево или вправо так, чтобы максимально совпасть по размеру и углу наклона с размером и углом наклона эталонов, подававшихся в процессе обучения. Впрочем, это растяжение/сжатие и наклон могут осуществляться динамически, на основе проб, в процессе распознавания в поисках лучшего угадывания буквы.
Для выявления всех признаков и их относительного положения "окно просмотра" необходимо разбить на сектора, определяющие понятия "слева", "справа", "вверху", "внизу", "внизу справа" и т.д.
Определенную трудность представляют пропуски и пробелы. Например, как определить разрыв окружности буквы с от полной окружности буквы о? Ведь может возбудиться "полный кружок", только с меньшим значением величины возбуждения.
Мы предлагаем наряду с позитивным изображением элементов букв анализировать их негативное изображение. Тогда пустота в соответствии с эталоном будет "кричать" о себе, возбуждать рецепторы, обретет активность. Наличие пустоты мы сможем так же "поймать" посредством возбуждения нейронов, как и видимые линии.
Легко увидеть на основе наших действий, что распознавания букв недостаточно. Не поняв ничего, мы поднимаемся на уровень распознавания слов, включаем в работу контекст. Только таким комплексным методом мы восстанавливаем смысл написанного, и это сулит неограниченные возможности развития и совершенствования нейросетевой технологии прочтения.
… Выслушав данное (да и другие) соображение, мы не стали разочаровывать дядю Рамзая тем, что это давно известно, делается, и существует обширная литература. Мы привели его для иллюстрации естественной взаимной вытекаемости идей, базирующихся на одном основании, стараясь менторски наставить молодое поколение – рекомендовать и заинтересовать.