Учебное пособие по курсу «Нейроинформатика»
Шрифт:
Совершенно очевидно, что нейронная сеть просто неспособна научиться надежно различать эти сигналы (если вообще способна научиться их различать!). Если использовать нейроны с входными синапсами, не равными единице, то нейронная сеть сможет отмасштабировать входные сигналы так, чтобы они стали различимы, но при этом будет задействована только часть диапазона приемлемых входных данных — все входные сигналы будут иметь один знак. Кроме того, все подаваемые сигналы будут занимать лишь малую часть этого диапазона. Например, если мы отмасштабируем температуры так, чтобы 300 соответствовала величина суммарного входного сигнала равная 1 (величина входного синапса равна 1/300), то реально подаваемые сигналы займут лишь одну шестую часть интервала [0,1] и одну двенадцатую интервала [-1,1]. Получаемые при этом при этом величины выходных сигналов нейронов приведены в табл. 2.
Таблица 2
Входной
| Нейрон типа S1 | Нейрон типа S2 | ||||||
---|---|---|---|---|---|---|---|---|
c=0.1 | c=0.5 | c=1 | c=2 | c=0.1 | c=0.5 | c=1 | c=2 | |
250 (0.83) | 0.52074 | 0.60229 | 0.69636 | 0.84024 | 0.89286 | 0.62500 | 0.45455 | 0.29412 |
275 (0.91) | 0.52273 | 0.61183 | 0.71300 | 0.86057 | 0.90164 | 0.64706 | 0.47826 | 0.31429 |
300 (1.0) | 0.52498 | 0.62246 | 0.73106 | 0.88080 | 0.90909 | 0.66667 | 0.50000 | 0.33333 |
Сигналы, приведенные в табл. 2 различаются намного сильнее соответствующих сигналов из табл. 1. Таким образом, необходимо заранее позаботиться о масштабировании и сдвиге сигналов, чтобы максимально полно использовать диапазон приемлемых входных сигналов. Опыт использования нейронных сетей с входными синапсами свидетельствует о том, что в подавляющем большинстве случаев предварительное масштабирование и сдвиг входных сигналов сильно облегчает обучение нейронных сетей. Если заранее произвести операции масштабирования и сдвига входных сигналов, то величины выходных сигналов нейронов даже при отсутствии входных синапсов будут различаться еще сильнее (см. табл. 3).
Таблица 3
Входной сигнал | Нейрон типа S1 | Нейрон типа S2 | ||||||
---|---|---|---|---|---|---|---|---|
c=0.1 | c=0.5 | c=1 | c=2 | c=0.1 | c=0.5 | c=1 | c=2 | |
250 (-1) | 0.47502 | 0.37754 | 0.26894 | 0.11920 | – 0.9091 | – 0.6667 | – 0.5000 | – 0.3333 |
275 (0) | 0.50000 | 0.50000 | 0.50000 | 0.50000 | 0.0000 | 0.0000 | 0.0000 | 0.0000 |
300 (1) | 0.52498 | 0.62246 | 0.73106 | 0.88080 | 0.9091 | 0.6667 | 0.5000 | 0.3333 |
Величину диапазона различимых входных сигналов можно определять
Другой способ определения различимости входных сигналов приведен в разделе «Оценка способности сети решить задачу».
Классификация компонентов входных данных
Информация поступает к нейронной сети в виде набора ответов на некоторый список вопросов. Можно выделить три основных типа ответов (вопросов).
1. Бинарный признак (возможен только один из ответов — истина или ложь).
2. Качественный признак (принимает конечное число значений).
3. Число.
Ответ типа качественный признак — это ответ с конечным числом состояний. Причем нельзя ввести осмысленное расстояние между состояниями. Примером качественного признака может служить состояние больного — тяжелый, средний, легкий. Действительно, нельзя сказать, что расстояние от легкого больного до среднего больше, меньше или равно расстоянию от среднего больного до тяжелого. Все качественные признаки можно в свою очередь разбить на три класса.
1. Упорядоченные признаки.
2. Неупорядоченные признаки.
3. Частично упорядоченные признаки.
Упорядоченным признаком называется такой признак, для любых двух состояний которого можно сказать, что одно из них предшествует другому. Тот факт, что состояние x предшествует состоянию y, будем обозначать следующим образом — x<y. Примером упорядоченного признака может служить состояние больного. Действительно, все состояния можно упорядочить по тяжести заболевания:
легкий больной < средний больной < тяжелый больной
Признак называют неупорядоченным, если никакие два состояния нельзя связать естественным в контексте задачи отношением порядка. Примером неупорядоченного признака может служить ответ на вопрос "Ваш любимый цвет?".
Признак называется частично упорядоченным, если для каждого состояния существует другое состояние, с которым оно связано отношением порядка. Примером частично упорядоченного признака является ответ на вопрос "Какой цвет Вы видите на экране монитора?", преследующий цель определение восприимчивости к интенсивностям основных цветов. Действительно, все множество из шестнадцати состояний разбивается на несколько цепочек:
Черный < Синий < Голубой < Белый;
Черный < Красный < Ярко красный < Белый;
Черный < Зеленый < Ярко зеленый < Белый;
Черный < Фиолетовый < Ярко фиолетовый < Белый
и т. д. Однако, между состояниями Синий и Красный отношения порядка нет.
Известно, что любой частично упорядоченный признак можно представить в виде комбинации нескольких упорядоченных и неупорядоченных признаков. Так, рассмотренный выше частично упорядоченный признак распадается на три упорядоченных признака: интенсивность синего, красного и зеленого цветов. Каждый из этих признаков является упорядоченным (цепочки порядка для этих признаков приведены в первых трех строчках рассмотрения примера). Каждое состояние исходного качественного признака описывается тройкой состояний полученных качественных признаков. Так, например, состояние Фиолетовый описывается в виде (Синий, Красный, Черный).
Исходя из вышесказанного, далее будет рассмотрено только кодирование упорядоченных и неупорядоченных признаков.
Кодирование бинарных признаков
Таблица 4. Кодирование бинарного признака
Смысл значения ложь | Значение входного сигнала | |
---|---|---|
Истина | Ложь | |
Отсутствие заданного свойства при b = 0 | a | 0 |
Отсутствие заданного свойства при b ≠ 0 | b | 0 |
Наличие другого свойства | b | a |